JP4961300B2

JP4961300B2 - 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム

Info

Publication number: JP4961300B2
Application number: JP2007210839A
Authority: JP
Inventors: 悟松本; 友二山本; 達雄古賀; 良輔大槻
Original assignee: Sanyo Electric Co Ltd
Current assignee: Sanyo Electric Co Ltd
Priority date: 2006-08-14
Filing date: 2007-08-13
Publication date: 2012-06-27
Anticipated expiration: 2027-08-13
Also published as: JP2008070868A

Description

本発明は楽曲コンテンツ処理技術に関し、特に、複数の楽曲コンテンツに対して一致判定を行う楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラムに関する。

テレビ放送又はラジオ放送等を受信し、楽曲コンテンツを自動的に収集（記録）する楽曲記録装置が知られている。また、テレビ放送又はラジオ放送から楽曲コンテンツを取得することに加え、ＣＤなどの記録媒体から楽曲コンテンツを取得したり、楽曲コンテンツを配信する配信サーバから通信ネットワークを介して楽曲コンテンツを取得したりする楽曲記録装置も知られている。

このような楽曲記録装置においては、ユーザが気付かないうちに、同一の楽曲コンテンツが複数記録され、ＨＤＤなどの楽曲コンテンツ記録部の記録容量が無駄に消費されてしまうことがある。

記録された楽曲コンテンツに楽曲情報が付加されていれば、その楽曲情報によって同一の楽曲コンテンツを検索し、不要な（品質の低い）楽曲コンテンツを削除可能である。しかし、記録された楽曲コンテンツに楽曲情報が付加されていない場合に、同一の楽曲コンテンツを検索するためには、記録された楽曲コンテンツを再生し、実際にユーザが各楽曲コンテンツを聴くことを要する。

一方、同一の楽曲コンテンツを自動的に検索する技術としては、各楽曲コンテンツの音声波形のマッチング演算を行うことで、同一の楽曲コンテンツを検索する手法が知られている（例えば、特許文献１参照）。
特表２００４−５３７７６０号公報

しかしながら、音声波形のマッチング演算を行う場合、複雑な演算を必要とするために、ＣＰＵ等の処理負担が増大するという問題がある。また、複数の楽曲コンテンツが圧縮符号化された状態で記録されている場合、音声波形のマッチング演算を行うためには各楽曲コンテンツを復号化することが必要であり、演算量が更に増大する。

上記問題点に鑑み、本発明は、楽曲コンテンツの一致判定に要する処理負荷を削減可能な楽曲一致判定装置、楽曲一致判定方法、及び楽曲一致判定プログラムを提供することを目的とする。

また、本発明は、楽曲コンテンツの一致判定に要する処理負荷を削減しつつ、複数の一致する楽曲コンテンツの中から品質の低い楽曲コンテンツを削除することによって、楽曲コンテンツ記録部の記録容量を有効活用できる楽曲記録装置、楽曲記録方法、及び楽曲記録プログラムを提供することを目的とする。

本発明の第１の特徴は、複数の楽曲コンテンツのそれぞれから特徴量を算出し、特徴量が閾値を超えた時点をカット点として検出するカット点検出部（カット点検出部７１）と、複数の楽曲コンテンツのそれぞれについて、カット点に関する情報を記憶するカット点情報記憶部（カット点情報記憶部９２）と、記憶されたカット点に関する情報に基づき、複数の楽曲コンテンツが一致するか否かを判定する一致判定部（一致判定部８１）とを備えることを要旨とする。ここで、「楽曲コンテンツ」とは、音楽（楽曲）が含まれるコンテンツを意味する。

この特徴によれば、楽曲で特徴量の変化が大きい時点をカット点として記憶し、このカット点に関する情報によって楽曲の一致判定を行うので、少ない演算量で楽曲の一致判定を行うことができる。

本発明の第２の特徴は、第１の特徴に係る楽曲一致判定装置において、カット点検出部は、特徴量として、音声信号のパワー又は周波数の単位時間当たりの変化量を算出することを要旨とする。「音声信号のパワー」とは、例えば、フーリエ変換などにより音声信号から振幅スペクトルを算出し、この振幅スペクトルの２乗和を求めたものを意味する。

この特徴によれば、楽曲コンテンツから音声信号のパワー又は周波数の単位時間当たりの変化量を特徴量として算出するので、楽曲コンテンツについて好ましい特徴量を得ることができ、精度の良いカット点を検出することができる。

本発明の第３の特徴は、第１又は第２の特徴に係る楽曲一致判定装置において、一致判定部は、各楽曲コンテンツのカット点の個数に基づいて、複数の楽曲コンテンツが一致するか否かを判定することを要旨とする。

この特徴によれば、一致判定部が、各楽曲コンテンツのカット点の個数に基づいて、複数の楽曲コンテンツが一致するか否かを判定することによって、楽曲の一致判定を容易に実行可能となり、演算量を削減することができる。

本発明の第４の特徴は、第１〜第３のいずれかの特徴に係る楽曲一致判定装置において、一致判定部は、各楽曲コンテンツのカット点間の時間間隔に基づいて、複数の楽曲コンテンツが一致するか否かを判定することを要旨とする。

この特徴によれば、一致判定部が、各楽曲コンテンツのカット点間の時間間隔に基づいて、複数の楽曲コンテンツが一致するか否かを判定することによって、楽曲の一致判定を容易に実行可能となり、演算量を削減することができる。

本発明の第５の特徴は、楽曲コンテンツを取得する第１取得部（第１楽曲コンテンツ取得部２１）と、前記第１取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第２取得部（第２楽曲コンテンツ取得部２２）と、前記第１取得部によって取得された楽曲コンテンツ、及び前記第２取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部（楽曲コンテンツ記憶部９１）とを備える楽曲記録装置（楽曲記録再生装置２００）であって、前記第１取得部によって取得された楽曲コンテンツに第１識別情報（ＦＭ録音フラグ）を付加し、前記第２取得部によって取得された楽曲コンテンツに第２識別情報（購入フラグ）を付加する識別情報付加部（識別情報付加部８６）と、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出し、前記特徴量が閾値を超えた時点をカット点として検出するカット点検出部（カット点検出部７１）と、前記カット点検出部によって検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する一致検出部（一致判定部８１）と、前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されているか否かを判定する識別情報判定部（識別情報判定部８７）と、前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第１識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除する楽曲コンテンツ削除部（制御部８０）とを備えることを要旨とする。

この特徴によれば、楽曲記録装置は、一致する複数の楽曲コンテンツに第１識別情報及び第２識別情報が付加されていると判定された場合、第１識別情報が付加されている楽曲コンテンツを楽曲コンテンツ記憶部から削除する。すなわち、複数の同一楽曲コンテンツが録音されている場合において、品質（音質）が低い楽曲コンテンツを削除することによって、楽曲コンテンツ記録部（例えば、ＨＤＤ）の記録容量を有効活用できる。また、特徴量の変化が大きい時点をカット点として、このカット点に基づいて楽曲コンテンツの一致判定を行うので、少ない演算量で楽曲コンテンツの一致判定を行うことができる。

本発明の第６の特徴は、本発明の第５の特徴に係る楽曲記録装置において、前記第１取得部は、放送局（ＦＭ放送局１０１）から無線で送信される放送信号を受信し、受信した前記放送信号から楽曲コンテンツを取得し、前記第２取得部は、楽曲コンテンツを記録する記録媒体（ＣＤ／ＤＶＤ１０４、メモリカード１０５）から楽曲コンテンツを取得する、又は楽曲コンテンツを配信する配信サーバ（楽曲コンテンツ配信サーバ１０２）から通信ネットワーク（通信ＮＷ１０３）を介して楽曲コンテンツを取得することを要旨とする。

この特徴によれば、楽曲記録装置は、同一の楽曲コンテンツであれば、記録媒体や配信サーバから取得した楽曲コンテンツを放送信号から取得した楽曲コンテンツよりも優先して楽曲コンテンツ記録部に残すことができるので、高品質な楽曲コンテンツを楽曲コンテンツ記録部に残すことができる。

本発明の第７の特徴は、本発明の第５の特徴に係る楽曲記録装置において、前記一致する複数の楽曲コンテンツに同一の識別情報が付加されている場合、前記一致する複数の楽曲コンテンツに含まれるノイズを検出するノイズ検出部（品質判定部７２）をさらに備え、前記楽曲コンテンツ削除部は、前記ノイズ検出部による検出結果に基づき、前記一致する複数の楽曲コンテンツのうちノイズが最も多い楽曲コンテンツを削除することを要旨とする。

この特徴によれば、楽曲記録装置は、同様の取得経路で取得した楽曲コンテンツについては、ノイズが少ない楽曲コンテンツを楽曲コンテンツ記録部に残すことができるので、高品質な楽曲コンテンツを楽曲コンテンツ記録部に残すことができる。

本発明の第８の特徴は、本発明の第５〜７のいずれか１つの特徴に係る楽曲記録装置において、前記カット点検出部は、前記特徴量として、音声信号のパワー又は周波数の単位時間当たりの変化量を算出することを要旨とする。

本発明の第９の特徴は、本発明の第５〜８のいずれか１つの特徴に係る楽曲記録装置において、前記一致検出部は、前記楽曲コンテンツ記憶部に記憶された楽曲コンテンツのカット点の個数に基づいて、前記一致する複数の楽曲コンテンツを検出することを要旨とする。

この特徴によれば、一致検出部が、各楽曲コンテンツのカット点の個数に基づいて、一致する複数の楽曲コンテンツを検出することによって、少ない演算量で、一致する複数の楽曲コンテンツを容易に検出可能となる。

本発明の第１０の特徴は、本発明の第５〜８のいずれか１つの特徴に係る楽曲記録装置において、前記一致検出部は、前記楽曲コンテンツ記憶部に記憶された楽曲コンテンツのカット点間の時間間隔に基づいて、前記一致する複数の楽曲コンテンツを検出することを要旨とする。

この特徴によれば、一致検出部が、各楽曲コンテンツのカット点間の時間間隔に基づいて、一致する複数の楽曲コンテンツを検出することによって、少ない演算量で、一致する複数の楽曲コンテンツを容易に検出可能となる。

本発明の第１１の特徴は、複数の楽曲コンテンツのそれぞれから特徴量を算出し、特徴量が閾値を超えた時点をカット点として検出するステップと、複数の楽曲コンテンツのそれぞれについて、カット点に関する情報を記憶するステップと、記憶されたカット点に関する情報に基づき、複数の楽曲コンテンツが一致するか否かを判定するステップとを含むことを要旨とする。

本発明の第１２の特徴は、楽曲コンテンツを取得する第１取得部と、前記第１取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第２取得部と、前記第１取得部によって取得された楽曲コンテンツ、及び前記第２取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部とを用いた楽曲記録方法であって、前記第１取得部によって取得された楽曲コンテンツに第１識別情報を付加し、前記第２取得部によって取得された楽曲コンテンツに第２識別情報を付加するステップと、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出するとともに、前記特徴量が閾値を超えた時点をカット点として検出するステップと、前記検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出するステップと、前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されているか否かを判定するステップと、前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第１識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除するステップとを備えることを要旨とする。

本発明の第１３の特徴は、コンピュータに、複数の楽曲コンテンツのそれぞれから特徴量を算出し、特徴量が閾値を超えた時点をカット点として検出する手順と、複数の楽曲コンテンツのそれぞれについて、カット点に関する情報を記憶する手順と、記憶されたカット点に関する情報に基づき、複数の楽曲コンテンツが一致するか否かを判定する手順とを実行させることを要旨とする。

本発明の第１４の特徴は、楽曲コンテンツを取得する第１取得部と、前記第１取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第２取得部と、前記第１取得部によって取得された楽曲コンテンツ、及び前記第２取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部とを備える楽曲記録装置として機能するコンピュータに、前記第１取得部によって取得された楽曲コンテンツに第１識別情報を付加し、前記第２取得部によって取得された楽曲コンテンツに第２識別情報を付加する手順と、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出するとともに、前記特徴量が閾値を超えた時点をカット点として検出する手順と、前記検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する手順と、前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されているか否かを判定する手順と、前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第１識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除する手順とを実行させることを要旨とする。

本発明によれば、楽曲コンテンツの一致判定に要する処理負荷を削減可能な楽曲一致判定装置、楽曲一致判定方法、及び楽曲一致判定プログラムを提供できる。

また、本発明によれば、楽曲コンテンツの一致判定に要する処理負荷を削減しつつ、複数の一致する楽曲コンテンツの中から品質の低い楽曲コンテンツを削除することによって、楽曲コンテンツ記録部の記録容量を有効活用できる楽曲記録装置、楽曲記録方法、及び楽曲記録プログラムを提供できる。

次に、図面を参照して、本発明の実施形態を説明する。以下の実施形態における図面の記載において、同一又は類似の部分には同一又は類似の符号を付している。

［第１実施形態］
（楽曲記録再生装置のハードウェア構成例）
図１は、本実施形態に係る楽曲記録再生装置のハードウェア構成図である。楽曲記録再生装置は、チューナ１と、Ａ／Ｄ（Analog to Digital）変換器２と、ＭＰ３（MPEG Audio Layer-3）コーデック３と、Ｄ／Ａ（Digital to Analog）変換器４と、スピーカ５と、バス６と、ＤＳＰ（Digital Signal Processor）７と、ＣＰＵ（Central Processing Unit）８と、ＨＤＤ（Hard Disk Drive）９と、メモリ１０とを備える。

Ａ／Ｄ変換器２、ＭＰ３コーデック３、Ｄ／Ａ変換器４、ＤＳＰ７、ＣＰＵ８、ＨＤＤ９、及びメモリ１０は、バス６を介して各種のデータを授受する。

チューナ１は例えばラジオ放送等の放送信号を受信し、放送信号から音声信号を復調する。

Ａ／Ｄ変換器２は、チューナ１からの音声信号をデジタル信号データに変換する。

ＭＰ３コーデック３は、デジタル音声データを圧縮符号化して符号化音声データを得るエンコーダの機能と、符号化音声データを復号化するデコーダの機能とを有する。

ＨＤＤ９は、主に、符号化音声データを記憶する。

ＤＳＰ７は、入力された音声信号を解析する。ＣＰＵ８は、楽曲記録再生装置全体の制御を実行する。

Ｄ／Ａ変換器４は、ＭＰ３コーデック３によって復号化されたデジタル音声データをアナログ信号に変換してスピーカ５に供給する。

メモリ１０は、ＤＳＰ７及びＣＰＵ８で実行されるプログラムを記憶するとともに、ＤＳＰ７及びＣＰＵ８のプログラム実行中に作業領域として利用される。

（楽曲記録再生装置の機能構成例）
図２は、本実施形態に係る楽曲記録再生装置の機能ブロック図である。図２の楽曲記録再生装置は、図１に示したチューナ１、Ａ／Ｄ変換器２、ＭＰ３コーデック３、Ｄ／Ａ変換器４、及びスピーカ５に加えて、楽曲コンテンツ抽出部７０と、カット点検出部７１と、品質判定部７２と、カット点情報記憶部９２と、品質情報記憶部９３と、一致判定部８１と、セグメント化部８２と、位置合わせ処理部８３と、セグメント選択部８４と、セグメント結合部８５と、制御部８０と、楽曲コンテンツ記憶部９１とを備えている。ここで、カット点検出部７１と、カット点情報記憶部９２と、一致判定部８１と、制御部８０とによって、楽曲一致判定装置１００が構成されている。

楽曲コンテンツ抽出部７０、カット点検出部７１、及び品質判定部７２のそれぞれの機能は、図１のＤＳＰ７により実現される。一致判定部８１、セグメント化部８２、位置合わせ処理部８３、セグメント選択部８４、セグメント結合部８５、及び制御部８０のそれぞれの機能は、図１のＣＰＵ８により実現される。カット点情報記憶部９２、品質情報記憶部９３、及び楽曲コンテンツ記憶部９１は、図１のＨＤＤ９内に構成される。

楽曲コンテンツ抽出部７０は、Ａ／Ｄ変換器２からのデジタル音声データから楽曲コンテンツを抽出する。制御部８０は、楽曲コンテンツ抽出部７０が抽出した楽曲コンテンツをＭＰ３コーデック３に供給する。ＭＰ３コーデック３は、楽曲コンテンツを圧縮符号化する。圧縮符号化された楽曲コンテンツは、楽曲コンテンツ記憶部９１に記録される。なお、楽曲コンテンツ抽出部７０は、後述するカット点を利用して楽曲コンテンツを抽出してもよい。

カット点検出部７１は、楽曲コンテンツ抽出部７０が抽出した楽曲コンテンツから特徴量を算出し、特徴量が閾値を超えた時点をカット点として検出する。ここで「特徴量」としては、例えば音声信号のパワーの単位時間当たりの変化量が利用できる。なお、音声信号のパワーは、上述したように、フーリエ変換などにより音声信号から振幅スペクトルを算出し、この振幅スペクトルの２乗和を求めることで得ることができる。カット点検出部７１の詳細については後述する。

カット点情報記憶部９２は、カット点検出部７１が検出したカット点に関する情報を記憶する。具体的には、カット点情報記憶部９２は、各楽曲コンテンツを識別する楽曲コンテンツ識別子と、各楽曲コンテンツのカット点数とを対応付けたカット点数情報を記憶するとともに、各カット点を識別するカット点識別子と、各カット点の検出時間（楽曲コンテンツの開始時間からの経過時間）とを対応付けたカット点時間情報を記憶する。以下、上記カット点数情報とカット点時間情報とを併せて「カット点情報」と呼ぶ。

このように、新たな楽曲コンテンツが楽曲コンテンツ記憶部９１に記録される際には、その新たな楽曲コンテンツのカット点情報も同時にカット点情報記憶部９２に記録される。

品質判定部７２は、楽曲コンテンツの品質を判定する。楽曲コンテンツの品質判定基準としては、雑音のレベル（振幅）又はトークの尤度の少なくとも一方が利用できる。以下では、楽曲コンテンツの品質判定基準として、雑音のレベル及びトークの尤度の両方を利用する場合について説明する。

品質判定部７２は、隣接する２つのカット点により区分される「セグメント」毎に品質を判定しても良く、楽曲コンテンツの所定時間毎の品質を判定しても良い。ここでは品質判定部７２が、セグメント毎に楽曲コンテンツの品質を判定する場合について説明する。

楽曲コンテンツの品質判定基準としてトークの尤度を利用する場合、音声認識技術を使用したクラスタリングにより、楽曲コンテンツとトークとを区別することが可能である。具体的には、分類するクラスごとのモデルをガウス混合分布(GMM)を用いてモデル化し、このモデルごとに似ているかどうかを示す尤度関数が用意されており、入力した音声とトークについての尤度関数を用いて算出された確率（尤度）を用いて、トークが検出される。なお、「トーク」とは、楽曲コンテンツに付加されている音声信号であり、例えば、ＤＪによる曲紹介等がこれに該当する。

品質情報記憶部９３は、品質判定部７２が判定した各セグメントの品質を品質情報として記憶する。具体的には、各セグメントを識別するセグメント識別子と、各セグメントの品質情報（雑音レベル、トークの尤度）とを対応付けて記憶する。

一致判定部８１は、カット点情報記憶部９２に記憶されたカット点情報に基づき、新たに記録された楽曲コンテンツと過去に記録された楽曲コンテンツとの重複を検出する。一例として、一致判定部８１は、上記カット点情報に基づき、各楽曲コンテンツのカット点の数が同じであるか否かを判定する。各楽曲コンテンツのカット点の数が同じであれば、上記カット点時間情報に基づき、各楽曲コンテンツにおいて、１つ目のカット点と２つ目のカット点の時間を計算する。このカット点区間の時間が２つの楽曲コンテンツの間で同じであれば、一致判定部８１は、次のカット点間の時間を計算し、最後のカット点まで繰り返す。２つの楽曲コンテンツにおいてすべてのカット点間の時間が同じであれば楽曲コンテンツが重複していると判定される。

一致判定部８１によって重複する２つの楽曲コンテンツが検出された場合、制御部８０は、重複する２つの楽曲コンテンツを楽曲コンテンツ記憶部９１から取得し、ＭＰ３コーデック３により各楽曲コンテンツを復号化する。復号化された各楽曲コンテンツは、セグメント化部８２に供給される。

セグメント化部８２は、上記カット点情報を用いて、各楽曲コンテンツを複数のセグメントに分割する。詳細には、セグメント化部８２は、新たに記録された楽曲コンテンツのカット点情報を用いて、新たに記録された楽曲コンテンツをセグメント化するとともに、過去に記録された楽曲コンテンツのカット点情報を用いて、過去に記録された楽曲コンテンツをセグメント化する。セグメント化された各楽曲コンテンツは、位置合わせ処理部８３に供給される。

位置合わせ処理部８３は、各楽曲コンテンツにおける相対位置を一致させるため、各楽曲コンテンツの最初のカット点の位置を一致させる。相対位置を一致させることで、対応するセグメントを明らかにする。なお、セグメントとは、上述したように、隣り合う２つカット点で挟まれた楽曲コンテンツの一部である。位置合わせ処理後の各楽曲コンテンツは、セグメント選択部８４に供給される。

セグメント選択部８４は、品質情報記憶部９３に記憶された各楽曲コンテンツの品質情報に基づき、各楽曲コンテンツにおいて時間的位置の等しい各セグメント間で、最も品質の高いセグメントを選択する。つまり、セグメント選択部８４は、各楽曲コンテンツの各セグメントの雑音レベルやトークの尤度を品質情報記憶部９３から読み出し、より低雑音であるセグメント、もしくは、より低いトークの尤度をもつセグメントを選択する。セグメント選択部８４によって選択されたセグメントは、セグメント結合部８５に供給される。

セグメント結合部８５は、セグメント選択部８４によって選択されたセグメントを順次結合して１つの楽曲コンテンツを得る。ここで、各セグメントは、カット点を接点にして結合される。セグメント結合部８５が作成した楽曲コンテンツは、制御部８０に供給される。

制御部８０は、セグメント結合部８５から供給される楽曲コンテンツを、ＭＰ３コーデック３を用いて圧縮符号化し、圧縮符号化後の楽曲コンテンツを楽曲コンテンツ記憶部９１に記憶する。その際、制御部８０は、結合対象となった元の各楽曲コンテンツを楽曲コンテンツ記憶部９１から削除する。

（カット点検出部の構成例）
次に、カット点検出部７１の機能ブロック図を図３に示す。カット点検出部７１は、パワー算出部７１１と、微分演算部７１２と、閾値比較部７１３と、カット点記録処理部７１４とを備えている。

パワー算出部７１１は、図４に示すように、時間領域において、楽曲コンテンツから音声信号のパワーを算出する。

微分演算部７１２は、音声信号のパワーの変化を検知するため、特徴量として音声信号のパワーを微分する。図５に示すように、時刻Ｔ前後の所定の期間Ｗ１における平均パワーの差の絶対値が、微分値として算出される。微分された結果、パワーの変化が大きい期間は微分値が大きくなる。

閾値比較部７１３は、微分演算部７１２が算出した所定の期間での微分値（特徴量）が所定の閾値以上であれば、その期間は音声信号の変化が大きいことを意味し、図４に示すように、その期間の始点又は終点をカット点として検出する。なお、所定の閾値は、楽曲の種類（ジャンル、曲調等）によって変更しても良い。

カット点記録処理部７１４は、閾値比較部７１３によって検出されたカット点に関する情報をカット点情報記憶部９２に記録する。

なお、図３の構成に限らず、周波数領域において周波数分析を行い、特定の周波数帯域でのパワーが閾値を越え、ある時間その状態が続いたときに、音声の変化が大きいとして、カット点として検出する構成でも良い。

（カット点情報例）
図６（ａ）は、カット点情報記憶部９２に記憶されるカット点数情報の一例を示す図である。図６（ａ）の例においては、楽曲コンテンツ識別子“＃１”と、カット点数“１６”とが対応付けられている。また、楽曲コンテンツ識別子“＃２”と、カット点数“２３”とが対応付けられている。楽曲コンテンツ識別子“＃３”と、カット点数“１６”とが対応付けられている。この場合、楽曲コンテンツ識別子“＃１”及び楽曲コンテンツ識別子“＃３”は、同一の楽曲コンテンツであると考えることができる。

図６（ｂ）は、カット点情報記憶部９２に記憶されるカット点時間情報の一例を示す図である。図６（ａ）の例においては、楽曲コンテンツ識別子“＃１”〜“＃３”のそれぞれについて、カット点識別子と、各カット点の検出時間（楽曲コンテンツの開始時間からの経過時間）とが対応付けられている。一致判定部８１は、上述したように、各楽曲コンテンツにおいて、１つ目のカット点と２つ目のカット点の時間間隔を計算し、このカット点間の時間間隔が２つの楽曲コンテンツの間で同じであれば、次のカット点間の時間間隔を計算し、最後のカット点まで繰り返すことによって、楽曲の一致判定を行う。

（セグメント選択部及びセグメント結合部の動作例）
次に、図７の波形図を用いて、セグメント選択部８４及びセグメント結合部８５の動作を説明する。

図７（ａ）及び（ｂ）は、異なる時刻に記録された、同一の楽曲コンテンツの音声波形を示している。図７（ａ）及び（ｂ）に示す音声波形においては、カット点＃１〜＃３の合計３つのカット点が検出されている。

図７（ａ）のカット点＃１及び＃２で区分されるセグメントは、雑音及びトークの少ないセグメントである。図７（ａ）のカット点＃２及び＃３で区分されるセグメントは、雑音が多いセグメントである。

また、図７（ｂ）のカット点＃１及び＃２で区分されるセグメントは、トークの多いセグメントである。図７（ｂ）のカット点＃２及び＃３で区分されるセグメントは、雑音の少ないセグメントである。

セグメント選択部８４は、図７（ａ）のカット点＃１及び＃２で区分されるセグメントと、図７（ｂ）のカット点＃１及び＃２で区分されるセグメントとを比較評価し、図７（ａ）のカット点＃１及び＃２で区分されるセグメントを選択する。

セグメント選択部８４は、図７（ａ）のカット点＃２及び＃３で区分されるセグメントと、図７（ｂ）のカット点＃２及び＃３で区分されるセグメントとを比較評価し、図７（ｂ）のカット点＃２及び＃３で区分されるセグメントを選択する。

この結果、セグメント結合部８５は、図７（ｃ）に示すように、図７（ａ）のカット点＃１及び＃２で区分されるセグメントと、図７（ｂ）のカット点＃２及び＃３で区分されるセグメントとを、カット点＃２を接点として結合する。このようにして、雑音及びトークの少ない楽曲コンテンツが作成される。

（楽曲記録処理フロー例）
次に、図８に示すフローチャートを参照して、本実施形態に係る楽曲記録処理フローの一例について説明する。

図８のステップＳ１０１において、図２に示すチューナ１は、例えばラジオ放送等の放送信号を受信し、放送信号から音声信号を復調する。

ステップＳ１０２において、Ａ／Ｄ変換器２は、ステップＳ１０１で得られた音声信号をデジタル信号データに変換する。

ステップＳ１０３において、楽曲コンテンツ抽出部７０は、ステップＳ１０２で得られたデジタル音声データから、楽曲コンテンツを抽出する。

ステップＳ１０４において、ＭＰ３コーデック３は、ステップＳ１０３で得られた楽曲コンテンツを圧縮符号化する。

ステップＳ１０５において、制御部８０は、ステップＳ１０４で圧縮符号化された楽曲コンテンツを楽曲コンテンツ記憶部９１に記憶する。

一方、ステップＳ１０６において、図３に示すパワー算出部７１１は、ステップＳ１０３で得られた楽曲コンテンツから音声信号のパワーを算出する。更に、微分演算部７１２は、パワー算出部７１１が算出した音声信号のパワーを微分する。

ステップＳ１０７において、閾値比較部７１３は、ステップＳ１０６で算出された微分値がある閾値以上であれば、その時刻をカット点として検出する。閾値比較部７１３が検出したカット点の情報は、図１のカット点情報記憶部９２に記録される。

ステップＳ１０８において、図１に示す品質判定部７２は、ステップＳ１０３で抽出された楽曲コンテンツの雑音レベルをセグメント単位で判定する。

ステップＳ１０９において、品質判定部７２は、ステップＳ１０３で抽出された楽曲コンテンツのトークの尤度をセグメント単位で判定する。ステップＳ１０８及びステップＳ１０９で判定された雑音レベル及びトークの尤度の情報は、品質情報記憶部９３に記録される。

（楽曲再生処理フロー例）
次に、図９に示すフローチャートを参照して、本実施形態に係る楽曲再生処理フローの一例について説明する。

図８のステップＳ２０１において、制御部８０は、楽曲コンテンツ記憶部９１から、圧縮符号化された楽曲コンテンツ（符号化音声データ）を読み出す。

ステップＳ２０２において、ＭＰ３コーデック３は、ステップＳ２０１で読み出された符号化音声データを復号化してデジタル音声データを得る。

ステップＳ２０３において、Ｄ／Ａ変換器４は、ステップＳ２０２で得られたデジタル音声データをアナログ信号に変換して音声信号を得る。

ステップＳ２０４において、スピーカ５は、ステップＳ２０３で得られた音声信号を出力する。

（楽曲結合処理フロー例）
次に、図１０に示すフローチャートを参照して、本実施形態に係る楽曲結合処理フローの一例について説明する。

図１０のステップＳ３０１において、図２に示す一致判定部８１は、カット点情報記憶部９２に記憶されたカット点情報に基づき、カット点情報の一致判定を実行し、新たに記録された楽曲コンテンツと過去に記録された楽曲コンテンツとの重複を検出する。なお、ステップＳ３０１の詳細については後述する。

ステップＳ３０２において、位置合わせ処理部８３は、楽曲コンテンツの相対位置を一致させるため、各楽曲コンテンツの最初のカット点の位置を一致させる。ステップＳ３０２の詳細については後述する。

ステップＳ３０３において、セグメント選択部８４は、各楽曲コンテンツにて時間的位置の等しい各セグメントを、ＭＰ３コーデック３及び制御部８０を介して楽曲コンテンツ記憶部９１から取得する。

ステップＳ３０４において、セグメント選択部８４は、各楽曲コンテンツにて時間的位置の等しい各セグメントについての品質情報（雑音レベル、トークの尤度）を、品質情報記憶部９３から取得する。セグメント選択部８４は、より低雑音であるセグメント、もしくは、より低いトークの尤度を有するセグメントを選択する。

ステップＳ３０５において、セグメント結合部８５は、ステップＳ３０４で選択されたセグメントを、カット点を接点として結合する。

ステップＳ３０６において、制御部８０は、各楽曲コンテンツの各セグメントのうち、最後のセグメントまで楽曲一致判定処理が完了したか否かを判定する。最後のセグメントまで楽曲一致判定処理が完了したと判定された場合、楽曲一致判定処理が完了する。最後のセグメントまで楽曲一致判定処理が完了していないと判定された場合、ステップＳ３０３に処理が戻る。

（一致判定処理フロー例）
次に、図１１に示すフローチャートを参照して、一致判定処理、すなわち図１０のステップＳ３０１の詳細について説明する。ただし、一致判定対象の一方の（１曲目の）楽曲コンテンツのカット点の位置をＴ０〜ＴＮとし、他方の（２曲目の）楽曲コンテンツのカット点の位置をＳ０〜ＳＮとする（Ｎ；１以上の整数）。

図１１のステップＳ４０１において、一致判定部８１は、変数“ｎ”を０に初期化する。

ステップＳ４０２において、一致判定部８１は、各楽曲コンテンツの最後のカット点まで一致判定処理が完了したか否かを判定するため、変数“ｎ”が“Ｎ＋１”よりも小さいか否か判定する。変数“ｎ”が“Ｎ＋１”よりも小さい場合、ステップＳ４０３に移行する。変数“ｎ”が“Ｎ＋１”以上である場合、ステップＳ４０５に移行する。

ステップＳ４０３において、一致判定部８１は、隣接する２つのカット点により区分されるセグメントの期間が、各楽曲コンテンツ間で等しいか否かを判定するため、｜Ｔ（ｎ＋１）−Ｔｎ｜と、｜Ｓ（ｎ＋１）−Ｓｎ｜とが、等しいか否かを判定する。｜Ｔ（ｎ＋１）−Ｔｎ｜と、｜Ｓ（ｎ＋１）−Ｓｎ｜とが等しいと判定された場合、ステップＳ４０４に移行する。｜Ｔ（ｎ＋１）−Ｔｎ｜と、｜Ｓ（ｎ＋１）−Ｓｎ｜とが等しくないと判定された場合、ステップＳ４０６に移行する。

ステップＳ４０４において、一致判定部８１は、変数“ｎ”をインクリメントし、その後ステップＳ４０２に処理が戻る。

一方、ステップＳ４０５において、一致判定部８１は、各楽曲コンテンツの各セグメントの期間がすべて一致しているため、各楽曲コンテンツが一致すると判定する。

これに対してステップＳ４０６において、一致判定部８１は、各楽曲コンテンツの各セグメントの期間が一致しないため、各楽曲コンテンツが一致しないと判定する。

（位置合わせ処理フロー例）
次に、図１２に示すフローチャートを参照して、楽曲位置合わせ処理、すなわち図１０のステップＳ３０２の詳細について説明する。ただし、一致判定対象の一方の（１曲目の）楽曲コンテンツのカット点の位置をＴ０〜ＴＮとし、他方の（２曲目の）楽曲コンテンツのカット点の位置をＳ０〜ＳＮとする（Ｎ；１以上の整数）。

図１２のステップＳ５０１において、位置合わせ処理部８３は、２つの楽曲コンテンツの最初のカット点Ｓ０，Ｔ０の時間的位置を一致させる。

ステップＳ５０２において、位置合わせ処理部８３は、変数“ｎ”を０に初期化する。

ステップＳ５０３において、位置合わせ処理部８３は、各楽曲コンテンツの最後のカット点まで位置合わせ処理が完了したか否かを判定するため、変数“ｎ”が“Ｎ＋１”よりも小さいか否か判定する。変数“ｎ”が“Ｎ＋１”よりも小さい場合、ステップＳ５０４に移行する。変数“ｎ”が“Ｎ＋１”以上である場合、ステップＳ５０６に移行する。

ステップＳ５０４において、位置合わせ処理部８３は、隣接する２つのカット点により区分されるセグメントの期間が、各楽曲コンテンツ間で等しいか否かを判定するため、｜Ｔ（ｎ＋１）−Ｔｎ｜と、｜Ｓ（ｎ＋１）−Ｓｎ｜とが、等しいか否かを判定する。｜Ｔ（ｎ＋１）−Ｔｎ｜と、｜Ｓ（ｎ＋１）−Ｓｎ｜とが等しいと判定された場合、ステップＳ５０５に移行する。｜Ｔ（ｎ＋１）−Ｔｎ｜と、｜Ｓ（ｎ＋１）−Ｓｎ｜とが等しくないと判定された場合、位置合わせ処理が終了する。

ステップＳ５０５において、位置合わせ処理部８３は、変数“ｎ”をインクリメントし、その後ステップＳ５０３に処理が戻る。

ステップＳ５０６において、位置合わせ処理部８３は、２つの楽曲コンテンツの最初のカット点Ｓ０，Ｔ０の時間的位置の差を記録する。

（作用及び効果）
以上詳細に説明したように、本実施形態によれば、楽曲で特徴量の変化が大きい時点をカット点として記憶し、このカット点に関する情報によって楽曲の一致判定を行うので、少ない演算量で楽曲の一致判定を行うことができる。

また、本実施形態によれば、カット点検出部７１が、楽曲コンテンツから音声信号のパワー又は周波数の単位時間当たりの変化量を特徴量として算出するので、楽曲コンテンツについて好ましい特徴量を得ることができ、精度の良いカット点を検出することができる。

更に、本実施形態によれば、一致判定部８１が、各楽曲コンテンツのカット点の個数に基づいて、複数の楽曲コンテンツが一致するか否かを判定することによって、楽曲の一致判定を容易に実行可能となり、演算量を削減することができる。

本実施形態によれば、一致判定部８１が、各楽曲コンテンツのカット点間の時間間隔に基づいて、複数の楽曲コンテンツが一致するか否かを判定することによって、楽曲の一致判定を容易に実行可能となり、演算量を削減することができる。

（第１変形例）
上述した実施形態に係る一致判定処理においては、隣接する２つのカット点により区分されるセグメントの期間が、各楽曲コンテンツ間で等しいか否かを判定する場合について説明した。

しかし、カット点の検出位置は、各楽曲コンテンツの状態によって異なる可能性があるため、若干の位置ずれを許容しつつ、一致判定を行うことが好ましい。

そこで、本変形例では、図１３に示すフローチャートを参照して、若干の位置ずれを許容した一致判定処理について説明する。図１３において、一致判定対象の一方の（１曲目の）楽曲コンテンツのカット点の位置をＴ０〜ＴＮとし、他方の（２曲目の）楽曲コンテンツのカット点の位置をＳ０〜ＳＮとする（Ｎ；１以上の整数）。ただし、図１１と同様の処理については、重複する説明を省略する。

図１３のステップＳ６０１において、一致判定部８１は、変数“ｎ”を０に初期化する。

ステップＳ６０２において、一致判定部８１は、各楽曲コンテンツの最後のカット点まで一致判定処理が完了したか否かを判定するため、変数“ｎ”が“Ｎ＋１”よりも小さいか否か判定する。変数“ｎ”が“Ｎ＋１”よりも小さい場合、ステップＳ６０３に移行する。変数“ｎ”が“Ｎ＋１”以上である場合、ステップＳ６０５に移行する。

ステップＳ６０３において、一致判定部８１は、各楽曲コンテンツにおける時間的位置の等しい各セグメントの期間の差分が、所定の閾値σよりも小さいか否かを判定する。各楽曲コンテンツにおける時間的位置の等しい各セグメントの期間の差分が、所定の閾値σよりも小さいと判定された場合、ステップＳ６０４に移行する。一方、各楽曲コンテンツにおける時間的位置の等しい各セグメントの期間の差分が、所定の閾値σ以上であると判定された場合、ステップＳ６０６に移行する。

ステップＳ６０４において、一致判定部８１は、変数“ｎ”をインクリメントし、その後ステップＳ６０２に処理が戻る。

一方、ステップＳ６０５において、一致判定部８１は、各楽曲コンテンツの各セグメントの期間がすべて一致又は略一致しているため、各楽曲コンテンツが一致すると判定する。

これに対してステップＳ６０６において、一致判定部８１は、各楽曲コンテンツの各セグメントの期間が一致又は略一致しないため、各楽曲コンテンツが一致しないと判定する。

このように、本変形例によれば、カット点の検出位置における若干の位置ずれを許容しつつ、一致判定を行うことができる。

（第２変形例）
上述した実施形態においては、各楽曲コンテンツのカット点数が等しい場合に図１１に示す一致判定処理を実行する場合について説明した。

しかし、同一楽曲であっても、一方の楽曲コンテンツの先頭部分が欠けていること等により、カット点数が異なる可能性がある。具体的には、テレビ放送やラジオ放送から抽出して得られた楽曲コンテンツの場合、コンテンツの先頭部分が欠けていることがある。

そこで、本変形例では、図１４に示すフローチャートを参照して、カット点数が異なっている場合であっても、同一楽曲を検知可能な一致判定処理について説明する。図１４において、一致判定対象の一方の（１曲目の）楽曲コンテンツのカット点の位置をＴ０〜ＴＮとし、他方の（２曲目の）楽曲コンテンツのカット点の位置をＳ０〜ＳＭとする（Ｎ，Ｍ；１以上の整数）。ただし、図１１及び図１３と同様の処理については、重複する説明を省略する。

図１４のステップＳ７０１において、一致判定部８１は、変数“ｎ”を０に初期化する。変数“ｎ”は、図１５に示すように、１曲目の楽曲コンテンツ＃１のカット点を先頭から順次指定するためのものである。

ステップＳ７０２において、一致判定部８１は、変数“ｍ”を０に初期化する。変数“ｍ”は、図１５に示すように、２曲目の楽曲コンテンツ＃２のカット点を先頭から順次指定するためのものである。

ステップＳ７０３において、一致判定部８１は、各セグメントの期間の差分が、所定の閾値σよりも小さいか否かを判定する。図１５の例では、楽曲コンテンツ＃１及び＃２のセグメント１の期間の差分が、所定の閾値σよりも小さいか判定される。各セグメントの期間の差分が、所定の閾値σよりも小さいと判定された場合、ステップＳ７０８に移行する。一方、各セグメントの期間の差分が、所定の閾値σ以上であると判定された場合、ステップＳ７０４に移行する。

ステップＳ７０４において、一致判定部８１は、変数“ｍ”をインクリメントする。

ステップＳ７０４において、一致判定部８１は、変数“ｍ”が、“Ｍ”よりも大きいか否かを判定する。変数“ｍ”が“Ｍ”よりも大きいと判定された場合、ステップＳ７０６に移行する。一方、変数“ｍ”が“Ｍ”以下であると判定された場合、ステップＳ７０３に処理が戻る。

ステップＳ７０６において、一致判定部８１は、変数“ｎ”をインクリメントする。

ステップＳ７０７において、一致判定部８１は、変数“ｎ”が、“Ｎ”よりも大きいか否かを判定する。変数“ｎ”が“Ｎ”よりも大きいと判定された場合、ステップＳ７１１に移行する。一方、変数“ｎ”が“Ｎ”以下であると判定された場合、ステップＳ７０２に処理が戻る。

この結果、変数“ｍ”が０に初期化されることによって、図４の例では、楽曲コンテンツ＃１のカット点＃１と、楽曲コンテンツ＃２のカット点＃０とが変数“ｎ”及び“ｍ”によってそれぞれ指定されることになる。よって、ステップＳ７０３にて、楽曲コンテンツ＃１のセグメント２と、楽曲コンテンツ＃２のセグメント１とが比較され、互いに一致又は略一致と判定される。

ステップＳ７０８においては、一致判定部８１は、変数“ｎ”又は“ｍ”が、“Ｎ”又は“Ｍ”のいずれか小さい方よりも小さいか否かを判定する。変数“ｎ”又は“ｍ”が、“Ｎ”又は“Ｍ”のいずれか小さい方よりも小さいと判定された場合、ステップＳ７０９に移行する。一方、変数“ｎ”又は“ｍ”が、“Ｎ”又は“Ｍ”のいずれか小さい方以上であると判定された場合、ステップＳ７１２に移行する。

ステップＳ７０９において、一致判定部８１は、変数“ｎ”及び“ｍ”をインクリメントする。

ステップＳ７１０において、一致判定部８１は、各セグメントの期間の差分が、所定の閾値σよりも小さいか否かを判定する。図１５の例では、楽曲コンテンツ＃１のセグメント３の期間と、楽曲コンテンツ＃２のセグメント２の期間との差分が、所定の閾値σよりも小さいか判定される。各セグメントの期間の差分が、所定の閾値σよりも小さいと判定された場合、ステップＳ７０８に処理が戻る。一方、各セグメントの期間の差分が、所定の閾値σ以上であると判定された場合、ステップＳ７１１に移行する。

ステップＳ７１１においては、一致判定部８１は、各楽曲コンテンツの各セグメントの期間が一致又は略一致しないため、各楽曲コンテンツが一致しないと判定する。

一方、ステップＳ７１２において、一致判定部８１は、各楽曲コンテンツの各セグメントの期間が一致又は略一致しているため、各楽曲コンテンツが一致すると判定する。

このように、本変形例によれば、カット点数が異なっている場合であっても、セグメントの特徴を利用することで、同一楽曲を検知することができる。

なお、本変形例に係る一致判定処理では、カット点数が異なる２つの楽曲コンテンツのうち、カット点数が多い方の楽曲コンテンツのカット点が、変数“ｎ”で指定されるようにしておくことが必要である。

［第２実施形態］
次に、本発明の第２実施形態について説明する。なお、本実施形態では、上述した第１実施形態と異なる点を主に説明し、重複する説明を省略する。

（楽曲記録再生装置の概略構成）
図１６は、本実施形態に係る楽曲記録再生装置２００の概略構成を示す図である。図１６に示すように、楽曲記録再生装置２００は、楽曲コンテンツを複数の取得経路によって取得可能な構成を有している。

具体的には、楽曲記録再生装置２００は、ＦＭ放送局（ＦＭラジオ放送局）１０１によって無線で送信されるＦＭ放送信号を受信し、受信したＦＭ放送信号から楽曲コンテンツを取得する。

また、楽曲記録再生装置２００は、楽曲コンテンツを記録する記録媒体、具体的には、ＣＤ／ＤＶＤ１０４又はメモリカード１０５から楽曲コンテンツを取得する。

さらに、楽曲記録再生装置２００は、楽曲コンテンツを配信する楽曲コンテンツ配信サーバ１０２から通信ＮＷ１０３を介して楽曲コンテンツを取得する。

楽曲記録再生装置２００は、ＦＭ放送信号から取得される楽曲コンテンツを自動録音することに加え、楽曲コンテンツ配信サーバ１０２からダウンロードした楽曲コンテンツを記録したり、記録媒体（ＣＤ／ＤＶＤ１０４又はメモリカード１０５）から読み出した楽曲コンテンツを記録したりする。この結果、楽曲記録再生装置２００には、複数の同一楽曲コンテンツが記録されることがあり、ＨＤＤ９の記録容量が無駄に消費されることになる。

そこで、楽曲記録再生装置２００は、複数の同一楽曲コンテンツが録音された場合に、当該複数の同一楽曲コンテンツのうち不要な楽曲コンテンツ、すなわち品質（音質）が低い楽曲コンテンツを削除する。

ここで、ＦＭ放送信号から取得される楽曲コンテンツには、ノイズが多く含まれている。このようなノイズには、トーク（曲紹介など）も含まれる。つまり、ＦＭ放送信号から取得される楽曲コンテンツは、品質（音質）が低い。一方、記録媒体（ＣＤ／ＤＶＤ１０４又はメモリカード１０５）、楽曲コンテンツ配信サーバ１０２から取得される楽曲コンテンツは、ノイズも少なく高品質である。

したがって、楽曲記録再生装置２００は、例えば、ＣＤ／ＤＶＤ１０４から録音された楽曲コンテンツと、ＦＭ放送信号から録音された楽曲コンテンツとが同一である場合には、ＦＭ放送信号から録音された楽曲コンテンツを削除する。

（楽曲記録再生装置のハードウェア構成）
図１７は、本実施形態に係る楽曲記録再生装置２００のハードウェア構成例を示すブロック図である。

図１７に示すように、楽曲記録再生装置２００は、図１の構成に加え、通信インターフェース（以下、「通信Ｉ／Ｆ」）１１、ＣＤ／ＤＶＤドライブ１２、メモリカードインターフェース（以下、「メモリカードＩ／Ｆ」）１３を備えている。

通信Ｉ／Ｆ１１は、通信ＮＷ１０３とのインターフェースとして機能し、通信ＮＷ１０３を介して楽曲コンテンツ配信サーバ１０２と通信する。そして、通信Ｉ／Ｆ１１は、楽曲コンテンツ配信サーバ１０２から通信ＮＷ１０３を介して楽曲コンテンツをダウンロードする。

ＣＤ／ＤＶＤドライブ１２は、ＣＤ／ＤＶＤを回転駆動するとともに、ＣＤ／ＤＶＤに書き込まれている楽曲コンテンツを光学的に読み取る。メモリカードＩ／Ｆ１３は、メモリカード１０５にアクセスし、メモリカード１０５に格納されている楽曲コンテンツを読み出す。

（楽曲記録再生装置の機能ブロック構成）
図１８は、楽曲記録再生装置２００の記録系統の機能構成例を示す機能ブロック図である。

図１８に示すように、楽曲記録再生装置２００は、第１楽曲コンテンツ取得部２１、第２楽曲コンテンツ取得部２２、識別情報付加部８６、楽曲コンテンツ記憶部９１、カット点検出部７１、カット点情報記憶部９２、一致判定部８１、識別情報判定部８７、品質判定部７２、制御部８０、及びＭＰ３コーデック３を備える。

第１楽曲コンテンツ取得部２１は、ＦＭ放送局１０１から無線で送信されるＦＭ放送信号を受信し、受信したＦＭ放送信号から楽曲コンテンツを取得する。第１楽曲コンテンツ取得部２１を構成するチューナ１、Ａ／Ｄ変換器２及び楽曲コンテンツ抽出部７０は、上述した第１実施形態と同様に構成される。

第２楽曲コンテンツ取得部２２は、上述した通信Ｉ／Ｆ１１、ＣＤ／ＤＶＤドライブ１２及びメモリカードＩ／Ｆ１３によって構成される。

識別情報付加部８６は、識別情報付加部８６は、第１楽曲コンテンツ取得部２１によって取得された楽曲コンテンツにＦＭ録音フラグを付加し、第２楽曲コンテンツ取得部２２によって取得された楽曲コンテンツに購入フラグを付加する。

ここで、ＦＭ録音フラグは、楽曲コンテンツがＦＭ録音（自動録音）されたものであることを示すフラグである。また、購入フラグは、楽曲コンテンツが購入されたもの、すなわち、記録媒体（ＣＤ／ＤＶＤ１０４、メモリカード１０５）又は楽曲コンテンツ配信サーバ１０２から取得されたものであることを示すフラグである。

楽曲コンテンツ記憶部９１、カット点検出部７１、カット点情報記憶部９２、一致判定部８１は、上述した第１実施形態と同様に構成される。ただし、本実施形態では、一致判定部８１は、カット点情報に基づいて、楽曲コンテンツ記憶部９１に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する。

識別情報判定部８７は、一致する複数の楽曲コンテンツにＦＭ録音フラグ及び購入フラグが付加されているか否かを判定する。

制御部８０は、一致する複数の楽曲コンテンツにＦＭ録音フラグ及び購入フラグが付加されていると判定された場合、一致する複数の楽曲コンテンツのうちＦＭ録音フラグが付加されている楽曲コンテンツを、楽曲コンテンツ記憶部９１から削除する。

また、品質判定部７２は、一致する複数の楽曲コンテンツに同一の識別情報が付加されている場合、一致する複数の楽曲コンテンツに含まれるノイズを検出する。

なお、上述した第１実施形態では、品質判定部７２は、品質情報をセグメント毎に生成していたが、本実施形態では、品質判定部７２は、楽曲コンテンツ全体に対する品質情報を生成すればよい。

制御部８０は、ノイズ検出部による検出結果に基づき、一致する複数の楽曲コンテンツのうちノイズが最も多い楽曲コンテンツを楽曲コンテンツ記憶部９１から削除する。

（楽曲コンテンツ削除処理の概要）
図１９は、楽曲コンテンツ記憶部９１に記録される楽曲コンテンツの一例を示す図である。以下においては、楽曲コンテンツ記憶部９１に記録される楽曲コンテンツは、ＦＭラジオ放送から自動で抽出された楽曲コンテンツ、又はＣＤ／ＤＶＤ１０４から取得された楽曲コンテンツであるものとする。

図１９の例では、楽曲コンテンツ記憶部９１において、ＦＭラジオ放送から自動で抽出された楽曲コンテンツＡ，Ｂ，Ｃと、ＣＤ／ＤＶＤ１０４から取得された楽曲コンテンツＡ，Ｄ，Ｅとが記録されている。

ＦＭラジオ放送から自動で抽出された楽曲コンテンツＡ，Ｂ，Ｃには、ＦＭ録音フラグＦ１がヘッダに付加されている。また、ＣＤ／ＤＶＤ１０４から取得された楽曲コンテンツＡ，Ｄ，Ｅには、購入フラグＦ２がヘッダに付加されている。

この場合、一致判定部８１は、ＦＭラジオ放送から自動で抽出された楽曲コンテンツＡと、ＣＤ／ＤＶＤ１０４から取得された楽曲コンテンツＡとの重複を検出する。そして、識別情報判定部８７は、重複する楽曲コンテンツＡに対してＦＭ録音フラグＦ１及び購入フラグＦ２が付加されていると判定する。

上述したように、ＦＭラジオ放送から自動で抽出された楽曲コンテンツＡよりも、ＣＤ／ＤＶＤ１０４から取得された楽曲コンテンツＡが高品質である。したがって、図１１の例では、制御部８０は、ＦＭラジオ放送から自動で抽出された楽曲コンテンツＡを、楽曲コンテンツ記憶部９１から削除する。

（楽曲コンテンツ削除処理フロー例）
図２０は、楽曲コンテンツ削除処理の処理フローを示すフローチャートである。

ステップＳ８０１において、一致判定部８１は、カット点情報に基づき、楽曲コンテンツ記憶部９１に記録されている複数の楽曲コンテンツが一致するか否かを判定する。ここでは、一致判定部８１は、互いに一致する２つの楽曲コンテンツを検出する。

ステップＳ８０２において、識別情報判定部８７は、一致判定部８１によって検出された各楽曲コンテンツに付加されている識別情報（フラグ）が同一であるか否かを判定する。

一致判定部８１によって検出された各楽曲コンテンツに付加されている識別情報（フラグ）が異なる場合、処理がステップＳ８０３に進む。

ステップＳ８０３において、制御部８０は、一致判定部８１によって検出された各楽曲コンテンツのうち、ＦＭ録音フラグが付加されている楽曲コンテンツを楽曲コンテンツ記憶部９１から削除する。

一方、一致判定部８１によって検出された各楽曲コンテンツに付加されている識別情報が同一である場合、処理がステップＳ８０４に進む。

ステップＳ８０４において、品質判定部７２は、一致判定部８１によって検出された各楽曲コンテンツに含まれるノイズを検出する。

ステップＳ８０５において、制御部８０は、一致する２つの楽曲コンテンツのうち、品質が低い方、すなわちノイズが多い方の楽曲コンテンツを楽曲コンテンツ記憶部９１から削除する。

（作用・効果）
本実施形態によれば、楽曲記録再生装置２００は、複数の同一楽曲コンテンツが録音されている場合において、記録媒体（ＣＤ／ＤＶＤ１０４、メモリカード１０５）や楽曲コンテンツ配信サーバ１０２から取得した楽曲コンテンツを、ＦＭ放送信号から取得した楽曲コンテンツよりも優先して楽曲コンテンツ記録部９１（ＨＤＤ９）に残すことができる。

すなわち、品質（音質）が低い楽曲コンテンツを削除することによって、高品質な楽曲コンテンツを楽曲コンテンツ記録部９１（ＨＤＤ９）に残すことができる。このため、楽曲コンテンツ記憶部９１（ＨＤＤ９）の記録容量を有効活用できる。

本実施形態によれば、品質判定部７２は、一致する複数の楽曲コンテンツに同一のフラグが付加されている場合、一致する複数の楽曲コンテンツに含まれるノイズを検出する。制御部８０は、ノイズの検出結果に基づき、一致する複数の楽曲コンテンツのうちノイズが多い楽曲コンテンツを削除する。

したがって、楽曲記録再生装置２００は、同様の取得経路で取得した楽曲コンテンツについては、ノイズが少ない楽曲コンテンツを楽曲コンテンツ記憶部９１（ＨＤＤ９）に残すことができるので、高品質な楽曲コンテンツを楽曲コンテンツ記録部９１（ＨＤＤ９）に残すことができる。

［その他の実施形態］
上記のように、本発明は実施形態によって記載したが、この開示の一部をなす論述及び図面はこの発明を限定するものであると理解すべきではない。この開示から当業者には様々な代替実施形態、実施例及び運用技術が明らかとなる。

上述した第１実施形態及び第２実施形態においては、楽曲コンテンツの特徴量として、音声信号のパワーの単位時間当たりの変化量を使用する場合について説明した。その他の実施形態として、図２１に示すように、楽曲コンテンツの特徴量として、音声信号の周波数の単位時間当たりの変化量を使用しても良い。

また、上述した第１実施形態においては、ラジオ放送を受信して、楽曲コンテンツを記録する楽曲記録再生装置の例について説明した。しかしながら、インターネット網等の通信網を利用した放送を受信しても良く、ＣＤ等から読み出された楽曲コンテンツを記録・再生しても良い。

更に、上述した第１実施形態においては、２つの楽曲コンテンツを結合する一例について説明した。しかしながら、３つ以上の楽曲コンテンツを結合する場合に適用可能である。３つ以上の楽曲コンテンツを結合する場合、２つの楽曲コンテンツを結合する場合よりも高品質な楽曲コンテンツを作成可能となる。

上述した第２実施形態では、カット点検出部７１は、楽曲コンテンツ記憶部９１に記憶された各楽曲コンテンツからカット点を検出していた。しかしながら、第１実施形態において述べたように、ＦＭ放送信号から抽出された楽曲コンテンツについては、楽曲コンテンツ抽出時にカット点が検出され、検出されたカット点に関する情報がカット点情報記憶部９２に既に記憶されている。したがって、カット点検出部７１は、ＦＭ放送信号から抽出された楽曲コンテンツ、すなわちＦＭ録音フラグが付加されている楽曲コンテンツについては、カット点の検出を省略し、カット点情報記憶部９２に記憶されているカット点に関する情報を取得してもよい。また、楽曲コンテンツ抽出部７０は、カット点を用いて楽曲コンテンツを抽出する場合、カット点検出部７１と同様に特徴量を閾値と比較することによってカット点を検出する。ここで、楽曲コンテンツ抽出部７０においては、楽曲コンテンツを抽出するための最小限のカット点が検出できればよい。このため、楽曲コンテンツ抽出部７０において用いられる閾値は、カット点検出部７１において用いられる閾値よりも大きくてもよい。

上述した実施形態においては、楽曲コンテンツ等を記憶するためにＨＤＤを用いる一例を説明したが、ＨＤＤに限らず、フラッシュメモリ等の半導体記憶装置を用いてもかまわない。

また、楽曲コンテンツの圧縮符号化方式としてＭＰ３を利用する場合について説明したが、他の圧縮符号化方式を採用してもかまわない。

更に、上述した第１実施形態及び第２実施形態で説明した各処理フローをコンピュータプログラムとして実装し、パーソナルコンピュータ（ＰＣ）等に実行させることが可能である。

このように本発明は、ここでは記載していない様々な実施形態等を包含するということを理解すべきである。したがって、本発明はこの開示から妥当な特許請求の範囲の発明特定事項によってのみ限定されるものである。

本発明の第１実施形態に係る楽曲記録再生装置のハードウェア構成例を示すブロック図である。本発明の第１実施形態に係る楽曲一致判定装置の機能構成例を示す機能ブロック図である。本発明の第１実施形態に係るカット点検出部の機能構成例を示す機能ブロック図である。本発明の第１実施形態に係るパワー算出部の動作を説明するための波形図である。本発明の第１実施形態に係る微分演算部の動作を説明するための波形図である。図６（ａ）は本発明の第１実施形態に係るカット点数情報の一例を示す図であり、図６（ｂ）は本発明の第１実施形態に係るカット点時間情報の一例を示す図である。本発明の第１実施形態に係るセグメント選択部及びセグメント結合部の動作を説明するための波形図である。本発明の第１実施形態に係る楽曲記録処理フロー例を示すフローチャートである。本発明の第１実施形態に係る楽曲再生処理フロー例を示すフローチャートである。本発明の第１実施形態に係る楽曲一致判定処理フロー例を示すフローチャートである。本発明の第１実施形態に係る楽曲一致判定処理における一致判定処理フロー例を示すフローチャートである。本発明の第１実施形態に係る楽曲一致判定処理における位置合わせ処理フロー例を示すフローチャートである。本発明の第１実施形態の第１変形例に係る楽曲一致判定処理フロー例を示すフローチャートである。本発明の第１実施形態の第２変形例に係る楽曲一致判定処理フロー例を示すフローチャートである。本発明の第１実施形態の第２変形例に係る楽曲一致判定処理を説明するためのタイムチャートである。本発明の第２実施形態に係る楽曲記録再生装置の概略構成を示す図である。本発明の第２実施形態に係る楽曲記録再生装置のハードウェア構成例を示すブロック図である。本発明の第２実施形態に係る楽曲記録再生装置の記録系統の機能構成例を示す機能ブロック図である。本発明の第２実施形態に係る楽曲コンテンツ記憶部に記録される楽曲コンテンツの一例を示す図である。本発明の第２実施形態に係る楽曲記録再生装置によって実行される楽曲コンテンツ削除処理の処理フローを示すフローチャートである。その他の実施形態に係るカット点検出動作を説明するための波形図である。

符号の説明

１…チューナ、２…Ａ／Ｄ変換器、３…ＭＰ３コーデック、４…Ｄ／Ａ変換器、５…スピーカ、６…バス、７…ＤＳＰ、８…ＣＰＵ、９…ＨＤＤ、１０…メモリ、１２…ＣＤ／ＤＶＤドライブ、２１…第１楽曲コンテンツ取得部、２２…第２楽曲コンテンツ取得部、７０…楽曲コンテンツ抽出部、７１…カット点検出部、７２…品質判定部、８０…制御部、８１…一致判定部、８２…セグメント化部、８３…位置合わせ処理部、８４…セグメント選択部、８５…セグメント結合部、８６…識別情報付加部、８７…識別情報判定部、９１…楽曲コンテンツ記憶部、９２…カット点情報記憶部、９３…品質情報記憶部、１００…楽曲一致判定装置、１０１…ＦＭ放送局、１０２…楽曲コンテンツ配信サーバ、１０３…通信ＮＷ、１０４…ＣＤ／ＤＶＤ、１０５…メモリカード、２００…楽曲記録再生装置、７１１…パワー算出部、７１２…微分演算部、７１３…閾値比較部、７１４…カット点記録処理部

Claims

複数の楽曲コンテンツのそれぞれから特徴量を算出し、前記特徴量が閾値を超えた時点をカット点として検出するカット点検出部と、
前記複数の楽曲コンテンツのそれぞれについて、前記カット点に関する情報を記憶するカット点情報記憶部と、
前記記憶されたカット点に関する情報に基づき、前記複数の楽曲コンテンツが一致するか否かを判定する一致判定部と
を備え、
前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
前記一方の楽曲コンテンツのカット点の位置をＴ０〜ＴＮとし、前記他方の楽曲コンテンツのカット点の位置をＳ０〜ＳＭとし、
前記ＴＮのＮ及び前記ＳＭのＭは、１以上の整数であり、
前記一致判定部は、変数ｎを０に初期化する第１ステップを実行し、
前記第１ステップの後に、前記一致判定部は、変数ｍを０に初期化する第２ステップを実行し、
前記第２ステップの後に、前記一致判定部は、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が所定の閾値であるσよりも小さいか判定する第３ステップを実行し、
前記第３ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合、前記一致判定部は、前記変数ｍをインクリメントする第４ステップを実行し、
前記第４ステップの後に、前記一致判定部は、前記変数ｍが前記Ｍよりも大きいか否かを判定する第５ステップを実行し、
前記第５ステップにおいて、前記変数ｍが前記Ｍ以下であると判定した場合、前記一致判定部は、前記第３ステップを実行し、
前記第５ステップにおいて、前記変数ｍが前記Ｍよりも大きいと判定した場合、前記一致判定部は、前記変数ｎをインクリメントする第６ステップを実行し、
前記第６ステップの後に、前記一致判定部は、前記変数ｎが前記Ｎよりも大きいか否かを判定する第７ステップを実行し、
前記第７ステップにおいて、前記変数ｎが前記変数Ｎ以下であると判定した場合、前記一致判定部は、前記第２ステップを実行し、
前記第３ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合、前記一致判定部は、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいか否かを判定する第８ステップを実行し、
前記第８ステップにおいて、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいと判定した場合、前記一致判定部は、前記変数ｎ及び前記変数ｍをインクリメントする第９ステップを実行し、
前記第９ステップの後に、前記一致判定部は、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいか判定する第１０ステップを実行し、
前記第１０ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合、前記一致判定部は、前記第８ステップを実行し、
前記第１０ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合、前記一致判定部は、前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第１１ステップを実行し、
前記第７ステップにおいて、前記変数ｎが前記Ｎよりも大きいと判定した場合、前記一致判定部は、前記第１１ステップを実行し、
前記第８ステップにおいて、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方以上であると判定した場合、前記一致判定部は、前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第１２ステップを実行することを特徴とする楽曲一致判定装置。
前記カット点検出部は、前記特徴量として、音声信号のパワー又は周波数の単位時間当たりの変化量を算出することを特徴とする請求項１に記載の楽曲一致判定装置。
前記一致判定部は、各楽曲コンテンツのカット点の個数に基づいて、前記複数の楽曲コンテンツが一致するか否かを判定することを特徴とする請求項１又は２に記載の楽曲一致判定装置。
前記一致判定部は、各楽曲コンテンツのカット点間の時間間隔に基づいて、前記複数の楽曲コンテンツが一致するか否かを判定することを特徴とする請求項１〜３のいずれか１項に記載の楽曲一致判定装置。
楽曲コンテンツを取得する第１取得部と、
前記第１取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第２取得部と、
前記第１取得部によって取得された楽曲コンテンツ、及び前記第２取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部と
を備える楽曲記録装置であって、
前記第１取得部によって取得された楽曲コンテンツに第１識別情報を付加し、前記第２取得部によって取得された楽曲コンテンツに第２識別情報を付加する識別情報付加部と、
前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出し、前記特徴量が閾値を超えた時点をカット点として検出するカット点検出部と、
前記カット点検出部によって検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する一致検出部と、
前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されているか否かを判定する識別情報判定部と、
前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第１識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除する楽曲コンテンツ削除部と
を備え、
前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
前記一方の楽曲コンテンツのカット点の位置をＴ０〜ＴＮとし、前記他方の楽曲コンテンツのカット点の位置をＳ０〜ＳＭとし、
前記ＴＮのＮ及び前記ＳＭのＭは、１以上の整数であり、
前記一致検出部は、変数ｎを０に初期化する第１ステップを実行し、
前記第１ステップの後に、前記一致検出部は、変数ｍを０に初期化する第２ステップを実行し、
前記第２ステップの後に、前記一致検出部は、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が所定の閾値であるσよりも小さいか判定する第３ステップを実行し、
前記第３ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合、前記一致検出部は、前記変数ｍをインクリメントする第４ステップを実行し、
前記第４ステップの後に、前記一致検出部は、前記変数ｍが前記Ｍよりも大きいか否かを判定する第５ステップを実行し、
前記第５ステップにおいて、前記変数ｍが前記Ｍ以下であると判定した場合、前記一致検出部は、前記第３ステップを実行し、
前記第５ステップにおいて、前記変数ｍが前記Ｍよりも大きいと判定した場合、前記一致検出部は、前記変数ｎをインクリメントする第６ステップを実行し、
前記第６ステップの後に、前記一致検出部は、前記変数ｎが前記Ｎよりも大きいか否かを判定する第７ステップを実行し、
前記第７ステップにおいて、前記変数ｎが前記変数Ｎ以下であると判定した場合、前記一致検出部は、前記第２ステップを実行し、
前記第３ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合、前記一致検出部は、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいか否かを判定する第８ステップを実行し、
前記第８ステップにおいて、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいと判定した場合、前記一致検出部は、前記変数ｎ及び前記変数ｍをインクリメントする第９ステップを実行し、
前記第９ステップの後に、前記一致検出部は、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいか判定する第１０ステップを実行し、
前記第１０ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合、前記一致検出部は、前記第８ステップを実行し、
前記第１０ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合、前記一致検出部は、前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第１１ステップを実行し、
前記第７ステップにおいて、前記変数ｎが前記Ｎよりも大きいと判定した場合、前記一致検出部は、前記第１１ステップを実行し、
前記第８ステップにおいて、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方以上であると判定した場合、前記一致検出部は、前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第１２ステップを実行することを特徴とする楽曲記録装置。
前記第１取得部は、放送局から無線で送信される放送信号を受信し、受信した前記放送信号から楽曲コンテンツを取得し、
前記第２取得部は、楽曲コンテンツを記録する記録媒体から楽曲コンテンツを取得する、又は楽曲コンテンツを配信する配信サーバから通信ネットワークを介して楽曲コンテンツを取得する
ことを特徴とする請求項５に記載の楽曲記録装置。
前記一致する複数の楽曲コンテンツに同一の識別情報が付加されている場合、前記一致する複数の楽曲コンテンツに含まれるノイズを検出するノイズ検出部をさらに備え、
前記楽曲コンテンツ削除部は、前記ノイズ検出部による検出結果に基づき、前記一致する複数の楽曲コンテンツのうちノイズが最も多い楽曲コンテンツを削除することを特徴とする請求項５に記載の楽曲記録装置。
前記カット点検出部は、前記特徴量として、音声信号のパワー又は周波数の単位時間当たりの変化量を算出することを特徴とする請求項５〜７のいずれか１項に記載の楽曲記録装置。
前記一致検出部は、前記楽曲コンテンツ記憶部に記憶された楽曲コンテンツのカット点の個数に基づいて、前記一致する複数の楽曲コンテンツを検出することを特徴とする請求項５〜８のいずれか１項に記載の楽曲記録装置。
前記一致検出部は、前記楽曲コンテンツ記憶部に記憶された楽曲コンテンツのカット点間の時間間隔に基づいて、前記一致する複数の楽曲コンテンツを検出することを特徴とする請求項５〜８のいずれか１項に記載の楽曲記録装置。
複数の楽曲コンテンツのそれぞれから特徴量を算出し、前記特徴量が閾値を超えた時点をカット点として検出するステップと、
前記複数の楽曲コンテンツのそれぞれについて、前記カット点に関する情報を記憶するステップと、
前記記憶されたカット点に関する情報に基づき、前記複数の楽曲コンテンツが一致するか否かを判定するステップと
を含み、
前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
前記一方の楽曲コンテンツのカット点の位置をＴ０〜ＴＮとし、前記他方の楽曲コンテンツのカット点の位置をＳ０〜ＳＭとし、
前記ＴＮのＮ及び前記ＳＭのＭは、１以上の整数であり、
前記複数の楽曲コンテンツが一致するか否かを判定するステップは、
変数ｎを０に初期化する第１ステップと、
変数ｍを０に初期化する第２ステップと、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が所定の閾値であるσよりも小さいか判定する第３ステップと、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合、前記変数ｍをインクリメントする第４ステップと、
前記変数ｍが前記Ｍよりも大きいか否かを判定する第５ステップと、
前記変数ｎをインクリメントする第６ステップと、
前記変数ｎが前記Ｎよりも大きいか否かを判定する第７ステップと、
前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいか否かを判定する第８ステップと、
前記変数ｎ及び前記変数ｍをインクリメントする第９ステップと、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいか判定する第１０ステップと、
前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第１１ステップと、
前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第１２ステップと、を含み、
前記第２ステップは、前記第１ステップの後、及び、前記第７ステップにおいて、前記変数ｎが前記変数Ｎ以下であると判定した場合に行われ、
前記第３ステップは、前記第２ステップの後、及び、前記第５ステップにおいて、前記変数ｍが前記Ｍ以下であると判定した場合に行われ、
前記第４ステップは、前記第３ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合に行われ、
前記第５ステップは、前記第４ステップの後に行われ、
前記第６ステップは、前記第５ステップにおいて、前記変数ｍが前記Ｍよりも大きいと判定した場合に行われ、
前記第７ステップは、前記第６ステップの後に行われ、
前記第８ステップは、前記第３ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合、及び、前記第１０ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合に行われ、
前記第９ステップは、前記第８ステップにおいて、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいと判定した場合に行われ、
前記第１０ステップは、前記第９ステップの後に行われ、
前記第１１ステップは、前記第７ステップにおいて、前記変数ｎが前記Ｎよりも大きいと判定した場合、及び、前記第１０ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合に行われ、
前記第１２ステップは、前記第８ステップにおいて、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方以上であると判定した場合に行われることを特徴とする楽曲一致判定方法。
楽曲コンテンツを取得する第１取得部と、
前記第１取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第２取得部と、
前記第１取得部によって取得された楽曲コンテンツ、及び前記第２取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部と
を用いた楽曲記録方法であって、
前記第１取得部によって取得された楽曲コンテンツに第１識別情報を付加し、前記第２取得部によって取得された楽曲コンテンツに第２識別情報を付加するステップと、
前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出するとともに、前記特徴量が閾値を超えた時点をカット点として検出するステップと、
前記検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出するステップと、
前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されているか否かを判定するステップと、
前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第１識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除するステップと
を備え、
前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
前記一方の楽曲コンテンツのカット点の位置をＴ０〜ＴＮとし、前記他方の楽曲コンテンツのカット点の位置をＳ０〜ＳＭとし、
前記ＴＮのＮ及び前記ＳＭのＭは、１以上の整数であり、
前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出するステップは、
変数ｎを０に初期化する第１ステップと、
変数ｍを０に初期化する第２ステップと、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が所定の閾値であるσよりも小さいか判定する第３ステップと、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合、前記変数ｍをインクリメントする第４ステップと、
前記変数ｍが前記Ｍよりも大きいか否かを判定する第５ステップと、
前記変数ｎをインクリメントする第６ステップと、
前記変数ｎが前記Ｎよりも大きいか否かを判定する第７ステップと、
前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいか否かを判定する第８ステップと、
前記変数ｎ及び前記変数ｍをインクリメントする第９ステップと、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいか判定する第１０ステップと、
前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第１１ステップと、
前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第１２ステップと、を含み、
前記第２ステップは、前記第１ステップの後、及び、前記第７ステップにおいて、前記変数ｎが前記変数Ｎ以下であると判定した場合に行われ、
前記第３ステップは、前記第２ステップの後、及び、前記第５ステップにおいて、前記変数ｍが前記Ｍ以下であると判定した場合に行われ、
前記第４ステップは、前記第３ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合に行われ、
前記第５ステップは、前記第４ステップの後に行われ、
前記第６ステップは、前記第５ステップにおいて、前記変数ｍが前記Ｍよりも大きいと判定した場合に行われ、
前記第７ステップは、前記第６ステップの後に行われ、
前記第８ステップは、前記第３ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合、及び、前記第１０ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合に行われ、
前記第９ステップは、前記第８ステップにおいて、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいと判定した場合に行われ、
前記第１０ステップは、前記第９ステップの後に行われ、
前記第１１ステップは、前記第７ステップにおいて、前記変数ｎが前記Ｎよりも大きいと判定した場合、及び、前記第１０ステップにおいて、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合に行われ、
前記第１２ステップは、前記第８ステップにおいて、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方以上であると判定した場合に行われることを特徴とする楽曲記録方法。
コンピュータに、
複数の楽曲コンテンツのそれぞれから特徴量を算出し、前記特徴量が閾値を超えた時点をカット点として検出する手順と、
前記複数の楽曲コンテンツのそれぞれについて、前記カット点に関する情報を記憶する手順と、
前記記憶されたカット点に関する情報に基づき、前記複数の楽曲コンテンツが一致するか否かを判定する手順と
を実行させ、
前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
前記一方の楽曲コンテンツのカット点の位置をＴ０〜ＴＮとし、前記他方の楽曲コンテンツのカット点の位置をＳ０〜ＳＭとし、
前記ＴＮのＮ及び前記ＳＭのＭは、１以上の整数であり、
前記複数の楽曲コンテンツが一致するか否かを判定する手順は、
変数ｎを０に初期化する第１手順と、
変数ｍを０に初期化する第２手順と、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が所定の閾値であるσよりも小さいか判定する第３手順と、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合、前記変数ｍをインクリメントする第４手順と、
前記変数ｍが前記Ｍよりも大きいか否かを判定する第５手順と、
前記変数ｎをインクリメントする第６手順と、
前記変数ｎが前記Ｎよりも大きいか否かを判定する第７手順と、
前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいか否かを判定する第８手順と、
前記変数ｎ及び前記変数ｍをインクリメントする第９手順と、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいか判定する第１０手順と、
前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第１１手順と、
前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第１２手順と、を含み、
前記第２手順を、前記第１手順の後、及び、前記第７手順において、前記変数ｎが前記変数Ｎ以下であると判定した場合に実行させ、
前記第３手順を、前記第２手順の後、及び、前記第５手順において、前記変数ｍが前記Ｍ以下であると判定した場合に実行させ、
前記第４手順を、前記第３手順において、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合に実行させ、
前記第５手順を、前記第４手順の後に実行させ、
前記第６手順を、前記第５手順において、前記変数ｍが前記Ｍよりも大きいと判定した場合に実行させ、
前記第７手順を、前記第６手順の後に実行させ、
前記第８手順を、前記第３手順において、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合、及び、前記第１０手順において、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合に実行させ、
前記第９手順を、前記第８手順において、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいと判定した場合に実行させ、
前記第１０手順を、前記第９手順の後に実行させ、
前記第１１手順を、前記第７手順において、前記変数ｎが前記Ｎよりも大きいと判定した場合、及び、前記第１０手順において、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合に実行させ、
前記第１２手順を、前記第８手順において、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方以上であると判定した場合に実行させることを特徴とする楽曲一致判定プログラム。
楽曲コンテンツを取得する第１取得部と、
前記第１取得部によって取得される楽曲コンテンツよりも高品質の楽曲コンテンツを取得する第２取得部と、
前記第１取得部によって取得された楽曲コンテンツ、及び前記第２取得部によって取得された楽曲コンテンツを記憶する楽曲コンテンツ記憶部と
を備える楽曲記録装置として機能するコンピュータに、
前記第１取得部によって取得された楽曲コンテンツに第１識別情報を付加し、前記第２取得部によって取得された楽曲コンテンツに第２識別情報を付加する手順と、
前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツのそれぞれから特徴量を算出するとともに、前記特徴量が閾値を超えた時点をカット点として検出する手順と、
前記検出されたカット点に基づいて、前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する手順と、
前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されているか否かを判定する手順と、
前記一致する複数の楽曲コンテンツに前記第１識別情報及び前記第２識別情報が付加されていると判定された場合、前記一致する複数の楽曲コンテンツのうち前記第１識別情報が付加されている楽曲コンテンツを前記楽曲コンテンツ記憶部から削除する手順と
を実行させ、
前記複数の楽曲コンテンツは、一方の楽曲コンテンツと他方の楽曲コンテンツとを含み、
前記一方の楽曲コンテンツの前記カット点と前記他方の楽曲コンテンツの前記カット点との数が異なる場合、前記一方の楽曲コンテンツは、前記他方の楽曲コンテンツよりも前記カット点の数が多く、
前記一方の楽曲コンテンツのカット点の位置をＴ０〜ＴＮとし、前記他方の楽曲コンテンツのカット点の位置をＳ０〜ＳＭとし、
前記ＴＮのＮ及び前記ＳＭのＭは、１以上の整数であり、
前記楽曲コンテンツ記憶部に記憶された複数の楽曲コンテンツの中から、互いに一致する複数の楽曲コンテンツを検出する手順は、
変数ｎを０に初期化する第１手順と、
変数ｍを０に初期化する第２手順と、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が所定の閾値であるσよりも小さいか判定する第３手順と、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合、前記変数ｍをインクリメントする第４手順と、
前記変数ｍが前記Ｍよりも大きいか否かを判定する第５手順と、
前記変数ｎをインクリメントする第６手順と、
前記変数ｎが前記Ｎよりも大きいか否かを判定する第７手順と、
前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいか否かを判定する第８手順と、
前記変数ｎ及び前記変数ｍをインクリメントする第９手順と、
｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいか判定する第１０手順と、
前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致しないと判定する第１１手順と、
前記一方の楽曲コンテンツと前記他方の楽曲コンテンツとが一致すると判定する第１２手順と、を含み、
前記第２手順を、前記第１手順の後、及び、前記第７手順において、前記変数ｎが前記変数Ｎ以下であると判定した場合に実行させ、
前記第３手順を、前記第２手順の後、及び、前記第５手順において、前記変数ｍが前記Ｍ以下であると判定した場合に実行させ、
前記第４手順を、前記第３手順において、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合に実行させ、
前記第５手順を、前記第４手順の後に実行させ、
前記第６手順を、前記第５手順において、前記変数ｍが前記Ｍよりも大きいと判定した場合に実行させ、
前記第７手順を、前記第６手順の後に実行させ、
前記第８手順を、前記第３手順において、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合、及び、前記第１０手順において、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σよりも小さいと判定した場合に実行させ、
前記第９手順を、前記第８手順において、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方よりも小さいと判定した場合に実行させ、
前記第１０手順を、前記第９手順の後に実行させ、
前記第１１手順を、前記第７手順において、前記変数ｎが前記Ｎよりも大きいと判定した場合、及び、前記第１０手順において、｜｜Ｔ（ｎ＋１）−Ｔｎ｜−｜Ｓ（ｍ＋１）−Ｓｍ｜｜が前記σ以上であると判定した場合に実行させ、
前記第１２手順を、前記第８手順において、前記変数ｎ又は前記変数ｍが、前記Ｎ又は前記Ｍのいずれか小さい方以上であると判定した場合に実行させることを特徴とする楽曲記録プログラム。