JP2019139326A

JP2019139326A - コンテンツ判定装置、コンテンツ判定方法、及びプログラム

Info

Publication number: JP2019139326A
Application number: JP2018019567A
Authority: JP
Inventors: 川西　隆仁; Takahito Kawanishi; 隆仁川西; 永野　秀尚; Hidenao Nagano; 秀尚永野; 柏野　邦夫; Kunio Kashino; 邦夫柏野; 康智大石; Yasutomo Oishi; 薫平松; Kaoru Hiramatsu
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2018-02-06
Filing date: 2018-02-06
Publication date: 2019-08-22
Anticipated expiration: 2038-02-06
Also published as: US11212572B2; WO2019156043A1; US20210219008A1; JP6707305B2

Abstract

【課題】クエリコンテンツの識別子を正確に判定する。【解決手段】コンテンツ判定装置１００は、クエリコンテンツを入力する入力部２と、複数のマスタコンテンツを記憶する記憶部１と、複数のマスタコンテンツのうちの２つのマスタコンテンツの特徴値が互いに合致しない領域を判定し、２つのマスタコンテンツそれぞれの、領域の特徴値におけるクエリコンテンツの対応する領域における特徴値と合致する数である合致特徴数を算出し、マスタコンテンツそれぞれの合致特徴数に基づいてクエリコンテンツの識別子を判定するコンテンツ判定部４と、を備えることを特徴とする。【選択図】図１

Description

本発明は、コンテンツ判定装置、コンテンツ判定方法、及びプログラムに関する。

従来、データベースに記憶されている音響又は映像を示す信号から目的信号に最も近い信号を探索することが知られている。例えば、非特許文献１には、指定された音や映像の断片からなる目的信号と、データベースに蓄えられた音や映像の蓄積信号を時系列で数値化し、数値化された目的信号と蓄積信号の類似の度合である類似値を算出することによって、目的信号に最も類似した蓄積信号を探索することが記載されている。

川西隆仁、外５名、"音楽や映像を特定するメディア指紋技術とその応用"、日本応用数理学会、応用数理 Vol.21(2011)、ｐ．２８９−２９２

近年、テレビジョン放送等によって、様々な異なるコンテンツが提供されている。そこで、テレビジョン放送等によって提供されたコンテンツ（以下、「クエリコンテンツ」という）がテレビジョン放送によって提供された実績を分析するため、該コンテンツがあらかじめ記憶されている複数の既知のコンテンツ（以下、「マスタコンテンツ」という）のいずれであるかを正確に判定することが求められている。特に、所定のフレーム区間において音響又はフレーム内の一部の映像が異なる、バージョン違いのコマーシャルのコンテンツが提供されることがある。この場合、テレビジョン放送等によって提供されたコンテンツのバージョンが、複数の既知のコンテンツのバージョンのいずれであるかを正確に判定することが求められている。

しかし、複数のマスタコンテンツ、及びクエリコンテンツの１つ以上にノイズが含まれることがある。また、マスタコンテンツにおける他のマスタコンテンツと異なる部分がコンテンツ全体に対して微少であることがある。この場合、マスタコンテンツのクエリコンテンツに対する類似値がノイズに影響を受けた値となり、クエリコンテンツがいずれのマスタコンテンツであるかを類似値に基づいて正確に判定することができない場合がある。

かかる事情に鑑みてなされた本発明の目的は、クエリコンテンツの識別子を正確に判定することができるコンテンツ判定装置、コンテンツ判定方法、及びプログラムを提供することにある。

上記の課題を解決するため、本発明に係るコンテンツ判定装置は、クエリコンテンツを入力する入力部と、複数のマスタコンテンツを記憶する記憶部と、前記複数のマスタコンテンツのうちの２つのマスタコンテンツの特徴値が互いに合致しない領域を判定し、前記２つのマスタコンテンツそれぞれの、前記領域の特徴値における前記クエリコンテンツの対応する領域における特徴値と合致する数である合致特徴数を算出し、前記マスタコンテンツそれぞれの前記合致特徴数に基づいて前記クエリコンテンツの識別子を判定するコンテンツ判定部と、を備えることを特徴とする。

また、本発明に係るコンテンツ判定方法は、コンテンツ判定装置が実行するコンテンツ判定方法であって、クエリコンテンツを入力するステップと、複数のマスタコンテンツを記憶するステップと、前記複数のマスタコンテンツのうちの２つのマスタコンテンツにおける前記特徴値が互いに合致しない領域を判定し、前記２つのマスタコンテンツそれぞれの、前記領域の特徴値の、前記クエリコンテンツの対応する領域に合致する特徴値の数であるである合致特徴数を算出し、前記マスタコンテンツそれぞれの前記合致特徴数に基づいて前記クエリコンテンツの識別子を判定するステップと、を含むことを特徴とする。

また、本発明に係るプログラムは、上記のコンテンツ判定装置としてコンピュータを機能させることを特徴とする。

本発明によれば、クエリコンテンツの識別子を正確に判定することができる。

本発明の第１の実施形態に係るコンテンツ判定装置の構成例を示すブロック図である。複数のマスタコンテンツそれぞれに含まれる固有部分の一例を示す図である。記憶部に記憶されているＮ種類のマスタコンテンツを示す概念図である。ノイズを含むクエリコンテンツ及びマスタコンテンツを示す概念図である。３つの区間から構成されるクエリコンテンツ及びマスタコンテンツを示す概念図である。本発明の第１の実施形態に係るコンテンツ判定方法の一例を示すフローチャートである。マスタコンテンツの順位を決定する処理の詳細を示すフローチャートである。本発明の第２の実施形態に係るコンテンツ判定装置の構成例を示すブロック図である。本発明の第２の実施形態に係るコンテンツ判定方法の一例を示すフローチャートである。本発明の第３の実施形態に係るコンテンツ判定装置の構成例を示すブロック図である。コンテンツにおける音量の時系列データを示す図である。候補区間及びカット点について説明するための図である。判定部による境界系列の判定の一例を説明するための図である。判定部によるコマーシャル境界の判定の一例を説明するための図である。カット点が抽出されなかった候補区間について説明するための図である。カット点が抽出されなかった候補区間におけるコマーシャル境界の判定の例を説明するための図である。本発明の第３の実施形態に係るコマーシャル境界判定方法においてコンテンツ取得部が実行する方法の一例を示すフローチャートである。

以下、本発明の第１の実施形態について、図面を参照して説明する。

図１は、本実施形態に係るコンテンツ判定装置１００の構成例を示す図である。図１に示すように、コンテンツ判定装置１００は、記憶部１と、入力部２と、マスタ順位決定部３と、コンテンツ判定部４と、出力部５とを備える。

記憶部１は、複数のマスタコンテンツを記憶する。以降において、記憶部１には、Ｎ種類（Ｎは２以上の整数）のマスタコンテンツが記憶されているとする。マスタコンテンツは映像及び音響から構成されるデータであり、例えば宣伝及び広告を目的とするコマーシャルコンテンツである。また、記憶部１は、マスタコンテンツを一意に識別するための識別子に関連付けてマスタコンテンツを記憶する。例えば、複数のマスタコンテンツは、所定以上の割合において同一の画像及び音声によって構成され、一部のみにおいて異なる映像及び音声から構成されるバージョン違いのコンテンツであってもよい。これに限られず、複数のマスタコンテンツは、互いに全く異なる映像及び音声から構成されるコンテンツであってもよい。

記憶部１に記憶されるＮ種類のマスタコンテンツは、例えば、図２に示すように、所定のフレーム区間においてフレーム内の、少なくとも一部の映像が互いに異なる。この異なる部分を、以下、「固有部分」という。固有部分は、コンテンツの製作者によって、コンテンツを構成する映像に含められる。なお、固有部分は、図２に示す例に限られるものではなく、所定のフレーム区間における音響であってもよい。

図３に示すように、各マスタコンテンツは複数の区間によって構成される。（ｔ−１）秒からｔ秒までに再生される区間を第ｔ区間とする（ｔは自然数）。各マスタコンテンツには、所定区間（図３の例では第１５区間）のみにおいてそれぞれ異なる固有部分が含まれる。この場合、所定区間以外の、各区間における類似値（以下、「区間類似値」という）は、所定区間における類似値より高い。区間類似値は、各コンテンツの各区間が該区間に対応するクエリコンテンツの区間と類似している度合いを示す指標である。区間類似値は、例えば、音響信号又は映像信号の周波数軸と時間軸とからなるスペクトログラムから抽出した特徴を用いる分割一致探索法（ＤＡＬ（Divide And Locate Method）法）によって算出される。区間類似値は、ＢＡＭ（Binary Area Matching）法又はＣＡＭ（Coarsely-quantized Area Matching）法によって、それぞれ音響信号及び映像信号の周波数軸と時間軸とからなるスペクトログラムから抽出した特徴を用いて算出されてもよい。区間類似値は、これに限られず、映像又は音響から構成されるコンテンツの類似の度合を算出する任意の方法によって算出されてもよい。図３に示す例では、各マスタコンテンツの第１５区間に固有部分が含まれる。この場合、第１区間から第１４区間までの各区間類似値は、第１５区間における区間類似値より高い。

図１に戻って、入力部２はクエリコンテンツを入力する。

マスタ順位決定部３は、複数のマスタコンテンツそれぞれの、クエリコンテンツに対する類似値に基づいて各マスタコンテンツの順位を決定する。一例として、マスタ順位決定部３は、記憶部１に記憶されているＮ種類のマスタコンテンツそれぞれの全体類似値を類似値として算出する。そして、マスタ順位決定部３は、全体類似値に基づいて各マスタコンテンツの順位を決定する。全体類似値は、マスタコンテンツのクエリコンテンツに対する全体的な類似の度合を示す値であり、該マスタコンテンツにおける各区間で算出された区間類似値の最小値である。

具体的には、マスタ順位決定部３は、Ｎ種類のマスタコンテンツそれぞれの区間類似値を算出する。例えば、図３に示したように、各マスタコンテンツが第１区間から第１５区間までで構成される場合、マスタ順位決定部３は、各マスタコンテンツの第１区間から第１５区間それぞれと、クエリコンテンツの第１区間から第１５区間それぞれとの区間類似値を算出する。そして、マスタ順位決定部３は、各マスタコンテンツにおける区間類似値の最小値を全体類似値として算出する。さらに、マスタ順位決定部３は、Ｎ種類のマスタコンテンツのうち全体類似値が小さいほど順位が高く（順位を示す数字が小さく）なるようにマスタコンテンツの順位を決定する。

上述したように、記憶部１に記憶されているＮ種類のマスタコンテンツの所定区間のみに固有部分が含まれる。したがって、クエリコンテンツと異なるマスタコンテンツにおける所定区間の区間類似値は、クエリコンテンツに対応するマスタコンテンツにおける所定区間の区間類似値より低くなる。また、クエリコンテンツと異なるマスタコンテンツにおける所定区間の区間類似値は、所定区間以外の区間類似値より低くなる。このため、マスタ順位決定部３によって算出された、各マスタコンテンツの区間類似値のうち最も低い区間類似値が該マスタコンテンツの特徴を良く示すと考えられる。したがって、従来の技術においては、マスタ順位決定部３は、各マスタコンテンツの最も低い区間類似値を全体類似値として算出し、該全体類似値が最も大きいマスタコンテンツがクエリコンテンツに対応すると判定していた。

しかし、実際には、図４に示すように、各コンテンツそれぞれには、いくつかの区間のいくつかの領域にノイズが含まれることがある。領域は、ＢＡＭ法及びＣＡＭ法では、領域は、音声信号及び画像信号の急激な変化を特徴化した特徴値に対応する領域である。特徴値は、例えば、周波数軸と時間軸とからなるスペクトログラムから抽出した特徴を示す符号、数値等である。さらに、クエリコンテンツにもいくつかの区間のいくつかの領域にノイズが含まれることがある。このノイズは、例えば、テレビ放送によってコンテンツが提供される前にテレビ局によってエンコードされるときに発生する。また、複数のテレビ局それぞれでエンコードの方法が異なる。そのため、同一のコンテンツがテレビ放送によって提供されても、それぞれのコンテンツに含まれるノイズは異なることがある。また、同一のテレビ局から提供された異なるコンテンツの同じ区間の同じ領域に同じノイズが含まれることもある。

このため、マスタ順位決定部３による区間類似値の算出にあたって、クエリコンテンツに対応するマスタコンテンツの、固有部分を含まない区間の区間類似値が、ノイズに起因して低く算出されることがある。また、固有部分のコンテンツ全体に対する割合は微小（例えば５％以下）であることが多い。このため、クエリコンテンツとは異なるマスタコンテンツにおける固有部分に起因して算出される区間類似値より、クエリコンテンツに対応するマスタコンテンツにおけるノイズに起因して算出される区間類似値の方が低くなることがある。その結果、クエリコンテンツとは異なるマスタコンテンツの全体類似値が最も大きくなり、クエリコンテンツに対応するマスタコンテンツが正確に判定されないことがある。

このような誤った判定を防ぐために、コンテンツ判定部４は以降で詳細に説明するようにクエリコンテンツの識別子を判定する。コンテンツ判定部４は、非合致判定部４１と、合致特徴数算出部４２と、判定部４３とを備える。

非合致判定部４１は、Ｎ種類のマスタコンテンツのうち、２つのマスタコンテンツの対応する区間の対応する領域における特徴値が合致するか否かを判定する。

具体的には、非合致判定部４１は、マスタ順位決定部３によって決定された順位に基づく順番でマスタコンテンツの特徴値のうち、クエリコンテンツの特徴値と合致する数である合致特徴数を判定する。例えば、非合致判定部４１は、まず、最も順位の高いマスタコンテンツと次に順位の高いマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定する。その後、判定部４３によって後述するように候補マスタコンテンツが判定されると、非合致判定部４１は、候補マスタコンテンツと、まだ特徴値が合致しない領域の判定の対象となっていないマスタコンテンツのうち最も順位の高いマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定する。非合致判定部４１は、Ｎ種類のマスタコンテンツの全てについて、特徴値が合致しない領域の判定の対象となるまでこれを繰り返す。

図５に示す例では、説明を簡易にするために、各マスタコンテンツ及びクエリコンテンツはそれぞれ第１〜第３区間で構成され、各区間の映像には第１〜第５領域が含まれる。また、ノイズはそれぞれ異なるノイズである。また、クエリコンテンツが含む固有部分は、第２位のマスタコンテンツの固有部分と同じであり、第３区間の第３及び第４領域に含まれる。なお、上述のように、Ｎ種類のマスタコンテンツがそれぞれ含む固有部分は異なる。この場合、非合致判定部４１は、まず、第１位のマスタコンテンツと第２位のマスタコンテンツの第１区間における第１領域の特徴値が互いに合致すると判定する。また、非合致判定部４１は、第１位のマスタコンテンツと第２位のマスタコンテンツとの第１区間における第２領域の特徴値が合致しない（図５の（１）参照）と判定する。同様にして、非合致判定部４１は、第１区間の第５領域（図５の（２）参照）、第２区間の第３領域（図５の（３）参照）及び第５領域（図５の（４）参照）、並びに第３区間の第３〜５領域（図５の（５）及び（６）参照）の特徴値が合致しないと判定する。

合致特徴数算出部４２は、非合致判定部４１によって判定された２つのマスタコンテンツそれぞれの合致特徴数を算出する。合致特徴数は、非合致判定部４１によって判定された互いに合致しない特徴値のうち、該特徴値に対応するクエリコンテンツの特徴値と合致する特徴値の数である。

合致特徴数算出部４２は、まず、上述のように最も順位の高い（第１位の）マスタコンテンツ、及び次に順位の高い（第２位の）マスタコンテンツにおいて互いに合致しなかった特徴値に基づいて、最も順位の高いマスタコンテンツ、及び次に順位の高いマスタコンテンツの合致特徴数をそれぞれ算出する。図５に示す例では、合致特徴数算出部４２は、第１位のマスタコンテンツと第２位のマスタコンテンツとの特徴値が互いに合致しない領域である第１区間の第２及び第５領域、第２区間の第３及び第５領域、並びに第３区間の第３〜５領域のそれぞれにおいて、第１位のマスタコンテンツ及び第２位のマスタコンテンツの特徴値それぞれがクエリコンテンツの対応する領域の特徴値に合致するか否かを判定する。この場合、合致特徴数算出部４２は、第１位のマスタコンテンツが、第２区間の第３領域、及び第３区間の第５領域の特徴値がクエリコンテンツの特徴値に合致すると判定する。これにより、合致特徴数算出部４２は、第１位のマスタコンテンツの合致特徴数を「２」と算出する。同様にして、合致特徴数算出部４２は、第２位のマスタコンテンツが、第２区間の第５領域、並びに第３区間の第３及び第４領域でクエリコンテンツに合致すると判定する。これにより、合致特徴数算出部４２は、第２位のマスタコンテンツ合致特徴数を「３」と算出する。

判定部４３は、合致特徴数算出部４２によって算出された合致特徴数に基づいて、クエリコンテンツの識別子を判定する。具体的には、判定部４３は、最も順位の高いマスタコンテンツと、次に順位の高いマスタコンテンツとそれぞれの合致特徴数の大きい方のマスタコンテンツを候補マスタコンテンツと判定する。そして、判定部４３は、候補マスタコンテンツと、特徴値が互いに合致しない領域が判定されていないマスタコンテンツのうち最も順位の高いマスタコンテンツと対応する区間の対応する領域において特徴値が合致しない領域を判定し、該領域に基づいて合致特徴数の大きい方のマスタコンテンツを新たな候補マスタコンテンツと判定することを繰り返す。そして、判定部４３は、最後に判定された候補マスタコンテンツの識別子がクエリコンテンツの識別子であると判定する。

図５に示す例では、第１位のマスタコンテンツの合致特徴数が「２」と算出され、第２位のマスタコンテンツ合致特徴数が「３」と算出されたため、判定部４３は、第２位のマスタコンテンツを第１候補マスタコンテンツと判定する。

次に、非合致判定部４１は、第１候補マスタコンテンツと第３位のマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定する。そして、合致特徴数算出部４２は、第１候補マスタコンテンツにおける該領域の特徴値が、対応するクエリコンテンツの特徴値に合致するか否かに基づいて、第１候補マスタコンテンツの合致特徴数を算出する。また、合致特徴数算出部４２は、第３位のマスタコンテンツの該領域の特徴値が、対応するクエリコンテンツの特徴値に合致するか否かに基づいて、第１候補マスタコンテンツの合致特徴数を算出する。そして、判定部４３は、第１候補マスタコンテンツ及び第３位のマスタコンテンツのうち合致特徴数が大きい方のコンテンツを新たな候補マスタコンテンツである第２候補マスタコンテンツと判定する。さらに非合致判定部４１、合致特徴数算出部４２、及び判定部４３は上述の処理を繰り返し、全てのマスタコンテンツを対象とする処理を終えた時点での候補マスタコンテンツの識別子がクエリコンテンツの識別子であると判定する。

すなわち、コンテンツ判定部４は、第１位のマスタコンテンツと第２位のマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定する。そして、コンテンツ判定部４は第１位のマスタコンテンツ及び第２位のマスタコンテンツそれぞれの該領域に基づいて合致特徴数を算出する。そして、コンテンツ判定部４は、該合致特徴数の大きい方のマスタコンテンツが第１候補マスタコンテンツであると判定する。次に、コンテンツ判定部４は、ｋ＝１〜（Ｎ−２）まで順に、第ｋ候補マスタコンテンツと第（ｋ＋２）位のマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定する。そして、コンテンツ判定部４は、第ｋ候補マスタコンテンツ及び第（ｋ＋２）位のマスタコンテンツそれぞれの合致特徴数を算出する。そして、コンテンツ判定部４は、合致特徴数が大きい方のコンテンツを新たな候補マスタコンテンツである第（ｋ＋１）候補マスタコンテンツと判定する。コンテンツ判定部４は、ｋ＝Ｎ−２のときに判定された第（ｋ＋１）候補マスタコンテンツ、すなわち第（Ｎ−１）候補マスタコンテンツの識別子がクエリコンテンツの識別子であると判定する。

さらに言い換えれば、コンテンツ判定部４は、最も順位の高いマスタコンテンツと、次に順位の高いマスタコンテンツと対応する区間の対応する領域において特徴値が合致しない領域を判定し、該領域に基づいて合致特徴数の大きい方のマスタコンテンツを候補マスタコンテンツと判定する。さらに、コンテンツ判定部４は、候補マスタコンテンツと、特徴値が互いに合致しない領域が判定されていないマスタコンテンツのうち最も順位の高いマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定し、該領域の特徴量に基づいて合致特徴数の高いマスタコンテンツを新たな候補マスタコンテンツと判定する。コンテンツ判定部４は、これを繰り返し、最後に判定された候補マスタコンテンツの識別子がクエリコンテンツの識別子であると判定する。

出力部５は、コンテンツ判定部４によって判定されたクエリコンテンツの識別子を他の装置に通信ネットワークを介して出力する。

次に、第１の実施形態のコンテンツ判定装置１００によるコンテンツ判定方法について、図６を参照して説明する。図６は、コンテンツ判定方法の一例を示すフローチャートである。

まず、入力部２により、テレビジョン放送等によって提供されたクエリコンテンツを入力する（ステップＳ１１）。

次に、マスタ順位決定部３により、クエリコンテンツに対する全体類似値が小さいほど順位が高くなるように、Ｎ種類のマスタコンテンツの順位を決定する（ステップＳ１２）。

ここで、マスタ順位決定部３による順位の決定の詳細について図７を参照して説明する。

まず、マスタ順位決定部３により、マスタコンテンツの各区間における、クエリコンテンツの対応する各区間との区間類似値を算出する（ステップＳ１２１）。

次に、マスタ順位決定部３により、全ての区間について区間類似値が算出されたか否かを判定する（ステップＳ１２２）。

ステップＳ１２２で全ての区間について区間類似値が算出されていないと判定されると、マスタ順位決定部３により、ステップＳ１２１に戻って、残りの区間の区間類似値を算出する。ステップＳ１２２で全ての区間について区間類似値が算出されたと判定されると、マスタ順位決定部３により、マスタコンテンツの区間類似値の最小値を全体類似値として算出する（ステップＳ１２３）。

次に、マスタ順位決定部３により、全てのマスタコンテンツの全体類似値が算出されたか否かを判定する（ステップＳ１２４）。

ステップＳ１２４で全てのマスタコンテンツの全体類似値が算出されていないと判定されると、ステップＳ１２１に戻って残りのマスタコンテンツの全体類似値を算出する。ステップＳ１２４で全てのマスタコンテンツの全体類似値が算出されたと判定されると、マスタ順位決定部３により、Ｎ種類のマスタコンテンツのうち全体類似値が小さいほど順位が高くなるようにマスタコンテンツの順位を決定する（ステップＳ１２５）。

再び図６を参照して、非合致判定部４１により、第１位のマスタコンテンツと第２位のマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定する（ステップＳ１３）。

次に、合致特徴数算出部４２により、ステップＳ１３で判定された領域の特徴値に基づいて、第１位のマスタコンテンツの合致特徴数を算出する（ステップＳ１４）。

次に、合致特徴数算出部４２により、ステップＳ１３で判定された領域の特徴値に基づいて、第２位のマスタコンテンツの合致特徴数を算出する（ステップＳ１５）。なお、合致特徴数算出部４２によりステップＳ１５の処理を行ってからステップＳ１４の処理を行ってもよい。

次に、ステップＳ１４及びステップＳ１５で算出された合致特徴数の大きい方のマスタコンテンツを第１候補マスタコンテンツと判定する（ステップＳ１６）。

次に、非合致判定部４１により、ｋ＝１とする（ステップＳ１７）。

次に、非合致判定部４１により、第ｋ候補マスタコンテンツと第（ｋ＋２）位のマスタコンテンツとにおける対応する区間の対応する領域において特徴値が合致しない領域を判定する（ステップＳ１８）。

次に、合致特徴数算出部４２により、ステップＳ１８で判定された領域の特徴値に基づいて、第ｋ候補マスタコンテンツの合致特徴数を算出する（ステップＳ１９）。

次に、合致特徴数算出部４２により、ステップＳ１８で判定された領域の特徴値に基づいて、第（ｋ＋２）位のマスタコンテンツの合致特徴数を算出する（ステップＳ２０）。なお、合致特徴数算出部４２によりステップＳ２０の処理を行ってからステップＳ１９の処理を行ってもよい。

次に、判定部４３により、ステップＳ１９及びステップＳ２０で算出された合致特徴数のうち大きい方のマスタコンテンツを第（ｋ＋１）候補マスタコンテンツと判定する（ステップＳ２１）。

次に、判定部４３により、ｋ＝（Ｎ−２）であるか否かを判定する（ステップＳ２２）。

ステップＳ２２でｋ＝（Ｎ−２）でないと判定されると、判定部４３により、ｋ＝ｋ＋１とし（ステップＳ２３）、ステップＳ１８に戻って、非合致判定部４１及び合致特徴数算出部４２によりステップＳ２１までの処理を繰り返す。

ステップＳ２２でｋ＝（Ｎ−２）であると判定されると、判定部４３により、第（ｋ＋１）候補マスタコンテンツであるマスタコンテンツの識別子がクエリコンテンツの識別子であると判定する（ステップＳ２４）。

次に、出力部５により、ステップＳ２４で判定されたクエリコンテンツの識別子を他の装置に出力する（ステップＳ２５）。

なお、上述したコンテンツ判定装置１００として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、コンテンツ判定装置１００の各機能を実現する処理内容を記述したプログラムを該コンピュータのデータベースに格納しておき、該コンピュータのＣＰＵによってこのプログラムを読み出して実行させることで実現することができる。

また、プログラムは、コンピュータ読取り可能媒体に記録されていてもよい。コンピュータ読取り可能媒体を用いれば、コンピュータにインストールすることが可能である。ここで、プログラムが記録されたコンピュータ読取り可能媒体は、非一過性の記録媒体であってもよい。非一過性の記録媒体は、特に限定されるものではないが、例えば、ＣＤ−ＲＯＭやＤＶＤ−ＲＯＭなどの記録媒体であってもよい。

以上説明したように、第１の実施形態によれば、コンテンツ判定装置１００は、複数のマスタコンテンツのうちの２つのマスタコンテンツの対応する区間の対応する領域において特徴値が合致しない領域を判定し、２つのマスタコンテンツそれぞれの合致特徴数を算出し、該合致特徴数に基づいてクエリコンテンツの識別子を判定する。したがって、コンテンツ判定装置１００は、複数のマスタコンテンツ及びクエリコンテンツのいずれか１つ以上にノイズが含まれている場合も正確にクエリコンテンツの識別子を判定することができる。

仮に３つ以上のマスタコンテンツのいずれかが合致しない特徴値に基づいて、合致特徴数が判定される場合、２つのマスタコンテンツにおける判定に比べて、多数の領域において特徴値が合致しないと判定されることになる。この場合、これらの多数の領域の特徴値それぞれに基づいて合致特徴数が算出されると、該合致特徴数の、固有部分における特徴値に起因する割合が低くなる。これに伴い、該合致特徴数の、固有部分以外の特徴値に含まれるノイズに起因する割合が相対的に高くなり、クエリコンテンツの識別子を正確に判定することができないという不都合が発生しうる。しかし、第１の実施形態のコンテンツ判定装置１００においては、２つのマスタコンテンツの対応する区間の対応する領域において特徴値が合致しない領域を判定するため、合致特徴数は、固有部分における特徴値に起因する割合が高くなりマスタコンテンツを正確に判定することができる。

また、仮に３つ以上のマスタコンテンツ全てで合致しない特徴値に基づいて、合致特徴数が判定される場合、Ｎ種類のマスタコンテンツにおいて少なくとも２つのマスタコンテンツに固有部分が含まれている領域が２つ以上あると、固有部分が含まれる領域において特徴値が合致すると判定されることがある。したがって、マスタコンテンツを特徴付ける固有部分において合致特徴数の算出がされず、クエリコンテンツの識別子を正確に判定することができないという不都合が発生しうる。しかし、第１の実施形態のコンテンツ判定装置１００においては、２つのマスタコンテンツを用いて判定するため、特徴値が合致しない領域が適切に判定されないことによってマスタコンテンツが正確に判定されないという問題を回避することができる。

なお、発明者らによる検証実験において、コンテンツ判定装置１００は、記憶部１が５７１９種類のマスタコンテンツを記憶している場合において、総計４８０時間の再生時間を有するコンテンツの識別子を判定した。その結果、再現率は９８．６％であり、適合率は９８．７％であった。これに対して、従来のように、区間類似値の最小値である全体類似値の最も大きいマスタコンテンツの識別子がクエリコンテンツの識別子であると判定した場合、再現率は９８．１％であり、適合率は９８．３％であった。すなわち、第１の実施形態のコンテンツ判定装置１００は従来に比べて正確にクエリコンテンツの識別子を判定することが検証された。

また、第１の実施形態によれば、コンテンツ判定装置１００は、複数のマスタコンテンツそれぞれの全体類似値に基づいて各マスタコンテンツの順位を決定し、該順位に従って候補コンテンツを判定する。これにより、全体類似値の大きいマスタコンテンツであるほど該判定の対象となる回数が少なく、最終的に候補マスタコンテンツとされる可能性が高くなる。したがって、コンテンツ判定装置１００は、合致特徴数のみではなく全体類似値によって決定された順位にも基づいて識別子を判定することとなる。これにより、コンテンツ判定装置１００は、さらに正確に識別子を判定することができる。

また、第１の実施形態によれば、コンテンツ判定装置１００は、候補マスタコンテンツと、特徴値が合致しない領域が判定されていないマスタコンテンツのうち最も順位の高いマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定し、それぞれの合致特徴数を算出し、該合致特徴数の大きい方のマスタコンテンツを新たな候補マスタコンテンツと判定することを繰り返す。このため、コンテンツ判定装置１００は、全ての組合せの２つのマスタコンテンツの対応する区間の対応する領域において特徴値が合致しない領域を判定する必要がない。すなわち、コンテンツ判定装置１００は、全ての組合せの数である_ＮＣ_２通りの２つのマスタコンテンツに対して判定を行う必要はなく、（Ｎ−１）通りの２つのマスタコンテンツに対して判定を行えばよい。また、コンテンツ判定装置１００は、_ＮＣ_２通りの組合せで２つのマスタコンテンツの合致特徴数を算出する必要はなく、（Ｎ−１）通りの組合せで２つのマスタコンテンツの合致特徴数を算出すればよい。したがって、コンテンツ判定装置１００は少ない処理負荷でクエリコンテンツの識別子を判定することができる。

また、第１の実施形態において、コンテンツ判定部４は、マスタ順位決定部３によって決定された順位に基づく順番で２つのマスタコンテンツの対応する区間の対応する領域において特徴値が合致しない領域を判定し、該２つのマスタコンテンツそれぞれの合致特徴数を算出したが、この限りではない。例えば、コンテンツ判定部４は、任意の順番で２つのマスタコンテンツの対応する区間の対応する領域において特徴値が合致しない領域を判定し、該２つのマスタコンテンツそれぞれの合致特徴数を算出してもよい。

また、第１の実施形態において、コンテンツ判定部４は、Ｎ種類のマスタコンテンツの全てについて他のマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定し、該２つのマスタコンテンツそれぞれの合致特徴数を算出したが、この限りではない。例えば、コンテンツ判定部４は、マスタ順位決定部３によって決定された最も全体類似値が大きい２つのマスタコンテンツ、すなわち第Ｎ位のマスタコンテンツと第（Ｎ−１）位のマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定し、該領域に基づいて算出した合致特徴数の大きい方のマスタコンテンツの識別子がクエリコンテンツの識別子であると判定してもよい。

（第２の実施形態）
次に、本発明の第２の実施形態について、図面を参照して説明する。

図８は、第２の実施形態に係るコンテンツ判定装置２００の構成例を示す図である。図８に示すように、コンテンツ判定装置２００は、記憶部１と、入力部２と、コンテンツ判定部４と、出力部５とを備える。コンテンツ判定装置２００は、マスタ順位決定部３を備えず、この点で第１の実施形態のコンテンツ判定装置１００と異なる。なお、第１の実施形態と同様の構成ブロックについては同一の参照符号を付して、適宜、説明を省略する。

第２の実施形態において、非合致判定部４１は、Ｎ種類のマスタコンテンツから抽出した２つのマスタコンテンツの組合せ全てについて、一方のマスタコンテンツと他方のマスタコンテンツとの対応する区間の対応する領域において特徴値が合致しない領域を判定する。合致特徴数算出部４２は、２つのマスタコンテンツの組合せ全てそれぞれについて、２つのマスタコンテンツの合致特徴数を算出する。

したがって、非合致判定部４１及び合致特徴数算出部４２は、_ＮＣ_２通りの判定を行うことになる。例えば、記憶部１に４種類のマスタコンテンツが記憶されている場合、非合致判定部４１は、マスタコンテンツ１とマスタコンテンツ２とにおいて特徴値が互いに合致しない領域Ａ_１２を判定する。そして、合致特徴数算出部４２は、マスタコンテンツ１の領域Ａ_１２の特徴値とクエリコンテンツの領域Ａ_１２に対応する領域の特徴値とに基づいて、マスタコンテンツ１の合致特徴数を算出する。さらに、合致特徴数算出部４２は、マスタコンテンツ２の領域Ａ_１２の特徴値とクエリコンテンツのＡ_１２に対応する領域の特徴値とに基づいて、マスタコンテンツ２の合致特徴数を算出する。

同様にして、非合致判定部４１及び合致特徴数算出部４２は、マスタコンテンツ１とマスタコンテンツ３との組合せについて特徴値が互いに合致しない領域Ａ_１３を判定し、領域Ａ_１３に基づいてマスタコンテンツ１及びマスタコンテンツ３それぞれの合致特徴数を算出する。さらに、非合致判定部４１及び合致特徴数算出部４２は、マスタコンテンツ１とマスタコンテンツ４との組合せ、マスタコンテンツ２とマスタコンテンツ３との組合せ、マスタコンテンツ２とマスタコンテンツ４との組合せ、マスタコンテンツ３とマスタコンテンツ４との組合せに対してそれぞれ同様の処理を行う。

判定部４３は、合致特徴数算出部４２によって算出された合致特徴数が最大であるマスタコンテンツの識別子が、クエリコンテンツの識別子であると判定する。

次に、第２の実施形態のコンテンツ判定装置２００によるコンテンツ判定方法について、図９を参照して説明する。図９は、コンテンツ判定方法の一例を示すフローチャートである。

まず、入力部２により、テレビジョン放送等によって提供されたクエリコンテンツを入力する（ステップＳ３１）。

次に、非合致判定部４１により、２つのマスタコンテンツにおける特徴値が互いに合致しない領域を判定する（ステップＳ３２）。

次に、合致特徴数算出部４２により、一方のマスタコンテンツの合致特徴数を算出する（ステップＳ３３）。

次に、合致特徴数算出部４２により、他方のマスタコンテンツの合致特徴数を算出する（ステップＳ３４）。

次に、合致特徴数算出部４２により、全てのマスタコンテンツの組合せについて合致特徴数が算出されたか否かを判定する（ステップＳ３５）。

ステップＳ３５で全てのマスタコンテンツの組合せについて合致特徴数が算出されていないと判定されると、ステップＳ３２に戻って、非合致判定部４１及び合致特徴数算出部４２によりステップＳ３４までの処理を繰り返す。

ステップＳ３５で全てのマスタコンテンツの組合せについて合致特徴数が算出されたと判定されると、判定部４３により合致特徴数が最大のマスタコンテンツの識別子がクエリコンテンツの識別子であると判定する（ステップＳ３６）。

次に、出力部５により、ステップＳ３６で判定された識別子を他の装置に出力する（ステップＳ３７）。出力部５により、ステップＳ３６で判定されたマスタコンテンツを他の装置に出力してもよい。

なお、上述したコンテンツ判定装置２００として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、コンテンツ判定装置２００の各機能を実現する処理内容を記述したプログラムを該コンピュータのデータベースに格納しておき、該コンピュータのＣＰＵによってこのプログラムを読み出して実行させることで実現することができる。

以上説明したように、第２の実施形態によれば、コンテンツ判定装置２００は、Ｎ種類のマスタコンテンツのうちの２つのマスタコンテンツにおいて特徴値が互いに合致しない領域を判定し、該２つのマスタコンテンツそれぞれの合致特徴数を算出する。そして、コンテンツ判定装置２００は、Ｎ種類のマスタコンテンツの全ての組合せにより算出したマスタコンテンツそれぞれの合致特徴数に基づいてクエリコンテンツの識別子を判定する。したがって、コンテンツ判定装置２００は、第１の実施形態のコンテンツ判定装置１００よりさらに正確にクエリコンテンツの識別子を正確に判定することができる。

（第３の実施形態）
次に、本発明の第３の実施形態について、図面を参照して説明する。

図１０は、第３の実施形態に係るコンテンツ判定装置３００の構成例を示す図である。図１０に示すように、コンテンツ判定装置３００は、記憶部１と、入力部２と、コンテンツ判定部４と、出力部５とを備える。コンテンツ判定装置２００は、さらにコンテンツ取得部６を備え、この点で第１の実施形態のコンテンツ判定装置１００と異なる。なお、第１の実施形態と同様の構成ブロックについては同一の参照符号を付して、適宜、説明を省略する。

第３の実施形態において、入力部２は、任意のコンテンツを取得する。入力部２によって入力されるコンテンツは、テレビ放送によって受信した、複数のコマーシャル及び番組を連続的に含むコンテンツであってよい。

コンテンツ取得部６は、入力部２によって入力されたコンテンツからクエリコンテンツを取得する。例えば、入力部２によって、複数のコマーシャル及び番組を連続的に含むコンテンツからコマーシャルの部分のコンテンツをクエリコンテンツとして取得する。コンテンツ取得部６は、音量算出部６１と、コマーシャル検出部６２と、候補区間決定部６３と、カット点抽出部６４と、取得部６５とを備える。

音量算出部６１は、図１１に示すように入力部１１によって入力されたコンテンツの時系列での音量を算出する。

コマーシャル検出部６２は、音量算出部６１によって算出された音量の時系列データから所定時間（例えば０．１秒）以上、音量が音量閾値未満となる時間帯（以下、「低音量区間」という）を判定する。そして、コマーシャル検出部６２は、低音量区間の間隔がコマーシャル規定長となる部分をコマーシャルとして検出する。コマーシャル規定長は、１つのコマーシャルが再生される時間であり、例えば、１５秒、３０秒、４５秒等である。

候補区間決定部６３は、コマーシャル検出部６２によって検出されたコマーシャルの両端の低音量区間を含む時間帯を候補区間と決定する。例えば、候補区間決定部６３は、低音量区間の開始時点から所定時間（例えば、０．５秒）前の時点以降で、低音量区間の終了時点から所定時間（例えば、０．５秒）後の時点までの時間帯を候補区間と決定する。なお、上述のように、コマーシャル検出部６２は、低音量区間の間隔がコマーシャル規定長となる部分をコマーシャルとして検出する。そのため、候補区間に含まれる低音量区間は、低音量区間のうち、該低音量区間の任意の時点が所定の時間間隔で離れて存在する低音量区間のみとなる。

カット点抽出部６４は、候補区間決定部６３によって決定された複数の候補区間Ｔｋ（ｋ＝１〜ｎ（ｎは２以上の整数）それぞれからＣ_ｋ（０以上の整数）個のカット点を抽出する。カット点は、候補区間の映像を構成する複数のフレームのうち、変化量が画素変化閾値以上であるフレームの再生時点である。変化量は、各フレームの画素値と、該各フレームの前フレームの画素値との差分又は比に基づく値である。例えば、変化量は、各フレームを構成する各画素の画素値と、各フレームの各画素にそれぞれ対応する、前フレームの画素の画素値との差分に基づく値であってもよい。差分に基づく値とは、例えば、各画素についての差分の絶対値の和、平均値、若しくは中央値、又は差分の二乗平均値である。また、変化量は、一のフレームと、該一のフレームの前フレームとの画素の平均値の比であってもよい。再生時点は、コンテンツが始めから再生される場合の開始を基準時点としたときの、該基準時点からの経過時間である。カット点抽出部６４は、変化量が画素変化閾値以上であるフレームの再生時点をカット点として抽出する。例えば、カット点抽出部６４は、変化量の比及び差それぞれが画素変化閾値以上であるフレームの再生時点をカット点としてもよい。なお、実験においては、各候補区間Ｔｋから６〜８個のカット点が検出されることが多い。

図１２に示した例では、カット点抽出部６４は、候補区間Ｔ１からＣ_１個（図１２では２個）のカット点を抽出し、候補区間Ｔ２からＣ_２個（図１２では３個）のカット点を抽出し、候補区間Ｔ３からＣ_３個（図１２では１個）のカット点を抽出する。同様にして、カット点抽出部６４は、候補区間Ｔｋ（ｋは自然数）からＣ_ｋ個のカット点を抽出する。

取得部６５は、カット点に基づいてコマーシャル境界を判定し、隣接するコマーシャル境界の間にあるコマーシャルをクエリコンテンツとして取得する。コマーシャル境界は、コンテンツにおける２つの連続したコマーシャルの区切りとなる時点、及び番組とコマーシャルとの区切りとなる時点である。

具体的には、取得部６５は、１個以上のカット点をそれぞれ含む複数の候補区間それぞれから１個のカット点を選択する。取得部６５は、カット点系列Ｓｊそれぞれに含まれるカット点に基づいてコマーシャル境界を判定する。カット点系列Ｓｊは、複数の候補区間それぞれから選択されたカット点の組み合わせであり、カット点系列Ｓｊの全数Ｃａｌｌは式（１）に示すとおりである。なお、候補区間Ｔｋにおいてカット点が検出されなかった場合、Ｃ_ｋ＝１とする。
Ｃａｌｌ＝Ｃ_１×Ｃ_２×・・・×Ｃ_ｋ×・・・×Ｃ_ｎ（１）

具体的には、取得部６５は、カット点系列Ｓｊそれぞれに含まれるカット点の隣接カット点時間とコマーシャル規定長とに基づいてコマーシャル境界を判定する。隣接カット点時間は、各候補区間のカット点と前の候補区間のカット点との間の時間である。

さらに具体的には、取得部６５は、各隣接カット点時間とコマーシャル規定長との差を算出する。取得部６５は、ノイズの影響を加味して、該差が時間差閾値未満である数（以下、「一致数」という）をカット点系列Ｓｊごとに算出する。時間差閾値は、例えば、コンテンツの映像の所定フレーム数が再生される時間である。所定フレーム数は、例えば、２フレームである。コンテンツの映像のフレームレートが３０ｆｐｓである場合、２フレームが再生される時間、すなわち時間差閾値は（２／３０）秒である。

一例として、図１３に示すように、候補区間決定部６３が３つの候補区間Ｔ１〜Ｔ３を決定し、カット点抽出部６４が、候補区間Ｔ１から２個のカット点Ｐ１１及びＰ１２、候補区間Ｔ２から３個のカット点Ｐ２１、Ｐ２２、及びＰ２３、並びに候補区間Ｔ３から１個のカット点Ｐ３１を抽出した場合について説明する。

図１３に示す例では、カット点系列Ｓｊの全数ＣａｌｌはＣ_１×Ｃ_２×Ｃ_３＝２×３×１＝６個である。カット点系列Ｓ１は、カット点Ｐ１１、カット点Ｐ２１、及びカット点Ｐ３１の組合せで構成される系列である。カット点系列Ｓ２は、カット点Ｐ１１、カット点Ｐ２２、及びカット点Ｐ３１の組合せで構成される系列である。カット点系列Ｓ４は、カット点Ｐ１１、カット点Ｐ２３、及びカット点Ｐ３１の組合せで構成される系列である。カット点系列Ｓ４は、カット点Ｐ１２、カット点Ｐ２１、及びカット点Ｐ３１の組合せで構成される系列である。カット点系列Ｓ５は、カット点Ｐ１２、及びカット点Ｐ２２、及びカット点Ｐ３１の組合せで構成される系列である。カット点系列Ｓ６は、カット点Ｐ１２、カット点Ｐ２３、及びカット点Ｐ３１の組合せで構成される系列である。

取得部６５は、カット点系列Ｓｊ（ｊ＝１〜６）それぞれにおける各隣接カット点時間とコマーシャル規定長との差を算出する。コマーシャル規定長を１５秒、所定範囲が（２／３０）秒であるとすると、取得部６５は、カット点系列Ｓ１〜Ｓ６の一致数をそれぞれ０，２，０，０，１，０と算出する。

取得部６５は、一致数が最大となるカット点系列Ｓｊが複数あるか否かを判定する。そして、取得部６５は、一致数が最大のカット点系列Ｓｊが１つである場合、該カット点系列Ｓｊを境界系列と判定する。図１３に示す例では、取得部６５は、カット点系列Ｓ１〜Ｓ６のうち、一致数が最大のカット点系列はカット点系列Ｓ２の１つであるため、カット点系列Ｓ２が境界系列であると判定する。

取得部６５は、一致数が最大となるカット点系列Ｓｊが複数あると判定した場合、一致数が最大の複数のカット点系列Ｓｊのうち、各隣接カット点時間とコマーシャル規定長との差の合計が最小であるカット点系列Ｓｊを境界系列と判定する。

そして、取得部６５は、境界系列に基づいてコマーシャル境界を判定する。具体的には、取得部６５は、境界系列において、隣接カット点時間がコマーシャル規定長に一致するカット点がコマーシャル境界であると判定する。

また、取得部６５は、境界系列において、隣接カット点時間がコマーシャル規定長に一致するカット点が含まれない候補区間のコマーシャル境界を、隣接する候補区間において決定されたコマーシャル境界とコマーシャル規定長とに基づいて判定する。

一例では、境界系列において、隣接カット点時間とコマーシャル規定長との差が時間差閾値以上であるカット点がある場合、取得部６５は、上述のように判定されたコマーシャル境界からの時間がコマーシャル規定長となる時点をコマーシャル境界と判定する。図１４に示す例では、図１３に示す例とは異なり、境界系列はカット点Ｐ１１、Ｐ２２、Ｐ３２、Ｐ４１、Ｐ５３で構成されるカット点系列であると判定されているとする。また、この境界系列において、取得部６５により、カット点Ｐ２２についての隣接カット点時間がコマーシャル規定長である１５秒に一致していると判定されているとする。また、取得部６５により、カット点Ｐ３２についての隣接カット点時間が１６．５秒であるため、隣接カット点時間とコマーシャル規定長との差が時間差閾値以上であると判定されているとする。この場合、取得部６５は、カット点Ｐ２２を候補区間Ｔ２におけるコマーシャル境界と判定する。そして、取得部６５は、カット点Ｐ３２ではなく、カット点Ｐ２２にコマーシャル規定長に許容時間を加算又は減算した時間を加算した時点が候補区間Ｔ３におけるコマーシャル境界であると判定する。許容時間は、候補区間ごとに異なる時間である。各候補区間の許容時間は、コマーシャル規定長に許容時間を加算又は減算した時間の合計がコマーシャル全体の再生時間となるように調整される。

他の例では、カット点抽出部６４によって候補区間Ｔｋにおいてカット点が抽出されなかった場合、取得部６５は、上述のように判定されたコマーシャル境界からの時間がコマーシャル規定長となる時点をコマーシャル境界と判定する。図１５Ａに示す例では、カット点抽出部６４によって、候補区間Ｔ３においてカット点が抽出されていない。また、取得部６５によって、境界系列はカット点Ｐ１１、Ｐ２２、Ｐ４１、Ｐ５３で構成されるカット点系列であると判定されている。この場合、取得部６５は、図１５Ｂに示すように、候補区間Ｔ３の前の候補区間Ｔ２において抽出されたコマーシャル境界からコマーシャル規定長に許容時間を加算又は減算した時間を加算した時点を候補区間Ｔ３におけるコマーシャル境界と判定する。

このようにして、コマーシャル境界が判定されると、取得部６５は、隣接するコマーシャル境界の間にあるコンテンツをクエリコンテンツとして取得する。

マスタ順位決定部３は、取得部６によって取得されたクエリコンテンツを用いて、第１の実施形態と同様に各マスタコンテンツの順位を決定する。

次に、第３の実施形態のコンテンツ判定装置３００によるコンテンツ判定方法について説明する。

第３の実施形態におけるコンテンツ判定方法では、第１の実施形態のコンテンツ判定方法におけるステップＳ１１でクエリコンテンツが入力されると、コンテンツ取得部６によって、入力部２が入力したコンテンツからクエリコンテンツを取得する。クエリコンテンツが取得されると、取得されたクエリコンテンツを用いてステップＳ１１からステップＳ２１までの処理が実行される。

ここで、コンテンツ取得部６によるクエリコンテンツ取得方法について、図１６を参照して詳細に説明する。図１６は、クエリコンテンツ取得方法の一例を示すフローチャートである。

音量算出部６１により、入力部２によって入力されたコンテンツの時系列での音量を算出する（ステップＳ４１）。

次に、コマーシャル検出部６２により、ステップＳ４１で算出された音量が音量閾値未満となる低音量区間を抽出する。そして、互いに隣接する低音量区間の間隔がコマーシャル規定長となる部分をコマーシャルとして検出する（ステップＳ４２）。

次に、候補区間決定部６３により、低音量区間の開始時点から所定時間（例えば、０．５秒）前の時点以降で、低音量区間の終了時点から所定時間（例えば、０．５秒）後の時点までの時間を候補区間と決定する（ステップＳ４３）。

次に、カット点抽出部６４により、ステップＳ４３で決定された候補区間の映像からカット点を抽出する（ステップＳ４４）。

次に、判定部６５により、ステップＳ４４で抽出された各候補区間内のカット点の組合せによって構成される全てのカット点系列Ｓ_ｊについての一致数を算出する（ステップＳ４５）。

次に、判定部６５により、一致数が最大のカット点系列Ｓ_ｊが複数あるか否かを判定する（ステップＳ４６）。

ステップＳ４６で、一致数が最大のカット点系列Ｓ_ｊが１つあると判定された場合、判定部６５により、該カット点系列Ｓ_ｊを境界系列と判定する（ステップＳ４７）。

ステップＳ４６で、一致数が最大のカット点系列Ｓ_ｊが複数あると判定された場合、判定部６５により、複数の、一致数が最大のカット点系列Ｓ_ｊのうち、隣接カット点時間のコマーシャル規定長との差が最小であるカット点系列Ｓ_ｊを境界系列と判定する（ステップＳ４８）。

ステップＳ４７又はステップＳ４８で境界系列が決定されると、取得部６５により、該境界系列に基づいてコマーシャル境界を判定する（ステップＳ４９）。

次に、取得部６５により、コマーシャル境界に基づいてコマーシャルをクエリコンテンツとして取得する（ステップＳ５０）。

以上説明したように、第３の実施形態によれば、コンテンツ判定装置３００は、コンテンツにおいて音量が所定時間以上、音量閾値未満となる低音量区間を含む、複数の候補区間を決定し、候補区間からカット点を抽出する。そして、コンテンツ判定装置３００は、カット点に基づいてコマーシャル境界を判定する。コマーシャルとコマーシャルとの間、及びコマーシャルと番組の間では、映像が切り替わることが多い。すなわち、コマーシャル境界はカット点であることが多い。したがって、コマーシャル境界判定装置１は、音量にのみ基づいてコマーシャル境界を判定する場合に比べて、低音量区間を含む候補区間におけるカット点に基づいてコマーシャル境界を判定することによって、正確にコマーシャルを検出することができる。そのため、コンテンツ判定装置３００は、正確に検出されたコマーシャルであるクエリコンテンツの識別子を判定することができる。

なお、上述したコンテンツ判定装置３００として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、コンテンツ判定装置３００の各機能を実現する処理内容を記述したプログラムを該コンピュータのデータベースに格納しておき、該コンピュータのＣＰＵによってこのプログラムを読み出して実行させることで実現することができる。

上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。

１記憶部
２入力部
３マスタ順位決定部
４コンテンツ判定部
５出力部
６コンテンツ取得部
４１非合致判定部
４２類似度算出部
４３判定部
６１音量算出部
６２コマーシャル検出部
６３候補区間決定部
６４カット点抽出部
６５取得部
１００，２００，３００コンテンツ判定装置

Claims

クエリコンテンツを入力する入力部と、
複数のマスタコンテンツを記憶する記憶部と、
前記複数のマスタコンテンツのうちの２つのマスタコンテンツの対応する区間の対応する領域において特徴値が合致しない領域を判定し、前記２つのマスタコンテンツそれぞれの、前記領域の特徴値の、前記クエリコンテンツの対応する領域における特徴値と合致する数である合致特徴数を算出し、前記マスタコンテンツそれぞれの前記合致特徴数に基づいて前記クエリコンテンツの識別子を判定するコンテンツ判定部と、
を備えることを特徴とするコンテンツ判定装置。
前記複数のマスタコンテンツそれぞれの、前記クエリコンテンツに対する類似値に基づいて各マスタコンテンツの順位を決定するマスタ順位決定部をさらに備え、
前記コンテンツ判定部は、前記順位に基づく順番で前記複数のマスタコンテンツそれぞれの前記合致特徴数を算出することを特徴とする請求項１に記載のコンテンツ判定装置。
前記コンテンツ判定部は、最も順位の高いマスタコンテンツと、次に順位の高いマスタコンテンツとの前記特徴値が互いに合致しない領域を判定し、前記領域の特徴値に基づいて前記合致特徴数の大きい方のマスタコンテンツを候補マスタコンテンツと判定し、前記候補マスタコンテンツと、前記特徴値が互いに合致しない領域が判定されていないマスタコンテンツのうち最も順位の高いマスタコンテンツとの特徴値が互いに合致しない領域を判定し、該領域の特徴値に基づいて前記合致特徴数の大きい方のマスタコンテンツを新たな候補マスタコンテンツと判定することを繰り返し、最後に判定された候補マスタコンテンツの識別子が前記クエリコンテンツの識別子であると判定することを特徴とする請求項２に記載のコンテンツ判定装置。
前記類似値は、前記マスタコンテンツの各区間と、該区間に対応する前記クエリコンテンツの区間との類似の度合である区間類似値の最小値であり、
前記マスタ順位決定部は、前記類似値が小さいほど、前記複数のマスタコンテンツの順位を高く決定することを特徴とする請求項２又は３に記載のコンテンツ判定装置。
前記コンテンツ判定部は、前記複数のマスタコンテンツのうちの２つのマスタコンテンツの組合せ全てについて前記特徴値が互いに合致しない領域を判定し、該領域それぞれの特徴値に基づいて前記２つのマスタコンテンツそれぞれの前記合致特徴数を算出し、前記算出された合致特徴数が最大である前記マスタコンテンツの識別子が、前記クエリコンテンツの識別子であると判定することを特徴とする請求項１に記載のコンテンツ判定装置。
複数のマスタコンテンツが記憶されたコンテンツ判定装置が実行するコンテンツ判定方法であって、
クエリコンテンツを入力するステップと、
前記複数のマスタコンテンツのうちの２つのマスタコンテンツの対応する区間の対応する領域において特徴値が合致しない領域を判定し、前記２つのマスタコンテンツそれぞれの、前記領域の特徴値の、前記クエリコンテンツの対応する領域における特徴値と合致する数である合致特徴数を算出し、前記マスタコンテンツそれぞれの前記合致特徴数に基づいて前記クエリコンテンツの識別子を判定するステップと、
を含むことを特徴とするコンテンツ判定方法。
請求項１から５のいずれか一項に記載のコンテンツ判定装置としてコンピュータを機能させるためのプログラム。