JP5880089B2

JP5880089B2 - コミック画像データ検出装置及びコミック画像データ検出プログラム

Info

Publication number: JP5880089B2
Application number: JP2012019066A
Authority: JP
Inventors: 岩永　弘之; 弘之岩永; 純一島村
Original assignee: Toppan Inc
Current assignee: Toppan Inc
Priority date: 2012-01-31
Filing date: 2012-01-31
Publication date: 2016-03-08
Anticipated expiration: 2032-01-31
Also published as: JP2013156946A

Description

本発明はＷｅｂサイト上に存在する画像データから、検出対象のコミックのページを画像データ化したデータであるコミック画像データと一致又は類似する画像データを検出する技術に関するものである。

従来、ネットワーク上に公開された情報について検索条件に基づき検索された検索結果情報の中から違法性の高い情報を検出する技術が開示されている（特許文献１参照）。
特許文献１に記載された違法情報検出装置は、検索結果情報から特徴量を抽出し、抽出した特徴量を検索結果情報と対応付けて記憶する。更に、テキスト、音声、画像、及び動画等の照合技術を用いて、各検索結果情報の間の類似度を計算し、計算した類似度に基づき類似しているか否かを判定する。そして、類似していると判定された検索結果情報の数が所定値を超える場合に、その検出結果情報を違法性の高い情報として検出する。

また、例えば、特許文献２には、ビットマップデータのテンプレート画像と照合対象の画像とでマッチングを行うパターンマッチング装置が開示されている。かかるパターンマッチング装置では、ビットマップデータと照合対象の画像、それぞれからエッジ情報を抽出する。次に、エッジ画像となった両画像に対して平滑化処理を施して両者の形状変化を補う。このように、形状変形部分を補正したエッジ画像同士をマッチング処理する。

特開２００９−１９９５１３号公報特開２００８−１５９０６１号公報

例えば、上記特許文献１の画像の照合に上記特許文献２の照合技術を適用した場合に、テンプレート画像としてビットマップデータ（多階調画像データ）を用意する必要がある。照合対象の種類が少ない場合は、ビットマップデータを照合対象の数だけ記憶保持すればよいが、Ｗｅｂサイト上に存在するコミック画像データのように、照合対象が多種の場合は、テンプレート画像として用意するビットマップデータも多種となり、そのデータ容量が膨大となる。そのため、エッジ画像化するなど、ビットマップデータから不要な情報を削除して、各テンプレートデータの容量を少なくする必要がある。但し、目的の照合精度を確保するためには、照合対象に応じて適切な特徴量を抽出する必要があり、また、抽出した特徴量の内容によってマッチング処理にかかる時間も変わってくる。しかしながら、これまでは、コミック画像データの検出に際して、適切なテンプレートデータを用いた検出方法が提案されていなかった。

本発明は、このような課題を解決するためになされたものであり、その目的は、コミック画像データの検出に際して、テンプレートデータの容量を軽減可能で且つマッチング時間の短縮が可能な、コミック画像データ検出装置、コミック画像データ検出プログラム及びコミック画像データ検出方法を提供することである。

〔形態１〕上記目的を達成するために、形態１のコミック画像データ検出装置は、Ｗｅｂサイト上に存在する画像データから、検出対象のコミックにおける予め設定されたページを画像データ化したデータであるコミック画像データと一致又は類似する画像データを検出するコミック画像データ検出装置であって、前記検出対象のコミックのコミック画像データから、該コミック画像データにおける、少なくともコマ割された各コマの形状及び各コマの位置の情報を含むコマ割に係る情報であるコマ割情報を抽出するコマ割情報抽出手段と、前記コマ割情報抽出手段で抽出したコマ割情報を記憶するコマ割情報記憶手段と、前記Ｗｅｂサイトから画像データを取得する画像データ取得手段と、前記画像データ取得手段で取得した画像データと前記コマ割情報記憶手段に記憶されているコマ割情報とに基づき、前記取得した画像データと前記コマ割情報とのマッチングを行うマッチング手段と、前記マッチング手段のマッチング結果に基づく前記取得した画像データと前記コミック画像データとの類似度に基づき、前記取得した画像データから前記コミック画像データと一致又は類似する画像データを検出する検出手段と、を備えることを特徴とする。

このような構成であれば、コマ割情報抽出手段によって、検出対象のコミックのコミック画像データから、該コミック画像データにおける、少なくともコマ割された各コマの形状及び各コマの位置の情報を含むコマ割情報が抽出されと、抽出されたコマ割情報が、コマ割情報記憶手段によって記憶される。一方、画像データ取得手段によって、Ｗｅｂサイトから画像データが取得されると、マッチング手段によって、取得された画像データと、コマ割情報記憶手段に記憶されているコマ割情報とに基づき、取得した画像データとコマ割情報とのマッチングが行われる。マッチング手段によってマッチングが行われると、検出手段によって、このマッチング結果に基づく取得した画像データとコミック画像データとの類似度に基づき、取得した画像データからコミック画像データと一致又は類似する画像データが検出される。
これにより、コミックに特有の情報であるコマ割情報を抽出し、抽出したコマ割情報を用いてマッチングを行うことが可能となるので、検出精度を比較的高精度に保った状態で、マッチングに用いるテンプレートデータのデータ量を軽減することができる。

〔形態２〕更に、形態２のコミック画像データ検出装置は、形態１の構成に対して、前記コマ割情報抽出手段は、前記コミック画像データを、該コミック画像データの画像に含まれるエッジ成分の分布を示す画像データであるエッジ画像データに変換し、該エッジ画像データから、前記コマ割情報として、コマ割された各コマの外縁部分に対応するエッジ成分のみが描画された画像データであるコマ割画像データを抽出することを特徴とする。

このような構成であれば、コミック画像データから余分な情報を除去した画像データであって、各コマの形状、位置、サイズの情報を含む画像データを、コマ割情報として抽出することができる。従って、コマ割情報のデータ量を大幅に軽減することができる。加えて、コマ割情報は、コミックに特有の情報であるため、マッチング時のテンプレートデータとして検出精度の比較的高い情報となる。

〔形態３〕更に、形態３のコミック画像データ検出装置は、形態２の構成に対して、前記コマ割情報抽出手段は、前記コミック画像データに対応する前記抽出したコマ割画像データについて、前記コマ割情報として、アスペクト比を保持したままで画像サイズを変更して構成される、画像サイズの異なる複数のコマ割画像データを生成することを特徴とする。
このような構成であれば、アスペクト比を保持した状態で、サイズの異なる複数のコマ割画像データを、コマ割情報として生成することができる。
これにより、Ｗｅｂサイトから取得された画像データのサイズや、画像データ中に含まれるコミックのページ数などに対応して、適切なサイズのコマ割画像データを用いてマッチングを行うことが可能となる。従って、検出精度を向上することができる。

〔形態４〕更に、形態４のコミック画像データ検出装置は、形態１乃至３のいずれか１の構成に対して、前記検出手段は、Ｗｅｂサイト毎に、前記一致又は類似する画像データとして検出された画像データに基づき、検出された画像データが予め設定された絞込条件に合致しているか否かを判定し、合致している判定すると、当該画像データを違法に公開された可能性のあるコミック画像データとして検出するようになっており、
前記検出手段で検出された、違法に公開された可能性のあるコミック画像データと、該画像データを公開しているＷｅｂサイトの情報とを対応付けて記憶するサイト情報記憶手段を備えることを特徴とする。

このような構成であれば、絞込条件の設定によって、違法にコミック画像データを公開している可能性のあるサイト（以下、違法候補サイトと称す）、または違法に公開されている可能性のあるコミック画像データ（以下、違法候補画像データと称す）を適切に検出することが可能となる。また、例えば、電子コミックのネット通販を正規に行っているＷｅｂサイトを違法候補サイトとして検出しないように、正規のサイトを除外するように絞込条件を設定することなどが可能となる。

〔形態５〕更に、形態７のコミック画像データ検出装置は、形態４の構成に対して、前記検出手段は、前記一致又は類似する画像データとして検出された画像データが、予め設定されたページ数以上のコミック画像データを含むと判定された場合に、前記絞込条件に合致すると判定することを特徴とする。
このような構成であれば、例えば、正規の電子コミック販売サイトなどのように、コミックの紹介ページとして、例えば１〜３ページの画像を公開しているようなサイト、即ち、検出対象から除外すべきサイトが大量に検出（リストアップ）されるのを防ぐことが可能となる。

〔形態６〕一方、上記目的を達成するために、形態６のコミック画像データ検出プログラムは、Ｗｅｂサイト上に存在する画像データから、検出対象のコミックにおける予め設定されたページを画像データ化したデータであるコミック画像データと一致又は類似する画像データを検出するコミック画像データ検出プログラムであって、前記検出対象のコミックのコミック画像データから、該コミック画像データにおける、少なくともコマ割された各コマの形状及び各コマの位置の情報を含むコマ割に係る情報であるコマ割情報を抽出するコマ割情報抽出手段、前記Ｗｅｂサイトから画像データを取得する画像データ取得手段、前記画像データ取得手段で取得した画像データと前記コマ割情報抽出手段で抽出したコマ割情報が記憶されたコマ割情報記憶手段に記憶されているコマ割情報とに基づき、前記取得した画像データと前記コマ割情報とのマッチングを行うマッチング手段、及び、前記マッチング手段のマッチング結果に基づく前記取得した画像データと前記コミック画像データとの類似度に基づき、前記取得した画像データから前記コミック画像データと一致又は類似する画像データを検出する検出手段として実現される機能をコンピュータに実行させるためのプログラムを含むことを特徴とする。
このような構成であれば、コンピュータによってプログラムが読み取られ、読み取られたプログラムに従ってコンピュータが処理を実行すると、形態１のコミック画像データ検出装置と同等の作用及び効果が得られる。

〔形態７〕また、上記目的を達成するために、形態７のコミック画像データ検出方法は、Ｗｅｂサイト上に存在する画像データから、検出対象のコミックにおける予め設定されたページを画像データ化したデータであるコミック画像データと一致又は類似する画像データを検出するコミック画像データ検出方法であって、前記検出対象のコミックのコミック画像データから、該コミック画像データにおける、少なくともコマ割された各コマの形状及び各コマの位置の情報を含むコマ割に係る情報であるコマ割情報を抽出するコマ割情報抽出ステップと、前記コマ割情報抽出ステップで抽出したコマ割情報を記憶するコマ割情報記憶手段と、前記Ｗｅｂサイトから画像データを取得する画像データ取得ステップと、前記画像データ取得ステップで取得した画像データと前記コマ割情報記憶ステップで記憶されたコマ割情報とに基づき、前記取得した画像データと前記コマ割情報とのマッチングを行うマッチングステップと、前記マッチングステップのマッチング結果に基づく前記取得した画像データと前記コミック画像データとの類似度に基づき、前記取得した画像データから前記コミック画像データと一致又は類似する画像データを検出する検出ステップと、を含むことを特徴とする。
これにより、上記形態１のコミック画像データ検出装置と同等の作用及び効果が得られる。

以上説明したように、本発明によれば、コミック画像データにおけるコマ割に係る情報を抽出して、これをマッチングに用いるデータ（テンプレートデータ）として記憶するようにしたので、検出精度を比較的高精度に保った状態で、テンプレートデータの記憶に必要なメモリ容量を軽減することができるという効果が得られる。更に、違法にコミック画像データを公開しているＷｅｂサイトを人手によって検出する前に、違法にコミック画像データを公開している可能性のあるＷｅｂサイトを絞り込むことができるので、検出を行う人の手間を軽減することができるという効果が得られる。

コミック画像データ検出システムの概要を示す図である。コミック画像データ検出装置１００のハードウェア構成を示すブロック図である。コミック画像データ検出装置１００の機能構成の一例を示すブロック図である。（ａ）は、コミック画像データの一例を示す図であり、（ｂ）は、（ａ）のコミック画像データから抽出したコマ割画像データの一例を示す図である。コマ割情報抽出処理の処理手順の一例を示すフローチャートである。コミック画像データ検出処理の処理手順の一例を示すフローチャートである。（ａ）〜（ｅ）は、コマ割画像データのコマ割内容の一例を示す図である。複数サイズのコマ割画像データの一例を示す図である。

以下、図面に基づき、本発明にかかるコミック画像データ検出装置、コミック画像データ検出プログラム及びコミック画像データ検出方法の実施形態を説明する。図１〜図８は、本発明にかかるコミック画像データ検出装置、コミック画像データ検出プログラム及びコミック画像データ検出方法の実施形態を示す図である。
（構成）
図１は、本発明の実施形態にかかるコミック画像データ検出システムの概要を示す図である。
図１に示すように、コミック画像データ検出システム１は、コミック画像データ検出装置１００と、Ｗｅｂサーバ２００＿１〜２００＿Ｎ（Ｎは４以上の自然数）と、クライアント端末３００＿１〜３００＿Ｍ（Ｍは、２以上の自然数）と、を含んで構成される。

また、コミック画像データ検出装置１００と、Ｗｅｂサーバ２００＿１〜２００＿Ｎと、クライアント端末３００＿１〜３００＿Ｍとは、公知のインターネット４００を介して、相互にデータ通信可能に接続されている。
コミック画像データ検出装置１００は、Ｗｅｂサーバ２００＿１〜２００＿Ｎの提供するＷｅｂサイトにおいて公開されている画像データから、コミックのページを画像データ化したデータであるコミック画像データを検出する機能を有している。更に、コミック画像データ検出装置１００は、検出対象のコミックのコミック画像データを違法に公開している可能性のあるＷｅｂサイトを違法候補サイトとして検出する機能を有している。

Ｗｅｂサーバ２００＿１〜２００＿Ｎは、インターネットプロバイダ等の管理下にあるサーバから構成されており、テキスト、音声、画像、動画等のコンテンツを公開している多数のＷｅｂサイトを提供するサーバである。以下、区別する必要が無い場合に、Ｗｅｂサーバ２００＿１〜２００＿Ｎを、単に、Ｗｅｂサーバ２００と称す。
クライアント端末３００＿１〜３００＿Ｍは、インターネット４００を介して、Ｗｅｂサーバ２００の提供するＷｅｂサイトにアクセスし、アクセス先のＷｅｂサイトで公開されている各種コンテンツの閲覧やダウンロード等を行うことが可能な端末である。以下、区別する必要が無い場合に、クライアント端末３００＿１〜３００＿Ｍを、単に、クライアント端末３００と称す。

次に、図２に基づき、コミック画像データ検出装置１００のハードウェア構成について説明する。図２は、コミック画像データ検出装置１００のハードウェア構成を示すブロック図である。
図２に示すように、コミック画像データ検出装置１００は、ＣＰＵ（Central Processing Unit）６０と、ＲＡＭ（Random Access Memory）６２と、ＲＯＭ（Read Only Memory）６４と、入出力インターフェース（Ｉ／Ｆ）６６と、バス６８とを含んで構成されるコンピュータシステムを備えている。ＣＰＵ６０、ＲＡＭ６２、ＲＯＭ６４およびＩ／Ｆ６６は、バス６８に接続されており、バス６８を介してこれら接続デバイス間のデータの送受信を可能としている。

コミック画像データ検出装置１００は、更に、Ｉ／Ｆ６６を介して、記憶装置７０と、表示装置７２と、入力装置７４と、イメージスキャナ７６と、ＮＩＣ（Network Interface Card）７８とに接続されている。
ＣＰＵ６０は、ＲＯＭ６４または記憶装置７０に予め記憶された各種専用のコンピュータプログラムをＲＡＭ６２に読み込み、ＲＡＭ６２に読み込まれたプログラムに記述された命令に従って、各種リソースを駆使して、後述するコマ割情報抽出処理及びコミック画像データ検出処理を実行する。

記憶装置７０は、各種専用のコンピュータプログラム、プログラムの実行において用いられるデータ等の、上記コマ割情報抽出処理及びコミック画像データ検出処理に必要なデータを記憶する。
具体的に、記憶装置７０は、上記コマ割情報抽出処理において抽出されたコマ割情報をマッチング処理に用いるテンプレートデータとして記憶する。

更に、記憶装置７０は、上記コミック画像データ検出処理において検出された違法に公開されている可能性のあるコミック画像データ（違法候補画像データ）及びこの違法候補画像データを公開しているＷｅｂサイト（違法候補サイト）の情報を記憶する。
ここで、記憶装置７０は、ＦＤドライブ、ＨＤドライブ等の磁気記憶型記憶装置、ＣＤドライブ、ＤＶＤドライブ、ＢＲＤドライブ等の光学的読取／書込方式記憶装置、ＭＯドライブ等の磁気記憶型／光学的読取方式記憶装置等の、コンピュータで記憶データを読み取り可能でかつデータを書き込み可能な記憶装置であれば何でもよい。

表示装置７２は、ＣＲＴディスプレイ、液晶ディスプレイなどの周知の表示装置であり、ＣＰＵ６０からの指令に応じて、上記コミック画像データ検出処理において検出された違法候補画像データ及びこの違法候補画像データを公開している違法候補サイトの情報等の画像の表示を行う。
入力装置７４は、キーボード、マウス、操作ボタン、タッチ式の入力デバイス（タッチパネル等）などのヒューマンインターフェースデバイスであり、ユーザの操作に応じた入力を受け付ける。

イメージスキャナ７６は、ＣＰＵ６０からの指令に応じて、原稿読取部にセットされた原稿（本実施形態ではコミックのページ）を光学的に読み取って、読み取った原稿の画像データ（本実施形態ではコミック画像データ）を生成する。そして、生成したコミック画像データを、順次Ｉ／Ｆ６６を介してコミック画像データ検出装置１００に送信する。
ＮＩＣ７８は、ＬＡＮ、ＷＡＮ、インターネット等のネットワーク上の外部装置と通信するためのデバイスであり、一般にＬＡＮカード等と呼ばれる周知のネットワークアダプタである。ＮＩＣ７８は、ネットワークケーブルＬを介してルータやハブ等に接続され、これらを介して、コミック画像データ検出装置１００をネットワーク（本実施形態ではインターネット）に接続する。なお、周知の無線ＬＡＮ等の、無線によって無線ＬＡＮ用のアクセスポイントを介してネットワークに接続する構成であってもよい。

これにより、本実施の形態では、ネットワークに接続されたＷｅｂサーバ２００の提供するＷｅｂサイトから、ＮＩＣ７８を介して、各Ｗｅｂサイトで公開されている画像データを取得することが可能である。
なお、このコミック画像データ検出装置１００は、例えば、周知のパーソナルコンピュータなどに実装されるものとして構成される。

次に、図３及び図４に基づき、コミック画像データ検出装置１００の機能構成について説明する。図３は、コミック画像データ検出装置１００の機能構成の一例を示すブロック図である。また、図４（ａ）は、コミック画像データの一例を示す図であり、（ｂ）は、（ａ）のコミック画像データから抽出したコマ割画像データの一例を示す図である。
図３に示すように、コミック画像データ検出装置１００は、機能構成部として、コミック画像データ取得部１０と、コマ割情報抽出部１１と、データ通信部１２と、Ｗｅｂサイト検索部１３と、画像データ取得部１４と、マッチング部１５と、判定部１６と、検出部１７と、を備えている。
コミック画像データ取得部１０は、入力装置７４を介したオペレータからのデータ取得指示に応じて、イメージスキャナ７６に対して原稿の読み取り指示を送信する。

本実施形態において、オペレータは、イメージスキャナ７６の原稿読取部に、検出対象のコミックのページをセットしておく。これにより、イメージスキャナ７６は、コミック画像データ取得部１０からの読み取り指示に応じて、セットされたコミックのページをイメージセンサによって光学的に読み取り、読み取ったページの画像データ（コミック画像データ）を生成する。そして、イメージスキャナ７６は、生成したコミック画像データを、Ｉ／Ｆ６６を介して、コミック画像データ検出装置１００に送信する。また、オペレータは、入力装置７４を介して、原稿読取部にセットしたコミックの情報（タイトル、作者名、巻数など）をコミック画像データ検出装置１００に入力する。

なお、イメージスキャナ７６が複数枚の原稿を載置可能な給紙トレイを備え、原稿が読み取られる毎に給紙トレイに載置された原稿を自動で１枚ずつ原稿読取部にセットする機能を有しているとする。この場合、コミック画像データ取得部１０から、連続して読み取る読み取り指示をイメージスキャナ７６に送信することで、イメージスキャナ７６に、給紙トレイに載せられている複数枚の原稿を１枚ずつ連続して読み取らせることが可能である。

コミック画像データ取得部１０は、イメージスキャナ７６から送信されたコミック画像データを取得する。そして、取得したコミック画像データをＲＡＭ６２の予め設定された記憶領域に記憶する。このとき、取得したコミック画像データを、入力されたコミック情報に対応付けて記憶する。また、コミック画像データ取得部１０は、コミック画像データの取得が完了すると、コミック画像データの取得が完了したことを、コマ割情報抽出部１１に通知する。

コマ割情報抽出部１１は、コミック画像データ取得部１０からの通知に応じて、ＲＡＭ６２に記憶されたコミック画像データを読み出し、読み出したコミック画像データからコマ割情報を抽出する。
例えば、図４（ａ）に示す描画内容のコミック画像データＣＩ１が得られたとする。
コミック画像データＣＩ１の画像は、図４（ａ）に示すように、４つの矩形のコマＦ１〜Ｆ４と、コマＦ１〜Ｆ４の外側の領域部分である余白部分ＭＡとから構成される。コマＦ１は、その外縁部分を形成する線分であるコマ割線Ｅ１と、コマ割線Ｅ１によって囲まれた領域内に描画された漫画Ｐ１とから構成され、コマＦ２は、その外縁部分を形成するコマ割線Ｅ２と、コマ割線Ｅ２によって囲まれた領域内に描画された漫画Ｐ２とから構成されている。更に、コマＦ３は、その外縁部分を形成するコマ割線Ｅ３と、コマ割線Ｅ３によって囲まれた領域内に描画された漫画Ｐ３とから構成され、コマＦ４は、その外縁部分を形成するコマ割線Ｅ４と、コマ割線Ｅ４によって囲まれた領域内に描画された漫画Ｐ４とから構成されている。

コマ割情報抽出部１１は、まず、読み出したコミック画像データＣＩ１を、公知のエッジ抽出方法を用いてエッジ画像データに変換する。
ここで、エッジ抽出方法としては、例えば、Ｐｒｅｗｉｔｔオペレータ、Ｓｏｂｅｌオペレータ、ラプラシアン等の公知の微分オペレータを用いてコミック画像データを微分（エッジ強調）し、エッジ強調した後に、予め設定された二値化閾値を用いて二値化する方法がある。また、二値化の方法としては、二値化閾値として１つの固定値を用いる方法、コミック画像データの画像を複数にブロック分けし、各ブロック毎に異なる二値化閾値を用いる方法等がある。また、二値化閾値は、オペレータが入力した値を用いてもよいし、二値化対象の画像のヒストグラムなどからその都度計算によって求めてもよい。

また、コミックのページが、カラーページの場合、コミック画像データをグレースケールデータ化してからエッジ抽出等を行っても良い。
また、二値化後の画像データをエッジ画像データとしてもよいが、二値化後に、エッジ部分を線形化する線形化処理を行ってもよい。また、必要に応じて、ノイズ除去処理（例えば、膨張・収縮等）を行ってもよい。
線形化処理としては、例えば、公知のブレゼンハムの線分描画アルゴリズムを用いてエッジ部分を線形化する方法がある。

このようにして生成されたエッジ画像データは、例えば、エッジ部分の画素値を「１」、エッジ以外の部分の画素値を「０」とした二値から構成される。なお、図４（ａ）に示すコミック画像データの例では、スクリーントーンやベタ塗り等が施されていない線画中心の漫画内容となっているため、エッジ画像データの内容は略同じものとなる。
コマ割情報抽出部１１は、次に、エッジ画像データから各コマを形成する線分であるコマ割線を残し、漫画部分を除去した内容の画像データを抽出する。

例えば、図４(ａ）の例であれば、各コマＦ１〜Ｆ４を形成するコマ割線Ｅ１〜Ｅ４を残し、漫画部分Ｐ１〜Ｐ４を除去した内容の画像データを抽出する。これにより、図４（ｂ）に示す画像内容の画像データＦＩ１（以下、コマ割画像データＦＩ１と称す）が抽出（生成）される。コマ割画像データＦＩ１は、図４（ｂ）に示すように、ページ上に各コマＦ１〜Ｆ４のコマ割線Ｅ１〜Ｅ４のみが描画された画像内容を有する。コマ割画像データは、図４（ｂ）に示すように、ページ紙面上における各コマの形状、サイズ及び位置の情報を有するデータとなる。なお、図４（ａ）の例では、各コマがコマ割線によって閉領域を形成しているが、コマ割線は、例えば、紙面を二分する１本の横線などのように、紙面の外縁部分を領域の端として各コマを構成する場合などもある。この場合は、余白部分が無くなる。また、コマ割線は、紙面の縦横に対して直交する線に限らず、斜め線などの直交しない線の場合もある。また、コマ割線によって構成される閉領域の形状も矩形に限らず、台形や三角形などの他の形状の場合もある。

更に、本実施形態において、コマ割情報抽出部１１は、抽出したコマ割画像データを基準（１００［％］）として、アスペクト比を保持した状態で、例えば、１０［％］〜２００［％］の範囲で基準のコマ割画像データを１０［％］刻みに縮小及び拡大した画像データを生成する。そして、この１０［％］〜２００［％］までの１０［％］刻みのコマ割画像データを、ランレングス圧縮等の可逆性を有する圧縮手法で圧縮し、これらの圧縮データをコミック情報と対応付けて記憶装置７０に記憶する。本実施形態では、この複数サイズのコマ割画像データが、コマ割情報となる。コマ割画像データは、描画部分のデータとして単色でかつ各コマのコマ割線部分のデータしか含まないためデータ量を大幅に圧縮することが可能である。なお、縮小及び拡大の範囲は、１０［％］〜２００［％］の範囲に限らず、他の範囲としてもよいし、また、１０［％］刻みに限らず、他の刻み幅としてもよい。
データ通信部１２は、ＮＩＣ７８を介した、各種データの外部装置への送信と外部装置からの各種データの受信とを制御する機能を有している。

具体的に、データ通信部１２は、各機能構成部からのデータ送信依頼に応じて、ＮＩＣ７８を介して、インターネット４００に接続されたＷｅｂサーバ２００などの外部装置にデータを送信する機能を有している。更に、データ通信部１２は、ＮＩＣ７８を介して、インターネット４００に接続された外部装置から受信したデータを対応する各機能構成部に出力する機能を有している。

Ｗｅｂサイト検索部１３は、オペレータからの入力装置７４を介して入力されたパトロール開始指示に応じて、記憶装置７０から、コマ割画像データに対応付けられたコミック情報に含まれる、コミックのタイトル、作者名、巻数等の情報を読み出す。そして、読み出したタイトル、作者名、巻数等を示すワードを検索ワードとして、インターネット４００に接続されたＷｅｂサーバ２００の提供するＷｅｂサイトから、検索ワードに対応するＷｅｂサイトを検索する。
具体的に、Ｗｅｂサイト検索部１３は、データ通信部１２を介して、例えば、予め設定された、信用のおける検索サービスを提供しているＷｅｂサイトにアクセスする。そして、このＷｅｂサイトに、データ通信部１２を介して検索ワードを送信し、検索サービスを利用して、Ｗｅｂサイトを検索する。

そして、Ｗｅｂサイト検索部１３は、検索されたＷｅｂサイトの情報（ＵＲＬ）を、検索ワードと対応付けて記憶装置７０に記憶する。その後、Ｗｅｂサイト検索部１３は、Ｗｅｂサイトの検索が完了したことを画像データ取得部１４に通知する。
なお、検索された全てのＷｅｂサイトの情報を記憶する構成に限らず、検索数（ヒット数）が膨大な場合を考慮して、例えば、予め設定した上限数のＷｅｂサイトの情報のみを記憶する構成としてもよい。

また、本実施形態において、Ｗｅｂサイト検索部１３は、例えば、電子コミックのネット販売を正規に行っているＷｅｂサイト等の、著作権を有する者から許可を得ているＷｅｂサイトについては、予めリストを生成しておき、リストにあるＷｅｂサイトが検索された場合は、検索結果から除外する。
画像データ取得部１４は、Ｗｅｂサイト検索部１３からの通知に応じて、記憶装置７０に記憶されたＷｅｂサイトの情報（ＵＲＬ）に基づき、データ通信部１２を介して、各Ｗｅｂサイトに対して順番にアクセスする。そして、アクセスしたＷｅｂサイトにおいて公開されている画像データを、データ通信部１２を介して取得し、取得した画像データを記憶装置７０に記憶する。

更に、画像データ取得部１４は、検索された全てのＷｅｂサイトから画像データを取得すると、画像データの取得が完了したことをマッチング部１５に対して通知する。また、画像データ取得部１４は、取得される画像データの数が多い場合に対応して、予め設定された上限数の画像データを取得する毎に、画像データの取得を一旦停止し、マッチング部１５に対して、マッチング指示を送信する。一方、マッチング部１５からのマッチング完了の通知を受け、この通知を受けたことに応じて、停止していた画像データの取得を再開する。

なお、上記した、Ｗｅｂサイト検索部１３において検索サービスを利用して検索ワードを用いたＷｅｂサイトの検索を行い、画像データ取得部１４において検索されたＷｅｂサイトから画像データを取得する構成に限らず、他の構成としてもよい。例えば、検索ワードによるＷｅｂサイトの検索を行わずに、予め取得条件を設定し、画像データ取得部１４において、設定した取得条件に合致するＷｅｂサーバ２００の提供するＷｅｂサイトから、設定した取得条件に合致する画像データを全て取得する構成としてもよい。取得条件としては、例えば、Ｗｅｂサーバ２００の所在する地域（日本、アメリカなど）、画像データの更新日時などを設定する。また、更新日時としては、例えば、コマ割情報に対応するコミックの販売日以降の日時を設定する。

マッチング部１５は、画像データ取得部１４からの取得完了通知又はマッチング指示に応じて、記憶装置７０に記憶されている、Ｗｅｂサイトから取得した画像データ（以下、取得画像データと称す）と、コマ割画像データとのマッチングを行う機能を備えている。
マッチング部１５は、具体的に、コマ割情報の抽出処理と同様に、取得画像データをエッジ画像データに変換し、変換したエッジ画像データからコマ割線と推定される画像部分のみを残した画像データ（以下、取得コマ割画像データと称す）を抽出する。そしてこの抽出した取得コマ割画像データに対して、記憶装置７０に記憶された各コマ割画像データをテンプレート画像としたテンプレートマッチングを行う。
なお、取得した画像データをエッジ画像データに変換してからマッチングを行う構成に限らず、例えば、取得画像データをそのまま用いてマッチングを行う構成など他の構成としてもよい。

取得画像データは、１つの画像データ中に、コミックの１ページ分を含むもの、２ページ分以上を含むものが考えられる。本実施形態では、１ページ分を含む場合と、見開き２ページ又はバラバラなページ順の２ページを含む場合とを対象として、マッチングを行う。その際に、取得画像データのサイズに応じて、１０［％］〜２００［％］までの各サイズのコマ割画像データから最適なサイズの２種類の画像データを選択して、マッチングを行う。例えば、見開き又はバラバラの２ページ分に対しては、１ページ分を含む場合のサイズに対して、半分のサイズのコマ割画像データを選択する。

また、マッチングの方法としては、例えば、コマ割画像データと取得コマ割画像データとの解像度を同じにして、同じ画素位置の各画素の画素値の差分を計算し、この差分値の絶対値の総和を計算する。コマ割画像データと取得コマ割画像データとは、二値化（ここでは、「０」と「１」に二値化）された画像データとなっているため、差分を計算した場合に、同じ画素値の部分では、計算結果が「０」となり、異なる画素値の部分では、「１」又は「−１」となる。
マッチング部１５は、マッチングの結果であるコマ割画像データと取得コマ割画像データとの差分値の総和を判定部１６に出力する。

判定部１６は、マッチング部１５から取得した総和と、予め設定されたマッチング閾値とを比較し、総和がマッチング閾値以下であれば、コマ割画像データと取得コマ割画像データとが一致又は類似している画像内容であると判定し、総和がマッチング閾値よりも大きければ、コマ割画像データと取得コマ割画像データとは異なる（類似していない）画像内容であると判定する。この計算方法の場合は、総和が小さければ小さいほど両者が類似していることになり、総和が「０」のときに両者が一致していることになる。つまり、この総和は、コマ割画像データと取得コマ割画像データとの類似度を示している。
判定部１６は、この判定結果と、対応する取得画像データを公開しているＷｅｂサイトの情報とを対応付けた判定結果情報を生成し、生成した判定結果情報を検出部１７に出力する。

検出部１７は、判定部１６からの判定結果情報に基づき、Ｗｅｂサイト毎に、一致又は類似した画像内容であると判定された取得コマ割画像データに含まれる画像データの数を計数する。そして、検出された各Ｗｅｂサイトについて、全ての判定結果情報を取得すると、計数値と、予め設定された計数閾値とを比較する。この比較により、計数値が計数閾値以上である場合は、計数された取得コマ割画像データに対応する取得画像データが違法に公開されている可能性のあるコミック画像データ（違法画像データ）であると判定する。一方、計数値が計数閾値未満である場合は、計数された取得コマ割画像データに対応する取得画像データが違法に公開された可能性のあるコミック画像データでは無いと判定する。
ここで、計数値は、マッチング処理に用いた検出対象のコミックのコミック画像データと一致又は類似していると判定された画像データ（ページ）の数を示す。

また、計数閾値は、例えば、正規の販売サイトが、紹介ページとして公開しているコミック画像データを違法画像データから除外するための閾値である。つまり、コミックの例えば１〜３ページくらいを抜粋して紹介しているような場合に、違法として判断しないように、上限のページ数を設定した閾値となる。また、別の観点からは、違法候補サイトの数が膨大となって、取り締まりに支障を来さないように、数を絞り込むための閾値とも言える。

検出部１７は、違法に公開された可能性があると判定した場合に、違法とに公開された可能性があると判定したコミック画像データの少なくとも一部と、該違法候補画像データを公開しているＷｅｂサイト（違法候補サイト）の情報と、コミック情報とを対応付けた情報である違法用の検出結果情報を生成する。そして、生成した違法用の検出結果情報を記憶装置７０に記憶する。一方、違法に公開された可能性がないと判定した場合、検出部１７は、そのＷｅｂサイトの情報と、違法ではないことを示す情報と、コミック情報とを対応付けた情報である非違法用の検出結果情報を生成する。そして、生成した非違法用の検出結果情報を記憶装置７０に記憶する。更に、検出部１７は、記憶装置７０から、違法ではないと判定されたＷｅｂサイトに対応する取得画像データを削除する。なお、違法ではないと判定した場合に、そのＷｅｂサイトの情報と取得画像データとを削除する構成としてもよい。

また、検出部１７は、検出結果情報を記憶（又は更新）したことを、検出結果表示部１８に通知する。
検出結果表示部１８は、検出部１７からの通知に応じて、記憶装置７０から検出結果情報を読み出し、読み出した情報に基づき、検出結果を示す画像を表示装置７２に表示する。

（コマ割情報抽出処理）
次に、図５に基づき、ＣＰＵ６０がＲＯＭ６４に記憶された専用のコンピュータプログラムに従って実行するコマ割情報抽出処理の処理手順を説明する。図５は、コマ割情報抽出処理の処理手順の一例を示すフローチャートである。
ＣＰＵ６０において、コマ割情報抽出処理が実行されると、図５に示すように、まず、ステップＳ１００に移行する。

ステップＳ１００では、コミック画像データ取得部１０において、入力装置７４を介したオペレータからのデータ取得指示があったか否かを判定する。その結果、オペレータからのデータ取得指示があったと判定した場合（Ｙｅｓ）は、ステップＳ１０２に移行する。一方、オペレータからのデータ取得指示がなかったと判定した場合（Ｎｏ）は、データ取得指示があるまで判定処理を繰り返す。
ステップＳ１０２に移行した場合は、コミック画像データ取得部１０において、イメージスキャナ７６から送信されたコミック画像データを取得して、ステップＳ１０４に移行する。

具体的に、コミック画像データ取得部１０は、データ取得指示に応じて、イメージスキャナ７６に対して読み取り指示を送信する。この読み取り指示に応じて、イメージスキャナ７６においてコミックのページ（原稿）が光学的に読み取られ、読み取られたページのコミック画像データが生成される。そして、コミック画像データ取得部１０は、イメージスキャナ７６から送信されたコミック画像データをＩ／Ｆ６６を介して取得する。

ステップＳ１０４では、コミック画像データ取得部１０において、ステップＳ１０２で取得したコミック画像データを、別途オペレータによって入力された、コミック情報と対応付けてＲＡＭ６２に記憶して、ステップＳ１０６に移行する。
ステップＳ１０６では、コミック画像データ取得部１０において、コミック画像データの記憶が完了したと判定すると、コミック画像データを取得したことを、コマ割情報抽出部１１に通知して、ステップＳ１０８に移行する。

ステップＳ１０８では、コマ割情報抽出部１１において、ＲＡＭ６２に記憶されたコミック画像データを読み出して、ステップＳ１１０に移行する。
ステップＳ１１０では、コマ割情報抽出部１１において、ステップＳ１０８で読み出したコミック画像データからコマ割情報を抽出するコマ割情報抽出処理を実行して、ステップＳ１１２に移行する。

コマ割情報抽出処理では、コマ割情報抽出部１１は、まず、読み出したコミック画像データをエッジ画像データに変換する。次に、このエッジ画像データからコマ割された各コマの外縁部分を形成するコマ割線を残し、各コマの外縁部分の内側に描画された漫画部分を除去した内容のコマ割画像データを抽出する。更に、コマ割情報抽出部１１は、抽出したコマ割画像データのサイズを基準（１００［％］）として、０［％］〜２００［％］の範囲で１０［％］刻みで基準のコマ割画像データをアスペクト比を保持した状態で縮小及び拡大した、サイズの異なる複数のコマ割画像データを生成する。これら生成された各サイズのコマ割画像データと、抽出した基準のコマ割画像データとをセットとして、コミック情報と対応付けたものがコマ割情報となる。

また、コマ割情報抽出部１１は、ＲＡＭ６２に記憶されたコミック画像データの全てに対して順次コマ割情報抽出処理を行い、抽出処理が完了したコミック画像データを順次ＲＡＭ６２から削除する。
ステップＳ１１２では、コマ割情報抽出部１１において、ステップＳ１１０のコマ割情報抽出処理において生成されたコマ割情報を、コミック情報と対応付けて記憶装置７０に記憶して、ステップＳ１００に移行する。
本実施形態において、コマ割情報抽出部１１は、複数サイズのコマ割画像データを、ランレングス圧縮等の可逆性を有する圧縮方法で圧縮し、この圧縮したコマ割画像データをコミック情報と対応付けて記憶する。

（コミック画像データ検出処理）
次に、図６に基づき、ＣＰＵ６０がＲＯＭ６４に記憶された専用のコンピュータプログラムに従って実行するコミック画像データ検出処理の処理手順を説明する。図６は、コミック画像データ検出処理の処理手順の一例を示すフローチャートである。
ＣＰＵ６０において、コミック画像データ検出処理が実行されると、図６に示すように、まず、ステップＳ２００に移行する。

ステップＳ２００では、Ｗｅｂサイト検索部１３において、入力装置７４を介したオペレータからのパトロール開始指示があったか否かを判定する。その結果、パトロール開始指示があったと判定した場合（Ｙｅｓ）は、ステップＳ２０２に移行する。一方、パトロール開始指示がなかったと判定した場合（Ｎｏ）は、パトロール開始指示があるまで判定処理を繰り返す。

ステップＳ２０２では、Ｗｅｂサイト検索部１３において、記憶装置７０から、検索ワードを読み出して、ステップＳ２０４に移行する。
Ｗｅｂサイト検索部１３は、具体的に、コミック画像データと対応付けて記憶装置７０に記憶されているコミック情報から、該コミック情報に含まれるタイトルや作者名等のワード情報を検索ワードとして読み出す。

ステップＳ２０４では、Ｗｅｂサイト検索部１３において、ステップＳ２０２で読み出した検索ワードを用いて、インターネット４００に接続されたＷｅｂサーバ２００の提供するＷｅｂサイトから、検索ワードに対応するＷｅｂサイトを検索して、ステップＳ２０６に移行する。
ステップＳ２０６では、Ｗｅｂサイト検索部１３において、検索ワードに対応するＷｅｂサイトが検索されたか否かを判定する。その結果、検索ワードに対応するＷｅｂサイトが検索されたと判定した場合（Ｙｅｓ）は、ステップＳ２０８に移行する。一方、検索ワードに対応するＷｅｂサイトが検索されなかったと判定した場合（Ｎｏ）は、ステップＳ２４４に移行する。

ステップＳ２０８に移行した場合は、Ｗｅｂサイト検索部１３において、検索されたＷｅｂサイトの情報（ＵＲＬ）を記憶装置７０に記憶して、ステップＳ２１０に移行する。
ステップＳ２１０に移行した場合は、画像データ取得部１４において、記憶装置７０に記憶された情報に対応するＷｅｂサイトに順次アクセスし、アクセス先のＷｅｂサイトにおいて公開されている画像データを取得して、ステップＳ２１２に移行する。
ステップＳ２１２では、画像データ取得部１４において、ステップＳ２１０で取得した画像データを、記憶装置７０に記憶して、ステップＳ２１４に移行する。

ステップＳ２１４では、画像データ取得部１４において、取得した画像データの数が、予め設定された上限数に到達したか否かを判定する。その結果、上限数に到達したと判定した場合（Ｙｅｓ）は、上限数に到達したことをマッチング部１５に通知して、ステップＳ２１６に移行し、上限数に到達していないと判定した場合（Ｎｏ）は、ステップＳ２４２に移行する。
ステップＳ２１６に移行した場合は、マッチング部１５において、記憶装置７０から、取得画像データと、この取得画像データに対応するコマ割画像データとを読み出して、ステップＳ２１８に移行する。
ステップＳ２１８では、マッチング部１５において、ステップＳ２１６で読み出した取得画像データと、コマ割画像データとのマッチング処理を実行して、ステップＳ２２０に移行する。

マッチング処理では、マッチング部１５は、まず、取得画像データをエッジ画像データに変換し、このエッジ画像データからコマ割された各コマと推定される画像部分の外縁部分を残して、その他の描画部分を除去した内容の取得コマ割画像データを抽出する。次に、サイズの異なる複数のコマ割画像データから、取得コマ割画像データのサイズに適したサイズのコマ割画像データを選択する。そして、選択したコマ割画像データの各画素の画素値と、取得コマ割画像データの同じ画素位置の各画素の画素値との差分値の絶対値を順次算出する。そして、これら絶対値の総和を算出し、算出した総和を、マッチング結果として順次判定部１６に出力する。

ステップＳ２２０では、判定部１６において、マッチング部１５から取得した総和と、予め設定されたマッチング閾値とを比較し、この比較結果に基づき、取得画像データがコミック画像データと一致又は類似している画像データであるか否かを判定する。そして、この判定結果に基づき判定結果情報を生成し、生成した判定結果情報を検出部１７に出力して、ステップＳ２２２に移行する。なお、本実施形態では、判定結果情報に、取得画像データ内に含まれる一致又は類似すると判定された画像データ（以下、類似画像データと称す）の数の情報も付加する。

ステップＳ２２２では、検出部１７において、判定部１６から取得した判定結果情報に基づき、マッチングした取得画像データが類似画像データを含むか否かを判定する。その結果、類似画像データを含むと判定した場合（Ｙｅｓ）は、ステップＳ２２４に移行し、類似画像データを含まないと判定した場合（Ｎｏ）は、ステップＳ２２６に移行する。
ステップＳ２２４に移行した場合は、検出部１７において、対応するＷｅｂサイトについて、取得画像データ中に含まれる類似画像データ（ページ）の数を計数して、ステップＳ２２６に移行する。

ステップＳ２２６では、マッチング部１５において、取得した全ての画像データについて、マッチング処理が完了したか否かを判定する。その結果、マッチング処理が完了したと判定した場合（Ｙｅｓ）は、ステップＳ２２８に移行し、マッチング処理が完了していないと判定した場合（Ｎｏ）は、ステップＳ２１８に移行する。
ステップＳ２２８に移行した場合は、画像データ取得部１４において、未取得の画像データがあるか否かを判定し、未取得の画像データがあると判定した場合（Ｙｅｓ）は、ステップＳ２１０に移行し、未取得の画像データがないと判定した場合（Ｎｏ）は、ステップＳ２３０に移行する。

ステップＳ２３０に移行した場合は、検出部１７において、Ｗｅｂサイト毎に、類似画像データの計数値と、予め設定された計数閾値とを比較して、ステップＳ２３２に移行する。
ステップＳ２３２では、検出部１７において、ステップＳ２３０の比較結果に基づき、絞込条件に合致するＷｅｂサイトがあったか否かを判定する。その結果、絞込条件に合致するＷｅｂサイトがあったと判定した場合（Ｙｅｓ）は、ステップＳ２３４に移行する。

一方、絞込条件に合致するＷｅｂサイトがなかったと判定した場合（Ｎｏ）は、ステップＳ２３６に移行する。
本実施形態では、類似画像データの計数値が計数閾値以上である場合に、絞込条件に合致していると判定し、類似画像データの計数値が計数閾値未満である場合に、絞込条件に合致していないと判定する。
ステップＳ２３４に移行した場合は、検出部１７において、絞込条件に合致すると判定された取得画像データの一部と、当該画像データを公開している違法候補サイトの情報と、コミック情報とを含む違法用の検出結果情報を生成して、ステップＳ２３８に移行する。

一方、ステップＳ２３６に移行した場合は、検出部１７において、違法候補サイトではないことを示す情報と、そのＷｅｂサイトの情報と、コミック情報とを含む非違法用の検出結果情報を生成して、ステップＳ２３８に移行する。
ステップＳ２３８では、検出部１７において、ステップＳ２３４又はＳ２３６で生成した検出結果情報を記憶装置７０に記憶して、ステップＳ２３９に移行する。

ステップＳ２３９では、検出部１７において、検出結果情報が未生成のＷｅｂサイトがあるか否かを判定する。その結果、検出結果情報が未生成のＷｅｂサイトがあると判定した場合（Ｙｅｓ）は、ステップＳ２３０に移行する。一方、検出結果情報が未生成のＷｅｂサイトが無いと判定した場合（Ｎｏ）は、検出結果情報の記憶（又は更新）処理が完了したことを、検出結果表示部１８に通知して、ステップＳ２４０に移行する。
ステップＳ２４０では、検出結果表示部１８において、記憶装置７０から検出結果情報を読み出し、読み出した検出結果情報に基づき、検出結果を表示装置７２に表示して、ステップＳ２４０に移行する。

一方、ステップＳ２１４において、予め設定した上限数に到達していないと判定してステップＳ２３８に移行した場合は、画像データ取得部１４において、画像データの取得が完了したか否かを判定する。その結果、画像データの取得が完了したと判定した場合（Ｙｅｓ）は、完了したことをマッチング部１５に通知して、ステップＳ２１６に移行する。一方、画像データの取得が完了していないと判定した場合（Ｎｏ）は、ステップＳ２１０に移行する。

また、ステップＳ２０６において、検索ワードに対応するＷｅｂサイトが検索されずにステップＳ２４０に移行した場合は、Ｗｅｂサイト検索部１３において、他のコミックの検索ワードがあるか否かを判定する。その結果、他のコミックの検索ワードがあると判定した場合（Ｙｅｓ）は、ステップＳ２０４に移行し、他のコミックの検索ワードがないと判定した場合（Ｎｏ）は、ステップＳ２００に移行する。

（動作）
次に、図７〜図８に基づき、本実施形態のコミック画像データ検出装置１００の動作を説明する。
ここで、図７（ａ）〜（ｅ）は、コマ割画像データのコマ割内容の一例を示す図である。また、図８は、複数サイズのコマ割画像データの一例を示す図である。
まず、コミック画像データ検出装置１００におけるコマ割情報抽出処理の動作について説明する。

いま、コミック画像データ検出装置１００において、オペレータが入力装置７４を操作してデータ取得指示を入力したとする。これにより、コミック画像データ取得部１０は、データ取得指示の入力に応じて（ステップＳ１００のＹｅｓ）、Ｉ／Ｆ６６を介して、イメージスキャナ７６に対して読取指示を出力する。その際、オペレータは、イメージスキャナ７６の原稿読取部又は給紙トレイに、検出対象のコミックから予め選定して切り離したページをセットしておく。このページの選定は、検出対象のコミックにおいて特徴的なコマ割となっているページや、各コマがコマ割線で囲まれた閉領域となっているページなど、マッチング処理時のマッチング精度や、コマ割情報抽出時の抽出精度等を考慮して行うことが望ましい。また、オペレータは、予め検出対象のコミックのタイトル、作者名、巻数等のコミック情報を入力しておく。

イメージスキャナ７６は、原稿読取部にセットされたコミックのページを光学的に読み取って、コミック画像データを生成し、生成したコミック画像データをＩ／Ｆ６６を介してコミック画像データ検出装置１００に送信する。
そして、コミック画像データ取得部１０は、イメージスキャナ７６から送信されたコミック画像データを取得し（ステップＳ１０２）、取得したコミック画像データを、コミック情報と対応付けてＲＡＭ６２に記憶する（ステップＳ１０４）。その後、コミック画像データ取得部１０は、コミック画像データの取得通知をコマ割情報抽出部１１に送信する（ステップＳ１０６）。

コマ割情報抽出部１１は、コミック画像データ取得部１０からの取得通知を受信すると、ＲＡＭ６２から、コミック画像データを読み出し（ステップＳ１０８）、読み出したコミック画像データからコマ割情報を抽出するコマ割情報抽出処理を実行する（ステップＳ１１０）。

コマ割情報抽出部１１は、まず、読み出したコミック画像データに対して、例えば、公知のＳｏｂｅｌオペレータによるエッジ強調処理を実行する。次に、エッジ強調後のデータを、予め設定した二値化閾値によって二値化して、二値化されたエッジ画像データを生成する。更に、コマ割情報抽出部１１は、エッジ画像データに対して、例えば、公知のブレゼンハムの線分描画アルゴリズムを用いてエッジ部分を線形化する処理を施す。その後、エッジ部分が線形化されたエッジ画像データから、予め設定された抽出規則に従って、コマ割線部分を残し、漫画部分を除去した内容のコマ割画像データを抽出する。例えば、抽出規則としては、エッジ画像データ中の線分によって閉領域が形成されている部分について、閉領域の外縁部分を残し、閉領域内の描画部分を除去する規則が設定されている。
このようにして、図７（ａ）〜（ｅ）に例示したようなコマ割画像データがコマ割情報として抽出されたとする。

ここで、図７（ａ）は、図４（ｂ）と同様のものであり、図７（ｂ）は、図７（ａ）と同様の各コマの形状が矩形となっている場合の例である。図７（ｃ）は、各コマの形状が台形となっている場合の例であり、図７（ｄ）は、各コマの形状として台形と矩形とが混在している場合の例である。図７（ｅ）は、ページの端部を外縁部の一部としているコマ割りがされている場合の例である。図７（ｅ）の例では、ページ端部がコマ割線となっているため各コマの判断が難しい。

コマ割情報抽出部１１は、更に、抽出した各コマ割画像データの画像サイズを基準（１００［％］）として、１０［％］〜２００［％］の範囲で１０［％］刻みで各画像を縮小及び拡大した複数サイズのコマ割画像データを生成する。図７（ａ）のコマ割画像データを例に挙げると、図８に示すように、基準のコマ割画像データに対して、画像サイズの縮小によって、１０［％］〜９０［％］まで１０［％］刻みで９種類のサイズのコマ割画像データを生成する。更に、画像サイズの拡大によって、１１０［％］〜２００［％］まで１０［％］刻みで１０種類のサイズのコマ割画像データを生成する。これにより、２０段階のサイズのコマ割画像データが得られる。
コマ割情報抽出部１１は、各２０段階のサイズのコマ割画像データを、例えば、ランレングス圧縮等の可逆性を有する圧縮方法で圧縮し、この圧縮されたコマ割画像データを、コミック情報と対応付けて記憶装置７０に記憶する（ステップＳ１１２）。なお、このようなコマ割情報の生成は、検出対象のコミック全てに対して行う。

次に、コミック画像データ検出装置１００におけるコマ割情報抽出処理の動作について説明する。
いま、コミック画像データ検出装置１００において、オペレータが入力装置７４を操作してパトロール開始指示を入力したとする。これにより、Ｗｅｂサイト検索部１３は、パトロール開始指示の入力に応じて（ステップＳ２００のＹｅｓ）、記憶装置７０にコミック画像データと対応付けて記憶されているコミック情報に含まれる検索ワードを読み出す（ステップＳ２０２）。なお、オペレータによるパトロール開始指示の入力に限らず、専用のソフトウェアによって、パトロールの開始時刻を予めスケジューリングしておき、スケジューリングされた開始時刻になったことに応じて自動でＷｅｂサイトの検索処理を実行するように構成してもよい。

次に、Ｗｅｂサイト検索部１３は、読み出した検索ワードを用いてＷｅｂサイトの検索を行う（ステップＳ２０４）。ここでは、Ｗｅｂサイトの検索は、検索対象のコミックのタイトルと、作者名と、コミックの巻数とを用いて、例えば、ＯＲ条件で検索を行う。つまり、Ｗｅｂサイト内に、これらの検索ワードのいずれか１つでも含むページを有していれば、そのＷｅｂサイトが検索される（ヒットする）ことになる。また、検索エンジンとしては、例えば、信用のおける公知の検索エンジンを用いる。

この検索処理によって、検索ワードに対応するＷｅｂサイトが検索されると（ステップＳ２０６のＹｅｓ）、Ｗｅｂサイト検索部１３は、検索されたＷｅｂサイトの情報（ＵＲＬ）を、検索対象のコミックのコミック情報と対応付けて記憶装置７０に記憶する（ステップＳ２０８）。そして、Ｗｅｂサイトの情報を記憶したことを、画像データ取得部１４に通知する。

画像データ取得部１４は、Ｗｅｂサイト検索部１３からの通知を受けたと判定すると、記憶装置７０に記憶されたＷｅｂサイトの情報（ＵＲＬ）に基づき、ここではヒット順（検索時の表示順）に、各Ｗｅｂサイトにアクセスを行い、アクセス先のＷｅｂサイトにおいて公開されている画像データを取得する（ステップＳ２１０）。そして、画像データ取得部１４は、取得した画像データを、コミック情報と対応付けて記憶装置７０に記憶する（ステップＳ２１２）。なお、上記したように、検索ワードを用いたＷｅｂサイトの検索を行わずに、Ｗｅｂサイトから、予め設定した取得条件に合致する画像データを全て取得する構成としてもよい。但し、この場合は、画像データと共に、取得条件に合致した画像データを公開しているＷｅｂサイトの情報（例えば、ＵＲＬ）を、取得した画像データに対応付けて記憶するようにする。

画像データ取得部１４は、画像データの取得数が予め設定した上限数に到達したか否かを判定する（ステップＳ２１４）。ここでは、到達していないと判定し（ステップＳ２１４のＮｏ）、かつ画像データの取得が完了したと判定したとする（ステップＳ２３８）。これにより、画像データ取得部１４は、画像データの取得が完了したことを、マッチング部１５に通知する。
マッチング部１５は、画像データ取得部１４からの通知を受けたと判定すると、記憶装置７０から、取得した画像データ（取得画像データ）と該取得画像データに対応付けられたコミック情報に対応するコマ割画像データとを読み出す（ステップＳ２１６）。

そして、マッチング部１５は、読み出した取得画像データとコマ割画像データとのマッチング処理を実行する（ステップＳ２１８）
具体的に、マッチング部１５は、まず、読み出した取得画像データをエッジ画像データへと変換する。このとき、コマ割情報抽出部１１でコマ割情報の抽出処理時に用いた処理方法と同様の処理方法でエッジ画像データへと変換する。

次に、マッチング部１５は、コマ割情報抽出部１１で用いた抽出規則と同様の規則に従って、このエッジ画像データからコマ割線部分と推定される部分を残して、その他の描画部分を除去した内容のコマ割画像データ（取得コマ割画像データ）を抽出する。なお、上記したように、エッジ画像データへの変換を行わずに、取得画像データをそのまま用いてマッチングを行う構成とすることも可能である。

マッチング部１５は、抽出した取得コマ割画像データに対して、記憶装置７０から読み出した各コマ割画像データをテンプレートデータとして、テンプレートマッチングを実行する。このとき、２０段階の各サイズのコマ割画像データの全てとマッチングを行ってもよいが、ここでは、コミックの１ページ分と見開き又はバラバラの２ページ分とを検出対象として、取得コマ割画像データのサイズに応じて、同サイズ又は最も近いサイズのコマ割画像データと、その半分のサイズのコマ割画像データとを選択する。そして、選択したコマ割画像データを用いてマッチングを行う。なお、２ページ分に対しては、検出対象のコミックに対応するコマ割画像データの全ての組合せでマッチングを行う。

また、マッチングは、取得コマ割画像データとコマ割画像データとを重ね合わせて、両者の重なった位置にある各２つの画素の画素値を用いて行う。ここでは、両画像のサイズ（解像度）を合わせて、ぴったりと重なるようにする。半分のサイズのコマ割画像データについては、取得コマ割画像データを半分にした一方又は他方とぴったりと重なるようにサイズを調整する。そして、画像の左上又は右上の画素を基準にして両者を重ね合わせた場合の、重なる位置にある各画素同士について、両者の画素値の差分の絶対値を算出し、更に、この絶対値の総和を算出する。マッチング部１５は、各選択したコマ割画像データに対する総和をマッチング結果として、判定部１６に出力する。

判定部１６は、マッチング部１５からマッチング結果を取得すると、取得したマッチング結果と、予め設定されたマッチング閾値とを比較する。そして、総和がマッチング閾値以下である場合に、取得コマ割画像データが、マッチングに用いたコマ割画像データと一致又は類似していると判定する。一方、総和がマッチング閾値よりも大きい場合は、取得コマ割画像データが、マッチングに用いたコマ割画像データと類似していないと判定する（ステップＳ２２０）。ここで、上記のマッチング方法では、総和が小さい程、取得コマ割画像データとコマ割画像データとの類似度が高いことになる（総和が「０」で完全一致）。なお、マッチング閾値は、全てに共通の１つの固定値を用いてもよいし、コマ割画像データ毎に閾値を設定してもよいし、各コマ割画像データのサイズ毎に閾値を設定してもよい。特に、コマ割線部分が多ければ多いほど、一致度は下がっていくことが予測されるので、このようなコマ割画像データに対して、あまり小さい閾値を設定してしまうと、検出率の低下を招く恐れがある。一方、閾値を大きくし過ぎると不要な画像まで一致していると判定されてしまうので、事前に行った試験の結果や実測データ等に基づいて最適な閾値を設定することが望ましい。

判定部１６は、このようにして判定した判定結果の情報と、Ｗｅｂサイトの情報とを含む判定結果情報を生成し、生成した判定結果情報を検出部１７に出力する。
検出部１７は、判定部１６からの判定結果情報に基づき、マッチングした取得画像データが、類似画像データを含んでいるか否かを判定する（ステップＳ２２２）。ここで、類似画像データを含んでいると判定した場合（ステップＳ２２２のＹｅｓ）は、検出部１７は、対応するＷｅｂサイトの類似画像データ数に、ここでは１〜２を加算する（ステップＳ２２４）。具体的に、１つの取得画像データにおいて、１ページ分の内容が含まれている場合は１を加算し、２ページ分の内容が含まれている場合は２を加算する。
上記一連のマッチング処理（ステップＳ２１６〜Ｓ２２４）を、全ての取得画像データについて処理が完了するまで繰り返し実行する。

そして、マッチング部１５においてマッチング処理が完了したと判定され（ステップＳ２２６のＹｅｓ）、画像データ取得部１４において、未取得の画像データが無いと判定されたとする（ステップＳ２２８のＮｏ）。これにより、検出部１７は、Ｗｅｂサイト毎に、これまでに計数した類似画像データ数と予め設定された計数閾値とを比較する。そして、この比較結果に基づき、絞込条件に合致するものがあるか否かを判定する（ステップＳ２３２）。ここでは、検出対象のコミックのページが「３」ページ以上含まれている場合に違法候補サイトと判断することとして、計数閾値は「３」に設定されていることとする。従って、検出部１７は、類似画像データ数が「３」以上であると判定した場合は、絞込条件に合致すると判定し（ステップＳ２３２のＹｅｓ）、類似画像データ数が「３」未満であると判定した場合は、絞込条件に合致しないと判定する（ステップＳ２３２のＮｏ）。

検出部１７は、絞込条件に合致すると判定した場合に、該当するＷｅｂサイト（違法候補サイト）の情報（ＵＲＬ）と、類似していると判定されかつ違法と判定された取得画像データの少なくとも一部と、コミック情報とを対応付けた検出結果情報を生成する（ステップＳ２３４）。一方、絞込条件に合致していないと判定した場合に、該当するＷｅｂサイトの情報と、コミック情報とを対応付けた検出結果情報を生成する（ステップＳ２３６）。

そして、検出部１７は、生成した検出結果情報を、記憶装置７０に記憶し、検出結果情報を記憶（又は更新）したことを検出結果表示部１８に通知する（ステップＳ２３８）。また、検出部１７は、違法ではないと判定されたＷｅｂサイトに対応する取得画像データを含む不要な取得画像データを記憶装置７０から削除する。
検出結果表示部１８は、検出部１７からの通知に応じて、記憶装置７０から検出結果情報を読み出し、読み出した検出結果情報に基づき検出結果を表示する（ステップＳ２４０）。なお、検出結果を表示する際に、類似度の高い順にソートして表示するようにしてもよい。

以上説明したように、本実施形態におけるコミック画像データ検出装置１００であれば、検出対象のコミックのコミック画像データから、コマ割情報として、コマ割線の描画部分を残して、漫画部分を除去した内容のコマ割画像データを抽出することができる。更に、抽出したコマ割画像データを基準として、当該コマ割画像データを１０［％］〜２００［％］の範囲で縮小及び拡大した、サイズの異なる複数のコマ割画像データを生成することができる。更に、これらコマ割画像データをランレングス圧縮等の可逆性を有する圧縮方法で圧縮したデータをコマ割情報として記憶装置７０に記憶することができる。
各コマを形成するコマ割線部分の画像は単色（黒色）であり、かつ、コマ割線は、基本的に直線の情報となるので描画部分は、漫画部分と比較して少ない。従って、コマ割情報は、可逆性を有する圧縮方法で圧縮をしてもデータ量を大幅に削減することができる。

また、コマ割画像データは、各コマの形状、位置、サイズ等の情報を含むデータであり、マッチングに用いるテンプレートデータとしての機能を有している。加えて、コマ割情報は、コミックに特有の情報であることから、原画像や全てのエッジ成分を含むエッジ画像を用いたマッチングと比較して、検出精度を低下させることなくデータ量を大幅に軽減することができる。
また、本実施形態におけるコミック画像データ検出装置１００は、コマ割画像データとして二値化した画像データを生成するようにしたので、例えば、コマ割画像データの画素値「０」の画素との差分を省略することなどが可能となり、原画像（特に多階調画像）を用いたマッチングと比較して、マッチング処理にかかる時間を短縮することができる。

また、本実施形態におけるコミック画像データ検出装置１００は、絞込条件によって、コミック画像データを違法に公開している可能性のあるＷｅｂサイトを絞り込んで検出することができるので、最終的に違法なサイトを人手によって検出する際の手間を軽減することができる。
ここで、上記実施形態において、コミック画像データ取得部１０が、コミック画像データ取得手段を構成し、コマ割情報抽出部１１が、コマ割情報抽出手段を構成し、コマ割情報抽出部１１及び記憶装置７０が、コマ割情報記憶手段を構成する。

また、上記実施形態において、Ｗｅｂサイト検索部１３及び画像データ取得部１４が、画像データ取得手段を構成し、マッチング部１５が、マッチング手段を構成する。
また、上記実施形態において、判定部１６及び検出部１７が検出手段を構成し、検出部１７及び記憶装置７０が、サイト情報記憶手段を構成する。
また、上記実施形態において、ステップＳ１０８〜Ｓ１１０が、コマ割情報抽出ステップに対応し、ステップＳ１１２が、コマ割情報記憶ステップに対応する。
また、上記実施形態において、ステップＳ２０４〜Ｓ２１０が、画像データ取得ステップに対応し、ステップＳ２１８が、マッチングステップに対応し、ステップＳ２２０〜Ｓ２３６が、検出ステップに対応する。

（変形例）
上記実施形態において、コマ割情報として、コマ割線部分を残し、それ以外の漫画部分を除去したコマ割画像データを抽出する構成としたが、この構成に限らない。
例えば、コミックにおいてコマ割以外の特徴的な情報として、各コマ内の人物等のセリフを記載する吹き出し部分がある。この吹き出し部分の描画内容についても残すようにすることで、より検出精度の高いコマ割情報を生成することが可能となる。吹き出し部分の描画内容としては、吹き出しを構成する枠線部分と、吹き出し内に記載された文字部分とがある。これらのいずれか一方を抽出してもよいし、両方を抽出してもよい。また、文字部分については、画像中に残すようにしてもよいが、文字コード化して、吹き出しの位置情報と対応付けて別途記憶する構成としてもよい。

また、吹き出し部分に限らず、登場人物の顔が描画されているコマについては、その情報をコマ割情報として記憶する構成としてもよい。但し、テンプレートデータの量が増えるとマッチング処理にかかる時間も長くなるので、処理時間とのトレードオフで含めるようにする。または、最初のマッチング処理では、コマ割線部分の描画情報のみを残したコマ割画像データによるマッチングを行い、このマッチングで違法に公開されている可能性があると判定されたＷｅｂサイトの画像データのみに対して、吹き出し部分や顔の位置情報を含むコマ割画像データを用いたマッチング処理を行う。吹き出し部分の情報は、データの記憶容量を考慮して、差分データとして持つようにする。

また、上記実施形態において、コマ割情報として、コマ割画像データを抽出する構成としたが、この構成に限らない。各コマの形状、サイズ、位置が解る情報であれば、例えば、コマの形状が多角形状であれば、各コマの頂点の座標情報と、形状を示す情報、コミック画像データのサイズ（ページサイズ）とを抽出する構成としてもよい。この場合は、例えば、マッチング処理時に、これらと同じ情報を取得画像データから抽出してマッチングを行う構成と、これらの情報に基づき、画像データを再構成して、再構成した画像データとのマッチングを行う構成とがある。

また、上記実施形態において、コミック画像データを、イメージスキャナから取得する構成としたが、この構成に限らない。例えば、ＵＳＢメモリ等のコンパクトメモリ、ＣＤドライブ、ＤＶＤドライブ、ブルーレイドライブ等を経由して取得する構成としてもよいし、ネットワーク経由で他のＰＣ等から取得する構成としてもよい。
また、上記実施形態は、本発明の好適な具体例であり、技術的に好ましい種々の限定が付されているが、本発明の範囲は、上記の説明において特に本発明を限定する旨の記載がない限り、これらの形態に限られるものではない。また、上記の説明で用いる図面は、図示の便宜上、部材ないし部分の縦横の縮尺は実際のものとは異なる模式図である。
また、本発明は上記実施形態に限定されるものではなく、本発明の目的を達成できる範囲での変形、改良等は本発明に含まれるものである。

１…コミック画像データ検出システム、１００…コミック画像データ検出装置、２００＿１〜２００＿Ｎ…Ｗｅｂサーバ、１０…コミック画像データ取得部、１１…コマ割情報抽出部、１２…データ通信部、１３…Ｗｅｂサイト検索部、１４…画像データ取得部、１５…マッチング部、１６…判定部、１７…検出部、１８…検出結果表示部、６０…ＣＰＵ、６２…ＲＡＭ、６４…ＲＯＭ、６６…Ｉ／Ｆ、６８…バス、７０…記憶装置、７２…表示装置、７４…入力装置、７６…イメージスキャナ、７８…ＮＩＣ

Claims

Ｗｅｂサイト上に存在する画像データから、検出対象のコミックにおける予め設定されたページを画像データ化したデータであるコミック画像データと一致又は類似する画像データを検出するコミック画像データ検出装置であって、
前記検出対象のコミックのコミック画像データから、該コミック画像データにおける、少なくともコマ割された各コマの形状及び各コマの位置の情報を含むコマ割に係る情報であるコマ割情報を抽出するコマ割情報抽出手段と、
前記コマ割情報抽出手段で抽出したコマ割情報を記憶するコマ割情報記憶手段と、
前記Ｗｅｂサイトから画像データを取得する画像データ取得手段と、
前記画像データ取得手段で取得した画像データと前記コマ割情報記憶手段に記憶されているコマ割情報とに基づき、前記取得した画像データと前記コマ割情報とのマッチングを行うマッチング手段と、
前記マッチング手段のマッチング結果に基づく前記取得した画像データと前記コミック画像データとの類似度に基づき、前記取得した画像データから前記コミック画像データと一致又は類似する画像データを検出する検出手段と、を備え、
前記コマ割情報抽出手段は、前記コミック画像データを、該コミック画像データの画像に含まれるエッジ成分の分布を示す画像データであるエッジ画像データに変換し、該エッジ画像データから、前記コマ割情報として、コマ割された各コマの外縁部分に対応するエッジ成分のみが描画された画像データであるコマ割画像データを抽出すると共に、アスペクト比を保持したままで画像サイズを変更して構成される、画像サイズの異なる複数のコマ割画像データを生成することを特徴とするコミック画像データ検出装置。
前記検出手段は、Ｗｅｂサイト毎に、前記一致又は類似する画像データとして検出された画像データに基づき、検出された画像データが予め設定された絞込条件に合致しているか否かを判定し、合致している判定すると、当該画像データを違法に公開された可能性のあるコミック画像データとして検出するようになっており、
前記検出手段で検出された、違法に公開された可能性のあるコミック画像データと、該画像データを公開しているＷｅｂサイトの情報とを対応付けて記憶するサイト情報記憶手段を備えることを特徴とする請求項１に記載のコミック画像データ検出装置。
前記検出手段は、前記一致又は類似する画像データとして検出された画像データが、予め設定されたページ数以上のコミック画像データを含むと判定された場合に、前記絞込条件に合致すると判定することを特徴とする請求項２に記載のコミック画像データ検出装置。
Ｗｅｂサイト上に存在する画像データから、検出対象のコミックにおける予め設定されたページを画像データ化したデータであるコミック画像データと一致又は類似する画像データを検出するコミック画像データ検出装置であって、
前記検出対象のコミックのコミック画像データから、該コミック画像データにおける、少なくともコマ割された各コマの形状及び各コマの位置の情報を含むコマ割に係る情報であるコマ割情報を抽出するコマ割情報抽出手段と、
前記コマ割情報抽出手段で抽出したコマ割情報を記憶するコマ割情報記憶手段と、
前記Ｗｅｂサイトから画像データを取得する画像データ取得手段と、
前記画像データ取得手段で取得した画像データと前記コマ割情報記憶手段に記憶されているコマ割情報とに基づき、前記取得した画像データと前記コマ割情報とのマッチングを行うマッチング手段と、
前記マッチング手段のマッチング結果に基づく前記取得した画像データと前記コミック画像データとの類似度に基づき、前記取得した画像データから前記コミック画像データと一致又は類似する画像データを検出する検出手段と、を備え、
前記検出手段は、Ｗｅｂサイト毎に、前記一致又は類似する画像データとして検出された画像データに基づき、検出された画像データが予め設定されたページ数以上のコミック画像データを含むか否かを判定し、含むと判定すると、当該画像データを違法に公開された可能性のあるコミック画像データとして検出するようになっており、
前記検出手段で検出された、違法に公開された可能性のあるコミック画像データと、該画像データを公開しているＷｅｂサイトの情報とを対応付けて記憶するサイト情報記憶手段を備えることを特徴とするコミック画像データ検出装置。
前記コマ割情報抽出手段は、前記コミック画像データを、該コミック画像データの画像に含まれるエッジ成分の分布を示す画像データであるエッジ画像データに変換し、該エッジ画像データから、前記コマ割情報として、コマ割された各コマの外縁部分に対応するエッジ成分のみが描画された画像データであるコマ割画像データを抽出することを特徴とする請求項４に記載のコミック画像データ検出装置。
Ｗｅｂサイト上に存在する画像データから、検出対象のコミックにおける予め設定されたページを画像データ化したデータであるコミック画像データと一致又は類似する画像データを検出するコミック画像データ検出プログラムであって、
前記検出対象のコミックのコミック画像データから、該コミック画像データにおける、少なくともコマ割された各コマの形状及び各コマの位置の情報を含むコマ割に係る情報であるコマ割情報を抽出するコマ割情報抽出手段、
前記Ｗｅｂサイトから画像データを取得する画像データ取得手段、
前記画像データ取得手段で取得した画像データと前記コマ割情報抽出手段で抽出したコマ割情報が記憶されたコマ割情報記憶手段に記憶されているコマ割情報とに基づき、前記取得した画像データと前記コマ割情報とのマッチングを行うマッチング手段、及び、
前記マッチング手段のマッチング結果に基づく前記取得した画像データと前記コミック画像データとの類似度に基づき、前記取得した画像データから前記コミック画像データと一致又は類似する画像データを検出する検出手段として実現される機能をコンピュータに実行させるためのプログラムを含み、
前記コマ割情報抽出手段は、前記コミック画像データを、該コミック画像データの画像に含まれるエッジ成分の分布を示す画像データであるエッジ画像データに変換し、該エッジ画像データから、前記コマ割情報として、コマ割された各コマの外縁部分に対応するエッジ成分のみが描画された画像データであるコマ割画像データを抽出すると共に、アスペクト比を保持したままで画像サイズを変更して構成される、画像サイズの異なる複数のコマ割画像データを生成することを特徴とするコミック画像データ検出プログラム。
Ｗｅｂサイト上に存在する画像データから、検出対象のコミックにおける予め設定されたページを画像データ化したデータであるコミック画像データと一致又は類似する画像データを検出するコミック画像データ検出プログラムであって、
前記検出対象のコミックのコミック画像データから、該コミック画像データにおける、少なくともコマ割された各コマの形状及び各コマの位置の情報を含むコマ割に係る情報であるコマ割情報を抽出するコマ割情報抽出手段、
前記Ｗｅｂサイトから画像データを取得する画像データ取得手段、
前記画像データ取得手段で取得した画像データと前記コマ割情報抽出手段で抽出したコマ割情報が記憶されたコマ割情報記憶手段に記憶されているコマ割情報とに基づき、前記取得した画像データと前記コマ割情報とのマッチングを行うマッチング手段、及び、
前記マッチング手段のマッチング結果に基づく前記取得した画像データと前記コミック画像データとの類似度に基づき、前記取得した画像データから前記コミック画像データと一致又は類似する画像データを検出する検出手段として実現される機能をコンピュータに実行させるためのプログラムを含み、
前記検出手段は、Ｗｅｂサイト毎に、前記一致又は類似する画像データとして検出された画像データに基づき、検出された画像データが予め設定されたページ数以上のコミック画像データを含むか否かを判定し、含むと判定すると、当該画像データを違法に公開された可能性のあるコミック画像データとして検出するようになっており、
前記検出手段で検出された、違法に公開された可能性のあるコミック画像データと、該画像データを公開しているＷｅｂサイトの情報とを対応付けて記憶するサイト情報記憶手段として実現される機能をコンピュータに実行させるためのプログラムを含むことを特徴とするコミック画像データ検出プログラム。