JP2013543178A - 出版物のフィンガープリント抽出方法、出版物のフィンガープリント抽出装置、フィンガープリントを利用した出版物識別システム及びフィンガープリントを利用した出版物識別方法 - Google Patents
出版物のフィンガープリント抽出方法、出版物のフィンガープリント抽出装置、フィンガープリントを利用した出版物識別システム及びフィンガープリントを利用した出版物識別方法 Download PDFInfo
- Publication number
- JP2013543178A JP2013543178A JP2013533773A JP2013533773A JP2013543178A JP 2013543178 A JP2013543178 A JP 2013543178A JP 2013533773 A JP2013533773 A JP 2013533773A JP 2013533773 A JP2013533773 A JP 2013533773A JP 2013543178 A JP2013543178 A JP 2013543178A
- Authority
- JP
- Japan
- Prior art keywords
- publication
- fingerprint
- text
- electronic document
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 73
- 239000000284 extract Substances 0.000 claims abstract description 25
- 238000012795 verification Methods 0.000 claims abstract description 12
- 238000007781 pre-processing Methods 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 8
- 238000000926 separation method Methods 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 17
- 238000012015 optical character recognition Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 5
- 238000004806 packaging method and process Methods 0.000 description 3
- 241000556720 Manga Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/10—Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Technology Law (AREA)
- Multimedia (AREA)
- Storage Device Security (AREA)
- Editing Of Facsimile Originals (AREA)
- Collating Specific Patterns (AREA)
Abstract
著作権侵害有無を容易に識別することができ、著作権を効果的に保護することができる出版物のフィンガープリント抽出方法、出版物のフィンガープリント抽出装置、フィンガープリントを利用した出版物識別システム及びフィンガープリントを利用した出版物識別方法が開示される。フィンガープリントを利用した出版物識別システムは、著作権侵害を識別するために収集された質疑出版物に対するフィンガープリントを抽出するフィンガープリント抽出装置と、フィンガープリント抽出装置から提供された質疑出版物に対するフィンガープリントに該当する原本出版物のフィンガープリントを質疑するフィンガープリント質疑装置と、原本出版物から抽出されたフィンガープリント及び原本出版物の付加情報が格納され、フィンガープリント質疑装置の質疑に相当して少なくとも1つの原本出版物のフィンガープリントで構成された検索結果候補群を提供するDBMSと、DBMSから提供された検索結果候補群を検証し、質疑出版物の著作権侵害有無を判断する候補群検証装置とを含む。したがって、出版物の著作権侵害有無を容易に識別することができ、これにより、著作権侵害を予防することができる。
Description
本発明は、コンテンツ識別に関し、より詳細には、出版物のフィンガープリント抽出方法、出版物のフィンガープリント抽出装置、フィンガープリントを利用した出版物識別システム及びフィンガープリントを利用した出版物識別方法に関する。
テキスト及びイメージを含むコンテンツまたはデジタル化された出版物は、容易に複製され、インターネットやP2Pなどの多様な経路を通じて不法的に流布されている。このように不法流布されたコンテンツは、著作者に直接的に経済的損失を加えるだけでなく、間接的には著作者の創作意欲を低下させる主要原因になっている。
コンテンツの不法流通を防止し、著作権を保護するために、従来、コンテンツの販売または購買時に、認証された環境下でコンテンツ購買行為が行われるようにコンテンツをパッケージング及び暗号化するDRM(Digital Rights Management)技術、コンテンツがハードディスクに格納されないようにするかまたはプリントされないように制限を設けるDPP(Digital Property Protection)技術、コンテンツ内に販売者またはコンテンツ著作権者の情報を目立たないように挿入するウォーターマーキング(watermarking)技術などが使用されてきた。
図1は、DRMなどの保護装置が適用された一般的なコンテンツ保護方法を概略的に示す図である。
図1を参照すれば、コンテンツ提供者(Contents Providers)は、原本コンテンツと暗号化キーを利用してコンテンツを暗号化及びパッケージングした後、これを提供し、ユーザは、当該DRMサーバーに接続して購買認証手続を行うことによって、当該コンテンツを適法に購買する場合にのみ暗号を解読することができるキーと当該コンテンツを使用することができる使用許可(license)を受けることができ、これにより、当該コンテンツを再生することができるようになる。
図1を参照すれば、コンテンツ提供者(Contents Providers)は、原本コンテンツと暗号化キーを利用してコンテンツを暗号化及びパッケージングした後、これを提供し、ユーザは、当該DRMサーバーに接続して購買認証手続を行うことによって、当該コンテンツを適法に購買する場合にのみ暗号を解読することができるキーと当該コンテンツを使用することができる使用許可(license)を受けることができ、これにより、当該コンテンツを再生することができるようになる。
図1に示されたように、従来、コンテンツ提供者がDRMなどの暗号化及びパッケージング方式の保護方法を適用してコンテンツ製作者の権利を保護して来、従来の著作権保護方法は、前述した方法の変形された形態で発展及び継勝されて来た。
従来の著作権保護方法は、暗号化あるいはパッケージング方式を利用してコンテンツの著作権を保護するようになる。しかし、暗号化されたコンテンツの暗号を解読するか、またはパッケージングされたコンテンツのパッケージングを解く場合には、コンテンツが不法で流布されることができる。例えば、特定電子本リーダー装置に適用されたDRMがハッキングされ、前記電子本リーダー装置用電子出版物が無断で不法流布された事例がある。
また、最近、デジタルカメラ、スキャナ、コンピュータなどの技術発展及びイメージ処理技術の発展に伴い、アナログまたはデジタル出版物の複製がさらに容易で、精巧になっており、これにより、ユーザがアナログ出版物またはデジタル化された出版物から不法流出を目的にデジタルファイルを生成し、これを配布する場合、不法流通可否または著作権侵害有無を判断することがさらに難しくなっている。
したがって、従来のコンテンツ保護技術によって保護機能が適用されたコンテンツまたは出版物が悪意的なユーザによって保護機能が解除された場合にも、コンテンツ識別技術を利用して出版物の著作権侵害有無及び不法流通可否を判断することができ、著作権を効果的に保護することができる方法が必要である。
前述したような短所を克服するための本発明の目的は、著作権侵害有無を判別し、著作権を効果的に保護することができるように出版物を容易に識別することができる出版物のフィンガープリント抽出方法を提供することにある。
また、本発明の他の目的は、前記出版物のフィンガープリント抽出方法を行うフィンガープリント抽出装置を提供することにある。
また、本発明のさらに他の目的は、出版物を容易に識別することができ、著作権を効果的に保護することができるフィンガープリントを利用した出版物識別システムを提供することにある。
また、本発明のさらに他の目的は、前記フィンガープリントを利用した出版物識別システムの動作方法を提供することにある。
前述した本発明の目的を達成するために、本発明の一態様によるフィンガープリント抽出方法は、入力されたテキスト形式の電子文書からテキストを抽出する段階と、前記抽出されたテキストからテキストフィンガープリントを抽出する段階とを含む。
前記入力されたテキスト形式の電子文書からテキストを抽出する段階は、前記入力されたテキスト形式の電子文書に対して前処理を行った後、前記入力されたテキスト形式の電子文書からテキストを抽出することができる。
前記入力されたテキスト形式の電子文書に対する前処理は、誤打訂正または文字復元を含むことができる。
また、本発明の目的を達成するために、本発明の他の態様によるフィンガープリント抽出方法は、イメージ形態の電子文書が入力される段階と、入力された前記イメージ形態の電子文書がテキスト基盤電子文書である場合、前記入力されたイメージ形態の電子文書をテキスト形態の電子文書に変換する段階と、前記変換されたテキスト形態の電子文書からテキストを抽出する段階と、前記抽出されたテキストからテキストフィンガープリントを抽出する段階とを含む。
前記イメージ形態の電子文書が入力される段階は、前記イメージ形態の電子文書が入力された後、前記イメージ形態の電子文書に対する前処理を行う段階を含むことができる。
前記イメージ形態の電子文書に対する前処理を行う段階は、前記イメージ形態の電子文書に含まれた雑音除去、ページ分離、イメージ回転及びイメージの勾配調整のうち少なくとも1つの処理を行うことができる。
前記出版物のフィンガープリント抽出方法は、前記入力された前記イメージ形態の電子文書がイメージ基盤電子文書である場合には、前記入力されたイメージ形態の電子文書に対する前処理を行う段階と、前記前処理が行われたイメージ形態の電子文書からイメージフィンガープリントを抽出する段階とをさらに含むことができる。
また、本発明の他の目的を達成するために、本発明の一態様によるフィンガープリント抽出装置は、入力されたイメージ形態の電子文書をテキスト形態の電子文書に変換するイメージテキスト変換部と、前記テキスト形態の電子文書からテキストを抽出するテキスト抽出部と、前記抽出されたテキストからテキストフィンガープリントを抽出するフィンガープリント抽出部とを含む。
前記出版物のフィンガープリント抽出装置は、前記入力されたイメージ形態の電子文書に含まれた雑音除去、ページ分離、イメージ回転及びイメージの勾配調整のうち少なくとも1つの処理を行うイメージ前処理部をさらに含むことができる。
前記フィンガープリント抽出部は、前記イメージ前処理部から提供された前処理されたイメージからイメージフィンガープリントを抽出することができる。
前記出版物のフィンガープリント抽出装置は、前記イメージテキスト変換部から提供された前記テキスト形態の電子文書または入力されたテキスト形態の電子文書に対して前処理を行った後、前記テキスト抽出部に提供するテキスト前処理部をさらに含むことができる。
また、本発明のさらに他の目的を達成するために、本発明の一態様によるフィンガープリントを利用した出版物識別システムは、原本出版物のフィンガープリントを抽出するフィンガープリント抽出装置と、前記フィンガープリント抽出装置から提供された原本出版物のフィンガープリントと前記原本出版物の付加情報を連携して格納する出版物情報構築装置と、前記原本出版物から抽出されたフィンガープリント及び前記原本出版物の付加情報が格納されるDBMS(DataBase Management System)とを含む。
前記フィンガープリント抽出装置は、前記原本出版物または質疑出版物がテキスト形式の電子文書である場合には、前記テキスト形式の電子文書からテキストを抽出した後、抽出されたテキストからテキストフィンガープリントを抽出し、前記原本出版物または前記質疑出版物がイメージ形態の電子文書である場合には、イメージ形態の電子文書をテキスト形態の電子文書に変換した後、変換されたテキスト形態の電子文書からテキストを抽出し、抽出されたテキストからテキストフィンガープリントを抽出することができる。
前記フィンガープリント抽出装置は、前記原本出版物または前記質疑出版物がイメージ形態の電子文書である場合には、前記イメージ形態の電子文書に対する前処理を行った後、前処理が行われたイメージ形態の電子文書からイメージフィンガープリントを抽出することができる。
前記原本出版物の付加情報は、原本出版物の製作者、出版社、題目、要約、発行日、ISBN、住所、電話番号及びファックス番号のうち少なくとも1つの情報を含むことができる。
また、本発明のさらに他の目的を達成するために、本発明の他の態様によるフィンガープリントを利用した出版物識別システムは、識別するために収集された質疑出版物に対するフィンガープリントを抽出するフィンガープリント抽出装置と、前記フィンガープリント抽出装置から提供された前記質疑出版物に対するフィンガープリントに該当する原本出版物のフィンガープリントを質疑するフィンガープリント質疑装置と、原本出版物から抽出されたフィンガープリント及び前記原本出版物の付加情報が格納され、前記フィンガープリント質疑装置の質疑に相当して少なくとも1つの原本出版物のフィンガープリントで構成された検索結果候補群を提供するDBMS(DataBase Management System)と、前記DBMSから提供された検索結果候補群を検証し、前記質疑出版物の著作権侵害有無を判断する候補群検証装置とを含む。
前記候補群検証装置は、前記検索結果候補群と前記質疑出版物のフィンガープリントを比較し、比較結果に基づいて前記質疑出版物を識別することができる。
前記候補群検証装置は、前記質疑出版物がDBMS内部に存在する出版物として判断される場合、前記質疑出版物に該当する付加情報を前記DBMSから獲得して提供することができる。
また、本発明のさらに他の目的を達成するために、本発明の一態様によるフィンガープリントを利用した出版物識別方法は、収集された質疑出版物に対するフィンガープリントを抽出する段階と、前記収集された質疑出版物から抽出されたフィンガープリントと対応する原本出版物のフィンガープリントをDBMSから検索する段階と、少なくとも1つの検索結果に基づいて前記収集された質疑出版物の著作権侵害有無を識別する段階とを含む。
前記少なくとも1つの検索結果に基づいて前記収集された質疑出版物を識別する段階は、前記少なくとも1つの検索結果を前記質疑出版物のフィンガープリントと比較した比較結果に基づいて前記質疑出版物を識別することができる。
前記フィンガープリントを利用した出版物識別方法は、前記収集された質疑出版物を識別した結果、前記質疑出版物が原本出版物と同一であると判別される場合、前記DBMSから前記質疑出版物に対応する付加情報を獲得する段階をさらに含むことができる。
前述したような出版物のフィンガープリント抽出方法、出版物のフィンガープリント抽出装置、フィンガープリントを利用した出版物識別システム及びフィンガープリントを利用した出版物識別方法によれば、原本出版物を利用してフィンガープリントを抽出し、出版物のメタデータ情報と連携して管理し、質疑出版物のフィンガープリントを抽出し、未知の出版物の情報を識別することができる。また、識別された出版物の情報を活用して出版物の不法流布可否または著作権侵害有無を判断する。
したがって、出版物を直接タイピングするかスキャンするか、またはカメラでキャップチャしてデジタル化された出版物に変形された場合またはDRMなどの各種保護装置が解除されるかシステム管理者が接近権限を利用して原本に準するデジタル出版物に変形して不法流布する場合にも、これを容易に識別することができ、これにより、出版物の不法流布や流通を減少させ、著作権の侵害を予防することができる。
また、本発明の一実施例によるフィンガープリントを利用した出版物識別システムは、出版物の一部情報(例えば、数ページ程度の出版物)を入力し、本来出版物の情報を検索する用途に活用されることもできる。
本発明は、多様な変更を行うことができ、さまざまな実施例を有することができるところ、特定の実施例を図面に例示し、詳細に説明する。
しかし、これは、本発明を特定の実施形態に限定しようとするものではなく、本発明の思想及び技術範囲に含まれるすべての変更、均等物ないし代替物を含むものと理解しなければならない。
本出願において使用した用語は、ただ特定の実施例を説明するために使用されたもので、本発明を限定しようとする意図ではない。単数の表現は、文脈上明白に異なって意味しない限り、複数の表現を含む。本出願において、“含む”または“有する”などの用語は、明細書上に記載した特徴、数字、段階、動作、構成要素、部品またはこれらを組み合わせたものが存在することを指定しようとするものであって、1つまたはそれ以上の他の特徴や数字、段階、動作、構成要素、部品またはこれらを組み合わせたものなどの存在または付加可能性をあらかじめ排除しないものと理解しなければならない。
異なって定義されない限り、技術的または科学的な用語を含んでここで使用されるすべての用語は、本発明の属する技術分野における通常の知識を有する者によって一般的に理解されるものと同一の意味を有している。一般的に使用される辞書に定義されているもののような用語は、関連技術の文脈上有する意味と一致する意味を有するものと解釈しなければならないし、本出願において明白に定義しない限り、理想的または過度に形式的な意味に解釈されない。
以下、添付の図面を参照して、本発明の好ましい実施例をさらに詳細に説明する。本発明を説明するにあたって、全体的な理解を容易にするために、図面上の同一の構成要素については、同一の参照符号を使用し、同一の構成要素について重複説明を省略する。
出版物を不法配布するためのデジタル化方法は、大きく4つに区分することができる。
第一に、出版物製作者が出版物を格納した格納媒体を紛失するか、または管理をおろそかにした場合、出版社にデジタルファイル形態で提供された出版物ファイルが流出された場合またはDRMが解除されてファイルが流出された場合などにより原本コンテンツ自体が流出される場合である。
第一に、出版物製作者が出版物を格納した格納媒体を紛失するか、または管理をおろそかにした場合、出版社にデジタルファイル形態で提供された出版物ファイルが流出された場合またはDRMが解除されてファイルが流出された場合などにより原本コンテンツ自体が流出される場合である。
第二に、本などの形態で印刷した出版物をユーザが直接タイピングしてデジタル化した場合である。このような場合には、印刷した出版物が電子文書形態に変換されるので、大量印刷などを通じて良い品質の海賊版出版物が量産されることができる。
第三に、小説、雑誌またはマンガ本などの形態で印刷した出版物をユーザがスキャナにスキャンしてデジタル化した場合である。ここで、ユーザは、印刷した出版物を分解し、スキャナの自動入力装置を使用するか、自動で出版物をめくる装置を使用するか、手で直接出版物をめくりながら印刷した出版物をスキャンしてイメージ形態で格納することによって、出版物をデジタル化することができる。
第四に、印刷された出版物をユーザがカメラを利用してキャップチャしてデジタル化する場合である。このような場合、デジタル化されたファイルはイメージ形態で格納され、キャップチャするユーザの熟練度によって品質の差異が発生することができる。
したがって、前述したような出版物を不法配布するための4つのデジタル化方法に対応する著作権保護技術が要求される。
図2は、出版物の著作権保護のための技術の例を示すものである。
図2に示されたように、出版物の著作権を保護するための技術は、大きく3つに分類することができる。
図2に示されたように、出版物の著作権を保護するための技術は、大きく3つに分類することができる。
まず、出版物で読者に情報を提供する手段は、大きく、テキストとイメージがある。テキストは、小説冊などの出版物において情報を伝達する主要手段であり、イメージは、雑誌やマンガ本などの出版物において情報を伝達する主要手段になる。
前述した出版物を不法配布するためのデジタル化方法のうち第一及び第二の方法は、テキスト基盤の電子文書形態でデジタル化する方法なので、電子文書形態でテキストフィンガープリント基盤の出版物識別技術が必要である。
また、前述した出版物を不法配布するためのデジタル方法のうち第三及び第四方法は、イメージ形態で出版物がデジタル化される。ここで、イメージ形態でデジタル化された出版物が小説冊などのようにテキスト基盤出版物である場合には、イメージファイル形態でテキストフィンガープリント基盤の出版物識別技術が必要であり、イメージ形態でデジタル化された出版物が雑誌やマンガ本などのようにイメージ基盤出版物である場合には、イメージファイル形態でイメージフィンガープリント基盤の出版物識別技術が必要である。ここで、フィンガープリントというのは、当該コンテンツあるいは出版物の固有な特徴情報を示すもので、特徴点あるいはDNAと呼ばれたりする。
図3は、電子文書形態でテキストフィンガープリントを抽出する方法を示す流れ図である。
以下、本発明の実施例において電子文書形態というのは、コンピュータなどを含む情報処理装置で多様な文書作成プログラムを利用して作成されてテキスト形式で格納された文書ファイル(例えば、TXT、ハングルファイル、ワードファイル、テキスト形式で格納されたPDFファイル)を指称する。
以下、本発明の実施例において電子文書形態というのは、コンピュータなどを含む情報処理装置で多様な文書作成プログラムを利用して作成されてテキスト形式で格納された文書ファイル(例えば、TXT、ハングルファイル、ワードファイル、テキスト形式で格納されたPDFファイル)を指称する。
まず、フィンガープリント抽出装置にテキスト文書が入力されれば(段階310)、フィンガープリント抽出装置は、入力されたテキスト文書からテキスト抽出が円滑に行われるようにするために、テキスト前処理を行う(段階320)。ここで、入力されるテキスト文書は、前述したように、多様な文書作成プログラムを利用して作成された電子文書になることができる。また、前記テキスト前処理過程は、誤打訂正やエラーに起因して非正常的な形態を有する文字を復元する処理過程などを含むことができ、必ず行われる必要はなく、必要な場合にのみ選択的に行われることができる。
その後、フィンガープリント抽出装置は、フィンガープリント抽出のためにテキスト前処理を経たテキスト文書に対して出版物の情報伝達手段であるテキストのみを抽出する(段階330)。
フィンガープリント抽出装置は、段階330の実行を通じて抽出されたテキストに対してフィンガープリントを抽出することによって、テキスト基盤電子文書形態の出版物に対するフィンガープリントを抽出する(段階340)。
フィンガープリント抽出装置は、段階330の実行を通じて抽出されたテキストに対してフィンガープリントを抽出することによって、テキスト基盤電子文書形態の出版物に対するフィンガープリントを抽出する(段階340)。
図4は、イメージ形態の出版物でテキストフィンガープリントを抽出する方法を示す流れ図である。
まず、フィンガープリント抽出装置にスキャナでスキャンされるか、またはカメラでキャップチャされたイメージファイル形態の文書が入力されれば(段階410)、フィンガープリント抽出装置は、入力されたイメージファイル形態の文書に対してOCR(Optical Character Recognition)性能を向上させることができるようにイメージ前処理を行う(段階420)。ここで、イメージファイル形態は、商用イメージビューアーを通じて表示されることができる形態のイメージファイルを意味し、イメージ前処理は、イメージ形態の文書に対してOCRを適用する場合、テキスト認識性能を低下させることができる要素を処理する過程であって、雑音除去、ページ分離、回転、勾配調整などの処理過程を含むことができる。
まず、フィンガープリント抽出装置にスキャナでスキャンされるか、またはカメラでキャップチャされたイメージファイル形態の文書が入力されれば(段階410)、フィンガープリント抽出装置は、入力されたイメージファイル形態の文書に対してOCR(Optical Character Recognition)性能を向上させることができるようにイメージ前処理を行う(段階420)。ここで、イメージファイル形態は、商用イメージビューアーを通じて表示されることができる形態のイメージファイルを意味し、イメージ前処理は、イメージ形態の文書に対してOCRを適用する場合、テキスト認識性能を低下させることができる要素を処理する過程であって、雑音除去、ページ分離、回転、勾配調整などの処理過程を含むことができる。
その後、フィンガープリント抽出装置は、前処理が行われたイメージファイル形態の文書に対してOCRを行い、イメージファイル形態の文書をテキスト形態の電子文書形態に変換する(段階430)。ここで、OCRを通じてテキストに変換された電子文書には、OCR性能の限界として誤認識された非正常的な形態の文字(または雑音)が含まれることができるので、これを除去するための処理過程が必要である。
したがって、フィンガープリント抽出装置は、段階430の実行を通じて変換されたテキスト形態の電子文書に対して前述したような非正常的な形態の文字または雑音を除去するための前処理過程を行う(段階440)。
その後、フィンガープリント抽出装置は、前処理されたテキスト形態の電子文書でテキストを抽出し(段階450)、抽出したテキストに対してテキストフィンガープリントを抽出する(段階460)。
段階440〜段階460のテキスト前処理過程、テキスト抽出過程及びテキストフィンガープリント抽出過程は、段階430で行われたOCRの認識アルゴリズム及び性能に相当して行われることが好ましい。
すなわち、図3に示した段階320〜段階340は、図4に示した段階440〜段階460とそれぞれ同一の機能を行うが、図3に示したフィンガープリント抽出過程は、比較的雑音が少ないテキスト形態の電子文書に対してフィンガープリントを抽出するのに対し、図4に示したフィンガープリント抽出過程では、入力されたイメージファイル形態の文書をOCRを経てテキスト形態の電子文書に変換した後、フィンガープリントを抽出するので、OCRの認識性能によって変換された電子文書に雑音が含まれる確率が大きくなる。
したがって、図4に示されたフィンガープリント抽出方法を行うフィンガープリント抽出装置は、図3に示されたフィンガープリント抽出方法を行うフィンガープリント抽出装置より雑音にさらに強靭なフィンガープリント抽出装置が使用されることが好ましく、図4に示されたフィンガープリント抽出方法を行うフィンガープリント抽出装置が雑音に強靭な装置が使用される場合、図3に示されたフィンガープリント抽出過程は、図4に含まれることができる。
図5は、イメージ形態の出版物でイメージフィンガープリントを抽出する方法を示す流れ図である。
前述したように、雑誌やマンガ本などの出版物では、イメージが情報を伝達する主要手段になる。したがって、前述したように情報を伝達する手段としてイメージが使用される出版物に対しては、著作権保護のためにイメージフィンガープリントを抽出する。
前述したように、雑誌やマンガ本などの出版物では、イメージが情報を伝達する主要手段になる。したがって、前述したように情報を伝達する手段としてイメージが使用される出版物に対しては、著作権保護のためにイメージフィンガープリントを抽出する。
図5を参照すれば、まず、フィンガープリント抽出装置は、スキャナを通じてスキャンされるかまたはカメラを通じてキャップチャされたイメージ形態の文書が入力されれば(段階510)、入力されたイメージ形態の文書でフィンガープリントを効果的に抽出することができるように前処理を行う(段階520)。ここで、前処理過程は、イメージフィンガープリント抽出を邪魔することができる要素を除去する過程を含み、例えば、雑音除去、ページ分離、回転、勾配調整などの処理を含むことができる。
その後、フィンガープリント抽出装置は、前処理されたイメージからイメージフィンガープリントを抽出する(段階530)。
図6は、本発明の一実施例による出版物のフィンガープリンティング抽出方法を示す流れ図であって、前述した図2〜図5の内容を総合したものである。
図6を参照すれば、まず、フィンガープリント抽出のためのデジタル化された出版物がフィンガープリント抽出装置に入力されれば、フィンガープリント抽出装置は、入力されたデジタル化された出版物がイメージファイルであるかまたはテキストファイルであるかを判断し(段階610)、イメージファイルである場合には、イメージに対する前処理を行う(段階620)。ここで、イメージ前処理は、イメージ形態の文書に対してOCRを適用する場合、テキスト認識性能を低下させることができる要素またはイメージフィンガープリント抽出を邪魔することができる要素を除去する過程であって、雑音除去、ページ分離、回転、勾配調整などの処理過程を含むことができる。
その後、フィンガープリント抽出装置は、前処理されたイメージがイメージ形態のテキストであるかを判断し(段階630)、イメージ形態のテキストとして判断される場合には、OCRを行い、イメージ形態のテキストをテキスト形態の電子文書に変換する(段階640)。ここで、OCRを通じてテキストに変換された電子文書には、OCR過程で認識性能の限界として誤認識された非正常的な形態の文字(または雑音)が含まれることができるので、これを除去するための処理過程が必要である。
フィンガープリント抽出装置は、段階640の実行を通じて変換されたテキスト形態の電子文書に対して前述したような非正常的な形態の文字または雑音を除去するためのテキスト前処理過程を行う(段階650)。
その後、フィンガープリント抽出装置は、前処理されたテキスト形態の電子文書でテキストを抽出し(段階660)、抽出したテキストに対してテキストフィンガープリントを抽出する(段階670)。
または、図6の段階610で、判断結果入力されたデジタル化された出版物がテキスト文書であると判断されれば、フィンガープリント抽出装置は、段階620〜640を行うことなく、段階650に進行し、段階650〜段階670を順次に行う。
また、図6の段階630で前処理されたイメージがイメージ形態のテキストではなく、雑誌やマンガなどのようなイメージである場合、フィンガープリント抽出装置は、段階640〜670を行うことなく、段階680に進行し、前処理されたイメージからイメージフィンガープリントを抽出する(段階680)。
図7は、本発明の一実施例による出版物のフィンガープリント抽出装置の構成を示すブロック図である。
図7を参照すれば、本発明の一実施例によるフィンガープリント抽出装置700は、制御部710、イメージ前処理部720、イメージ−テキスト変換部730、テキスト前処理部740、テキスト抽出部750及びフィンガープリント抽出部760を含むことができる。
制御部710は、入力されたデジタル化された出版物の種類を判断し、判断結果によって入力されたデジタル化された出版物をイメージ前処理部720またはテキスト前処理部740に提供する。
例えば、制御部710は、入力された出版物がスキャナでスキャンされるか、またはカメラでキャップチャされたイメージ形態の電子文書である場合には、イメージ前処理部に提供し、入力された出版物がテキスト形態の電子文書である場合には、テキスト前処理部740に提供する。
また、制御部710は、前述した機能以外にも、フィンガープリント抽出装置を構成する他の構成要素の動作を制御することができる。
イメージ前処理部720は、制御部710から提供されたイメージ形態の電子文書に対してOCRの認識性能を向上させることができるように、雑音除去、ページ分離、回転、勾配調整などの前処理を行った後、前処理が行われたイメージの種類を判断し、前処理が行われたイメージがテキストで構成されたイメージ形態の電子文書である場合には、イメージ−テキスト変換部730に提供し、前処理が行われたイメージが雑誌またはマンガなどのようにイメージで構成された場合には、フィンガープリント抽出部760に提供する。
イメージ−テキスト変換部730は、OCRで構成されることができ、イメージ前処理部720から提供された前処理されたイメージをテキスト形態の電子文書に変換した後、変換されたテキスト形態の電子文書をテキスト抽出部750に提供する。
テキスト前処理部740は、テキスト前処理部740または制御部710から提供されたテキスト形態の電子文書に対して非正常的な形態の文字または雑音を除去するための前処理過程を行った後、前処理されたテキスト形態の電子文書をテキスト抽出部750に提供する。
テキスト抽出部750は、テキスト前処理部740から前処理されたテキスト形態の電子文書を提供され、提供された電子文書から出版物の情報伝達手段であるテキストを抽出した後、フィンガープリント抽出部760に提供する。
フィンガープリント抽出部760は、イメージ前処理部720から提供された前処理されたイメージでイメージフィンガープリントを抽出するか、またはテキスト抽出部750から提供されたテキストでテキストフィンガープリントを抽出する。ここで、フィンガープリント抽出部720は、公知されたフィンガープリント抽出技術を利用してイメージまたはテキストからフィンガープリントを抽出することができる。
具体的に、フィンガープリント抽出部760は、イメージフィンガープリント抽出モジュール761及びテキストフィンガープリント抽出モジュール763を含むことができ、イメージフィンガープリント抽出モジュール761は、イメージ前処理部720から提供された前処理されたイメージでイメージフィンガープリントを抽出し、テキストフィンガープリント抽出モジュール763は、テキスト抽出部750から提供されたテキストでフィンガープリントを抽出する。
図6及び図7に示された本発明の一実施例による出版物のフィンガープリント抽出方法及び装置は、原本出版物のフィンガープリントを抽出するために使用されることもでき、インターネットを通じて検索されるか、または収集された不法流布された出版物のフィンガープリントを抽出するために使用されることもでき、情報を知りたい任意の出版物のフィンガープリントを抽出するために使用されることもできる。また、本発明の一実施例による出版物のフィンガープリント抽出方法及び装置は、質疑出版物のフィンガープリントを抽出する用途に使用されることもできる。
図8は、本発明の一実施例による出版物識別システムの構成を示すブロック図であって、出版物著作権者または出版物提供者から著作権の保護のために出版物の原本が提供された場合、出版物のフィンガープリントを利用してデータベースを構築するシステムを例示して図示した。
図8を参照すれば、本発明の一実施例による出版物識別システムは、フィンガープリント抽出装置700、出版物情報構築装置810及びDBMS(DataBase Management System)830を含むことができる。
フィンガープリント抽出装置700は、図7に示されたものと同一の構成を有し、図6に示されたフィンガープリント抽出方法を実行し、原本出版物のフィンガープリントを抽出した後、抽出された原本出版物のフィンガープリントを出版物情報構築装置810に提供する。
出版物情報構築装置810は、フィンガープリント抽出装置700から原本出版物のフィンガープリントを提供され、出版物著作権者または出版物提供者から原本出版物の情報を提供された後、原本出版物のフィンガープリントと原本出版物の情報を連携させてDBMS 830に提供し、これを管理する。ここで、原本出版物の情報は、原本出版物の製作者、出版社、題目、要約、発行日、ISBN(International Standard Book Number)、住所、電話番号、ファックス番号などの原本出版物と関連した多様な情報を含むことができる。
また、出版物情報構築装置810は、出版物の管理のために原本出版物をDBMS 830に格納することもでき、保安が要求される場合、出版物の全体または一部を暗号化し、DBMS 830に格納することもできる。
DBMS 830は、出版物情報構築装置810から提供された原本出版物のフィンガープリント及びこれと連携された出版物情報を格納する。また、DBMS 830は、出版物情報構築装置810の提供によって原本出版物を格納することもできる。
図9は、本発明の他の実施例による出版物識別システムの構成を示すブロック図である。
デジタル出版物のファイルまたはデジタル化された出版物ファイルは、インターネットなどを通じて容易に流布することができる。例えば、出版物ファイルは、P2P、トレント、ウェブハード、カフェー、ブログなどのように多様なインターネット経路を通じて流布されることができる。また、デジタルファイルの特性によってデジタル出版物またはデジタル化された出版物は、コピー及び移動が容易なので、携帯用格納装置や携帯用端末などを通じて流布されることができる。
デジタル出版物のファイルまたはデジタル化された出版物ファイルは、インターネットなどを通じて容易に流布することができる。例えば、出版物ファイルは、P2P、トレント、ウェブハード、カフェー、ブログなどのように多様なインターネット経路を通じて流布されることができる。また、デジタルファイルの特性によってデジタル出版物またはデジタル化された出版物は、コピー及び移動が容易なので、携帯用格納装置や携帯用端末などを通じて流布されることができる。
図9に示された本発明の他の実施例による出版物識別システムは、前述したように、多様な経路を通じて不法流布された出版物または著作権侵害出版物を識別するか、または知りたい出版物を識別するために使用される。
図9を参照すれば、本発明の一実施例による出版物識別システムは、フィンガープリント抽出装置700、フィンガープリント質疑装置820、DBMS 830及び候補群検証装置840を含むことができる。
フィンガープリント抽出装置700は、図7に示されたものと同一の構成を有し、図6に示されたフィンガープリント抽出方法を行う。フィンガープリント抽出装置700は、出版物の不法流通または著作権侵害有無を識別するために多様な経路を通じて検索及び収集された質疑出版物のフィンガープリントを抽出した後、抽出されたフィンガープリントをフィンガープリント質疑装置820に提供する。
フィンガープリント質疑装置820は、フィンガープリント抽出装置700から提供された質疑出版物のフィンガープリントをDBMS 830に質疑する。また、フィンガープリント質疑装置820は、フィンガープリント抽出装置700から提供された質疑出版物のフィンガープリントを候補群検証装置840に提供する。
DBMS 830は、フィンガープリント質疑装置820から質疑出版物のフィンガープリントを提供され、これに対応するフィンガープリントをデータベースで検索した後、検索された少なくとも1つの検索結果候補群を候補群検証装置840に提供する。ここで、前記検索結果候補群は、前記質疑出版物のフィンガープリントと類似する少なくとも1つの原本出版物のフィンガープリント及び当該出版物の情報を含むことができる。
候補群検証装置840は、DBMS 830から提供された検索結果候補群を検証し、質疑出版物の不法流布または著作権侵害有無を判別する。
例えば、候補群検証装置840は、DBMS 830から提供された検索結果候補群とフィンガープリント質疑装置820から提供された質疑出版物のフィンガープリントを比較し、質疑出版物の不法流布または著作権侵害有無を判別することができる。また、候補群検証装置840は、不法流布または著作権が侵害された出版物の情報をDBMS 830から獲得し、当該機関または管理者に提供することもできる。
図8及び図9に示された出版物識別システムにおいてフィンガープリント抽出装置は、出版物のフィンガープリントを抽出するために多い処理時間を要求するので、システムの負荷を減少させるためにクラウドコンピューティング概念を利用してフィンガープリント抽出装置を分散させて構成することができる。また、出版物識別システムの性能を向上させ、全体的な負荷を減少させるために、ハッシュなどの技術を利用して一度検索されたファイルは別に処理し、さらに検索する過程を防止する技術を利用することもできる。
図10は、本発明の一実施例による出版物識別システムの出版物識別方法を示す流れ図である。
図10を参照すれば、まず、出版物識別システムは、不法流通されるか、または著作権を侵害するものと疑心される出版物を質疑出版物として検索及び収集し(段階1010)、収集された質疑出版物のフィンガープリントを抽出する(段階1020)。
図10を参照すれば、まず、出版物識別システムは、不法流通されるか、または著作権を侵害するものと疑心される出版物を質疑出版物として検索及び収集し(段階1010)、収集された質疑出版物のフィンガープリントを抽出する(段階1020)。
その後、出版物識別システムは、抽出されたフィンガープリントに対応する出版物をDBMSに質疑し(段階1030)、DBMSから当該検索結果候補群を獲得する(段階1040)。ここで、DBMSから獲得した検索結果候補群は、質疑出版物のフィンガープリントに対応する少なくとも1つの出版物のフィンガープリントを含むことができる。
その後、出版物識別システムは、獲得した検索結果候補群に対する検証を行い、不法流布(または流通)されるか、著作権が侵害されたものと判断される当該出版物を識別する(段階1050)。ここで、出版物識別システムは、段階1020の実行を通じて抽出されたフィンガープリントとDBMSから提供されたフィンガープリントを比較した結果に基づいて当該出版物を識別することができる。
その後、出版物識別システムは、不法流布または著作権が侵害された出版物の情報をDBMSから獲得し、獲得した情報を提供する(段階1060)。
前述したように、本発明の一実施例による出版物識別システムは、あらかじめ著作権保護を要請した出版物に対して原本出版物を利用してフィンガープリントを抽出し、出版物のメタデータ情報と連携して管理することによって、出版物の識別及び著作権保護のためのシステムを構築し、出版物のフィンガープリントを利用して不法流布されるかまたは著作権が侵害された出版物を識別することによって、著作権を保護することができる。
また、本発明はフィンガープリントを利用して暗号化及びパッケージング方法が解除された状況で不法流通を遮断し、以後に当該出版物がオンライン上に無断で流布された場合に、適切な保護措置を取ることができるようにする。
また、本発明の一実施例によるフィンガープリントを利用した出版物識別システムは、出版物の一部情報(例えば、数ページ程度の出版物)を入力し、本来出版物の情報を検索する目的にも活用されることもできる。これは、本発明の一実施例による出版物識別システムがコンテンツ固有の情報を示す特徴点を利用したフィンガープリントを利用することによって可能になる。
以上実施例を参照して説明したが、当該技術分野の熟練された当業者は、下記の特許請求の範囲に記載された本発明の思想及び領域から逸脱しない範囲内で本発明を多様に修正及び変更させることができることを理解することができる。
Claims (20)
- 入力されたテキスト形式の電子文書からテキストを抽出する段階と、
前記抽出されたテキストからテキストフィンガープリントを抽出する段階と、を含む出版物のフィンガープリント抽出方法。 - 前記入力されたテキスト形式の電子文書からテキストを抽出する段階は、
前記入力されたテキスト形式の電子文書に対して前処理を行った後、前記入力されたテキスト形式の電子文書からテキストを抽出することを特徴とする請求項1に記載の出版物のフィンガープリント抽出方法。 - 前記入力されたテキスト形式の電子文書に対する前処理は、誤打訂正または文字復元を含むことを特徴とする請求項2に記載の出版物のフィンガープリント抽出方法。
- イメージ形態の電子文書が入力される段階と、
入力された前記イメージ形態の電子文書がテキスト基盤電子文書である場合、前記入力されたイメージ形態の電子文書をテキスト形態の電子文書に変換する段階と、
前記変換されたテキスト形態の電子文書からテキストを抽出する段階と、
前記抽出されたテキストからテキストフィンガープリントを抽出する段階と、を含む出版物のフィンガープリント抽出方法。 - 前記イメージ形態の電子文書が入力される段階は、
前記イメージ形態の電子文書が入力された後、前記イメージ形態の電子文書に対する前処理を行う段階を含むことを特徴とする請求項4に記載の出版物のフィンガープリント抽出方法。 - 前記イメージ形態の電子文書に対する前処理を行う段階は、
前記イメージ形態の電子文書に含まれた雑音除去、ページ分離、イメージ回転及びイメージの勾配調整のうち少なくとも1つの処理を行うことを特徴とする請求項5に記載の出版物のフィンガープリント抽出方法。 - 前記出版物のフィンガープリント抽出方法は、
前記入力された前記イメージ形態の電子文書がイメージ基盤電子文書である場合には、
前記入力されたイメージ形態の電子文書に対する前処理を行う段階と、
前記前処理が行われたイメージ形態の電子文書からイメージフィンガープリントを抽出する段階と、をさらに含むことを特徴とする請求項4に記載の出版物のフィンガープリント抽出方法。 - 前記変換されたテキスト形態の電子文書からテキストを抽出する段階は、
前記変換されたテキスト形式の電子文書に対して前処理を行った後、前記変換されたテキスト形式の電子文書からテキストを抽出することを特徴とする請求項4に記載の出版物のフィンガープリント抽出方法。 - 入力されたイメージ形態の電子文書をテキスト形態の電子文書に変換するイメージテキスト変換部と、
前記テキスト形態の電子文書からテキストを抽出するテキスト抽出部と、
前記抽出されたテキストからテキストフィンガープリントを抽出するフィンガープリント抽出部と、を含む出版物のフィンガープリント抽出装置。 - 前記出版物のフィンガープリント抽出装置は、
前記入力されたイメージ形態の電子文書に含まれた雑音除去、ページ分離、イメージ回転及びイメージの勾配調整のうち少なくとも1つの処理を行うイメージ前処理部をさらに含むことを特徴とする請求項9に記載の出版物のフィンガープリント抽出装置。 - 前記フィンガープリント抽出部は、
前記イメージ前処理部から提供された前処理されたイメージからイメージフィンガープリントを抽出することを特徴とする請求項10に記載の出版物のフィンガープリント抽出装置。 - 前記出版物のフィンガープリント抽出装置は、
前記イメージテキスト変換部から提供された前記テキスト形態の電子文書または入力されたテキスト形態の電子文書に対して前処理を行った後、前記テキスト抽出部に提供するテキスト前処理部をさらに含むことを特徴とする請求項9に記載の出版物のフィンガープリント抽出装置。 - 原本出版物のフィンガープリントを抽出するフィンガープリント抽出装置と、
前記フィンガープリント抽出装置から提供された原本出版物のフィンガープリントと前記原本出版物の付加情報を連携して格納する出版物情報構築装置と、
前記原本出版物から抽出されたフィンガープリント及び前記原本出版物の付加情報が格納されるDBMS(DataBase Management System)と、を含むフィンガープリントを利用した出版物識別システム。 - 前記フィンガープリント抽出装置は、
前記原本出版物または質疑出版物がテキスト形式の電子文書である場合には、前記テキスト形式の電子文書からテキストを抽出した後、抽出されたテキストからテキストフィンガープリントを抽出し、前記原本出版物または前記質疑出版物がイメージ形態の電子文書である場合には、イメージ形態の電子文書をテキスト形態の電子文書に変換した後、変換されたテキスト形態の電子文書からテキストを抽出し、抽出されたテキストからテキストフィンガープリントを抽出することを特徴とする請求項13に記載のフィンガープリントを利用した出版物識別システム。 - 前記フィンガープリント抽出装置は、
前記原本出版物または前記質疑出版物がイメージ形態の電子文書である場合には、前記イメージ形態の電子文書に対する前処理を行った後、前処理が行われたイメージ形態の電子文書からイメージフィンガープリントを抽出することを特徴とする請求項14に記載のフィンガープリントを利用した出版物識別システム。 - 前記原本出版物の付加情報は、
原本出版物の製作者、出版社、題目、要約、発行日、ISBN、住所、電話番号及びファックス番号のうち少なくとも1つの情報を含むことを特徴とする請求項13に記載のフィンガープリントを利用した出版物識別システム。 - 著作権侵害を識別するために収集された質疑出版物に対するフィンガープリントを抽出するフィンガープリント抽出装置と、
前記フィンガープリント抽出装置から提供された前記質疑出版物に対するフィンガープリントに該当する原本出版物のフィンガープリントを質疑するフィンガープリント質疑装置と、
原本出版物から抽出されたフィンガープリント及び前記原本出版物の付加情報が格納され、前記フィンガープリント質疑装置の質疑に相当して少なくとも1つの原本出版物のフィンガープリントで構成された検索結果候補群を提供するDBMS(DataBase Management System)と、
前記DBMSから提供された検索結果候補群を検証し、前記質疑出版物の著作権侵害有無を判断する候補群検証装置と、を含むフィンガープリントを利用した出版物識別システム。 - 前記候補群検証装置は、
前記検索結果候補群と前記質疑出版物のフィンガープリントを比較し、比較結果に基づいて前記質疑出版物を識別し、前記質疑出版物が前記DBMS内部に存在する出版物として判断される場合、前記質疑出版物に該当する付加情報を前記DBMSから獲得して提供することを特徴とする請求項17に記載のフィンガープリントを利用した出版物識別システム。 - 収集された質疑出版物に対するフィンガープリントを抽出する段階と、
前記収集された質疑出版物から抽出されたフィンガープリントと対応する原本出版物のフィンガープリントをDBMSから検索する段階と、
少なくとも1つの検索結果に基づいて前記収集された質疑出版物を識別する段階と、を含むフィンガープリントを利用した出版物識別方法。 - 前記少なくとも1つの検索結果に基づいて前記収集された質疑出版物を識別する段階は、
前記少なくとも1つの検索結果を前記質疑出版物のフィンガープリントと比較した比較結果に基づいて前記質疑出版物を識別し、前記収集された質疑出版物を識別した結果、前記質疑出版物が原本出版物と同一であると判別される場合、前記DBMSから前記質疑出版物に対応する付加情報を獲得する段階をさらに含むことを特徴とする請求項19に記載のフィンガープリントを利用した出版物識別方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2010-0100508 | 2010-10-14 | ||
KR20100100508 | 2010-10-14 | ||
KR20110023069A KR101491446B1 (ko) | 2010-10-14 | 2011-03-15 | 출판물의 핑거프린트 추출 방법, 출판물의 핑거프린트 추출 장치, 핑거프린트를 이용한 출판물 식별 시스템 및 핑거프린트를 이용한 출판물 식별 방법 |
KR10-2011-0023069 | 2011-03-15 | ||
PCT/KR2011/007633 WO2012050379A2 (ko) | 2010-10-14 | 2011-10-13 | 출판물의 핑거프린트 추출 방법, 출판물의 핑거프린트 추출 장치, 핑거프린트를 이용한 출판물 식별 시스템 및 핑거프린트를 이용한 출판물 식별 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013543178A true JP2013543178A (ja) | 2013-11-28 |
Family
ID=46139476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013533773A Pending JP2013543178A (ja) | 2010-10-14 | 2011-10-13 | 出版物のフィンガープリント抽出方法、出版物のフィンガープリント抽出装置、フィンガープリントを利用した出版物識別システム及びフィンガープリントを利用した出版物識別方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20130290330A1 (ja) |
JP (1) | JP2013543178A (ja) |
KR (1) | KR101491446B1 (ja) |
CN (1) | CN103154957A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101558260B1 (ko) | 2014-09-15 | 2015-10-12 | 주식회사 디알엠인사이드 | 고속 복제물 검출 시스템 및 방법 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101479412B1 (ko) * | 2013-07-08 | 2015-01-05 | 연세대학교 산학협력단 | 디지털 컨텐츠 식별 방법 및 장치 |
KR101577376B1 (ko) * | 2014-01-21 | 2015-12-14 | (주) 아워텍 | 텍스트 기준점 기반의 저작권 침해 판단 시스템 및 그 방법 |
CN106055539B (zh) * | 2016-05-27 | 2018-12-28 | 中国科学技术信息研究所 | 姓名消歧的方法和装置 |
US10108883B2 (en) * | 2016-10-28 | 2018-10-23 | Intuit Inc. | Image quality assessment and improvement for performing optical character recognition |
SE1750530A1 (en) * | 2017-05-02 | 2018-11-03 | Fingerprint Cards Ab | Extracting fingerprint feature data from a fingerprint image |
KR102026956B1 (ko) | 2017-10-17 | 2019-09-30 | (주)아이와즈 | 디지털 저작물 유통 모니터링 시스템 |
KR102126839B1 (ko) | 2019-03-28 | 2020-06-25 | (주)아이와즈 | 딥러닝 기반 국가별 저작물 검색 시스템 |
CN110390352A (zh) * | 2019-06-26 | 2019-10-29 | 华中科技大学 | 一种基于相似性哈希的图像暗数据价值评估方法 |
CN111177666A (zh) * | 2019-12-30 | 2020-05-19 | 北京天威诚信电子商务服务有限公司 | 基于脆弱水印的司法文书防伪防篡改方法及系统 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001097128A1 (en) * | 2000-06-10 | 2001-12-20 | Markany Inc. | System and method of providing and authenticating works of authorship based on watermark technique |
US20030105739A1 (en) * | 2001-10-12 | 2003-06-05 | Hassane Essafi | Method and a system for identifying and verifying the content of multimedia documents |
JP3952958B2 (ja) * | 2003-01-22 | 2007-08-01 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
JP2006301835A (ja) * | 2005-04-19 | 2006-11-02 | Fuji Xerox Co Ltd | 取引書類管理方法及びシステム |
US7769772B2 (en) * | 2005-08-23 | 2010-08-03 | Ricoh Co., Ltd. | Mixed media reality brokerage network with layout-independent recognition |
JP4510092B2 (ja) * | 2005-10-25 | 2010-07-21 | 富士通株式会社 | 電子透かしの埋め込み及び検出 |
KR20070106475A (ko) * | 2007-08-27 | 2007-11-01 | (주)코인미디어 랩 | 텍스트 복제 탐지 방법 |
EP2204979A1 (en) * | 2008-12-30 | 2010-07-07 | Irdeto Access B.V. | Fingerprinting a data object with multiple watermarks |
-
2011
- 2011-03-15 KR KR20110023069A patent/KR101491446B1/ko active IP Right Grant
- 2011-10-13 CN CN2011800494631A patent/CN103154957A/zh active Pending
- 2011-10-13 JP JP2013533773A patent/JP2013543178A/ja active Pending
- 2011-10-13 US US13/879,398 patent/US20130290330A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101558260B1 (ko) | 2014-09-15 | 2015-10-12 | 주식회사 디알엠인사이드 | 고속 복제물 검출 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
US20130290330A1 (en) | 2013-10-31 |
CN103154957A (zh) | 2013-06-12 |
KR101491446B1 (ko) | 2015-02-23 |
KR20120038880A (ko) | 2012-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101491446B1 (ko) | 출판물의 핑거프린트 추출 방법, 출판물의 핑거프린트 추출 장치, 핑거프린트를 이용한 출판물 식별 시스템 및 핑거프린트를 이용한 출판물 식별 방법 | |
US8607354B2 (en) | Deriving multiple fingerprints from audio or video content | |
JP3784635B2 (ja) | データ運用方法 | |
US6868405B1 (en) | Copy detection for digitally-formatted works | |
US20120317421A1 (en) | Fingerprinting Executable Code | |
US8873863B2 (en) | System and method for fingerprinting for comics | |
US7975313B2 (en) | System and method for tracing Tardos fingerprint codes | |
WO2011121927A1 (ja) | デジタルコンテンツ管理システム、装置、プログラムおよび方法 | |
KR101803066B1 (ko) | 불법 복제된 서적의 통합 식별 시스템 및 방법 | |
CN112069465A (zh) | 一种基于区块链的稿件知识产权保护方法和系统 | |
JP6169277B2 (ja) | デジタルコンテンツの整合性を確保するためのデジタルコンテンツ監視システム | |
Alruban et al. | Biometrically linking document leakage to the individuals responsible | |
Elbegbayan | Winnowing, a document fingerprinting algorithm | |
JP2004185312A (ja) | 文書管理装置 | |
Hoffman | An illustration of hashing and its effect on illegal file content in the digital age | |
WO2012050379A2 (ko) | 출판물의 핑거프린트 추출 방법, 출판물의 핑거프린트 추출 장치, 핑거프린트를 이용한 출판물 식별 시스템 및 핑거프린트를 이용한 출판물 식별 방법 | |
Nanjundan et al. | Perspective Chapter: Text Watermark Analysis–Concept, Technique, and Applications | |
KR101068792B1 (ko) | Hash코드를 이용한 인터넷 공유 사이트에서의 영상 컨텐츠 저작권 보호 방법 | |
CN116226885B (zh) | 一种复印机保密检查取证系统及方法 | |
Contreras et al. | Protection of relational databases by means of watermarking: recent advances and challenges | |
JP6752347B1 (ja) | 情報処理装置、コンピュータプログラム及び情報処理方法 | |
JP2006237687A (ja) | プログラムおよび利用者追跡装置 | |
Wang et al. | CryptoPaper: Digital information security for physical documents | |
David et al. | Playing the System: Content Recognition Technologies and the Creative Process of Sampling Musicians | |
Laptev et al. | Method for Effective PDF Files Manipulation Detection |