KR20170076368A

KR20170076368A - 불법 복제된 서적의 통합 식별 시스템 및 방법

Info

Publication number: KR20170076368A
Application number: KR1020150186528A
Authority: KR
Inventors: 김태현; 윤희돈
Original assignee: 주식회사 디알엠인사이드
Priority date: 2015-12-24
Filing date: 2015-12-24
Publication date: 2017-07-04
Also published as: KR101803066B1

Abstract

본 발명은 불법 복제된 서적의 통합 식별 시스템 및 방법에 관한 것으로서, 더욱 상세히는 글자 위주의 일반 도서나 그림 위주의 만화책을 구분할 필요 없이 원본 서적을 스캔이나 캡처 등을 통해 불법 복제하여 생성한 컨텐츠를 구성하는 페이지별 이미지 구성에 따라 글자 및 그림 중 빈도가 높은 대상을 기준으로 특징점을 추출하여 원본 서적에 대한 원본 컨텐츠의 특징점과 비교함으로써 원본 서적을 불법 복제하여 생성한 불법 복제 컨텐츠를 정확하게 식별할 수 있는 불법 복제된 서적의 통합 식별 시스템 및 방법에 관한 것이다.

Description

불법 복제된 서적의 통합 식별 시스템 및 방법{Integrated identification system and method for illegal copy of book}

현재 디지털 콘텐츠 기술의 발달과 데이터 전송 매체의 발달로 인해 데이터의 상호 교류 및 정보의 양이 급격하게 증가하고 있다. 일반적으로 영화, 음악, 문서, 사진 등 다양한 종류의 디지털 콘텐츠가 제작되고 인터넷, P2P 또는 웹 하드를 통해 공유되고 빠르게 유포됨으로써 콘텐츠의 습득이 용이해졌다.

이러한 콘텐츠 공유에 의해 사회적인 문제로 지적되는 것이 저작권이 있는 디지털 콘텐츠의 불법 공유로 인한 저작권자의 권리 침해 문제이다. 디지털 콘텐츠에 대한 저작권 침해 사례들로 인해 DRM(Digital Rights Management), 워터마킹, 핑커프린팅 등의 기술이 적용되어 저작권자의 권리 보호 및 사용자의 피해를 예방하기 위해 활용되고 있다. 하지만 CD, DVD, 서적과 같은 저작물을 디지털 기기를 사용하여 디지털화하여 공유하는 경우에 저작권자의 권리는 제대로 보호받지 못하고 있으며 사용자에 대한 피해도 예방하지 못하고 있다.

이에 대한 대응 방안으로 현재 서적을 스캔이나 캡처 등을 통해 이미지 파일 형태로 생성한 불법 복제 컨텐츠를 식별하기 위하여 불법 복제 컨텐츠에서 연속된 이미지의 특징점을 추출한 후 저작권이 있는 원본 서적에 대한 원본 컨텐츠에서 추출된 특징점과 비교함으로써 일치 여부에 따라 불법 복제 여부를 식별하는 기술이 적용되고 있다.

그러나, 서적은 단순 글자 위주의 도서 뿐만 아니라 그림 위주의 만화책과 같은 다양한 종류의 서적이 존재하며, 이에 따라 글자 위주의 도서에 적용되는 특징점 추출 기술과 그림 위주의 만화책에 적용되는 특징점 기술이 상이하다.

따라서, 불법 복제 도서와 불법 복제 만화를 하나의 시스템에서 통합 식별하기 위해서 기존에는 식별 대상 서적의 종류를 구분하는 것이 선행되어야 하며, 식별 대상 서적에 대한 컨텐츠로부터 추출된 특징점과 원본 서적의 특징점 비교가 용이하도록 하기 위해 원본 도서로부터 추출된 특징점에 대한 DB와 원본 만화로부터 추출된 특징점에 대한 DB를 별도로 구축하여야 한다.

즉, 기존 시스템은 컨텐츠의 식별 요청 시에 이미지의 특성을 조사해서 해당 컨텐츠가 만화인지 또는 도서인지 먼저 구분하고 해당되는 특징점 DB를 대상으로 특징점 매칭을 하여 식별을 수행하도록 동작한다.

그러나, 이러한 기존 시스템은 DB 구축시에 만화임에도 불구하고 대화가 많아 글자 빈도가 높은 경우 도서로 인식하여 특징점을 추출하게 되며, 이로 인해 만화 특징점을 정상적으로 추출할 수 없거나 특징점이 갖추어야 할 유일성을 확보할 수 없게 되는 문제점이 발생하며, 이로 인해 추후 불법 복제 컨텐츠의 인식률이 크게 떨어지는 문제점이 있다.

마찬가지로, 도서임에도 불구하고 삽화와 같은 그림이 다수 포함되는 경우 DB 구축시에 해당 도서를 만화로 인식하여 이미지의 특징점을 추출하게 되며 이로 인해 도서 특징점을 정상적으로 추출할 수 없거나 특징점이 갖추어야 할 유일성을 확보할 수 없게 되어, 이러한 경우 역시 추후 불법 복제 컨텐츠의 인식률이 크게 떨어지게 된다.

이러한 현상은 시스템의 불법 복제 컨텐츠 식별 요청시에서도 발생할 수 있으며, DB 구축시와는 다르게 단지 소수의 이미지만으로 특징점을 추출하여 식별을 시도하기 때문에, 만화임에도 불구하고 글자가 대부분인 페이지가 식별대상이거나 도서임에도 불구하고 삽화가 대부분인 페이지가 식별대상인 경우 식별 대상과 전혀 다른 서적 종류에 대한 특징점 DB를 참조하여 식별을 시도하게 되고, 이로 인해 오인식률이 증가하여 시스템에 대한 신뢰성을 크게 저하시킬 수 있다.

따라서, 단일 시스템에서 글자 및 그림의 빈도에 따라 서적의 특성을 정확하게 판단하여 도서 및 만화에 대한 불법 복제 컨텐츠를 정확히 식별할 수 있도록 하고, 이를 통해 불법 복제 컨텐츠의 유통을 방지할 수 있는 시스템 개발이 요구되고 있다.

한국공개특허 제10-2005-0026769호

본 발명은 저작권이 있는 원본 서적에 대응되는 원본 컨텐츠로부터 추출된 페이지별 이미지 단위로 글자 및 그림 중 어느 하나의 파라미터가 빈도가 높은지를 판단한 후 페이지별 이미지 단위로 특징점을 추출하여 서적 종류의 구분 없이 서적의 특징점에 대한 통합 DB를 구축하고, 이를 통해 원본 서적을 불법 복제한 불법 복제 컨텐츠에 대한 식별 요청시 페이지별 이미지 단위로 유연하게 글자 및 그림 빈도에 따라 적합한 특징점 기술을 적용하여 원본 서적의 특징점에 대한 DB와 비교함으로써 불법 복제 컨텐츠를 서적 종류의 구분 없이 정확하게 식별할 수 있도록 지원하고 이를 통해 시스템 신뢰성을 개선하는데 그 목적이 있다.

또한, 본 발명은 도서임에도 불구하고 삽화만으로 구성된 페이지가 존재하거나 만화임에도 불구하고 글자만으로 구성된 페이지가 존재하더라도 용이하게 서적 종류에 관계없이 정확하게 특징점을 추출할 수 있도록 동작하여, 원본 컨텐츠에 대한 정확한 특징점을 확보하는 동시에 불법 복제 컨텐츠에 대한 특징점을 정확히 추출할 수 있어 불법 복제 컨텐츠에 해당되는 원본 서적을 정확히 검출하고 이를 통해 불법 복제 컨텐츠의 오인식률을 낮추고 전체적인 식별 성능을 향상시키는데 그 목적이 있다.

본 발명의 실시예에 따른 불법 복제된 서적의 통합 식별 시스템은 서적을 이미지 형태로 변환한 컨텐츠로부터 이미지를 추출하고, 각 이미지를 분석하여 그림 및 글자 중 빈도가 높은 파라미터에 따라 각 이미지에 대응되어 속성정보를 부여하는 이미지 분석부와, 상기 이미지별로 상기 속성정보에 따라 그림 및 글자에 각각 대응되는 특징점 추출 알고리즘 중 어느 하나를 통해 이미지의 특징점을 추출하여 상기 속성정보를 포함하는 특징점 정보를 생성하는 특징점 추출부 및 서로 다른 원본 컨텐츠 각각에 대하여 상기 이미지 분석부 및 특징점 추출부와 연동하여 상기 원본 컨텐츠를 구성하는 원본 이미지별로 특징점 정보를 생성한 후 각 특징점 정보에 해당되는 원본 이미지의 순서에 따라 상기 원본 컨텐츠에 대한 컨텐츠 정보와 매칭하여 DB에 저장하고, 식별 대상 컨텐츠를 포함하는 식별 요청정보 수신시 상기 이미지 분석부 및 특징점 추출부와 연동하여 상기 식별 대상 컨텐츠를 구성하는 연속된 복수의 식별 대상 이미지를 미리 설정된 개수만큼 추출한 후 상기 각 식별 대상 이미지에 대응되어 생성한 특징점 정보를 상기 식별 대상 이미지의 순서에 따라 정렬하여 그룹화한 식별 대상 정보를 생성한 후 상기 DB에 저장된 컨텐츠 정보별 특징점 정보와 비교하여 상기 식별 대상 정보의 각 특징점 정보와 순서대로 일치하는 특징점 정보에 매칭된 컨텐츠 정보가 추출되면 상기 식별 대상 컨텐츠를 상기 컨텐츠 정보에 대한 불법 복제 컨텐츠로 판단하는 판단부를 포함할 수 있다.

본 발명과 관련된 일 예로서, 상기 속성정보는 상기 특징점 정보를 구성하는 복수의 비트 중 MSB 또는 LSB로 구성되는 것을 특징으로 할 수 있다.

본 발명과 관련된 일 예로서, 상기 판단부는 상기 원본 이미지 또는 식별 대상 이미지에 부여된 파일명 또는 각 이미지의 페이지 순서에 따라 상기 원본 이미지 또는 식별 대상 이미지의 순서를 식별하는 것을 특징으로 할 수 있다.

본 발명과 관련된 일 예로서, 상기 판단부는 상기 식별 대상 정보를 구성하는 각 특징점 정보에 포함된 속성정보를 상기 식별 대상 이미지의 순서에 따라 정렬한 구간 식별 정보를 생성하고, 상기 구간 식별 정보를 상기 DB에 저장된 각 특징점 정보의 속성정보와 컨텐츠 정보별로 비교하여 상기 구간 식별 정보에 따른 각 속성정보와 순서대로 연속 일치하는 복수의 특징점 정보로 구성된 비교 구간을 설정하고, 상기 비교 구간에 대해서만 상기 식별 대상 정보에 포함된 특징점 정보와 상기 구간에 속한 특징점 정보를 상호 비교하는 것을 특징으로 할 수 있다.

본 발명과 관련된 일 예로서, 상기 판단부는 상기 구간에 속한 각 특징점 정보와 상기 식별 대상 정보에 포함된 각 특징점 정보를 동일 순서끼리 상호 비교하여 일치 여부를 판단하는 것을 특징으로 할 수 있다.

본 발명과 관련된 일 예로서, 상기 판단부는 상기 구간 식별 정보에 포함된 각 속성 정보와 상기 DB에서 컨텐츠 정보에 매칭되어 순서가 연속되는 각 특징점 정보에 포함된 속성 정보를 상호 비교하여 연속 일치하는 일치 개수를 산출하고, 상기 구간 식별 정보에 포함된 속성정보의 개수 대비 상기 일치 개수의 비율이 미리 설정된 기준치 이상인 구간을 상기 비교 구간으로 설정하는 것을 특징으로 할 수 있다.

본 발명과 관련된 일 예로서, 상기 판단부는 상기 DB로부터 상기 컨텐츠 정보별로 매칭 저장된 복수의 특징점 정보 각각으로부터 속성정보만을 추출하여 특징점 정보의 정렬 순서에 따라 정렬한 이미지 요약정보를 생성한 후 상기 컨텐츠 정보와 매칭하여 상기 DB에 저장하고, 상기 구간 식별정보와 이미지 요약정보를 비교하여 상기 구간 식별정보의 각 속성정보와 순서대로 일치하는 구간을 상기 이미지 요약정보로부터 식별하고, 식별된 구간을 상기 비교 구간으로 설정하는 것을 특징으로 할 수 있다.

본 발명과 관련된 일 예로서, 상기 판단부는 상기 식별 대상 이미지로부터 추출된 특징점 정보와 상기 원본 이미지로부터 추출된 특징점 정보의 상호 비교시 유사도를 산출하고, 유사도가 미리 설정된 기준치 이상인 경우 상기 식별 대상 이미지의 특징점 정보와 상기 원본 이미지의 특징점 정보가 상호 일치하는 것으로 판단하는 것을 특징으로 할 수 있다.

본 발명과 관련된 일 예로서, 상기 판단부는 상기 컨텐츠 정보별로 상기 원본 컨텐츠의 각 특징점 정보와 상기 식별 대상 정보를 비교하여, 상기 식별 대상 정보와 비교된 상기 원본 컨텐츠의 특징점 정보들 중 상기 식별 대상 정보에 포함된 특징점 정보와 상호 일치하는 특징점 정보를 식별하여 일치 개수를 산출하고, 상기 식별 대상 정보를 구성하는 특징점 정보의 개수 대비 상기 일치 개수의 비율을 산출하며, 해당 비율이 미리 설정된 기준치 이상인 컨텐츠 정보를 상기 DB로부터 추출하여, 상기 식별 대상 컨텐츠를 상기 컨텐츠 정보에 대한 불법 복제 컨텐츠로 판단하는 것을 특징으로 할 수 있다.

본 발명의 실시예에 따른 원본 서적을 이미지 형태로 변환하여 복제한 불법 복제 컨텐츠를 식별하는 장치의 불법 복제된 서적의 통합 식별 방법은, 서로 다른 원본 컨텐츠 각각에 대하여 상기 원본 컨텐츠를 구성하는 복수의 원본 이미지를 추출하고, 각 원본 이미지를 분석하여 그림 및 글자 중 빈도가 높은 파라미터에 따라 각 원본 이미지에 대응되어 속성정보를 부여하며, 상기 각 원본 이미지에 대응되는 속성정보에 따라 그림 및 글자에 각각 대응되는 특징점 추출 알고리즘 중 어느 하나를 통해 이미지의 특징점을 추출하여 상기 속성정보를 포함하는 특징점 정보를 생성한 후 각 특징점 정보에 해당되는 원본 이미지의 순서에 따라 상기 원본 컨텐츠에 대한 컨텐츠 정보와 매칭하여 DB에 저장하는 단계와, 식별 대상 컨텐츠를 포함하는 식별 요청정보를 수신하는 단계와, 상기 식별 대상 컨텐츠를 구성하는 연속된 복수의 식별 대상 이미지를 미리 설정된 개수만큼 추출한 후 상기 각 식별 대상 이미지에 대응되어 상기 원본 컨텐츠에 대한 특징점 정보의 생성 방식과 동일한 방식으로 특징점 정보를 생성하고, 각 식별 대상 이미지에 대응되는 특징점 정보를 상기 식별 대상 이미지의 순서에 따라 정렬하여 그룹화한 식별 대상 정보를 생성하는 단계 및 상기 식별 대상 정보를 상기 DB와 컨텐츠 정보별 특징점 정보와 비교하여 상기 식별 대상 정보의 각 특징점 정보와 순서대로 연속 일치하는 특징점 정보에 매칭된 컨텐츠 정보가 추출된 경우 상기 식별 대상 컨텐츠를 상기 컨텐츠 정보에 대응되는 불법 복제 컨텐츠로 판단하는 단계를 포함할 수 있다.

상술한 바와 같이, 본 발명은 원본 서적을 이미지 파일 형태로 생성한 원본 컨텐츠를 서적 종류에 관계없이 페이지별 이미지 단위로 글자 및 그림 중 어느 파라미터의 빈도가 높은지를 판단하여 해당 파라미터에 적합한 특징점 추출 방식을 페이지별 이미지에 적용함으로써 페이지별로 다른 페이지와 구분되는 특징점을 정확하게 추출하고 이를 기반으로 다른 서적과 정확한 구분이 이루어지도록 원본 서적의 유일성이 보장된 DB를 구축할 수 있으며, 원본 서적을 스캔이나 캡처 등의 방식을 통해 불법 복제하여 생성한 불법 복제 컨텐츠에도 원본 컨텐츠의 특징점 추출 방식과 동일한 방식을 적용하여 원본 컨텐츠와의 비교가 정확하게 이루어지도록 지원할 수 있어 원본 서적을 불법 복제하여 생성한 불법 복제 컨텐츠를 정확하게 검출할 수 있을 뿐만 아니라 서적 종류에 관계없이 정확하게 서적의 특성을 분석하여 오인식률을 크게 낮출 수 있다.

또한, 본 발명은 식별 대상 컨텐츠를 DB에 저장된 원본 컨텐츠와 특징점 비교시 식별 대상 컨텐츠에서 추출된 식별 대상 이미지를 기반으로 생성된 특징점 정보를 포함하는 식별 대상 정보에서 각 식별 대상 이미지를 구성하는 글자 또는 그림 중 어느 하나의 주요 파라미터에 대한 속성정보만을 추출하여 구간 식별정보를 생성하고, 상기 구간 식별정보를 DB의 각 특징점 정보에 포함된 속성정보와 비교하여 각 컨텐츠 정보에 순서대로 매칭된 복수의 특징점 정보들 중에서 상기 구간 식별정보에 포함된 각 속성정보와 순서대로 일치하는 속성정보가 포함된 연속되는 복수의 특징점 정보로 이루어진 구간을 식별한 후 해당 구간에 대해서만 식별 대상 정보와 특징점 비교가 이루어지도록 지원하여 불법 복제 컨텐츠를 검출하기 위한 연산량을 대폭 줄이는 동시에 처리 속도를 높일 수 있는 효과가 있다.

도 1 및 도 2는 본 발명의 실시예에 따른 불법 복제된 서적의 통합 식별 시스템의 구성도.
도 3 및 도 4는 본 발명의 실시예에 따른 불법 복제된 서적의 통합 식별 시스템의 컨텐츠를 구성하는 이미지별 속성 분석 및 특징점 추출에 대한 예시도.
도 5는 본 발명의 실시예에 따른 불법 복제된 서적의 통합 식별 시스템의 식별 대상 컨텐츠에 대한 식별 대상 정보의 생성을 도시한 예시도.
도 6은 본 발명의 실시예에 따른 불법 복제된 서적의 통합 식별 시스템의 원본 컨텐츠와 식별 대상 컨텐츠 상호간 특징점 비교에 대한 예시도.
도 7 및 도 8은 본 발명의 실시예에 따른 불법 복제된 서적의 통합 식별 시스템의 속성 정보를 이용한 원본 컨텐츠 및 식별 대상 컨텐츠 상호간 특징점 비교에 대한 예시도.
도 9는 본 발명의 실시예에 따른 불법 복제된 서적의 통합 식별 방법에 대한 순서도.

이하, 도면을 참고하여 본 발명의 상세 실시예를 설명한다.

도 1 및 도 2는 본 발명의 실시예에 따른 불법 복제된 서적의 통합 식별 시스템의 구성도로서, 도시된 바와 같이 이미지 분석부(120), 특징점 추출부(130) 및 판단부(110)를 포함할 수 있다.

우선, 상기 판단부(110)는 외부로부터 그림 위주로 구성된 만화나 글자 위주로 구성된 도서를 포함하는 서적을 이미지 형태로 변환한 컨텐츠(contents)를 수신하여 상기 이미지 분석부(120)로 제공할 수 있다.

상기 이미지 분석부(120)는 상기 컨텐츠가 단일 파일로 구성된 경우 상기 컨텐츠를 구성하는 페이지별 이미지를 추출하거나 상기 컨텐츠가 복수의 이미지로 구성된 경우 각 이미지를 순서대로 추출할 수 있다. 또한, 상기 이미지 분석부(120)는 상기 컨텐츠가 압축 파일로 구성된 경우 압축을 해제하여 이미지를 추출할 수도 있음은 물론이다.

이때, 상기 판단부(110)가 상기 컨텐츠로부터 이미지를 추출하여 상기 이미지 분석부(120)로 제공할 수도 있음은 물론이며, 상기 이미지 분석부(120)가 상기 판단부(110)의 제어에 따라 미리 설정된 개수만큼 연속된 이미지를 추출할 수 있다.

여기서, 상기 이미지는 촬영이나 스캔 등을 통해 얻은 이미지를 다양한 방식으로 인코딩한 파일일 수 있으며, 일례로 JPEG, GIF, BMP, PNG, TIFF, PDF 등의 확장자를 가질 수 있다.

또한, 상기 이미지 분석부(120) 및 판단부(110)는 상기 컨텐츠를 구성한 이미지별 페이지 또는 이미지에 부여된 파일명에 따라 각 이미지의 순서를 판단할 수 있다.

또한, 상기 이미지 분석부(120)는 각 이미지를 분석하여 그림 및 글자를 식별하고, 그림 및 글자 중 빈도가 더 높은 주요 파라미터(parameter)에 대응되어 미리 설정된 설정값에 대한 속성정보를 생성하고, 이를 대응되는 이미지에 부여할 수 있다.

한편, 상기 특징점 추출부(130)는 상기 이미지 분석부(120)로부터 상기 컨텐츠를 구성하는 각 이미지에 대응되는 속성정보 및 해당 이미지를 수신하고, 상기 각 이미지에 대하여 속성정보에 따라 그림 위주로 구성된 이미지(그림 빈도가 높은 이미지)인지 글자(문자) 위주로 구성된 이미지(글자 빈도가 높은 이미지)인지를 구분할 수 있다.

이에 따라, 상기 특징점 추출부(130)는 그림 위주로 구성된 이미지에 대해서는 그림과 관련된 특징점을 추출하기 위한 특징점 추출 알고리즘을 적용하여 특징점을 추출한 후 수십 비트(bit) 이내의 정보로 한정한 특징점 정보를 생성할 수 있다.

또한, 상기 특징점 추출부(130)는 글자 위주로 구성된 이미지에 대해서는 글자와 관련된 특징점을 추출하기 위한 특징점 추출 알고리즘을 적용하여 특징점을 추출한 후 상기 그림 위주의 이미지에 대해서 생성한 특징점 정보와 동일한 비트 크기를 가지는 특징점 정보를 생성할 수 있다.

이때, 상기 특징점 추출부(130)가 이용하는 글자 관련 특징점 추출 알고리즘은 글자를 식별하고 글자 분포를 판단하는 방식이나 띄어쓰기 또는 들여쓰기 분포를 판단하는 방식 등을 통해 특징점을 추출하는 것과 같은 다양한 글자 관련 특징점 추출 알고리즘이 적용될 수 있으며, 그림 관련 특징점 추출 알고리즘은 이미지 식별을 통해 특징점을 추출하는 다양한 이미지 관련 특징점 추출 알고리즘이 적용될 수 있다.

한편, 상기 특징점 추출부(130)는 상기 특징점 정보의 일부 비트를 상기 속성정보를 위한 비트로 할당할 수 있으며, 이를 통해 상기 속성정보를 포함하는 특징점 정보를 생성할 수 있다.

이에 따라, 상기 특징점 정보는 하나의 이미지에 대하여 글자 및 그림 중 더 높은 빈도를 가지는 파라미터에 대한 정보와 상기 이미지의 특징점에 대한 정보를 포함할 수 있다.

한편, 상기 특징점 추출부(130)는 상기 특징점 정보를 상기 판단부(110)로 제공할 수 있으며, 상기 판단부(110)는 상기 컨텐츠에 대한 컨텐츠 정보와 상기 컨텐츠로부터 추출된 이미지별 특징점 정보를 상호 매칭하여 컨텐츠 DB(140)에 저장할 수 있다.

이때, 상기 판단부(110)는 각 이미지의 페이지 순서에 따라 순서대로 상기 특징점 정보를 컨텐츠 정보와 매칭하여 저장할 수 있다.

상술한 구성에 따라, 상기 판단부(110)는 도 2에 도시된 바와 같이 저작권이 있는 서로 다른 원본 서적 각각에 대한 원본 컨텐츠를 수신한 후 상기 이미지 분석부(120) 및 특징점 추출부(130)와 연동하여(또는 이미지 분석부(120) 및 특징점 추출부(130)를 제어하여) 상기 원본 컨텐츠에 대한 컨텐츠 정보와 상기 원본 컨텐츠를 구성하는 원본 이미지별 특징점 정보를 페이지 순서에 따라 매칭 저장할 수 있다.

이를 통해, 본 발명에 따른 불법 복제된 서적의 통합 식별 시스템은 원본 서적에 대한 DB 구축 과정에서 기존과 같이 그림 위주의 만화 및 글자 위주의 도서 각각에 대한 별도의 DB를 마련하여 서적 종류에 따라 만화에 해당되는 특징점 정보를 만화 관련 DB에 저장하고 도서에 해당되는 특징점 정보를 도서 관련 DB에 저장하는 방식으로 분리 관리할 필요 없이 페이지 단위 이미지에서 글자 및 그림 중 빈도가 더 높은 어느 하나의 주요 파라미터를 기준으로 특징점을 추출하고 이를 원본 서적에 대한 컨텐츠 정보와 매칭하여 단일 DB에 저장할 수 있으므로, 모든 종류의 서적에 대한 특징점을 단일 DB로 통합 관리할 수 있어 컨텐츠 관리에 대한 효율성을 높일 수 있다.

또한, 본 발명에 따른 시스템은 만화임에도 불구하고 목차나 줄거리 설명 등과 같은 글자 위주의 페이지가 구성되어 있는 경우 해당 페이지에 대응되는 이미지에 대해서는 글자 관련 특징점 추출 방식을 적용하고, 도서임에도 불구하고 삽화와 같은 그림 위주의 페이지가 구성되어 있는 경우 해당 페이지에 대응되는 이미지에 대해서는 그림 관련 특징점 추출 방식을 적용하여 이미지의 주된(주요) 파라미터에 상응하여 특징점을 추출함으로써 특정 서적의 유일성을 확보할 수 있으며, 이를 통해 원본 서적에 대한 원본 컨텐츠와 해당 원본 서적을 불법 복제한 불법 복제 컨텐츠의 상호 비교가 용이하도록 지원할 수 있을 뿐 아니라 불법 복제 컨텐츠를 오인식 없이 정확하게 검출할 수 있도록 지원할 수 있다.

한편, 도 3 및 도 4는 상술한 서적 종류와 무관하게 단일 DB로 모든 종류의 서적을 관리하기 위한 특징점 관련 단일 DB 구축 과정을 더욱 상세히 설명한 예시도로서, 우선 도 3에 도시된 바와 같이 상기 판단부(110)는 이미지 분석부(120) 및 특징점 추출부(130)와 연동하여 원본 컨텐츠를 수신한 후 해당 원본 컨텐츠로부터 페이지별 원본 이미지를 추출하고, 상기 각 원본 이미지에 대하여 글자 및 그림 중 어느 파라미터의 빈도가 높은지에 대한 속성 분석을 통해 글자 및 그림 중 어느 하나의 주요 파라미터에 대한 속성정보를 생성하며, 상기 속성정보에 따라 글자 또는 그림 중 어느 하나의 파라미터에 대응되는 특징점 추출 알고리즘을 상기 원본 이미지에 적용하여 특징점을 추출한 후 상기 속성정보를 포함하는 특징점 정보를 생성할 수 있다.

이때, 도시된 바와 같이 상기 이미지 분석부(120)는 이미지에 대한 속성 분석을 통해 글자 위주로 구성된 이미지에 대해서는 속성정보의 설정값으로 0을 설정하고, 그림 위주로 구성된 이미지에 대해서는 속성정보의 설정값으로 1을 설정할 수 있다.

이에 따라, 상기 특징점 추출부(130)는 상기 이미지 분석부(120)로부터 상기 원본 컨텐츠의 각 이미지에 매칭된 속성정보를 수신하고, 도 3에 도시된 바와 같이 상기 원본 컨텐츠의 서적 종류가 그림 위주로 구성된 만화임에도 불구하고 글자 위주로 구성된 페이지(페이지 2, 페이지 3)가 포함된 경우 속성정보를 기초로 해당 페이지(페이지 2, 페이지 3)의 이미지가 글자 위주로 구성되어 있음을 식별할 수 있으며, 이에 따라 해당 페이지(페이지 2, 페이지 3)의 이미지에 대해 글자에 대한 특징점 추출 알고리즘을 적용하여 각 페이지의 이미지에 대응되어 특징점 정보를 생성할 수 있다.

이때, 상기 특징점 추출부(130)는 상기 속성정보를 기초로 만화 관련 원본 컨텐츠에서 그림 위주로 구성된 다른 페이지를 식별할 수 있음은 물론이며, 그림 위주로 구성된 페이지의 이미지에 대해서는 그림 관련 특징점 추출 알고리즘을 적용하여 각 페이지의 이미지에 대응되어 특징점 정보를 생성할 수 있다.

한편, 상기 특징점 추출부(130)는 도 4에 도시된 바와 같이 상기 원본 컨텐츠의 서적 종류가 글자 위주로 구성된 도서임에도 불구하고 그림 위주로 구성된 페이지(페이지 1, 페이지 4, 페이지 6)가 포함된 경우 상기 속성정보를 기초로 해당 페이지의 이미지에 대해서 그림 관련 특징점 추출 알고리즘을 적용하여 각 페이지의 이미지에 대응되어 특징점 정보를 생성할 수 있다.

이때, 상기 특징점 추출부(130)는 상기 속성정보를 기초로 도서 관련 원본 컨텐츠에서 글자 위주로 구성된 다른 페이지를 식별할 수 있음은 물론이며, 글자 위주로 구성된 페이지의 이미지에 대해서는 글자 관련 특징점 추출 알고리즘을 적용하여 각 페이지의 이미지에 대응되어 특징점 정보를 생성할 수 있다.

이에 따라, 본 발명은 서적 종류에 관계없이 원본 컨텐츠를 구성하는 각 이미지에서 빈도가 높은 주요 파라미터(글자 또는 그림)를 식별하고, 식별된 주요 파라미터에 대응되는 특징점 추출 알고리즘을 유동적으로 적용하여 정확하게 특징점을 추출할 수 있으며, 이를 통해 각 페이지의 이미지에 대한 특징을 정확하게 정의할 수 있다.

한편, 상술한 바와 같이 상기 특징점 추출부(130)는 특징점 정보 중 일부 비트를 상기 속성정보에 할당할 수 있으며, 상기 특징점 정보에서 상기 속성정보가 설정되는 비트는 MSB(Most Significant Bit) 또는 LSB(Least Significant Bit)일 수 있다.

한편, 상기 판단부(110)는 상기 원본 컨텐츠를 구성하는 페이지별 이미지에 대한 특징점 정보를 상기 특징점 추출부(130)로부터 수신하여 페이지 순서에 따라 상기 컨텐츠 정보와 순서대로 매칭하여 저장할 수 있으며, 서로 다른 원본 컨텐츠 각각에 대응되어 복수의 특징점 정보가 저장된 컨텐츠 DB(140)를 구축할 수 있다.

이때, 상기 판단부(110)는 상기 이미지 분석부(120) 및 특징점 추출부(130)와 연동하여 각 이미지의 순서를 결정하기 위한 순서 정보를 각 이미지에 대응되어 부여할 수 있으며, 상기 순서 정보를 각 특징점 정보와 매칭하여 저장할 수 있음은 물론이다. 또한, 상기 순서정보는 페이지 정보일 수 있다.

한편, 상기 판단부(110)는 CPU, GPU, 버스 등을 포함하는 제어부로 구성될 수도 있으며, 상기 이미지 분석부(120), 특징점 추출부(130) 및 판단부(110) 중 일부 구성이 하나의 구성부로 통합되거나 일부 구성이 다른 구성부에 구성될 수도 있음은 물론이다.

또한, 상기 불법 복제된 서적의 통합 식별 시스템은 서버와 같은 하나의 장치로 구성되거나 특정 장치에 모듈로서 구성될 수도 있다.

한편, 본 발명은 상술한 바와 같이 원본 컨텐츠에 대응되어 구축된 컨텐츠 DB(140)를 기초로 저작권이 있는 원본 서적을 스캔(scan)이나 캡처(capture) 등을 통해 불법 복제하여 이미지 파일 형태로 생성한 불법 복제 컨텐츠를 검출하기 위해, 불법 복제가 의심되는 식별 대상 컨텐츠를 수신하여 상술한 원본 컨텐츠에 대한 특징점 정보의 생성 방식을 통해 식별 대상 컨텐츠로부터 이미지를 추출한 후 속성정보를 포함하는 특징점 정보를 생성할 수 있으며, 이를 컨텐츠 DB(140)에 저장된 특징점 정보와 비교하여 상기 식별 대상 컨텐츠와 일정 수준 이상 일치하는 원본 컨텐츠가 검출되는 경우 해당 식별 대상 컨텐츠를 원본 컨텐츠를 불법 복제한 불법 복제 컨텐츠로서 식별할 수 있는데 이에 대한 설명을 상술한 구성을 토대로 이하 도면을 참고하여 설명한다.

우선, 도 5에 도시된 바와 같이 상기 판단부(110)는 외부로부터 식별 대상 컨텐츠를 포함하는 식별 요청 정보 수신시 상기 식별 대상 컨텐츠를 이미지 분석부(120)로 제공하며, 상기 이미지 분석부(120)와 연동하여 상기 식별 대상 컨텐츠로부터 미리 설정된 개수의 연속된 복수의 식별 대상 이미지를 추출할 수 있다.

이때, 상기 판단부(110) 또는 이미지 분석부(120)는 상기 식별 대상 이미지에 부여된 파일명 또는 각 이미지에 해당되는 페이지 순서에 따라 상기 식별 대상 이미지의 순서를 식별할 수 있으며, 이를 통해 미리 설정된 개수로 연속된 순서를 가진 복수 이미지를 추출할 수 있다. 여기서, 상기 판단부(110) 또는 이미지 분석부(120)는 상기 원본 컨텐츠로부터 상기 각 원본 이미지의 순서를 판단할 때에도 파일명 또는 페이지 순서에 따라 이미지의 순서를 식별할 수 있음은 물론이다.

한편, 상기 이미지 분석부(120)는 상기 각 식별 대상 이미지에 대하여 상술한 바와 마찬가지로 속성정보를 생성한 후 식별 대상 이미지와 매칭하여 상기 특징점 추출부(130)로 제공할 수 있다.

이후, 상기 특징점 추출부(130)는 상기 각 식별 대상 이미지에 매칭된 속성정보를 기초로 빈도가 높은 주요 파라미터(글자 또는 그림)를 식별하고, 각 식별 대상 이미지에 대응되어 식별된 주요 파라미터와 연관된 특징점 추출 알고리즘을 식별 대상 이미지에 적용하여 특징점 정보를 생성할 수 있다.

이를 통해, 상기 특징점 추출부(130)는 순서가 연속되는 각 식별 대상 이미지에 대하여 상기 속성정보를 포함하는 특징점 정보를 생성한 후 상기 판단부(110)로 제공할 수 있다.

이에 따라, 상기 판단부(110)는 상기 특징점 추출부(130)로부터 수신되는 특징점 정보를 각 식별 대상 이미지의 순서에 따라 정렬하여 그룹화한 식별 대상 정보를 생성할 수 있으며, 이때 상기 식별 대상 정보는 상기 특징점 추출부(130)에서 생성하여 상기 판단부(110)로 제공할 수도 있다.

한편, 상기 판단부(110)는 도 6에 도시된 바와 같이 상기 식별 대상 정보를 기초로 상기 컨텐츠 DB(140)를 스캔(검색)할 수 있으며, 스캔 과정에서 상기 식별 대상 정보에 포함된 각 특징점 정보를 컨텐츠 정보별로 매칭되어 상기 컨텐츠 DB(140)에 저장된 각 특징점 정보와 상호 비교할 수 있다.

이를 통해, 상기 판단부(110)는 컨텐츠 정보별로 상기 식별 대상 정보를 기초로 컨텐츠 DB(140)를 스캔하여, 상기 식별 대상 정보에 포함된 각 특징점 정보와 순서대로 일치하며 동일 컨텐츠 정보에 매칭되는 복수의 연속된 특징점 정보가 존재하는 경우 해당 복수의 연속된 특징점 정보에 매칭된 컨텐츠 정보(컨텐츠 정보 1)를 추출할 수 있다.

이에 따라, 상기 판단부(110)는 상기 식별 대상 정보에 대응되는 식별 대상 컨텐츠가 상기 추출된 컨텐츠 정보에 대응되는 원본 서적을 불법 복제하여 얻어진 컨텐츠(또는 파일)임을 식별할 수 있으며, 이에 대한 정보를 제공할 수 있다.

상술한 구성에서, 상기 판단부(110)는 상기 식별 대상 이미지로부터 추출된 특징점 정보와 상기 원본 이미지로부터 추출된 특징점 정보의 상호 비교시 미리 설정된 알고리즘에 따라 상기 식별 대상 이미지의 특징점 정보와 상기 원본 이미지의 특징점 상호간 유사도를 산출하고, 유사도가 미리 설정된 기준치 이상인 경우 상기 식별 대상 이미지의 특징점 정보와 상기 원본 이미지의 특징점 정보가 상호 일치하는 것으로 판단할 수 있다.

더하여, 상기 판단부(110)는 상기 컨텐츠 정보별로 상기 원본 컨텐츠의 각 특징점 정보와 상기 식별 대상 정보를 비교하여, 상기 식별 대상 정보와 비교된 상기 원본 컨텐츠의 특징점 정보들 중 상기 식별 대상 정보에 포함된 특징점 정보와 상호 일치하는 특징점 정보를 식별하여 일치 개수를 산출하고, 상기 식별 대상 정보를 구성하는 특징점 정보의 개수(식별 대상 이미지의 개수) 대비 상기 일치 개수의 비율을 산출하며, 해당 비율이 미리 설정된 기준치 이상인 컨텐츠 정보를 상기 DB(140)로부터 추출하여, 상기 식별 대상 컨텐츠를 상기 추출된 컨텐츠 정보에 대한 불법 복제 컨텐츠로 판단할 수도 있다.

상술한 바와 같이, 본 발명은 원본 서적을 이미지 파일 형태로 생성한 원본 컨텐츠를 서적 종류에 관계없이 페이지별 이미지 단위로 글자 및 그림 중 어느 파라미터의 빈도가 더 높은지를 판단하여 해당 파라미터에 적합한 특징점 추출 방식을 페이지별 이미지에 적용함으로써 페이지별로 다른 페이지와 구분되는 특징점을 정확하게 추출하고 이를 기반으로 다른 서적과 정확한 구분이 이루어지도록 원본 서적의 유일성이 보장된 DB를 구축할 수 있으며, 원본 서적을 스캔이나 캡처 등의 방식을 통해 불법 복제하여 생성한 불법 복제 컨텐츠에도 원본 컨텐츠의 특징점 추출 방식과 동일한 방식을 적용하여 원본 컨텐츠와의 비교가 정확하게 이루어지도록 지원할 수 있어 원본 서적을 불법 복제하여 생성한 불법 복제 컨텐츠를 정확하게 검출할 수 있을 뿐만 아니라 서적 종류에 관계없이 정확하게 서적의 특성을 분석하여 오인식률을 크게 낮출 수 있다.

한편, 본 발명은 식별 대상 컨텐츠를 컨텐츠 DB(140)에 저장된 원본 컨텐츠와 특징점 비교시 식별 대상 컨텐츠에서 추출된 식별 대상 이미지를 기반으로 생성된 특징점 정보를 포함하는 식별 대상 정보에서 각 식별 대상 이미지를 구성하는 주요 파라미터(글자 및 그림 중 빈도가 높은 파라미터)에 대한 속성정보만을 추출하여 구간 식별정보를 생성하고, 상기 구간 식별정보를 컨텐츠 DB(140)의 각 특징점 정보에 포함된 속성정보와 비교하여 각 컨텐츠 정보에 순서대로 매칭된 복수의 특징점 정보들 중에서 상기 구간 식별정보에 포함된 각 속성정보와 순서대로 일치하는 속성정보가 포함된 연속되는 복수의 특징점 정보로 이루어진 구간을 식별하고, 해당 구간에 대해서만 식별 대상 정보와 특징점 비교가 이루어지도록 지원하여 연산량을 대폭 줄이는 동시에 처리 속도를 높일 수 있는데 이를 도 7 및 도 8을 통해 상세히 설명한다.

우선, 도 7에 도시된 바와 같이 상기 판단부(110)는 상기 식별 대상 정보에 포함된 각 특징점 정보에 포함된 속성정보를 추출한 후 특징점 정보의 순서에 따라 상기 속성정보를 순서대로 정렬 및 통합하여 하나의 데이터 필드(data field)로 구성한 구간 식별 정보를 생성할 수 있다.

이를 통해, 상기 판단부(110)는 상기 구간 식별 정보를 이용하여 상기 컨텐츠 DB(140)를 스캔할 수 있으며, 컨텐츠 DB(140)에 저장된 각 컨텐츠 정보에 대하여 컨텐츠 정보에 순서대로 매칭된 복수의 특징점 정보 각각에 포함된 속성정보와 상기 구간 식별 정보에 포함된 각 속성 정보를 비교하여 상기 구간 식별 정보에 포함된 각 속성 정보와 순서대로 연속 일치하는 복수의 특징점 정보로 이루어진 구간을 식별할 수 있다.

이때, 상기 판단부(110)는 상기 구간 식별 정보에 의해 식별된 구간에 포함되는 복수의 특징점 정보에 각각에 매칭되어 컨텐츠 DB(140)에 저장된 순서 정보를 기반으로 상기 식별된 구간을 특징점 비교 대상 구간으로 하는 비교 구간 정보를 생성할 수 있다.

또한, 상기 판단부(110)는 상기 구간 식별 정보에 포함된 각 속성 정보와 연속되는 각 특징점 정보에 포함된 속성 정보를 비교하여 연속 일치하는 일치 개수를 산출하고, 상기 구간 식별 정보에 포함된 속성정보의 개수 대비 상기 일치개수의 비율이 미리 설정된 기준치 이상인 구간에 대해서도 유사도가 높은 구간으로 판단하여 해당 구간을 특징점 비교 대상 구간으로 설정하고 해당 구간에 대한 비교 구간 정보를 생성할 수도 있다.

이에 대한 일례로, 도시된 바와 상기 판단부(110)는 컨텐츠 DB(140)에 저장된 복수의 컨텐츠 정보를 대상으로 상기 구간 식별 정보를 기초로 스캔하여 구간 식별정보의 각 속성정보와 순서대로 일치하는 각 속성정보가 포함된 복수의 연속되는 특징점 정보를 식별하고, 이를 통해 컨텐츠 정보 1에 대해서는 해당 복수의 연속되는 특징점 정보로 이루어진 구간인 페이지 1부터 페이지 4까지를 특징점 비교 대상 구간으로 설정하고, 컨텐츠 정보 n에 대해서는 페이지 14부터 페이지 17까지를 특징점 비교 대상 구간으로 설정하여 이에 대한 비교 구간 정보를 생성할 수 있다.

이에 따라, 상기 판단부(110)는 도 8에 도시된 바와 같이 컨텐츠 DB(140)에 저장된 원본 컨텐츠에 대한 컨텐츠 정보들 중에서 상기 비교 구간 정보에 해당되는 컨텐츠 정보를 대상으로 특징점 비교를 수행할 수 있으며, 상기 비교 구간 정보에 따라 특징점 비교 대상 구간만을 대상으로 상기 식별 대상 정보에 포함된 특징점 정보와 상기 특징점 비교 대상 구간에 속한 특징점 정보를 정렬 순서가 상호 일치하는 특징점 정보끼리 순서대로 비교하여 상기 식별 대상 정보에 포함된 특징점 정보의 개수 대비 특징점 정보의 일치 개수에 대한 상기 비율이 미리 설정된 기준치 이상인 컨텐츠 정보를 추출할 수 있으며, 이를 통해 상기 식별 대상 정보에 대응되는 식별 대상 컨텐츠가 상기 컨텐츠 정보에 대응되는 불법 복제 컨텐츠인 것으로 판단할 수 있다.

즉, 도시된 바와 같이 상기 판단부(110)는 컨텐츠 DB(140)에 저장된 모든 원본 컨텐츠를 대상으로 하지 않고 파라미터에 대한 정보만으로 식별 대상 컨텐츠와 관련성이 높다고 판단되는 원본 컨텐츠만을 특징점 비교 대상으로 간추려 한정할 수 있으며, 이를 통해 특징점 비교 과정에 대한 연산량을 대폭 감소시킬 수 있는 동시에 복제 여부 판단에 대한 처리 속도를 향상시켜 시스템 효율성을 높일 수 있다.

한편, 상술한 구성에서 상기 판단부(110)는 상기 컨텐츠 DB(140)에서 컨텐츠 정보에 매칭 저장된 복수의 특징점 정보 각각으로부터 속성정보만을 추출하여 특징점 정보의 정렬 순서에 따라 정렬한 이미지 요약정보를 별도 생성하여 상기 컨텐츠 정보와 매칭하여 상기 컨텐츠 DB(140)에 저장할 수 있다.

이를 통해, 상기 판단부(110)는 상기 구간 식별정보와 이미지 요약정보를 비교하여 더욱 편리하게 상기 구간 식별정보에 해당되는 특징점 정보로 이루어진 구간을 상기 이미지 요약정보로부터 추출할 수 있으며, 이를 통해 연산량 및 처리 속도를 더욱 향상시킬 수도 있다.

도 9는 본 발명의 실시예에 따른 불법 복제된 서적의 통합 식별 방법에 대한 순서도로서, 도시된 바와 같이 상기 불법 복제된 서적의 통합 식별 시스템이 구성된 서버는 서로 다른 원본 컨텐츠 각각에 대하여 상기 원본 컨텐츠를 구성하는 복수의 원본 이미지를 추출하고, 각 원본 이미지를 분석하여 그림 및 글자 중 빈도가 높은 파라미터에 따라 각 원본 이미지에 대응되어 속성정보를 부여하며, 상기 각 원본 이미지에 대응되는 속성정보에 따라 그림 및 글자에 각각 대응되는 특징점 추출 알고리즘 중 어느 하나를 통해 상기 각 원본 이미지의 특징점을 추출하여 상기 속성정보를 포함하는 특징점 정보를 생성한 후 각 특징점 정보에 해당되는 원본 이미지의 순서에 따라 상기 원본 컨텐츠에 대한 컨텐츠 정보와 매칭하여 DB(140)에 저장할 수 있다(S1).

한편, 상기 서버는 식별 대상 컨텐츠를 포함하는 식별 요청정보를 수신하는 경우(S2) 상기 식별 대상 컨텐츠를 구성하는 연속된 복수의 식별 대상 이미지를 미리 설정된 개수만큼 추출한 후(S3) 상기 각 식별 대상 이미지에 대응되어 상기 원본 컨텐츠에 대한 특징점 정보의 생성 방식과 동일한 방식으로 특징점 정보를 생성하고, 각 식별 대상 이미지에 대응되는 특징점 정보를 상기 식별 대상 이미지의 순서에 따라 정렬하여 그룹화한 식별 대상 정보를 생성할 수 있다(S4).

다음, 상기 서버는 상기 식별 대상 정보를 상기 DB(140)에 저장된 컨텐츠 정보별 특징점 정보와 비교하여(S5) 상기 식별 대상 정보의 각 특징점 정보와 순서대로 연속 일치하는 특징점 정보에 매칭된 컨텐츠 정보가 추출된 경우(S6, S7) 상기 식별 대상 컨텐츠를 상기 컨텐츠 정보에 대응되는 불법 복제 컨텐츠로 판단할 수 있다(S8).

본 명세서에 기술된 다양한 장치 및 구성부는 하드웨어 회로(예를 들어, CMOS 기반 로직 회로), 펌웨어, 소프트웨어 또는 이들의 조합에 의해 구현될 수 있다. 예를 들어, 다양한 전기적 구조의 형태로 트랜지스터, 로직게이트 및 전자회로를 활용하여 구현될 수 있다.

전술된 내용은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

110: 판단부 120: 이미지 분석부
130: 특징점 추출부 140: 컨텐츠 DB

Claims

서적을 이미지 형태로 변환한 컨텐츠로부터 이미지를 추출하고, 각 이미지를 분석하여 그림 및 글자 중 빈도가 높은 파라미터에 따라 각 이미지에 대응되어 속성정보를 부여하는 이미지 분석부;
상기 이미지별로 상기 속성정보에 따라 그림 및 글자에 각각 대응되는 특징점 추출 알고리즘 중 어느 하나를 통해 이미지의 특징점을 추출하여 상기 속성정보를 포함하는 특징점 정보를 생성하는 특징점 추출부; 및
서로 다른 원본 컨텐츠 각각에 대하여 상기 이미지 분석부 및 특징점 추출부와 연동하여 상기 원본 컨텐츠를 구성하는 원본 이미지별로 특징점 정보를 생성한 후 각 특징점 정보에 해당되는 원본 이미지의 순서에 따라 상기 원본 컨텐츠에 대한 컨텐츠 정보와 매칭하여 DB에 저장하고, 식별 대상 컨텐츠를 포함하는 식별 요청정보 수신시 상기 이미지 분석부 및 특징점 추출부와 연동하여 상기 식별 대상 컨텐츠를 구성하는 연속된 복수의 식별 대상 이미지를 미리 설정된 개수만큼 추출한 후 상기 각 식별 대상 이미지에 대응되어 생성한 특징점 정보를 상기 식별 대상 이미지의 순서에 따라 정렬하여 그룹화한 식별 대상 정보를 생성한 후 상기 DB에 저장된 컨텐츠 정보별 특징점 정보와 비교하여 상기 식별 대상 정보의 각 특징점 정보와 순서대로 일치하는 특징점 정보에 매칭된 컨텐츠 정보가 추출되면 상기 식별 대상 컨텐츠를 상기 컨텐츠 정보에 대한 불법 복제 컨텐츠로 판단하는 판단부
를 포함하는 불법 복제된 서적의 통합 식별 시스템.
청구항 1에 있어서,
상기 속성정보는 상기 특징점 정보를 구성하는 복수의 비트 중 MSB 또는 LSB로 구성되는 것을 특징으로 하는 불법 복제된 서적의 통합 식별 시스템.
청구항 1에 있어서,
상기 판단부는 상기 원본 이미지 또는 식별 대상 이미지에 부여된 파일명 또는 각 이미지의 페이지 순서에 따라 상기 원본 이미지 또는 식별 대상 이미지의 순서를 식별하는 것을 특징으로 하는 불법 복제된 서적의 통합 식별 시스템.
청구항 1에 있어서,
상기 판단부는 상기 식별 대상 정보를 구성하는 각 특징점 정보에 포함된 속성정보를 상기 식별 대상 이미지의 순서에 따라 정렬한 구간 식별 정보를 생성하고, 상기 구간 식별 정보를 상기 DB에 저장된 각 특징점 정보의 속성정보와 컨텐츠 정보별로 비교하여 상기 구간 식별 정보에 따른 각 속성정보와 순서대로 연속 일치하는 복수의 특징점 정보로 구성된 비교 구간을 설정하고, 상기 비교 구간에 대해서만 상기 식별 대상 정보에 포함된 특징점 정보와 상기 구간에 속한 특징점 정보를 상호 비교하는 것을 특징으로 하는 불법 복제된 서적의 통합 식별 시스템.
청구항 4에 있어서,
상기 판단부는 상기 구간에 속한 각 특징점 정보와 상기 식별 대상 정보에 포함된 각 특징점 정보를 동일 순서끼리 상호 비교하여 일치 여부를 판단하는 것을 특징으로 하는 불법 복제된 서적의 통합 식별 시스템.
청구항 4에 있어서,
상기 판단부는 상기 구간 식별 정보에 포함된 각 속성 정보와 상기 DB에서 컨텐츠 정보에 매칭되어 순서가 연속되는 각 특징점 정보에 포함된 속성 정보를 상호 비교하여 연속 일치하는 일치 개수를 산출하고, 상기 구간 식별 정보에 포함된 속성정보의 개수 대비 상기 일치 개수의 비율이 미리 설정된 기준치 이상인 구간을 상기 비교 구간으로 설정하는 것을 특징으로 하는 불법 복제된 서적의 통합 식별 시스템.
청구항 4에 있어서,
상기 판단부는 상기 DB로부터 상기 컨텐츠 정보별로 매칭 저장된 복수의 특징점 정보 각각으로부터 속성정보만을 추출하여 특징점 정보의 정렬 순서에 따라 정렬한 이미지 요약정보를 생성한 후 상기 컨텐츠 정보와 매칭하여 상기 DB에 저장하고, 상기 구간 식별정보와 이미지 요약정보를 비교하여 상기 구간 식별정보의 각 속성정보와 순서대로 일치하는 구간을 상기 이미지 요약정보로부터 식별하고, 식별된 구간을 상기 비교 구간으로 설정하는 것을 특징으로 하는 불법 복제된 서적의 통합 식별 시스템.
청구항 1에 있어서,
상기 판단부는 상기 식별 대상 이미지로부터 추출된 특징점 정보와 상기 원본 이미지로부터 추출된 특징점 정보의 상호 비교시 유사도를 산출하고, 유사도가 미리 설정된 기준치 이상인 경우 상기 식별 대상 이미지의 특징점 정보와 상기 원본 이미지의 특징점 정보가 상호 일치하는 것으로 판단하는 것을 특징으로 하는 불법 복제된 서적의 통합 식별 시스템.
청구항 1에 있어서,
상기 판단부는 상기 컨텐츠 정보별로 상기 원본 컨텐츠의 각 특징점 정보와 상기 식별 대상 정보를 비교하여, 상기 식별 대상 정보와 비교된 상기 원본 컨텐츠의 특징점 정보들 중 상기 식별 대상 정보에 포함된 특징점 정보와 상호 일치하는 특징점 정보를 식별하여 일치 개수를 산출하고, 상기 식별 대상 정보를 구성하는 특징점 정보의 개수 대비 상기 일치 개수의 비율을 산출하며, 해당 비율이 미리 설정된 기준치 이상인 컨텐츠 정보를 상기 DB로부터 추출하여, 상기 식별 대상 컨텐츠를 상기 컨텐츠 정보에 대한 불법 복제 컨텐츠로 판단하는 것을 특징으로 하는 불법 복제된 서적의 통합 식별 시스템.
원본 서적을 이미지 형태로 변환하여 복제한 불법 복제 컨텐츠를 식별하는 장치의 불법 복제된 서적의 통합 식별 방법에 있어서,
서로 다른 원본 컨텐츠 각각에 대하여 상기 원본 컨텐츠를 구성하는 복수의 원본 이미지를 추출하고, 각 원본 이미지를 분석하여 그림 및 글자 중 빈도가 높은 파라미터에 따라 각 원본 이미지에 대응되어 속성정보를 부여하며, 상기 각 원본 이미지에 대응되는 속성정보에 따라 그림 및 글자에 각각 대응되는 특징점 추출 알고리즘 중 어느 하나를 통해 이미지의 특징점을 추출하여 상기 속성정보를 포함하는 특징점 정보를 생성한 후 각 특징점 정보에 해당되는 원본 이미지의 순서에 따라 상기 원본 컨텐츠에 대한 컨텐츠 정보와 매칭하여 DB에 저장하는 단계;
식별 대상 컨텐츠를 포함하는 식별 요청정보를 수신하는 단계;
상기 식별 대상 컨텐츠를 구성하는 연속된 복수의 식별 대상 이미지를 미리 설정된 개수만큼 추출한 후 상기 각 식별 대상 이미지에 대응되어 상기 원본 컨텐츠에 대한 특징점 정보의 생성 방식과 동일한 방식으로 특징점 정보를 생성하고, 각 식별 대상 이미지에 대응되는 특징점 정보를 상기 식별 대상 이미지의 순서에 따라 정렬하여 그룹화한 식별 대상 정보를 생성하는 단계; 및
상기 식별 대상 정보를 상기 DB와 컨텐츠 정보별 특징점 정보와 비교하여 상기 식별 대상 정보의 각 특징점 정보와 순서대로 연속 일치하는 특징점 정보에 매칭된 컨텐츠 정보가 추출된 경우 상기 식별 대상 컨텐츠를 상기 컨텐츠 정보에 대응되는 불법 복제 컨텐츠로 판단하는 단계
를 포함하는 불법 복제된 서적의 통합 식별 방법.