KR102113756B1 - 이미지 출처 확인을 통한 무단 사용 방지 시스템 - Google Patents

이미지 출처 확인을 통한 무단 사용 방지 시스템 Download PDF

Info

Publication number
KR102113756B1
KR102113756B1 KR1020180166033A KR20180166033A KR102113756B1 KR 102113756 B1 KR102113756 B1 KR 102113756B1 KR 1020180166033 A KR1020180166033 A KR 1020180166033A KR 20180166033 A KR20180166033 A KR 20180166033A KR 102113756 B1 KR102113756 B1 KR 102113756B1
Authority
KR
South Korea
Prior art keywords
document
unit
image
information
feature point
Prior art date
Application number
KR1020180166033A
Other languages
English (en)
Inventor
강호갑
윤희돈
Original Assignee
주식회사 디알엠인사이드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 디알엠인사이드 filed Critical 주식회사 디알엠인사이드
Priority to KR1020180166033A priority Critical patent/KR102113756B1/ko
Application granted granted Critical
Publication of KR102113756B1 publication Critical patent/KR102113756B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/604Tools and structures for managing or administering access control systems
    • G06K9/46
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Technology Law (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 다양한 종류의 문서를 이미지 기반으로 변환하여 관리하도록 함으로써 문서의 무단 사용이나 복제는 물론이고 문서에 포함된 부속 정보가 별도로 존재하는 경우에도 그 정보의 출처를 명확히 확인할 수 있도록 한 이미지 출처 확인을 통한 무단 사용 방지 시스템에 관한 것으로서, 문서를 이미지 형태로 변환하고, 해당 문서 이미지에 대한 특징점을 추출하여 저장하며, 해당 문서에 포함된 그림, 사진, 도면, 표, 문단 등의 부속 정보를 관심 영역으로 식별하여 해당 부속 정보에 대한 특징점을 추출 및 저장한 다음, 식별이 필요한 대상 문서에 대해 이를 이미지로 변환한 후 문서 이미지에 대한 특징점 기반 비교와 부속 정보에 대한 관심 영역 기반 비교를 통해서 문서의 출처나 부속 정보의 출처를 확인하고, 해당 출처에 대한 보안 기준을 통해 보안 위반 여부를 신속하고 정확하게 파악할 수 있는 효과가 있다.

Description

이미지 출처 확인을 통한 무단 사용 방지 시스템{System and method for identifying online comics based on region of interest}
본 발명은 이미지 출처 확인을 통한 무단 사용 방지 시스템에 관한 것으로서, 더욱 상세히는 다양한 종류의 문서를 이미지 기반으로 변환하여 관리하도록 함으로써 문서의 무단 사용이나 복제는 물론이고 문서에 포함된 부속 정보가 별도로 존재하는 경우에도 그 정보의 출처를 명확히 확인할 수 있도록 한 이미지 출처 확인을 통한 무단 사용 방지 시스템에 관한 것이다.
다양한 종류의 문서들과 문서 형식의 컨텐츠들이 범람하고 있는 환경에서, 개인 창작물이나 기업의 보안 문서를 보호하기 위한 다양한 기술들이 제시되고 있다.
각종 도서나 문서들에 대한 보안은 현재 기업 기밀 정보를 보호하기 위해 사용되고 있는 DLP(Data Loss Prevention) 시스템과 같은 보안 기술을 통해 어느정도 보호할 수 있다. 이러한 DLP 시스템은 메일, 문서 등에 중요한 기밀정보 또는 개인식별정보 등을 포함하고 있는지의 여부를 텍스트 기반으로 검사하여 접근 및 차단 여부를 결정하는 구조로 되어 있으며, 이러한 문자기반 컨텐츠를 PDF(Portable Document Format) 파일이나 스캔된 이미지 파일로 변환하여 보관하는 경우에 대응하기 위해서 PDF 문서에서 글자만 파싱하는 모듈을 이용하거나 이미지 파일에서 글자 부분을 OCR(Optical Character Reader/Recognition) 기술을 통해서 판독하여 텍스트 기반으로 검사하는 구성을 포함하기도 한다.
이러한 DLP 시스템의 경우 문서에 포함된 텍스트 부분은 평이하지만 첨부된 이미지에 기밀로 관리되는 그림, 사진, 디자인, 설계자료 등이 포함되는 경우 이를 선별하지 못하는 문제가 있으며, 이미지 형식의 문서를 검사하는 경우 이미지에 포함된 문자를 판독하기 위한 시간이 오래 걸리며 그 정확도가 낮아 신뢰성에 문제가 발생할 수 있다.
나아가, 이러한 텍스트 기반의 경우 지원하지 않는 외국어나 문자의 파자 등을 통해 그 내용이 파악되지 않는 사례도 빈번하므로 신뢰 수준이 높지 않은 실정이다. 특히, 문서 내용의 다양성과 포함된 컨텐츠의 중요도 변화에 따라 텍스트 보다는 문서에 포함된 각종 그림, 표, 사진, 도면, 도형 등과 같은 비정형 요소들에 대한 중요성이 커지고 있을 뿐만 아니라, 이러한 문서 내용 중 일부만 선별 추출된 복사본에 대해서는 그 관리나 출처 확인등이 어려워 전통적인 텍스트 기반 보안 방식으로는 효율적으로 문서 내용의 무단 사용을 방지하기가 어려운 상황이다.
좀 더 강력한 방법으로 DRM(Digital Rights Management)과 같은 암호화 방식으로 문서를 암호화하여 중요 정보를 보호하는 기술이 존재하는데, 이는 열람이나 접근 등급에 따라 차등하게 문서를 이용할 수 있도록 하는 것이다. 지금까지 알려진 가장 효과적인 보안기술이기는 하지만, 화면 캡쳐, 카메라 촬영 등의 방법으로 보안 통제를 벗어나는 우회가 가능하므로 완전한 보안이나 출처 확인이 어렵고, 암호화를 위한 전용 어플리케이션의 적용과 갱신등이 필요하여 기업 부담이 증가하게 된다. 나아가, 일반적인 상용 문서편집장치는 이러한 특정 업체의 DRM 기술을 지원하지 않기 때문에 API 후킹과 같은 편법을 사용하게 되는데, 운영체제 별 지원 여부나 사용 운영체제의 업그레이드에 따라 DRM 기술의 수정이 필요하여 많은 비용과 불편함이 발생하며, 문서의 암호화 및 복호화를 위한 지연과 부하도 발생하게 된다.
특히, 일부 국가에서는 사용자를 잠재적인 범죄자로 간주하여 문서를 암호화하는 DRM 기술 보다는 보관 파일에 대한 보안문서를 탐지하여 경고하는 DLP 기술을 선호하고 있는 실정이어서, 현실적으로 다양한 문서나 그에 포함된 컨텐츠에 대한 보안성을 높이는데 한계가 있다.
나아가, 보안 문서의 일부나 포함된 부속 정보(그림, 사진, 도면, 표 등)를 다른 문서에 삽입하는 경우 해당 부속 정보의 출처를 확인하기 어렵고, 문서 중 일부만 파편화되어 존재하는 경우 해당 일부의 출처를 확인하기 어렵다.
따라서, 문서의 종류나 언어 및 포함된 부속 정보들에 대한 중요도나 보안 여부를 신속하게 확인하고, 파편화된 내용이나 스캔 혹은 촬영된 일부 내용이라 하더라도 그 출처를 확인한 후 이를 기반으로 보안 기준의 위반이나 무단 사용을 확인할 수 있으면서, 사용자의 부하 증가는 경감할 수 있도록 하는 새로운 방식의 무단 사용 방지 기술이 필요한 실정이다.
한국공개특허 제10-2005-0026769호 [온라인 만화 불법 복제방지 시스템 및 방법] 한국 등록특허 제10-1640902호 [HTML 문서에 포함되는 콘텐츠를 보호하는 장치 및 방법]
전술한 문제점을 해결하기 위한 본 발명의 목적은 문서를 이미지 형태로 변환하고, 해당 문서 이미지에 대한 특징점을 추출하여 저장하며, 해당 문서에 포함된 그림, 사진, 도면, 표 등의 부속 정보를 관심 영역으로 식별하여 해당 부속 정보에 대한 특징점을 추출 및 저장한 다음, 식별이 필요한 대상 문서에 대해 이를 이미지로 변환한 후 문서 이미지에 대한 특징점 기반 비교와 부속 정보에 대한 관심 영역 기반 비교를 통해서 문서의 출처나 부속 정보의 출처를 확인하고, 해당 출처에 대한 보안 기준을 통해 보안 위반 여부를 신속하고 정확하게 파악할 수 있도록 한 이미지 출처 확인을 통한 무단 사용 방지 시스템을 제공하는 것이다.
특히 본 발명의 다른 목적은 문서의 편집을 통해 부속 정보의 위치가 변경되거나 복수 페이지에 걸쳐 있거나, 식별 대상 문서가 일부 부속 정보에 대한 것만 존재하거나, 혹은 인쇄된 내용에 대해서도 해당 문서나 부속 정보를 토대로 출처를 확인하여 무단 사용 여부를 확인할 수 있도록 한 이미지 출처 확인을 통한 무단 사용 방지 시스템을 제공하는 것이다.
본 발명의 실시예에 따른 이미지 출처 확인을 통한 무단 사용 방지 시스템은 원본 문서를 이미지로 변환하여 해당 원본 문서의 특징점을 추출한 후 해당 원본 문서에 대한 정보와 함께 제공하고, 식별 요청에 따른 문서를 이미지로 변환하여 해당 식별 요청 문서의 특징점을 추출한 후 제공하는 보안 에이전트부와, 보안 에이전트부가 제공하는 원본 문서의 특징점을 해당 원본 문서 정보와 함께 등록 저장하고, 식별 요청에 따라 보안 에이전트가 제공하는 식별 요청 문서의 특징점을 등록 저장된 원본 문서의 특징점과 비교하여 해당 식별 요청 문서에 대응되는 원본 문서 정보를 검출하는 문서 보안 필터링 서버를 포함한다.
일례로서, 보안 에이전트부는 원본 문서와 해당 원본 문서에 대한 정보를 제공하는 문서 관리 서버에 구성되거나 적어도 연동하는 단말에 구성되며, 상기 원본 문서에 대한 정보는 문서명, 문서 관리번호, 문서 버전, 등록자, 등록일 중 적어도 하나 이상을 포함하는 문서 관리 정보와, 보안 등급과 접근 등급 중 적어도 하나를 포함하는 접근통제 정보와, 해당 문서의 유효, 수정, 폐기 중 적어도 하나를 포함하는 문서 상태 정보를 포함할 수 있다.
일례로서, 보안 에이전트부는 원본 문서와 그에 대한 문서 정보를 수신하고, 식별이 요청된 문서를 수집하는 문서 수집부와, 수집된 문서를 이미지로 변환하는 문서-이미지 변환부와, 문서-이미지 변환부에서 변환된 이미지에 대한 특징점을 추출하는 문서 특징점 추출부와, 문서-이미지 변환부에서 변환된 이미지에 포함된 부속 정보 중 관심 영역을 선별하여 선별된 관심 영역에 대한 특징점을 추출하는 부속 정보 특징점 추출부와, 문서 수집부에서 수집된 원본 문서에 대해 문서 특징점 추출부 및 부속 정보 특징점 추출부에서 추출한 특징점들과 문서 정보를 문서 보안 필터링 서버에 제공하는 특징점 등록부와, 식별 요청에 따라 상기 문서 수집부에서 수집된 식별 요청된 문서에 대해 문서 특징점 추출부 및 부속 정보 특징점 추출부에서 추출한 특징점들을 문서 보안 필터링 서버에 제공하는 식별 요청부를 포함할 수 있다.
일례로서, 문서 보안 필터링 서버는 보안 에이전트부의 식별 요청부를 통해 제공되는 문서 특징점 추출부의 특징점을 기반으로 페이지 단위로 기 등록된 문서와 비교하여 대응 문서를 검색하는 페이지 검사부와, 식별 요청부를 통해 제공되는부속 정보 특징점 추출부의 특징점을 기반으로 관심 영역에 대해 저장된 특징점을 검색하는 부속 검사부를 통해 식별 요청 문서에 대응되는 원본 문서 정보를 검출하는 매칭 검사부를 포함할 수 있다.
일례로서, 문서 보안 필터링 서버는 보안 에이전트부의 식별 요청부를 통해 제공되는 특징점들과 등록된 원본 문서의 특징점들을 비교하여 그 출처를 검출하고, 해당 출처가 되는 원본 문서의 문서 정보에 따라 무단 사용 여부를 판정한 후 그 결과를 보안 에이전트부에 제공할 수 있다.
일례로서, 보안 에이전트부의 문서 수집부는 식별이 요청된 문서로서 카메라 촬영 이미지나 스캔된 문서의 이미지를 수집하며, 이 경우 문서-이미지 변환부는 수집된 이미지의 포맷을 변경하거나 특징을 정규화하여 문서 특징점 추출부와 부속 정보 특징점 추출부에 제공할 수 있다.
일례로서, 부속 정보 특징점 추출부는 문서 이미지에서 경계선 검출을 통해 관심 영역을 추출하는 관심 영역 추출부와, 관심 영역을 미리 설정된 정규화 크기로 정규화한 정규화 이미지를 생성하는 정규화부와, 상기 정규화 이미지를 미리 설정된 크기의 복수의 블록으로 분할하고, HOG(Histogram of Oriented Gradient) 기반으로 상기 블록별로 하나 이상의 지배 기울기를 산출하는 영상 분석부와, 상기 관심 영역을 구성하는 상기 블록별 상기 하나 이상의 지배 기울기를 미리 설정된 기준에 따라 이진화 처리한 N 비트값의 특징점 정보를 상기 관심 영역에 대응되어 생성하는 특징점 추출부를 포함할 수 있다.
일례로서, 관심 영역 추출부는 문서 이미지에 포함된 부속 정보가 복수 페이지에 걸져있는 경우 그 연결성을 고려하여 복수 페이지에 포함된 부속 정보들을 추출한 후 결합하여 하나의 관심 영역으로 산출하되, 그 관심 영역의 크기를 약속된 기준에 따라 하나로 하거나 복수로 분할할 수 있다.
일례로서, 특징점 추출부는 단위 블록을 미리 설정된 개수의 복수의 셀로 분할하고, HOG를 기반으로 단위 셀별로 산출된 기울기를 취합하여 방향별 기울기의 크기를 산출하고, 미리 설정된 기준 크기 이상의 크기를 가진 하나 이상의 지배 기울기를 상기 단위 블록에 대응되어 산출할 수 있다.
일례로서, 특징점 추출부는 상기 하나 이상의 지배 기울기 각각의 방향에 따라 미리 설정된 복수의 각도 범위별로 지배 기울기의 존재 여부를 판단하고, 상기 복수의 각도범위별로 상기 지배 기울기의 존재 여부에 따라 이진화 처리할 수 있다.
본 발명의 실시예에 따른 이미지 출처 확인을 통한 무단 사용 방지 시스템은 문서를 이미지 형태로 변환하고, 해당 문서 이미지에 대한 특징점을 추출하여 저장하며, 해당 문서에 포함된 그림, 사진, 도면, 표 등의 부속 정보를 관심 영역으로 식별하여 해당 부속 정보에 대한 특징점을 추출 및 저장한 다음, 식별이 필요한 대상 문서에 대해 이를 이미지로 변환한 후 문서 이미지에 대한 특징점 기반 비교와 부속 정보에 대한 관심 영역 기반 비교를 통해서 문서의 출처나 부속 정보의 출처를 확인하고, 해당 출처에 대한 보안 기준을 통해 보안 위반 여부를 신속하고 정확하게 파악할 수 있는 효과가 있다.
특히 본 발명은 문서의 언어, 각종 부속 정보의 종류에 무관한 출처 확인이 가능하며, 문서의 편집을 통해 부속 정보의 위치가 변경되거나 복수 페이지에 걸쳐 있거나, 식별 대상 문서에 일부 부속 정보만 존재하거나, 혹은 인쇄된 내용에 대해서도 해당 문서나 부속 정보를 토대로 출처를 확인하여 무단 사용 여부를 확인할 수 있는 효과가 있다.
나아가, 본 발명은 신속한 문서의 특징점 추출을 통해서 변형되지 않은 문서의 출처를 대단히 신속하게 확인할 수 있으며, 부속 정보에 대응되는 관심영역의 경우는 HOG 기반 영상 분석 알고리즘을 통해 블록을 기반으로 추출되는 지배 기울기를 이진화 처리하여 특징점을 산출하도록 하여 전체 페이지의 특징점을 다수 추출하는 경우에 비해 그 추출 속도가 빠르면서도 정확도가 높으며, 화질이나 해상도를 변경하는 경우에 대해서도 높은 식별 정확도를 제공하는 효과가 있다.
도 1은 본 발명의 실시예에 따른 이미지 출처 확인을 통한 무단 사용 방지 시스템의 구성도.
도 2는 본 발명의 실시예에 따른 이미지 출처 확인을 통한 무단 사용 방지 시스템의 적용 대상 문서들의 예시.
도 3은 본 발명의 실시예에 따른 부속 정보 특징점 추출부 구성도.
도 4 및 도 5는 본 발명의 실시예에 따른 문서 내 관심 영역 선별 방식의 예.
도 6 내지 도 10은 본 발명의 실시예에 따른 부속 정보 특징점 추출부의 동작 과정을 구체적으로 설명하기 위한 개념도.
도 11은 본 발명의 다른 실시예에 따른 이미지 출처 확인을 통한 무단 사용 방지 시스템의 구성도.
본 발명에서 사용되는 기술적 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 발명에서 사용되는 기술적 용어는 본 발명에서 특별히 다른 의미로 정의되지 않는 한 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나 과도하게 축소된 의미로 해석되지 않아야 한다. 또한, 본 발명에서 사용되는 기술적인 용어가 본 발명의 사상을 정확하게 표현하지 못하는 잘못된 기술적 용어일 때에는 당업자가 올바르게 이해할 수 있는 기술적 용어로 대체되어 이해되어야 할 것이다. 또한, 본 발명에서 사용되는 일반적인 용어는 사전에 정의되어 있는 바에 따라 또는 전후 문맥상에 따라 해석되어야 하며, 과도하게 축소된 의미로 해석되지 않아야 한다.
또한, 본 발명에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함한다. 본 발명에서 "구성된다" 또는 "포함한다" 등의 용어는 발명에 기재된 여러 구성 요소들 또는 여러 단계를 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.
또한, 본 발명에서 사용되는 제 1, 제 2 등과 같이 서수를 포함하는 용어는 구성 요소들을 설명하는데 사용될 수 있지만 구성 요소들은 용어들에 의해 한정되어서는 안 된다. 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성 요소는 제 2 구성 요소로 명명될 수 있고, 유사하게 제 2 구성 요소도 제 1 구성 요소로 명명될 수 있다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
또한, 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 발명의 사상을 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 발명의 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다.
특히, 이하 본 발명의 실시예에서 설명하는 보안 에이전트부는 실질적으로는 제어부, 메모리, 입출력 인터페이스, 통신 장치 등으로 구성되는 컴퓨터나 서버, 혹은 각종 단말 장치를 통해 수행되는 소프트웨어로 구성될 수 있으며, 본 발명의 실시예에서 등장하는 각종 서버나 사용자 단말 혹은 사용자 휴대 단말 장치에 그 일부로서 구성될 수도 있고 별도로 이들과 연동하는 단말 혹은 서버에 구성될 수도 있다.
이하, 도면을 참고하여 본 발명의 상세 실시예를 설명한다.
도 1은 본 발명의 실시예에 따른 이미지 출처 확인을 통한 무단 사용 방지 시스템의 구성도이다.
도시된 바와 같이 문서 관리 서버(10)로부터 원본 문서와 문서 정보를 수신하여 문서에 대한 특징점을 추출하는 보안 에이전트부(100)와, 보안 에이전트부(100)가 추출한 특징점과 문서 정보를 등록하여 저장하는 문서 보안 필터링 서버(200)를 포함한다.
이러한 보안 에이전트부(100)는 식별 요청 정보(새로운 문서를 검출하거나 특정 문서에 대한 식별이 요청되거나, 혹은 특정 문서 사용 서버의 요청이 있는 경우 등)에 따라 문서 사용 서버(20)의 문서들에 대한 특징점을 추출하여 문서 보안 필터링 서버(200)에 제공하고 그 원본 문서를 찾아 문서 정보에 포함된 접근통제 정보를 기반으로 무단 사용 여부를 판정한다.
여기서, 원본 문서에 대한 정보는 문서명, 문서 관리번호, 문서 버전, 등록자, 등록일 중 적어도 하나 이상을 포함하는 문서 관리 정보와, 보안 등급과 접근 등급 중 적어도 하나를 포함하는 접근통제 정보와, 해당 문서의 유효, 수정, 폐기 중 적어도 하나를 포함하는 문서 상태 정보를 포함할 수 있다.
문서 사용 서버(20)는 파일 서버, 메일 서버, 웹프록시 서버와 같은 다양한 종류의 문서 사용 서버를 포함하며, 실제 문서를 사용하거나 편집하는 사용자 단말도 포함될 수 있다.
이러한 보안 에이전트부(100)는 문서 관리 서버(10)의 일부로 포함되거나 연동하는 단말에 설치된 소프트웨어로서 구성될 수 있으며, 문서 사용 서버(20)나 사용자 단말 혹은 별도의 자체 단말에 소프트웨어로서 구성될 수 있다.
이러한 본 발명의 실시예에 따른 이미지 출처 확인을 통한 무단 사용 방지 시스템은 다양한 문서들을 통합적으로 관리하여 그 출처를 확인할 수 있는데, 도 2에 도시된 바와 같은 일반적인 문서(도 2a), 웹툰과 같은 이미지로 구성된 문서(도 2b), 만화책과 같은 이미지로 구성된 문서(도 2c), 프로그램 소스로 구성된 문서(도 2d), 데이터 표로 구성된 문서(도 2e), 설계도면으로 구성된 문서(도 2f) 등을 포함하는데, 이러한 예시적인 문서 외에도 다양한 종류의 문서들을 포괄할 수 있다.
특히, 본 발명은 문서 내부의 언어 종류, 텍스트에 대한 내용이나 의미, OCR이 어려운 내용 등에 무관하게 다양한 문서를 통합적으로 일괄 관리하여 그 전체 내용, 페이지 내용, 혹은 페이지 내부에 존재하는 부속 정보를 단위로 식별 대상의 출처를 찾아낼 수 있다.
이러한 본 발명의 구성을 도 1을 참조하여 좀 더 상세히 설명한다.
도시된 보안 에이전트부(100)는 원본 문서를 이미지로 변환하여 해당 원본 문서의 특징점을 추출한 후 해당 원본 문서에 대한 정보와 함께 제공하고, 식별 요청에 따른 문서를 이미지로 변환하여 해당 식별 요청 문서의 특징점을 추출한 후 제공하고, 문서 보안 필터링 서버(200)는 보안 에이전트부(100)가 제공하는 원본 문서의 특징점을 해당 원본 문서 정보와 함께 등록 저장하고, 식별 요청에 따라 보안 에이전트(100)가 제공하는 식별 요청 문서의 특징점을 등록 저장된 원본 문서의 특징점과 비교하여 해당 식별 요청 문서에 대응되는 원본 문서 정보를 검출한다.
이러한 보안 에이전트부(100)의 구성을 좀 더 상세히 살펴보면, 먼저 원본 문서와 그에 대한 문서 정보를 수신하고, 식별이 요청된 문서를 수집하는 문서 수집부(110)와, 수집된 문서를 이미지로 변환하는 문서-이미지 변환부(120)와, 문서-이미지 변환부(120)에서 변환된 이미지에 대한 특징점을 추출하는 문서 특징점 추출부(140)와, 문서-이미지 변환부(120)에서 변환된 이미지에 포함된 부속 정보 중 관심 영역을 선별하여 선별된 관심 영역에 대한 특징점을 추출하는 부속 정보 특징점 추출부(130)와, 문서 수집부(110)에서 수집된 원본 문서에 대해 문서 특징점 추출부(140) 및 부속 정보 특징점 추출부(130)에서 추출한 특징점들과 문서 정보를 문서 보안 필터링 서버(200)에 제공하는 특징점 등록부(150)와, 식별 요청에 따라 상기 문서 수집부(110)에서 수집된 식별 요청된 문서에 대해 문서 특징점 추출부(140) 및 부속 정보 특징점 추출부(130)에서 추출한 특징점들을 문서 보안 필터링 서버(200)에 제공하는 식별 요청부(160)를 포함한다.
즉, 본 발명의 실시예에서는 문서를 텍스트의 의미론적 특징으로 구분하는 것이 아니라 문서를 이미지로 변환하여 이미지의 형상 자체를 기반으로 문서의 각 페이지나 해당 페이지에 포함된 부속 정보를 식별한다.
특히, 전체 페이지에 대한 특징점을 추출하여 신속한 검색을 수행할 수 있도록 하는 토대를 마련하고, 문서의 내용이 일부 변형되거나 문서에 포함된 일부 부속 정보만 사용되는 경우에도 그 출처를 확인할 수 있도록 부속 정보의 특징점을 별도로 추출하여 이를 심층 식별한다. 본 발명에서는 이러한 부속 정보와 같은 비교적 작은 크기의 부속 정보만을 이미지로 선별하되, 수 많은 문서에 포함된 엄청난 규모의 각종 부속 정보들을 신속하게 대비하여 식별할 수 있도록 그 특징점 숫자는 적으면서도 그 식별력은 뛰어난 새로운 방식을 적용한다. 이는 이후 좀 더 상세히 설명하도록 한다.
이러한 문서를 이미지화하여 페이지와 부속 정보로 구분하여 각각 특징점을 추출하는 보안 에이전트부(100)에 대응하여 문서 보안 필터링 서버(200)에는 보안 에이전트부(100)의 식별 요청부(160)를 통해 제공되는 문서 특징점 추출부(140)의 특징점을 기반으로 페이지 단위로 기 등록된 문서와 비교하여 대응 문서를 검색하는 페이지 검사부와, 식별 요청부(160)를 통해 제공되는부속 정보 특징점 추출부(130)의 특징점을 기반으로 관심 영역에 대해 저장된 특징점을 검색하는 부속 검사부를 통해 식별 요청 문서에 대응되는 원본 문서 정보를 검출하는 매칭 검사부(210)를 포함한다. 나아가, 이러한 문서 보안 필터링 서버(200)는 보안 에이전트부(100)의 특징점 등록부(150)를 통해 등록되는 각종 특징점 정보와 문서 정보를 구분 저장하는 데이터베이스(220)를 포함한다. 도시된 예와 같이 문서명, 문서 관리번호, 문서 버전, 등록자, 등록일과 같은 문서 관리 정보와 문서의 유효, 수정, 폐기와 같은 문서 상태 정보를 저장하는 문서 정보 데이터베이스, 보안 등급과 접근 등급 등의 접근통제 정보를 저장하는 보안 정책 관리 데이터베이스, 문서 특징점 추출부(140)가 추출한 문서의 페이지 단위 특징점 정보를 저장하는 문서 이미지 특징점 데이터베이스, 부속 정보 특징점 추출부(130)가 추출하는 페이지 내 관심 영역에 대한 특징점을 저장하는 부속 정보 특징점 데이터베이스를 포함할 수 있다.
한편, 문서 보안 필터링 서버(200)는 보안 에이전트부(100)의 식별 요청부(160)를 통해 제공되는 특징점들과 등록된 원본 문서의 특징점들을 비교하여 그 출처를 검출하고, 해당 출처가 되는 원본 문서의 문서 정보에 따라 무단 사용 여부를 판정한 후 그 결과(출처에 해당하는 문서 정보와 보안등급/접근 등급 등 보안 정보)를 보안 에이전트부(100)의 식별 요청부(160)에 제공한다.
보안 에이전트부(100)는 설정된 관리자에게 보안 침해 정보를 신고하는 보안 신고부(170)를 포함할 수 있는데, 식별 요청부(160)는 문서 보안 필터링 서버(200)를 통해 식별 요청 문서에 대한 무단 사용 여부 결과를 수신하여 무단 사용인 경우 보안 신고부(170)에 무단 사용 여부 결과(출처에 해당하는 문서 정보와 보안등급/접근 등급 등 보안 정보)를 보안 침해 정보로서 제공하며, 보안 신고부(170)는 이러한 정보를 관리자에게 전달할 수 있다. 관리자는 이러한 보안 침해 정보를 확인하여 해당 식별 요청 문서를 보유하거나 생성한 사용자에게 보안 경고를 보낼 수 있다.
실질적으로 본 발명의 실시예에 따른 문서 특징점 추출부(140)는 페이지를 단위로 하여 신속한 검색(일치 페이지가 있는 문서를 우선 선별)을 수행하기 위한 것이므로 페이지의 전체 이미지에 대한 주파수 특성을 기반으로 특징점을 추출하거나, 문장과 부속 정보의 배치 형상을 기준으로 특징점을 추출하거나, 이미지에 포함된 경계를 추출한 후 경계의 히스토그램 특징을 기준으로 특징점을 추출하는 등의 알려져 있는 다양한 방식의 특징점 추출 방식이 적용될 수 있다. 간단하게는 문서의 종류를 판단하여 문장 위주의 페이지인지, 그림 포함 페이지인지, 그림 위주의 페이지인지, 표 위주의 페이지 인지 등을 구분한 후 각 구분된 페이지에 대해 별도로 설정된 간소화된 특징 추출 방식(예를 들어 문장의 경우 들여쓰기 패턴과 문장의 마침표 위치 등)을 적용할 수도 있다.
하지만, 하나의 페이지에 포함되는 다양한 부속 정보의 경우 상대적으로 그 크기가 작을 수 있고 변화의 정도가 작거나 유사한 내용들이 많아 그 출처를 신뢰성 있게 구분할 수 있는 정도의 특징을 선별하는데 많은 시간이 걸리거나 선별 특징점들의 수가 많아 검색에 많은 시간이 걸릴 수도 있다.
본 발명에서는 문서나 페이지에 대비하여 그 수가 엄청나게 많으면서도 그 크기는 상대적으로 작은 부속 정보의 특징점을 적은 수로 추출하면서도 그 선별 신뢰성을 높일 수 있도록 하는 부속 정보 특징점 추출부를 구성한다.
도 3은 본 발명의 실시예에 따른 부속 정보 특징점 추출부 구성도로서, 도시된 바와 같이 문서 이미지에서 경계선 검출을 통해 관심 영역을 추출하는 관심 영역 추출부(131)와, 관심 영역을 미리 설정된 정규화 크기로 정규화한 정규화 이미지를 생성하는 정규화부(132)와, 정규화 이미지를 미리 설정된 크기의 복수의 블록으로 분할하고, HOG(Histogram of Oriented Gradient) 기반으로 상기 블록별로 하나 이상의 지배 기울기를 산출하는 영상 분석부(133)와, 관심 영역을 구성하는 상기 블록별 상기 하나 이상의 지배 기울기를 미리 설정된 기준에 따라 이진화 처리한 N 비트값의 특징점 정보를 상기 관심 영역에 대응되어 생성하는 특징점 추출부(134)를 포함한다.
먼저, 관심 영역 추출부(131)는 문서에 포함된 부속 정보를 관심 영역으로 추출하는 것으로, 이미지화된 문서에서 하나의 덩어리를 이루는 영역을 기본적인 관심 영역으로 구분할 수 있는데, 우선 그림, 사진, 표, 도면 등과 같은 텍스트가 아닌 영역을 우선 선별할 수 있다. 물론, 텍스트로 이루어진 한 덩어리의 문단를 하나의 관심 영역으로 선별할 수도 있다.
도 4 및 도 5는 본 발명의 실시예에 따른 문서 내 관심 영역 선별 방식의 예로서, 도 4에 도시된 바와 같이 배경에 대비하여 하나의 덩어리를 이루는 영역(즉, 경계를 경계선을 통해 구분할 수 있는 영역) 중 텍스트가 아닌 영역을 우선 선별할 수 있다. 도 4a는 문서에 포함된 표를 관심 영역으로 추출한 경우이고, 도 4b는 문서에 포함된 이미지 중에서 배경과 다른 컷들을 관심 영역으로 추출한 경우이며, 도 4c는 설계도에서 구분된 각 도면 영역들과 설계 정보가 표시된 표를 관심 영역으로 추출한 경우이다.
하지만, 본 발명의 경우 문서를 대상으로 한다는 점에서 한 페이지의 내용으로 그치는 것이 아니라 이러한 부속 정보에 따른 관심 영역이 여러 페이지에 걸쳐서 표시될 수 있다. 특히, 이러한 부속 정보는 실질적으로 간단한 조작에 의해 페이지에 걸쳐 있는 부분이 변경될 수 있어 부속 정보의 대상이 달라질 수 있게 된다.
따라서, 도 5에 도시된 바와 같이 페이지(11)에 포함된 부속 정보 중 관심 영역으로 선별된 부분이 페이지의 상단이나 하단에 존재하는 경우 이전 페이지나 다음 페이지에 관련 부속 정보가 연속하여 존재하는 지 확인할 수 있으며, 연속하여 존재하는 경우 해당 페이지들을 부속 정보를 기준으로 이어진 이미지로 변환한 후 해당 이미지에서 관심 영역(12)을 추출한다. 하지만, 부속 정보가 너무 많은 페이지에 걸쳐 있을 수 있으므로 이는 제한해야 한다.
따라서, 관심 영역 추출부(131)는 문서 이미지에 포함된 부속 정보가 복수 페이지에 걸져있는 경우 그 연결성을 고려하여 복수 페이지에 포함된 부속 정보들을 추출한 후 결합하여 하나의 관심 영역으로 산출하되, 그 관심 영역의 크기를 약속된 기준에 따라 하나로 하거나 복수로 분할(예를 들어, 그 조합된 관심 영역의 크기가 2페이지 분량을 초과하는 경우 2페이지 단위로 분할하는 등)할 수 있다.
이를 통해서 해당 표 부분만 편집하여 별도의 파일로 만들거나 해당 부분을 다른 문서에 포함시켜 페이지당 표의 표현 상태가 달라지는 경우가 생겨도 이를 검출할 수 있게 된다.
도 6 내지 도 10은 본 발명의 실시예에 따른 부속 정보 특징점 추출부의 동작 과정을 구체적으로 설명하기 위한 개념도이다.
먼저, 도 3의 관심 영역 추출부(131)는 앞서 설명했던 바와 같이 도 6에 도시된 예시적 문서(13)에서 하나의 부속 정보를 관심 영역(14)으로 추출한다.
정규화부(132)는 관심 영역 추출부(131)로 부터 제공되는 관심 영역(14)의 이미지를 수신하고, 관심 영역 이미지를 미리 설정된 정규화 크기로 정규화한 정규화 이미지를 생성한다.
정규화부(132)는 미리 설정된 정규화 크기 또는 정규화 비율에 따라 관심 영역의 원본 이미지를 정규화할 수 있는데 일례로 정규화부(120)는 원본 이미지의 가로를 미리 설정된 픽셀수로 조절하고, 해당 가로의 조절 비율에 맞추어 원본 이미지의 세로 픽셀수를 자동 조절할 수도 있다. 도시된 예시는 해당 관심 영역의 이미지를 192 x 192의 비교적 작은 크기로 정규화한다.
정규화부(132)는 이러한 정규화 이미지를 영상 분석부(133)에 제공한다.
도 8은 영상 분석부(133)의 처리 방식을 보인 것으로, 도시된 바와 같이 수신된 정규화 이미지를 미리 설정된 크기(또는 제 1 크기)의 복수의 설정 영역으로 구분(분할)한다. 이러한 단위 설정 영역을 다시 복수의 서로 다른 미리 설정된 크기(또는 제 2 크기)의 블록(block)으로 구분(도시된 예시에서는 블록 1 내지 블록 4)하며, 블록별로 HOG(Histogram of Oriented Gradient) 기반의 영상 분석을 통해 하나 이상의 지배 기울기(dominant gradient)를 산출한다.
일례로, 도 9에 도시된 바와 같이, 영상 분석부(133)는 단위 블록을 미리 설정된 크기(또는 제 3 크기)의 복수의 셀(cell)로 구분(도시된 예시에서는 9개의 셀로 구분)하고, HOG를 기반으로 단위 셀 별로 기울기를 산출할 수 있다.
이때, 상기 단위 블록은 상기 복수의 블록 중 어느 하나를 의미할 수 있다.
또한, 영상 분석부(133)는 특정 단위 블록에 속한 셀별로 산출된 기울기를 취합하여 상기 특정 단위 블록에 대한 방향별 기울기의 크기를 산출할 수 있다. 즉, 영상 분석부(133)는 특정 단위 블록에 속한 셀별로 산출된 복수의 기울기를 취합하여 기울기 방향별(또는 기울기별) 크기를 산출할 수 있다.
일례로, 영상 분석부(133)는 HOG 알고리즘에 따른 상기 특정 단위 블록에 속한 셀별 기울기에 따라 미리 설정된 각도 간격으로 구분되어 미리 설정되는 서로 다른 기울기 방향(gradient orientation)별로 기울기의 크기(gradient magnitude)를 연산한 히스토그램(histogram)을 산출할 수 있으며, 상기 히스토그램에서 미리 설정된 기준 크기 이상의 크기를 가진 하나 이상의 지배 기울기를 상기 특정 단위 블록에 대응되어 산출(또는 추출)할 수 있다.
이때, 영상 분석부(133)는 40도의 각도 간격으로 서로 다른 기울기 방향이 설정되는 경우 9개의 서로 다른 기울기 방향에 따른 히스토그램을 산출할 수 있다.
특징점 추출부(134)는 도 10에 도시된 바와 같이, 영상 분석부(133)와 연동하여 상기 특정 단위 블록에 대응되어 산출된 상기 하나 이상의 지배 기울기 각각의 방향에 따라 미리 설정된 복수의 서로 다른 각도 범위(또는 각도)별로 지배 기울기의 존재 여부를 판단할 수 있으며, 상기 복수의 서로 다른 각도범위별(또는 각도별)로 상기 지배 기울기의 존재 여부에 따라 이진화 처리할 수 있다.
일례로, 특징점 추출부(134)에는 40도 각도를 기준으로(또는 간격으로) 복수의 서로 다른 각도 범위가 미리 설정되고, 해당 복수의 각도 범위별 비트값이 단위 블록의 특징점 관련 데이터를 구성하도록 미리 설정될 수 있다. 이에 따라, 특징점 추출부(134)는 40도 각도를 기준으로 각도 범위를 구분한 경우 하나의 블록에 대하여 특징점 관련 데이터로 9bit를 할당할 수 있다.
또한, 특징점 추출부(134)는 각도 범위별로 지배 기울기의 존재 여부에 따라 지배 기울기가 존재하는 각도 범위에는 1로 설정하고 지배 기울기가 존재하지 않는 각도 범위는 0으로 설정하여, 하나의 단위 블록에 대하여 9bit 크기의 데이터를 산출할 수 있으며, 상기 데이터를 상기 특정 단위 블록의 특징점으로 추출(또는 산출)할 수 있다.
즉, 도시된 바와 같이, 특징점 추출부(134)는 블록 3에 대하여 미리 설정된 0°를 초과하며 40°이하인 각도 범위에 지배 기울기가 존재하므로 1로 설정하고, 40°를 초과하며 80°이하인 미리 설정된 각도 범위에 지배 기울기가 존재하지 않으므로 0으로 설정할 수 있다.
이에 따라, 특징점 추출부(134)는 360도를 40도 간격으로 분할한 9개의 서로 다른 각도 범위별로 지배 기울기의 존재 여부에 따라 이진 연산을 수행하여 단위 블록에 대하여 9bit의 특징점(또는 특징점 정보)을 산출할 수 있다.
이때, 특징점 추출부(134)에 미리 설정되는 상기 각도 범위를 결정하기(나누기) 위한 기준 각도를 40도를 예를 들어 설명하였으나, 이러한 기준 각도는 다양한 각도로 변경 설정될 수 있음은 물론이며, 일례로 기준 각도를 낮출수록 이미지의 특징에 대한 표현이 가능한 기울기의 방향 개수 및 비트 수가 증가하여 특징점의 해상도를 높일 수 있으며, 이를 통해 더욱 정밀한 특징점 정보를 획득할 수도 있다.
상술한 구성에 따라, 특징점 추출부(134)는 단위 설정 영역(A)을 구성하는 복수의 서로 다른 블록별로 9bit의 특징점 정보를 산출(생성)할 수 있으며, 4개의 블록으로 구성되는 단위 설정 영역(A)에 대하여 36bit의 특징점 정보를 산출(생성)할 수 있다.
또한, 특징점 추출부(134)는 하나의 관심 영역을 구성하는 복수의 서로 다른 설정 영역별로 36bit의 특징점 정보를 산출할 수 있으며, 이를 통해 하나의 관심 영역이 9개의 설정 영역으로 구성된 경우 상기 관심 영역에 대하여 324bit의 특징점 정보를 생성하여 관심 영역에 대한 특징점을 추출할 수 있다.
이때, 특징점 추출부(134)는 관심 영역을 다양한 개수의 설정 영역 및 블록으로 구분할 수 있음은 물론이며, 이를 통해 블록별 하나 이상의 지배 기울기를 이진화 처리하여(또는 이진 데이터로 변환하여) N 비트값의 특징점 정보를 관심 영역에 대응되어 생성할 수 있다.
상술한 구성을 통해, 특징점 추출부(134)는 관심 영역에 대하여 통상 알려져 있는 주파수 분석 방식이나 단순 HOG 특징점 추출 방식 등에 비해서 현저히 적은 용량의 특징점 정보를 생성할 수 있으며, 이를 통해 특징점 정보를 이용한 검색과정의 처리 부하를 낮추는 동시에 처리 속도를 향상시킬 수 있다.
한편, 이와 같이 블록을 셀로 나누어 그에 대한 HOG를 통해 지배 기울기를 산출하여 이를 이진화 함으로써 해당 관심 영역의 크기, 해상도 등의 변형에 둔감한 신뢰성 있는 식별이 가능하게 된다. 이는 문서 파일을 이미지로 변환한 경우는 물론이고 이러한 문서를 출력한 인쇄물을 스캔하거나 해당 인쇄물의 전체나 일부를 사진으로 촬영한 후 이를 기반으로 식별을 요청할 수도 있음을 의미한다.
도 11은 본 발명의 다른 실시예에 따른 이미지 출처 확인을 통한 무단 사용 방지 시스템의 구성도로서, 문서 사용 서버가 아닌 사용자 단말(30)를 통해 촬영된 문서를 보안 에이전트부(100)의 문서 수집부(110)를 통해 수신한 경우를 보인 것이다.
사용자 단말(30)은 소정의 웹페이지나 링크 혹은 전용 어플리케이션을 통해서 보안 에이전트부(100)에 문서의 사진을 전달할 수 있으며, 그 결과를 제공 받을 수 있다. 경우에 따라서 이러한 보안 에이전트부(100)는 사용자 단말(30)에 적어도 일부가 어플리케이션으로서 구성될 수도 있다.
도시된 경우, 보안 에이전트부(100)의 문서 수집부(110)는 식별이 요청된 문서로서 카메라 촬영 이미지나 스캔된 문서의 이미지를 수집하며, 문서-이미지 변환부(120)는 수집된 이미지의 포맷을 변경하거나 그 특징을 정규화(자동 화질 조정이나 해상도 조절 등)하여 문서 특징점 추출부(140)와 부속 정보 특징점 추출부(130)에 제공할 수 있다. 만일 사용자 단말(30)을 통해 전달되는 문서 이미지가 신규 문서의 등록일 수도 있는데 이 경우 특징점 등록부(150)는 문서 특징점 추출부(140)와 부속 정보 특징점 추출부(130)를 통해 얻어진 특징점을 사용자 단말(30)을 통해 전달되는 문서 정보와 함께 문서 보안 필터링 서버(200)에 등록할 수 있다.
만일, 특정 문서나 문서의 부속 정보에 대한 식별을 요청하기 위한 것이라면 식별 요청부(160)가 사용자 단말(30)의 요청에 따라 문서 특징점 추출부(140)와 부속 정보 특징점 추출부(130)를 통해 얻어진 특징점을 문서 보안 필터링 서버(200)에 제공한다. 문서 보안 필터링 서버(200)의 매칭 검사부(210)는 수신된 문서 특징점 추출부(140)와 부속 정보 특징점 추출부(130)를 통해 얻어진 특징점을 각각 기 등록된 특징점과 비교하여 출처를 선별하고 그에 대응되는 문서 정보와 보안 정보를 무단 사용 여부 결과로서 식별 요청부(160)에 제공한다. 식별 요청부(160)는 수신된 무단 사용 여부 결과를 사용자 단말(30)에 제공하며, 필요한 경우 보안 신고부(170)를 통해 관리자에게 신고한다.
앞서 설명했던 본 발명의 실시예를 통해서 문서의 언어, 각종 부속 정보의 종류에 무관한 출처 확인이 가능하며, 문서의 편집을 통해 부속 정보의 위치가 변경되거나 복수 페이지에 걸쳐 있거나, 식별 대상 문서에 일부 부속 정보만 존재하거나, 혹은 인쇄된 내용에 대해서도 해당 문서나 부속 정보를 토대로 출처를 확인하여 무단 사용 여부를 확인할 수 있다.
본 명세서에 기술된 다양한 장치 및 구성부는 하드웨어 회로(예를 들어, CMOS 기반 로직 회로), 펌웨어, 소프트웨어 또는 이들의 조합에 의해 구현될 수 있다. 예를 들어, 다양한 전기적 구조의 형태로 트랜지스터, 로직게이트 및 전자회로를 활용하여 구현될 수 있다.
전술된 내용은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 보안 에이전트부 110: 문서 수집부
120: 문서-이미지 변환부 130: 부속 정보 특징점 추출부
140: 문서 특징점 추출부 150: 특징점 등록부
160: 식별 요청부 170: 보안 신고부
200: 문서 보안 필터링 서버 210: 매칭 검사부
220: 데이터베이스

Claims (10)

  1. 원본 문서를 이미지로 변환하여 해당 원본 문서의 특징점을 추출한 후 해당 원본 문서에 대한 정보와 함께 제공하고, 식별 요청에 따른 문서를 이미지로 변환하여 해당 식별 요청 문서의 특징점을 추출한 후 제공하는 보안 에이전트부와;
    보안 에이전트부가 제공하는 원본 문서의 특징점을 해당 원본 문서 정보와 함께 등록 저장하고, 식별 요청에 따라 보안 에이전트가 제공하는 식별 요청 문서의 특징점을 등록 저장된 원본 문서의 특징점과 비교하여 해당 식별 요청 문서에 대응되는 원본 문서 정보를 검출하는 문서 보안 필터링 서버를 포함하되,
    상기 보안 에이전트부는 원본 문서와 해당 원본 문서에 대한 정보를 제공하는 문서 관리 서버에 구성되거나 적어도 연동하는 단말에 구성되며, 상기 원본 문서에 대한 정보는 문서명, 문서 관리번호, 문서 버전, 등록자, 등록일 중 적어도 하나 이상을 포함하는 문서 관리 정보와, 보안 등급과 접근 등급 중 적어도 하나를 포함하는 접근통제 정보와, 해당 문서의 유효, 수정, 폐기 중 적어도 하나를 포함하는 문서 상태 정보를 포함하는 것을 특징으로 하는 이미지 출처 확인을 통한 무단 사용 방지 시스템.
  2. 삭제
  3. 청구항 1에 있어서, 상기 보안 에이전트부는
    원본 문서와 그에 대한 문서 정보를 수신하고, 식별이 요청된 문서를 수집하는 문서 수집부와;
    수집된 문서를 이미지로 변환하는 문서-이미지 변환부와;
    문서-이미지 변환부에서 변환된 이미지에 대한 특징점을 추출하는 문서 특징점 추출부와;
    문서-이미지 변환부에서 변환된 이미지에 포함된 부속 정보 중 관심 영역을 선별하여 선별된 관심 영역에 대한 특징점을 추출하는 부속 정보 특징점 추출부와;
    문서 수집부에서 수집된 원본 문서에 대해 문서 특징점 추출부 및 부속 정보 특징점 추출부에서 추출한 특징점들과 문서 정보를 문서 보안 필터링 서버에 제공하는 특징점 등록부와;
    식별 요청에 따라 상기 문서 수집부에서 수집된 식별 요청된 문서에 대해 문서 특징점 추출부 및 부속 정보 특징점 추출부에서 추출한 특징점들을 문서 보안 필터링 서버에 제공하는 식별 요청부를 포함하는 것을 특징으로 하는 이미지 출처 확인을 통한 무단 사용 방지 시스템.
  4. 청구항 3에 있어서, 상기 문서 보안 필터링 서버는 보안 에이전트부의 식별 요청부를 통해 제공되는 문서 특징점 추출부의 특징점을 기반으로 페이지 단위로 기 등록된 문서와 비교하여 대응 문서를 검색하는 페이지 검사부와, 식별 요청부를 통해 제공되는부속 정보 특징점 추출부의 특징점을 기반으로 관심 영역에 대해 저장된 특징점을 검색하는 부속 검사부를 통해 식별 요청 문서에 대응되는 원본 문서 정보를 검출하는 매칭 검사부를 포함하는 것을 특징으로 하는 이미지 출처 확인을 통한 무단 사용 방지 시스템.
  5. 청구항 3에 있어서, 상기 문서 보안 필터링 서버는 보안 에이전트부의 식별 요청부를 통해 제공되는 특징점들과 등록된 원본 문서의 특징점들을 비교하여 그 출처를 검출하고, 해당 출처가 되는 원본 문서의 문서 정보에 따라 무단 사용 여부를 판정한 후 그 결과를 보안 에이전트부에 제공하는 것을 특징으로 하는 이미지 출처 확인을 통한 무단 사용 방지 시스템.
  6. 청구항 1에 있어서, 상기 보안 에이전트부의 문서 수집부는 식별이 요청된 문서로서 카메라 촬영 이미지나 스캔된 문서의 이미지를 수집하며, 이 경우 문서-이미지 변환부는 수집된 이미지의 포맷을 변경하거나 특징을 정규화하여 문서 특징점 추출부와 부속 정보 특징점 추출부에 제공하는 것을 특징으로 하는 이미지 출처 확인을 통한 무단 사용 방지 시스템.
  7. 청구항 3에 있어서, 상기 부속 정보 특징점 추출부는
    문서 이미지에서 경계선 검출을 통해 관심 영역을 추출하는 관심 영역 추출부와;
    관심 영역을 미리 설정된 정규화 크기로 정규화한 정규화 이미지를 생성하는 정규화부와;
    상기 정규화 이미지를 미리 설정된 크기의 복수의 블록으로 분할하고, HOG(Histogram of Oriented Gradient) 기반으로 상기 분할된 각 블록별로 하나 이상의 지배 기울기를 산출하는 영상 분석부와;
    상기 관심 영역을 구성하는 상기 분할된 각 블록별로 산출된 상기 하나 이상의 지배 기울기를 미리 설정된 기준에 따라 이진화 처리한 N 비트값의 특징점 정보를 상기 관심 영역에 대응되어 생성하는 특징점 추출부를 포함하는 것을 특징으로 하는 이미지 출처 확인을 통한 무단 사용 방지 시스템.
  8. 청구항 7에 있어서, 상기 관심 영역 추출부는 문서 이미지에 포함된 부속 정보가 복수 페이지에 걸져있는 경우 그 연결성을 고려하여 복수 페이지에 포함된 부속 정보들을 추출한 후 결합하여 하나의 관심 영역으로 산출하되, 그 관심 영역의 크기를 약속된 기준에 따라 하나로 하거나 복수로 분할하는 것을 특징으로 하는 이미지 출처 확인을 통한 무단 사용 방지 시스템.
  9. 청구항 7에 있어서, 상기 특징점 추출부는 단위 블록을 미리 설정된 개수의 복수의 셀로 분할하고, HOG를 기반으로 단위 셀별로 산출된 기울기를 취합하여 방향별 기울기의 크기를 산출하고, 미리 설정된 기준 크기 이상의 크기를 가진 하나 이상의 지배 기울기를 상기 단위 블록에 대응되어 산출하는 것을 특징으로 하는 이미지 출처 확인을 통한 무단 사용 방지 시스템.
  10. 청구항 9에 있어서, 상기 특징점 추출부는 상기 하나 이상의 지배 기울기 각각의 방향에 따라 미리 설정된 복수의 각도 범위별로 지배 기울기의 존재 여부를 판단하고, 상기 복수의 각도범위별로 상기 지배 기울기의 존재 여부에 따라 이진화 처리하는 것을 특징으로 하는 이미지 출처 확인을 통한 무단 사용 방지 시스템.
KR1020180166033A 2018-12-20 2018-12-20 이미지 출처 확인을 통한 무단 사용 방지 시스템 KR102113756B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180166033A KR102113756B1 (ko) 2018-12-20 2018-12-20 이미지 출처 확인을 통한 무단 사용 방지 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180166033A KR102113756B1 (ko) 2018-12-20 2018-12-20 이미지 출처 확인을 통한 무단 사용 방지 시스템

Publications (1)

Publication Number Publication Date
KR102113756B1 true KR102113756B1 (ko) 2020-05-21

Family

ID=70910273

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180166033A KR102113756B1 (ko) 2018-12-20 2018-12-20 이미지 출처 확인을 통한 무단 사용 방지 시스템

Country Status (1)

Country Link
KR (1) KR102113756B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102406098B1 (ko) * 2021-11-29 2022-06-08 주식회사 인사이트베슬 사중 팔레트 데이터 구조를 이용한 이미지 번역편집 시스템
KR20230077960A (ko) * 2021-11-26 2023-06-02 주식회사 스파이스웨어 인공지능 기반의 기밀정보 암호화 방법 및 장치

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050026769A (ko) 2003-09-09 2005-03-16 (주) 베타랜드 온라인 만화 불법 복제방지 시스템 및 방법
KR101640902B1 (ko) 2014-12-24 2016-07-19 주식회사 파수닷컴 Html 문서에 포함되는 콘텐츠를 보호하는 장치 및 방법
KR101744614B1 (ko) * 2015-12-21 2017-06-09 주식회사 디알엠인사이드 불법 복제된 온라인 만화 식별 시스템 및 방법
KR20170076368A (ko) * 2015-12-24 2017-07-04 주식회사 디알엠인사이드 불법 복제된 서적의 통합 식별 시스템 및 방법
KR101884874B1 (ko) * 2017-01-19 2018-08-03 한국과학기술원 부분 이미지 기반 객체 판별 방법 및 장치
KR20180099180A (ko) * 2017-02-28 2018-09-05 주식회사 소원네트웍스 전자문서의 정보 보안 방법 및 서버

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050026769A (ko) 2003-09-09 2005-03-16 (주) 베타랜드 온라인 만화 불법 복제방지 시스템 및 방법
KR101640902B1 (ko) 2014-12-24 2016-07-19 주식회사 파수닷컴 Html 문서에 포함되는 콘텐츠를 보호하는 장치 및 방법
KR101744614B1 (ko) * 2015-12-21 2017-06-09 주식회사 디알엠인사이드 불법 복제된 온라인 만화 식별 시스템 및 방법
KR20170076368A (ko) * 2015-12-24 2017-07-04 주식회사 디알엠인사이드 불법 복제된 서적의 통합 식별 시스템 및 방법
KR101884874B1 (ko) * 2017-01-19 2018-08-03 한국과학기술원 부분 이미지 기반 객체 판별 방법 및 장치
KR20180099180A (ko) * 2017-02-28 2018-09-05 주식회사 소원네트웍스 전자문서의 정보 보안 방법 및 서버

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230077960A (ko) * 2021-11-26 2023-06-02 주식회사 스파이스웨어 인공지능 기반의 기밀정보 암호화 방법 및 장치
KR102619521B1 (ko) * 2021-11-26 2023-12-29 주식회사 스파이스웨어 인공지능 기반의 기밀정보 암호화 방법 및 장치
KR102406098B1 (ko) * 2021-11-29 2022-06-08 주식회사 인사이트베슬 사중 팔레트 데이터 구조를 이용한 이미지 번역편집 시스템

Similar Documents

Publication Publication Date Title
KR101585029B1 (ko) 문서 인식 분류 시스템
US8386437B2 (en) Apparatus and method for document collection and filtering
US10489606B2 (en) System, method, and computer program product for preventing image-related data loss
US8126197B2 (en) Method for image quality assessment using quality vectors
US9436821B2 (en) Systems and methods for detecting attempts to transmit sensitive information via data-distribution channels
US20150339526A1 (en) Systems and methods for classifying objects in digital images captured using mobile devices
KR101491446B1 (ko) 출판물의 핑거프린트 추출 방법, 출판물의 핑거프린트 추출 장치, 핑거프린트를 이용한 출판물 식별 시스템 및 핑거프린트를 이용한 출판물 식별 방법
US10235583B2 (en) Electronically shredding a document
RU2676247C1 (ru) Способ и компьютерное устройство для кластеризации веб-ресурсов
KR102113756B1 (ko) 이미지 출처 확인을 통한 무단 사용 방지 시스템
KR101803066B1 (ko) 불법 복제된 서적의 통합 식별 시스템 및 방법
US20080243818A1 (en) Content-based accounting method implemented in image reproduction devices
JP2011188465A (ja) 原稿レイアウトの方向検出方法及び装置
KR102089797B1 (ko) 인공지능 기반의 홈페이지 개인정보유출차단시스템
KR101744614B1 (ko) 불법 복제된 온라인 만화 식별 시스템 및 방법
WO2009065151A2 (en) Method for image quality assessment using quality vectors
Eskenazi et al. When document security brings new challenges to document analysis
CN105872307A (zh) 图像形成装置以及图像输出方法
US8725751B1 (en) Method and apparatus for blocking or blurring unwanted images
CN111368128A (zh) 目标图片的识别方法、装置和计算机可读存储介质
US7532368B2 (en) Automated processing of paper forms using remotely-stored form content
Dhavale Advanced image-based spam detection and filtering techniques
RU2699234C1 (ru) Способ обеспечения безопасного использования электронного документа
US20160259957A1 (en) System And Method For Monitoring And Protecting Healthcare Data
CN112100630A (zh) 一种针对保密文件的识别方法

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant