KR101904486B1 - 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템 및 그 방법 - Google Patents

트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템 및 그 방법 Download PDF

Info

Publication number
KR101904486B1
KR101904486B1 KR1020180003285A KR20180003285A KR101904486B1 KR 101904486 B1 KR101904486 B1 KR 101904486B1 KR 1020180003285 A KR1020180003285 A KR 1020180003285A KR 20180003285 A KR20180003285 A KR 20180003285A KR 101904486 B1 KR101904486 B1 KR 101904486B1
Authority
KR
South Korea
Prior art keywords
tree structure
authority information
web page
unique authority
blocked
Prior art date
Application number
KR1020180003285A
Other languages
English (en)
Other versions
KR20180083800A (ko
Inventor
유대걸
Original Assignee
(주)엠더블유스토리
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)엠더블유스토리 filed Critical (주)엠더블유스토리
Publication of KR20180083800A publication Critical patent/KR20180083800A/ko
Application granted granted Critical
Publication of KR101904486B1 publication Critical patent/KR101904486B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/12Payment architectures specially adapted for electronic shopping systems
    • G06Q20/123Shopping for digital content
    • G06Q20/1235Shopping for digital content with control of digital rights management [DRM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Technology Law (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Multimedia (AREA)
  • Finance (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • General Engineering & Computer Science (AREA)
  • Storage Device Security (AREA)

Abstract

본 발명의 트리 구조를 비교하여 웹 정보의 변경을 감지하는 시스템 및 그 방법은 웹사이트의 웹 페이지 저마다에 포함된 태그를 추출하여 제 1 트리 구조를 생성하고, 생성된 제 1 트리 구조와 실시간으로 제공되는 웹사이트의 웹 페이지로부터 추출 및 생성된 제 2 트리 구조를 비교하여 웹사이트 저마다의 웹 페이지가 변경되는 것을 감지할 수 있다.

Description

트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템 및 그 방법{MONITORING SYSTEM AND METHOD FOR DETECT CHANGES IN WEB PAGE BY COMPARING TREE STRUCTURES}
본 발명은 웹사이트의 웹 페이지 저마다에 포함된 태그를 추출하여 제 1 트리 구조를 생성하고, 생성된 제 1 트리 구조와 실시간으로 제공되는 웹사이트의 웹 페이지로부터 추출 및 생성된 제 2 트리 구조를 비교하여 웹사이트 저마다의 웹 페이지가 변경되는 것을 감지하는 모니터링 시스템 및 그 방법에 관한 것이다.
웹툰, 음원, 동영상 및 서적 등의 다양한 디지털 콘텐츠는 웹사이트 등의 정보제공 매체를 통해 자유롭게 유통된다. 이에 따라 디지털 콘텐츠는 전세계 어느 지역에 있든지 누구나 공유할 수 있게 되었다. 한편, 디지털 콘텐츠의 빠른 확산에 비해 디지털 콘텐츠의 저작물 보호에 대한 사용자들의 인식은 턱없이 부족한 실정이며, 이를 극복하기 위해 디지털 콘텐츠의 불법 유통을 색출하기 위한 웹사이트 모니터링이 정보화 사회에서 중요한 수단으로 작용되고 있다.
디지털 콘텐츠의 저작권 보호를 위한 방안으로는 저작물의 복제 및 유통을 어렵게 하는 사전적 조치와 이미 복제되어 유통 중인 저작물을 색출하여 단속하는 사후적 조치로 구분될 수 있다.
사전적 조치는 이를테면 복제가 불가능하거나 복제 횟수를 제한하기 위한 워터마킹(Watermarking) 기술 등과 같이, 기술적 측면에서 개발되는 방식으로 많은 발전이 이루어져 왔다. 그러나 사전적 조치에 의한 방식은 제한을 임의로 해제하는 기술이 개발됨에 따라 대부분 무력화되었으며, 저작물의 직접적 침해에 해당되지 않는 복제 등에 대해서도 구분을 두지 않고 금지하는 문제가 발생하여 현실적으로 적용이 무의미한 경우가 빈번하다.
따라서 디지털 콘텐츠의 불법적인 복제 및 유통을 제한하기 위해서는 사후적 조치를 이용해 지속적인 웹사이트의 모니터링과 디지털 콘텐츠의 불법 유통에 대한 적발이 병행되어야 한다.
하지만, 현재의 불법 유통되는 디지털 콘텐츠에 대한 색출은 저작권자 개인 또는 저작권을 위탁 관리하는 위탁기관이 자발적으로 웹사이트에 접속하여 탐색하는 수작업에 의존하고 있다. 이러한 방식은 무수히 많은 웹사이트들에 대한 모니터링과 적발을 매우 어렵게 하며, 색출된 웹사이트에서도 새로이 저작권 침해 사례가 추가되는 경우에는 재접속 및 재검출을 하지 않는 한 지속적인 감시가 무용지물이 되고 마는 문제점이 있었다.
KR 등록특허공보 제10-1634754호(2016.07.22.)
본 발명이 해결하고자 하는 기술적 과제는 저작권법에 저촉되는 웹툰, 만화, 애니메이션, 음원 및 영화 등의 콘텐츠가 제공되는 웹사이트를 감시하기 위해 트리 구조를 비교하여 웹 페이지의 변화를 감지하는 모니터링 시스템 및 그 방법을 제공하는 것이다.
본 발명의 트리 구조를 비교하여 웹 페이지의 변화를 감지하는 모니터링 시스템은 웹사이트 및 모니터링 서버를 포함한다. 웹사이트는 웹 페이지 생성 파일로 구성된 적어도 하나의 웹 페이지를 포함한다. 모니터링 서버는 상기 웹사이트의 접근 권한을 갖는 복수의 고유 권한 정보 중 적어도 하나의 상기 고유 권한 정보를 이용해 상기 웹사이트에 접근하고, 상기 웹 페이지 생성 파일에 포함된 태그(tag)를 추출하여 계층형의 제 1 트리 구조를 생성 및 저장하며, 상기 제 1 트리 구조와 실시간으로 제공되는 상기 웹 페이지의 상기 웹 페이지 생성 파일로부터 추출 및 생성된 계층형의 제 2 트리 구조를 비교하여 상기 제 1 및 상기 제 2 트리 구조의 일치 여부를 판별한다.
상기 모니터링 서버는 상기 제 1 및 상기 제 2 트리 구조의 일치 여부를 판별한 결과, 상기 제 1 및 상기 제 2 트리 구조가 서로 다르다고 판별되면, 상기 제 1 트리 구조와 다르다고 판별된 상기 제 2 트리 구조에 대응되는 상기 웹 페이지의 사용자 인터페이스와 상기 제 2 트리 구조를 저장한다.
상기 모니터링 서버는 상기 제 1 및 상기 제 2 트리 구조의 일치 여부를 판별한 결과, 상기 제 1 및 상기 제 2 트리 구조가 서로 다르다고 판별되면, 상기 제 2 트리 구조에 포함된 태그 중 상기 제 1 트리 구조와 서로 다른 태그의 개수를 산출한다.
상기 모니터링 서버는 상기 웹사이트로부터 상기 고유 권한 정보가 차단되면, 차단된 상기 고유 권한 정보를 제외한 다른 상기 고유 권한 정보를 이용해 상기 웹사이트에 대한 접근을 재개한다.
상기 모니터링 서버는 상기 웹사이트로부터 차단된 상기 고유 권한 정보와 상기 고유 권한 정보를 차단시킨 상기 웹사이트가 상호 매핑된 차단 매핑 테이블을 저장하고, 상기 고유 권한 정보를 차단시킨 상기 웹사이트로부터 다른 상기 고유 권한 정보가 차단되면, 상기 차단 매핑 테이블로부터 상기 고유 권한 정보를 차단시킨 상기 웹사이트에 대응되는 상기 고유 권한 정보를 추출하며, 추출된 상기 고유 권한 정보가 차단 해제되었는지에 따라 추출된 상기 고유 권한 정보를 이용해 상기 고유 권한 정보를 차단 시킨 상기 웹사이트의 모니터링을 재개한다.
또한 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법은 제 1 트리 구조 생성 및 저장 단계, 제 2 트리 구조 생성 단계 및 트리 구조 판별 단계를 포함한다. 제 1 트리 구조 생성 및 저장 단계는 웹 페이지 생성 파일로 구성되는 적어도 하나의 웹페이지가 포함된 웹사이트에 모니터링 서버가 접근하고, 상기 웹 페이지 생성 파일에 포함된 태그를 추출하여 계층형의 제 1 트리 구조를 생성 및 저장한다. 제 2 트리 구조 생성 단계는 상기 모니터링 서버가 실시간으로 제공되는 상기 웹 페이지에 다시 접근하고, 실시간으로 제공되는 상기 웹 페이지의 상기 웹 페이지 생성 파일에 포함된 태그를 추출하여 계층형의 제 2 트리 구조를 생성한다. 트리 구조 판별 단계는 상기 모니터링 서버가 상기 제 1 및 상기 제 2 트리 구조를 비교하여 일치 여부를 판별한다.
뿐만 아니라 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법은 증거 수집 단계를 더 포함한다. 증거 수집 단계는 상기 모니터링 서버가 상기 트리 구조 판별 단계에서 상기 제 1 및 상기 제 2 트리 구조의 일치 여부를 판별한 결과, 상기 제 1 및 상기 제 2 트리 구조가 서로 다르다고 판별되면, 상기 제 1 트리 구조와 다르다고 판별된 상기 제 2 트리 구조에 대응되는 상기 웹 페이지의 사용자 인터페이스와 상기 제 2 트리 구조를 저장한다.
상기 증거 수집 단계는 상기 모니터링 서버가 상기 제 1 및 상기 제 2 트리 구조의 일치 여부를 판별한 결과, 상기 제 1 및 상기 제 2 트리 구조가 서로 다르다고 판별되면, 상기 제 2 트리 구조에 포함된 태그 중 상기 제 1 트리 구조와 서로 다른 태그의 개수를 산출한다.
상기 모니터링 서버는 상기 웹사이트에 대한 접근 권한을 갖는 복수의 고유 권한 정보 중 적어도 하나의 상기 고유 권한 정보를 이용해 상기 웹사이트에 접근하되, 상기 웹사이트로부터 상기 고유 권한 정보가 차단되면, 차단된 상기 고유 권한 정보를 제외한 다른 상기 고유 권한 정보를 이용해 상기 웹사이트에 대한 접근을 재개한다.
상기 모니터링 서버는 상기 웹사이트로부터 차단된 상기 고유 권한 정보와 상기 고유 권한 정보를 차단시킨 상기 웹사이트가 상호 매핑된 차단 매핑 테이블을 저장하고, 상기 고유 권한 정보를 차단시킨 상기 웹사이트로부터 다른 상기 고유 권한 정보가 차단되면, 상기 차단 매핑 테이블로부터 상기 고유 권한 정보를 차단시킨 상기 웹사이트에 대응되는 상기 고유 권한 정보를 추출하며, 추출된 상기 고유 권한 정보가 차단 해제되었는지에 따라 추출된 상기 고유 권한 정보를 이용해 상기 고유 권한 정보를 차단 시킨 상기 웹사이트의 모니터링을 재개한다.
상술한 바와 같이, 본 발명에 따른 트리 구조를 비교하여 웹 페이지의 변화를 감지하는 모니터링 시스템 및 그 방법은 웹사이트의 웹 페이지 저마다에 포함된 태그를 추출하여 제 1 트리 구조를 생성하고, 생성된 제 1 트리 구조와 실시간으로 제공되는 웹사이트의 웹 페이지로부터 추출 및 생성된 제 2 트리 구조를 비교함으로써, 저작권법에 저촉되는 웹툰, 만화, 애니메이션, 음원 및 영화 등의 콘텐츠가 제공되는 웹사이트의 웹 페이지 구조가 변경되더라도 지속적으로 단속할 수 있는 효과가 있다.
도 1은 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템을 표현하는 도면이다.
도 2는 도 1의 모니터링 서버에 대한 구성을 표현하는 도면이다.
도 3은 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법의 처리 수순을 표현하는 도면이다.
본 발명의 실시예는 여러 가지 형태로 변형될 수 있으며, 본 발명의 범위가 아래에서 서술하는 실시예로 인해 한정되어지는 것으로 해석되어서는 아니 된다. 본 실시예는 당업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. 따라서 도면에서의 구성요소의 형상 등은 보다 명확한 설명을 강조하기 위해서 그려진 것이다.
이하 첨부된 도면을 참조하여 본 발명에 따른 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템 및 그 방법의 바람직한 실시예를 상세히 설명한다.
도 1은 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템을 표현하는 도면이다.
도 1을 참조하면, 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템(10)은 저작권법에 저촉되는 웹툰, 만화, 애니메이션, 음원 및 영화 등의 콘텐츠가 제공되는 웹사이트(100) 저마다의 웹 페이지(110) 구조가 변경되더라도 지속적으로 해당 웹사이트(100)를 단속하기 위해 모니터링 서버(200)를 이용한다. 즉, 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템(10)은 모니터링 서버(200)를 통해 웹사이트(100) 각각의 웹 페이지(110)를 탐색하고, 저장된 제 1 트리 구조와 탐색 중인 웹 페이지로부터 생성된 제 2 트리 구조를 상호 비교하여 그 일치 여부에 따라 웹사이트(100)가 웹 페이지(110)의 구조를 변경하여 단속을 회피하는지 적발할 수 있다. 따라서 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템(10)은 웹 페이지(110)의 구조가 변경될 위험이 있는 웹사이트(100)와 이 웹사이트(100)를 감시하는 모니터링 서버(200)를 포함한다.
구체적으로 웹사이트(100)는 웹툰, 만화, 애니메이션, 음원 및 영화 등의 다양한 디지털 콘텐츠가 포함된 적어도 하나의 웹 페이지(110)로 이루어진다. 특히, 각각의 웹 페이지(110)는 웹 페이지 생성 파일, 예를 들어 HTML(Hypertext Markup Language : HTML)이나 XML(Extensible Markup Language : XML) 등의 웹 언어로 구성된다. 또한, 웹 페이지 생성 파일은 식별 가능한 속성 정보에 해당되는 다수의 태그(tag)를 포함하며, 모니터링 서버(200)에 의해 탐색될 시, 다수의 태그를 제공할 수 있다. 아울러, 웹사이트(100)는 웹사이트(100)의 접근 권한을 갖는 고유 권한 정보(225)에 대해 웹 페이지(110)의 탐색, 즉 모니터링을 인허하는 것은 물론이다.
도 1과 더불어 도 2를 더 참조하여 모니터링 서버(200)의 구성 및 작동을 설명한다.
도 2는 도 1의 모니터링 서버에 대한 구성을 표현하는 도면이다.
도 2를 참조하면, 모니터링 서버(200)는 웹사이트(100)의 접근 권한을 갖는 복수의 고유 권한 정보(225) 중 적어도 하나의 고유 권한 정보(225)를 이용해 웹사이트(100)에 접근하고, 미리 저장해 놓은 제 1 트리 구조와 접근한 웹사이트(100)에 포함된 웹 페이지(110)로부터 추출 및 생성된 제 2 트리 구조를 상호 비교하여 그 일치 여부에 따라 접근한 웹사이트(100)의 웹 페이지(110) 구조가 변경되었는지를 판별한다. 더 나아가, 모니터링 서버(200)는 제 1 및 제 2 트리 구조의 비교 판별 결과에 따라 그 결과를 저장하는 것은 물론이고, 제 1 트리 구조와 서로 다르다고 판별된 제 2 트리 구조의 차이나는 태그 개수를 산출할 수 있다. 이를 위해 모니터링 서버(200)는 통신부(201), 제어부(202), 모니터링 프로그램(210) 및 데이터베이스(220)를 포함한다.
통신부(201)는 모니터링 서버(200)가 복수의 웹사이트(100)와 상호 데이터 통신되도록 처리한다. 즉, 통신부(201)는 웹사이트(100)와 모니터링 서버(200) 사이에 전송되는 정보가 포함된 모든 신호들을 전달할 수 있다. 통신부(201)는 예컨대 공중의 통신망 내지 모니터링 서버(200)에 국한된 특정한 통신망을 이용할 수 있다.
제어부(202)는 모니터링 서버(200)의 제반 작동이 처리되도록 제어한다. 즉, 제어부(202)는 통신부(201), 모니터링 프로그램(210) 및 데이터베이스(220)를 제어하여 모든 데이터가 송수신되도록 할 수 있다. 제어부(202)는 예를 들어, 범용적인 중앙연산장치(CPU), 특정한 목적에 적합하게 구현된 프로그래머블 디바이스 소자(CPLD, FPGA), 주문형 반도체 연산장치(ASIC) 및 마이크로 컨트롤러 칩 등의 연산 장치 중 적어도 하나를 이용할 수 있다.
모니터링 프로그램(210)은 웹사이트(100)의 접근 권한을 갖는 복수의 고유 권한 정보(225) 중 적어도 하나의 고유 권한 정보(225)를 이용해 웹사이트(100)를 모니터링하여 데이터베이스(220)에 저장된 제 1 트리 구조와 실시간으로 웹 페이지(110)에서 추출된 태그로 생성된 제 2 트리 구조를 상호 비교하여 그 일치 여부에 따라 증거 자료를 수집하게 된다. 이러한 모니터링 프로그램(210)은 웹 페이지 탐색부(211), 트리 구조 생성부(213) 및 증거 자료 수집부(215)를 포함한다.
웹 페이지 탐색부(211)는 고유 권한 정보(225)를 이용해 웹사이트(100)에 접근하는 것은 물론이고, 데이터베이스(220)에 저장된 제 1 트리 구조와 접근한 웹사이트(100)에서 추출된 태그로 생성된 제 2 트리 구조를 상호 비교하여 그 일치 여부를 판별한다. 여기서 제 1 트리 구조란, 데이터베이스(220)에 저장된 정보로써, 모니터링 프로그램(210)이 트리 구조 비교를 위한 모니터링 작동을 수행하기 이전에 웹사이트(100)에 접근, 웹 페이지(110)에 포함된 태그로부터 추출되어 적어도 하나의 노드(node)를 갖는 계층형으로 형성된다. 한편, 제 2 트리 구조는 모니터링 프로그램(210)이 트리 구조 비교를 위한 모니터링 작동을 수행하는 중에 웹 페이지 탐색부(211)가 접근한 웹사이트(100)의 웹 페이지(110)에 포함된 태그로부터 추출되어 적어도 하나의 노드(node)를 갖는 계층형으로 형성된다. 즉, 제 1 트리 구조는 모니터링 작동이 수행되기 이전에 기준을 정하기 위한 정보로써 데이터베이스(220)에 저장되는 반면, 제 2 트리 구조는 모니터링 작동이 수행되는 중에 제 1 트리 구조의 비교 정보로써 실시간 생성된다. 뿐만 아니라 웹 페이지 탐색부(211)는 웹사이트(100)의 모니터링 도중에 웹사이트(100)로부터 고유 권한 정보(225)가 차단되면, 차단된 고유 권한 정보(225)와 고유 권한 정보(225)를 차단시킨 웹사이트(100)가 상호 매핑된 차단 매핑 테이블을 저장한다. 이와 더불어 웹 페이지 탐색부(211)는 차단된 고유 권한 정보(225)를 대체하는 다른 고유 권한 정보(225)를 이용해 모니터링을 재설정하여 웹사이트(100)에 대한 모니터링을 재개할 수 있다. 이때 웹 페이지 탐색부(211)는 웹사이트(100)에 대한 모니터링을 수행하도록 접근 명령을 내리는 스크립트 정보, 즉 명령어에 다른 고유 권한 정보(225)를 대입하여 웹사이트(100)에 대한 접근이 이루어질 수 있도록 한다. 웹 페이지 탐색부(211)는 예컨대 크롤러(Crawler) 등의 탐색 및 색인 기능을 수행하는 컴퓨터 프로그램으로 구비될 수 있다. 더 나아가 웹 페이지 탐색부(211)는 고유 권한 정보(225)를 차단시킨 웹사이트(100)로부터 다른 고유 권한 정보(225)가 또 다시 차단되면, 차단 매핑 테이블(227)로부터 고유 권한 정보(225)를 차단시킨 웹사이트(100)에 대응되는 고유 권한 정보(225)를 추출하고, 추출된 고유 권한 정보(225)가 차단 해제되었는지에 따라 추출된 고유 권한 정보(225)를 이용해 고유 권한 정보(225)를 차단시킨 웹사이트(100)의 모니터링이 재개되도록 할 수있다.
트리 구조 생성부(213)는 웹 페이지 탐색부(211)에 의해 웹 페이지(110)로부터 추출된 다수의 태그를 제 2 트리 구조로 형성하여 웹 페이지 탐색부(211)에 제공할 수 있다. 또한 트리 구조 생성부(213)는 다수의 태그를 그 명령어의 흐름에 따라 상위에서 하위로 분산되는 계층형의 제 2 트리 구조로 형성한다. 트리 구조 생성부(213)는 이미 데이터베이스(220)에 저장된 제 1 트리 구조를 생성하는 데에도 관여할 수 있음은 물론이다.
증거 자료 수집부(215)는 웹 페이지 탐색부(211)로부터 제 1 트리 구조와 제 2 트리 구조를 상호 비교하여 그 구조가 서로 다르다고 판별되면, 제 1 트리 구조와 다르다고 판별된 제 2 트리 구조에 대응되는 웹 페이지의 사용자 인터페이스와 해당 제 2 트리 구조를 데이터베이스(220)에 함께 저장한다. 또한, 증거 자료 수집부(215)는 사용자 인터페이스와 해당 제 2 트리 구조를 저장 시, 제 2 트리 구조에 포함된 태그 중 제 1 트리 구조와 서로 다른 태그의 개수를 산출하여 사용자 인터페이스 및 제 2 트리 구조와 데이터베이스(220)에 함께 저장되도록 할 수 있다. 즉, 증거 자료 수집부(215)는 웹사이트(100)가 웹 페이지(110)의 구조를 달리하여 모니터링을 회피한다는 명확한 근거 자료를 수집할 수 있다.
데이터베이스(220)는 제어부(202)의 제어를 받아 웹사이트 정보(221), 구조화 정보(223), 고유 권한 정보(225), 차단 매핑 테이블(227) 및 증거 수집 정보(229)를 저장한다. 또한 데이터베이스(220)는 통신부(201), 제어부(202) 및 모니터링 프로그램(210)의 요청에 따라 저장된 정보들을 제공할 수 있다.
웹사이트 정보(221)는 웹사이트(100)를 검색할 수 있는 URL(Uniform Resource Locator : URL) 등의 위치 기록을 포함할 수 있다. 즉, 웹사이트 정보(221)는 모니터링 프로그램(210)에서 모니터링 작동을 실행하려고 하면, 위치 기록 등을 제공하여 모니터링하고자 하는 웹사이트(100)에 원활히 접근할 수 있도록 정보를 제공한다.
구조화 정보(223)는 제 1 트리 구조와 제 2 트리 구조가 저장된다. 제 1 트리 구조는 모니터링 프로그램(210)이 제 1 및 제 2 트리 구조의 비교 판별을 실행하기 전, 웹사이트(100)에 미리 접근하여 추출, 생성 및 저장되는 것이 바람직하다. 또한 제 2 트리 구조는 모니터링 프로그램(210)의 제 1 및 제 2 트리 구조에 대한 비교 판별이 이루어지면, 실시간으로 생성되어 각각의 웹사이트(100)에 대응되도록 저장된다.
고유 권한 정보(225)는 예를 들어, IP(Internet Protocol : IP), 웹사이트(100)의 접근이 인허된 ID(Identification : ID) 등 웹사이트(100)의 접근 권한을 갖는 식별 정보로써, 복수로 구비될 수 있으며, 웹사이트(100)로부터 적어도 하나의 고유 권한 정보(225)가 차단되는 것에 대응하는 것이 바람직하다.
차단 매핑 테이블(227)은 차단된 고유 권한 정보(225)와 고유 권한 정보(225)를 차단시킨 웹사이트(100)가 상호 일대일 대응되도록 할 수 있다. 물론, 차단 매핑 테이블(227)에 저장된 고유 권한 정보(225)와 웹사이트(100)는 일대일 대응될 수 있을 뿐만 아니라, 복수의 차단된 고유 권한 정보(225)에 하나의 웹사이트(100)가 중복된다면 다대일 대응될 수도 있다.
증거 수집 정보(229)는 증거 자료 수집부(215)에 의해 수집된 사용자 인터페이스, 제 2 트리 구조 및 태그의 개수를 제 1 트리 구조와 다르다고 판별된 제 2 트리 구조에 대응되는 웹사이트에 구별 가능하게끔 저장할 수 있다. 아울러, 증거 수집 정보(229)는 관리자 또는 저작권자의 요청에 따라 외부에 제공될 수 있다.
도 3을 참조하여 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법을 설명한다.
도 3은 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법의 처리 수순을 표현하는 도면이다.
도 3을 참조하면, 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법은 단계 S310에서 웹 페이지 생성 파일로 구성되는 적어도 하나의 웹 페이지(110)가 포함된 웹사이트(100)에 모니터링 서버(200)가 접근하고, 접근한 모니터링 서버(200)가 웹 페이지 생성 파일에 포함된 태그를 추출하여 계층형의 제 1 트리 구조를 생성 및 저장한다.
단계 S320에서 모니터링 서버(200)는 실시간으로 제공되는 웹 페이지(110)에 다시 접근하여 해당 웹 페이지(110)를 탐색, 즉 모니터링한다.
단계 S330에서 모니터링 서버(200)는 실시간으로 제공되는 웹 페이지(110)의 웹 페이지 생성 파일에 포함된 태그를 추출하여 계층형의 제 2 트리 구조를 생성한다.
단계 S340에서 모니터링 서버(200)는 저장된 제 1 트리 구조와 새로이 생성된 제 2 트리 구조를 비교하여 일치 여부를 판별한 결과, 제 1 및 제 2 트리 구조가 일치한다고 판별되면, 이 수순은 단계 S350으로 진행하여 해당 웹 페이지(110)를 지속적으로 탐색하고, 제 1 및 제 2 트리 구조가 일치하지 않는다고 판별되면, 이 수순은 단계 S360 및 단계 S370으로 진행한다.
모니터링 서버(200)는 단계 S350에서 제 1 및 제 2 트리 구조가 서로 다르다고 판별되면, 단계 S360에서 제 1 트리 구조와 다르다고 판별된 제 2 트리 구조에 대응되는 웹 페이지(110)의 사용자 인터페이스와 제 2 트리 구조를 저장한다.
또한 모니터링 서버(200)는 단계 S350에서 제 1 및 제 2 트리 구조가 서로 다르다고 판별되면, 단계 S370에서 제 2 트리 구조에 포함된 태그 중 제 1 트리 구조와 서로 다른 태그의 개수를 산출하여 단계 S350에서 저장되는 사용자 인터페이스 및 제 2 트리 구조와 함께 데이터베이스(220)에 저장한다.
따라서, 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법은 단계 S310 내지 S370의 과정을 수행함으로써, 웹사이트(100)가 웹 페이지(110) 구조를 변경하여 저작권법에 저촉되는 디지털 콘텐츠를 유통하는 행위를 포착할 수 있다.
이상에서, 본 발명의 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템 및 그 방법을 상세한 설명과 도면에 따라 나타내었지만, 이는 실시예를 들어 설명한 것에 불과하며, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 다양한 변화 및 변경이 가능하다.
10 : 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템
100 : 웹사이트
110 : 웹 페이지
200 : 모니터링 서버
201 : 통신부
202 : 제어부
210 : 모니터링 프로그램
220 : 데이터베이스

Claims (10)

  1. 웹 페이지 생성 파일로 구성된 적어도 하나의 웹 페이지를 포함하는 웹사이트; 및
    상기 웹사이트의 접근 권한을 갖는 복수의 고유 권한 정보 중 적어도 하나의 상기 고유 권한 정보를 이용해 상기 웹사이트에 접근하고, 상기 웹 페이지 생성 파일에 포함된 태그(tag)를 추출하여 계층형의 제 1 트리 구조를 생성 및 저장하며, 상기 제 1 트리 구조와 실시간으로 제공되는 상기 웹 페이지의 상기 웹 페이지 생성 파일로부터 추출 및 생성된 계층형의 제 2 트리 구조를 비교하여 상기 제 1 및 상기 제 2 트리 구조의 일치 여부를 판별하는 모니터링 서버;를 포함하고,
    상기 모니터링 서버는,
    상기 제 1 및 상기 제 2 트리 구조의 일치 여부를 판별한 결과, 상기 제 1 및 상기 제 2 트리 구조가 서로 다르다고 판별되면, 상기 제 1 트리 구조와 다르다고 판별된 상기 제 2 트리 구조에 대응되는 상기 웹 페이지의 사용자 인터페이스와 상기 제 2 트리 구조를 저장하는 것을 특징으로 하는 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템.
  2. 삭제
  3. 청구항 1에 있어서,
    상기 모니터링 서버는,
    상기 제 1 및 상기 제 2 트리 구조의 일치 여부를 판별한 결과, 상기 제 1 및 상기 제 2 트리 구조가 서로 다르다고 판별되면, 상기 제 2 트리 구조에 포함된 태그 중 상기 제 1 트리 구조와 서로 다른 태그의 개수를 산출하는 것을 특징으로 하는 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템.
  4. 청구항 1에 있어서,
    상기 모니터링 서버는,
    상기 웹사이트로부터 상기 고유 권한 정보가 차단되면, 차단된 상기 고유 권한 정보를 제외한 다른 상기 고유 권한 정보를 이용해 상기 웹사이트에 대한 접근을 재개하는 것을 특징으로 하는 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템.
  5. 청구항 4에 있어서,
    상기 모니터링 서버는,
    상기 웹사이트로부터 차단된 상기 고유 권한 정보와 상기 고유 권한 정보를 차단시킨 상기 웹사이트가 상호 매핑된 차단 매핑 테이블을 저장하고, 상기 고유 권한 정보를 차단시킨 상기 웹사이트로부터 다른 상기 고유 권한 정보가 차단되면, 상기 차단 매핑 테이블로부터 상기 고유 권한 정보를 차단시킨 상기 웹사이트에 대응되는 상기 고유 권한 정보를 추출하며, 추출된 상기 고유 권한 정보가 차단 해제되었는지에 따라 추출된 상기 고유 권한 정보를 이용해 상기 고유 권한 정보를 차단 시킨 상기 웹사이트의 모니터링을 재개하는 것을 특징으로 하는 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템.
  6. 청구항 1에 기재된 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템의 모니터링 방법에 있어서,
    웹 페이지 생성 파일로 구성되는 적어도 하나의 웹페이지가 포함된 웹사이트에 모니터링 서버가 접근하고, 상기 웹 페이지 생성 파일에 포함된 태그를 추출하여 계층형의 제 1 트리 구조를 생성 및 저장하는 제 1 트리 구조 생성 및 저장 단계;
    상기 모니터링 서버가 실시간으로 제공되는 상기 웹 페이지에 다시 접근하고, 실시간으로 제공되는 상기 웹 페이지의 상기 웹 페이지 생성 파일에 포함된 태그를 추출하여 계층형의 제 2 트리 구조를 생성하는 제 2 트리 구조 생성 단계; 및
    상기 모니터링 서버가 상기 제 1 및 상기 제 2 트리 구조를 비교하여 일치 여부를 판별하는 트리 구조 판별 단계; 및
    상기 모니터링 서버가 상기 트리 구조 판별 단계에서 상기 제 1 및 상기 제 2 트리 구조의 일치 여부를 판별한 결과, 상기 제 1 및 상기 제 2 트리 구조가 서로 다르다고 판별되면, 상기 제 1 트리 구조와 다르다고 판별된 상기 제 2 트리 구조에 대응되는 상기 웹 페이지의 사용자 인터페이스와 상기 제 2 트리 구조를 저장하는 증거 수집 단계;를
    포함하는 것을 특징으로 하는 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법.
  7. 삭제
  8. 청구항 6에 있어서,
    상기 증거 수집 단계는,
    상기 모니터링 서버가 상기 제 1 및 상기 제 2 트리 구조의 일치 여부를 판별한 결과, 상기 제 1 및 상기 제 2 트리 구조가 서로 다르다고 판별되면, 상기 제 2 트리 구조에 포함된 태그 중 상기 제 1 트리 구조와 서로 다른 태그의 개수를 산출하는 것을 특징으로 하는 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법.
  9. 청구항 6에 있어서,
    상기 모니터링 서버는,
    상기 웹사이트에 대한 접근 권한을 갖는 복수의 고유 권한 정보 중 적어도 하나의 상기 고유 권한 정보를 이용해 상기 웹사이트에 접근하되, 상기 웹사이트로부터 상기 고유 권한 정보가 차단되면, 차단된 상기 고유 권한 정보를 제외한 다른 상기 고유 권한 정보를 이용해 상기 웹사이트에 대한 접근을 재개하는 것을 특징으로 하는 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법.
  10. 청구항 9에 있어서,
    상기 모니터링 서버는,
    상기 웹사이트로부터 차단된 상기 고유 권한 정보와 상기 고유 권한 정보를 차단시킨 상기 웹사이트가 상호 매핑된 차단 매핑 테이블을 저장하고, 상기 고유 권한 정보를 차단시킨 상기 웹사이트로부터 다른 상기 고유 권한 정보가 차단되면, 상기 차단 매핑 테이블로부터 상기 고유 권한 정보를 차단시킨 상기 웹사이트에 대응되는 상기 고유 권한 정보를 추출하며, 추출된 상기 고유 권한 정보가 차단 해제되었는지에 따라 추출된 상기 고유 권한 정보를 이용해 상기 고유 권한 정보를 차단 시킨 상기 웹사이트의 모니터링을 재개하는 것을 특징으로 하는 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 방법.
KR1020180003285A 2017-01-13 2018-01-10 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템 및 그 방법 KR101904486B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170006189 2017-01-13
KR20170006189 2017-01-13

Publications (2)

Publication Number Publication Date
KR20180083800A KR20180083800A (ko) 2018-07-23
KR101904486B1 true KR101904486B1 (ko) 2018-10-05

Family

ID=63102943

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180003285A KR101904486B1 (ko) 2017-01-13 2018-01-10 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR101904486B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083754A (zh) * 2019-04-23 2019-08-02 重庆紫光华山智安科技有限公司 结构变化网页的自适应数据抽取方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102435339B1 (ko) * 2019-12-04 2022-08-23 아주대학교산학협력단 저작권 침해 의심 사이트 추적 및 증거 수집 방법, 및 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677764A (zh) * 2015-12-30 2016-06-15 百度在线网络技术(北京)有限公司 信息提取方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101634754B1 (ko) 2015-10-15 2016-07-22 (주)여섯번째데이터 저작물 공유에 대한 모니터링 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105677764A (zh) * 2015-12-30 2016-06-15 百度在线网络技术(北京)有限公司 信息提取方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083754A (zh) * 2019-04-23 2019-08-02 重庆紫光华山智安科技有限公司 结构变化网页的自适应数据抽取方法

Also Published As

Publication number Publication date
KR20180083800A (ko) 2018-07-23

Similar Documents

Publication Publication Date Title
US20190377764A1 (en) Illegal content search system and method thereof
US7941857B2 (en) Data network and method for checking nodes of a data network
US10873507B2 (en) Proxy automatic configuration file manager
US20090113545A1 (en) Method and System for Tracking and Filtering Multimedia Data on a Network
JP2006520940A (ja) インターネット検索エンジンにおける無効クリック検出方法および装置
JP2008146517A (ja) データ配布システムおよびインデクス保持装置
JP2010146457A (ja) 情報処理システムおよびプログラム
KR101904486B1 (ko) 트리 구조를 비교하여 웹 페이지의 변경을 감지하는 모니터링 시스템 및 그 방법
KR20170101624A (ko) 디지털 콘텐츠 모니터링 시스템 및 그 처리 방법
JP6768965B2 (ja) ウェブサイトモニタリングシステム及びモニタリング方法
JP2009003549A (ja) データ管理装置およびデータ管理方法、データ管理プログラム、データ管理プログラム記憶媒体
KR20080039324A (ko) 디지털 저작권 관리를 위한 워터마크 추적 시스템
KR20130093230A (ko) 웹상에서의 저작권 침해 컨텐츠에 대한 검출 및 관리 시스템
JP2015106330A (ja) 著作権侵害監視システム、監視サーバおよびプログラム
JP2001306528A (ja) コンテンツ配信方法およびシステムとコンテンツ配信プログラムを記録した記録媒体
KR20170099177A (ko) 접근 권한 별로 분리된 브라우저 프로세스를 이용한 브라우저 제공 방법 및 이를 이용한 장치
JP2007148739A (ja) ファイル管理システム及びそのプログラム
JP2005332049A (ja) ポリシ変換方法、ポリシ移行方法およびポリシ評価方法
KR101544750B1 (ko) 더미 인증키를 이용한 클라우드 시스템의 보안 장치 및 방법
KR101640929B1 (ko) 데이터 접근 경로를 추적하는 방법 및 장치
KR101594643B1 (ko) 실행 파일의 부분 정보에 기반한 소프트웨어 불법 복제 및 표절 탐지 방법 및 이를 위한 장치
KR101460410B1 (ko) 온라인을 통한 콘텐츠 감시 시스템 및 방법
JP6697104B1 (ja) ファイルシステム基盤の高速探索、完全削除、シンボリックリンクを利用した個人情報保護システム及びその方法
Yokoyama et al. A proposal of preventive measure of pursuit using a browser fingerprint
KR100973220B1 (ko) 워터마크를 이용한 디지털 저작권 보호 시스템

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right