KR102022058B1 - Method and system for detecting counterfeit of web page - Google Patents

Method and system for detecting counterfeit of web page Download PDF

Info

Publication number
KR102022058B1
KR102022058B1 KR1020180019753A KR20180019753A KR102022058B1 KR 102022058 B1 KR102022058 B1 KR 102022058B1 KR 1020180019753 A KR1020180019753 A KR 1020180019753A KR 20180019753 A KR20180019753 A KR 20180019753A KR 102022058 B1 KR102022058 B1 KR 102022058B1
Authority
KR
South Korea
Prior art keywords
web page
forgery
image
histogram
web
Prior art date
Application number
KR1020180019753A
Other languages
Korean (ko)
Other versions
KR20190099816A (en
Inventor
서승철
이근기
Original Assignee
주식회사 디로그
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 디로그 filed Critical 주식회사 디로그
Priority to KR1020180019753A priority Critical patent/KR102022058B1/en
Publication of KR20190099816A publication Critical patent/KR20190099816A/en
Application granted granted Critical
Publication of KR102022058B1 publication Critical patent/KR102022058B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

본 발명은 이미지 기반의 웹 페이지 위변조 탐지 방법 및 시스템에 관한 것으로, 기 설정된 기간 동안 기 설정된 횟수 이상으로 웹 사이트에 접속하며, 접속할 때마다 상기 웹 페이지에 대한 이미지를 수집하는 단계와, 상기 수집한 이미지 각각과 웹 페이지의 원본 이미지간 비교를 통해 상기 이미지 각각에 대한 수치화 결과 값을 계산한 후 이를 저장매체에 저장하는 단계와, 상기 저장매체에 저장된 상기 이미지 각각에 대한 수치화 결과 값을 이용하여 학습 모델을 생성하여 학습 모델 데이터베이스에 저장하는 단계와, 이후 수집되는 웹 페이지의 이미지에 대한 특징점을 추출하며, 상기 특징점과 원본 이미지의 특징점간의 비교를 통해 위변조 판단용 정보를 산출하며, 상기 산출한 위변조 판단용 정보와 상기 학습 모델 데이터베이스에 저장된 학습 모델간의 비교를 통해 상기 이후 수집되는 웹 페이지에 대한 위변조 여부를 판단하는 단계를 포함하는 웹 페이지 위변조 탐지 방법을 제공할 수 있다.The present invention relates to an image-based web page forgery detection method and system, comprising: accessing a web site more than a predetermined number of times during a preset period of time, collecting an image for the web page every time; Computing a numerical result value for each of the images by comparing each image with the original image of the web page, and storing it in a storage medium, and learning using the numerical result value for each of the images stored in the storage medium Generating and storing a model in a training model database, and extracting feature points for the images of the web pages collected thereafter, calculating information for determining forgery and forgery by comparing the feature points with the feature points of the original image, and calculating the forgery. Judgment information and training stored in the learning model database By comparing the models, it is possible to provide a web page forgery detection method comprising the step of determining whether the forgery for the subsequently collected web page.

Description

웹 페이지 위변조 탐지 방법 및 시스템{METHOD AND SYSTEM FOR DETECTING COUNTERFEIT OF WEB PAGE}Web page forgery detection method and system {METHOD AND SYSTEM FOR DETECTING COUNTERFEIT OF WEB PAGE}

본 발명은 이미지 기반으로 웹 페이지의 위변조 여부를 판단하는 웹 페이지 위변조 탐지 방법 및 시스템에 관한 것이다.The present invention relates to a web page forgery detection method and system for determining whether the web page forgery based on the image.

최근 국내 웹사이트의 보안 취약성과 관련하여 악성코드 유포사이트나 사기쇼핑몰 등 네티즌들을 위험에 빠뜨릴 수 있는 웹사이트 수가 무려 1만2000여 개를 넘어섰다. 웹사이트 곳곳이 '함정'인 셈이다.Recently, the number of websites that can put netizens at risk such as malware dissemination sites and fraudulent shopping malls has exceeded 12,000 in relation to the security vulnerability of domestic websites. All over the website is a trap.

또한 최신의 해킹 기법은 웹사이트를 통한 악성코드를 유포하는 방식도 보다 교묘해지고 있는 실정이다.In addition, the latest hacking techniques are becoming more sophisticated methods of distributing malicious code through websites.

일반적으로 이 같은 방식은 웹사이트를 해킹한 뒤 이용자 PC가 접속할 경우, 악성코드 숙주서버와 링크되는 코드를 홈페이지 안에 숨겨놓는 경우가 대부분인데, 해당 코드를 암호화하는 방법 등을 통해 탐지시스템을 우회하는 것이 그 핵심에 있다고 하겠다.In general, this method usually hacks a website and hides the code linked to the malware host server in the homepage when the user's PC accesses it. By bypassing the detection system by encrypting the code, Is at its core.

여기에 구글의 검색엔진을 활용해 취약점에 노출된 다량의 웹사이트를 한꺼번에 공격하는 해킹방식도 여전히 기승을 부리고 있는 실정이다.In addition, hacking methods that use Google's search engine to attack a large number of websites exposed to vulnerabilities are still on the rise.

과거에는 주로 MS 윈도 보안업데이트만 제대로 받으면 웹 바이러스 피해를 최소화할 수 있었지만, 최근에는 웹서버 자체에 대한 응용프로그램 및 데이터 베이스에 대한 종합적인 보안업데이트가 시급해지고 있다는 얘기다.In the past, if only Microsoft Windows security update was properly received, web virus damage could be minimized. In recent years, comprehensive security update of application and database on web server itself is urgently needed.

이러한 시대적 상황을 배경으로 다양한 보안장비 및 소프트웨어들이 개발되었음에도 왜 네트워크를 통하여 공격 및 전파되는 위협으로부터 자유롭지 못한 것은 웹이 주는 다양한 편의성 때문이다.Although various security devices and software have been developed in the background of this era, the reason why it is not free from the threat of attack and propagation through the network is because of the convenience of the web.

이러한 편의성은 종종 공격자로 하여금 유용한 Evasion(탐지 회피)기술이 된다.This convenience is often an attacker's useful evasion technique.

상기 회피 기술을 이용한 해킹 공격에 공격당하는 경우, 보통 관리자들에게 발견되지 않으며, 아주 오랜 기간 동안 웹 서버의 서비스 내에 활동하는 각종 정보들을 유출 및 열람하고, 추가적으로 발생되는 부가 정보를 얻기 위하여 시스템 내에 인위적으로 기생한다.When attacked by a hacking attack using the above-mentioned evasion technique, it is not usually found by administrators, and it is artificial in the system in order to leak and view various kinds of information active in the service of the web server for a long time, and to obtain additional information generated additionally. Parasitic

더불어 공격자는 자신에게 주어진 제어권을 이용하여 웹서버 내지는 서비스에 접속하는 정상 사용자들에게 악의적인 프로그램을 내려보내기 위하여 초기 웹페이지내(디폴트 웹페이지)를 수정하는 방법들을 널리 이용하고 있다.In addition, the attacker has widely used the method of modifying the initial web page (default web page) to send malicious programs to normal users who access the web server or service using the control given to him.

또한 기존에 사용되던 웹페이지의 위변조를 체크하던 방법론의 경우, 단순히 HASH 알고리즘을 이용하여 Checksum만을 비교하여 홈페이지의 위변조를 경보하고 복구하는 수준에 그쳐 다이나믹한(동적인) 웹페이지가 보편화된 현재의 웹구조에서는 오탐 확률이 매우 높아져 단순히 Checksum만을 비교하는 방법은 이미 구세대의 유물이 되고 말았다.In addition, in the case of the method for checking forgery and alteration of the webpages used in the past, it is only a level that alerts and recovers the forgery of the homepage by simply comparing the checksum using a HASH algorithm. In the web structure, the probability of false positives is so high that simply comparing the checksum has become an artifact of the old generation.

대한민국 등록특허 제10-0912794호(2009.08.18. 등록)Republic of Korea Patent No. 10-0912794 (registered August 18, 2009)

본 발명은 웹 페이지의 이미지를 기반으로 웹 페이지의 위변조 여부를 판별할 수 있는 웹 페이지 위변조 탐지 시스템 및 방법을 제공한다.The present invention provides a web page forgery detection system and method that can determine whether the web page forgery based on the image of the web page.

또한, 본 발명은 웹 페이지의 이미지를 수치화시키며, 수치화된 결과 값을 이용하여 웹페이지의 위변조 여부를 판별할 수 있는 웹 페이지 위변조 탐지 시스템 및 방법을 제공한다.In addition, the present invention provides a web page forgery detection system and method for digitizing the image of the web page, and can determine whether the forgery of the web page using the digitized result value.

본 발명은 웹페이지가 위변조된 경우 원본 웹 페이지 파일을 이용하여 복구할 수 있는 웹 페이지 위변조 탐지 시스템 및 방법을 제공한다.The present invention provides a web page forgery detection system and method that can be recovered by using the original web page file when the web page is forged.

상술한 해결하고자 하는 과제를 해결하기 위해서 본 발명의 실시예에 따른 웹 페이지 위변조 탐지 방법은 기 설정된 기간 동안 기 설정된 횟수 이상으로 웹 사이트에 접속하며, 접속할 때마다 상기 웹 페이지에 대한 이미지를 수집하는 단계와, 상기 수집한 이미지 각각과 웹 페이지의 원본 이미지간 비교를 통해 상기 이미지 각각에 대한 수치화 결과 값을 계산한 후 이를 저장매체에 저장하는 단계와, 상기 저장매체에 저장된 상기 이미지 각각에 대한 수치화 결과 값을 이용하여 학습 모델을 생성하여 학습 모델 데이터베이스에 저장하는 단계와, 이후 수집되는 웹 페이지의 이미지에 대한 특징점을 추출하며, 상기 특징점과 원본 이미지의 특징점간의 비교를 통해 위변조 판단용 정보를 산출하며, 상기 산출한 위변조 판단용 정보와 상기 학습 모델 데이터베이스에 저장된 학습 모델간의 비교를 통해 상기 이후 수집되는 웹 페이지에 대한 위변조 여부를 판단하는 단계를 포함할 수 있다.In order to solve the above-mentioned problem, the web page forgery detection method according to an embodiment of the present invention accesses a web site more than a predetermined number of times during a predetermined period, and collects an image for the web page every time. And calculating a numerical result value for each of the images by comparing the collected images with the original images of the web page, and storing the calculated numerical values for each of the images, and storing each of the images stored in the storage medium. Generating a training model using the result value and storing the training model in a training model database, and extracting feature points for the images of the collected web pages, and calculating the information for forgery determination by comparing the feature points with those of the original image. And the calculated forgery information and the learning model Emitter may comprise determining whether the forgery of the web pages is collected through the subsequent comparison of the learning model stored in the database.

본 발명의 실시예에 따른 상기 저장매체에 저장하는 단계는 기 설정된 기간 동안 수집한 웹 페이지에 대한 이미지 각각과 원본 이미지에 대한 특징점 매칭 또는 히스토그램 비교 분석을 통해 상기 이미지 각각에 대한 수치화 결과 값을 계산할 수 있다.The storing in the storage medium according to an embodiment of the present invention may calculate the numerical result value for each of the images through the feature point matching or histogram comparison and analysis of each image and the original image for the web page collected during the predetermined period. Can be.

본 발명의 실시예에 따르면, 상기 수집하는 단계는 상기 웹 사이트 접속 시 접근 타임 아웃 시간을 산출하는 단계와, 상기 접근 타임 아웃 시간 이내에 상기 웹 사이트에 접속되어 생성된 상기 웹 페이지의 이미지를 저장매체에 저장하여 수집하는 단계를 포함할 수 있다.According to an embodiment of the present invention, the collecting may include calculating an access timeout time when the web site is accessed, and storing an image of the web page generated by accessing the web site within the access timeout time. It may include storing in the collection.

상술한 해결하고자 하는 과제를 해결하기 위해서 본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템은 기 설정된 기간 동안 기 설정된 횟수 이상으로 웹 사이트에 접속하며, 접속할 때마다 상기 웹 페이지에 대한 이미지를 수집하는 이미지 수집부와, 상기 수집한 이미지 각각과 웹 페이지의 원본 이미지간 비교를 통해 상기 이미지 각각에 대한 수치화 결과 값을 계산한 후 이를 저장매체에 저장하는 모델러부와, 상기 저장매체에 저장된 상기 이미지 각각에 대한 수치화 결과 값을 이용하여 학습 모델을 생성하여 학습 모델 데이터베이스에 저장하는 머신 러닝부와, 이후 수집되는 웹 페이지의 이미지에 대한 특징점을 추출하며, 상기 특징점과 원본 이미지의 특징점간의 비교를 통해 위변조 판단용 정보를 산출하며, 상기 산출한 위변조 판단용 정보와 상기 학습 모델 데이터베이스에 저장된 학습 모델간의 비교를 통해 상기 이후 수집되는 웹 페이지에 대한 위변조 여부를 판단하 위변조 판단부를 포함할 수 있다.In order to solve the above-mentioned problem, a web page forgery detection system according to an embodiment of the present invention accesses a web site more than a predetermined number of times during a predetermined period, and collects an image for the web page every time. An image collecting unit, a modeler unit which calculates a numerical result of each of the images by comparing the collected images with the original images of the web page, and stores the calculated values in the storage medium, and each of the images stored in the storage medium. The machine learning unit generates a training model by using the numerical result of and stores the training model in the training model database, and extracts feature points for the images of the collected web pages, and compares the feature points with the feature points of the original image. Calculating judgment information, and calculating the forgery judgment And whether the forgery of the web pages that are collected after the learning model through the comparison between the learning model stored in the database may include a judge to determine forgery.

본 발명의 실시예에 따르면, 상기 위변조 탐지 시스템은 상기 웹 사이트의 접속 주기가 설정되어 있으며, 상기 접속 주기에 따라 상기 이미지 수집부 및 상기 위변조 판단부를 동작시켜 웹 사이트에 접속시키는 스케쥴러부를 더 포함할 수 있다.According to an embodiment of the present invention, the forgery detection system has a connection period of the web site is set, and further comprising a scheduler unit for connecting to the web site by operating the image collection unit and the forgery determination unit according to the access period. Can be.

본 발명의 실시예에 따르면, 상기 위변조 탐지 시스템은 복구용 웹 페이지 파일이 저장된 복구용 파일 저장소와, 상기 웹 사이트 상에 복구용 에이전트를 설치하며, 상기 위변조 판단부의 판단 결과 상기 웹 페이지가 위변조된 것으로 판단될 때 상기 복구용 에이전트와의 통신을 통해 상기 복구용 파일 저장소에 저장된 복구용 웹 페이지 파일을 전송하는 웹 페이지 복구부를 더 포함할 수 있다.According to an embodiment of the present invention, the forgery detection system is to install a recovery file storage for storing the recovery web page file, and a recovery agent on the web site, the web page is forged as a result of the determination of the forgery determination unit The web page recovery unit may further include a web page recovery unit configured to transmit a repair web page file stored in the repair file store through communication with the repair agent when determined to be determined.

본 발명의 실시예에 따르면, 상기 모델러부는 기 설정된 기간 동안 수집한 웹 페이지에 대한 이미지 각각과 원본 이미지간의 특징점 매칭 또는 히스토그램 비교 분석을 통해 상기 이미지 각각에 대한 수치화 결과 값을 계산할 수 있다.According to an embodiment of the present invention, the modeler may calculate a numerical result value for each of the images through a feature point matching or histogram comparison analysis between the images of the web pages collected during the predetermined period and the original image.

본 발명의 실시예에 따르면, 상기 이미지 수집부는 상기 웹 사이트 접속 시 접근 타임 아웃 시간을 산출하며, 상기 접근 타임 아웃 시간 내에 상기 웹 사이트에 접속된 경우에만 상기 웹 페이지에 대한 이미지를 수집할 수 있다.According to an embodiment of the present invention, the image collecting unit calculates an access timeout time when accessing the web site, and collects an image for the web page only when the web site is accessed within the access timeout time. .

전술한 본 발명의 과제 해결 수단에 따르면, 웹 페이지의 이미지를 수치화시키며, 수치화된 결과 값을 이용하여 웹페이지의 위변조 여부를 판별할 수 있는 웹 페이지 위변조 탐지 시스템 및 방법을 제공함으로써, 웹 페이지 변조 공격에 민감하게 대응할 수 있다.According to the aforementioned problem solving means of the present invention, by digitizing the image of the web page, by providing a web page forgery detection system and method that can determine whether the forgery of the web page using the digitized result value, Can respond sensitively to attacks.

또한, 전술한 본 발명의 과제 해결 수단에 따르면, 웹 페이지의 이미지를 기반으로 학습 모델을 구축하고, 구축한 학습 모델을 이용하여 웹 페이지 위변조 공격에 대응할 수 있는 시스템 및 방법을 제공함으로써, 웹 페이지 위변조 판단 시간을 최소화시킬 수 있을 뿐만 아니라 네트워크 망 내 부하를 최소화시킬 수 있다.In addition, according to the above-described problem solving means of the present invention, by building a learning model based on the image of the web page, by providing a system and method that can respond to the web page forgery attack using the built learning model, In addition to minimizing forgery and judgment time, the load on the network can be minimized.

도 1은 본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템의 전반적인 구성을 도시한 블록도이다.
도 2는 본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템이 웹 페이지에 대한 위변조 판단을 위한 학습 모델을 생성하는 과정을 도시한 흐름도이다.
도 3은 본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템이 웹 페이지에 대한 위변조 판단을 위한 학습 모델을 생성하는 과정을 도시한 흐름도이다.
1 is a block diagram showing the overall configuration of a web page forgery detection system according to an embodiment of the present invention.
2 is a flowchart illustrating a process of generating, by the web page forgery detection system according to an embodiment of the present invention, a learning model for determining forgery for a web page.
3 is a flowchart illustrating a process in which a web page forgery detection system according to an embodiment of the present invention generates a learning model for determining a forgery for a web page.

이하, 도면을 참조하여 본 발명의 구체적인 실시형태를 설명하기로 한다. 이하의 상세한 설명은 본 명세서에서 기술된 방법, 장치 및/또는 시스템에 대한 포괄적인 이해를 돕기 위해 제공된다. 그러나 이는 예시에 불과하며 본 발명은 이에 제한되지 않는다.Hereinafter, specific embodiments of the present invention will be described with reference to the drawings. The following detailed description is provided to assist in a comprehensive understanding of the methods, devices, and / or systems described herein. However, this is only an example and the present invention is not limited thereto.

본 발명의 실시 예들을 설명함에 있어서, 본 발명과 관련된 공지기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다. 그리고, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다. 상세한 설명에서 사용되는 용어는 단지 본 발명의 실시예들을 기술하기 위한 것이며, 결코 제한적이어서는 안 된다. In describing the embodiments of the present invention, when it is determined that the detailed description of the known technology related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted. In addition, terms to be described below are terms defined in consideration of functions in the present invention, which may vary according to the intention or custom of a user or an operator. Therefore, the definition should be made based on the contents throughout the specification. The terminology used in the description is for the purpose of describing embodiments of the invention only and should not be limiting.

이하 첨부된 도면을 참조하여 웹 페이지 위변조 탐지 시스템에 대해 설명하기로 한다.Hereinafter, a web page forgery detection system will be described with reference to the accompanying drawings.

도 1은 본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템의 전반적인 구성을 도시한 블록도이다.1 is a block diagram showing the overall configuration of a web page forgery detection system according to an embodiment of the present invention.

도 1에 도시된 바와 같이, 웹 페이지 위변조 탐지 시스템은 크게 이미지 수집부(100), 모델러부(102), 머신 러닝부(104), 위변조 판단부(106), 저장매체(108) 및 학습 모델 데이터베이스(110) 등을 포함할 수 있다.As illustrated in FIG. 1, the web page forgery detection system is largely comprised of an image collector 100, a modeler 102, a machine learning unit 104, a forgery determination unit 106, a storage medium 108, and a learning model. Database 110 and the like.

이미지 수집부(100)는 기 설정된 주기, 예컨대 5분∼10분 단위로 웹 사이트에 접속하여 주기별로 웹 페이지 이미지를 수집할 수 있다. 구체적으로, 이미지 수집부(100)는 기 설정된 주기를 이용하여 기 저장된 웹 사이트의 접속 정보, 예컨대 URL 정보를 이용하여 웹 사이트에 접속한 후 멀티스레드 다운로더를 이용하여 웹 사이트에 대한 웹 페이지를 다운로드받아 이미지화시켜 저장매체(108)에 저장할 수 있다. 이에 따라, 저장매체(108)에는 주기별 웹 페이지의 이미지가 저장될 수 있다.The image collection unit 100 may access a web site at predetermined intervals, for example, 5 to 10 minutes, and collect web page images for each period. In detail, the image collection unit 100 accesses a web site using access information of a pre-stored web site, for example, URL information by using a preset period, and then downloads a web page for the web site using a multi-threaded downloader. The image may be received and stored in the storage medium 108. Accordingly, the storage medium 108 may store an image of a web page for each period.

또한, 이미지 수집부(100)는 웹 사이트에 대한 접근 타임 아웃 시간이 설정되어 있으며, 웹 사이트 접속 시 접속에 걸리는 시간(접속 시간)을 산출한 후 산출한 접속 시간이 접근 타임 아웃 시간 이내일 경우 정상적인 웹 사이트의 접속으로 판단하여 웹 페이지에 대한 이미지를 저장매체(108)에 저장할 수 있다.In addition, the image collection unit 100 is set to the access timeout time for the web site, and when the access time calculated after calculating the access time (access time) to access the web site is within the access timeout time The image of the web page may be stored in the storage medium 108 by determining that a normal web site is accessed.

본 발명의 실시예에 따른 이미지 수집부(100)는 웹 크롤러, 봇(bot), 웹 스파이더, 앤트, 웹 로봇, 윔 등을 이용하여 구현될 수 있으나, 이에 한정하지는 않는다.The image collection unit 100 according to the embodiment of the present invention may be implemented using a web crawler, a bot, a web spider, an ant, a web robot, a web browser, but is not limited thereto.

모델러부(102)는 기 설정된 기간 동안 수집된 주기별 웹 페이지의 이미지 각각에 수치화 알고리즘을 적용하여 웹 페이지 이미지 각각에 대한 수치화 결과 값을 계산하며, 계산한 수치화 결과 값을 저장매체(108)에 저장할 수 있다. 구체적으로, 모델러부(102)는 웹 페이지에 대한 원본 이미지와 주기별 웹 페이지의 이미지 각각에 대한 특징점, 예컨대 이미지의 윤곽선을 추출한 후 원본 이미지의 윤곽선과 수집된 웹 페이지의 이미지에 대한 윤곽선간의 비교를 통해 수치화 결과 값을 계산하거나 원본 이미지와 수집한 웹 페이지 이미지의 컬러분포(히스토그램)를 추출한 후 이를 기반으로 컬러 분포에 대한 수치화 결과 값을 계산하여 저장매체(108)에 저장할 수 있다.The modeler 102 calculates a numerical result value for each web page image by applying a numerical algorithm to each image of a web page for each period collected for a predetermined period, and stores the calculated numerical result value in the storage medium 108. Can be stored. Specifically, the modeler unit 102 extracts a feature point for each of the image of the web page and the periodic image of the web page, for example, the contour of the image, and then compares the contour of the original image with the contour of the collected web page image. After calculating the numerical result value or extracting the color distribution (histogram) of the original image and the collected web page image based on this can be calculated and stored in the storage medium 108 the numerical result value for the color distribution.

이를 위하여, 본 발명의 실시예에 따른 모델러부(102)는 웹 페이지에 대한 원본 이미지를 저장 및 관리할 수 있다. 구체적으로, 모델러부(102)는 원본 이미지에 대한 특징점 정보, 예컨대 윤곽선, 히스토그램 등의 정보를 저장 및 관리할 수 있다.To this end, the modeler 102 according to an embodiment of the present invention may store and manage the original image for the web page. In detail, the modeler 102 may store and manage feature point information of the original image, for example, an outline, a histogram, and the like.

한편, 본 발명의 실시예에 따른 모델러부(102)에서 이용되는 알고리즘의 예로는 "feature matching", "compare Histogram" 등을 들 수 있으나, 이에 한정하지는 않는다.On the other hand, examples of the algorithm used in the modeler 102 according to an embodiment of the present invention may include, but are not limited to, "feature matching", "compare Histogram", and the like.

본 발명의 실시예에서 모델러부(102)에 의해 계산되는 수치화 결과 값은 원본 이미지의 윤곽선을 기준으로 하여 수집한 이미지와 원본 이미지간 윤곽선의 이동 값(근거리 이동 값, 원거리 이동 값, 유사한 위치 값 등을 포함함)일 수 있으며, 원본 이미지의 히스토그램과 수집한 이미지의 히스토그램간의 유사도 값 또는 변동 값일 수 있다. In the embodiment of the present invention, the numerical result calculated by the modeler 102 is a moving value of the contour between the collected image and the original image based on the contour of the original image (near distance movement value, distance movement value, similar position value). And the likeness value, or the variation value between the histogram of the original image and the histogram of the collected image.

머신 러닝부(104)는 저장매체(108)에 저장된 복수의 이미지에 대한 수치화 결과 값에 대한 머신 러닝을 수행하여 학습 모델을 생성하며, 생성한 웹 페이지에 대한 학습 모델을 웹 페이지의 식별 정보에 매칭시켜 학습 모델 데이터베이스(110)에 저장할 수 있다. 구체적으로, 머신 러닝부(104)는 윤곽선의 이동 값 또는 히스토그램 변동 값을 훈련 데이터로 설정하여 학습을 수행함으로써, 학습 모델을 생성할 수 있다.The machine learning unit 104 generates a learning model by performing machine learning on numerical result values of a plurality of images stored in the storage medium 108, and generates the learning model of the generated web page into identification information of the web page. The matching may be stored in the learning model database 110. In detail, the machine learning unit 104 may generate a learning model by performing training by setting a moving value or a histogram variation value of the contour as training data.

먼저, 윤곽선의 이동 값을 이용한 경우 머신 러닝부(104)는 원본 이미지의 윤곽선을 기준으로 한 주기별로 수집한 웹 페이지의 이미지에 대한 윤곽선 이동 값을 이용하여 정상 웹 페이지의 윤관선 이동 범위 값을 포함한 학습 모델을 생성하며, 컬러 분포(히스토그램)를 이용한 경우 정상 웹 페이지의 컬러 분포 변동 범위 값을 포함한 학습 모델을 생성할 수 있다.First, in the case of using the moving value of the contour, the machine learning unit 104 includes the contour moving range value of the normal web page using the moving value of the contour of the image of the web page collected at intervals based on the contour of the original image. A learning model is generated, and when a color distribution (histogram) is used, a learning model including a color distribution variation range value of a normal web page may be generated.

위변조 판단부(106)는 학습 모델을 생성한 후 웹 페이지에 대한 이미지를 수집(이하, '검사용 웹 페이지 이미지'라고 함)하며, 검사용 웹 페이지 이미지의 특징점, 예컨대 윤곽선, 히스토그램 등의 특징점을 추출한 후 추출한 특징점과 학습 모델 데이터베이스(110)에 저장된 학습 모델간의 비교를 통해 위변조 여부를 판단할 수 있다. 구체적으로, 위변조 판단부(106)는 검사용 웹 페이지의 이미지에서 윤곽선을 추출한 후 추출한 윤곽선이 원본 이미지에서 어느 정도 이동되었는지를 판단하며, 판단한 정도 값과 학습 모델을 비교하여 검사용 웹 페이지가 위조 또는 변조되었는지를 판단하거나, 검사용 웹 페이지의 이미지에서 히스토그램을 추출한 후 추출한 히스토그램과 원본 이미지의 히스토그램간의 비교를 통해 변동 정도를 산출하며, 산출한 변동 정보와 학습 모델을 비교하여 검사용 웹 페이지가 위조 또는 변조되었는지를 판단할 수 있다.The forgery determination unit 106 generates a learning model and collects an image of a web page (hereinafter referred to as an 'inspection web page image'), and a feature point of an inspection web page image, such as an outline and a histogram. After the extraction, the forgery may be determined by comparing the extracted feature points with the learning models stored in the learning model database 110. Specifically, the forgery determination unit 106 extracts the contour from the image of the inspection web page, and determines how much the extracted contour is moved in the original image. The inspection web page is forged by comparing the determined value with the learning model. Or determine whether the image has been tampered with, or extract a histogram from the image of the inspection web page, and then calculate the degree of variation by comparing the histogram of the extracted image with the histogram of the original image. It can be determined whether it is forged or tampered with.

본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템은 스케쥴러부(112)를 더 포함할 수 있다.Web page forgery detection system according to an embodiment of the present invention may further include a scheduler (112).

스케쥴러부(112)는 이미지 수집부(100) 및 위변조 판단부(106)의 웹 페이지에 대한 접속 주기를 설정할 수 있는 인터페이스를 제공하며, 인터페이스를 통해 설정된 접속 주기에 따라 이미지 수집부(100) 및 위변조 판단부(106)를 동작시킬 수 있다.The scheduler 112 provides an interface for setting an access cycle for the web page of the image collector 100 and the forgery determination unit 106, and according to the access cycle set through the interface. The forgery determination unit 106 may be operated.

또한, 본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템은 복수용 웹 페이지 파일이 저장된 복구용 파일 저장소(116) 및 웹 페이지 복구부(114)를 더 포함할 수 있다.In addition, the web page forgery detection system according to an embodiment of the present invention may further include a recovery file storage 116 and a web page recovery unit 114 is stored a plurality of web page files.

웹 페이지 복구부(114)는 웹 페이지 상에 복구용 에이전트를 설치하며, 위변조 판단부(106)의 판단 결과 웹 페이지가 위변조된 것으로 판단될 때 복구용 에이전트와의 통신을 통해 복구용 파일 저장소(116)에 저장된 복구용 웹 페이지 파일을 전송하여 웹 페이지를 복구시킬 수 있다. 구체적으로, 웹 페이지 복구부(114)는 웹 페이지와 관련된 파일을 저장 및 관리하는 웹 서버 상에 복구용 에이전트를 설치한 후 웹 페이지가 위변조된 것으로 판단될 경우 복구용 에이전트와의 통신을 통해 복구용 파일 저장소(116)에 저장된 복수용 웹 페이지 파일을 웹 서버에 전송하여 현재의 웹 페이지 파일을 정상 웹 페이지 파일로 변경시켜 복구시킬 수 있다.The web page recovery unit 114 installs a recovery agent on the web page, and when it is determined that the forgery determination unit 106 determines that the web page is forged, a file storage for recovery through communication with the recovery agent ( The web page may be restored by transmitting the repair web page file stored in 116. Specifically, the web page recovery unit 114 installs a recovery agent on a web server that stores and manages a file related to a web page, and then recovers it through communication with the recovery agent when it is determined that the web page is forged. A plurality of web page files stored in the file storage 116 for the web server may be transmitted to the web server to restore the current web page file to a normal web page file.

또한, 본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템은 인가된 접속만을 허용하기 위한 액세스 제어부(118), 저장매체(108)에 저장된 수치화된 데이터를 체계적으로 관리하기 위한 데이터 관리부(120), 저장매체(108), 학습 모델 데이터베이스(110) 및 복수용 파일 저장소(116)에 대한 저장용량을 관리하기 위한 저장매체 관리부(122) 등을 더 포함할 수 있다.In addition, the web page forgery detection system according to an embodiment of the present invention is the access control unit 118 for allowing only authorized access, the data management unit 120 for systematically managing the digitized data stored in the storage medium 108, The storage medium 108, the learning model database 110, and a storage medium manager 122 for managing storage capacity of the plurality of file storages 116 may be further included.

본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템은 관리자용 뷰어(124) 및 관제용 대시보드(126) 등을 제공하여 목적에 맞게 적합한 사용자 인터페이스를 제공할 수 있다.Web page forgery detection system according to an embodiment of the present invention can provide a user interface suitable for the purpose by providing an administrator viewer 124 and the control dashboard 126.

상술한 바와 같은 구성을 갖는 웹 페이지 위변조 탐지 시스템이 이미지를 기반으로 웹 페이지의 위변조를 탐지하는 과정에 대해 도 2 및 도 3을 참조하여 설명한다.A process of detecting forgery of a web page based on an image by the web page forgery detection system having the above-described configuration will be described with reference to FIGS. 2 and 3.

도 2는 본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템이 웹 페이지에 대한 위변조 판단을 위한 학습 모델을 생성하는 과정을 도시한 흐름도이다.2 is a flowchart illustrating a process in which a web page forgery detection system according to an embodiment of the present invention generates a learning model for determining a forgery for a web page.

도 2에 도시된 바와 같이, 먼저 웹 페이지 위변조 탐지 시스템은 스케쥴러부(112)에 설정된 접속 주기에 따라 이미지 수집부(100)를 구동시키며(S200), 이미지 수집부(100)의 구동을 통해 저장매체(108)의 검색을 통해 접속할 웹 사이트를 선택한 후 선택한 웹 사이트에 접속하여 웹 사이트에 대한 웹 페이지의 이미지를 생성한다(S202).As shown in FIG. 2, the web page forgery detection system first drives the image collecting unit 100 according to a connection period set in the scheduler unit 112 (S200), and stores the image collecting unit 100 by driving the image collecting unit 100. After selecting the web site to be accessed through the search of the medium 108, the web site is connected to the selected web site to generate an image of the web page for the web site (S202).

이때, 웹 페이지 위변조 탐지 시스템의 이미지 수집부(100)는 웹 사이트에 접속하는데 걸리는 시간인 접속 시간을 산출하며(S204), 산출한 접속 시간이 기 저장된 접근 타임 아웃 시간 이내인지를 판단, 즉 정상 접속인지를 판단한다(S206).At this time, the image collection unit 100 of the web page forgery detection system calculates the access time which is the time it takes to access the web site (S204), and determines whether the calculated access time is within the previously stored access timeout time, that is, normal It is determined whether the connection (S206).

S206의 판단 결과, 접근 타임 아웃 시간 이내일 경우 이미지 수집부(100)는 생성한 웹 페이지의 이미지를 저장매체(108)에 저장하며(S208), 그렇지 않을 경우 S200으로 진행하여 이후 단계를 진행한다.As a result of the determination in S206, if it is within the access timeout time, the image collecting unit 100 stores the generated web page image in the storage medium 108 (S208), otherwise proceeds to S200 and proceeds to the next step. .

이후, 웹 페이지 위변조 탐지 시스템의 이미지 수집부(100)는 기 설정된 시간이 경과되었는지를 판단한다(S210).Thereafter, the image collection unit 100 of the web page forgery detection system determines whether a predetermined time has elapsed (S210).

S210의 판단 결과, 기 설정된 시간이 경과된 경우 웹 페이지 위변조 탐지 시스템은 모델러부(102)를 구동시켜 웹 페이지의 이미지에 대한 수치화 작업을 수행한다(S212). 구체적으로, 모델러부(102)는 저장매체(108)에 저장된 웹 페이지 이미지에서 윤곽선 정보를 추출하며, 추출한 윤곽선 정보와 원본 이미지의 윤곽선간의 비교를 통해 윤곽선 이동 값을 계산하거나 저장매체(108)에 저장된 웹 페이지 이미지의 히스토그램과 원본 이미지의 히스토그램간의 비교를 통해 히스토그램 변동 정도 값을 산출하는 방식으로 수집한 웹 페이지 각각에 대한 수치화 작업을 수행한다.As a result of the determination of S210, when the preset time has elapsed, the web page forgery detection system drives the modeler 102 to perform numerical operation on the image of the web page (S212). In detail, the modeler unit 102 extracts contour information from a web page image stored in the storage medium 108, and calculates a contour shift value or compares the contour information with the storage medium 108 by comparing the extracted contour information with the contour of the original image. The histogram of the stored web page image is compared with the histogram of the original image to calculate the histogram variation.

그런 다음, 모델러부(102)는 수치화 작업을 수행한 결과 값, 즉 수집한 웹 페이지 각각에 대한 윤곽선 이동 값 또는 히스토그램 변동 정도 값을 이용하여 머신 러닝을 수행하여 학습 모델을 생성한 후 이를 학습 모델 데이터베이스(110)에 저장한다(S214).Then, the modeler 102 generates a learning model by performing machine learning using a result of performing the digitization operation, that is, a contour shift value or a histogram variation value for each collected web page, and then generates the learning model. It is stored in the database 110 (S214).

상술한 바와 같은 도 2에 도시된 바와 같은 단계들을 통해 생성한 학습 모델을 이용하여 웹 페이지에 대한 위변조를 탐지하는 방법에 대해 도 3을 참조하여 설명하다.A method of detecting forgery for a web page using the learning model generated through the steps as shown in FIG. 2 as described above will be described with reference to FIG. 3.

도 3은 본 발명의 실시예에 따른 웹 페이지 위변조 탐지 시스템이 웹 페이지에 대한 위변조를 탐지하는 과정을 도시한 흐름도이다.3 is a flowchart illustrating a process of detecting a forgery of a web page by a web page forgery detection system according to an exemplary embodiment of the present invention.

도 3에 도시된 바와 같이, 먼저 웹 페이지 위변조 탐지 시스템은 위변조 판단부(106)를 통해 웹 사이트에 접속한 후(S300), 접속한 웹 사이트의 웹 페이지에 대한 이미지(이하,'검사용 웹 페이지 이미지'라고 함)를 수집한다(S302).As shown in FIG. 3, the web page forgery detection system first accesses a web site through the forgery determination unit 106 (S300), and then displays an image (hereinafter referred to as an “inspection web”) of the web page of the accessed web site. Page image ”) (S302).

그런 다음, 웹 페이지 위변조 탐지 시스템은 검사용 웹 페이지 이미지에서 특징점, 예컨대 윤곽선, 히스토그램 등의 정보를 추출하며(S304), 추출한 특징점과 원본 이미지의 특징점간의 비교를 통해 윤곽선의 이동 값, 히스토그램의 변동 값 등을 계산한다(S306).Then, the web page forgery detection system extracts information of feature points, such as contours and histograms, from the inspection web page image (S304), and changes the movement values of the contours and histograms by comparing the extracted feature points with the feature points of the original image. A value and the like are calculated (S306).

이후, 위변조 판단부(106)는 계산한 이동 값, 변동 값 등과 학습 모델 데이터베이스(110) 내 학습 모델간의 비교를 통해 웹 페이지의 위변조 여부를 판단한다(S308).Thereafter, the forgery determination unit 106 determines whether the forgery of the web page is performed by comparing the calculated moving value, the variation value, and the learning model in the learning model database 110 (S308).

S308의 판단 결과, 위변조된 경우 웹 페이지 위변조 탐지 시스템은 웹 페이지 복구부(114)를 구동시킨다(S310).As a result of the determination in S308, in the case of forgery, the web page forgery detection system drives the web page recovery unit 114 (S310).

이에 따라, 웹 페이지 복구부(114)는 웹 사이트에 복구용 에이전트를 설치한 후 복구용 에이전트와 통신을 통해 복구 파일 저장소(116)에 저장된 웹 페이지 파일을 전송하여 웹 사이트 내 웹 페이지를 복구시킨다(S312).Accordingly, the web page recovery unit 114 recovers a web page in the web site by installing a repair agent on the web site and then transmitting a web page file stored in the repair file store 116 through communication with the repair agent. (S312).

한편, S308의 판단 결과, 위변조되지 않는 것으로 판단되는 경우 위변조 판단부(106)는 접속 주기인지를 판단한다(S314).On the other hand, if it is determined that the forgery is not as a result of the determination in S308, the forgery determination unit 106 determines whether the connection period (S314).

S314의 판단 결과, 접속 주기일 경우 위변조 판단부(106)는 S300으로 진행하여 이후 단계를 수행하며, 그렇지 않을 경우 S314로 진행하여 계속해서 접속 주기인지를 판단한다.As a result of the determination in S314, the forgery determination unit 106 proceeds to S300 to perform a subsequent step in the case of the access cycle, otherwise proceeds to S314 to determine whether the connection cycle continues.

전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The above description of the present application is intended for illustration, and it will be understood by those skilled in the art that the present invention may be easily modified in other specific forms without changing the technical spirit or essential features of the present application. Therefore, it should be understood that the embodiments described above are exemplary in all respects and not restrictive. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as distributed may be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is shown by the following claims rather than the detailed description, and all changes or modifications derived from the meaning and scope of the claims and their equivalents should be construed as being included in the scope of the present application. .

100 : 이미지 수집부
102 : 모델러부
104 : 머신 러닝부
106 : 위변조 판단부
108 : 저장매체
110 : 학습 모델 데이터베이스
112 : 스케쥴러부
114 : 웹 페이지 복구부
116 : 복구용 파일 저장소
118 : 액세스 제어부
120 : 데이터 관리부
122 : 저장매체 관리부
124 : 관리자용 뷰어
126 : 관제용 대시 보드
100: image collector
102: modeler part
104: machine learning unit
106: forgery and alteration determination unit
108: storage medium
110: Learning Model Database
112: scheduler
114: web page recovery unit
116: File storage for recovery
118: access control unit
120: data management unit
122: storage medium management unit
124: viewer viewer
126: Control Dashboard

Claims (8)

기 설정된 기간 동안 기 설정된 횟수 이상으로 웹 사이트에 접속하며, 접속할 때마다 웹 페이지에 대한 이미지를 수집하는 단계와,
기 설정된 기간 동안 수집한 웹 페이지에 대한 이미지 각각에서 윤곽선을 추출하고, 상기 추출한 윤곽선과 원본 이미지의 윤곽선간의 비교를 통해 윤곽선 이동 값을 산출하고, 상기 수집한 웹 페이지에 대한 이미지 각각에서 히스토그램과 상기 원본 이미지의 히스토그램간의 비교를 통해 히스토그램의 변동 정도 값을 산출한 후 이를 저장매체에 저장하는 단계와,
상기 저장매체에 저장된 상기 이미지 각각에 대한 윤곽선 이동 값과 히스토그램의 변동 정도 값을 이용하여 정상 웹 페이지의 윤곽선 이동 범위 값과 히스토그램 분포 변동 범위 값을 포함하는 학습 모델을 생성하여 학습 모델 데이터베이스에 저장하는 단계와,
이후 수집되는 웹 페이지의 이미지에 대한 윤곽선 및 히스토그램의 특징점을 추출하며, 상기 특징점과 원본 이미지의 윤곽선 및 히스토그램간의 비교를 통해 위변조 판단용 정보인 윤곽선 이동 값 및 히스토그램 변동 값을 산출하며, 상기 산출한 위변조 판단용 정보와 상기 학습 모델 데이터베이스에 저장된 학습 모델인 상기 정상 웹 페이지의 윤곽선 이동 범위 값과 히스토그램 분포 변동 범위 값간의 비교를 통해 상기 이후 수집되는 웹 페이지에 대한 위변조 여부를 판단하는 단계를 포함하는 웹 페이지 위변조 탐지 방법.
Accessing a website more than a predetermined number of times during a preset period of time, and collecting an image of the web page each time;
Contours are extracted from each image of the collected web pages for a predetermined period of time, a contour shift value is calculated by comparing the extracted contours with contours of the original image, and the histogram and the respective images of the collected web pages are calculated. Calculating the variation value of the histogram by comparing the histograms of the original image, and storing the result in the storage medium;
A training model including contour movement range values and histogram distribution variation range values of a normal web page is generated by using contour movement values and histogram variation values for each of the images stored in the storage medium, and stored in a training model database. Steps,
After that, the feature points of the contour and histogram of the collected web page images are extracted, and the contour shift value and the histogram variation value, which are information for forgery and judgment determination, are calculated by comparing the feature point with the contour and histogram of the original image. And determining whether the forgery of the subsequently collected web page is compared by comparing the forgery determination information with the contour movement range value and the histogram distribution variation range value of the normal web page, which is the training model stored in the training model database. How to detect web page forgery.
삭제delete 제1항에 있어서,
상기 수집하는 단계는,
상기 웹 사이트 접속 시 접근 타임 아웃 시간을 산출하는 단계와,
상기 접근 타임 아웃 시간 이내에 상기 웹 사이트에 접속되어 생성된 상기 웹 페이지의 이미지를 저장매체에 저장하여 수집하는 단계를 포함하는 웹 페이지 위변조 탐지 방법.
The method of claim 1,
The collecting step,
Calculating an access timeout time when the website is accessed;
And storing an image of the web page generated by accessing the web site within the access timeout time and storing the collected image on a storage medium.
기 설정된 기간 동안 기 설정된 횟수 이상으로 웹 사이트에 접속하며, 접속할 때마다 웹 페이지에 대한 이미지를 수집하는 이미지 수집부와,
기 설정된 기간 동안 수집한 웹 페이지에 대한 이미지 각각에서 윤곽선을 추출하고, 상기 추출한 윤곽선과 원본 이미지의 윤곽선간의 비교를 통해 윤곽선 이동 값을 산출하고, 상기 수집한 웹 페이지에 대한 이미지 각각에서 히스토그램과 상기 원본 이미지의 히스토그램간의 비교를 통해 히스토그램의 변동 정도 값을 산출한 후 이를 저장매체에 저장하는 모델러부와,
상기 저장매체에 저장된 상기 이미지 각각에 대한 윤곽선 이동 값과 히스토그램의 변동 정도 값을 이용하여 정상 웹 페이지의 윤곽선 이동 범위 값과 히스토그램 분포 변동 범위 값을 포함하는 학습 모델을 생성하여 학습 모델 데이터베이스에 저장하는 머신 러닝부와,
이후 수집되는 웹 페이지의 이미지에 대한 윤곽선 및 히스토그램의 특징점을 추출하며, 상기 특징점과 원본 이미지의 윤곽선 및 히스토그램간의 비교를 통해 위변조 판단용 정보인 윤곽선 이동 값 및 히스토그램 변동 값을 산출하며, 상기 산출한 위변조 판단용 정보와 상기 학습 모델 데이터베이스에 저장된 학습 모델인 상기 정상 웹 페이지의 윤곽선 이동 범위 값과 히스토그램 분포 변동 범위 값간의 비교를 통해 상기 이후 수집되는 웹 페이지에 대한 위변조 여부를 판단하는 위변조 판단부를 포함하는 웹 페이지 위변조 탐지 시스템.
An image collection unit which accesses a web site more than a preset number of times for a preset period of time, and collects an image of the web page every time the connection is made;
Contours are extracted from each image of the collected web pages for a predetermined period of time, a contour shift value is calculated by comparing the extracted contours with contours of the original image, and the histogram and the respective images of the collected web pages are calculated. A modeler unit which calculates a variation value of the histogram by comparing the histograms of the original image and stores it in a storage medium;
A training model including contour movement range values and histogram distribution variation range values of a normal web page is generated by using contour movement values and histogram variation values for each of the images stored in the storage medium, and stored in a training model database. Machine learning department,
After that, the feature points of the contours and histograms of the collected web page images are extracted. A forgery determination unit configured to determine whether the forgery of the subsequently collected web pages is compared by comparing the forgery determination information with the contour movement range value and the histogram distribution variation range value of the normal web page which is the training model stored in the training model database. Web page forgery detection system.
제4항에 있어서,
상기 위변조 탐지 시스템은,
상기 웹 사이트의 접속 주기가 설정되어 있으며, 상기 접속 주기에 따라 상기 이미지 수집부 및 상기 위변조 판단부를 동작시켜 웹 사이트에 접속시키는 스케쥴러부를 더 포함하는 웹 페이지 위변조 탐지 시스템.
The method of claim 4, wherein
The forgery detection system,
And a scheduler configured to access the web site by operating the image collection unit and the forgery determination unit according to the access cycle.
제4항에 있어서,
상기 위변조 탐지 시스템은,
복구용 웹 페이지 파일이 저장된 복구용 파일 저장소와,
상기 웹 사이트 상에 복구용 에이전트를 설치하며, 상기 위변조 판단부의 판단 결과 상기 웹 페이지가 위변조된 것으로 판단될 때 상기 복구용 에이전트와의 통신을 통해 상기 복구용 파일 저장소에 저장된 복구용 웹 페이지 파일을 전송하는 웹 페이지 복구부를 더 포함하는 웹 페이지 위변조 탐지 시스템.
The method of claim 4, wherein
The forgery detection system,
A recovery file store that stores the recovery web page file,
Install a repair agent on the web site, and when it is determined that the web page is forged as a result of the forgery determination unit, the repair web page file stored in the repair file store through communication with the repair agent Web page forgery detection system further comprising a web page recovery unit for transmitting.
삭제delete 제4항에 있어서,
상기 이미지 수집부는,
상기 웹 사이트 접속 시 접근 타임 아웃 시간을 산출하며, 상기 접근 타임 아웃 시간 내에 상기 웹 사이트에 접속된 경우에만 상기 웹 페이지에 대한 이미지를 수집하는 웹 페이지 위변조 탐지 시스템.
The method of claim 4, wherein
The image collection unit,
A web page forgery detection system for calculating an access timeout time when accessing the web site, and collecting an image for the web page only when the web site is accessed within the access timeout time;
KR1020180019753A 2018-02-20 2018-02-20 Method and system for detecting counterfeit of web page KR102022058B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180019753A KR102022058B1 (en) 2018-02-20 2018-02-20 Method and system for detecting counterfeit of web page

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180019753A KR102022058B1 (en) 2018-02-20 2018-02-20 Method and system for detecting counterfeit of web page

Publications (2)

Publication Number Publication Date
KR20190099816A KR20190099816A (en) 2019-08-28
KR102022058B1 true KR102022058B1 (en) 2019-11-04

Family

ID=67775108

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180019753A KR102022058B1 (en) 2018-02-20 2018-02-20 Method and system for detecting counterfeit of web page

Country Status (1)

Country Link
KR (1) KR102022058B1 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022124430A1 (en) * 2020-12-08 2022-06-16 주식회사 앰진시큐러스 Evidence collection standard for interaction and connectivity on website including dynamic content and links, and method therefor
KR102238784B1 (en) * 2020-12-18 2021-04-16 주식회사 에이아이디비 Method and system for storing and verifying web pages using a blockchain network
KR102313414B1 (en) * 2021-04-19 2021-10-15 주식회사 에프원시큐리티 Hybrid system and method for detecting defaced homepage using artificial intelligence and pattern
CN114124564B (en) * 2021-12-03 2023-11-28 北京天融信网络安全技术有限公司 Method and device for detecting counterfeit website, electronic equipment and storage medium
CN117729041A (en) * 2023-12-22 2024-03-19 云尖(北京)软件有限公司 Webpage tamper-resistant data encryption method and system

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100736540B1 (en) * 2006-02-20 2007-07-06 에스케이 텔레콤주식회사 Web defacement checker and checking method thereof
KR101761513B1 (en) * 2016-06-13 2017-07-26 한남대학교 산학협력단 Method and system for detecting counterfeit and falsification using image

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100912794B1 (en) 2008-11-18 2009-08-18 주식회사 나우콤 Web hacking management system and manegement method thereof for real time web server hacking analysis and homepage hacking search
KR101140699B1 (en) * 2010-06-03 2012-05-03 한국조폐공사 Forgery Detection System for Security Printing Resource Based on Digital Forensic Technology and Method Therefor
KR102159399B1 (en) * 2013-12-03 2020-09-23 주식회사 케이티 Device for monitoring web server and analysing malicious code

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100736540B1 (en) * 2006-02-20 2007-07-06 에스케이 텔레콤주식회사 Web defacement checker and checking method thereof
KR101761513B1 (en) * 2016-06-13 2017-07-26 한남대학교 산학협력단 Method and system for detecting counterfeit and falsification using image

Also Published As

Publication number Publication date
KR20190099816A (en) 2019-08-28

Similar Documents

Publication Publication Date Title
KR102022058B1 (en) Method and system for detecting counterfeit of web page
CN107659543B (en) Protection method for APT (android packet) attack of cloud platform
US8839440B2 (en) Apparatus and method for forecasting security threat level of network
CN102110198B (en) Anti-counterfeiting method for web page
EP2691848B1 (en) Determining machine behavior
JP5961183B2 (en) How to detect malicious software using contextual probabilities, generic signatures, and machine learning methods
CN102592103B (en) Secure file processing method, equipment and system
CN107786564B (en) Attack detection method and system based on threat intelligence and electronic equipment
CN110837640B (en) Malicious file searching and killing method, device, storage medium and device
CN101816148A (en) Be used to verify, data transmit and the system and method for protection against phishing
CN104836781A (en) Method distinguishing identities of access users, and device
CN104657665B (en) A kind of document handling method
CN109684835A (en) The system and method for malicious file are detected using machine learning
US9830452B2 (en) Scanning device, cloud management device, method and system for checking and killing malicious programs
CN109800560B (en) Equipment identification method and device
CN111104579A (en) Identification method and device for public network assets and storage medium
KR102079304B1 (en) Apparatus and method of blocking malicious code based on whitelist
CN113190838A (en) Web attack behavior detection method and system based on expression
CN107294953A (en) Attack operation detection method and device
CN106549980A (en) A kind of malice C&C server determines method and device
CN113704328B (en) User behavior big data mining method and system based on artificial intelligence
CN105471842A (en) Network safety analysis method under big data environment
CN113190839A (en) Web attack protection method and system based on SQL injection
CN106713293A (en) Cloud platform malicious behavior detecting system and method
CN112235304A (en) Dynamic security protection method and system for industrial internet

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant