KR20180105335A - SYSTEM AND METHOD FOR DETECTING COUNTERFEIT and FALSIFICATION USING LINK DATA - Google Patents

SYSTEM AND METHOD FOR DETECTING COUNTERFEIT and FALSIFICATION USING LINK DATA Download PDF

Info

Publication number
KR20180105335A
KR20180105335A KR1020170032255A KR20170032255A KR20180105335A KR 20180105335 A KR20180105335 A KR 20180105335A KR 1020170032255 A KR1020170032255 A KR 1020170032255A KR 20170032255 A KR20170032255 A KR 20170032255A KR 20180105335 A KR20180105335 A KR 20180105335A
Authority
KR
South Korea
Prior art keywords
link data
web site
forgery
comparison
web page
Prior art date
Application number
KR1020170032255A
Other languages
Korean (ko)
Other versions
KR101924787B1 (en
Inventor
극 이
조지호
안효중
한 이
Original Assignee
한남대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한남대학교 산학협력단 filed Critical 한남대학교 산학협력단
Priority to KR1020170032255A priority Critical patent/KR101924787B1/en
Publication of KR20180105335A publication Critical patent/KR20180105335A/en
Application granted granted Critical
Publication of KR101924787B1 publication Critical patent/KR101924787B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/12Protecting executable software
    • G06F21/121Restricting unauthorised execution of programs
    • G06F21/128Restricting unauthorised execution of programs involving web programs, i.e. using technology especially used in internet, generally interacting with a web browser, e.g. hypertext markup language [HTML], applets, java
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic
    • H04L63/1483Countermeasures against malicious traffic service impersonation, e.g. phishing, pharming or web spoofing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2119Authenticating web pages, e.g. with suspicious links

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Technology Law (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to a website forgery detection system using link data and a method thereof, a recording medium storing a program for implementing the same, and a computer program stored in the medium for implementing the same. The website forgery detection system using link data according to the present invention compares and analyzes link data information of a web page accessed by a user and link data information of a normal web site which is not forged to detect whether the web site is forged. The website forgery detection system using link data comprises: a database; an access detection means; a link data collection means; and a comparison analysis means.

Description

링크데이터를 이용한 웹사이트 위변조 탐지 시스템 및 방법{SYSTEM AND METHOD FOR DETECTING COUNTERFEIT and FALSIFICATION USING LINK DATA}TECHNICAL FIELD [0001] The present invention relates to a system and method for detecting forgery of a web site using link data,

본 발명은 링크데이터를 이용한 웹사이트 위변조 탐지 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 사용자가 접속한 웹페이지의 링크데이터 정보와 위변조가 되지 않은 정상적인 웹사이트의 링크데이터 정보를 비교 분석하여 웹사이트의 위변조 여부를 탐지하는 링크데이터를 이용한 웹사이트 위변조 탐지 시스템 및 방법에 관한 것이다.The present invention relates to a web site forgery detection system and method using link data, and more particularly to a web site forgery detection system and method using link data, The present invention relates to a web site forgery detection system and method using link data for detecting whether a user forged or forged a web site.

은행에 직접 찾아가 업무를 보던 시대를 지나 집에서 간편하게 은행 업무를 볼 수 있는 시대가 된 후에 온라인을 활용한 금융서비스의 편리함으로 인하여 2016년 9월말 인터넷뱅킹서비스와 모바일뱅킹 등록 고객 수는 급격히 증가하게 되었다. 인터넷뱅킹과 모바일뱅킹의 이용규모(일평균)는 8,790만 건으로 상당히 많은 수가 사용함을 알 수 있다.After the age of visiting the bank and looking at work, it became easy to see the banking service at home, and the number of Internet banking service and mobile banking registered customers increased sharply at the end of September 2016 due to the convenience of online financial services. . The number of internet banking and mobile banking use (daily average) is 87.9 million, which means that a considerable number of users are using it.

인터넷뱅킹 사용자의 증가는 해커들로부터의 위협에 쉽게 노출되는 결과 또한 초래하게 되었다. The increase in the number of Internet banking users has also been exposed to the threat from hackers.

웹사이트 위변조 공격방법으로는 XSS(Cross Site Scripting) 공격, CSRF(Cross Site Request Forgery) 공격, 피싱(Phishing) 및 파밍(Pharming) 공격, hosts 파일 변조 공격, DBD(Drive By Download)공격, MITM(Man In The Middle) 공격 등이 있다.Web site forgery attack methods include Cross Site Scripting (XSS) attacks, Cross Site Request Forgery (CSRF) attacks, phishing and pharming attacks, hosts file tampering attacks, DBD (Drive By Download) attacks, MITM Man In The Middle attack.

그 중 피싱(Phishing) 및 파밍(Pharming) 공격은, 실제의 은행 사이트와 유사한 피싱(Phishing)사이트를 이용한 파밍(Pharming)공격으로 이용자로부터 금융거래가 가능한 개인정보를 입력하도록 유도하여 피해가 발생하는 방법이다. Among them, phishing and pharming attack is a pharming attack using a phishing site similar to an actual banking site, thereby inducing the user to input personal information capable of financial transactions, to be.

피싱(Phishing)공격은 개인정보(Private data)와 낚시(Fishing)의 합성어로 공공기관 및 금융기관으로 사칭하여 이메일을 발송하고 가짜은행사이트로의 접속을 유도해 금융정보를 탈취하는 공격이다. A phishing attack is a combination of private data and fishing. It is an attack to send e-mails as public institutions and financial institutions and steal financial information by inducing access to fake bank sites.

파밍(Pharming)공격은 악성코드를 통해 감염된 사용자 PC를 조작하여 금융정보를 빼내는 방법으로 피해자가 정상적인 사이트에 접속을 시도하더라도 위·변조된 피싱사이트로 접속이 유도되며 각종 금융정보를 탈취하는 공격이다.A pharming attack is an attack to steal financial information by manipulating an infected user's PC through malicious code. Even if a victim tries to access a normal site, access to a phishing site is triggered, .

이와 같은 방법은 실제 사이트와 유사하기 때문에 사용자가 사이트의 위·변조 여부를 직접 판단하기 어려움이 있다. Since this method is similar to the actual site, it is difficult for the user to directly judge whether or not the site is altered.

국내에서는 사이버 위협에 대응하기 위해 ‘국가 사이버 안전센터(NCSC)’, 인터넷침해사고대응지원센터(KrCERT/CC) 등을 중심으로 분야별 사이버 보안을 담당하는 부문 보안관제 센터를 구축·운영하고 있으나, 보안관제 센터의 대상기관 수가 증가하고, 지속적으로 많은 수의 피싱사이트가 생겨남에 따라 실시간으로 위·변조를 탐지하고 대응하는데 있어서 한계가 있다.In Korea, we are establishing and operating a divisional security control center in charge of cyber security, centering on the National Cyber Safety Center (NCSC) and the Internet Infringement Response Support Center (KrCERT / CC) As the number of target organizations of the security control center increases and a large number of phishing sites are continuously generated, there is a limit in detecting and responding in real time to the up /

한국등록특허 [10-1264280]에서는 웹 페이지 변조 탐지 시스템 및 방법이 개시되어 있다.Korean Patent Registration No. 10-1264280 discloses a web page modulation detection system and method.

한국등록특허 [10-1264280](등록일자: 2013년05월08일)Korea registered patent [10-1264280] (Registration date: May 08, 2013)

따라서 본 발명은 상기한 바와 같은 문제점을 해결하기 위하여 안출된 것으로, 본 발명의 목적은 사용자가 접속한 웹페이지의 링크데이터 정보와 위변조가 되지 않은 정상적인 웹사이트의 링크데이터 정보를 비교 분석하여 웹사이트의 위변조 여부를 탐지하는 링크데이터를 이용한 웹사이트 위변조 탐지 시스템 및 방법을 제공하는 것이다.SUMMARY OF THE INVENTION Accordingly, the present invention has been made to solve the above-mentioned problems occurring in the prior art, and it is an object of the present invention to provide a method and apparatus for comparing and analyzing link data information of a web page accessed by a user and link data information of a normal web site, The present invention provides a web site forgery detection system and method using link data for detecting whether a user forged or forged a web site.

본 발명의 실 시예들의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The objects of the embodiments of the present invention are not limited to the above-mentioned objects, and other objects not mentioned can be clearly understood by those skilled in the art from the following description .

상기한 바와 같은 목적을 달성하기 위한 본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 시스템은 특정 웹사이트의 주소 및 해당 웹사이트의 링크데이터를 저장하는 데이터베이스(100); 사용자단말이 미리 설정된 특정 웹사이트에 접속하였는지 여부를 감지하는 접속감지수단(200); 상기 접속감지수단(200)에 의해 상기 특정 웹사이트에 접속한 것이 감지된 경우, 상기 특정 웹사이트의 링크데이터를 수집하는 링크데이터수집수단(300); 및 사용자단말이 접속한 주소와 특정 웹사이트의 주소를 비교분석하고, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여, 상기 특정 웹사이트가 위변조 되었는지는 판단하는 비교분석수단(400);을 포함하는 것을 특징으로 한다.According to an embodiment of the present invention, there is provided a web site forgery detection system using link data, comprising: a database (100) for storing addresses of a specific web site and link data of the corresponding web site; A connection detecting means (200) for detecting whether or not a user terminal has accessed a predetermined specific web site; Link data collection means (300) for collecting link data of the specific web site when it is detected by the connection detection means (200) that the specific web site is accessed; And comparing and analyzing the link data collected by the link data collection means 300 and the link data stored in the database 100, And comparing and analyzing means 400 for determining whether the web site is forged or falsified.

또한, 상기 링크데이터수집수단(300)은 HTML 작업을 위한 Java 라이브러리인 jsoup을 이용하여 웹페이지 내에 연결된 각종 링크데이터를 수집하는 것을 특징으로 한다.In addition, the link data collection means 300 collects various link data linked in a web page by using a Java library jsoup for HTML work.

또, 상기 비교분석수단(400)은 Levenshtein Distance 알고리즘을 이용하여 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하는 것을 특징으로 한다.The comparison and analysis means 400 compares the link data collected by the link data collection means 300 with the link data stored in the database 100 using the Levenshtein Distance algorithm.

아울러, 상기 링크데이터를 이용한 웹사이트 위변조 탐지 시스템은 상기 비교분석수단(400)에 의해 비교분석 결과가 100% 일치할 경우 상기 링크데이터수집수단(300)에 의해 수집된 해당 웹페이지의 링크데이터로 연결되는 서브 웹페이지로 이동하는 서브웹페이지이동수단(500)을 포함하며, 상기 링크데이터수집수단(300)은 상기 서브웹페이지이동수단(500)에 의해 이동된 서브 웹페이지의 링크데이터를 수집하고, 상기 비교분석수단(400)은 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 상기 특정 웹사이트가 위변조 되었는지는 판단하는 것을 특징으로 한다.In addition, the website forgery detection system using the link data may be configured such that if the comparison analysis result is 100% identical to the comparison analysis result, the link data of the corresponding web page collected by the link data collection means 300 The link data collecting means 300 collects link data of the sub web page moved by the sub web page moving means 500, And the comparative analysis means 400 compares the link data collected by the link data collection means 300 with the link data stored in the database 100 to determine whether the specific web site has been tampered with .

본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 방법은 특정 웹사이트의 주소 및 해당 웹사이트의 링크데이터를 저장하는 데이터베이스(100); 사용자단말이 미리 설정된 특정 웹사이트에 접속하였는지 여부를 감지하는 접속감지수단(200); 상기 접속감지수단(200)에 의해 상기 특정 웹사이트에 접속한 것이 감지된 경우, 상기 특정 웹사이트의 링크데이터를 수집하는 링크데이터수집수단(300); 및 사용자단말이 접속한 주소와 특정 웹사이트의 주소를 비교분석하고, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여, 상기 특정 웹사이트가 위변조 되었는지는 판단하는 비교분석수단(400);을 포함하는 링크데이터를 이용한 웹사이트 위변조 탐지 시스템을 이용한 링크데이터를 이용한 웹사이트 위변조 탐지 방법에 있어서, 상기 접속감지수단(200)에 의해, 사용자단말이 미리 설정된 특정 웹사이트에 접속하였는지 여부를 감지하는 웹사이트접속 단계(S10); 상기 웹사이트접속 단계(S10)에서 미리 설정된 특정 웹사이트에 접속한 것이 감지된 경우, 상기 비교분석수단(400)에 의해, 사용자단말이 접속한 주소와 특정 웹사이트의 주소가 동일한지 비교하는 주소비교 단계(S20); 상기 주소비교 단계(S20)에서 사용자단말이 접속한 주소와 특정 웹사이트의 주소가 동일하면, 상기 링크데이터수집수단(300)에 의해, 상기 특정 웹사이트의 링크데이터를 수집하는 링크데이터수집 단계(S30); 및 상기 비교분석수단(400)에 의해, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 상기 특정 웹사이트가 위변조 되었는지는 판단하는 링크데이터비교 단계(S40);를 포함하는 것을 특징으로 한다.The method for detecting website forgery using link data according to an embodiment of the present invention includes: a database 100 for storing addresses of a specific website and link data of the corresponding website; A connection detecting means (200) for detecting whether or not a user terminal has accessed a predetermined specific web site; Link data collection means (300) for collecting link data of the specific web site when it is detected by the connection detection means (200) that the specific web site is accessed; And comparing and analyzing the link data collected by the link data collection means 300 and the link data stored in the database 100, A web site forgery detection method using link data using a web site forgery detection system using link data, comprising: comparing and analyzing means (400) for determining whether a web site has been falsified; , A web site access step (S10) for detecting whether a user terminal is connected to a predetermined web site set in advance; If it is detected in the connection step S10 of the web site that a predetermined web site has been accessed, the comparison and analysis unit 400 compares the address of the specific web site with the address of the user terminal, Comparison step S20; A link data collection step of collecting link data of the specific web site by the link data collection means 300 if the address accessed by the user terminal and the address of the specific web site are the same in the address comparison step S20 S30); And the comparative analysis means 400 compares the link data collected by the link data collection means 300 with the link data stored in the database 100 to determine whether the specific website is forged or not And a link data comparison step (S40).

또한, 상기 링크데이터수집 단계(S30)는 HTML 작업을 위한 Java 라이브러리인 jsoup을 이용하여 웹페이지 내에 연결된 각종 링크데이터를 수집하는 것을 특징으로 한다.In addition, the link data collection step S30 collects various link data linked in a web page by using a Java library jsoup for HTML work.

또, 상기 링크데이터비교 단계(S40)는 Levenshtein Distance 알고리즘을 이용하여 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하는 것을 특징으로 한다.The link data comparison step S40 is characterized by comparing and analyzing the link data collected by the link data collection means 300 and the link data stored in the database 100 using the Levenshtein Distance algorithm .

또한, 상기 비교분석수단(400)에 의해 비교분석 결과가 100% 일치할 경우 상기 링크데이터수집수단(300)에 의해 수집된 해당 웹페이지의 링크데이터로 연결되는 서브 웹페이지로 이동하는 서브웹페이지이동수단(500)이 더 포함된 링크데이터를 이용한 웹사이트 위변조 탐지 시스템을 이용한 링크데이터를 이용한 웹사이트 위변조 탐지 방법에 있어서, 상기 비교분석수단(400)에 의한 비교분석 결과가 100% 일치할 경우, 상기 서브웹페이지이동수단(500)에 의해, 해당 웹페이지에서 수집된 해당 웹페이지의 링크데이터로 연결되는 서브 웹페이지로 이동하는 서브페이지이동 단계(S50); 상기 링크데이터수집수단(300)에 의해, 서브 웹페이지의 링크데이터를 수집하는 서브링크데이터수집 단계(S60); 및 상기 비교분석수단(400)에 의해, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 상기 특정 웹사이트가 위변조 되었는지는 판단하는 서브링크데이터비교 단계(S60);를 포함하는 것을 특징으로 한다.If the comparative analysis result of the comparative analysis means 400 is 100%, the sub web page is moved to the sub web page linked with the link data of the corresponding web page collected by the link data collection means 300 The web site forgery detection method using link data using the web site forgery detection system using the link data further including the moving means 500 is characterized in that when the comparison analysis result by the comparison and analysis means 400 is 100% A subpage moving step (S50) of moving to a subweb page connected to the link data of the corresponding webpage collected in the webpage by the subpage web page moving means (500); A sub link data collection step (S60) of collecting link data of a sub web page by the link data collection means (300); And the comparative analysis means 400 compares the link data collected by the link data collection means 300 with the link data stored in the database 100 to determine whether the specific website is forged or not And sub-link data comparison step (S60).

또, 본 발명의 일 실시예에 따르면, 상기 링크데이터를 이용한 웹사이트 위변조 탐지 방법을 구현하기 위한 프로그램이 저장된 컴퓨터 판독 가능한 기록매체가 제공되는 것을 특징으로 한다.According to an embodiment of the present invention, there is provided a computer-readable recording medium on which a program for implementing a method for detecting a website forgery-and-fix using the link data is stored.

아울러, 본 발명의 일 실시예에 따르면, 상기 링크데이터를 이용한 웹사이트 위변조 탐지 방법을 구현하기 위해, 컴퓨터 판독 가능한 기록매체에 저장된 프로그램이 제공되는 것을 특징으로 한다.According to an embodiment of the present invention, a program stored in a computer-readable recording medium is provided to implement a method for detecting a website forgery-and-alteration using the link data.

본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 시스템 및 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체 및 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램에 의하면, 웹사이트의 위변조 공격은 점점 급증하고 심화되어지고 있는 상황에서, 링크데이터의 간단한 비교로 빠르고 정확한 위변조 탐지가 가능한 효과가 있다.According to the web site forgery detection system and method using link data according to an embodiment of the present invention, a recording medium storing a program for implementing the same, and a computer program stored in a medium for implementing the same, In this situation, it is possible to detect fast and accurate forgery and falsification by simple comparison of link data.

또한, Java 라이브러리인 jsoup을 이용하여 웹페이지 내에 연결된 각종 링크데이터를 수집함으로써, 웹페이지에서 링크데이터를 보다 빠르고 정확하게 수집할 수 있는 효과가 있다.Also, by collecting various link data linked to a web page by using the Java library jsoup, it is possible to collect link data in a web page more quickly and accurately.

또, Levenshtein Distance 알고리즘을 이용하여 링크데이터를 비교분석함으로써, 보다 빠르고 정확하게 위변조 탐지가 가능한 효과가 있다.Also, by comparing and analyzing the link data using the Levenshtein Distance algorithm, there is an effect that fake detection can be performed more quickly and accurately.

아울러, 서브 웹페이지에 해당하는 링크데이터의 비교를 추가적으로 수행함으로써, 보다 정확한 위변조 탐지가 가능한 효과가 있다.Further, comparison of the link data corresponding to the sub-web page is additionally performed, so that there is an effect that more accurate falsification detection can be performed.

도 1은 본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 시스템의 개념도.
도 2는 수집된 링크데이터의 일부를 보여주는 예시도.
도 3은 본 발명의 다른 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 시스템의 개념도.
도 4는 본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 방법의 흐름도.
도 5는 본 발명의 다른 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 방법의 흐름도.
1 is a conceptual diagram of a web site forgery detection system using link data according to an embodiment of the present invention.
2 is an exemplary diagram showing part of the collected link data;
3 is a conceptual diagram of a web site forgery detection system using link data according to another embodiment of the present invention.
4 is a flowchart of a method for detecting a website forgery using link data according to an embodiment of the present invention.
5 is a flowchart of a method for detecting a website forgery using link data according to another embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야한다.While the invention is susceptible to various modifications and alternative forms, specific embodiments thereof are shown by way of example in the drawings and will herein be described in detail. It is to be understood, however, that the invention is not to be limited to the specific embodiments, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.It is to be understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, .

반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between.

본 명세서에서 사용되는 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 공정, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 공정, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used herein is for the purpose of describing particular embodiments only and is not intended to be limiting of the invention. The singular expressions include plural expressions unless the context clearly dictates otherwise. In the present application, the term "comprises" or "having ", etc. is intended to specify the presence of stated features, integers, steps, operations, elements, parts, or combinations thereof, And does not preclude the presence or addition of one or more other features, integers, integers, steps, operations, elements, components, or combinations thereof.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미가 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미가 있는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in commonly used dictionaries are to be interpreted as having a meaning consistent with the meaning in the context of the relevant art and are to be construed as ideal or overly formal in meaning unless explicitly defined in the present application Do not.

이하, 첨부된 도면을 참조하여 본 발명을 더욱 상세하게 설명한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정하여 해석되어서는 아니 되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여, 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다. 또한, 사용되는 기술 용어 및 과학 용어에 있어서 다른 정의가 없다면, 이 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 통상적으로 이해하고 있는 의미를 가지며, 하기의 설명 및 첨부 도면에서 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 설명은 생략한다. 다음에 소개되는 도면들은 당업자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 예로서 제공되는 것이다. 따라서, 본 발명은 이하 제시되는 도면들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 또한, 명세서 전반에 걸쳐서 동일한 참조번호들은 동일한 구성요소들을 나타낸다. 도면들 중 동일한 구성요소들은 가능한 한 어느 곳에서든지 동일한 부호들로 나타내고 있음에 유의해야 한다. Hereinafter, the present invention will be described in more detail with reference to the accompanying drawings. Prior to this, terms and words used in the present specification and claims should not be construed as limited to ordinary or dictionary terms, and the inventor should appropriately interpret the concept of the term appropriately in order to describe its own invention in the best way. The present invention should be construed in accordance with the meaning and concept consistent with the technical idea of the present invention. Further, it is to be understood that, unless otherwise defined, technical terms and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Descriptions of known functions and configurations that may be unnecessarily blurred are omitted. The following drawings are provided by way of example so that those skilled in the art can fully understand the spirit of the present invention. Therefore, the present invention is not limited to the following drawings, but may be embodied in other forms. In addition, like reference numerals designate like elements throughout the specification. It is to be noted that the same elements among the drawings are denoted by the same reference numerals whenever possible.

도 1은 본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 시스템의 개념도이고, 도 2는 수집된 링크데이터의 일부를 보여주는 예시도이며, 도 3은 본 발명의 다른 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 시스템의 개념도이고, 도 4는 본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 방법의 흐름도이며, 도 5는 본 발명의 다른 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 방법의 흐름도이다.FIG. 1 is a conceptual diagram of a web site forgery detection system using link data according to an embodiment of the present invention, FIG. 2 is a view illustrating a part of collected link data, FIG. FIG. 4 is a flowchart illustrating a method for detecting a website forgery detection using link data according to an embodiment of the present invention. FIG. 5 is a flowchart illustrating a method of detecting a web site forgery detection using link data according to another embodiment of the present invention. FIG. 2 is a flowchart of a method for detecting a forgery of a web site using the method of FIG.

설명에 앞서, 본 명세서에서 사용되는 용어에 대해 간단히 설명하도록 한다.Prior to explanation, the terms used in this specification will be briefly described.

'웹사이트(website)'는 인터넷 프로토콜 기반의 네트워크에서 도메인 이름이나 IP 주소, 루트 경로만으로 이루어진 일반 URL을 통하여 보이는 웹페이지 (Web Page)들의 의미 있는 묶음이다. 대한민국에서 흔히 말하는 홈페이지는 엄밀히 말해 웹사이트를 지칭한다.A 'website' is a meaningful bundle of web pages viewed through a generic URL consisting solely of a domain name, an IP address, and a root path in an internet protocol based network. The homepage, which is commonly referred to in Korea, refers to the website strictly speaking.

인터넷에서 사용자들이 정보가 필요할 때 언제든지 그것을 제공할 수 있도록 웹서버에 정보를 저장해 놓은 웹페이지의 집합체를 말한다. 즉, 정보를 저장해놓고 정보를 필요로 하는 사람에게 언제든지 정보를 제공하는 창고라는 의미로, 웹서버(web server)가 보유하고 있는 정보(웹페이지)의 집합체를 의미한다. 하나의 웹 서버에 서로 다른 정보를 제공하는 두 개 이상의 웹사이트가 존재할 수 있다. A collection of Web pages that store information on a Web server so that users can provide it whenever they need it. In other words, it refers to a collection of information (web pages) held by a web server in the sense of a warehouse that stores information and provides information to a person who needs information at any time. There can be more than one web site that provides different information to one web server.

다시 말해, '웹사이트'는 인터넷에 들어가는 관문으로 간략히 사이트(site)라고도 하며, 흔히 홈페이지 주소로 되어 있다. In other words, a 'website' is a gateway to the Internet, sometimes referred to simply as a site, often referred to as the home page address.

본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 시스템 및 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체 및 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램은 사용자가 접속한 웹페이지의 링크데이터 정보와 위변조가 되지 않은 정상적인 웹사이트의 링크데이터 정보를 비교 분석하여 웹사이트의 위변조 여부를 탐지하여, 사전에 신뢰할 수 없는 웹페이지를 통한 잘못된 접근을 방지함으로써, 금융정보 유출 사고 등을 사전에 방지할 수 있다.A web site forgery detection system and method using link data according to an embodiment of the present invention, a recording medium on which a program for implementing the same is stored, and a computer program stored in a medium for implementing the same, And the link data information of a normal web site which is not forged and falsified, thereby detecting the forgery or falsification of the web site and preventing erroneous access through the unreliable web page in advance, thereby preventing financial information leakage accidents .

도 1에 도시된 바와 같이, 본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 시스템은 데이터베이스(100), 접속감지수단(200), 링크데이터수집수단(300) 및 비교분석수단(400)을 포함한다.1, a web site forgery detection system using link data according to an exemplary embodiment of the present invention includes a database 100, a connection detecting unit 200, a link data collecting unit 300, 400).

데이터베이스(100)는 특정 웹사이트의 주소 및 해당 웹사이트의 링크데이터를 저장한다.The database 100 stores addresses of specific websites and link data of the corresponding websites.

여기서, 특정 웹사이트는 특정 금융 웹사이트(인터넷뱅킹, KB국민은행 인터넷뱅킹, 우리은행 인터넷뱅킹, 신한은행 인터넷뱅킹 등의 제1금융권 인터넷 뱅킹 웹사이트 등), 금융감독원 등의 웹사이트 일 수 있다. Here, the specific website may be a website of a specific financial website (such as Internet banking, KB bank internet banking, Woori bank Internet banking, first bank Internet banking website such as Shinhan bank Internet banking), Financial Supervisory Service .

데이터베이스(100)는 특정 웹사이트의 정상적인 주소(URL)를 저장한다. 이는 추후, 사용자가 접속한 특정 웹사이트의 URL을 크롤링하여 특정 웹사이트의 정상적인 URL과 비교하게 되며, 비교된 결과를 토대로 링크데이터의 비교분석을 수행 할지 여부를 결정할 수 있도록 하기 위함이다.The database 100 stores a normal address (URL) of a specific web site. This is to enable the user to determine whether to perform a comparative analysis of the link data based on the comparison result, by comparing the URL of the specific web site accessed by the user with the normal URL of the specific web site.

또한, 데이터베이스(100)는 특정 웹사이트의 정상적인 링크데이터를 저장한다. 이는 추후, 사용자가 접속한 특정 웹사이트의 링크데이터를 크롤링하여 특정 웹사이트의 정상적인 링크데이터와 비교하게 되며, 비교된 결과를 토대로 웹사이트의 위변조를 판별하기 위함이다.In addition, the database 100 stores normal link data of a specific web site. This is to compare the normal link data of a specific web site with the link data of a specific web site accessed by the user in the future, and to judge a forgery or falsification of the web site based on the comparison result.

여기서, 정상적인 주소와 정상적인 링크데이터는 위변조가 없는 주소와 링크데이터를 의미한다.Here, the normal address and the normal link data refer to the address and link data without forgery and falsification.

또한, 데이터베이스(100)는 비교분석수단(400)에 의해 위변조 웹사이트라고 판단된 경우 위변조 정보들을 저장할 수 있다.Also, the database 100 may store the forgery information when it is determined by the comparison and analysis means 400 that the website is a forgery-altered web site.

접속감지수단(200)은 사용자단말이 미리 설정된 특정 웹사이트에 접속하였는지 여부를 감지한다.The connection detecting means 200 detects whether or not the user terminal has accessed a predetermined web site set in advance.

여기서, 사용자단말은 컴퓨터, 모바일 기기, 스마트 기기 등 웹사이트에 가능한 모든 기기를 통칭한다.Here, the user terminal collectively refers to all the devices available on a web site such as a computer, a mobile device, and a smart device.

상기 접속감지수단(200)은 웹사이트의 위변조 여부를 확인할 필요성이 있는 특정 웹사이트에 사용자가 사용자단말을 이용하여 접속하였는지 여부를 감시한다.The connection detecting means 200 monitors whether a user accesses a specific web site which needs to check whether a web site is forged or falsified by using a user terminal.

이는, 모든 웹사이트의 위변조 여부를 확인하는 것은 웹서핑 속도를 늦추기 때문에, 웹서핑 속도를 감안하여 위변조 여부를 확인할 필요성이 있는 특정 웹사이트만 위변조 여부를 확인하기 위함이다.This is to confirm whether forgery or falsification of only a specific web site which needs to check whether forgery or falsification has been taken in consideration of the speed of web surfing because checking whether or not all web sites are falsified is slowing down the web surfing speed.

링크데이터수집수단(300)은 상기 접속감지수단(200)에 의해 상기 특정 웹사이트에 접속한 것이 감지된 경우, 상기 특정 웹사이트의 링크데이터를 수집한다.The link data collection means 300 collects link data of the specific web site when it is detected by the connection detection means 200 that the specific web site is accessed.

웹사이트는 웹페이지의 묶음을 의미하는 것으로, 특정 웹사이트의 링크데이터를 수집한다는 의미는 현재 접속된 웹페이지의 링크데이터를 수집한다는 의미이다. A web site means a bundle of web pages, meaning collecting link data of a specific web site means collecting link data of the currently connected web page.

여기서, 링크데이터는 현재 접속된 웹페이지와 연결된 웹페이지의 이동정보를 나타내는 것으로, URL(Uniform Resource Locator: 자원 위치 지정자) 등의 정보(도 2 참조)를 의미한다.Here, the link data represents movement information of a web page connected to the currently connected web page, and it means information such as a URL (Uniform Resource Locator) (see Fig. 2).

이때, 상기 링크데이터수집수단(300)은 HTML 작업을 위한 Java 라이브러리인 jsoup을 이용하여 웹페이지 내에 연결된 각종 링크데이터를 수집하는 것을 특징으로 할 수 있다.At this time, the link data collection means 300 may collect various link data linked to a web page by using a Java library jsoup for HTML work.

jsoup는 웹페이지를 파싱해서 원하는 값만을 가져올 때 유용한 라이브러리이다.jsoup is a useful library for parsing web pages and fetching only the desired values.

비교분석수단(400)은 사용자단말이 접속한 주소와 특정 웹사이트의 주소를 비교분석하고, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여, 상기 특정 웹사이트가 위변조 되었는지는 판단한다.The comparison and analysis means 400 compares the address of the user terminal with the address of the specific web site and analyzes the link data collected by the link data collection means 300 and the link data stored in the database 100 And determines whether the specific web site is forged or falsified.

즉, 비교분석수단(400)은 1차적으로 웹사이트의 주소를 비교하여 위변조가 없는 것으로 판명되면, 2차적으로 링크데이터를 비교하여 위변조 여부를 판단한다.That is, when the comparison and analysis means 400 firstly compares the address of the web site and it is determined that there is no forgery or falsification, the comparison and analysis means 400 secondarily compares the link data to judge whether or not forgery is possible.

여기서, 비교분석수단(400)에 의한 비교 결과가 100% 일치할 경우, 위변조가 없는 것으로 판단할 수 있다.Here, when the comparison result by the comparison and analysis means 400 is 100% identical, it can be judged that there is no forgery or falsification.

이때, 상기 비교분석수단(400)은 Levenshtein Distance 알고리즘을 이용하여 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하는 것을 특징으로 할 수 있다.The comparison and analysis means 400 may compare and analyze the link data collected by the link data collection means 300 and the link data stored in the database 100 using the Levenshtein Distance algorithm. have.

또한, 상기 비교분석수단(400)은 Levenshtein Distance 알고리즘을 이용하여 사용자단말이 접속한 주소와 특정 웹사이트의 주소를 비교분석하는 것을 특징으로 할 수 있다.In addition, the comparison and analysis means 400 may compare and analyze an address accessed by the user terminal and a specific web site address using the Levenshtein Distance algorithm.

Levenshtein Distance 알고리즘은 러시아 과학자 Vladimir Levenshtein의 이름에서 유래된 것으로 편집 거리 알고리즘 이라고도 하며, 두 문자열의 유사도를 측정하기 위하여 고안된 알고리즘으로 철자검사, 음성인식, 표절검사 등에 이용한다. 2차원 배열을 이용하여 두 문자열을 비교하며 삽입, 삭제, 변경을 문자열 한부분마다 진행하여 최소편집거리 값을 구한다. 부분마다 구한 최소편집거리의 누적된 값이 두 문자열의 최종편집거리 값이 되며, 그 값을 통하여 유사한 정도를 구하는 판단의 척도로 사용한다.The Levenshtein Distance algorithm is derived from the name of the Russian scientist Vladimir Levenshtein. It is also called the edit distance algorithm. It is an algorithm designed to measure the similarity of two strings. It is used for spell checking, speech recognition, and plagiarism. Compares two strings using a two-dimensional array and proceeds with insertion, deletion, and modification for each part of the string to obtain the minimum editing distance value. The cumulative value of the minimum edit distance obtained for each part becomes the final edit distance value of the two strings, and is used as a measure of judgment to obtain a similar degree through the value.

AA LL LL II GG AA TT OO RR 00 1One 22 33 44 55 66 77 88 99 EE 1One 1One 22 33 44 55 66 77 88 99 LL 22 22 1One 22 33 44 55 66 77 88 EE 33 33 22 22 33 44 55 66 77 88 VV 44 44 33 33 33 44 55 66 77 88 AA 55 44 44 44 44 44 44 55 66 77 TT 66 55 55 55 55 55 55 44 55 66 OO 77 66 66 66 66 66 66 55 44 55 RR 88 77 77 77 77 77 77 66 55 44

표 1은 ALLIGATOR와 ELEVATOR를 비교하여 편집거리를 구하는 Levenshtein Distance 알고리즘 작동과정으로 같은 값인 경우는 왼쪽 대각선 위쪽의 값을 가져오고 다른 값인 경우는 위쪽, 왼쪽, 왼쪽 대각선 위쪽의 값 중 가장 작은 값에 1을 더한 값을 가져온다. 알고리즘 작동이 끝나면 오른쪽 가장아래 부분의 값이 두문자열의 편집거리가 된다.Table 1 shows the operation of the Levenshtein Distance algorithm that compares the ALLIGATOR with the ELEVATOR to obtain the edit distance. In the case of the same value, it takes the value above the left diagonal. If it is different from the value above, . When the algorithm is finished, the value at the bottom right is the editing distance of the two strings.

Levenshtein Distance 알고리즘을 이용하여 현재 접속한 페이지 URL 주소와 기존 수집한 URL 주소를 비교한 결과 값은, Using the Levenshtein Distance algorithm, the result of comparing the current page URL address with the existing URL address,

비교하는 두 문자열이 한부분이라도 다른 경우, 0.0의 결과 값이 나오고, If the two strings to be compared differ by one part, the result of 0.0 is output,

비교하는 두 문자열이 100% 일치하는 경우, 1.0의 결과 값이 나온다.If the two strings to be compared are 100% identical, the result is 1.0.

도 3에 도시된 바와 같이, 본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 시스템은 상기 비교분석수단(400)에 의해 비교분석 결과가 100% 일치할 경우 상기 링크데이터수집수단(300)에 의해 수집된 해당 웹페이지의 링크데이터로 연결되는 서브 웹페이지로 이동하는 서브페이지이동수단(500)을 포함하며,3, in the web site forgery detection system using link data according to an embodiment of the present invention, when the comparative analysis result is equal to 100% by the comparative analysis means 400, the link data collection means And a sub-page moving unit 500 for moving to a sub-web page connected to the link data of the corresponding web page,

상기 링크데이터수집수단(300)은 상기 서브페이지이동수단(500)에 의해 이동된 서브 웹페이지의 링크데이터를 수집하고,The link data collection means 300 collects link data of the sub web page moved by the sub page moving means 500,

상기 비교분석수단(400)은 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 상기 특정 웹사이트가 위변조 되었는지는 판단하는 것을 특징으로 할 수 있다.The comparison and analysis means 400 compares and analyzes the link data collected by the link data collection means 300 and the link data stored in the database 100 to determine whether the specific website is forged or not can do.

웹사이트의 위변조 공격은 점점 급증하고 심화되어지고 있다. 이러한 위변조 공격에 대응하기 위해서는 보다 정확한 위변조 탐지가 필요하며, Web site forgery and falsification attacks are increasing and increasing. In order to cope with such forgery and fake attacks, more accurate detection of forgery and falsification is required,

이를 위해, 접속된 웹페이지의 링크데이터와 데이터베이스(100)에 저장된 웹페이지의 링크데이터를 비교하는 데에서 그치는 것이 아니고, For this purpose, the present invention is not limited to comparing the link data of the connected web page with the link data of the web page stored in the database 100,

해당 웹페이지의 링크데이터로 연결되는 서브 웹페이지의 링크데이터들도 비교하여 보다 정확한 위변조 탐지를 할 수 있다.The link data of the sub web page connected to the link data of the corresponding web page can be compared to detect the forgery and falsification more accurately.

도 4에 도시된 바와 같이, 본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 방법은 특정 웹사이트의 주소 및 해당 웹사이트의 링크데이터를 저장하는 데이터베이스(100); 사용자단말이 미리 설정된 특정 웹사이트에 접속하였는지 여부를 감지하는 접속감지수단(200); 상기 접속감지수단(200)에 의해 상기 특정 웹사이트에 접속한 것이 감지된 경우, 상기 특정 웹사이트의 링크데이터를 수집하는 링크데이터수집수단(300); 및 사용자단말이 접속한 주소와 특정 웹사이트의 주소를 비교분석하고, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여, 상기 특정 웹사이트가 위변조 되었는지는 판단하는 비교분석수단(400);을 포함하는 링크데이터를 이용한 웹사이트 위변조 탐지 시스템을 이용한 링크데이터를 이용한 웹사이트 위변조 탐지 방법에 있어서,As shown in FIG. 4, a method for detecting a website forgery using link data according to an embodiment of the present invention includes: a database 100 for storing addresses of a specific website and link data of the corresponding website; A connection detecting means (200) for detecting whether or not a user terminal has accessed a predetermined specific web site; Link data collection means (300) for collecting link data of the specific web site when it is detected by the connection detection means (200) that the specific web site is accessed; And comparing and analyzing the link data collected by the link data collection means 300 and the link data stored in the database 100, A web site forgery detection method using link data using a web site forgery detection system using link data, the method comprising: comparing and analyzing means (400) for determining whether a web site has been falsified;

웹사이트접속 단계(S10), 주소비교 단계(S20), 링크데이터수집 단계(S30) 및 링크데이터비교 단계(S40)를 포함한다.A website access step S10, an address comparison step S20, a link data collection step S30, and a link data comparison step S40.

웹사이트접속 단계(S10)는 상기 접속감지수단(200)에 의해, 사용자단말이 미리 설정된 특정 웹사이트에 접속하였는지 여부를 감지한다.In the web site connection step S10, the connection detecting means 200 detects whether the user terminal has accessed a predetermined web site set in advance.

이는, 모든 웹사이트의 위변조 여부를 확인하는 것은 웹서핑 속도를 늦추기 때문에, 웹서핑 속도를 감안하여 위변조 여부를 확인할 필요성이 있는 특정 웹사이트만 위변조 여부를 확인하기 위함이다.This is to confirm whether forgery or falsification of only a specific web site which needs to check whether forgery or falsification has been taken in consideration of the speed of web surfing because checking whether or not all web sites are falsified is slowing down the web surfing speed.

주소비교 단계(S20)는 상기 웹사이트접속 단계(S10)에서 미리 설정된 특정 웹사이트에 접속한 것이 감지된 경우, 상기 비교분석수단(400)에 의해, 사용자단말이 접속한 주소와 특정 웹사이트의 주소가 동일한지 비교한다.The address comparing step S20 compares the address accessed by the user terminal with the address of the specific web site by the comparison and analysis unit 400 when it is detected that the web site is connected to a predetermined web site, Compare the addresses.

즉, 주소비교 단계(S20)는 사용자가 접속한 특정 웹사이트의 주소(URL)를 크롤링하여 특정 웹사이트의 정상적인 주소(URL)와 비교하여 두 주소가 동일한지 비교한다.That is, in the address comparing step S20, the address (URL) of the specific web site accessed by the user is crawled and compared with the normal address (URL) of the specific web site to compare the two addresses.

즉, 사용자가 접속한 현재 웹페이지 주소를 기존 수집하여 데이터베이스(100)에 저장된 웹페이지 주소와 동일한지 비교한다.That is, the address of the current web page accessed by the user is collected and compared with the address of the web page stored in the database 100.

상기 주소비교 단계(S20)에서 두 주소가 동일하지 않으면, 위변조된 웹사이트로 판단하고, 위변조된 웹사이트임을 사용자단말에 알릴 수 있다.If the two addresses are not identical in the address comparison step (S20), it is determined that the web site is a forged web site, and the user terminal can be informed that the web site is a forged web site.

또한, 비교분석수단(400)에 의해 위변조된 웹사이트라고 판단된 경우, 위변조 정보들을 데이터베이스(100)에 저장할 수 있다.In addition, if it is determined by the comparison and analysis means 400 that the web site is forged, the forgery information can be stored in the database 100.

아울러, 비교분석수단(400)에 의해 위변조된 웹사이트라고 판단된 경우, 해당 웹사이트의 접속을 종료 또는 차단시키는 것도 가능하다.In addition, if it is determined by the comparison and analysis means 400 that the web site is forged, it is also possible to terminate or block the connection of the web site.

이때, 상기 주소비교 단계(S20)는 Levenshtein Distance 알고리즘을 이용하여 사용자단말이 접속한 주소와, 상기 데이터베이스(100)에 저장된 특정 웹사이트의 주소를 비교분석하는 것을 특징으로 할 수 있다.At this time, the address comparing step S20 may compare the address accessed by the user terminal using the Levenshtein Distance algorithm and the address of the specific web site stored in the database 100. [

Levenshtein Distance 알고리즘에 대해서는 상기에서 설명하였기 때문에 생략하도록 한다.The Levenshtein Distance algorithm has been described above and will be omitted.

링크데이터수집 단계(S30)는 상기 주소비교 단계(S20)에서 사용자단말이 접속한 주소와 특정 웹사이트의 주소가 동일하면, 상기 링크데이터수집수단(300)에 의해, 상기 특정 웹사이트의 링크데이터를 수집한다.In the link data collection step S30, if the address of the specific web site is the same as the address of the user terminal in the address comparison step S20, the link data collection means 300 acquires link data Lt; / RTI >

웹사이트는 웹페이지의 묶음을 의미하는 것으로, 특정 웹사이트의 링크데이터를 수집한다는 의미는 현재 접속된 웹페이지의 링크데이터를 수집한다는 의미이다. A web site means a bundle of web pages, meaning collecting link data of a specific web site means collecting link data of the currently connected web page.

여기서, 링크데이터는 현재 접속된 웹페이지와 연결된 웹페이지의 이동정보를 나타내는 것으로, URL(Uniform Resource Locator: 자원 위치 지정자) 등의 정보(도 2 참조)를 의미한다.Here, the link data represents movement information of a web page connected to the currently connected web page, and it means information such as a URL (Uniform Resource Locator) (see Fig. 2).

이때, 상기 링크데이터수집 단계(S30)는 HTML 작업을 위한 Java 라이브러리인 jsoup을 이용하여 웹페이지 내에 연결된 각종 링크데이터를 수집하는 것을 특징으로 할 수 있다.In this case, the link data collection step (S30) may collect various link data linked in a web page using jsoup, which is a Java library for HTML work.

jsoup을 이용하여 웹페이지 내에 연결된 각종 링크데이터의 수집을 진행 하였다.JSoup was used to collect various kinds of link data linked to web pages.

링크데이터비교 단계(S40)는 상기 비교분석수단(400)에 의해, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 상기 특정웹사이트가 위변조 되었는지는 판단한다.In the link data comparison step S40, the comparison and analysis means 400 compares and analyzes the link data collected by the link data collection means 300 and the link data stored in the database 100, It is judged whether the site is forged or falsified.

즉, 링크데이터비교 단계(S40)는 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터가 동일한 데이터인지 비교한다.That is, in the link data comparison step S40, the link data collected by the link data collection means 300 and the link data stored in the database 100 are compared and analyzed, and the link data collected by the link data collection means 300 Data and the link data stored in the database 100 are the same data.

즉, 사용자가 접속한 현재 웹페이지의 링크데이터와 기존 수집하여 데이터베이스(100)에 저장된 링크데이터가 동일한지 비교한다.That is, it compares the link data of the current web page accessed by the user with the link data stored in the database 100 that have been collected.

상기 링크데이터비교 단계(S40)에서 사용자가 접속한 현재 웹페이지의 링크데이터와 기존 수집하여 데이터베이스(100)에 저장된 링크데이터가 동일하지 않으면, 위변조된 웹사이트로 판단하고, 위변조된 웹사이트임을 사용자단말에 알릴 수 있다.If the link data of the current web page accessed by the user in the link data comparison step (S40) is not the same as the link data stored in the database 100, it is determined that the web site is a forged web site. It can notify the terminal.

또한, 비교분석수단(400)에 의해 위변조된 웹사이트라고 판단된 경우, 위변조 정보들을 데이터베이스(100)에 저장할 수 있다.In addition, if it is determined by the comparison and analysis means 400 that the web site is forged, the forgery information can be stored in the database 100.

아울러, 비교분석수단(400)에 의해 위변조된 웹사이트라고 판단된 경우, 해당 웹사이트의 접속을 종료 또는 차단시키는 것도 가능하다.In addition, if it is determined by the comparison and analysis means 400 that the web site is forged, it is also possible to terminate or block the connection of the web site.

이때, 상기 링크데이터비교 단계(S40)는 Levenshtein Distance 알고리즘을 이용하여 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하는 것을 특징으로 할 수 있다.The link data comparison step S40 is characterized by comparing and analyzing the link data collected by the link data collection means 300 and the link data stored in the database 100 using the Levenshtein Distance algorithm .

Levenshtein Distance 알고리즘에 대해서는 상기에서 설명하였기 때문에 생략하도록 한다.The Levenshtein Distance algorithm has been described above and will be omitted.

상기 링크데이터비교 단계(S40)는 링크데이터 수집 단계에서 수집된 링크데이터를 정상인 웹페이지 링크데이터와 비교, 분석하여 정상과 비정상을 판단한다. 비정상의 경우 탐지시스템이 종료되며, 정상일 경우 기존에 수집해놓은 링크데이터인 서브페이지로 이동하여 탐지를 진행할 수 있다.The link data comparison step (S40) compares the link data collected in the link data collection step with normal web page link data to determine normal and abnormal. In case of abnormality, the detection system is terminated, and if it is normal, the user can move to a subpage, which is previously collected link data, and proceed with detection.

도 5에 도시된 바와 같이, 본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 방법은 상기 비교분석수단(400)에 의해 비교분석 결과가 100% 일치할 경우 상기 링크데이터수집수단(300)에 의해 수집된 해당 웹페이지의 링크데이터로 연결되는 서브 웹페이지로 이동하는 서브페이지이동수단(500)이 더 포함된 링크데이터를 이용한 웹사이트 위변조 탐지 시스템을 이용한 링크데이터를 이용한 웹사이트 위변조 탐지 방법에 있어서,As shown in FIG. 5, the method for detecting website forgery using link data according to an embodiment of the present invention is characterized in that when the comparison and analysis result is 100% 300), and a sub-page moving means (500) for moving to a sub-web page linked to link data of the corresponding web page collected by the web site forcible detection system In the detection method,

링크데이터비교 단계(S40) 이후에, 서브페이지이동 단계(S50), 서브링크데이터수집 단계(S60) 및 서브링크데이터비교 단계(S70)를 포함할 수 있다.After the link data comparison step S40, it may include a sub page shift step S50, a sub link data collection step S60 and a sub link data comparison step S70.

서브페이지이동 단계(S50)는 상기 서브페이지이동수단(500)에 의해, 상기 비교분석수단(400)에 의한 비교분석 결과가 100% 일치할 경우, 해당 웹페이지에서 수집된 해당 웹페이지의 링크데이터로 연결되는 서브 웹페이지로 이동한다.In the subpage moving step S50, when the comparison analysis result by the comparison and analysis means 400 is equal to 100%, the subpage moving means 500 reads the link data of the corresponding webpage collected from the corresponding webpage To a sub-web page connected to the sub-web page.

서브링크데이터수집 단계(S60)는 상기 링크데이터수집수단(300)에 의해, 서브 웹페이지의 링크데이터를 수집한다.The sub-link data collection step (S60) collects the link data of the sub-web page by the link data collection means (300).

서브링크데이터비교 단계(S70)는 상기 비교분석수단(400)에 의해, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 상기 특정 웹사이트가 위변조 되었는지는 판단한다.The sub-link data comparison step S70 compares the link data collected by the link data collection means 300 with the link data stored in the database 100 by the comparison and analysis means 400, It is judged whether the website is forged or falsified.

즉, 서브링크데이터비교 단계(S70)는 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터가 동일한 데이터인지 비교한다.That is, the sub-link data comparison step S70 compares the link data collected by the link data collection means 300 with the link data stored in the database 100 and compares the link data collected by the link data collection means 300 The link data and the link data stored in the database 100 are the same data.

즉, 사용자가 접속한 현재 웹페이지(서브페이지이동수단(500)에 의해 이동한 서브 웹페이지)의 링크데이터와 기존 수집하여 데이터베이스(100)에 저장된 링크데이터가 동일한지 비교한다.That is, it compares the link data of the current web page accessed by the user (the sub web page moved by the sub page shifting means 500) with the link data already collected and stored in the database 100.

상기 서브링크데이터비교 단계(S70)에서 사용자가 접속한 현재 웹페이지(서브페이지이동수단(500)에 의해 이동한 서브 웹페이지)의 링크데이터와 기존 수집하여 데이터베이스(100)에 저장된 링크데이터가 동일하지 않으면, 위변조된 웹사이트로 판단하고, 위변조된 웹사이트임을 사용자단말에 알릴 수 있다.In the sub link data comparison step S70, the link data of the current web page accessed by the user (the sub web page moved by the sub page shifting means 500) and the link data previously collected and stored in the database 100 are the same Otherwise, it is determined that the web site is a forged web site, and the user terminal can be informed that the web site is a forged web site.

또한, 비교분석수단(400)에 의해 위변조된 웹사이트라고 판단된 경우, 위변조 정보들을 데이터베이스(100)에 저장할 수 있다.In addition, if it is determined by the comparison and analysis means 400 that the web site is forged, the forgery information can be stored in the database 100.

아울러, 비교분석수단(400)에 의해 위변조된 웹사이트라고 판단된 경우, 해당 웹사이트의 접속을 종료 또는 차단시키는 것도 가능하다.In addition, if it is determined by the comparison and analysis means 400 that the web site is forged, it is also possible to terminate or block the connection of the web site.

상기 서브링크데이터비교 단계(S70)에서 나온 결과 값이 위변조가 없는 웹사이트에 해당되는 정상의 결과 값을 얻었을 경우에는, If the result value obtained from the sub-link data comparison step S70 is a normal result corresponding to a website without forgery and falsification,

서브페이지이동 단계(S50)에서 서브링크데이터비교 단계(S60)까지 반복 수행할 수 있다.(도 5 참조)The subpage data comparison step S60 may be repeatedly performed in the subpage moving step S50 (see FIG. 5). [

이는, 보다 정확한 위변조 탐지를 하기 위함으로, 더 이상의 서브 웹페이지가 없을 때 까지 반복수행하는 것도 가능하나, 무한루프에 걸릴 위험이 있으므로, 일정 횟수를 정해두고 반복 수행하는 것도 가능함은 물론이다.This is because it is possible to repeatedly perform the process until there is no further sub-web page in order to perform more precise detection of falsification and tampering, but there is a risk of endless loop, so that it is possible to repeat the process with a fixed number of times.

이상에서 본 발명의 일 실시예에 따른 링크데이터를 이용한 웹사이트 위변조 탐지 방법에 대하여 설명하였지만, 링크데이터를 이용한 웹사이트 위변조 탐지 방법을 구현하기 위한 프로그램이 저장된 컴퓨터 판독 가능한 기록매체 및 링크데이터를 이용한 웹사이트 위변조 탐지 방법을 구현하기 위한 컴퓨터 판독 가능한 기록매체에 저장된 프로그램 역시 구현 가능함은 물론이다.Although the web site forgery detection method using link data according to an embodiment of the present invention has been described above, it is possible to use a computer readable recording medium storing a program for implementing a web site forgery detection method using link data, It goes without saying that a program stored in a computer-readable recording medium for implementing the website forgery detection method can also be implemented.

즉, 상술한 링크데이터를 이용한 웹사이트 위변조 탐지 방법은 이를 구현하기 위한 명령어들의 프로그램이 유형적으로 구현됨으로써, 컴퓨터를 통해 판독될 수 있는 기록매체에 포함되어 제공될 수도 있음을 당업자들이 쉽게 이해할 수 있을 것이다. 다시 말해, 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어, 컴퓨터 판독 가능한 기록매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 컴퓨터 판독 가능한 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 상기 컴퓨터 판독 가능한 기록매체의 예에는 하드 디스크, 플로피 디스크 및 자기테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리, USB 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.That is, the above-described method for detecting a website forgery-alteration using link data can be easily understood by those skilled in the art that a program of instructions for implementing the program can be tangibly embodied in a recording medium readable by a computer will be. In other words, it can be implemented in the form of a program command that can be executed through various computer means, and can be recorded on a computer-readable recording medium. The computer-readable recording medium may include program commands, data files, data structures, and the like, alone or in combination. The program instructions recorded on the computer-readable recording medium may be those specially designed and configured for the present invention or may be those known and available to those skilled in the computer software. Examples of the computer-readable medium include magnetic media such as hard disks, floppy disks and magnetic tape, optical media such as CD-ROMs and DVDs, and optical disks such as floppy disks. Magneto-optical media and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, USB memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

본 발명은 상기한 실시예에 한정되지 아니하며, 적용범위가 다양함은 물론이고, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 다양한 변형 실시가 가능한 것은 물론이다. It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims.

100: 데이터베이스 200: 접속감지수단
300: 링크데이터수집수단 400: 비교분석수단
500: 서브페이지이동수단
S10: 웹사이트접속 단계 S20: 주소비교 단계
S30: 링크데이터수집 단계 S40: 링크데이터비교 단계
S50: 서브페이지이동 단계 S60: 서브링크데이터수집 단계
S70: 서브링크데이터비교 단계
100: Database 200: Connection Detection Means
300: link data collection means 400: comparative analysis means
500: Subpage moving means
S10: Web site access step S20: Address comparison step
S30: Link data collection step S40: Link data comparison step
S50: Sub page shift step S60: Sub link data collection step
S70: Sublink data comparison step

Claims (10)

특정 웹사이트의 주소 및 해당 웹사이트의 링크데이터를 저장하는 데이터베이스(100);
사용자단말이 미리 설정된 특정 웹사이트에 접속하였는지 여부를 감지하는 접속감지수단(200);
상기 접속감지수단(200)에 의해 상기 특정 웹사이트에 접속한 것이 감지된 경우, 상기 특정 웹사이트의 링크데이터를 수집하는 링크데이터수집수단(300); 및
사용자단말이 접속한 주소와 특정 웹사이트의 주소를 비교분석하고, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여, 상기 특정 웹사이트가 위변조 되었는지는 판단하는 비교분석수단(400);
을 포함하는 링크데이터를 이용한 웹사이트 위변조 탐지 시스템.
A database 100 for storing addresses of specific websites and link data of the corresponding websites;
A connection detecting means (200) for detecting whether or not a user terminal has accessed a predetermined specific web site;
Link data collection means (300) for collecting link data of the specific web site when it is detected by the connection detection means (200) that the specific web site is accessed; And
Analyzes the link data collected by the link data collecting means 300 and the link data stored in the database 100 to compare the link data collected by the link data collecting means 300 with the specific web A comparison and analysis means 400 for determining whether the site is forged or falsified;
A web site forgery detection system using link data including.
제1항에 있어서,
상기 링크데이터수집수단(300)은
HTML 작업을 위한 Java 라이브러리인 jsoup을 이용하여 웹페이지 내에 연결된 각종 링크데이터를 수집하는 것을 특징으로 하는 링크데이터를 이용한 웹사이트 위변조 탐지 시스템.
The method according to claim 1,
The link data collection means (300)
A web site forgery detection system using link data, characterized by collecting various link data linked to a web page by using a Java library jsoup for HTML operation.
제1항에 있어서,
상기 비교분석수단(400)은
Levenshtein Distance 알고리즘을 이용하여 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하는 것을 특징으로 하는 링크데이터를 이용한 웹사이트 위변조 탐지 시스템.
The method according to claim 1,
The comparison and analysis means (400)
Wherein the link data collected by the link data collection means (300) and the link data stored in the database (100) are compared and analyzed using the Levenshtein Distance algorithm.
제1항에 있어서,
상기 링크데이터를 이용한 웹사이트 위변조 탐지 시스템은
상기 비교분석수단(400)에 의해 비교분석 결과가 100% 일치할 경우 상기 링크데이터수집수단(300)에 의해 수집된 해당 웹페이지의 링크데이터로 연결되는 서브 웹페이지로 이동하는 서브웹페이지이동수단(500)
을 포함하며,
상기 링크데이터수집수단(300)은
상기 서브웹페이지이동수단(500)에 의해 이동된 서브 웹페이지의 링크데이터를 수집하고,
상기 비교분석수단(400)은
상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 상기 특정 웹사이트가 위변조 되었는지는 판단하는 것을 특징으로 하는 링크데이터를 이용한 웹사이트 위변조 탐지 시스템.
The method according to claim 1,
The web site forgery detection system using the link data
A sub web page moving means for moving to a sub web page linked with link data of the corresponding web page collected by the link data collecting means 300 when the comparison and analysis result is 100% (500)
/ RTI >
The link data collection means (300)
Collects link data of the sub web page moved by the sub web page moving means 500,
The comparison and analysis means (400)
Wherein the web site forgery and corruption is determined by comparing and analyzing the link data collected by the link data collection means (300) and the link data stored in the database (100) Detection system.
특정 웹사이트의 주소 및 해당 웹사이트의 링크데이터를 저장하는 데이터베이스(100); 사용자단말이 미리 설정된 특정 웹사이트에 접속하였는지 여부를 감지하는 접속감지수단(200); 상기 접속감지수단(200)에 의해 상기 특정 웹사이트에 접속한 것이 감지된 경우, 상기 특정 웹사이트의 링크데이터를 수집하는 링크데이터수집수단(300); 및 사용자단말이 접속한 주소와 특정 웹사이트의 주소를 비교분석하고, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여, 상기 특정 웹사이트가 위변조 되었는지는 판단하는 비교분석수단(400);을 포함하는 링크데이터를 이용한 웹사이트 위변조 탐지 시스템을 이용한 링크데이터를 이용한 웹사이트 위변조 탐지 방법에 있어서,
상기 접속감지수단(200)에 의해, 사용자단말이 미리 설정된 특정 웹사이트에 접속하였는지 여부를 감지하는 웹사이트접속 단계(S10);
상기 웹사이트접속 단계(S10)에서 미리 설정된 특정 웹사이트에 접속한 것이 감지된 경우, 상기 비교분석수단(400)에 의해, 사용자단말이 접속한 주소와 특정 웹사이트의 주소가 동일한지 비교하는 주소비교 단계(S20);
상기 주소비교 단계(S20)에서 사용자단말이 접속한 주소와 특정 웹사이트의 주소가 동일하면, 상기 링크데이터수집수단(300)에 의해, 상기 특정 웹사이트의 링크데이터를 수집하는 링크데이터수집 단계(S30); 및
상기 비교분석수단(400)에 의해, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 상기 특정 웹사이트가 위변조 되었는지는 판단하는 링크데이터비교 단계(S40);
를 포함하는 링크데이터를 이용한 웹사이트 위변조 탐지 방법.
A database 100 for storing addresses of specific websites and link data of the corresponding websites; A connection detecting means (200) for detecting whether or not a user terminal has accessed a predetermined specific web site; Link data collection means (300) for collecting link data of the specific web site when it is detected by the connection detection means (200) that the specific web site is accessed; And comparing and analyzing the link data collected by the link data collection means 300 and the link data stored in the database 100, A web site forgery detection method using link data using a web site forgery detection system using link data, the method comprising: comparing and analyzing means (400) for determining whether a web site has been falsified;
A web site access step (S10) for detecting whether the user terminal has accessed a predetermined web site set by the connection detecting means (200);
If it is detected in the connection step S10 of the web site that a predetermined web site has been accessed, the comparison and analysis unit 400 compares the address of the specific web site with the address of the user terminal, Comparison step S20;
A link data collection step of collecting link data of the specific web site by the link data collection means 300 if the address accessed by the user terminal and the address of the specific web site are the same in the address comparison step S20 S30); And
The comparison and analysis means 400 compares the link data collected by the link data collection means 300 with the link data stored in the database 100 to determine whether the specific website is forged or not A data comparison step (S40);
A method for detecting forgery of a web site using link data including a link data.
제5항에 있어서,
상기 링크데이터수집 단계(S30)는
HTML 작업을 위한 Java 라이브러리인 jsoup을 이용하여 웹페이지 내에 연결된 각종 링크데이터를 수집하는 것을 특징으로 하는 링크데이터를 이용한 웹사이트 위변조 탐지 방법.
6. The method of claim 5,
The link data collection step (S30)
A method for detecting forgery of a website using link data, characterized by collecting various link data linked to a web page by using a Java library jsoup for HTML operation.
제5항에 있어서,
상기 링크데이터비교 단계(S40)는
Levenshtein Distance 알고리즘을 이용하여 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하는 것을 특징으로 하는 링크데이터를 이용한 웹사이트 위변조 탐지 방법.
6. The method of claim 5,
The link data comparison step (S40)
Wherein the link data collected by the link data collection means (300) and the link data stored in the database (100) are compared and analyzed using the Levenshtein Distance algorithm.
제5항에 있어서,
상기 비교분석수단(400)에 의해 비교분석 결과가 100% 일치할 경우 상기 링크데이터수집수단(300)에 의해 수집된 해당 웹페이지의 링크데이터로 연결되는 서브 웹페이지로 이동하는 서브웹페이지이동수단(500)이 더 포함된 링크데이터를 이용한 웹사이트 위변조 탐지 시스템을 이용한 링크데이터를 이용한 웹사이트 위변조 탐지 방법에 있어서,
상기 비교분석수단(400)에 의한 비교분석 결과가 100% 일치할 경우, 상기 서브웹페이지이동수단(500)에 의해, 해당 웹페이지에서 수집된 해당 웹페이지의 링크데이터로 연결되는 서브 웹페이지로 이동하는 서브페이지이동 단계(S50);
상기 링크데이터수집수단(300)에 의해, 서브 웹페이지의 링크데이터를 수집하는 서브링크데이터수집 단계(S60); 및
상기 비교분석수단(400)에 의해, 상기 링크데이터수집수단(300)에 의해 수집된 링크데이터와, 상기 데이터베이스(100)에 저장된 링크데이터를 비교분석하여 상기 특정 웹사이트가 위변조 되었는지는 판단하는 서브링크데이터비교 단계(S60);
를 포함하는 링크데이터를 이용한 웹사이트 위변조 탐지 방법.
6. The method of claim 5,
A sub web page moving means for moving to a sub web page linked with link data of the corresponding web page collected by the link data collecting means 300 when the comparison and analysis result is 100% A method for detecting forgery of a web site using link data using a web site forgery detection system using link data,
When the result of the comparative analysis by the comparative analysis means 400 is 100%, the sub web page moving means 500 transmits a sub web page, which is linked to the link data of the corresponding web page, Moving subpage moving step S50;
A sub link data collection step (S60) of collecting link data of a sub web page by the link data collection means (300); And
The comparison and analysis means 400 compares the link data collected by the link data collection means 300 with the link data stored in the database 100 to determine whether the specific website is forged or not Link data comparison step (S60);
A method for detecting forgery of a web site using link data including a link data.
제 5항 내지 제 8항 중 선택되는 어느 한 항에 기재된 링크데이터를 이용한 웹사이트 위변조 탐지 방법을 구현하기 위한 프로그램이 저장된 컴퓨터 판독 가능한 기록매체.
A computer-readable recording medium storing a program for implementing a method for detecting a website forgery-alteration using link data according to any one of claims 5 to 8.
제 5항 내지 제 8항 중 선택되는 어느 한 항에 기재된 링크데이터를 이용한 웹사이트 위변조 탐지 방법을 구현하기 위한 컴퓨터 판독 가능한 기록매체에 저장된 프로그램.
A program stored in a computer-readable recording medium for implementing a method for detecting a website forgery-alteration using link data according to any one of claims 5 to 8.
KR1020170032255A 2017-03-15 2017-03-15 SYSTEM AND METHOD FOR DETECTING COUNTERFEIT and FALSIFICATION USING LINK DATA KR101924787B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170032255A KR101924787B1 (en) 2017-03-15 2017-03-15 SYSTEM AND METHOD FOR DETECTING COUNTERFEIT and FALSIFICATION USING LINK DATA

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170032255A KR101924787B1 (en) 2017-03-15 2017-03-15 SYSTEM AND METHOD FOR DETECTING COUNTERFEIT and FALSIFICATION USING LINK DATA

Publications (2)

Publication Number Publication Date
KR20180105335A true KR20180105335A (en) 2018-09-28
KR101924787B1 KR101924787B1 (en) 2018-12-04

Family

ID=63721566

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170032255A KR101924787B1 (en) 2017-03-15 2017-03-15 SYSTEM AND METHOD FOR DETECTING COUNTERFEIT and FALSIFICATION USING LINK DATA

Country Status (1)

Country Link
KR (1) KR101924787B1 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100736540B1 (en) * 2006-02-20 2007-07-06 에스케이 텔레콤주식회사 Web defacement checker and checking method thereof

Also Published As

Publication number Publication date
KR101924787B1 (en) 2018-12-04

Similar Documents

Publication Publication Date Title
KR101001132B1 (en) Method and System for Determining Vulnerability of Web Application
RU2610254C2 (en) System and method of determining modified web pages
US9680850B2 (en) Identifying bots
US9356955B2 (en) Methods for determining cross-site scripting and related vulnerabilities in applications
Lee et al. A novel method for SQL injection attack detection based on removing SQL query attribute values
US8949990B1 (en) Script-based XSS vulnerability detection
KR101010708B1 (en) Method and apparatus for preventing web page attacks
CN102571846B (en) Method and device for forwarding hyper text transport protocol (HTTP) request
US8850567B1 (en) Unauthorized URL requests detection
US20090119769A1 (en) Cross-site scripting filter
KR100894331B1 (en) Anomaly Detection System and Method of Web Application Attacks using Web Log Correlation
EP1999609A2 (en) Client side attack resistant phishing detection
JP2010516007A (en) Method and apparatus for detecting computer fraud
CN107463844B (en) WEB Trojan horse detection method and system
CN101895516A (en) Method and device for positioning cross-site scripting attack source
KR102408205B1 (en) Method and apparatus for detecting life cycle step of website
CN113518077A (en) Malicious web crawler detection method, device, equipment and storage medium
CN110851838A (en) Cloud testing system and security testing method based on Internet
Wedman et al. An analytical study of web application session management mechanisms and HTTP session hijacking attacks
Nagarjun et al. Cross-site scripting research: A review
KR101468798B1 (en) Apparatus for tracking and preventing pharming or phishing, method using the same
US20180173685A1 (en) Security-Focused Web Application Crawling
KR101924787B1 (en) SYSTEM AND METHOD FOR DETECTING COUNTERFEIT and FALSIFICATION USING LINK DATA
Duraisamy et al. A server side solution for protection of web applications from cross-site scripting attacks
KR20090058271A (en) Integration security system and method by tracking web-database attack detection log data

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant