KR101648349B1 - Apparatus and method for calculating risk of web site - Google Patents

Apparatus and method for calculating risk of web site Download PDF

Info

Publication number
KR101648349B1
KR101648349B1 KR1020150158687A KR20150158687A KR101648349B1 KR 101648349 B1 KR101648349 B1 KR 101648349B1 KR 1020150158687 A KR1020150158687 A KR 1020150158687A KR 20150158687 A KR20150158687 A KR 20150158687A KR 101648349 B1 KR101648349 B1 KR 101648349B1
Authority
KR
South Korea
Prior art keywords
risk
web
web page
score
given
Prior art date
Application number
KR1020150158687A
Other languages
Korean (ko)
Inventor
김환국
정종훈
배한철
추현록
오상환
윤수진
Original Assignee
한국인터넷진흥원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국인터넷진흥원 filed Critical 한국인터넷진흥원
Priority to KR1020150158687A priority Critical patent/KR101648349B1/en
Priority to PCT/KR2016/000348 priority patent/WO2017082470A1/en
Application granted granted Critical
Publication of KR101648349B1 publication Critical patent/KR101648349B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/57Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
    • G06F21/577Assessing vulnerabilities and evaluating computer system security
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1433Vulnerability analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/56Computer malware detection or handling, e.g. anti-virus arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1441Countermeasures against malicious traffic

Abstract

Disclosed is a method for calculating the risk of a web site. According to an embodiment of the present invention, the method for calculating the risk of the web site includes: a step of collecting web contents included on a web site to be inspected; a step of inspecting whether the web contents includes at least one among a malicious script, an HTML vulnerable tag, and a blacklist URL corresponding to the risk of the web site; and a step of calculating the risk of the web site by using at least one among a risk factor included in the web contents, hierarchical information of a web page included in the web contents, and connection information of the web page included in the web contents.

Description

웹사이트 위험도 산출 장치 및 그 방법{APPARATUS AND METHOD FOR CALCULATING RISK OF WEB SITE}[0001] APPARATUS AND METHOD FOR CALCULATING RISK OF WEB SITE [0002]

본 발명은 웹사이트 위험도 산출 장치 및 그 방법에 관한 것으로, 보다 상세하게는 웹컨텐츠의 악성 스크립트 포함 여부, 웹컨텐츠가 포함된 웹페이지의 위치 및 웹페이지에 연결될 수 있는 경로의 수를 이용하여 이를 포함하는 웹사이트의 위험도를 산출할 수 있는 웹사이트 위험도 산출 장치 및 그 방법에 관한 것이다.The present invention relates to a web site risk calculation apparatus and method, and more particularly, to a web site risk calculation apparatus and method using web site content and a web site, And a web site risk calculation device and method thereof that can calculate a risk of a web site including the web site.

최근들어 악성코드 유포는 다양한 경로를 통해 이루어지고 있다. 그 중에서도 가장 널리 쓰이는 방법은 웹사이트를 통한 유포이다. 인터넷의 사용이 필수가 되버린 현대사회에서 웹사이트를 통한 악성 코드 유포는 유포자에게 매우 매력적이고 유용한 방법 중 하나이다.In recent years, malicious codes are spreading through various channels. The most widely used method is distribution through websites. In modern society, where the use of the Internet has become necessary, distribution of malicious code through websites is one of the most attractive and useful methods for the spreaders.

웹사이트를 보유한 업체 또는 기관의 여력에 따라 웹사이트들의 보안성도 달라지지만, 대체적으로 모든 웹사이트들이 악성코드 유포에 잠재적인 후보가 될 수 있다.The security of websites depends on the availability of the company or organization that owns the website, but in general, all websites can be potential candidates for spreading malicious code.

이는 웹사이트 혹은 서버를 완벽하게 보호할 수 있는 기술이 현재까지 없기 때문이며, 상당수의 웹사이트들은 최소한의 방어 수단도 없이 크래커의 공격에 노출되어 있기 때문이다.This is because there is currently no technology to fully protect a Web site or server, and many Web sites are vulnerable to cracker attacks without minimal defense.

이에, 웹사이트를 통한 악성코드 유포에 대응하고자 많은 보안 업체에서 웹사이트들을 분석하여 악성코드 유포나 피싱 등 여러 위험도를 측정하고 이를 데이터베이스화하려는 시도가 이루어지고 있다.Therefore, in order to cope with the distribution of malicious codes through websites, many security companies are attempting to analyze web sites to measure various risks such as distribution of malicious codes and phishing, and to database them.

또한, 이렇게 데이터베이스화된 웹사이트 위험도 정보를 바탕으로 사용자들에게 현재 접속하려는 웹사이트의 위험성을 알려주는 서비스들이 속속 선보이고 있다.In addition, based on the database information of the web site risk information, there are a series of services that inform the users of the risk of the web site that they are currently accessing.

이러한 기술 개발 추세를 반영하여 복수의 웹사이트들에 대한 위험도를 객관적으로 측정할 수 있는 새로운 형태의 웹사이트 위험도 측정 방법에 대한 필요성이 대두되었다.A new type of web site risk measurement method that can objectively measure the risk of multiple web sites has been needed to reflect this trend of technology development.

본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로, 본 발명의 목적은 객관적인 지표를 이용하여 웹사이트의 위험도를 점수화할 수 있는 웹사이트 위험도 측정 방법을 제공하는데 있다.SUMMARY OF THE INVENTION The present invention has been made in order to solve the above problems, and an object of the present invention is to provide a web site risk measurement method capable of scoring a risk of a web site by using an objective indicator.

본 발명의 또 다른 목적은 웹사이트 위험도에 따라 서로 다른 등급을 부여함으로써 사용자로 하여금 자신이 접속하려고 하는 웹사이트의 위험도를 직감적으로 인지할 수 있게 하는 웹사이트 위험도 측정 방법을 제공하는데 있다.It is another object of the present invention to provide a web site risk measurement method that allows a user to intuitively recognize a risk of a web site to which the user intends to access by assigning different ranks according to the web site risk.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속한 기술분야의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The technical objects of the present invention are not limited to the above-mentioned technical problems, and other technical subjects not mentioned can be clearly understood by those skilled in the art from the following description.

상술한 목적을 달성하기 위한 본 발명의 일 실시예에 따른 웹사이트 위험도 산출 방법은, 점검 대상 웹사이트에 포함된 웹컨텐츠를 수집하는 단계, 상기 웹컨텐츠가 위험 요인에 해당하는 악성 스크립트, HTML 취약 태그 및 블랙리스트 URL 중 적어도 하나를 포함하는지에 대한 검사를 수행하는 단계, 상기 웹컨텐츠에 포함된 위험 요인, 상기 웹컨텐츠가 포함된 웹페이지의 계층 정보 및 상기 웹컨텐츠가 포함된 웹페이지의 연결 정보 중 적어도 하나를 이용하여 상기 웹페이지의 위험도를 계산하는 단계를 포함한다.According to another aspect of the present invention, there is provided a method for calculating a web site risk, comprising the steps of: collecting web content included in a web site to be inspected; Tag, and blacklist URL of the web page, a risk factor included in the web content, a hierarchical information of the web page including the web content, and a link of the web page including the web content And calculating the risk of the web page using at least one of the information.

본 발명의 일 실시예에 따르면, 상기 웹페이지의 위험도를 계산하는 단계는, 상기 웹컨텐츠에 포함된 위험 요인에 대응되는 기 설정된 위험도 점수를 부여하는 단계, 웹페이지의 계층적 구조에서 상기 웹컨텐츠가 포함된 웹페이지의 계층 정보에 대응되는 기 설정된 위험도 점수를 부여하는 단계 및 상기 웹컨텐츠가 포함된 웹페이지의 연결 정보에 대응되는 위험도 점수를 부여하는 단계를 포함할 수 있다.According to an embodiment of the present invention, the step of calculating the risk of the web page may include: providing a predetermined risk score corresponding to a risk factor included in the web content; A step of providing a predetermined risk score corresponding to the hierarchical information of the web page including the web content, and a risk score corresponding to the connection information of the web page containing the web content.

본 발명의 일 실시예에 따르면, 상기 웹컨텐츠에 포함된 위험 요인에 대응되는 기 설정된 위험도 점수를 부여하는 단계는, 상기 웹컨텐츠에 포함된 위험 요인이 복수개인 경우, 각 위험 요인에 대응되는 기 설정된 위험도 점수를 합산하는 단계를 포함할 수 있다.According to an embodiment of the present invention, the step of assigning predetermined risk scores corresponding to the risk factors included in the web content may include: when a plurality of risk factors included in the web content are present, And summing the set risk scores.

본 발명의 일 실시예에 따르면, 상기 웹페이지의 위험도를 계산하는 단계는, 상기 위험 요인에 대응하여 부여된 점수, 상기 계층 정보에 대응하여 부여된 점수 및 상기 연결 정보에 대응하여 부여된 점수를 곱하여 상기 웹페이지에 대한 위험도를 산출하는 단계를 포함할 수 있다.According to an embodiment of the present invention, the step of calculating the risk of the web page may include calculating a score of a score corresponding to the risk factor, a score corresponding to the hierarchical information, and a score corresponding to the connection information And calculating a risk level for the web page.

본 발명의 일 실시예에 따르면, 복수의 웹페이지들에 부여된 위험 요인 관련 위험도 점수 중 최대 위험도 점수, 복수의 웹페이지들에 부여된 계층 정보 관련 위험도 점수 중 최대 위험도 점수 및 복수의 웹페이지들에 부여된 연결 정보 관련 위험도 점수 중 최대 위험도 점수를 합산한 값을 위험 요인에 부여될 수 있는 최대 위험도 점수, 계층 정보에 부여될 수 있는 최대 위험도 점수 및 연결 정보에 부여될 수 있는 최대 위험도 점수를 합산한 값으로 나눈 값을 상기 복수의 웹페이지들로 구성된 웹사이트 위험도로 결정하는 단계를 더 포함할 수 있다.According to an embodiment of the present invention, a maximum risk score among risk factors related risk scores assigned to a plurality of web pages, a maximum risk score among hierarchical information related risk scores assigned to a plurality of web pages, and a plurality of web pages , The maximum risk score that can be given to the hierarchical information, and the maximum risk score that can be given to the connection information. And calculating a value obtained by dividing the sum of the sum of the plurality of web pages by the sum of the sum and the sum as a web site risk composed of the plurality of web pages.

본 발명의 일 실시예에 따르면, 상기 웹사이트 위험도에 대응되는 등급을 상기 웹사이트에 부여하는 단계를 더 포함할 수 있다.According to an embodiment of the present invention, the method may further include the step of assigning a rating corresponding to the website risk to the website.

본 발명의 일 실시예에 따르면, 상기 웹사이트의 과거 위험도에 대응되는 가중치를 반영하여 웹사이트의 위험도를 계산하는 단계를 더 포함할 수 있다.According to an embodiment of the present invention, the risk may be calculated by reflecting a weight corresponding to a past risk of the web site.

본 발명의 또 다른 실시예에 따른 웹사이트 위험도 산출 장치는, 점검 대상 웹사이트에 포함된 웹컨텐츠를 수집하는 수집부, 상기 수집된 웹컨텐츠가 악성 스크립트, HTML 취약 태그 및 블랙리스트 URL 중 적어도 하나를 포함하는지에 대한 검사를 수행하는 검사부 및 상기 웹컨텐츠에 수행된 검사의 종류, 상기 웹컨텐츠의 위치 및 상기 웹컨텐츠가 포함된 웹페이지의 연결정보 중 적어도 하나를 이용하여 상기 웹페이지의 위험도를 계산하는 웹페이지 위험도 계산부를 포함한다.The web site risk calculation apparatus according to another embodiment of the present invention includes a collection unit for collecting web contents included in a check target web site, at least one of the collected malicious script, HTML vulnerable tag, and black list URL And a control unit configured to control at least one of a type of the inspection performed on the web content, a location of the web content, and connection information of the web page including the web content, And a web page risk calculator for calculating the web page risk.

본 발명의 일 실시예에 따르면, 상기 웹페이지 위험도 계산부는, 웹컨텐츠에 포함된 위험 요인에 대응되는 기 설정된 위험도 점수를 부여하고, 웹페이지의 계층적 구조에서 상기 웹컨텐츠가 포함된 웹페이지의 계층 정보에 대응되는 기 설정된 위험도 점수를 부여하며, 상기 웹컨텐츠가 포함된 웹페이지의 연결 정보에 대응되는 위험도 점수를 부여할 수 있다.According to an embodiment of the present invention, the web page risk calculation unit may assign a predetermined risk score corresponding to a risk factor included in the web content, and determine a risk score of the web page including the web content in a hierarchical structure of the web page A predetermined risk score corresponding to the hierarchical information is given, and a risk score corresponding to the connection information of the web page including the web content can be given.

본 발명의 일 실시예에 따르면, 상기 웹페이지 위험도 계산부는, 상기 웹컨텐츠에 포함된 위험 요인이 복수개인 경우, 각 위험 요인에 대응되는 기 설정된 위험도 점수를 합산할 수 있다.According to an embodiment of the present invention, when a plurality of risk factors included in the web content are included, the web page risk calculation unit may sum predetermined risk scores corresponding to each risk factor.

본 발명의 일 실시예에 따르면, 상기 웹페이지 위험도 계산부는, 상기 위험 요인에 대응하여 부여된 점수, 상기 계층 정보에 대응하여 부여된 점수 및 상기 연결 정보에 대응하여 부여된 점수를 곱하여 상기 웹페이지에 대한 위험도를 산출할 수 있다.According to an embodiment of the present invention, the web page risk calculation unit may multiply the score given in correspondence with the risk factor, the score given in correspondence with the hierarchical information, and the score given in correspondence with the connection information, Can be calculated.

본 발명의 일 실시예에 따르면, 복수의 웹페이지들에 부여된 위험 요인 관련 위험도 점수 중 최대 위험도 점수, 복수의 웹페이지들에 부여된 계층 정보 관련 위험도 점수 중 최대 위험도 점수 및 복수의 웹페이지들에 부여된 연결 정보 관련 위험도 점수 중 최대 위험도 점수를 합산한 값을 위험 요인에 부여될 수 있는 최대 위험도 점수, 계층 정보에 부여될 수 있는 최대 위험도 점수 및 연결 정보에 부여될 수 있는 최대 위험도 점수를 합산한 값으로 나눈 값을 상기 복수의 웹페이지들로 구성된 웹사이트 위험도로 결정하는 웹사이트 위험도 계산부를 더 포함할 수 있다.According to an embodiment of the present invention, a maximum risk score among risk factors related risk scores assigned to a plurality of web pages, a maximum risk score among hierarchical information related risk scores assigned to a plurality of web pages, and a plurality of web pages , The maximum risk score that can be given to the hierarchical information, and the maximum risk score that can be given to the connection information. And a web site risk calculator for determining a value obtained by dividing the sum of the plurality of web pages by a value obtained by summing the sum as a web site risk composed of the plurality of web pages.

본 발명의 일 실시예에 따르면, 상기 웹사이트 위험도 계산부는, 상기 웹사이트 위험도에 대응된느 등급을 상기 웹사이트에 부여할 수 있다.According to an embodiment of the present invention, the website risk calculation unit may assign a rating corresponding to the website risk to the website.

본 발명의 일 실시예에 따르면, 상기 웹사이트 위험도 계산부는, 상기 웹사이트의 과거 위험도에 대응되는 가중치를 반영하여 웹사이트의 위험도를 계산할 수 있다.According to an embodiment of the present invention, the website risk calculator may calculate a risk of a web site by reflecting a weight corresponding to a past risk of the web site.

상술한 본 발명의 일 실시예에 따른 웹사이트 위험도 산출 방법에 따르면, 객관적인 지표를 이용하여 웹사이트의 위험도를 점수화할 수 있다는 효과를 달성할 수 있다.According to the web site risk calculation method according to the embodiment of the present invention, the risk of a web site can be scored using an objective indicator.

또한, 웹사이트 위험도에 따라 서로 다른 등급을 부여함으로써 사용자로 하여금 자신이 접속하려고 하는 웹사이트의 위험도를 직감적으로 인지할 수 있게 한다는 효과를 달성할 수 있다.In addition, by assigning different grades according to the web site risk, the user can intuitively recognize the risk of the web site he or she intends to access.

도 1은 본 발명의 일 실시예에 따른 웹사이트 위험도 산출 장치를 설명하기 위한 기능 블록도이다.
도 2는 본 발명의 일 실시예에 따라 웹페이지에 포함된 위험 요인에 대응되는 점수를 부여하는 과정을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따라 검사 대상 웹사이트의 계층 구조를 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 웹페이지의 계층 정보에 대응되는 위험도 점수 정보를 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따라 웹페이지의 연결 정보에 대응되는 위험도 점수를 부여하는 방법을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따라 웹페이지의 위험도를 산출하는 과정을 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에 따라 복수의 웹페이지를 포함하는 웹사이트의 위험도를 산출하는 과정을 설명하기 위한 도면이다.
도 8은 본 발명의 일 실시예에 따라 웹사이트에 부여되는 등급을 설명하기 위한 도면이다.
도 9는 본 발명의 일 실시예에 따라 웹사이트의 위험도를 산출하는 방법을 설명하기 위한 흐름도이다.
도 10은 본 발명의 또 다른 실시예에 따른 웹사이트 위험도 산출 장치를 설명하기 위한 기능 블록도이다.
1 is a functional block diagram illustrating a web site risk calculation apparatus according to an embodiment of the present invention.
FIG. 2 is a view for explaining a process of assigning a score corresponding to a risk factor included in a web page according to an embodiment of the present invention.
3 is a diagram for explaining a hierarchical structure of a Web site to be inspected according to an embodiment of the present invention.
4 is a view for explaining risk score information corresponding to hierarchical information of a web page according to an embodiment of the present invention.
5 is a view for explaining a method of assigning a risk score corresponding to connection information of a web page according to an embodiment of the present invention.
6 is a diagram for explaining a process of calculating a risk of a web page according to an embodiment of the present invention.
7 is a diagram illustrating a process of calculating a risk of a web site including a plurality of web pages according to an embodiment of the present invention.
FIG. 8 is a view for explaining a rating given to a web site according to an embodiment of the present invention.
9 is a flowchart illustrating a method of calculating a risk of a web site according to an embodiment of the present invention.
10 is a functional block diagram illustrating a web site risk calculation apparatus according to another embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 게시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. BRIEF DESCRIPTION OF THE DRAWINGS The advantages and features of the present invention, and the manner of achieving them, will be apparent from and elucidated with reference to the embodiments described hereinafter in conjunction with the accompanying drawings. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. Rather, these embodiments are provided so that this disclosure will be thorough and complete, and will fully convey the scope of the invention to those skilled in the art. To fully disclose the scope of the invention to those skilled in the art, and the invention is only defined by the scope of the claims. Like reference numerals refer to like elements throughout the specification.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless defined otherwise, all terms (including technical and scientific terms) used herein may be used in a sense commonly understood by one of ordinary skill in the art to which this invention belongs. Also, commonly used predefined terms are not ideally or excessively interpreted unless explicitly defined otherwise.

또한, 본 명세서에서 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함될 수 있다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.Also, the singular forms herein may include plural forms unless specifically stated in the text. It is noted that the terms "comprises" and / or "comprising" used in the specification are intended to be inclusive in a manner similar to the components, steps, operations, and / Or additions.

먼저, 본 명세서에서 사용되는 용어들을 정의하도록 한다.First, let us define the terms used in this specification.

웹사이트(Web Site) : 인터넷 프로토콜 기반의 네트워크에서 도메인 이름이나 IP 주소, 루트 경로만으로 이루어진 일반 URL을 통하여 보여지는 웹페이지(Web page)들의 의미 있는 묶음이다.Web Site: This is a meaningful bundle of Web pages that are displayed through a generic URL consisting of a domain name, an IP address, and a root path in an Internet Protocol-based network.

웹페이지(Web Page) : 웹사이트를 구성하는 각각의 페이지들을 의미한다.Web Page: It refers to each page constituting the Web site.

웹컨텐츠 (Web Contents) : 웹페이지에 포함된 다양한 텍스트, 그림, 소리 동영상 파일 등을 의미한다.Web Contents: It refers to various texts, pictures, sound video files included in web pages.

도 1은 본 발명의 일 실시예에 따른 웹사이트 위험도 산출 장치를 설명하기 위한 기능 블록도이다.1 is a functional block diagram illustrating a web site risk calculation apparatus according to an embodiment of the present invention.

도 1에 도시된 웹사이트 위험도 산출 장치(100)는 수집부(110), 검사부(120) 및 위험도 계산부(130)를 포함한다.The web site risk calculation apparatus 100 shown in FIG. 1 includes a collection unit 110, an inspection unit 120, and a risk calculation unit 130.

수집부(110)는 점검 대상 웹사이트에 포함된 웹컨텐츠를 수집한다. 본 발명의 일 실시예에 따른 수집부(110)는 복수의 점검 대상 웹사이트 URL을 크롤러(Crawler)에게 할당하여 점검 대상 웹사이트에 포함된 웹컨텐츠를 수집할 수 있다. 때, 크롤러는 기 설정된 우선 순위에 따라 웹페이지에 포함된 웹컨텐츠를 수집할 수 있다.The collection unit 110 collects web contents included in the check target website. The collecting unit 110 according to an embodiment of the present invention can collect a plurality of web sites URLs to be checked to a crawler to collect web contents included in the web sites to be checked. , The crawler can collect the web content included in the web page according to the predetermined priority.

검사부(120)는 수집된 웹컨텐츠가 악성 스크립트, HTML 취약 태그 및 블랙리스트 URL 중 적어도 하나를 포함하는지에 대한 검사를 수행한다.The inspection unit 120 checks whether the collected web content includes at least one of a malicious script, an HTML vulnerable tag, and a blacklist URL.

본 발명의 일 실시예에 따른 검사부(120)는 악성 스크립트 포함 여부를 확인하기 위해 수집된 웹컨텐츠에 대한 문서 객체 모델(DOM : Document Object Model)을 생성하고 이를 이용하여 악성 스크립트가 포함되어 있는지 여부를 검사할 수 있다.The inspection unit 120 according to an embodiment of the present invention generates a document object model (DOM) for collected web contents to check whether malicious script is included and determines whether malicious script is included . ≪ / RTI >

구체적으로, DOM 정보로부터 해쉬값을 추출하고 이를 기 저장된 해쉬값과 비교하여 DOM 정보로부터 추출된 해쉬값이 기 저장된 해쉬값과 상이하다고 판단되면 웹컨텐츠에 악성 스크립트가 포함된 것으로 결정할 수 있다.Specifically, if the hash value is extracted from the DOM information and compared with the previously stored hash value, if it is determined that the hash value extracted from the DOM information is different from the previously stored hash value, it can be determined that the malicious script is included in the web content.

검사부(120)는 상술한 문서 객체 모델에서 태그 정보를 추출하여 HTML 취약 태그가 웹컨텐츠에 포함되어 있는지 여부도 확인할 수 있다. 구체적으로, 기 저장된 HTML 악성 태그의 시그니처와 문서 객체 모델에서 추출된 태그 정보와의 비교를 통해 HTML 취약 태그가 존재하는지 여부를 확인할 수 있다.The inspection unit 120 extracts the tag information from the document object model and can check whether the HTML weak tag is included in the web content. Specifically, it is possible to confirm whether or not the HTML vulnerable tag exists by comparing the signature of the previously stored HTML malicious tag with the tag information extracted from the document object model.

또한, 검사부(120)는 기 정된 블랙리스트 URL 정보와 웹컨텐츠에서 추출된 URL 정보를 비교하여 웹컨텐츠가 블랙리스에 등재된 URL을 포함하는지 여부에 대한 검사도 수행할 수 있다.In addition, the checking unit 120 may compare the black list URL information with the URL information extracted from the web content to check whether the web content includes the URL registered in the black list.

다만, 검사부(120)에서 수행될 수 있는 검사는 이에 한정되지 않으며 스크립트 정적 분석 검사, 행위 분석 검사 등 다른 검사가 추가적으로 수행될 수도 있다.However, the inspection that can be performed by the inspection unit 120 is not limited to this, and other tests such as script static analysis, behavior analysis, and the like may be additionally performed.

웹페이지 위험도 계산부(130)부는 웹페이지에 포함된 위험 요인, 웹컨텐츠의 계층 정보 및 웹컨텐츠가 포함된 웹페이지 연결 정보 중 적어도 하나의 정보를 이용하여 웹페이지의 위험도를 계산할 수 있다.The web page risk calculation unit 130 may calculate the risk of the web page using at least one of the risk factors included in the web page, the hierarchical information of the web content, and the web page connection information including the web content.

웹페이지 위험도 계산부(130)가 상술한 정보를 이용하여 웹페이지의 위험도를 계산하는 구체적인 방법은 이하에서 상세하게 설명하도록 한다.A concrete method of calculating the risk of a web page by using the above-described information by the web page risk calculation unit 130 will be described in detail below.

도 2는 본 발명의 일 실시예에 따라 웹페이지에 포함된 위험 요인에 대응되는 점수를 부여하는 과정을 설명하기 위한 도면이다.FIG. 2 is a view for explaining a process of assigning a score corresponding to a risk factor included in a web page according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 웹사이트 위험도 검사 장치(100)는 위험 요인에 대응되는 스코어 정보를 저장하는 저장부(미도시)를 더 포함할 수 있다. The web site risk checking apparatus 100 according to an exemplary embodiment of the present invention may further include a storage unit (not shown) for storing score information corresponding to a risk factor.

예를 들어, 검사부(120)가 임의의 웹페이지에 대해 위험도 검사를 수행한 결과 그 웹페이지에 포함된 웹컨텐츠가 블랙리스트에 등재된 URL을 포함한다고 판단된 경우, 그에 대응되는 위험도 점수를 부여할 수 있다.For example, if the inspection unit 120 determines that the web content included in the web page includes a URL registered in the black list as a result of performing a risk check on an arbitrary web page, the corresponding risk score is assigned can do.

본 실시예에서 블랙리스트 URL 검사에 대응되는 위험도 점수가 “40점”이므로 위험 요인과 관련해서는 위험도 점수”40”점이 부여될 수 있다.In the present embodiment, since the risk score corresponding to the blacklist URL test is " 40 points ", a risk score " 40 "

한편, 검사부(120)가 하나의 웹페이지에 대해 검사를 수행 결과, 그 웹페이지에 복수의 위험 요인이 포함되어 있는 경우가 있을 수 있다. 예를 들어, 하나의 웹페이지에 HTML 취약 태그를 포함하는 웹컨텐츠 및 블랙리스트에 등재된 URL을 포함하는 웹컨텐츠가 포함되어 있는 경우가 있을 수 있다.Meanwhile, as a result of the inspection unit 120 performing a check on one web page, there may be a case where a plurality of risk factors are included in the web page. For example, one web page may include web content including HTML fragile tags and web content including blacklisted URLs.

이 경우, 본 발명의 일 실시예에 따른 웹사이트 위험도 계산부(130)는 위험 요인에 대응되는 복수의 스코어들을 합산하여 위험 요인과 관련된 위험도 점수를 산출할 수 있다.In this case, the web site risk calculation unit 130 according to an embodiment of the present invention may calculate a risk score related to a risk factor by summing a plurality of scores corresponding to the risk factors.

예를 들어, “HTML 취약 태그”에 대응되는 “40”점과 “블랙리스트 URL”에 대응되는 “10”점을 합산하여 “50점”을 위험 요인과 관련한 위험도 점수로 부여할 수 있다.For example, a score of "40" corresponding to "HTML Vulnerable Tag" and a score of "10" corresponding to "Blacklist URL" may be added together to give "50 points" as a risk score related to a risk factor.

웹페이지 위험도 계산부(130)는 웹페이지에 포함된 위험 요인에 대응되는 위험도 점수를 부여할 수 있을 뿐만 아니라, 위험 요인이 포함된 웹컨텐츠를 포함하는 웹페이지의 위치에 따라 위험도 점수를 부여할 수도 있다.The web page risk calculator 130 can not only assign a risk score corresponding to the risk factors included in the web page but also assign a risk score according to the position of the web page including the web content including the risk factors It is possible.

도 3은 본 발명의 일 실시예에 따라 검사 대상 웹사이트의 계층 구조를 설명하기 위한 도면이다.3 is a diagram for explaining a hierarchical structure of a Web site to be inspected according to an embodiment of the present invention.

웹사이트는 도 3에 도시된 바와 같이 계층적 구조를 가질 수 있다. 제1 계층 웹페이지(310)는 사용자가 웹사이트의 대표 URL로 접속했을 때 보여지는 웹페이지이다.The web site may have a hierarchical structure as shown in Fig. The first layer web page 310 is a web page displayed when the user accesses the representative URL of the web site.

제2 계층의 웹페이지들(320)은 제1 계층 웹페이지(310)를 통해 접속될 수 있는 웹페이지들이다. 예를 들어, 사용자가 대표 URL을 입력하여 제1 계층 웹페이지(310)에 접속한 후, 제1 계층 웹페이지(310)에 포함된 링크를 통해 제2 계층 웹페이지들(320) 중 하나의 웹페이지에 연결될 수 있다.The second layer of web pages 320 are web pages that can be accessed through the first layer web page 310. For example, after a user accesses the first layer web page 310 by inputting a representative URL, one of the second layer web pages 320 through the link included in the first layer web page 310 Can be linked to a web page.

제3 계층의 웹페이지들(330)은 제2 계층 웹페이지들(320)을 통해 접속될 수 있는 웹페이지들이다. 마찬가지로, 제3 계층 웹페이지들(330)은 제2 계층 웹페이지(320)들에 포함된 링크 등을 통해 연결될 수 있다.The third tier web pages 330 are web pages that can be accessed through the second tier web pages 320. Likewise, the third layer web pages 330 may be linked through links included in the second layer web pages 320, and so on.

본 발명의 일 실시예에 따른 웹페이지 위험도 계산부(130)는 상술한 웹페이지의 계층적 구조를 고려하여, 위험 요인이 검출된 웹페이지의 계층별로 서로 다른 위험도 점수를 부여할 수 있다.The web page risk calculation unit 130 according to an embodiment of the present invention may assign different risk scores to each hierarchy of web pages in which the risk factors are detected in consideration of the hierarchical structure of the web pages.

*상위 계층에 속한 웹페이지일수록 사용자의 접속 빈도가 높아지고, 하위 계층에 속한 웹페이지일수록 사용자의 접속 빈도가 낮아지기 때문이다.* The more frequently a web page belongs to the upper layer, the higher the frequency of access to the user, and the lower the frequency of access to a web page belonging to a lower layer.

이를 위해 본 발명의 일 실시예에 따른 웹사이트 위험도 산출 장치는 위험 요인이 포함된 웹페이지의 계층 정보에 대응되는 위험도 점수 정보를 저장하고 있을 수 있다.To this end, the web site risk calculation apparatus according to an embodiment of the present invention may store risk score information corresponding to hierarchical information of a web page including a risk factor.

도 4는 본 발명의 일 실시예에 따른 웹페이지의 계층 정보에 대응되는 위험도 점수 정보를 설명하기 위한 도면이다.4 is a view for explaining risk score information corresponding to hierarchical information of a web page according to an embodiment of the present invention.

도 4에 도시된 위험도 점수 정보에서 “1 계층”은 사용자가 대표 URL을 통해 웹사이트에 접속했을 때 표시되는 웹페이지이다. 즉, 사용자의 접속 빈도가 높은 웹페이지이므로 가장 높은 위험도 점수가 부여된다. 반면, 하위 계층에 속한 웹페이지들은 상위 계층의 웹페이지들을 통해 접속되는 웹페이지들이므로 하위 계층에 속한 웹페이지일수록 낮은 점수가 부여된다.In the risk score information shown in Fig. 4, " one layer " is a web page displayed when a user accesses a web site through a representative URL. That is, the highest risk score is given because it is a web page having a high frequency of user access. On the other hand, since web pages belonging to a lower layer are web pages accessed through web pages of an upper layer, a lower score is given to a web page belonging to a lower layer.

예를 들어, HTML 취약 태그가 포함된 웹컨텐츠가 위치하는 웹페이지가 “3 계층”에 속한다면, 그 웹페이지에는 그에 대응되는 위험도 점수 “2.5”점이 부여된다. 반면, HTML 취약 태그가 포함된 웹컨텐츠가 위치하는 웹페이지가 “5 계층” 이상이라면, 그 웹페이지에는 “0.625”점의 위험도 점수가 부여된다.For example, if the web page in which the web content containing the HTML vulnerable tag is located belongs to the " three-tier ", that web page is assigned a risk score of " 2.5 " On the other hand, if the web page in which the web content containing the HTML vulnerable tag is located is more than " five layers ", a risk score of " 0.625 "

또한, 본 발명의 일 실시예에 따른 웹페이지 위험도 계산부(130)는 웹페이지의 연결 정보를 이용하여 위험도 점수를 부여할 수도 있다.Also, the web page risk calculation unit 130 according to an embodiment of the present invention may assign a risk score using the connection information of the web page.

도 5는 본 발명의 일 실시예에 따라 웹페이지의 연결 정보에 대응되는 위험도 점수를 부여하는 방법을 설명하기 위한 도면이다.5 is a view for explaining a method of assigning a risk score corresponding to connection information of a web page according to an embodiment of the present invention.

여기에서 웹페이지의 연결 정보란, 특정 웹페이지에 대하여 그 웹페이지에 유입될 수 있는 경로 수를 의미한다. 예를 들어, 동일한 웹사이트의 다른 웹페이지를 통해 연결될 수 있는 경로 수, 다른 웹사이트를 통해 연결될 수 있는 경로 수를 합산한 것일 수 있다. 상술한 웹페이지 연결 정보는 문서 연결 구조 분석을 통해 측정될 수 있다.Here, the connection information of a web page refers to the number of paths that can flow into a web page for a specific web page. For example, the number of paths that can be connected through other Web pages of the same Web site, and the number of paths that can be connected through other Web sites may be added. The web page connection information described above can be measured through analysis of the document connection structure.

특정 웹페이지에 유입될 수 있는 경로 수가 많을수록 사용자가 그 웹페이지에 접속할 가능성이 크므로 높은 위험도 점수가 부여되고, 경로 수가 적은 경우 사용자가 그 웹페이지 접속할 가능성이 낮으므로 낮은 위험도 점수가 부여된다.The higher the number of paths that can be introduced to a specific web page, the higher the risk score is given because the user is more likely to access the web page. If the number of paths is small, the user is less likely to access the web page.

이에, 본 발명의 일 실시예에 따른 웹사이트 위험도 산출 장치(100)는 웹사이트의 연결 정보에 대응되는 위험도 점수 정보를 기 저장하고 있을 수 있다. 예를 들어, 임의의 웹페이지에 연결될 수 있는 경로수가 1~2개인 경우 상대적으로 낮은 위험도 점수인 “1점”이 부여되고, 경로수가 11개 이상인 경우 상대적으로 높은 위험도 점수인 “11점”이 부여되도록 할 수 있다.Accordingly, the web site risk calculation apparatus 100 according to an embodiment of the present invention may store risk score information corresponding to connection information of a web site. For example, a relatively low risk score of "1 point" is given when there are one or two paths that can be connected to an arbitrary web page, and a relatively high risk score of "11 points" .

이하에서는, 상술한 과정을 거쳐 특정 부여된 위험도 점수를 이용하여 웹페이지별 위험도를 산출하는 과정을 설명하도록 한다.Hereinafter, the process of calculating the risk level for each web page using the risk score given through the above-described process will be described.

도 6은 본 발명의 일 실시예에 따라 웹페이지의 위험도를 산출하는 과정을 설명하기 위한 도면이다.6 is a diagram for explaining a process of calculating a risk of a web page according to an embodiment of the present invention.

본 실시예에서는 임의의 웹페이지(610)가 HTML 취약 태그 및 블랙리스트에 등재된 URL을 포함하는 웹컨텐츠를 포함하는 것을 예로 들어 설명한다. 또한, 임의의 웹페이지(610)는 도 6에 도시된 바와 같이 “제2 계층”에 속하며 이에 접속할 수 있는 경로 수는 5인 경우를 예로 들어 설명한다.In the present embodiment, an example is described in which an arbitrary web page 610 includes web contents including URLs registered in the HTML vulnerable tag and the black list. In addition, the arbitrary web page 610 belongs to the " second layer " as shown in FIG. 6, and the number of paths that can be connected to the web page 610 is five.

임의의 웹페이지(610)에 대해 검사부(120)가 검사를 수행하면 “HTML 취약 태그” 및 “블랙리스트 URL”이 위험 요인으로 검출된다. 이에, 본 발명의 일 실시예에 따른 웹사이트 위험도 산출 장치(100)는 위험 요인에 대응되는 위험도 점수 정보를 기 저장하고 있으므로, “HTML 취약 태그”에 대응되는 위험도 점수 “10점”과 “블랙리스트 URL”에 대응되는 “40”점을 합산한 “50점”을 부여한다.When the inspection section 120 performs an inspection on an arbitrary web page 610, an " HTML vulnerable tag " and a " blacklist URL " are detected as a risk factor. Accordingly, since the web site risk calculation device 100 according to the embodiment of the present invention stores the risk score information corresponding to the risk factors, the risk score " 10 points " corresponding to "Quot; 50 points " obtained by adding " 40 " points corresponding to " list URL "

또한, 위험 요인이 검출된 임의의 페이지(610)가 “제2 계층”에 속하는 웹페이지이므로 도 4에 도시된 정보를 이용하여 “5점”을 부여한다.In addition, since the arbitrary page 610 in which the risk factor is detected is the web page belonging to the " second layer ", " 5 points "

마지막으로, 임의의 웹페이지(610)에 접속할 수 있는 경로의 수가 5라고 하였으므로, 도 5에 도시된 정보를 이용하여 “2점”을 부여한다.Lastly, since the number of paths that can be connected to an arbitrary web page 610 is 5, " 2 points " is given using the information shown in Fig.

본 발명의 일 실시예에 따른 웹페이지 위험도 계산부(130)는 상술한 과정을 거쳐 부여된 위험도 점수를 곱하여 임의의 웹페이지(610)에 대한 위험도를 계산한다.The web page risk calculator 130 according to an embodiment of the present invention calculates the risk for an arbitrary web page 610 by multiplying the risk score given through the process described above.

이를 수식으로 나타내면 다음과 같다.The equation is expressed as follows.

Figure 112015110210072-pat00001
Figure 112015110210072-pat00001

따라서, 도 6에 도시된 임의의 웹페이지에 대한 위험도는 50 X 5 X 2 = 500점으로 계산된다.Therefore, the risk for any web page shown in FIG. 6 is calculated as 50 X 5 X 2 = 500 points.

다만, 본 실시예에서는 도 2 내지 도 5에서 설명한 위험도 점수를 곱하여 웹페이지에 대한 위험도를 산출하는 것을 예로 들어 설명하였으나 이에 한정하지 않으며, 위험도 점수를 합산하거나, 위험도 점수에 가중치를 부여한 결과값을 합산하는 방식 등으로 산출하도록 구현할 수도 있다.However, the present invention is not limited to this. For example, the risk score may be added to the web page, or the risk score may be weighted. And a method of summing them.

상술한 과정을 거쳐 웹페이지 각각에 대한 위험도가 산출되면 이를 이용하여 복수의 웹페이지들의 집합은 웹사이트에 대한 위험도도 산출할 수 있게 된다.When the risk for each web page is calculated through the above-described process, a plurality of sets of web pages can calculate the risk for the web site.

도 7은 본 발명의 일 실시예에 따라 복수의 웹페이지를 포함하는 웹사이트의 위험도를 산출하는 과정을 설명하기 위한 도면이다.7 is a diagram illustrating a process of calculating a risk of a web site including a plurality of web pages according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 웹사이트 위험도 산출 장치(100)는 웹사이트의 위험도를 결정하는 웹사이트 위험도 계산부(미도시)를 더 포함할 수 있다.The web site risk calculation apparatus 100 according to an embodiment of the present invention may further include a web site risk calculation unit (not shown) for determining a risk of a web site.

도 1 내지 도 6에서 설명한 과정을 통해 웹사이트를 구성하는 복수의 웹페이지 각각에 대한 위험도가 계산되면 웹사이트 위험도 계산가 이를 이용하여 웹사이트의 위험도를 계산할 수 있다.When the risk for each of the plurality of web pages constituting the web site is calculated through the processes described in Figs. 1 to 6, the web site risk calculator can calculate the risk of the web site using the calculated risk.

구체적으로, 웹사이트의 위험도는 다음과 같은 수식을 통해 산출될 수 있다.Specifically, the risk of a web site can be calculated through the following equation.

Figure 112015110210072-pat00002
Figure 112015110210072-pat00002

Figure 112015110210072-pat00003
Figure 112015110210072-pat00003

여기에서, MRI(Max Risk Item)란 웹페이지에 대해 부여된 위험도 점수 중 가장 높은 위험도 점수를 의미한다.Here, the MRI (Max Risk Item) means the highest risk score among the risk scores given for the web page.

예를 들어, 위험 요인과 관련한 위험도 점수에서 제1 웹페이지에 “50점”이 부여되고 제2 웹페이지에 “30점”이 부여되었으며 제3 웹페이지에 “70점”이 부여되었다면, 위험 요인과 관련된 MRI는 “70 점”이 된다.For example, if the first web page is given "50 points" and the second web page is given "30 points" and the third web page is given "70 points" in the risk score associated with the risk factor, The MRI associated with the " 70 points ".

마찬가지로, 위치 정보와 관련한 위험도 점수에서 제1 웹페이지에 “10점”이 부여되고 제2 웹페이지에 “2.5”점이 부여되었으며 제3 웹페이지에 “5점”이 부여되었다면, 위치 정보와 관련된 MRI는 “10점”이 된다.Likewise, if "10 points" is assigned to the first web page, "2.5" points are assigned to the second web page, and "5 points" are assigned to the third web page in the risk score associated with the location information, Becomes " 10 points ".

연결 정보와 관련한 위험도 점수에서도 1 웹페이지에 “1”점이 부여되고 제2 웹페이지에 “3점”이 부여되었으며 제3 웹페이지에 “2”점에 부여되었다면 연결 정보와 관련된 MRI는 “3점”이 된다.If the risk score associated with the connection information is given a "1" point on one web page, a "three point" on the second web page, and a "2" point on the third web page, ".

따라서, MRI 점수의 총합은 위험 요인과 관련하여 웹페이지에 부여된 최대 위험도 점수, 위치 정보와 관련하여 웹페이지에 부여된 최대 위험도 점수 및 연결 정보와 관련하여 웹페이지에 부여된 최대 위험도 점수를 합산한 점수를 의미한다.Thus, the sum of the MRI scores is the sum of the maximum risk score assigned to the web page in relation to the risk factor, the maximum risk score assigned to the web page in relation to the location information, and the maximum risk score assigned to the web page in connection with the connection information It means one score.

또한, 수학식 2에서 분모에 들어가는 “위험 요인에 할당된 최대 점수”는 위험 요인과 관련하여 부여될 수 있는 최대 위험도 점수를 의미한다. 관련하여, 도 7을 살펴보면 위험 요인과 관련하여 부여될 수 있는 최대 위험도 점수(710)는 “40점”임을 알 수 있다.Also, the " maximum score assigned to a risk factor " in the denominator in Equation 2 means the maximum risk score that can be given in relation to the risk factor. Referring to FIG. 7, it can be seen that the maximum risk score 710 that can be given in relation to the risk factor is " 40 points ".

마찬가지로, 위치 정보와 관련하여 부여될 수 있는 최대 위험도 점수(720)는 “10점”, 연결 정보와 관련하여 부여될 수 있는 최대 위험도 점수(730)는 “4점”임을 알 수 있다.Similarly, it can be seen that the maximum risk score 720 that can be given in relation to the position information is "10 points", and the maximum risk score 730 that can be given in connection with the connection information is "4 points".

한편, 수학식 2를 통해 계산된 웹사이트 위험도는 그 웹사이트에 대해 과거에 산출된 위험도를 반영하여 새로운 위험도를 산출할 수도 있다. 예를 들어, 과거에 산출된 위험도에 따라 그에 대응되는 가중치를 반영하여 새로운 위험도를 산출할 수 있다.On the other hand, the web site risk calculated through Equation (2) may be used to calculate a new risk by reflecting the risk calculated in the past for the web site. For example, a new risk can be calculated by reflecting the corresponding weight according to the risk calculated in the past.

상술한 과정을 거쳐 웹사이트에 대한 위험도가 계산되면 그 결과에 따라 웹사이트의 위험도에 대응되는 등급을 부여할 수 있다.If the risk of a website is calculated through the above-described process, a rating corresponding to the risk of the web site can be given according to the result.

도 8은 본 발명의 일 실시예에 따라 웹사이트에 부여되는 등급을 설명하기 위한 도면이다.FIG. 8 is a view for explaining a rating given to a web site according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 웹사이트 위험도 산출 장치(100)는 도 7에서 산출된 웹사이트의 위험도에 따라 그에 대응되는 등급을 부여할 수 있다. 이에, 웹사이트 위험도 산출 장치(100)는 도 8에 도시된 등급 정보를 기 저장하고 있을 수 있다.The web site risk calculation apparatus 100 according to an embodiment of the present invention may assign a rating corresponding to the risk of the web site calculated in Fig. Accordingly, the web site risk calculation apparatus 100 may store the rating information shown in Fig.

다만, 등급이 부여되는 기준은 도 8에 도시된 바에 한정되지 않으며 보다 다양한 등급이 보다 세부적인 기준의 의해 부여되도록 구현할 수도 있다.However, the criterion to which the class is assigned is not limited to that shown in FIG. 8, and a more various class may be implemented by a more detailed criterion.

도 9는 상술한 본 발명의 일 실시예에 따라 웹사이트 위험도를 산출하는 방법을 설명하기 위한 도면이다.9 is a view for explaining a method for calculating a web site risk according to an embodiment of the present invention.

수집부(110)는 점검 대상 웹사이트에 포함된 웹컨텐츠를 수집한다(S910). 구체적으로, 크롤러에게 복수의 웹사이트들 대한 URL을 할당하여 웹컨텐츠를 수집할 수 있다.The collecting unit 110 collects the web contents included in the inspection target website (S910). Specifically, the crawler can collect a web content by assigning URLs of a plurality of websites.

수집부(110)가 웹컨텐츠를 수집하면, 검사부(120)는 웹컨텐츠가 위험 요인에 해당하는 악성 스크립트, HTML 취약 태크 및 블랙리스트 URL 중 적어도 하나를 포함하는지에 대한 검사를 수행한다(S920).When the collecting unit 110 collects web content, the checking unit 120 checks whether the web content includes at least one of a malicious script corresponding to a risk factor, an HTML vulnerable tag, and a blacklist URL (S920) .

상기 웹컨텐츠에 포함된 위험 요인, 상기 웹컨텐츠가 포함된 웹페이지의 계층 정보 및 상기 웹컨텐츠가 포함된 웹페이지의 연결 정보 중 적어도 하나를 이용하여 상기 웹페이지의 위험도를 계산한다(S930). 상술한 정보를 이용하여 웹페이지의 위험도를 계산하는 구체적인 방법은 도 2 내지 도 6에서 상세하게 셜명하였으므로 중복되는 설명은 생략하도록 한다.In operation S930, the risk of the web page is calculated using at least one of the risk factors included in the web content, the hierarchical information of the web page including the web content, and the connection information of the web page including the web content. The specific method of calculating the risk of a web page using the above-described information has been described in detail with reference to FIG. 2 to FIG. 6, so that redundant description will be omitted.

도 10은 본 발명의 또 다른 실시예에 따른 웹사이트 위험도 산출 장치를 설명하기 위한 도면이다.10 is a view for explaining a web site risk calculation apparatus according to another embodiment of the present invention.

도 10에 도시된 웹사이트 위험도 산출 장치(1000)는 프로세서(1010), 스토리지(1020), 메모리(1030), 네트워크 인터페이스(1040) 및 버스(1050)을 포함한다.The web site risk calculation apparatus 1000 shown in FIG. 10 includes a processor 1010, a storage 1020, a memory 1030, a network interface 1040, and a bus 1050.

프로세서(1010)은 웹사이트 위험도 산출 프로그램을 실행한다. 그러나, 프로세서(1010)에서 실행될 수 있는 프로그램은 이에 한정되지 않으며 다른 범용적인 프로그램이 실행될 수도 있다.The processor 1010 executes a website risk calculation program. However, the program that can be executed in the processor 1010 is not limited thereto, and other general-purpose programs may be executed.

스토리지(1020)는 웹사이트 위험도 산출 프로그램을 저장한다. 또한, 위험 요인에 대응되는 위험도 점수, 웹페이지의 계층 정보에 대응되는 위험도 점수 및 웹페이지의 연결 정보에 대응되는 위험도 점수에 관한 정보가 스토리지(1020)에 저장될 수도 있다.Storage 1020 stores a website risk calculation program. Information about the risk score corresponding to the risk factor, the risk score corresponding to the hierarchical information of the web page, and the risk score corresponding to the connection information of the web page may be stored in the storage 1020.

한편, 스토리지(1020)에 저장된 웹사이트 위험도 산출 프로그램은, 점검 대상 웹사이트에 포함된 웹컨텐츠를 수집하는 단계, 상기 웹컨텐츠가 위험 요인에 해당하는 악성 스크립트, HTML 취약 태그 및 블랙리스트 URL 중 적어도 하나를 포함하는지에 대한 검사를 수행하는 단계, 상기 웹컨텐츠에 포함된 위험 요인, 상기 웹컨텐츠가 포함된 웹페이지의 계층 정보 및 상기 웹컨텐츠가 포함된 웹페이지의 연결 정보 중 적어도 하나를 이용하여 상기 웹페이지의 위험도를 계산하는 단계를 수행한다.On the other hand, the web site risk calculation program stored in the storage 1020 includes a step of collecting web content included in the check target web site, a step of obtaining at least one of malicious script, HTML vulnerable tag, Checking at least one of the risk factors included in the web content, the hierarchical information of the web page including the web content, and the connection information of the web page including the web content, The step of calculating the risk of the web page is performed.

*메모리(1030)는 웹사이트 위험도 산출 프로그램을 로딩한다. 메모리(1030)에 로딩된 웹사이트 위험도 산출 프로그램은 프로세서(1010)에 의해 실행된다.The memory 1030 loads the website risk calculation program. The website risk calculation program loaded into the memory 1030 is executed by the processor 1010. [

네트워크 인터페이스(1040)에는 다른 컴퓨팅 장치가 연결될 수 있고, 버스(1050)는 상술한 프로세서(1010), 스토리지(1020), 메모리(1030) 및 네트워크 인터페이스(1040) 등이 연결되는 데이터 이동 통로로서의 역할을 수행한다.Other computing devices may be connected to the network interface 1040 and the bus 1050 may serve as a data movement path through which the processor 1010, the storage 1020, the memory 1030, and the network interface 1040 described above are connected .

한편, 상술한 방법은 컴퓨터에서 실행될 수 있는 프로그램으로 작성 가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상술한 방법에서 사용된 데이터의 구조는 컴퓨터로 읽을 수 있는 기록매체에 여러 수단을 통하여 기록될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록매체는 마그네틱 저장매체(예를 들면, 롬, 플로피 디스크, 하드 디스크 등), 광학적 판독 매체(예를 들면, 시디롬, 디브이디 등)와 같은 저장매체를 포함한다.Meanwhile, the above-described method can be implemented in a general-purpose digital computer that can be created as a program that can be executed by a computer and operates the program using a computer-readable recording medium. In addition, the structure of the data used in the above-described method can be recorded on a computer-readable recording medium through various means. The computer-readable recording medium includes a storage medium such as a magnetic storage medium (e.g., ROM, floppy disk, hard disk, etc.), optical reading medium (e.g., CD ROM,

본 실시예와 관련된 기술 분야에서 통상의 지식을 가진 자는 상기된 기재의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 방법들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. Therefore, the disclosed methods should be considered from an illustrative point of view, not from a restrictive point of view. The scope of the present invention is defined by the appended claims rather than by the foregoing description, and all differences within the scope of equivalents thereof should be construed as being included in the present invention.

Claims (14)

점검 대상 웹사이트에 포함된 웹컨텐츠를 수집하는 단계;
상기 웹컨텐츠가 위험 요인에 해당하는 악성 스크립트, HTML 취약 태그 및 블랙리스트 URL 중 적어도 하나를 포함하는지에 대한 검사를 수행하는 단계;
상기 웹컨텐츠에 포함된 위험 요인, 상기 웹컨텐츠가 포함된 웹페이지의 계층 정보 및 상기 웹컨텐츠가 포함된 웹페이지의 연결 정보 중 적어도 하나를 이용하여 상기 웹페이지의 위험도를 계산하는 단계; 및
복수의 웹페이지들에 부여된 위험 요인 관련 위험도 점수 중 최대 위험도 점수, 복수의 웹페이지들에 부여된 계층 정보 관련 위험도 점수 중 최대 위험도 점수 및 복수의 웹페이지들에 부여된 연결 정보 관련 위험도 점수 중 최대 위험도 점수를 합산한 값을 위험 요인에 부여될 수 있는 최대 위험도 점수, 계층 정보에 부여될 수 있는 최대 위험도 점수 및 연결 정보에 부여될 수 있는 최대 위험도 점수를 합산한 값으로 나눈 값을 상기 복수의 웹페이지들로 구성된 웹사이트 위험도로 결정하는 단계를 포함하는 웹사이트 위험도 산출 방법.
Collecting web contents included in a check target website;
Performing a check as to whether the web content includes at least one of a malicious script corresponding to a risk factor, an HTML vulnerable tag, and a blacklist URL;
Calculating a risk of the web page by using at least one of a risk factor included in the web content, a hierarchy information of the web page including the web content, and a connection information of the web page including the web content; And
The highest risk score among the risk factors related to the plurality of web pages, the highest risk score among the risk information related to the hierarchical information related to the plurality of web pages, and the risk information related to the connection information given to the plurality of web pages A value obtained by dividing the sum of the maximum risk scores by a maximum risk score that can be given to the risk factors, a maximum risk score that can be given to the hierarchical information, and a maximum risk score that can be given to the connection information, Determining a web site risk consisting of web pages of the web site.
제1항에 있어서,
상기 웹페이지의 위험도를 계산하는 단계는,
상기 웹컨텐츠에 포함된 위험 요인에 대응되는 기 설정된 위험도 점수를 부여하는 단계;
웹페이지의 계층적 구조에서 상기 웹컨텐츠가 포함된 웹페이지의 계층 정보에 대응되는 기 설정된 위험도 점수를 부여하는 단계; 및
상기 웹컨텐츠가 포함된 웹페이지의 연결 정보에 대응되는 위험도 점수를 부여하는 단계를 포함하는 웹사이트 위험도 산출 방법.
The method according to claim 1,
Wherein the step of calculating the risk of the web page comprises:
Providing a predetermined risk score corresponding to a risk factor included in the web content;
Providing a predetermined risk score corresponding to hierarchical information of a web page including the web content in a hierarchical structure of the web page; And
And providing a risk score corresponding to the connection information of the web page including the web content.
제2항에 있어서,
상기 웹컨텐츠에 포함된 위험 요인에 대응되는 기 설정된 위험도 점수를 부여하는 단계는,
상기 웹컨텐츠에 포함된 위험 요인이 복수개인 경우, 각 위험 요인에 대응되는 기 설정된 위험도 점수를 합산하는 단계를 포함하는 웹사이트 위험도 산출 방법.
3. The method of claim 2,
Wherein the step of assigning a predetermined risk score corresponding to a risk factor included in the web content comprises:
And summing predetermined risk scores corresponding to the respective risk factors when a plurality of risk factors included in the web content are included.
제2항에 있어서,
상기 웹페이지의 위험도를 계산하는 단계는,
상기 위험 요인에 대응하여 부여된 점수, 상기 계층 정보에 대응하여 부여된 점수 및 상기 연결 정보에 대응하여 부여된 점수를 곱하여 상기 웹페이지에 대한 위험도를 산출하는 단계를 포함하는 웹사이트 위험도 산출 방법.
3. The method of claim 2,
Wherein the step of calculating the risk of the web page comprises:
Calculating a risk value for the web page by multiplying a score given in response to the risk factor, a score given in correspondence with the hierarchical information, and a score given in correspondence with the connection information.
삭제delete 제1항에 있어서,
상기 웹사이트 위험도에 대응되는 등급을 상기 웹사이트에 부여하는 단계를 더 포함하는 웹사이트 위험도 산출 방법.
The method according to claim 1,
And assigning a rating corresponding to the website risk to the website.
제6항에 있어서,
상기 웹사이트의 과거 위험도에 대응되는 가중치를 반영하여 웹사이트의 위험도를 계산하는 단계를 더 포함하는 웹사이트 위험도 산출 방법.
The method according to claim 6,
And calculating a risk of a web site by reflecting a weight corresponding to a past risk of the web site.
점검 대상 웹사이트에 포함된 웹컨텐츠를 수집하는 수집부;
상기 수집된 웹컨텐츠가 악성 스크립트, HTML 취약 태그 및 블랙리스트 URL 중 적어도 하나를 포함하는지에 대한 검사를 수행하는 검사부;
상기 웹컨텐츠에 수행된 검사의 종류, 상기 웹컨텐츠의 위치 및 상기 웹컨텐츠가 포함된 웹페이지의 연결정보 중 적어도 하나를 이용하여 상기 웹페이지의 위험도를 계산하는 웹페이지 위험도 계산부; 및
복수의 웹페이지들에 부여된 위험 요인 관련 위험도 점수 중 최대 위험도 점수, 복수의 웹페이지들에 부여된 계층 정보 관련 위험도 점수 중 최대 위험도 점수 및 복수의 웹페이지들에 부여된 연결 정보 관련 위험도 점수 중 최대 위험도 점수를 합산한 값을 위험 요인에 부여될 수 있는 최대 위험도 점수, 계층 정보에 부여될 수 있는 최대 위험도 점수 및 연결 정보에 부여될 수 있는 최대 위험도 점수를 합산한 값으로 나눈 값을 상기 복수의 웹페이지들로 구성된 웹사이트 위험도로 결정하는 웹사이트 위험도 계산부를 포함하는 웹사이트 위험도 산출 장치.
A collection unit for collecting web contents included in a check target website;
An inspection unit for checking whether the collected web content includes at least one of a malicious script, an HTML vulnerable tag, and a blacklist URL;
A web page risk calculator for calculating a risk of the web page using at least one of a type of the check performed on the web content, a position of the web content, and connection information of the web page including the web content; And
The highest risk score among the risk factors related to the plurality of web pages, the highest risk score among the risk information related to the hierarchical information related to the plurality of web pages, and the risk information related to the connection information given to the plurality of web pages A value obtained by dividing the sum of the maximum risk scores by a maximum risk score that can be given to the risk factors, a maximum risk score that can be given to the hierarchical information, and a maximum risk score that can be given to the connection information, A web site risk calculator configured to determine a web site risk based on web pages of the web site.
제8항에 있어서,
상기 웹페이지 위험도 계산부는,
웹컨텐츠에 포함된 위험 요인에 대응되는 기 설정된 위험도 점수를 부여하고, 웹페이지의 계층적 구조에서 상기 웹컨텐츠가 포함된 웹페이지의 계층 정보에 대응되는 기 설정된 위험도 점수를 부여하며, 상기 웹컨텐츠가 포함된 웹페이지의 연결 정보에 대응되는 기 설정된 위험도 점수를 부여하는 웹사이트 위험도 산출 장치.
9. The method of claim 8,
The web page risk calculator calculates,
A predetermined risk score corresponding to a risk factor included in the web content is given and a predetermined risk score corresponding to the hierarchical information of the web page including the web content is given in a hierarchical structure of the web page, The web site risk calculating unit assigns a predetermined risk score corresponding to the connection information of the web page including the web site.
제9항에 있어서,
상기 웹페이지 위험도 계산부는,
상기 웹컨텐츠에 포함된 위험 요인이 복수개인 경우, 각 위험 요인에 대응되는 기 설정된 위험도 점수를 합산하는 웹사이트 위험도 산출 장치.
10. The method of claim 9,
The web page risk calculator calculates,
A web site risk calculation device for summing predetermined risk scores corresponding to the respective risk factors when a plurality of risk factors included in the web content are included.
제9항에 있어서,
상기 웹페이지 위험도 계산부는,
상기 위험 요인에 대응하여 부여된 점수, 상기 계층 정보에 대응하여 부여된 점수 및 상기 연결 정보에 대응하여 부여된 점수를 곱하여 상기 웹페이지에 대한 위험도를 산출하는 웹사이트 위험도 산출 장치.
10. The method of claim 9,
The web page risk calculator calculates,
A web site risk calculation unit for calculating a risk for the web page by multiplying the score given in correspondence with the risk factor, the score given in correspondence with the hierarchical information, and the score given in correspondence with the connection information.
삭제delete 제8항에 있어서,
상기 웹사이트 위험도 계산부는,
상기 웹사이트 위험도에 대응되는 등급을 상기 웹사이트에 부여하는 웹사이트 위험도 산출 장치.
9. The method of claim 8,
The website risk calculator calculates,
And assigns a rating corresponding to the website risk to the website.
제13항에 있어서,
상기 웹사이트 위험도 계산부는,
상기 웹사이트의 과거 위험도에 대응되는 가중치를 반영하여 웹사이트의 위험도를 계산하는 웹사이트 위험도 산출 장치.
14. The method of claim 13,
The website risk calculator calculates,
And calculating a risk of the web site by reflecting the weight corresponding to the past risk of the web site.
KR1020150158687A 2015-11-12 2015-11-12 Apparatus and method for calculating risk of web site KR101648349B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020150158687A KR101648349B1 (en) 2015-11-12 2015-11-12 Apparatus and method for calculating risk of web site
PCT/KR2016/000348 WO2017082470A1 (en) 2015-11-12 2016-01-13 Apparatus and method for calculating risk of web site

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150158687A KR101648349B1 (en) 2015-11-12 2015-11-12 Apparatus and method for calculating risk of web site

Publications (1)

Publication Number Publication Date
KR101648349B1 true KR101648349B1 (en) 2016-09-01

Family

ID=56942669

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150158687A KR101648349B1 (en) 2015-11-12 2015-11-12 Apparatus and method for calculating risk of web site

Country Status (2)

Country Link
KR (1) KR101648349B1 (en)
WO (1) WO2017082470A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101781450B1 (en) * 2017-01-03 2017-09-25 한국인터넷진흥원 Method and Apparatus for Calculating Risk of Cyber Attack
KR101899049B1 (en) * 2017-08-23 2018-09-14 (주)에프원시큐리티 Method for detecting forgery and falsification of website and management system for forgery and falsification of website

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11711393B2 (en) 2020-10-19 2023-07-25 Saudi Arabian Oil Company Methods and systems for managing website access through machine learning

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130068425A (en) * 2011-12-15 2013-06-26 한국인터넷진흥원 System for evaluating the degree of risk for hopping and distribution sites of malicious code and method for evaluating the same
KR101461051B1 (en) * 2013-06-11 2014-11-13 (주) 에스에스알 Method for detecting malignant code through web function analysis, and recording medium thereof
KR101481910B1 (en) * 2013-08-14 2015-01-15 한국과학기술원 Apparatus and method for monitoring suspicious information in web page

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090064337A1 (en) * 2007-09-05 2009-03-05 Shih-Wei Chien Method and apparatus for preventing web page attacks

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130068425A (en) * 2011-12-15 2013-06-26 한국인터넷진흥원 System for evaluating the degree of risk for hopping and distribution sites of malicious code and method for evaluating the same
KR101461051B1 (en) * 2013-06-11 2014-11-13 (주) 에스에스알 Method for detecting malignant code through web function analysis, and recording medium thereof
KR101481910B1 (en) * 2013-08-14 2015-01-15 한국과학기술원 Apparatus and method for monitoring suspicious information in web page

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101781450B1 (en) * 2017-01-03 2017-09-25 한국인터넷진흥원 Method and Apparatus for Calculating Risk of Cyber Attack
KR101899049B1 (en) * 2017-08-23 2018-09-14 (주)에프원시큐리티 Method for detecting forgery and falsification of website and management system for forgery and falsification of website

Also Published As

Publication number Publication date
WO2017082470A1 (en) 2017-05-18

Similar Documents

Publication Publication Date Title
US8856165B1 (en) Ranking of users who report abuse
US20070118528A1 (en) Apparatus and method for blocking phishing web page access
KR101781450B1 (en) Method and Apparatus for Calculating Risk of Cyber Attack
KR100968126B1 (en) System for Detecting Webshell and Method Thereof
CN102663052B (en) Method and device for providing search results of search engine
CN107294919A (en) A kind of detection method and device of horizontal authority leak
CN106022132A (en) Real-time webpage Trojan detection method based on dynamic content analysis
JPWO2008139856A1 (en) Risk model correction system, risk model correction method, and risk model correction program
CN108667766B (en) File detection method and file detection device
CN109104421B (en) Website content tampering detection method, device, equipment and readable storage medium
JP2014502753A (en) Web page information detection method and system
CN103279710A (en) Method and system for detecting malicious codes of Internet information system
Dobolyi et al. Phishmonger: A free and open source public archive of real-world phishing websites
KR101648349B1 (en) Apparatus and method for calculating risk of web site
CN107392028A (en) The detection method and its detection means of sensitive information, storage medium, electronic equipment
Gu et al. An efficient approach to detecting phishing web
CN104252447A (en) File behavior analysis method and device
CN108280102B (en) Internet surfing behavior recording method and device and user terminal
KR101481910B1 (en) Apparatus and method for monitoring suspicious information in web page
Ling et al. Are they toeing the line? diagnosing privacy compliance violations among browser extensions
Brajnik et al. Effects of sampling methods on web accessibility evaluations
KR101725404B1 (en) Method and apparatus for testing web site
CN104636420B (en) System and method for hyperlink data to be presented
Zhang et al. Detecting bad information in mobile wireless networks based on the wireless application protocol
KR101589914B1 (en) Method for Measuring Real Time Website Performance and the System thereof

Legal Events

Date Code Title Description
GRNT Written decision to grant