KR101664109B1 - 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법 및 시스템 - Google Patents

웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법 및 시스템 Download PDF

Info

Publication number
KR101664109B1
KR101664109B1 KR1020150089208A KR20150089208A KR101664109B1 KR 101664109 B1 KR101664109 B1 KR 101664109B1 KR 1020150089208 A KR1020150089208 A KR 1020150089208A KR 20150089208 A KR20150089208 A KR 20150089208A KR 101664109 B1 KR101664109 B1 KR 101664109B1
Authority
KR
South Korea
Prior art keywords
risk
web site
web
web page
personal information
Prior art date
Application number
KR1020150089208A
Other languages
English (en)
Inventor
김관호
이수경
Original Assignee
인천대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 인천대학교 산학협력단 filed Critical 인천대학교 산학협력단
Priority to KR1020150089208A priority Critical patent/KR101664109B1/ko
Application granted granted Critical
Publication of KR101664109B1 publication Critical patent/KR101664109B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F17/2705
    • G06F17/277
    • G06F17/30861
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6263Protecting personal data, e.g. for financial or medical purposes during internet communication, e.g. revealing personal data from cookies

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 웹사이트를 구성하는 웹 페이지들 간의 링크 관계에 대한 구조를 기반으로 위험도 계산 모델을 통해 개인정보 노출 위험성을 분석하여 웹사이트별 적어도 하나 이상의 웹 페이지에 노출된 개인정보의 위험수준을 판단하고, 판단 결과를 단일화면을 통해 기설정된 디스플레이 서비스 메뉴 기반 서비스 항목별 정보를 GUI를 통해 지표화하기 위한 것으로, 이를 위해 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드가 실행되면, 사용자 인터럽트를 통해 입력된 분석 대상 웹사이트로 동적으로 로딩하여 웹페이지를 파싱하고, 기설정된 정책 기반 하에 파싱된 웹페이지의 링크 기반 추적을 통해 웹페이지를 선별 처리하여 저장된 웹페이지에 대한 기설정된 항목별 정보 수집을 통해 기정의된 위험도 수준을 기반으로 해당 웹페이지 내 노출된 개인정보에 대한 레벨별 가중치를 부여하여 개인정보 노출 위험도를 산출하고, 상기 웹사이트를 구성하는 웹페이지들 간 링크 관계에 대한 구조를 분석하여 분석 결과 기반 웹페이지별 방문 확률을 측정을 통해 상기 웹사이트에 노출된 개인정보 노출 위험도를 측정함으로써 웹사이트에 포함된 웹페이지별 개인정보의 1차적 노출 사고뿐만 아니라 이후 해당 웹페이지의 다양한 링크를 통해 노출되는 2차적인 노출 사고 또한 예방 가능한 기술이다.

Description

웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법 및 시스템{A METHOD AND SYSTEM SERVICE FOR PROVIDING EXPOSURE RISKS OF PRIVATE INFORMATION BASED ON WEBSITE STRUCTURE}
본 발명은 웹사이트를 구성하는 웹 페이지들 간의 링크 관계에 대한 구조를 기반으로 위험도 계산 모델을 통해 개인정보 노출 위험성을 분석하여 웹사이트별 웹 페이지에 노출된 개인정보의 위험수준을 판단하여 지표화하기 위한 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스에 관한 것이다.
최근 들어 웹상의 개인정보 노출 사고가 지속적으로 발생하고 있다. 개인정보 노출 사고에 대한 기존의 기술적인 보호 조치는 활성화되어 있지만 그에 대한 예방 조치는 아직 미흡한 상태이다. 개인정보의 노출과 이에 따라 발생하는 2차적인 침해사고의 피해를 예방하기 위해서는 웹 사이트 이용자 입장에서 개인정보의 위험성을 판단할 수 있는 지표를 제시하여 자기정보 침해에 대한 예방 의식을 갖추도록 해야 한다.
웹 사이트의 개인정보 위험성이란 단순히 개인정보 자체의 상대적인 위험성이 아닌 노출된 개인정보가 제3자에게 악용될 위험에 노출될 가능성을 의미한다. 이 웹 사이트의 개인정보 위험성을 판단하기 위해 웹 사이트의 위험도를 제시하여 우선순위 기반의 효율적인 대처방안을 수립하고, 사용자들은 해당 웹 사이트의 위험에 대해 주의하고 피해를 예방할 수 있도록 해야 한다.
기존의 개인정보의 위험도 분석은 개인정보의 상대적인 위험 수준 제시에 국한되어 있었고, 기존의 PC 및 이메일에서의 노출 판별에만 집중되어 있어 웹사이트에서의 자동화 시스템 개발이 부재하였다[1], [2], [3].
웹 사이트 위험도의 계산을 위해서는 개인정보의 상대적인 위험 수준뿐 아니라 웹 사이트의 구조적인 특성도 고려되어야 한다. 그 이유는 1차적 노출 사고 이후에도 해당 웹 페이지가 다양한 링크를 통해 노출되는 2차적인 노출 사고가 발생할 수 있어서 단순히 개인정보 자체의 위험도로는 실제 노출될 가능성에 기반 한 위험도 계산이 어렵기 때문이다.
대한민국 공개특허공보 제10-2013-0032660호(2013. 04. 02)
따라서 본 발명은 이를 해결하기 위해 웹사이트를 구성하는 웹 페이지들 간의 링크 관계에 대한 구조를 기반으로 위험도 계산 모델을 통해 개인정보 노출 위험성을 분석하여 웹사이트별 웹 페이지에 노출된 개인정보의 위험수준을 판단하고, 판단 결과를 단일화면을 통해 기설정된 디스플레이 서비스 메뉴 기반 서비스 항목별 정보를 GUI를 통해 지표화하기 위한 기술을 제공하고자 한다.
본 발명의 일 견지에 따르면, 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드가 실행되면, 사용자 인터럽트를 통해 입력된 분석 대상 웹사이트로 동적으로 로딩하는 과정과, 로딩된 웹사이트를 구성하는 웹페이지를 파싱하고, 기설정된 정책 기반 하에 파싱된 웹페이지의 링크 기반 추적을 통해 웹페이지를 선별 처리하는 과정과, 선별 처리 결과 기반 저장된 웹페이지에 대한 기설정된 항목별 정보 수집을 통해 기정의된 위험도 수준을 기반으로 해당 웹페이지 내 노출된 개인정보에 대한 레벨별 가중치를 부여하여 개인정보 노출 위험도를 산출하는 과정과, 상기 웹사이트를 구성하는 웹페이지들 간을 연결하는 태그 분석을 통해 해당 웹사이트의 링크 관계에 대한 구조를 분석하고, 분석 결과를 기반으로 웹페이지별 방문 확률을 측정하여 측정 결과를 통해 상기 웹사이트에 노출된 개인정보 노출 위험도를 측정하는 과정과, 측정된 상기 웹사이트에 대응하는 노출 위험도를 기설정된 메뉴를 기반으로 서비스 항목별로 지표화하여 상기 웹사이트 개인정보 노출 위험도 검색 모드가 수행되는 화면에 표시하는 과정을 포함함을 특징으로 한다.
본 발명의 다른 견지에 따르면 네트워크를 통해 연결된 단말로부터 웹사이트 개인정보 노출 위험도 검색 요청이 수신되면 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드를 실행하여 사용자 인터럽트를 통해 입력된 분석 대상 웹사이트로 로딩하여 상기 웹사이트를 구성하는 웹페이지들 간의 링크 관계에 대한 구조를 분석하고, 분석 결과 기반 웹페이지별 방문 확률을 측정하여 웹사이트에 노출된 개인정보 노출 위험도를 측정하여 서비스 항목별로 지표화하여 표시하는 웹사이트 위험도 검색 서비스 서버와, 사용자 인터페이스를 통해 입력된 웹사이트 주소에 따라 상기 웹사이트의 개인정보 노출 위험도 상태 표시 서비스를 네트워크를 통해 연결된 웹사이트 위험도 검색 서비스 서버로부터 지원받고, 상기 웹사이트 위험도 검색 서비스 서버로부터 제공되는 상기 웹사이트의 개인정보 노출 위험도 상태 표시 서비스 데이터를 웹사이트 개인정보 노출 위험도 검색 모드 화면상에 기설정된 영역별로 릴레이 표시하고, 상기 릴레이되어 표시된 개인정보 노출 위험도 상태 표시 서비스 데이터를 호출하여 기설정된 기준에 따라 항목화된 화면을 통해 사용자 인터럽트에 따라 적응적으로 선택하여 표시하는 단말을 포함함을 특징으로 한다.
본 발명은 웹사이트에 포함된 웹페이지별 개인정보의 1차적 노출 사고뿐만 아니라 이후 해당 웹페이지의 다양한 링크를 통해 노출되는 2차적인 노출 사고 또한 예방 가능한 효과가 있다.
또한, 본 발명은 웹사이트별 웹페이지에 개시된 개인정보의 위험 수준 상태를 웹사이트를 구성하는 웹페이지들 간의 링크 관계 구조를 기반으로 GUI적으로 정렬하여 한 화면에 표시하므로 일목요연한 웹사이트별 위험 분석이 가능할 뿐만 아니라, 사용자와 정보 제공자 간 GUI적 인터렉티브(interactive)한 활성화를 통해 단일화면 내에서 시인성이 보다 강화된 웹사이트별 웹페이지 위험도 상태 정보 제공이 가능할 뿐만 아니라, 이를 통해 다수의 웹사이트별 위험 수준 관련 상태 정보를 명확하게 파악 가능한 효과가 있다.
도 1은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 관한 전체 흐름도.
도 2는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 있어서, 대상 웹페이지를 선별하기 위한 웹페이지 처리 동작에 관한 흐름도.
도 3은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법이 실행되는 전체 화면 예시도.
도 4 내지 도 6은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법이 실행되는 전체 화면에서 소정 선택별 대응하는 화면 예시도.
도 7은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 있어서, 기정의된 위험도 수준 테이블.
도 8은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 있어서, 웹페이지 위험도 계산 과정을 보인 예시도.
도 9는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 있어서, 웹사이트 구조를 고려한 웹페이지 중요도 관련 위험도 탐지를 수행하기 위한 실제 동작의 일례를 보인 화면 예시도.
도 10은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 있어서, 웹사이트 구조 기반의 중요도 계산 알고리즘에 관련 웹페이지맵.
도 11은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법이 통합적으로 적용된 전체 실행을 보인 예시도.
도 12는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법이 적용된 화면에 있어서, 페이지뷰 결과를 기반으로 각 분야별 상위 웹사이트가 선정된 관련 화면 예시도.
도 13은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법이 적용된 화면에 있어서 소정 사이트의 웹페이지별 중요도 관련 그래프.
도 14는 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템의 구성도.
도 15는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템에 있어서, 웹사이트 검색 서비스 서버의 상세 블록도.
이하 본 발명에 따른 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명에서는 구체적인 구성 소자 등과 같은 특정 사항들이 나타나고 있는데 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐 이러한 특정 사항들이 본 발명의 범위 내에서 소정의 변형이나 혹은 변경이 이루어질 수 있음은 이 기술 분야에서 통상의 지식을 가진 자에게는 자명하다 할 것이다.
본 발명은 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스에 관한 것으로, 더욱 상세하게는 웹사이트를 구성하는 웹 페이지들 간의 링크 관계에 대한 구조를 기반으로 위험도 계산 모델을 통해 개인정보 노출 위험성을 분석하여 웹사이트별 적어도 하나 이상의 웹 페이지에 노출된 개인정보의 위험수준을 판단하고, 판단 결과를 단일화면을 통해 기설정된 디스플레이 서비스 메뉴 기반 서비스 항목별 정보를 GUI를 통해 지표화하기 위한 것으로, 이를 위해 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드가 실행되면, 사용자 인터럽트를 통해 입력된 분석 대상 웹사이트로 동적으로 로딩하여 웹페이지를 파싱하고, 기설정된 정책 기반 하에 파싱된 웹페이지의 링크 기반 추적을 통해 웹페이지를 선별 처리하여 저장된 웹페이지에 대한 기설정된 항목별 정보 수집을 통해 기정의된 위험도 수준을 기반으로 해당 웹페이지 내 노출된 개인정보에 대한 레벨별 가중치를 부여하여 개인정보 노출 위험도를 산출하고, 상기 웹사이트를 구성하는 웹페이지들 간 링크 관계에 대한 구조를 분석하여 분석 결과 기반 웹페이지별 방문 확률을 측정을 통해 상기 웹사이트에 노출된 개인정보 노출 위험도를 측정함으로써 웹사이트에 포함된 웹페이지별 개인정보의 1차적 노출 사고뿐만 아니라 이후 해당 웹페이지의 다양한 링크를 통해 노출되는 2차적인 노출 사고 또한 예방 가능한 기술을 제공하고자 한다.
또한, 본 발명은 웹사이트에 대응하는 노출 위험도를 기설정된 메뉴를 기반으로 서비스 항목별로 그래프가 포함된 GUI 아이템을 통해 표시하여 상기 웹사이트 개인정보 노출 위험도 검색 모드가 수행되는 화면에 지표화함으로써 웹사이트별 웹페이지에 개시된 개인정보의 위험 수준 상태를 웹사이트를 구성하는 웹페이지들 간의 링크 관계 구조를 기반으로 GUI적으로 정렬하여 한 화면에 표시하므로 일목요연한 웹사이트별 위험 분석이 가능할 뿐만 아니라, 사용자와 정보 제공자 간 GUI적 인터렉티브(interactive)한 활성화를 통해 단일화면 내에서 시인성이 보다 강화된 웹사이트별 웹페이지 위험도 상태 정보 제공이 가능할 뿐만 아니라, 이를 통해 다수의 웹사이트별 위험 수준 관련 상태 정보를 명확하게 파악 가능한 기술을 제공하고자 한다.
그리고, 본 발명은 웹서비스 환경에서 개인정보 보호를 위한 정책기반의 개인정보 보호 방안에 관한 것으로, 정보 요청자의 선택 입력과 개인정보 노출 위험도 제공 서비스 정책 기반으로 선별적으로 선택된 항목에 대응되게 웹사이트 위험도 검색 서비스 서버를 통해 정보 요청자가 자신의 단말을 이용하여 웹 브라우징을 통해 원하는 수준으로 커스터마이징(customizing)된 개인정보 노출 위험도 상태 서비스 수신이 가능하고 안전한 서비스 구조에 따라 개인정보 보호를 위한 정책관리가 진행됨으로써 웹사이트 환경에서 개인정보 관련 웹사이트 위험도에 대한 대처가 가능한 기술을 제공하고자 한다.
더불어, 본 발명의 상세한 설명에 앞서, 이하 설명되는 사용자 인터럽트(interrupt)라는 용어는 사용자가 단말을 이용하여 웹사이트 개인정보 노출 위험도 검색 모드에서 서비스를 받고자 하는 검색 대상 웹사이트의 주소를 입력하거나 단말에 표시된 오브젝트를 포인팅하고자 하는 의도를 의미하는 것으로, 이를 통해 대상 웹사이트로 로딩하거나 해당 오브젝트를 활성화하여 설정된 서비스를 실행한다.
이하, 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 관해 도 1 내지 도 13을 참조하여 자세히 살펴보기로 한다.
먼저, 도 1은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 관한 전체 흐름도이다.
도 1을 참조하면, 110 과정에서는 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드가 실행되면, 112 과정에서 사용자 인터럽트를 통해 입력된 분석 대상 웹사이트로 동적으로 로딩한다.
여기서, 상기 검색 모드는 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위해 사용자 단말 혹은 상기 사용자 단말의 요청에 의해 웹사이트 위험도 검색 서비스를 서버를 통해 모드 전환되어 수행되는 것으로, 본 발명이 적용된 웹사이트 개인정보 노출 위험도 검색 모드에서는 이하 후술 되는 바와 같이 개인정보 자체의 의미적인 분석과 예상되는 개인정보 노출 횟수의 구조적인 분석을 동시에 고려하여 웹사이트의 위험도를 계산하는 동작이 수행된다.
이어서, 114 과정에서는 로딩된 웹사이트를 구성하는 웹페이지를 파싱하여, 116 과정에서 기설정된 정책 기반 하에 파싱된 웹페이지의 링크 기반 추적을 통해 웹페이지를 선별 처리한다.
여기서, 상기 기설정된 정책 기반 하에 파싱된 웹페이지의 링크 기반 추적을 통해 웹페이지를 선별 처리하는 동작을 도 2를 참조하여 상세히 살펴보도록 한다.
도 2는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 있어서, 대상 웹페이지를 선별하기 위한 웹페이지 처리 동작에 관한 흐름도이다. 이러한 도 2의 동작은 웹사이트를 구성하는 웹페이지별 위험도 계산을 수행하기 이전에 웹사이트에 대응하는 웹페이지별 링크에 따라 계속 접속하면서 중복되게 접속된 웹페이지를 선별하기 위한 것으로, 도 2를 참조하면, 먼저, 210 과정에서는 로딩된 웹사이트에 대응하는 웹페이지를 소정 라이브러리(예컨대, HTML 리딩 Jsoup Connect)를 통해 파싱한다.
212 과정에서는 상기 웹사이트에서 표시되는 서비스 웹페이지별 HTML 데이터를 doc.outerHTML()를 이용하여 추출하고, 214 과정에서 웹페이지의 소스 정보를 분석한다.
216 과정에서는 상기 소스 정보 분석 결과를 통해 웹페이지별 링크를 추적하고, 218 과정에서 웹페이지들에 대한 기설정된 항목별 정보 수집 관련 방문 이력 여부를 해쉬 함수를 기반으로 웹페이지의 해쉬값을 계산하여 판단한다.
이때, 상기 해쉬함수는 mdcode 생성을 통해 MDSCheckSum을 활용하여 동일 페이지 식별에 활용되며 본 발명의 실시 예에서는 해당하는 작업을 수행하는 코드의 일례로 상기 mdcode 및 MDSCheckSum을 예로 들어 설명하나, 본 발명이 이에 한정되지 않음을 미리 밝혀두는 바이다.
이러한, 상기 해쉬 함수는 해쉬값을 계산하는 알고리즘으로, 상세하게는, 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드를 실행하기 위해 기설정된 항목별 정보 수집을 위해 방문한 웹페이지에 대한 중복 방문을 피하기 위해 이전 방문 이력에 해당하는 웹페이지가 검색 모드 대상에 포함되기 전에 그동안 축적된 다른 모든 웹페이지 각각에 대해 비교를 하여 같으면 해당 웹페이지를 검색 모드 대상에 넣지 않고 대응하는 칼럼을 업데이트(현 URL->전 URL)하여 재방문을 방지한다.
이때, 본 발명에서는 축적된 웹페이지의 수가 많을 경우를 대비해 해쉬 함수를 이용하여 웹페이지의 해쉬값을 계산하고, 계산된 해쉬값을 비교하여 수행한다.
여기서, 상기 해쉬값 계산은 하나의 문자열을 원래의 것을 상징하는 더 짧은 길이의 값이나 키로 변환하는 것으로, 해쉬값은 짧은 해쉬키를 사용하여 항목을 찾으면 원래의 값을 이용하여 찾는 것보다 더 빠르기 때문에 DB 내의 항목들을 색인하고 검색하는데 사용된다. 상기 해쉬값 계산에 사용되는 문자열은 웹페이지 내의 모든 내용 중 임의의 일부 또는 전부를 사용할 수 있다.
220 과정에서는 계산된 해쉬값이 해쉬값 리스트에 존재하는지 여부를 mdcode 고유한지 여부를 통해 체크한다.
존재하지 않는 경우, 224 과정으로 이동하여 해쉬값 리스트에 해쉬값을 추가하고, 해당 웹페이지를 지정된 mdcode DB에 저장한다.
한편, 체크 결과, 상기 계산된 해쉬값이 해쉬값 리스트에 존재하는 경우, 222 과정으로 이동하여 현재 웹페이지 URL을 이전 웹페이지 URL로 변경하여 해당 칼럼을 업데이트한다.
이와 같이, 상술한 도 2의 동작을 통해 본 발명이 적용된 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 지원을 위해 링크 수집 및 노이즈 제거 과정이 선행되어 수행된다.
다시, 도 1의 설명으로 돌아가서, 118 과정에서는 선별 처리 결과 기반 mdcode DB에 저장된 웹페이지에 대한 기설정된 항목별 정보 수집을 통해 도 7의 기정의된 위험도 수준 테이블을 기반으로 해당 웹페이지 내 노출된 개인정보에 대한 레벨별 가중치를 부여하여 120 과정에서 상기 웹페이지의 개인정보 노출 위험도를 산출한다.
상기 기설정된 항목별 정보 수집은 해당 웹페이지에서의 링크 및 개인정보 수집을 의미하는 것으로, 상술한 기설정된 정책 조건에 따라 재방문 여부 확인을 위한 노이즈 제거를 통해 mdcode DB에 저장된 새로운 웹페이지에 대하여, 도 7의 테이블을 기반으로 개인정보 위험 수준 상태를 확인할 수 있도록 파싱된 웹페이지로부터 컨텐츠 데이터와 하이퍼 링크 데이터를 분류하여 수집하고 이를 각각의 대응하는 DB에 저장한다.
이때, 상기 기정의된 위험도 수준을 살펴보면, 개인정보의 유형은 공인된 기관(예컨대, 안전행정부)에서 제시한 홈페이지 개인정보 외에도 노출될 시 위험하다고 판단되는 전화번호, E-mail 주소, IP 주소, 사업자등록번호, 법인등록번호를 추가하여 총 12가지의 개인정보를 대상으로 한다. 개인정보의 민감도와 악용 시 피해 정도에 따라 도 7에 도시된 바와 테이블로 3개의 유형별로 위험수준을 설정한다.
도 7에서와 같이, 3단계로 구분된 Level(71)에서 Level(72), Level(73)으로 갈수록 더 민감한 정보이다. Level(73) 의 정보가 노출될 시 제3자에게 악용될 위험을 가지고 있는 반면, Level(71)의 정보는 어느 정도 공개가 되어 있으며 Level(71)의 정보만 가지고 개인의 신분이나 신상정보를 파악하기는 어렵다. 하지만, 사생활 침해의 우려가 있고 Level(72)나 Level(73)의 정보와 함께 노출되었을 시에는 매우 위험한 정보로 분류할 수 있기 때문에 Level(71)의 정보도 가중치를 부여하여 웹페이지에 개시된 개인정보(714) 관련 노출 위험도를 산출한다.
계속해서, 122 과정에서는 웹사이트를 구성하는 웹페이지들 간을 연결하는 태그 분석을 통해 해당 웹사이트의 링크 관계에 대한 구조를 분석한다.
124 과정의 동작을 통해 분석 결과를 기반으로 웹페이지별 방문 확률을 측정하고, 126 과정에서 측정 결과를 통해 상기 웹사이트에 노출된 개인정보 노출 위험도를 측정한다.
이때, 상기 웹페이지별 방문 확률 측정은 권한(authority) 및 허브들(hubs)을 구분하는 기설정된 알고리즘(Hyper Induced Topic Serch, HITS)을 기반으로 상기 웹사이트를 구성하는 웹페이지들 상호 간 연결된 링크의 빈도수로부터 하기의 수학식 1을 통해 인커밍(incoming) 링크를 가진 페이지인 권한(authority)을 결정하고, 결정된 권한으로부터 아웃고잉(outgoing) 링크를 가진 허브들(hubs)을 획득하여 수행된다.
Figure 112015060855521-pat00001
Figure 112015060855521-pat00002
웹사이트 방문자들은 링크를 클릭함으로써 현재 웹페이지에서 링크 대상으로 이동하게 된다. 이와 같이 링크 기반의 이동 행태를 반영하기 위해 웹페이지의 예상 방문 확률을 측정한다.
웹 페이지의 예상 방문 확률을 측정하기 위해 웹 사이트의 구조적인 형태를 가장 잘 반영한 공지된 HITS 알고리즘을 적용한다. HITS 알고리즘은 링크를 분석하여 웹문서에 대한 authority와 hubs로서의 두 종류의 속성값을 계산한다. 여기서, authority는 제시된 주제에 대해 중요한 정보를 갖고 있는 문서라는 것을 의미하며, 본 발명에서는 웹 페이지의 예상 방문 확률을 의미한다. 웹 페이지들 상호 간에 연결된 링크의 빈도수로부터 authorities를 결정하며, 역으로 hubs를 알 수 있다.
이에 따라, 질의로부터 의미기반의 검색엔진에서 얻어진 검색결과의 웹문서 집합 N을 HITS의 입력으로 사용한다. 수학식 1에서
Figure 112015060855521-pat00003
Figure 112015060855521-pat00004
인 웹문서
Figure 112015060855521-pat00005
에 대한 authorities score이고 H[n]은 hub score이다. 위의 연산을 반복적으로 수행하면
Figure 112015060855521-pat00006
Figure 112015060855521-pat00007
는 최종적인 authority score와 hub score로 수렴하게 된다.
그리고, 본 발명의 일 실시 예에 따른 웹페이지 예상 방문 횟수는 웹페이지 예상 방문 확률과 웹사이트 평균 방문 횟수의 곱으로 하기의 수학식 2와 같이 표현한다.
Figure 112015060855521-pat00008
또한, 상기 웹페이지별 방문 확률 측정 결과는, 기정의된 위험도 계산 변수 테이블을 기반으로 웹사이트 평균 방문 횟수와 곱셈 연산을 통해 하기 수학식 3형태로 웹페이지 예상 방문 횟수로 계산된다.
즉, 상기 저장된 웹페이지에 대한 위험도는, 웹사이트 위험도 검색 서비스 서버를 통해 제공되는 웹페이지의 방문 횟수와 해당 웹페이지에 노출된 개인정보 개수에 상대적인 위험수준을 부여하여 수학식 3을 통해 산출된다.
Figure 112015060855521-pat00009
그리고, 특정 웹사이트의 위험도를 구하기 위해 특정 웹사이트내의 모든 웹페이지의 위험도를 모두 더한다. 이는 하기 수학식 4의 형태와 같다.
Figure 112015060855521-pat00010
한편, 표 1은 본 발명의 실시 예에 따른 수학식 관련 변수를 정의한 것이다.
변수 설명
Figure 112015060855521-pat00011
Figure 112015060855521-pat00012
번째 웹 사이트 위험도
Figure 112015060855521-pat00013
Figure 112015060855521-pat00014
번째 웹 사이트의
Figure 112015060855521-pat00015
번째 웹페이지 위험도
Figure 112015060855521-pat00016
개인정보 위험수준 개수
Figure 112015060855521-pat00017
Figure 112015060855521-pat00018
번째 웹 사이트 내
웹 페이지 총 개수
Figure 112015060855521-pat00019
Figure 112015060855521-pat00020
번째 웹 사이트의
Figure 112015060855521-pat00021
번째 웹 페이지 예상 방문 확률
Figure 112015060855521-pat00022
Figure 112015060855521-pat00023
번째 웹 사이트 평균 방문 횟수
Figure 112015060855521-pat00024
Figure 112015060855521-pat00025
번째 웹 사이트의
Figure 112015060855521-pat00026
번째 웹 페이지 예상 방문 횟수
Figure 112015060855521-pat00027
Figure 112015060855521-pat00028
번째 웹 사이트의
Figure 112015060855521-pat00029
번째 웹 페이지에 노출된
Figure 112015060855521-pat00030
에 해당하는
개인정보의 노출 횟수
Figure 112015060855521-pat00031
Figure 112015060855521-pat00032
의 가중치
Figure 112015060855521-pat00033
이와 같이, 본 발명은 상술한 도 1의 110 과정 내지 126 과정의 동작을 통해 웹페이지 중요도와 웹사이트 페이지뷰를 고려하여 웹페이지 예상 방문 횟수를 도출하고, 웹사이트 구조에 따른 웹페이지 중요도와 개인정보의 위험수준을 도 7에 도시된 테이블을 기반으로 웹페이지 위험도를 계산한다.
이를 도 8 및 도 9를 참조하여 화면 예시도를 통해 환언하여 살펴보도록 한다.
먼저, 도 8은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 있어서, 웹페이지 위험도 계산 과정을 보인 예시도로서, 도 8에 도시된 바와 같이 웹사이트의 웹페이지를 나타내는 노드와 노드들 간의 링크를 나타내는 연결선으로 구성된 웹사이트 페이지맵(818)을 기반으로 각 웹페이지별 링크를 수집하고, 수집된 링크를 리스트화하여 순차적으로 웹페이지를 수집한다(820). 링크 수집된 웹페이지(820)에 대한 개시된 개인정보를 기정의된 위험도 수준(812)을 기반으로 웹페이지별 중요도를 부여(810)하고, 웹페이지에 개시된 개인정보를 기정의된 위험도 수준(812)을 기반으로 웹페이지 위험도 계산 모델(814)을 통해 웹페이지별 개인정보 노출 위험도를 측정하여 산출하고, 산출된 결과를 기반으로 해당 웹사이트의 링크 관계에 대한 구조에 적용하여 위험군에 속하는 해당 웹페이지에 대해 웹사이트의 페이지 맵을 이용하여 노드 표시(816)한다.
이와 같이 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법은 웹페이지 중요도와 웹사이트 페이지뷰가 고려된 웹페이지 예상 방문 횟수 및 페이지맵 구조 기반 웹페이지의 중요도와 개인정보 위험수준을 확률적으로 산출한 후, 최종적으로, 도 1의 128 과정을 통해 측정된 상기 웹사이트에 대응하는 노출 위험도를 기설정된 메뉴를 기반으로 서비스 항목별로 지표화하여 상기 웹사이트 개인정보 노출 위험도 검색 모드가 수행되는 화면에 표시한다.
이때, 상기 지표화하는 동작은 도 3에 도시된 바와 같이, 웹사이트 위험도 검색 서비스 서버를 통해 제공되는 복수의 분할된 영역을 갖는 웹사이트 개인정보 노출 위험도 검색 모드 화면(310)상에서 상기 분할된 각 영역에 상기 검색 모드 화면의 일 영역(312)으로부터 입력된 웹사이트 메인 웹페이지에 대응하는 기설정된 서비스 항목별 노출 위험도 결과 정보가 항목별(314, 316) 하위 계층으로 릴레이(예컨대, 주소, 제목, 부자관계, 개인정보 종류와 노출 횟수, 각 페이지 중요도 순)되어 표시된다.
이어서, 도 9는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 있어서, 웹사이트 구조를 고려한 웹페이지 중요도 관련 위험도 탐지를 수행하기 위한 실제 동작의 일례를 보인 화면 예시도이다.
도 9에 도시된 바와 같이, 소정 웹사이트의 페이지맵(910)과 이에 대응하는 웹페이지 실제 화면 예시도 맵(912)을 기반으로 소정 웹사이트의 페이지맵(910)에서 소정 노드(914)가 선택되면 이에 대응하는 화면 예시도(916)의 링크 주소에 따라 적어도 하나 이상의 하위 노드로 방사되고, 상기 노드(914) 및 웹페이지(916) 즉, 920에서 주민등록번호 2개가 유출, 또 다른 하위 노드에서의 주민등록번호 5개, 전화번호 3개 유출된 경우, 이를 각각 P1 및 P2로 정의하여 노출된 개인정보 유형 및 웹 페이지의 예상 방문 횟수를 같이 고려하였을 때 실제 노출될 가능성에 기반한 위험도 계산이 가능하며 이는 하기와 같다.
P1;
ㆍ웹 페이지 예상 방문 횟수 = 8,000
ㆍ노출된 개인정보 위험도 수준 = 3x2 = 6
P2;
ㆍ웹 페이지 예상 방문 횟수 = 200
ㆍ노출된 개인정보 위험도 수준 = 3x5+1X3 = 18
∴P1 위험도/P2 위험도 = 13. 3
이어서, 도 10은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 있어서, 웹사이트 구조 기반의 중요도 계산 알고리즘에 관련 웹페이지맵을 보인 것이다.
본 발명의 일 실시 예에 따른 웹페이지의 예상 방문 확률을 구하기 위해 HITS 알고리즘을 기반으로 그물같이 얽혀 있는 링크들을 인-링크(in-link, 들어오는 링크)와 아웃-링크(out-link, 나가는 링크)로 나누어 두 개를 모두 고려하여 반복적으로 계산을 수행한 결과 중요도가 가장 높은 페이지가 가장 큰 예상 방문확률을 가지게 된다(∴웹페이지 중요도 = 웹페이지에 예상 방문 확률).
이를 도 10을 기반으로 도식화하면 하기와 같다.
Figure 112015060855521-pat00034
ㆍ반복적 알고리즘: 반복 연산을 했을 때 수렴하는 일정한 값이 각 페이지들의 최종 방문 확률
ㆍ복잡한 링크 구조 = 웹사이트 구조
ㆍIn-link가 많은 것 = 기대 방문 확률이 높은 것
도 11은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법이 통합적으로 적용된 전체 실행 동작을 보인 것으로, 상술한 본 발명의 일 실시 예에 따른 동작을 환언하면 도 11에 도시된 바와 같이, 기정의된 위험도 수준을 기반으로 해당 웹페이지 내 노출된 개인정보에 대한 레벨별 가중치를 부여하여 개인정보 노출 위험도를 산출하고, 상기 웹사이트를 구성하는 웹페이지들 간 링크 관계에 대한 구조(12)를 분석하여 분석 결과 기반 웹페이지별 방문 확률을 측정(214)을 통해 상기 웹사이트에 노출된 개인정보 노출 위험도를 측정한다.
ㆍ(웹페이지 예상 방문 횟수) = (웹페이지 중요도) * (웹사이트 페이지뷰)
(여기서, 웹페이지 중요도 = 웹페이지 예상 방문 확률, 웹사이트 페이지뷰 = 웹사이트 방문 횟수)
Figure 112015060855521-pat00035
= (웹페이지 기대 방문 횟수) *
Figure 112015060855521-pat00036
{(Level i에 해당하는 개인정보 노출 횟수)*
Figure 112015060855521-pat00037
}
Figure 112015060855521-pat00038
(여기서,
Figure 112015060855521-pat00039
= i번째 웹사이트 위험도,
Figure 112015060855521-pat00040
= i번째 사이트의 j번째 페이지 위험도, L = 개인정보 위험수준 개수,
Figure 112015060855521-pat00041
= 웹사이트 내 웹페이지 개수)
이후, 웹사이트를 구성하는 웹페이지에 대한 중복 링크 제거 및 개인정보가 부재한 링크 제거를 통해 웹페이지 중요도로 산출되어 지정된 DB에 저장된다.
이하, 후술되는 도 4 내지 도 6은 도 3의 도시된 검색 모드 화면(310)에서의 소정 선택을 통해 변환되는 화면 예시도를 보인 것으로, 우선, 도 4는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법이 적용된 화면에 있어서, 웹사이트 구조 보기 관련 화면 예시도이다.
도 4를 참조하면, 검색 모드 화면(410)의 일 영역에 마킹된 웹사이트 구조 보기 블록(412)에 대한 사용자 인터럽트가 발생된 경우, 본 발명의 웹사이트 위험도 검색 서비스 서버의 제어부를 통해 해당 웹사이트의 메인 페이지 로딩을 통해 전송된 웹페이지 소스 관련 링크를 구현한 요소들을 분석하여 링크된 페이지들을 구하고, 상기 웹사이트의 링크 구조에 따라 접속을 통해 해당 웹사이트를 구성하는 웹페이지들의 링크 관계에 대한 데이터를 구축한다.
상기 구축된 데이터를 기반으로 상기 웹사이트의 메인 페이지를 나타내는 노드부터 하위의 노드까지 계속 방사되는 페이지 맵의 출력 정보 산출을 통해 웹사이트의 페이지를 나타내는 노드와 상기 노드들 간의 링크를 나타내는 연결선으로 구성된 웹페이지맵(414)을 생성하여 출력한다.
도 5는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법이 적용된 화면에 있어서, 웹사이트 위험도 계산 보기 관련 화면 예시도이다. 도 5를 참조하면, 검색 모드 화면(518)의 일 영역에 마킹된 웹페이지 위험도 계산 블록(512)에 대한 사용자 인터럽트가 발생된 경우, 상기 웹페이지맵을 구성하는 노드별 해당 웹페이지에 기정의된 위험도 수준을 기반으로 중요도를 부여하여 노드에 대한 단계별 가변 범위에 기초하여 중요도 순위 기반 노드의 크기가 확대된 웹페이지맵(514)에 표시하고, 상기 중요도 순위 기반 노드의 크기가 확대된 웹페이지맵이 표시된 영역에 이웃되게 대응되는 그래프(516)를 생성하여 표시한다.
이때, 상기 단계별 가변 범위는, 기설정된 크기의 단위 노드를 기준으로 2 배율 및 3 배율로 확장되는 범위이고, 상기 그래프는 상기 웹페이지맵의 노드별 부여된 중요도를 입력으로 받아 입력값을 연결하여 그래프 생성 클래스 실행을 통해 생성된다.
더불어, 도 6은 웹사이트 위험도 계산 보기 관련 화면 예시도에 있어서, 웹 사이트 위험도 계산 블록(610) 인터럽트 발생 시, 해당 웹사이트 웹페이지맵(612)에서 노드별 중요도가 부여되어 해당 노드들이 기설정된 크기의 단위 노드(61)를 기준으로 2배율(60) 및 3배율(62)로 확장된 예를 보인 것으로, 이와 더불어 인접한 영역(614, 616)에 각각 웹사이트 내 웹페이지 수집현황 및 해당 웹사이트의 상태 정보 텍스트가 디스플레이된다.
상기 웹페이지맵(612)을 구성하는 노드별 사용자 인터럽트를 감시하여 상기 사용자 인터럽트가 발생된 노드별 해당 웹페이지의 노출된 개인정보 횟수에 대응하는 그래프가 일 영역에 표시된다.
한편, 도 12는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법이 적용된 화면에 있어서, 페이지뷰 결과를 기반으로 각 분야별 상위 웹사이트가 선정된 관련 화면 예시도이다.
도 12를 참조하면, 상기 검색 모드 화면의 일 영역에 마킹된 웹사이트 위험도 계산 블록에 대한 사용자 인터럽트가 발생된 경우, 관련 전문기관으로부터 웹사이트 위험도 검색 서비스 서버를 통해 관리되는 전체 웹사이트를 리스팅(listing)하고, 기설정된 기간 동안의 웹사이트별 평균 페이지뷰 횟수(혹은 위험도)를 리스팅된 웹사이트별로 대응되게 매칭하여 그래프를 통해 통합 가이드한다.
또한, 웹페이지 수집 현황 표시 모드 시, 도 12에 리스팅된 웹사이트 중 어느 하나의 웹사이트가 선택된 경우 혹은 도 6에 생성된 페이지맵에 해당하는 해당 웹사이트의 웹페이지 수집 현황을 도 6의 614 영역에 도시된 바와 같이, 계층적 트리 구조로 분류하고, 해당 상태별로 기설정된 수의 필드를 그라데이션(gradation)하여 백분율로 표시한다.
그리고, 도 13은 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법이 적용된 화면에 있어서 소정 사이트의 웹페이지별 중요도 관련 그래프를 보인 것으로, 도 13을 참조하면 웹페이지(중요도 순으로 나열)를 가로축으로, log(웹페이지 중요도)를 세로축으로 하여 웹페이지 중요도를 분석하였다.
도 13에 도시된 바와 같이, 웹페이지 중요도가 낮은 곳에서 노출된 개인정보의 수가 많더라고 웹페이지 중요도가 높은 곳에서 노출된 소수의 개인정보가 더 위험한 것으로 판단된다.
이상에서는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법에 대해서 살펴보았다.
이하, 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템에 대해 도 14 및 15를 참조하여 자세히 살펴보기로 한다.
우선, 본 발명이 적용된 시스템은 도 14에 도시된 바와 같으며, 사용자 단말(20)과 네트워크를 통해 연동된 웹사이트 위험도 검색 서비스 서버(21)를 포함한다.
상기 웹사이트 위험도 검색 서비스 서버(21)는 네트워크를 통해 연결된 단말(20)로부터 웹사이트 개인정보 노출 위험도 검색 요청이 수신되면 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드를 실행하여 사용자 인터럽트를 통해 입력된 분석 대상 웹사이트로 로딩하여 상기 웹사이트를 구성하는 웹페이지들 간의 링크 관계에 대한 구조를 분석하고, 분석 결과 기반 웹페이지별 방문 확률을 측정하여 웹사이트에 노출된 개인정보 노출 위험도를 측정하여 서비스 항목별로 지표화하여 표시한다.
여기서, 도 15를 참조하면, 도 15는 본 발명의 일 실시 예에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템에 있어서, 웹사이트 검색 서비스 서버의 상세 블록도를 보인 것으로, 도 15에 도시된 바와 같이 웹사이트 위험도 검색 서비스 서버는, 웹사이트 구조 분석부(50), 웹사이트 제공부(51), 제어부(52), 웹페이지 처리부(56) 및 사용자 인터페이스 제어부(57)를 포함한다.
상기 웹페이지 처리부(56)는 웹사이트 제공부(51)로부터 로딩된 웹사이트의 웹페이지를 파싱하고, 기설정된 정책 기반 하에 파싱된 웹페이지의 링크 기반 추적을 통해 웹페이지를 선별 처리한다.
여기서, 상기 기설정된 정책은 웹사이트를 구성하는 웹페이지별 위험도 계산을 수행하기 이전에 웹사이트에 대응하는 웹페이지별 링크에 따라 계속 접속하면서 중복되게 접속된 웹페이지를 선별하기 위한 것으로, 상기 웹페이지 선별 처리를 통해 본 발명이 적용된 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 지원을 위해 링크 수집 및 노이즈 제거 과정이 선행되어 수행된다.
상기 제어부(52)는 웹사이트 위험도 검색 서비스 서버의 전반적인 동작을 제어하여, 방문 확률 측정부(53), 위험도 측정부(54) 및 위험도 산출부(55)를 포함하며, 제어부(52)의 위험도 산출부(55)에서는 선별 처리 결과 기반 저장된 웹페이지에 대한 기설정된 항목별 정보 수집을 통해 기정의된 위험도 수준을 기반으로 해당 웹페이지 내 노출된 개인정보에 대한 레벨별 가중치를 부여하여 개인정보 노출 위험도를 산출한다.
그리고, 상기 제어부(52)는 상기 방문 확률 측정부(53)를 통해 기설정된 알고리즘(HITS)을 기반으로 상기 웹사이트를 구성하는 웹페이지들 상호 간 연결된 링크의 빈도수로부터 하기의 수학식 5를 통해 (authorities)를 결정하고, 결정된 authrities로부터 (hubs)를 획득하여 상기 웹페이지별 방문 확률 측정을 수행한다.
Figure 112015060855521-pat00042
Figure 112015060855521-pat00043
제어부(52)를 통해 기정의된 위험도 계산 변수 테이블을 기반으로 웹사이트 평균 방문 횟수와 곱셈 연산을 통해 하기식 6의 형태로 웹페이지 기대 방문 횟수로 상기 웹페이지별 방문 확률 측정 결과를 계산한다.
Figure 112015060855521-pat00044
또한, 제어부(52)의 위험도 산출부(55)에서는 웹페이지의 방문 횟수와 해당 웹페이지에 노출된 개인정보 개수에 상대적인 위험수준을 부여하여 하기의 수학식 7을 통해 산출된다.
Figure 112015060855521-pat00045
또한, 특정 웹사이트의 위험도를 구하기 위해 특정 웹사이트내의 모든 웹페이지의 위험도를 모두 더한다. 이는 하기 수학식 8의 형태와 같다.
Figure 112015060855521-pat00046
상기 웹사이트 구조 분석부(50)는 상기 웹사이트를 구성하는 웹페이지들 간을 연결하는 태그 분석을 통해 해당 웹사이트의 링크 관계에 대한 구조를 분석하여 제어부(52)로 출력하며, 상기 제어부(52)의 위험도 측정부(54)는 웹사이트 구조 분석부(50)의 분석 결과를 기반으로 웹페이지별 방문 확률을 측정하여 측정 결과를 통해 상기 웹사이트에 노출된 개인정보 노출 위험도를 측정한다.
상기 사용자 인터페이스 제어부(57)은 제어부(52)의 제어 하에 측정된 상기 웹사이트에 대응하는 노출 위험도를 기설정된 메뉴를 기반으로 서비스 항목별로 지표화하여 상기 웹사이트 개인정보 노출 위험도 검색 모드가 수행되는 네트워크를 통해 연결된 단말의 화면에 표시되도록 제어한다.
다시 도 14를 참조하면, 본 발명의 일 실시 예에 따른 단말(20)은 사용자 인터페이스를 통해 입력된 웹사이트 주소에 따라 상기 웹사이트의 개인정보 노출 위험도 상태 표시 서비스를 네트워크를 통해 연결된 웹사이트 위험도 검색 서비스 서버(21)로부터 지원받고, 상기 웹사이트 위험도 검색 서비스 서버로부터 제공되는 상기 웹사이트의 개인정보 노출 위험도 상태 표시 서비스 데이터를 웹사이트 개인정보 노출 위험도 검색 모드 화면상에 기설정된 영역별로 릴레이 표시하고, 상기 릴레이되어 표시된 개인정보 노출 위험도 상태 표시 서비스 데이터를 호출하여 기설정된 기준에 따라 항목화된 화면을 통해 사용자 인터럽트에 따라 적응적으로 선택하여 표시한다.
여기서, 본 발명의 실시 예에 따른 상기 단말(20)은 바람직하게는 네트워크를 통하여 서버와 데이터 통신이 가능한 단말기며, 디지털 방송 단말기, 개인 정보 단말기(PDA, Personal Digital Assistant), 스마트 폰(Smart Phone), 3G 단말기 예를 들면 IMT-2000(International Mobile Telecommunication 2000) 단말기, WCDMA(Wideband Code Division Multiple Access)단말기, GSM/GPRS(GLOBAL SYSTEM FOR MOBILE COMMUNICATION PACKET RADIO SERVICE) 및 UMTS(Universal Mobile Telecommunication Service) 단말기 등과 같은 모든 정보통신기기 및 멀티미디어 기기와, 그에 대한 응용에도 적용될 수 있음은 자명할 것이다.
상기 단말(20)에서 검색 모드 화면의 일 영역에 마킹된 웹사이트 구조 보기 블록에 대한 사용자 인터럽트가 발생된 경우, 상기 웹사이트 위험도 검색 서비스 서버(21)의 제어부에서는 해당 웹사이트의 메인 페이지 로딩을 통해 전송된 웹페이지 소스 관련 링크를 구현한 요소들을 분석하여 링크된 페이지들을 구하고, 상기 웹사이트의 링크 구조에 따라 접속을 통해 해당 웹사이트를 구성하는 웹페이들의 링크 관계에 대한 데이터를 구축하여 상기 구축된 데이터를 기반으로 상기 웹사이트의 메인 페이지를 나타내는 노드부터 하위의 노드까지 계속 방사되는 페이지 맵의 출력 정보 산출을 통해 웹사이트의 페이지를 나타내는 노드와 상기 노드들 간의 링크를 나타내는 연결선으로 구성된 웹페이지맵을 생성하여 사용자 인터페이스 제어부를 통해 해당 단말로 출력한다.
또한, 상기 검색 모드 화면의 일 영역에 마킹된 웹페이지 위험도 계산 블록에 대한 사용자 인터럽트가 발생된 경우, 상기 웹사이트 위험도 검색 서비스 서버(21)의 제어부는, 상기 웹페이지맵을 구성하는 노드별 해당 웹페이지에 기정의된 위험도 수준을 기반으로 중요도를 부여하여 노드에 대한 단계별 가변 범위에 기초하여 중요도 순위 기반 노드의 크기가 확대된 웹페이지맵을 표시하고, 상기 중요도 순위 기반 노드의 크기가 확대된 웹페이지맵이 표시된 영역에 이웃되게 대응되는 그래프를 생성하여 사용자 인터페이스 제어부를 통해 해당 단말로 출력한다.
그리고, 상기 검색 모드 화면의 일 영역에 마킹된 웹사이트 위험도 계산 블록에 대한 사용자 인터럽트가 발생된 경우, 상기 웹사이트 위험도 검색 서비스 서버의 제어부는, 공인된 인증기관으로부터 웹사이트 위험도 검색 서비스 서버를 통해 관리되는 전체 웹사이트를 리스팅(listing)하고, 기설정된 기간 동안의 웹사이트별 평균 페이지뷰 횟수(혹은 위험도)를 리스팅된 웹사이트별로 대응되게 매칭하여 사용자 인터페이스 제어부를 통해 해당 단말로 출력하여 그래프를 통해 통합 가이드한다. 웹페이지 수집 현황 표시 모드 시, 상기 리스팅된 웹사이트 중 어느 하나의 웹사이트가 선택된 경우 해당 웹사이트의 웹페이지 현황을 계층적 트리 구조로 분류하고, 해당 상태별로 기설정된 수의 필드를 그라데이션하여 백분율로 표시한다.
상기와 같이 본 발명에 따른 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법 및 시스템에 관한 동작이 이루어질 수 있으며, 한편 상기한 본 발명의 설명에서는 구체적인 실시 예에 관해 설명하였으나 여러 가지 변형이 본 발명의 범위를 벗어나지 않고 실시될 수 있다. 따라서 본 발명의 범위는 설명된 실시 예에 의하여 정할 것이 아니고 청구범위와 청구범위의 균등한 것에 의하여 정하여져야 할 것이다.
50: 웹사이트 구조 분석부 51: 웹사이트 제공부
52: 제어부 53: 방문 확률 측정부
54: 위험도 측정부 55: 위험도 산출부
56: 웹페이지 처리부 57: 사용자 인터페이스 제어부
참고문헌
[1] 김유진, 개인정보 탐지 및 위험분석 모델, 학위논문(석사), 성신여자대학교, 2011.
[2] 이기성 외 2명, 개인정보 노출을 예방하는 방법에 관한 연구, 정보보안 논문지, 12권, 1호, 71-77, 2012.
[3] 천명호 외 2명, SNS에서 개인정보유출방지를 위한 개인정보 유출위험도 측정 방법, 한국정보보호학회, 23권, 6호, 1199-1206, 2013.
[4] 김성희 외 1명, 하이퍼링크 구조를 이용한 웹 검색의 순위 알고리즘에 관한 연구, 정보관리연구, 37권, 2호, 33-50,

Claims (27)

  1. 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드가 실행되면, 사용자 인터럽트를 통해 입력된 분석 대상 웹사이트로 동적으로 로딩하는 과정과,
    로딩된 웹사이트를 구성하는 웹페이지를 파싱하고, 기설정된 정책 기반 하에 파싱된 웹페이지의 링크 기반 추적을 통해 웹페이지를 선별 처리하는 과정과,
    선별 처리 결과 기반 저장된 웹페이지에 대한 기설정된 항목별 정보 수집을 통해 기정의된 위험도 수준을 기반으로 해당 웹페이지 내 노출된 개인정보에 대한 레벨별 가중치를 부여하여 개인정보 노출 위험도를 산출하는 과정과,
    상기 웹사이트를 구성하는 웹페이지들 간을 연결하는 태그 분석을 통해 해당 웹사이트의 링크 관계에 대한 구조를 분석하고, 분석 결과를 기반으로 웹페이지별 방문 확률을 측정하여 측정 결과를 통해 상기 웹사이트에 노출된 개인정보 노출 위험도를 측정하는 과정과,
    측정된 상기 웹사이트에 대응하는 노출 위험도를 기설정된 메뉴를 기반으로 서비스 항목별로 지표화하여 상기 웹사이트 개인정보 노출 위험도 검색 모드가 수행되는 화면에 표시하는 과정을 포함하고,
    상기 지표화하는 과정은,
    웹사이트 위험도 검색 서비스 서버를 통해 제공되는 복수의 분할된 영역을 갖는 웹사이트 개인정보 노출 위험도 검색 모드 화면상에서 상기 분할된 각 영역에 상기 검색 모드 화면의 일 영역으로부터 입력된 웹사이트 메인 웹페이지에 대응하는 기설정된 서비스 항목별 노출 위험도 결과 정보가 릴레이되어 표시됨을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 검색 모드 화면의 일 영역에 마킹된 웹사이트 구조 보기 블록에 대한 사용자 인터럽트가 발생된 경우,
    해당 웹사이트의 메인 페이지 로딩을 통해 전송된 웹페이지 소스 관련 링크를 구현한 요소들을 분석하여 링크된 페이지들을 구하는 과정과,
    상기 웹사이트의 링크 구조에 따라 접속을 통해 해당 웹사이트를 구성하는 웹페이지들의 링크 관계에 대한 데이터를 구축하는 과정과,
    상기 구축된 데이터를 기반으로 상기 웹사이트의 메인 페이지를 나타내는 노드부터 하위의 노드까지 계속 방사되는 페이지 맵의 출력 정보 산출을 통해 웹사이트의 페이지를 나타내는 노드와 상기 노드들 간의 링크를 나타내는 연결선으로 구성된 웹페이지맵을 생성하여 출력하는 과정을 포함함을 특징을 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  4. 제3항에 있어서,
    상기 검색 모드 화면의 일 영역에 마킹된 웹페이지 위험도 계산 블록에 대한 사용자 인터럽트가 발생된 경우,
    상기 웹페이지맵을 구성하는 노드별 해당 웹페이지에 기정의된 위험도 수준을 기반으로 중요도를 부여하여 노드에 대한 단계별 가변 범위에 기초하여 중요도 순위 기반 노드의 크기가 확대된 웹페이지맵을 표시하는 과정과,
    상기 중요도 순위 기반 노드의 크기가 확대된 웹페이지맵이 표시된 영역에 이웃되게 대응되는 그래프를 생성하여 표시하는 과정을 더 포함함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  5. 제4항에 있어서, 상기 단계별 가변 범위는,
    기설정된 크기의 단위 노드를 기준으로 2배율 및 3배율로 확장되는 범위임을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  6. 제4항에 있어서, 상기 그래프는,
    상기 노드별 부여된 중요도를 입력으로 받아 입력값을 연결하여 그래프 생성 클래스 실행을 통해 생성됨을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  7. 제4항에 있어서, 상기 웹페이지맵을 구성하는 노드별 사용자 인터럽트를 감시하여 상기 사용자 인터럽트가 발생된 노드별 해당 웹페이지의 노출된 개인정보 횟수에 대응하는 그래프를 표시함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  8. 제1항에 있어서,
    상기 검색 모드 화면의 일 영역에 마킹된 웹사이트 위험도 계산 블록에 대한 사용자 인터럽트가 발생된 경우, 웹사이트 위험도 검색 서비스 서버를 통해 관리되는 전체 웹사이트를 리스팅(listing)하고, 기설정된 기간 동안의 웹사이트별 평균 페이지뷰 횟수(혹은 위험도)를 리스팅된 웹사이트별로 대응되게 매칭하여 그래프를 통해 통합 가이드함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  9. 제8항에 있어서, 웹페이지 수집 현황 표시 모드 시,
    상기 리스팅된 웹사이트 중 어느 하나의 웹사이트가 선택된 경우 해당 웹사이트의 웹페이지 수집 현황을 계층적 트리 구조로 분류하고, 해당 상태별로 기설정된 수의 필드를 그라데이션하여 백분율로 표시함을을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  10. 제1항에 있어서, 상기 기정의된 위험도 수준은,
    기인증된 기관으로부터 발행되어 개인정보의 민감도와 악용 시 피해 정도에 따라 복수의 유형별 적어도 하나 이상의 개인정보 항목이 각각 분류되어 위험수준 레벨이 설정됨을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  11. 제1항에 있어서, 상기 웹페이지별 방문 확률 측정은,
    기설정된 알고리즘(HITS)을 기반으로 상기 웹사이트를 구성하는 웹페이지들 상호 간 연결된 링크의 빈도수로부터 하기의 수학식을 통해 권한(authority)을 결정하고, 결정된 권한(authority)으로부터 허브들(hubs)을 획득하여 수행됨을 특징을 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
    Figure 112016053370054-pat00047

    Figure 112016053370054-pat00048
  12. 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드가 실행되면, 사용자 인터럽트를 통해 입력된 분석 대상 웹사이트로 동적으로 로딩하는 과정과,
    로딩된 웹사이트를 구성하는 웹페이지를 파싱하고, 기설정된 정책 기반 하에 파싱된 웹페이지의 링크 기반 추적을 통해 웹페이지를 선별 처리하는 과정과,
    선별 처리 결과 기반 저장된 웹페이지에 대한 기설정된 항목별 정보 수집을 통해 기정의된 위험도 수준을 기반으로 해당 웹페이지 내 노출된 개인정보에 대한 레벨별 가중치를 부여하여 개인정보 노출 위험도를 산출하는 과정과,
    상기 웹사이트를 구성하는 웹페이지들 간을 연결하는 태그 분석을 통해 해당 웹사이트의 링크 관계에 대한 구조를 분석하고, 분석 결과를 기반으로 웹페이지별 방문 확률을 측정하여 측정 결과를 통해 상기 웹사이트에 노출된 개인정보 노출 위험도를 측정하는 과정과,
    측정된 상기 웹사이트에 대응하는 노출 위험도를 기설정된 메뉴를 기반으로 서비스 항목별로 지표화하여 상기 웹사이트 개인정보 노출 위험도 검색 모드가 수행되는 화면에 표시하는 과정을 포함하고,
    상기 웹페이지별 방문 확률 측정 결과는,
    기정의된 위험도 계산 변수 테이블을 기반으로 웹사이트 평균 방문 횟수와 곱셈 연산을 통해 하기식 형태로 웹페이지 예상 방문 횟수로 계산됨을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
    Figure 112016053370054-pat00049
  13. 제1항에 있어서, 상기 저장된 웹페이지에 대한 위험도는,
    웹사이트 위험도 검색 서비스 서버를 통해 제공되는 웹페이지의 방문 횟수와 해당 웹페이지에 노출된 개인정보 개수에 상대적인 위험수준을 부여하여 하기의 식을 통해 산출됨을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
    Figure 112015060855521-pat00050
  14. 제13항에 있어서,
    소정의 웹사이트를 구성하는 웹페이지의 위험도를 하기식 형태로 총합하여 상기 소정 웹사이트의 위험도를 산출함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
    Figure 112015060855521-pat00051
  15. 제1항에 있어서, 상기 기설정된 정책 기반 하에 웹페이지를 선별 처리하는 과정은,
    상기 로딩된 웹사이트에 대응하는 웹페이지를 소정 라이브러리를 통해 파싱하고, 상기 웹사이트에서 표시되는 서비스 웹페이지별 HTML 데이터를 추출하여 웹페이지의 소스 정보를 분석하는 과정과,
    상기 소스 정보 분석 결과를 통해 웹페이지별 링크를 추적하여 웹페이지들에 대한 기설정된 항목별 정보 수집 관련 방문 이력 여부를 해쉬함수를 기반으로 웹페이지의 해쉬값을 계산하여 판단하는 과정과,
    판단 결과, 계산된 해쉬값이 해쉬값 리스트에 존재하지 않는 경우, 해쉬값 리스트에 해쉬값을 추가하고, 해당 웹페이지를 지정된 DB에 저장하는 과정과,
    상기 계산된 해쉬값이 해쉬값 리스트에 존재하는 경우, 현재 웹페이지 URL을 이전 웹페이지 URL로 변경하여 해당 칼럼을 업데이트하는 과정을 포함함을 특징을 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  16. 제1항에 있어서, 상기 웹사이트에 노출된 개인정보 노출 위험도를 측정하는 과정은,
    상기 웹사이트를 구성하는 웹페이지에 대한 중복 링크 제거 및 개인정보가 부재한 링크 제거를 통해 웹페이지 중요도로 산출됨을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법.
  17. 네트워크를 통해 연결된 단말로부터 웹사이트 개인정보 노출 위험도 검색 요청이 수신되면 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드를 실행하여 사용자 인터럽트를 통해 입력된 분석 대상 웹사이트로 로딩하여 상기 웹사이트를 구성하는 웹페이지들 간의 링크 관계에 대한 구조를 분석하고, 분석 결과 기반 웹페이지별 방문 확률을 측정하여 웹사이트에 노출된 개인정보 노출 위험도를 측정하여 서비스 항목별로 지표화하여 표시하는 웹사이트 위험도 검색 서비스 서버와,
    사용자 인터페이스를 통해 입력된 웹사이트 주소에 따라 상기 웹사이트의 개인정보 노출 위험도 상태 표시 서비스를 네트워크를 통해 연결된 웹사이트 위험도 검색 서비스 서버로부터 지원받고, 상기 웹사이트 위험도 검색 서비스 서버로부터 제공되는 상기 웹사이트의 개인정보 노출 위험도 상태 표시 서비스 데이터를 웹사이트 개인정보 노출 위험도 검색 모드 화면상에 기설정된 영역별로 릴레이 표시하고, 상기 릴레이되어 표시된 개인정보 노출 위험도 상태 표시 서비스 데이터를 호출하여 기설정된 기준에 따라 항목화된 화면을 통해 사용자 인터럽트에 따라 적응적으로 선택하여 표시하는 단말을 포함하고,
    상기 단말은,
    복수의 분할된 영역을 갖는 웹사이트 개인정보 노출 위험도 검색 모드 화면을 통해 상기 웹사이트 위험도 검색 서비스 서버의 제어부로부터 제공되는 상기 검색 모드 화면의 일 영역에 입력된 웹사이트 메인 웹페이지에 대응하는 기설정된 서비스 항목별 노출 위험도 결과 정보를 상기 분할된 각 영역에 릴레이되어 표시되도록 함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템.
  18. 제17항에 있어서, 상기 웹사이트 위험도 검색 서비스 서버는,
    웹사이트 제공부로부터 로딩된 웹사이트의 웹페이지를 파싱하고, 기설정된 정책 기반 하에 파싱된 웹페이지의 링크 기반 추적을 통해 웹페이지를 선별 처리하는 웹페이지 처리부와,
    선별 처리 결과 기반 저장된 웹페이지에 대한 기설정된 항목별 정보 수집을 통해 기정의된 위험도 수준을 기반으로 해당 웹페이지 내 노출된 개인정보에 대한 레벨별 가중치를 부여하여 개인정보 노출 위험도를 산출하는 위험도 산출부와,
    상기 웹사이트를 구성하는 웹페이지들 간을 연결하는 태그 분석을 통해 해당 웹사이트의 링크 관계에 대한 구조를 분석하는 웹사이트 구조 분석부와,
    분석 결과를 기반으로 웹페이지별 방문 확률을 측정하여 측정 결과를 통해 상기 웹사이트에 노출된 개인정보 노출 위험도를 측정하는 제어부와,
    상기 제어부의 제어 하에 측정된 상기 웹사이트에 대응하는 노출 위험도를 기설정된 메뉴를 기반으로 서비스 항목별로 지표화하여 상기 웹사이트 개인정보 노출 위험도 검색 모드가 수행되는 네트워크를 통해 연결된 단말의 화면에 표시되도록 제어하는 사용자 인터페이스 제어부를 포함함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템.
  19. 삭제
  20. 제17항에 있어서, 상기 검색 모드 화면의 일 영역에 마킹된 웹사이트 구조 보기 블록에 대한 사용자 인터럽트가 발생되면,
    상기 웹사이트 위험도 검색 서비스 서버의 제어부는,
    해당 웹사이트의 메인 페이지 로딩을 통해 전송된 웹페이지 소스 관련 링크를 구현한 요소들을 분석하여 링크된 페이지들을 구하고, 상기 웹사이트의 링크 구조에 따라 접속을 통해 해당 웹사이트를 구성하는 웹페이들의 링크 관계에 대한 데이터를 구축하여 상기 구축된 데이터를 기반으로 상기 웹사이트의 메인 페이지를 나타내는 노드부터 하위의 노드까지 계속 방사되는 페이지 맵의 출력 정보 산출을 통해 웹사이트의 페이지를 나타내는 노드와 상기 노드들 간의 링크를 나타내는 연결선으로 구성된 웹페이지맵을 생성하여 사용자 인터페이스 제어부를 통해 해당 단말로 출력함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템.
  21. 제20항에 있어서, 상기 검색 모드 화면의 일 영역에 마킹된 웹페이지 위험도 계산 블록에 대한 사용자 인터럽트가 발생된 경우,
    상기 웹사이트 위험도 검색 서비스 서버의 제어부는,
    상기 웹페이지맵을 구성하는 노드별 해당 웹페이지에 기정의된 위험도 수준을 기반으로 중요도를 부여하여 노드에 대한 단계별 가변 범위에 기초하여 중요도 순위 기반 노드의 크기가 확대된 웹페이지맵을 표시하고, 상기 중요도 순위 기반 노드의 크기가 확대된 웹페이지맵이 표시된 영역에 이웃되게 대응되는 그래프를 생성하여 사용자 인터페이스 제어부를 통해 해당 단말로 출력함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템.
  22. 제17항에 있어서, 상기 검색 모드 화면의 일 영역에 마킹된 웹사이트 위험도 계산 블록에 대한 사용자 인터럽트가 발생된 경우,
    상기 웹사이트 위험도 검색 서비스 서버의 제어부는,
    웹사이트 위험도 검색 서비스 서버를 통해 관리되는 전체 웹사이트를 리스팅(listing)하고, 기설정된 기간 동안의 웹사이트별 평균 페이지뷰 횟수(혹은 위험도)를 리스팅된 웹사이트별로 대응되게 매칭하여 사용자 인터페이스 제어부를 통해 해당 단말로 출력하여 그래프를 통해 통합 가이드함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템.
  23. 제22항에 있어서, 웹페이지 수집 현황 표시 모드 시,
    상기 리스팅된 웹사이트 중 어느 하나의 웹사이트가 선택된 경우 해당 웹사이트의 웹페이지 수집 현황을 계층적 트리 구조로 분류하고, 해당 상태별로 기설정된 수의 필드를 그라데이션하여 백분률로 표시함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템.
  24. 제17항에 있어서, 상기 웹사이트 위험도 검색 서비스 서버는,
    제어부를 통해 기설정된 알고리즘(HITS)을 기반으로 상기 웹사이트를 구성하는 웹페이지들 상호 간 연결된 링크의 빈도수로부터 하기의 수학식을 통해 권한(authority)을 결정하고, 결정된 권한(authority)으로부터 허브들(hubs)을 획득하여 상기 웹페이지별 방문 확률 측정을 수행함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템.
    Figure 112016053370054-pat00052

    Figure 112016053370054-pat00053
  25. 네트워크를 통해 연결된 단말로부터 웹사이트 개인정보 노출 위험도 검색 요청이 수신되면 웹사이트별 개인정보 노출 위험도 상태 표시 서비스 지원을 위한 웹사이트 개인정보 노출 위험도 검색 모드를 실행하여 사용자 인터럽트를 통해 입력된 분석 대상 웹사이트로 로딩하여 상기 웹사이트를 구성하는 웹페이지들 간의 링크 관계에 대한 구조를 분석하고, 분석 결과 기반 웹페이지별 방문 확률을 측정하여 웹사이트에 노출된 개인정보 노출 위험도를 측정하여 서비스 항목별로 지표화하여 표시하는 웹사이트 위험도 검색 서비스 서버와,
    사용자 인터페이스를 통해 입력된 웹사이트 주소에 따라 상기 웹사이트의 개인정보 노출 위험도 상태 표시 서비스를 네트워크를 통해 연결된 웹사이트 위험도 검색 서비스 서버로부터 지원받고, 상기 웹사이트 위험도 검색 서비스 서버로부터 제공되는 상기 웹사이트의 개인정보 노출 위험도 상태 표시 서비스 데이터를 웹사이트 개인정보 노출 위험도 검색 모드 화면상에 기설정된 영역별로 릴레이 표시하고, 상기 릴레이되어 표시된 개인정보 노출 위험도 상태 표시 서비스 데이터를 호출하여 기설정된 기준에 따라 항목화된 화면을 통해 사용자 인터럽트에 따라 적응적으로 선택하여 표시하는 단말을 포함하고,
    상기 웹사이트 위험도 검색 서비스 서버는,
    제어부를 통해 기정의된 위험도 계산 변수 테이블을 기반으로 웹사이트 평균 방문 횟수와 곱셈 연산을 통해 하기식 형태로 웹페이지 예상 방문 횟수로 상기 웹페이지별 방문 확률 측정 결과를 계산함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템.
    Figure 112016053370054-pat00054
  26. 제18항에 있어서, 상기 위험도 산출부는,
    상기 제어부를 통해 제공되는 웹페이지의 방문 횟수와 해당 웹페이지에 노출된 개인정보 개수에 상대적인 위험수준을 부여하여 하기의 식을 통해 산출됨을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템.
    Figure 112015060855521-pat00055
  27. 제26항에 있어서, 상기 위험도 산출부는,
    소정의 웹사이트를 구성하는 웹페이지의 위험도를 하기식 형태로 총합하여 상기 소정 웹사이트의 위험도를 산출함을 특징으로 하는 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 시스템.
    Figure 112015060855521-pat00056
KR1020150089208A 2015-06-23 2015-06-23 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법 및 시스템 KR101664109B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150089208A KR101664109B1 (ko) 2015-06-23 2015-06-23 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150089208A KR101664109B1 (ko) 2015-06-23 2015-06-23 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법 및 시스템

Publications (1)

Publication Number Publication Date
KR101664109B1 true KR101664109B1 (ko) 2016-10-10

Family

ID=57145621

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150089208A KR101664109B1 (ko) 2015-06-23 2015-06-23 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101664109B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807159A (zh) * 2019-10-30 2020-02-18 同盾控股有限公司 数据标记方法、装置、存储介质及电子设备
CN112039885A (zh) * 2020-08-31 2020-12-04 绿盟科技集团股份有限公司 一种网站风险评估方法及装置
KR102279359B1 (ko) * 2021-02-22 2021-07-20 주식회사 지란지교데이터 선택적 비식별 개인정보 활용 방법 및 장치
KR102533008B1 (ko) * 2022-12-29 2023-05-17 월드버텍 주식회사 비정형 데이터로부터 개인정보를 탐지하고 노출 위험도를 측정하는 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106820A (ja) * 2004-09-30 2006-04-20 Toshiba Corp リスク予測値推定方法および該方法を実行可能な情報処理装置
JP2008090586A (ja) * 2006-10-02 2008-04-17 Tsukuba Secure Network Research Co Ltd ウェブサイトの正当性判定支援システム
KR100992069B1 (ko) * 2010-03-19 2010-11-04 한국인터넷진흥원 인터넷상의 개인정보 노출대응 시스템 및 방법
KR20130032660A (ko) 2011-09-23 2013-04-02 한전케이디엔주식회사 개인정보 유출 검색 시스템 및 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006106820A (ja) * 2004-09-30 2006-04-20 Toshiba Corp リスク予測値推定方法および該方法を実行可能な情報処理装置
JP2008090586A (ja) * 2006-10-02 2008-04-17 Tsukuba Secure Network Research Co Ltd ウェブサイトの正当性判定支援システム
KR100992069B1 (ko) * 2010-03-19 2010-11-04 한국인터넷진흥원 인터넷상의 개인정보 노출대응 시스템 및 방법
KR20130032660A (ko) 2011-09-23 2013-04-02 한전케이디엔주식회사 개인정보 유출 검색 시스템 및 방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110807159A (zh) * 2019-10-30 2020-02-18 同盾控股有限公司 数据标记方法、装置、存储介质及电子设备
CN110807159B (zh) * 2019-10-30 2021-05-11 同盾控股有限公司 数据标记方法、装置、存储介质及电子设备
CN112039885A (zh) * 2020-08-31 2020-12-04 绿盟科技集团股份有限公司 一种网站风险评估方法及装置
CN112039885B (zh) * 2020-08-31 2022-09-02 绿盟科技集团股份有限公司 一种网站风险评估方法及装置
KR102279359B1 (ko) * 2021-02-22 2021-07-20 주식회사 지란지교데이터 선택적 비식별 개인정보 활용 방법 및 장치
KR102533008B1 (ko) * 2022-12-29 2023-05-17 월드버텍 주식회사 비정형 데이터로부터 개인정보를 탐지하고 노출 위험도를 측정하는 방법

Similar Documents

Publication Publication Date Title
CN102741839B (zh) 基于用户浏览器历史的url过滤
Kallepalli et al. Measuring and modeling usage and reliability for statistical web testing
CN1941782B (zh) 将安全漏洞关联于资产的系统和方法
US8429750B2 (en) Search engine with webpage rating feedback based Internet search operation
KR101664109B1 (ko) 웹사이트 구조 기반 개인정보 노출 위험도 제공 서비스 방법 및 시스템
US7860971B2 (en) Anti-spam tool for browser
US20080134015A1 (en) Web Site Structure Analysis
CN103221959A (zh) 通过确定链接的信誉来保护不受未知恶意行为危害的方法和系统
CN110704873B (zh) 一种防止敏感数据泄漏的方法及系统
CN106354877A (zh) 网页离线浏览方法及装置
US12045843B2 (en) Systems and methods for tracking data shared with third parties using artificial intelligence-machine learning
CN107896219A (zh) 一种网站脆弱性的检测方法、系统及相关装置
KR20100095208A (ko) 웹 페이지 클릭 정보 추적 시스템 및 방법
CN108667766A (zh) 文件探测方法及文件探测装置
CN107783976A (zh) 用户信息挖掘方法及装置
CN112307292A (zh) 基于高级持续性威胁攻击的信息处理方法及系统
CN108536702A (zh) 一种相关实体确定方法、装置及计算设备
CN109002550B (zh) 一种针对还原设备的测试方法及装置
CN109086429B (zh) Ivr语音导航的方法、系统、设备及存储介质
KR101959213B1 (ko) 침해 사고 예측 방법 및 그 장치
CA2906517A1 (en) Online privacy management
KR101648349B1 (ko) 웹사이트 위험도 산출 장치 및 그 방법
CN104598458B (zh) 页面检测方法及装置
Kumar et al. A brief investigation on web usage mining tools (WUM)
CN110059480A (zh) 网络攻击行为监控方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
R401 Registration of restoration