KR102060766B1 - 다크웹 범죄 사이트 모니터링 시스템 - Google Patents

다크웹 범죄 사이트 모니터링 시스템 Download PDF

Info

Publication number
KR102060766B1
KR102060766B1 KR1020170150770A KR20170150770A KR102060766B1 KR 102060766 B1 KR102060766 B1 KR 102060766B1 KR 1020170150770 A KR1020170150770 A KR 1020170150770A KR 20170150770 A KR20170150770 A KR 20170150770A KR 102060766 B1 KR102060766 B1 KR 102060766B1
Authority
KR
South Korea
Prior art keywords
index
information
site
unit
crime
Prior art date
Application number
KR1020170150770A
Other languages
English (en)
Other versions
KR20190054478A (ko
Inventor
양중식
염경록
곽용진
Original Assignee
주식회사 이르테크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 이르테크 filed Critical 주식회사 이르테크
Priority to KR1020170150770A priority Critical patent/KR102060766B1/ko
Publication of KR20190054478A publication Critical patent/KR20190054478A/ko
Application granted granted Critical
Publication of KR102060766B1 publication Critical patent/KR102060766B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • G06F17/2755
    • G06F17/2765
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Educational Administration (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Technology Law (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 색인 정보를 이용하여 범죄 사이트 또는 게시물 검색, 범죄 사이트 유무 판별 및 증거 분석 중 하나 이상이 수행되도록 제어하고, 다크웹 내 범죄 사이트의 불법 거래, 불법 유통 또는 불법 정보와 관련된 증거를 수집하여 모니터링하는 다크웹 범죄 사이트 모니터링 시스템을 개시한다.

Description

다크웹 범죄 사이트 모니터링 시스템{SYSTEM FOR MONITORING CRIME SITE IN DARK WEB}
본 발명은 다크웹 범죄 사이트 모니터링 시스템에 관한 것으로서, 더욱 상세하게는 다크웹 내 범죄 사이트를 모니터링하여 불법 거래, 불법 유통 또는 불법 정보와 관련된 증거를 수집하는 기술에 관한 것이다.
종래에는 특허문헌과 같이 일반적인 경로인 인터넷상에서 불법 저작물과 관련된 유통을 모니터링 또는 증거를 수집하여 저작권자의 권리를 보호할 수 있고, 인터넷상의 공정 거래가 이루어지도록 할 수 있다.
그러나 최근에는 익명의 사용자들이 일반적인 검색을 통하여 접근하기 어렵고, 익명화 서비스 프로그램을 통하여 접근이 가능하여 사이버상에서의 범죄로 활용되고 있는 다크웹(dark web)을 통하여 불공정 거래 또는 불법 거래가 이루어지고 있다. 예를 들어 최근에는 익명의 사용자들이 마약과 무기, 해킹 프로그램 및 음란물 등을 불법으로 거래할 수 있고, 금융 정보 또는 신원 정보 등 불법 정보를 유통시킬 수 있으며, 결제수단으로 가상화폐인 비트코인을 사용할 수 있기 때문에, 다크웹을 이용한 불공정 거래 비중 또는 불법적인 거래 유통 비중이 지속적으로 성장하고 있고, 전세계적으로 경제적 또는 산업적 피해가 증가하고 있다.
한국등록특허 제10-1485128호
본 발명은 상기와 같은 문제점을 해결하고자 범죄와 관련된 수집 대상에 대응하여 색인 정보를 생성하여 사이트 검색, 범죄 사이트 판별 및 증거 분석 중 하나 이상을 수행하는 다크웹 범죄 사이트 모니터링 시스템을 제공한다.
상기 과제를 달성하기 위한 본 발명에 따른 다크웹 범죄 사이트 모니터링 시스템은, 다크웹 내 색인 추출용 사이트의 게시물 정보로부터 색인어를 추출하고, 역색인어를 구축하여 색인 정보를 생성하는 색인 분석부 및 상기 색인 정보를 이용하여 범죄 사이트 또는 게시물 검색, 범죄 사이트 유무 판별 및 증거 분석 중 하나 이상이 수행되도록 제어하는 제어부를 포함하여, 상기 다크웹 내 범죄 사이트의 불법 거래, 불법 유통 또는 불법 정보와 관련된 증거를 수집하여 모니터링하는 것을 특징으로 한다.
상기 색인 분석부는 색인 추출용 사이트의 게시물 정보를 문장 단위로 분리하는 문장 분리부; 각각의 문장을 형태소 단위로 분할하는 형태소 분할부; 범죄 용어 정보를 이용하여 범죄와 관련된 단어 단위의 색인어를 인식하는 색인어 인식부; 문장에서 시계열적으로 가중되는 색인어 또는 소정의 출현 빈도수를 갖는 색인어를 중심으로 어휘 중요도를 분석하는 어휘 분석부 및 소정의 어휘 중요도를 갖는 색인어로부터 역색인어를 구축하는 역색인 구축부를 포함하는 것을 특징으로 할 수 있다.
본 발명에 따른 다크웹 범죄 사이트 모니터링 시스템은, 시드 URL 리스트를 저장하는 저장부; 상기 시드 URL 리스트를 설정하는 설정부; 익명화 서비스를 이용하여 다크웹에 접속하는 다크웹 접속부; 상기 시드 URL 리스트를 이용하여 색인 추출용 사이트를 검색하는 검색부 및 상기 색인 추출용 사이트의 게시물 정보를 수집하는 수집부를 더 포함하는 것을 특징으로 할 수 있다.
상기 검색부는 저장부에 범죄 사이트 정보, 색인 정보 또는 범죄 용어 정보가 미리 저장되어 있으면, 저장부에 미리 저장된 정보를 이용하여 색인 추출용 사이트를 검색하는 것을 특징으로 할 수 있다.
상기 다크웹 접속부는 사이버 공공기관 관리서버 또는 공공기관 사용자 단말기로 다크웹 접속을 제공하는 것을 특징으로 할 수 있다.
본 발명은 다크웹 내 범죄 사이트를 모니터링하여 불법 거래, 불법 유통 또는 불법 정보와 관련된 증거를 수집할 수 있고, 사이버 범죄 수사의 기초 자료를 제공할 수 있으며, 불법적 거래 유통의 비중을 감소시킬 수 있다.
도 1은 본 발명의 실시예에 따른 다크웹 범죄 사이트 모니터링 시스템을 도시한 블록도이다.
도 2는 도 1의 다크웹 범죄 사이트 모니터링 시스템의 동작 방법을 도시한 흐름도이다.
도 3은 도 2의 색인 정보 생성 이전의 전처리 동작 방법을 도시한 흐름도이다.
도 4는 도 2의 색인 정보 생성 방법을 도시한 흐름도이다.
도 5는 도 4의 색인 정보 생성 방법을 도식화한 예이다.
도 6은 도 1의 색인 분석부를 상세하게 도시한 블록도이다.
도 7은 도 2의 증거 수집 및 증거 분석 방법을 도시한 흐름도이다.
도 8은 증거 정보를 통계 처리하는 예를 도시한 것이다.
도 9는 템플릿 정보를 이용하여 모니터링 정보를 시각화하는 예를 도시한 것이다.
도 10은 도 1의 저장부를 상세하게 도시한 블록도이다.
이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시예를 상세하게 설명하지만, 본 발명이 실시예에 의해 제한되거나 한정되는 것은 아니다.
도 1은 본 발명의 실시예에 따른 다크웹 범죄 사이트 모니터링 시스템을 도시한 블록도로서, 다크웹 범죄 사이트 모니터링 시스템(100)은 다크웹 내 범죄 사이트를 모니터링하여 불법 거래, 불법 유통 또는 불법 정보와 관련된 증거를 수집하고, 수집된 증거를 사이버 공공기관 관리서버(200) 또는 공공기관 사용자 단말기(미도시)로 제공한다. 공공기관 사용자는 사이버 범죄를 수사할 때 다크웹 범죄 사이트의 증거를 활용한다.
다크웹 범죄 사이트 모니터링 시스템(100)은 사이버 공공기관 관리서버(200) 또는 공공기관 사용자 단말기로부터 증거 정보 요청을 수신하면, 증거 정보를 수집하여 사이버 공공기관 관리서버(200) 또는 공공기관 사용자 단말기로 전송할 수 있다.
다크웹 범죄 사이트 모니터링 시스템(100)은 사이버 공공기관 관리서버(200) 또는 공공기관 사용자 단말기로 다크웹 접속을 제공할 수 있다.
다크웹 범죄 사이트 모니터링 시스템(100)은 색인 분석부(110), 설정부(120), 저장부(130), 다크웹 접속부(140), 검색부(150), 수집부(160), 모니터링부(170) 및 제어부(180) 중 하나 이상을 포함한다.
도 2는 도 1의 다크웹 범죄 사이트 모니터링 시스템의 동작 방법을 도시한 흐름도로서, 다크웹 범죄 사이트 모니터링 시스템(100)은 색인 정보가 범죄 사이트 또는 게시물 검색, 범죄 사이트 유무 판별 및 증거 분석 중 하나 이상에 이용되므로, 색인 분석부(110)에서 색인 정보를 생성하고, 제어부(180)에서 범죄 사이트 또는 게시물 검색, 범죄 사이트 유무 판별 및 증거 분석 중 하나 이상이 수행되도록 제어한다.
도 3은 도 2의 색인 정보 생성 이전의 전처리 동작 방법을 도시한 흐름도로서, 저장부(130)는 시드 URL 리스트를 저장하고, 설정부(120)는 수집 대상 및 범죄 유형에 대응하는 검색 조건을 설정하고, 범죄 사이트를 추출하기 위한 시드 URL 리스트를 설정한다. 수집 대상은 불법 거래, 불법 유통 및 불법 정보로 구분된다. 예를 들어 불법 거래에 따른 범죄 유형은 마약, 무기 또는 청부 살인과 관련된 것이고, 불법 유통에 따른 범죄 유형은 음란물 동영상 또는 위조 상품과 관련된 것이며, 불법 정보에 따른 범죄 유형은 금융 정보 또는 신원 정보와 관련된 것이며, 이에 한정하지 않는다.
저장부(130)는 초기에 범죄 사이트 정보를 보유하지 않으므로, 범죄 사이트의 초기 수집을 위한 시드 URL 리스트를 저장한다. 시드 URL 리스트는 히든위키 사이트, 다크웹 광고 사이트 및 다크웹 검색 사이트 중 하나 이상을 포함한다.
다크웹 접속부(140)는 익명화 서비스를 이용하여 다크웹에 접속한다. 익명화 서비스는 온라인 상에서 트래픽 분석이나, IP 주소 추적을 불가능하게 하여 프라이버시와 보안을 보장하는 익명성 네트워크를 제공하는 서비스로서, 토르(TOR: The Onion Routing), 아이투피(I2P) 또는 프리넷(freenet)일 수 있다.
토르는 프록시 소프트웨어 중 하나로서, 사용자의 인터넷 트래픽은 암호화되며, 보안과 익명성을 얻기 위해 특정한 방식으로 라우팅된다. 토르는 웹사이트, 시장, 인스턴트 메세지 서비스 및 이메일 서비스와 같은 서비스를 이용자들이 실행할 수 있도록 하는 소위 TOR 히든 서비스 프로토콜(TOR Hidden Services Protocol)을 지원한다.
아이투피는 익명 네트워크이고, 프로그램간의 익명통신을 위해 사용되는 기술이며, 네트워크 자체가 엄격한 메시지 기반이지만, 신뢰할 수 있는 스트리밍 통신을 가능하게 하는 라이브러리도 있다.
프리넷은 검열을 피하는 통신을 위한 피어 투 피어 플랫폼이고, 분산된 분산 데이터 저장소를 사용하여 정보를 보관하여 전달하며, 검열에 대한 두려움이 없이 웹에서 게시 및 통신 할 수 있는 무료 소프트웨어 모음을 제공한다.
검색부(150)는 시드 URL 리스트를 이용하여 색인 추출용 사이트를 검색한다. 검색부(150)는 저장부(130)에 범죄 사이트 정보, 색인 정보 또는 범죄 용어 정보가 미리 저장되어 있으면, 저장부에 미리 저장된 정보를 이용하여 색인 추출용 사이트를 검색한다.
수집부(160)는 색인 추출용 사이트의 게시물 정보를 수집하고, 색인 분석부(110)는 다크웹 내 색인 추출용 사이트의 게시물 정보로부터 색인어를 추출하고, 역색인어를 구축하여 색인 정보를 생성한다.
도 4는 도 2의 색인 정보 생성 방법을 도시한 흐름도이고, 도 5는 도 4의 색인 정보 생성 방법을 도식화한 예로서, 색인 분석부(110)는 게시물로부터 색인어를 추출하고, 각 게시물 당 색인어 수를 카운팅하며, 키워드 순서로 정렬한다.
색인 분석부(110)는 키워드 당 역색인 벡터를 생성하고, 역색인 벡터를 압축하며, 색인어 목록을 자료구조 색인한다. 역색인 벡터를 압축하는 이유는 게시물 벡터와 위치 벡터를 저장할 때 정수 배열이 많이 사용되므로, 이러한 벡터를 압축하여 색인을 작게 하고, 검색을 빠르게 하도록 하기 위해서이다.
색인어 추출 방법은 형태소 분석을 이용할 수 있고, N-gram 방식, Term-gram 방식 또는 토큰 단위 방식을 이용할 수 있다.
도 6은 도 1의 색인 분석부를 상세하게 도시한 블록도로서, 색인 분석부(110)는 문장 분리부(111), 형태소 분할부(112), 색인어 인식부(113), 어휘 분석부(114) 및 역색인 구축부(115)를 포함한다.
문장 분리부(111)는 색인 추출용 사이트의 게시물 정보를 문장 단위로 분리한다. 문장 분리부(111)는 게시물을 규칙과 패턴 기반 학습에 의한 문장 분리 모델을 이용하여 문장 단위로 분리한다. 문장 분리부(111)는 대량의 코퍼스 내에서 사용되고 있는 문장 경계를 기준으로 음절과 어절 등의 자질을 이용하여 통계적 특징을 추출하고, 다양한 학습 방법을 통하여 문장 경계를 인식한다.
형태소 분할부(112)는 각각의 문장을 형태소 단위로 분할한다. 형태소 분할부(112)는 앞뒤 문맥정보에 기반하여 문맥의 적합성을 계산하고, 최소 단위의 의미가 있는 형태소를 추출한다.
색인어 인식부(113)는 범죄 용어 정보를 이용하여 범죄와 관련된 단어 단위의 색인어를 인식한다. 색인어 인식부(113)는 전처리, 필터링 및 후처리 규칙과 사전을 적용하여 신조 형태의 색인어도 인식한다.
어휘 분석부(114)는 문장에서 시계열적으로 가중되는 색인어 또는 소정의 출현 빈도수를 갖는 색인어를 중심으로 어휘 중요도를 분석하고, 역색인 구축부(115)는 소정의 어휘 중요도를 갖는 색인어로부터 역색인어를 구축한다.
색인은 게시물로부터 키워드를 뽑아내는 것이고, 역색인은 어떠한 키워드에 대한 요청이 있을 때 키워드를 바탕으로 그 키워드가 포함된 게시물을 찾아내는 것이다. 본 발명은 역색인어를 구축하여 질의 요청시 빠르게 해당 게시물을 찾을 수 있다.
다시 도 1을 참조하면, 제어부(180)는 범죄 사이트 또는 게시물 검색, 범죄 사이트 유무 판별 및 증거 분석 중 하나 이상이 수행되도록 제어한다. 이하 각각의 수행 동작에 대하여 설명한다.
<범죄 사이트 수집 방법>
검색부(150)는 색인 정보를 이용하여 후보 사이트를 검색하고, 색인 분석부(110)는 후보 사이트의 게시물 정보로부터 소정의 출현 빈도수를 갖는 후보 단어를 추출하고, 후보 단어와 색인 정보를 비교하여 범죄 사이트 여부를 판별하며, 수집부(160)는 범죄 사이트로 판별된 후보 사이트를 수집하고, 저장부(130)는 범죄 사이트 정보를 저장하거나 업데이트한다.
후보 사이트는 인증이 필요하거나 불필요할 수 있고, 다양한 회원가입 패턴이 필요할 수 있다. 또한 후보 사이트는 HTMSL 코드상에서 URL이 단순 노출될 수 있고, 자바 스크립트 함수로 URL이 노출될 수 있으며, URL이 암호화되어 노출될 수 있다.
색인 분석부(110)는 단순 노출된 URL을 판별하거나, 자바 스크립트 렌더링후 URL을 추출하거나, 화면 렌더링을 통하여 URL을 추출하기 위해 후보 사이트의 인증 유무 및 URL 패턴을 분석하여 후보 사이트의 링크를 추출한다.
저장부(130)는 후보 단어를 참조하여 색인 정보를 업데이트할 수 있다.
<증거 수집 및 증거 분석 방법>
도 7은 도 2의 증거 수집 및 증거 분석 방법을 도시한 흐름도로서, 검색부(150)는 범죄 사이트 정보와 색인 정보를 이용하여 범죄 사이트를 검색한다. 검색부(150)는 검색 옵션에 대응하여 범죄 용어 정보를 통하여 범죄 사이트를 검색할 수 있다.
수집부(160)는 범죄 사이트의 게시물 정보로부터 증거 정보를 수집한다. 수집부(160)는 범죄 사이트 명칭, 사이트 URL, 게시물 명칭, 게시자, 게시일, 게시물 캡쳐 화면 및 동영상 중 하나 이상을 포함하는 증거 정보를 수집할 수 있다.
색인 분석부(110)는 증거 정보로부터 소정의 출현 빈도수를 갖는 증거 단어를 추출하고, 증거 단어와 색인 정보를 비교하여 증거 정보의 적합성을 판별한다.
색인 분석부(110)는 증거 정보가 텍스트 형태일 수 있고, 이미지 형태일 수 있으며, 동영상 형태일 수 있기 때문에, 각 형태의 텍스트 요소만을 추출할 수 있다. 예를 들어 색인 분석부(110)는 동영상의 정지 이미지, 자막 또는 음성으로부터 텍스트 요소를 추출할 수 있다. 또한 색인 분석부(110)는 텍스트 요소를 분석하여 동영상이 불법 저작물인지 판별할 수 있고, 불법 거래와 관련된 저작물인지 판별할 수 있다.
색인 분석부(110)는 게시물의 텍스트 요소를 이용한 학습, 색인 정보를 이용한 학습 및 범죄 용어 정보를 이용한 학습을 통하여 증거 정보의 적합성을 판별할 수 있다.
저장부(130)는 적합성이 있는 증거 정보를 저장할 수 있고, 증거 단어를 참조하여 색인 정보를 업데이트할 수 있다.
색인 분석부(110)는 범죄 사이트 검색 과정에서 신규 사이트가 검색되면 신규 사이트가 범죄 사이트인지 판별하고, 수집부(160)는 범죄 사이트로 판별된 신규 사이트를 수집하며, 저장부(130)는 신규 사이트를 포함하여 범죄 사이트 정보를 업데이트한다.
모니터링부(130)는 증거 정보를 불법 거래별, 불법 유통별, 불법 정보별, 지역별, 시간별, 국가별 및 사이트 회원 규모별 중 하나 이상으로 통계 처리하여 모니터링 정보를 생성하고, 템플릿 정보를 이용하여 모니터링 정보를 시각화한다.
도 8은 증거 정보를 통계 처리하는 예를 도시한 것이고, 도 9는 템플릿 정보를 이용하여 모니터링 정보를 시각화하는 예를 도시한 것으로서, 모니터링부(170)는 도 8에 도시된 바와 같이 수집 대상과 범죄 유형별로 범죄 사이트 건수를 통계 처리할 수 있고, 도 9에 도시된 바와 같이 차트용 템플릿을 이용하여 마약 거래 현황을 월별 추이로 시각화할 수 있다.
템플릿 정보는 차트용 템플릿일 수 있고, 대륙 단위, 국가 단위 또는 지역 단위의 지도용 템플릿일 수 있으며, 다양한 형태의 템플릿을 포함할 수 있다.
도 10은 도 1의 저장부를 상세하게 도시한 블록도로서, 저장부(130)는 사전 베이스(131), 색인 베이스(132), 사이트 베이스(133), 증거 베이스(134), 템플릿 베이스(135) 및 모니터링 베이스(136)를 포함한다.
사전 베이스(131)는 범죄 용어와 관련된 범죄 용어 정보가 저장되고, 색인 베이스(132)는 수집 대상 또는 범죄 유형으로 구분된 색인 정보가 저장되며, 사이트 베이스(133)는 시드 URL 리스트 및 범죄 사이트 정보가 저장되고, 증거 베이스(134)는 증거 정보가 저장되며, 템플릿 베이스(135)는 템플릿 정보가 저장되고, 모니터링 베이스(136)는 모니터링 정보가 저장된다.
<실시간 모니터링 방법>
설정부(120)는 범죄 사이트 중에서 실시간 모니터링 페이지를 설정하고, 검색부(150)는 소정의 주기마다 실시간 모니터링 페이지에 대한 검색을 수행한다.
본 발명은 실시간 모니터링 페이지를 실시간으로 모니터링함으로써, 불법 거래와 불법 유통을 조기에 차단하거나, 불법 정보의 확산을 조기에 차단할 수 있다.
본 발명은 실시간 모니터링 페이지를 실시간으로 모니터링함으로써, 시리즈물, 드라마 또는 라이브 방송 등 라이브로 방송되는 대상 저작물을 녹화하여 대상 저작물의 방송이 끝나자마자 유포되는 불법 저작물의 유통을 조기 차단할 수 있다.
다크웹 접속부(140)는 사이버 공공기관 관리서버(200) 또는 공공기관 사용자 단말기로 다크웹 접속을 제공한다.
사이버 공공기관 관리서버(200) 또는 공공기관 사용자 단말기는 요청 정보를 생성하지 않고, 다크웹 접속부(140)를 통하여 직접 범죄 사이트를 검색할 수 있다. 사이버 공공기관 관리서버(200) 또는 공공기관 사용자 단말기는 다크웹 범죄 현황 또는 특정 범죄를 타겟팅하는 세부 범죄 현황을 요청하는 요청 정보를 다크웹 범죄 사이트 모니터링 시스템(100)으로 전송하고, 다크웹 범죄 사이트 모니터링 시스템(100)으로부터 요청 정보에 대응하는 모니터링 정보를 수신할 수 있다.
본 발명은 사이버 공공기관 관리서버(200) 또는 공공기관 사용자 단말기로 다크웹 접속을 제공하여 범죄 수사의 속도를 향상시킬 수 있다.
100: 다크웹 범죄 사이트 모니터링 시스템
110: 색인 분석부 120: 설정부
130: 저장부 140: 다크웹 접속부
150: 검색부 160: 수집부
170: 모니터링부 180: 제어부
200: 사이버 공공기관 관리서버

Claims (5)

  1. 시드 URL 리스트를 저장하는 저장부;
    상기 시드 URL 리스트를 설정하는 설정부;
    익명화 서비스를 이용하여 다크웹에 접속하는 다크웹 접속부;
    상기 시드 URL 리스트를 이용하여 다크웹 내 색인 추출용 사이트를 검색하는 검색부;
    상기 색인 추출용 사이트의 게시물 정보를 수집하는 수집부 및
    상기 색인 추출용 사이트의 게시물 정보로부터 색인어를 추출하고, 역색인어를 구축하여 색인 정보를 생성하는 색인 분석부를 포함하며,
    상기 수집부는 범죄 사이트의 불법 거래, 불법 유통 또는 불법 정보를 수집 대상으로 하여 증거 정보를 수집하고, 검색부는 색인 정보를 이용하여 범죄 사이트 또는 게시물 검색을 수행하며, 상기 색인 분석부는 색인 정보를 이용하여 범죄 사이트 유무 판별과 증거 정보의 적합성 여부를 판별하기 위한 증거 분석을 수행하고,
    상기 수집 대상과 범죄 유형별로 증거 정보를 통계 처리하여 모니터링 정보를 생성하는 모니터링부 및
    상기 색인 정보를 이용하는 검색부와 색인 분석부를 제어하는 제어부를 더 포함하는 것을 특징으로 하는 다크웹 범죄 사이트 모니터링 시스템.
  2. 제1항에 있어서,
    상기 색인 분석부는,
    색인 추출용 사이트의 게시물 정보를 문장 단위로 분리하는 문장 분리부;
    각각의 문장을 형태소 단위로 분할하는 형태소 분할부;
    범죄 용어 정보를 이용하여 범죄와 관련된 단어 단위의 색인어를 인식하는 색인어 인식부;
    문장에서 시계열적으로 가중되는 색인어 또는 소정의 출현 빈도수를 갖는 색인어를 중심으로 어휘 중요도를 분석하는 어휘 분석부 및
    소정의 어휘 중요도를 갖는 색인어로부터 역색인어를 구축하는 역색인 구축부를 포함하는 것을 특징으로 하는 다크웹 범죄 사이트 모니터링 시스템.
  3. 삭제
  4. 제1항에 있어서,
    상기 검색부는 저장부에 범죄 사이트 정보, 색인 정보 또는 범죄 용어 정보가 미리 저장되어 있으면, 저장부에 미리 저장된 정보를 이용하여 색인 추출용 사이트를 검색하는 것을 특징으로 하는 다크웹 범죄 사이트 모니터링 시스템.
  5. 제1항에 있어서,
    상기 다크웹 접속부는 사이버 공공기관 관리서버 또는 공공기관 사용자 단말기로 다크웹 접속을 제공하는 것을 특징으로 하는 다크웹 범죄 사이트 모니터링 시스템.
KR1020170150770A 2017-11-13 2017-11-13 다크웹 범죄 사이트 모니터링 시스템 KR102060766B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170150770A KR102060766B1 (ko) 2017-11-13 2017-11-13 다크웹 범죄 사이트 모니터링 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170150770A KR102060766B1 (ko) 2017-11-13 2017-11-13 다크웹 범죄 사이트 모니터링 시스템

Publications (2)

Publication Number Publication Date
KR20190054478A KR20190054478A (ko) 2019-05-22
KR102060766B1 true KR102060766B1 (ko) 2019-12-30

Family

ID=66680703

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170150770A KR102060766B1 (ko) 2017-11-13 2017-11-13 다크웹 범죄 사이트 모니터링 시스템

Country Status (1)

Country Link
KR (1) KR102060766B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102257139B1 (ko) 2020-12-18 2021-05-27 한국인터넷진흥원 다크웹 정보 수집 방법 및 장치
US11763033B2 (en) 2021-01-01 2023-09-19 Bank Of America Corporation Leveraging entity dark web chatter using slope of vendor identifier appearances as a search proxy

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102318297B1 (ko) * 2019-12-27 2021-10-27 (주)아이와즈 가짜뉴스 탐지와 주기적 웹 모니터링을 통한 범죄첩보 탐지 시스템 및 그 방법
KR102322918B1 (ko) * 2020-11-11 2021-11-05 (주)미소정보기술 온라인 생활범죄 감지 시스템 및 방법
KR20230094112A (ko) 2021-12-20 2023-06-27 고려대학교 산학협력단 다크넷 마켓 사용자의 다중 계정을 탐지하는 방법 및 이를 위한 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017115272A1 (en) * 2015-12-28 2017-07-06 Sixgill Ltd. Dark web monitoring, analysis and alert system and method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101485128B1 (ko) 2013-09-27 2015-01-28 김병호 불법 저작물의 증거 채증 시스템 및 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017115272A1 (en) * 2015-12-28 2017-07-06 Sixgill Ltd. Dark web monitoring, analysis and alert system and method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102257139B1 (ko) 2020-12-18 2021-05-27 한국인터넷진흥원 다크웹 정보 수집 방법 및 장치
US11301522B1 (en) 2020-12-18 2022-04-12 Korea Internet & Security Agency Method and apparatus for collecting information regarding dark web
US11797617B2 (en) 2020-12-18 2023-10-24 Korea Internet & Security Agency Method and apparatus for collecting information regarding dark web
US11763033B2 (en) 2021-01-01 2023-09-19 Bank Of America Corporation Leveraging entity dark web chatter using slope of vendor identifier appearances as a search proxy

Also Published As

Publication number Publication date
KR20190054478A (ko) 2019-05-22

Similar Documents

Publication Publication Date Title
KR102060766B1 (ko) 다크웹 범죄 사이트 모니터링 시스템
Schäfer et al. BlackWidow: Monitoring the dark web for cyber security information
US11271966B2 (en) Real-time detection and redirecton from counterfeit websites
Zhang et al. A domain-feature enhanced classification model for the detection of Chinese phishing e-Business websites
EP3713191A1 (en) Identifying legitimate websites to remove false positives from domain discovery analysis
KR101852107B1 (ko) 다크웹 범죄정보 분석 시스템 및 그 방법
Rao et al. Two level filtering mechanism to detect phishing sites using lightweight visual similarity approach
CN104615760A (zh) 钓鱼网站识别方法和系统
US20220188402A1 (en) Real-Time Detection and Blocking of Counterfeit Websites
Rao et al. A heuristic technique to detect phishing websites using TWSVM classifier
Das Guptta et al. Modeling hybrid feature-based phishing websites detection using machine learning techniques
Deshpande et al. Detection of phishing websites using Machine Learning
KR20180088655A (ko) 웹 추적 서비스들을 검출하기 위한 방법
US11797617B2 (en) Method and apparatus for collecting information regarding dark web
Brenner et al. Discovery of single-vendor marketplace operators in the Tor-Network
CN106982147B (zh) 一种Web通讯应用的通讯监控方法和装置
Kara et al. Characteristics of understanding urls and domain names features: the detection of phishing websites with machine learning methods
CN115314268B (zh) 基于流量指纹和行为的恶意加密流量检测方法和系统
US20150156169A1 (en) Method for determining validity of command and system thereof
CN116318974A (zh) 站点风险识别方法、装置、计算机可读介质及电子设备
CN115599345A (zh) 一种基于知识图谱的应用安全需求分析推荐方法
CN115392238A (zh) 一种设备识别方法、装置、设备及可读存储介质
WO2020086024A2 (en) A system for enabling device identification
Tiwari et al. Malicious Website Navigation Prevention Using CNNs and URL Vectors: A Study
KR102493080B1 (ko) 클라이언트 커스터마이징 기반의 디지털 포렌식 서비스 제공 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant