KR20190138350A - 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템 - Google Patents

웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템 Download PDF

Info

Publication number
KR20190138350A
KR20190138350A KR1020180064681A KR20180064681A KR20190138350A KR 20190138350 A KR20190138350 A KR 20190138350A KR 1020180064681 A KR1020180064681 A KR 1020180064681A KR 20180064681 A KR20180064681 A KR 20180064681A KR 20190138350 A KR20190138350 A KR 20190138350A
Authority
KR
South Korea
Prior art keywords
data
crime
domain
prediction
occurrence
Prior art date
Application number
KR1020180064681A
Other languages
English (en)
Inventor
권민구
Original Assignee
주식회사 웬즈데이에잇피엠
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 웬즈데이에잇피엠 filed Critical 주식회사 웬즈데이에잇피엠
Priority to KR1020180064681A priority Critical patent/KR20190138350A/ko
Publication of KR20190138350A publication Critical patent/KR20190138350A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Educational Administration (AREA)
  • Biophysics (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템에 관한 것으로, (a) 상기 예측 대상 지역에 대한 복수의 데이터 도메인으로부터 범죄 예측용 데이터가 수집되는 단계와, (b) 상기 예측 대상 지역에서 기설정된 기간 동안 발생한 범죄에 대한 범죄 발생 데이터가 범죄 발생 기록 도메인으로부터 수집되는 단계와, (c) 각각의 데이터 도메인의 상기 범죄 예측용 데이터와 상기 범죄 발생 데이터를 통계적 기법에 따라 분석되어, 상기 데이터 도메인별로 상기 범죄 예측용 데이터 중 유의미한 데이터가 유효 데이터로 추출되는 단계와, (d) 상기 유효 데이터가 기 등록된 딥 러닝 알고리즘에 적용되어 범죄 발생이 예측되는 단계를 포함하고; 상기 유효 데이터는 데이터의 유형에 따라 복수의 데이터 그룹으로 분류되며; 상기 딥 러닝 알고리즘은 각각의 상기 데이터 그룹에 대응하여 마련되고, 해당 데이터 그룹의 상기 유효 데이터가 입력되어 특성 표상 학습이 수행되는 복수의 특성 표상 층으로 구성된 제1 심층 신경망과, 각각의 상기 특성 표상 층의 출력을 입력받아 특성 레벨에서 데이터를 융합하는 조인트 특성 표상 층을 갖는 제2 심층 신경망과, 상기 조인트 특성 표상 층의 출력에 기초하여 범죄 발생 확률을 산출하는 출력 함수를 포함하는 것을 특징으로 한다.

Description

웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템{omitted}
본 발명은 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템에 관한 것으로서, 보다 상세하게는 복수의 데이터 도메인으로부터 수집된 빅 데이터를 이용하여 복수의 데이터 도메인으로부터 수집된 데이터의 특성을 고려하여 예측 대상 지역에 대한 보다 정확한 범죄 발생 여부를 예측할 수 있는 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템에 관한 것이다.
범죄는 피해의 심각성으로 인해 사회에서 큰 관심을 받고 있다. 이에 따라, 범죄 예방에 관한 다양한 연구가 진행되어 왔다. 이러한, 범죄에 관한 연구는 주로 통계적인 접근 방법을 이용해 다양한 데이터들과 실제 범죄 발생과의 상관관계 및 패턴을 분석하는 방법으로 진행되어 왔다.
하지만, 근래에는 기술의 발전으로 인해 빅 데이터와 기계학습을 기반으로 범죄에 접근하는 방법에 대한 연구가 이루어지고 있다. 즉, 단순하게 통계적으로 데이터와 범죄 사이의 패턴 분석에서 더 나아가 실제 기계 학습 모델을 통해 범죄를 예측하는 시스템의 개발이 이루어지고 있다.
또한, 최근에는 범죄 예측 시스템을 실제 환경에 적용하여 범죄 예측 시스템의 결과를 기반으로 범죄 예방을 위한 효과적인 순찰 경로를 구성하였고, 실제 범죄 발생 감소의 효과를 보여주고 있다.
기계 학습 기반의 범죄 예측 시스템은 일반적으로 과거 범죄 발생 기록을 통해 범죄의 발생 패턴을 학습하며, 이 외에도 인구, 경제, 교육 등의 해당 지역의 특성을 나타낼 수 있는 다양한 정보를 수집하여 추가적으로 학습에 사용해 왔다.
범죄 발생 예측을 위한 기존의 연구들에서 인구, 경제, 교육 등의 하나의 데이터를 이용하여 해당 데이터와 실제 발생된 범죄 간의 상관관계를 분석하는 방법으로 이루어졌다. 일 예로, 한국공개특허공보 제10-2014-0100173호에 개시된 '기상정보를 이용한 범죄 예측 서비스 제공 방법'에서는 기상정보에 따른 범죄발생 가능성을 데이터베이스화하여 현재의 기상정보 또는 예보된 기상정보에 따른 범죄예측정보를 사용자에게 제공하는 방법을 제안하고 있다.
다른 예로, 한국등록특허공보 제10-1628938호에 개시된 '주거침입절도범죄 예측 시스템 및 방법'에서는 대상지의 3차원 공간 특성과 범죄자 행동 특성 간의 상관관계를 분석하여 예측 알고리즘을 설계하는 방법을 제안하고 있다.
상기 특허공보들을 통해 제안된 예측 방법들은 예를 들어, 기상 정보나 범죄자의 행동 특성과 같은 단지 한 유형의 데이터만을 이용하기 때문에, 해당 유형의 데이터와 실제 범죄 발생 간의 상관관계가 작은 경우 예측 정확성을 담보하기는 어려울 뿐만 아니라, 단순한 우연에 의해 결과가 좌우되는 부정확성을 피하기 어려운 실정이다.
근래에 기술의 발전으로 빅 데이터 시대가 되면서 다양한 대량의 정보를 수집하기 쉬어졌고, 이로 인해 범죄 예측을 위해 사용되는 데이터의 양 뿐만 아니라 다양한 유형의 데이터를 다양한 데이터 도메인으로부터 수집할 수 있는 환경이 제공되어 있다.
이와 같이, 범죄 예측을 위해서 사용할 수 있는 데이터의 증가는 예측 성능의 향상을 기대할 수 있다. 하지만, 상술한 바와 같이, 한 가지 유형의 데이터가 많이 활용한다고 해도 상술한 문제를 해소하기는 어려울 뿐만 아니라, 수집된 다양한 유형의 데이터를 이용하여 단순하게 활용하는 것은 오히려 예측 성능을 저하시키는 요인으로 작용할 수 있다. 이는, 범죄 발생 예측과 무관한 데이터의 사용은 오히려 기계 학습 모델의 데이터와 범죄 사이의 상관관계 및 패턴을 잘 학습하지 못하게 하여 성능 감소를 야기할 수 있기 때문이다.
또한, 기존의 범죄 예측 방법은 사용하는 데이터 도메인 간의 차이를 고려하지 않은 예측 방법을 사용해 왔다. 범죄 발생 예측에 사용될 수 있는 데이터는 범죄 발생 기록, 인구, 경제 등 다양한 반면 이러한 데이터들은 각각 다른 데이터 도메인에서 수집되기 때문에 서로 다른 데이터 분포와 특성을 가지고 있어, 데이터 도메인의 차이를 고려하지 않은 예측 방법은 예측 정확성을 담보하기 어렵다.
국내공개특허공보 제10-2014-0100173호 국내등록특허공보 제10-1628938호
발명은 상기와 같은 문제점을 해소하기 위해 안출된 것으로서, 복수의 데이터 도메인으로부터 수집된 빅 데이터를 이용하여 복수의 데이터 도메인으로부터 수집된 데이터의 특성을 고려하여 예측 대상 지역에 대한 보다 정확한 범죄 발생 여부를 예측할 수 있는 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템을 제공하는데 그 목적이 있다.
상기 목적은 본 발명에 따라, 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템에 있어서, (a) 상기 예측 대상 지역에 대한 복수의 데이터 도메인으로부터 범죄 예측용 데이터가 수집되는 단계와, (b) 상기 예측 대상 지역에서 기 설정된 기간 동안 발생한 범죄에 대한 범죄 발생 데이터가 범죄 발생 기록 도메인으로부터 수집되는 단계와, (c) 각각의 데이터 도메인의 상기 범죄 예측용 데이터와 상기 범죄 발생 데이터를 통계적 기법에 따라 분석되어, 상기 데이터 도메인별로 상기 범죄 예측용 데이터 중 유의미한 데이터가 유효 데이터로 추출되는 단계와, (d) 상기 유효 데이터가 기 등록된 딥 러닝 알고리즘에 적용되어 범죄 발생이 예측되는 단계를 포함하고; 상기 유효 데이터는 데이터의 유형에 따라 복수의 데이터 그룹으로 분류되며; 상기 딥 러닝 알고리즘은 각각의 상기 데이터 그룹에 대응하여 마련되고, 해당 데이터 그룹의 상기 유효 데이터가 입력되어 특성 표상 학습이 수행되는 복수의 특성 표상 층으로 구성된 제1 심층 신경망과, 각각의 상기 특성 표상 층의 출력을 입력받아 특성 레벨에서 데이터를 융합하는 조인트 특성 표상 층을 갖는 제2 심층 신경망과, 상기 조인트 특성 표상층의 출력에 기초하여 범죄 발생 확률을 산출하는 출력 함수를 포함하는 것을 특징으로 하는 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템에 의해서 달성된다.
여기서, 상기 데이터 도메인은 상기 예측 대상 지역의 인구 도메인, 경제 도메인, 교육 도메인, 주택 도메인, 날씨 도메인, 이미지 도메인 중 적어도 2 이상을 포함하고, 상기 범죄 예측용 데이터는 상기 인구 도메인으로부터 수집되는 인구 데이터와, 상기 경제 도메인으로부터 수집되는 경제 데이터와, 상기 교육 도메인으로부터 수집되는 교육 데이터와, 상기 주택 도메인으로부터 수집되는 주택 데이터와, 상기 날씨 도메인으로부터 수집되는 날씨 데이터와, 상기 이미지 도메인으로부터 수집되는 이미지 데이터를 포함할 수 있다.
그리고, 상기 (c) 단계는 (c1) 상기 데이터 도메인 중 적어도 하나에 속하는 상기 범죄 예측용 데이터를 상기 피어슨 상관 계수 분석(Pearson correlation coefficient analysis) 기법에 적용하여 유효 데이터를 추출하는 단계와; (c2) 상기 데이터 도메인 중 나머지에 속하는 상기 범죄 예측용 데이터를 Kruskal-Wallis H 검정 기법에 적용하여 유효 데이터를 추출할 수 있다.
또한, 상기 (c1) 단계에서는 상기 인구 데이터, 상기 경제 데이터, 상기 교육 데이터, 상기 주택 데이터 및 상기 날씨 데이터가 상기 피어슨 상관 계수 분석 기법에 적용되며; 상기 (c2) 단계에서는 상기 이미지 데이터가 상기 Kruskal-Wallis H 검정 기법에 적용될 수 있다.
또한, 상기 이미지 데이터는 상기 예측 대상 지역에서 샘플링 포인트 단위로 수집되며; 상기 (c2) 단계는 (c21) 상기 이미지 데이터로부터 특징 정보를 추출하는 단계와; (c22) 상기 특징 정보를 k-means 클러스터링 (Clustering) 알고리즘에 적용하여 복수의 특징 그룹으로 그룹핑하는 단계와; (c23) 상기 범죄 발생 데이터에 기초하여, 각각의 상기 샘플링 포인트 내에서의 범죄 발생 건수와 해당 샘플링 포인트의 상기 이미지 데이터가 상기 Kruskal-Wallis H 검정 기법에 적용되어 각각의 상기 특징 그룹의 특징 정보에 따른 상기 범죄 발생 건수의 통계적 유의미한 차이가 분석되는 단계와; (c24) 상기 (c23) 단계에서의 분석 결과에 기초하여 유효 데이터를 추출하는 단계를 포함할 수 있다.
그리고, 상기 (c23) 단계에서는 p-value의 본페로니-타입 수정(Bonferroni-type adjustment)을 이용한 던스 테스트(Dunn's Test)가 실행되어 상기 특징 그룹 간의 사후 검정이 수행될 수 있다.
그리고, 상기 출력 함수는 소프트맥스(Softmax) 함수를 포함할 수 있다.
상기와 같은 구성에 따라, 본 발명에 따르면, 복수의 데이터 도메인으로부터 수집된 빅 데이터를 이용하여 복수의 데이터 도메인으로부터 수집된 데이터의 특성을 고려하여 예측 대상 지역에 대한 보다 정확한 범죄 발생 여부를 예측할 수 있는 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템이 제공된다.
도 1은 본 발명에 따른 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템의 구성을 나타낸 도면이고,
도 2 및 도 3은 본 발명에 따른 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템을 설명하기 위한 도면이고,
도 4는 본 발명에서 시카고 지역의 0.001 위도-경도 단위로 샘플링된 샘플링 포인트의 예를 도시한 도면이고,
도 5는 본 발명에 따른 딥 러닝 알고리즘을 수행하기 위한 심층 신경망(Deep Neural Network)의 구조를 도시한 도면이고,
도 6은 본 발명에 따른 범죄 발생 예측 방법에 따라 예측된 결과를 표시한 핫스팟 지도를 나타낸 도면이다.
이하에서는 첨부된 도면을 참조하여 본 발명에 따른 실시예들을 상세히 설명한다.
도 1은 본 발명에 따른 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템(100)의 구성을 나타낸 도면이다. 도 1을 참조하여 설명하면 본 발명에 따른 범죄 발생 예측 시스템(100)은 데이터 수집부(110), 데이터 선택부(120) 및 범죄 발생 예측부(130)를 포함한다. 또한, 본 발명에 따른 범죄 발생 예측 시스템(100)은 수집 데이터 저장부(150) 및 예측 결과 제공부(140)를 포함할 수 있다.
데이터 수집부(110)는 복수의 데이터 도메인(300)으로부터 예측 대상 지역에 대한 범죄 예측용 데이터를 수집한다. 여기서, 데이터 수집부(110)에 의해 수집된 범죄 예측용 데이터 및 후술할 범죄 발생 데이터는 수집 데이터 저장부(150)에 저장된다.
본 발명에서는 데이터 수집부(110)가 인터넷과 같은 통신망을 통해 각각의 데이터 도메인(300)과 연결되어 데이터 도메인(300)에 저장된 범죄 예측용 데이터를 수집하는 것을 예로 하나, 각각의 데이터 도메인(300)의 관리자로부터 범죄 예측용 데이터를 전송받거나 저장매체를 통해 전달받아 수집되도록 마련될 수 있다.
본 발명에서는 데이터 도메인(300)으로 인구 도메인(310), 경제 도메인(340), 교육 도메인(330), 주택 도메인(320), 날씨 도메인(350) 및 이미지 도메인(370)을 포함하는 것을 예로 하며, 그 개수와 유형은 이에 국한되지 않으며, 예시의 하나 또는 일부가 제외될 수 있음은 물론이다.
이에, 본 발명에 따른 범죄 예측용 데이터는 인구 도메인(310)으로부터 수집되는 인구 데이터, 경제 도메인(340)으로부터 수집되는 경제 데이터, 교육 도메인(330)으로부터 수집되는 교육 도메인(330), 주택 도메인(320)으로부터 수집되는 주택 데이터, 날씨 도메인(350)으로부터 수집되는 날씨 데이터, 그리고, 이미지 도메인(370)으로부터 수집되는 이미지 데이터를 포함할 수 있는데, 데이터 도메인(300)과 데이터 도메인(300)의 수집 방법의 예, 범죄 예측용 데이터의 예에 대한 설명은 후술한다.
한편, 데이터 수집부(110)는 예측 대상 지역에서 기 설정된 기간 동안 발생한 범죄에 대한 범죄 발생 데이터를 범죄 발생 기록 도메인(360)으로부터 수집한다.
그리고, 데이터 선택부(120)는 데이터 수집부(110)를 통해 수집된 범죄 예측용 데이터와 범죄 발생 데이터를 이용하여, 각각의 데이터 도메인(300)의 범죄 예측용 데이터와 범죄 발생 데이터를 통계적 기법에 따라 분석한다. 그리고, 데이터 선택부(120)는 범죄 예측용 데이터 중 통계적 기법에 따른 분석에 따라 유의미한 데이터로 판단된 데이터를 유효 데이터로 추출한다. 이를 통해, 각 데이터 도메인(300)으로부터 추출된 범죄 예측용 데이터 중 무의미한 데이터를 제거하고 유의미한 데이터만을 유효 데이터로 이용하여 범죄 발생 가능성을 예측함으로써, 예측 정확성을 향상시키게 된다. 여기서, 데이터 선택부(120)에 의한 유효 데이터 추출 방법에 대한 구체적인 설명은 후술한다.
범죄 발생 예측부(130)는 데이터 선택부(120)에 의해 추출된 유효 데이터를 기 등록된 딥 러닝 알고리즘에 적용하여 예측 대상 지역의 범죄 발생을 예측한다.
이하에서는, 도 2 내지 도 6을 참조하여 본 발명에 따른 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템에 대해 구체적으로 설명한다. 여기서, 본 발명에 따른 범죄 발생 예측 발명을 설명하는데 있어서, 예측 대상 지역을 미국의 시카고를 예로 하여 설명하며, 범죄 예측용 데이터는 시카고에 대한 실제 데이터를 예로 하여 설명한다.
먼저, 복수의 데이터 도메인(300)으로부터 범죄 예측 데이터와, 범죄 발생 기록 도메인(360)으로부터 범죄 발생 데이터가 수집된다(S30). [표 1]은 미국 시카고에 대한 범죄 예측용 데이터 및 범죄 발생 데이터의 수집을 위한 데이터 도메인(300)의 실제 예를 나타낸 것이다.
[표 1]
Figure pat00001
[표 1]을 참조하여 설명하면, 범죄 발생 데이터는 기 설정된 기간 동안 발생된 범죄에 대해서 수집되는데, 본 발명에서는 2014년도에 발생한 범죄 발생 데이터를 수집하는 것을 예로 하여 설명한다. 범죄 발생 보고서에는 범죄 유형, 범죄가 발생한 위치에 대한 위도-경도 좌표 데이터가 포함되어 있다.
American FactFinder로부터는 인구 데이터, 주택 데이터, 교육 데이터 및 경제 데이터가 수집될 수 있다. 이와같이, 하나의 데이터 도메인(300)으로부터 서로 다른 유형의 데이터가 수집될 수 있는 바, 본 명세서에서 데이터 도메인(300)의 명칭은 해당 범죄 예측용 데이터의 유형에 맞춰 명명된 것으로 물리적으로나 관리 대상이 상이함을 나타내는 것인 아니다. 여기서, 본 발명에서는 2014 American Community Survey(ACS) 데이터를 사용하는데, 시카고의 인구 조사 단위(census track)에 대한 정보가 포함되어 있으며, 결측값(Missing value)을 갖는 불완전한 데이터 세트는 제거될 수 있다.
날씨 데이터는, [표 1]에 나타난 바와 같이, Weather Underground API로부터 수집되고, 이미지 데이터는 구글 스트리트 뷰 이미지 API로부터 수집하는 것을 예로 하고 있다. 여기서, 날씨 데이터는 시카고의 일별 기후 이력으로부터 수집되는데, 날씨의 평균값, 최대값, 최소값 등에 대한 정보를 포함하고 있으며, 눈, 비, 우박, 토네이도 등과 같은 기후 이벤트 정보도 포함하고 있다. 본 발명에서는 결측값을 갖는 평균 습도와 강설 데이터는 범죄 예측용 데이터로 사용하지 않으며, 2014년에 발생하지 않은 우박과 토네이도 데이터도 제거하는 것을 예로 한다.
이미지 데이터는 위도-경도 좌표값을 이용하여 수집하는 것을 예로 한다. 이미지 데이터는 시카고 경계 내에서 포인트 샘플링을 이용하여 얻는 것을 예로 한다. 본 발명에서는 모든 0.001 위도-경도 단위로 이미지를 획득하는 것을 예로 한다. 도 4는 본 발명에서 시카고 지역의 0.001 위도-경도 단위로 샘플링된 샘플링 포인트의 예를 도시하고 있다.
상기와 같은 과정에서 각각의 유형에 범죄 예측용 데이터를 수집하는 과정에서, 결측값이 발생하는 경우 동일한 유형의 데이터를 제공하는 다른 데이터 도메인(300)으로부터 추가적인 데이터의 수집이 가능하다. 일 예로, 구글 스트리트 뷰 이미지 API로부터 이미지 데이터를 수집하는 과정에서, 샘플링 포인트에 대해 이미지가 존재하지 않는 경우가 발생할 수 있다. 이 경우, Google Maps Geocoding API로부터 해당 샘플링 포인트에 대한 이미지 데이터를 획득할 수 있다.
다시, 도 2 및 도 3을 참조하여 설명하면, 상기와 같이 범죄 예측용 데이터의 수집이 완료되면, 상술한 바와 같이, 각각의 데이터 도메인(300)의 범죄 예측용 데이터와 범죄 발생 데이터를 통계적 기법에 따라 분석하여, 유의미한 데이터가 각각의 데이터 도메인(300)별로 유효 데이터로 추출된다(S40).
본 발명에서는, 도 2 및 도 3에 도시된 바와 같이, 데이터 도메인(300) 중 적어도 하나에 속하는 범죄 예측용 데이터를 피어슨 상관 계수 분석(Pearson correlation coefficient analysis) 기법에 적용하여(S41) 해당 데이터 도메인(300)의 유효 데이터를 추출하고(S42), 데이터 도메인(300) 중 나머지에 속하는 범죄 예측용 데이터를 Kruskal-Wallis H 검정 기법에 적용하여(S43 내지 S45) 유효 데이터를 추출(S46)하는 것을 예로 한다.
본 발명에서는 피어슨 상관 계수 분석(Pearson correlation coefficient analysis) 기법에 인구 데이터, 경제 데이터, 교육 데이터, 주택 데이터 및 날씨 데이터가 적용되는 것을 예로 하며, Kruskal-Wallis H 검정 기법에는 이미지 데이터가 적용되는 것을 예로 한다.
보다 구체적으로 설명하면, 인구 데이터, 주택 데이터, 교육 데이터 및 경제 데이터는 범죄 발생 데이터로부터 인구 조사 단위(census track)의 범죄 발생 건수를 얻고, 각각의 데이터와 범죄 발생 건수 간의 상관관계를 계산할 수 있다. 날씨 데이터의 경우, 하루 동안의 범죄 발생 건수와의 상관관계를 계산할 수 있다.
그런 다음, 분석 결과, 예를 들어 p<0.05로 통계적 유의미함을 가지고, r<-0.2 & r>0.2인 조건을 충족하는 데이터만을 유효 데이터로 추출하고, 나머지 데이터는 범죄 예측에 도움이 되지 않는 데이터로 판단하여 제거하게 된다.
이미지 데이터의 경우, 상술한 인구 데이터나 경제 데이터 등과는 다른 형식을 가지고 있어, 피어슨 상관 계수 분석(Pearson correlation coefficient analysis) 기법을 통해 상관관계 분석이 불가능하므로, 상술한 바와 같이, Kruskal-Wallis H 검정 기법이 적용된다.
보다 구체적으로 설명하면, 이미지 데이터로부터 특징 정보가 추출된다(S43). 상술한 바와 같이, 본 발명에서는 이미지 데이터가 0.001 위도/경도 좌표 단위로 추출되는 바, 각 좌표 단위에서의 이미지 데이터로부터 특징 정보가 각각 추출된다. 예를 들어, 합성곱 신경망(Convolutional Neural Netwo가 : CNN) 중 하나인 Alexnet의 첫 번째 fully connected layer(예컨대 4096 차원)의 결과를 특징 정보로 추출할 수 있다.
그런 다음, 특징 정보를 k-means 클러스터링(Clustering) 알고리즘에 적용하여 복수의 특징 그룹으로 그룹핑한다(S44). 본 발명에서는 k 값을 10으로 설정하는 것을 예로 할 수 있으며, 특징 정보 추출 방법이나 k 값은 데이터 등의 상황에 따라 임의로 설정이 가능하다.
그런 다음, 범죄 발생 데이터를 이용하여, 영상 데이터의 샘플링 포인트 내에서의 범죄 발생 건수와 해당 샘플링 포인트의 이미지 데이터를 Kruskal-Wallis H 검정 기법에 적용되어 각각의 특징 그룹의 특징 정보에 따른 범죄 발생 건수의 통계적 유의미한 차이가 있는지 여부가 분석된다(S45).
여기서, 본 발명에서는 p-value의 본페로니-타입 수정(Bonferroni-type adjustment)을 이용한 던스 테스트(Dunn's Test)를 실행하여 특징 그룹 간의 사후 검정이 수행한다. 이와 같은 검정 과정을 통해 유의미함이 없는 데이터는 제거되고, 유의미한 데이터는 유효 데이터로 추출된다(S46).
상기와 같이, 데이터 도메인(300)별로, 즉, 범죄 예측용 데이터의 유형별로 추출된 유효 데이터가 상술한 바와 같이, 딥 러닝 알고리즘에 적용되어 범죄 발생 여부가 예측된다(S51).
유효 데이터들은 데이터의 유형에 따라 복수의 데이터 그룹으로 분류된다. 본 발명에서는 유효 데이터들이 3개의 데이터 그룹으로 분류되는 것을 예로 하는데, 시간적 그룹, 공간적 그룹, 그리고 콘텍스트(Context) 그룹으로 구분되는 것을 예로 한다.
공간적 그룹에는 인구 데이터, 주택 데이터, 교육 데이터 및 경제 데이터로부터 추출된 유효 데이터가 그룹핑된다. 그리고, 시간적 그룹에는 날씨 데이터 및 범죄 발생 데이터로부터 추출된 유효 데이터가 그룹핑된다. 마지막으로, 콘텍스트 그룹에는 이미지 데이터로부터 추출된 유효 데이터가 그룹핑된다.
도 5는 본 발명에 따른 딥 러닝 알고리즘을 수행하기 위한 심층 신경망(Deep Neural Network)의 구조를 도시한 도면이다. 도 5를 참조하여 설명하면, 본 발명에 따른 딥 러닝 알고리즘은 제1 심층 신경망(510), 제2 심층 신경망(520), 및 출력 함수(530)를 포함할 수 있다.
제1 심층 심경망은 각각의 데이터 그룹에 대응하여 마련되는 복수의 특성 표상 층(511,512,513)(Feature representation layer)으로 구성된다. 여기서, 각각의 데이터 그룹에 속하는 유효 데이터는 로우 데이터 벡터(Raw data vector)로 대응하는 특성 표상 층(511,512,513)에 각각 입력되고, 각각의 특성 표상 층(511,512,513)은 독립적으로 동작하여 특성 표상이 수행되어, 특성 벡터(Feature vector)로 출력된다.
그리고, 각각의 특성 표상 층(511,512,513)으로부터 출력된 특성 벡터는 제2 심층 신경망(520)을 구성하는 조인트 특성 표상 층(521)(Joint feature representation layer)로 입력되어 특성 레벨에서 데이터가 통합되어 하나의 단일 특성 벡터로 데이터 융합(Data fusion)된다.
그리고, 단일 특성 벡터는 출력 함수(530)로 입력되어, 범죄 발생 확률로 산출된다. 본 발명에서는 출력 함수(530)로 소프트맥스(Softmax) 함수가 적용되는 것을 예로 하는데, 소프트맥스 함수는 분류(Classification)을 수행하는 함수로, 각 클래스의 확률값을 출력하는데, 클래스들의 확률값의 합은 1이 된다. 따라서, 본 발명에서는 클래스가 범죄 발생 클래스와 범죄 미발생 클래스로 분류되고, 두 클래스의 확률값이 소프트맥스 함수로부터 출력되어 범죄 발생 여부가 예측 가능하게 된다.
여기서, 상술한 바와 같이 샘플링 포인트 단위로 확률값이 출력 가능한 바, 도 1에 도시된 예측 결과 제공부(140)는 예측 대상 지역의 지도, 예컨대, 시카고의 지도 상에 이를 시각적으로 표시하는 핫스팟 지도를 생성하여 출력할 수 있다.
도 6은 본 발명에 따른 범죄 발생 예측 방법에 따라 예측된 결과를 표시한 핫스팟 지도를 나타낸 것으로, 미국 시카고의 2014년 1월부터 11월까지의 데이터를 이용하여 예측한 것이다.
본 발명에 따른 범죄 발생 예측 방법의 예측 정확성의 평가를 위해, 동일한 데이터를 이용하여 기존의 예측 방법 중 Kernel density estimation 방법과 Support vector machine을 이용하여 예측된 결과를 2014년 12월에 실제 발생한 범죄와 각각 비교하였다. 비교 결과, 본 발명에 따른 범죄 발생 예측 방법이 기존의 예측 방법보다 17%의 정확도가 향상되었음을 확인하였다.
비록 본 발명의 몇몇 실시예들이 도시되고 설명되었지만, 본 발명이 속하는 기술분야의 통상의 지식을 가진 당업자라면 본 발명의 원칙이나 정신에서 벗어나지 않으면서 본 실시예를 변형할 수 있음을 알 수 있을 것이다.
발명의 범위는 첨부된 청구항과 그 균등물에 의해 정해질 것이다.
100 : 범죄 발생 예측 시스템 110 : 데이터 수집부
120 : 데이터 선택부 130 : 범죄 발생 예측부
140 : 예측 결과 제공부 150 : 수집 데이터 저장부
300 : 데이터 도메인 310 : 인구 도메인
320 : 주택 도메인 330 : 교육 도메인
340 : 경제 도메인 350 : 날씨 도메인
360 : 범죄 발생 기록 도메인 370 : 이미지 도메인
510 : 제1 심층 신경망 511,512,512 : 특성 표상 층
520 : 제2 심층 신경망 521 : 조인트 특성 표상 층
530 : 출력 함수

Claims (4)

  1. 빅 데이터를 이용한 예측 대상 지역의 범죄 발생 예측 방법에 있어서,
    (a) 상기 예측 대상 지역에 대한 복수의 데이터 도메인으로부터 범죄 예측용 데이터가 범죄 발생 예측 시스템에 입력되는 단계와,
    (b) 상기 예측 대상 지역에서 기 설정된 기간 동안 발생한 범죄에 대한 범죄 발생 데이터가 범죄 발생 기록 도메인으로부터 상기 범죄 발생 예측 시스템에 입력되는 단계와,
    (c) 각각의 데이터 도메인의 상기 범죄 예측용 데이터와 상기 범죄 발생 데이터가 상기 범죄 발생 예측 시스템에 기 등록된 통계적 기법에 따라 분석되어, 상기 데이터 도메인별로 상기 범죄 예측용 데이터 중 유의미한 데이터가 유효 데이터로 추출되는 단계와,
    (d) 상기 범죄 발생 예측 시스템에 기 등록된 딥 러닝 알고리즘에 상기 유효 데이터가 적용되어 범죄 발생이 예측되는 단계를 포함하고;
    상기 유효 데이터는 데이터의 유형에 따라 복수의 데이터 그룹으로 분류되고;
    상기 딥 러닝 알고리즘은
    각각의 상기 데이터 그룹에 대응하여 마련되고, 해당 데이터 그룹의 상기 유효 데이터가 입력되어 특성 표상 학습이 수행되는 복수의 특성 표상 층으로 구성된 제1 심층 신경망과, 각각의 상기 특성 표상 층의 출력을 입력받아 특성 레벨에서 데이터를 융합하는 조인트 특성 표상 층을 갖는 제 2 심층 신경망과,
    상기 조인트 특성 표상 층의 출력에 기초하여 범죄 발생 확률을 산출하는 출력 함수를 포함하고;
    상기 데이터 도메인은 상기 예측 대상 지역의 인구 도메인, 경제 도메인, 교육 도메인, 주택 도메인, 날씨 도메인, 이미지 도메인 중 적어도 2 이상을 포함하고;
    상기 범죄 예측용 데이터는
    상기 인구 도메인으로부터 수집되는 인구 데이터와,
    상기 경제 도메인으로부터 수집되는 경제 데이터와,
    상기 교육 도메인으로부터 수집되는 교육 데이터와,
    상기 주택 도메인으로부터 수집되는 주택 데이터와,
    상기 날씨 도메인으로부터 수집되는 날씨 데이터와,
    상기 이미지 도메인으로부터 수집되는 이미지 데이터를 포함하고;
    상기 (c) 단계는
    (c1) 상기 데이터 도메인 중 적어도 하나에 속하는 상기 범죄 예측용 데이터가 피어슨 상관 계수 분석(Pearson correlation coefficient analysis) 기법에 적용되어 유효 데이터가 추출되는 단계와,
    (c2) 상기 데이터 도메인 중 나머지에 속하는 상기 범죄 예측용 데이터가 Kruskal-Wallis H 검정 기법에 적용되어 유효 데이터가 추출되는 단계를 포함하며;
    상기 (c1) 단계에서는 상기 인구 데이터, 상기 경제 데이터, 상기 교육 데이터, 상기 주택 데이터 및 상기 날씨 데이터가 상기 피어슨 상관 계수 분석 기법에 적용되며;
    상기 (c2) 단계에서는 상기 이미지 데이터가 상기 Kruskal-Wallis H 검정 기법에 적용되는 것을 특징으로 하는 빅 데이터를 이용한 예측 대상 지역의 범죄 발생 예측 방법.
  2. 제1항에 있어서,
    상기 이미지 데이터는 상기 예측 대상 지역에서 샘플링 포인트 단위로 수집되며;
    상기 (c2) 단계는
    (c21) 상기 이미지 데이터로부터 특징 정보를 추출하는 단계와;
    (c22) 상기 특징 정보를 k-means 클러스터링(Clustering) 알고리즘에 적용하여 복수의 특징 그룹으로 그룹핑하는 단계와;
    (c23) 상기 범죄 발생 데이터에 기초하여, 각각의 상기 샘플링 포인트 내에서의 범죄 발생 건수와 해당 샘플링 포인트의 상기 이미지 데이터가 상기 Kruskal-Wallis H 검정 기법에 적용되어 각각의 상기 특징 그룹의 특징 정보에 따른 상기 범죄 발생 건수의 통계적 유의미한 차이가 분석되는 단계와;
    (c24) 상기 (c23) 단계에서의 분석 결과에 기초하여 유효 데이터를 추출하는 단계를 포함하는 것을 특징으로 하는 빅 데이터를 이용한 예측 대상 지역의 범죄 발생 예측 방법.
  3. 제2항에 있어서,
    상기 (c23) 단계에서는 p-value의 본페로니-타입 수정(Bonferroni-type adjustment)을 이용한 던스 테스트(Dunn's Test)가 실행되어 상기 특징 그룹 간의 사후 검정이 수행되는 것을 특징으로 하는 빅 데이터를 이용한 예측 대상 지역의 범죄 발생 예측 방법.
  4. 제1항에 있어서,
    상기 출력 함수는 소프트맥스(Softmax) 함수를 포함하는 것을 특징으로 하는 빅 데이터를 이용한 예측 대상 지역의 범죄 발생 예측 방법.
KR1020180064681A 2018-06-05 2018-06-05 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템 KR20190138350A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180064681A KR20190138350A (ko) 2018-06-05 2018-06-05 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180064681A KR20190138350A (ko) 2018-06-05 2018-06-05 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템

Publications (1)

Publication Number Publication Date
KR20190138350A true KR20190138350A (ko) 2019-12-13

Family

ID=68847536

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180064681A KR20190138350A (ko) 2018-06-05 2018-06-05 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템

Country Status (1)

Country Link
KR (1) KR20190138350A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906970A (zh) * 2021-03-03 2021-06-04 上海融港网络科技有限公司 一种犯罪预测方法、装置、终端和存储介质
WO2022034984A1 (ko) * 2020-08-14 2022-02-17 고려대학교 산학협력단 치안 및 공공 데이터 기반 범죄 신고 수 예측 장치 및 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140100173A (ko) 2013-02-05 2014-08-14 인터로젠 (주) 기상정보를 이용한 범죄예측 서비스 제공 방법
KR101628938B1 (ko) 2014-09-22 2016-06-09 세종대학교산학협력단 주거침입절도범죄 예측 시스템 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140100173A (ko) 2013-02-05 2014-08-14 인터로젠 (주) 기상정보를 이용한 범죄예측 서비스 제공 방법
KR101628938B1 (ko) 2014-09-22 2016-06-09 세종대학교산학협력단 주거침입절도범죄 예측 시스템 및 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022034984A1 (ko) * 2020-08-14 2022-02-17 고려대학교 산학협력단 치안 및 공공 데이터 기반 범죄 신고 수 예측 장치 및 방법
CN112906970A (zh) * 2021-03-03 2021-06-04 上海融港网络科技有限公司 一种犯罪预测方法、装置、终端和存储介质
CN112906970B (zh) * 2021-03-03 2022-12-30 上海融港网络科技有限公司 一种犯罪预测方法、装置、终端和存储介质

Similar Documents

Publication Publication Date Title
KR101830522B1 (ko) 빅 데이터를 이용한 예측 대상 지역의 범죄 발생 예측 방법
CN110364008B (zh) 路况确定方法、装置、计算机设备和存储介质
Wang et al. Machine learning-based regional scale intelligent modeling of building information for natural hazard risk management
Hung et al. Methods for assessing the credibility of volunteered geographic information in flood response: A case study in Brisbane, Australia
CN113570867B (zh) 一种城市交通状态预测方法、装置、设备及可读存储介质
McIntosh et al. Assessing similarity of geographic processes and events
CN116680658B (zh) 一种基于风险评价的热浪监测站选址方法及系统
JP2017228091A (ja) 歩行状態学習方法、歩行状態推定方法、路面状況理解方法、装置、及びプログラム
CN112309126A (zh) 车牌检测方法、装置、电子设备及计算机可读存储介质
Moosavi et al. Characterizing driving context from driver behavior
KR20190138350A (ko) 웨어러블 기기에서 수집한 생체 정보 및 행동 패턴을 활용한 개인별 범죄 피해 확률 예측 시스템
CN116108984A (zh) 基于流量-poi因果关系推理的城市流量预测方法
Chen et al. Uvlens: urban village boundary identification and population estimation leveraging open government data
Yue et al. Using twitter data to determine hurricane category: An experiment
CN113704373B (zh) 基于移动轨迹数据的用户识别方法、装置及存储介质
CN114970621A (zh) 异常聚集事件的检测方法、装置、电子设备和存储介质
CN112580616B (zh) 人群数量确定方法、装置、设备及存储介质
CN116384844B (zh) 基于地理信息云平台的决策方法及装置
Gupta et al. Cnn-based semantic change detection in satellite imagery
CN117455237A (zh) 一种基于多源数据的道路交通事故风险预测方法
CN115563652A (zh) 轨迹嵌入预防泄露方法及系统
KR102387284B1 (ko) 건강 영향의 심각도 및 사회경제적 취약성을 고려한 폭염영향 예측 장치 및 방법
KR101744776B1 (ko) 지도 검색 기록을 이용한 유동인구 추정 장치 및 방법
CN114298399A (zh) 城市社区案事件动态风险预测方法及装置
CN113971496A (zh) 活动影响下的城市交通路网状态演化趋势预测方法及系统