KR102473115B1

KR102473115B1 - 신고 데이터 분석 시스템 및 방법

Info

Publication number: KR102473115B1
Application number: KR1020220036060A
Authority: KR
Inventors: 이태현
Original assignee: 주식회사 비투엔
Priority date: 2022-03-23
Filing date: 2022-03-23
Publication date: 2022-12-01

Abstract

신고 데이터 분석 시스템 및 방법을 개시한다. 본 발명은 범죄 발생과 같은 신고 데이터를 기반으로 신고 발생 예측과 신고 발생 중심지점을 도출하여 최적의 순찰 지점을 제공하고, 신고 발상 예측 데이터를 기반으로 신고 발생시 신속한 출동과 순찰 업무의 효율적인 개선을 제공할 수 있다.

Description

신고 데이터 분석 시스템 및 방법{SYSTEM AND METHOD FOR ANALYSING REPORT DATA}

본 발명은 신고 데이터 분석 시스템 및 방법에 관한 발명으로서, 더욱 상세하게는 범죄 발생과 같은 신고 데이터를 기반으로 신고 발생 예측과 신고 발생 중심지점을 도출하여 최적의 순찰 지점을 제공하는 신고 데이터 분석 시스템 및 방법에 관한 것이다.

범죄는 피해의 심각성으로 인해 사회에서 큰 관심을 받고 있다. 이에 따라, 범죄 예방에 관한 다양한 연구가 진행되어 왔다.

이러한, 범죄에 관한 연구는 주로 통계적인 접근 방법을 이용해 다양한 데이터들과 실제 범죄 발생과의 상관관계 및 패턴을 분석하는 방법으로 진행되어 왔다.

근래에는 기술의 발전으로 인해 빅 데이터와 기계학습을 기반으로 범죄에 접근하는 방법에 대한 연구가 이루어지고 있다.

즉, 단순하게 통계적으로 데이터와 범죄 사이의 패턴 분석에서 더 나아가 실제 기계 학습 모델을 통해 범죄를 예측하는 시스템의 개발이 이루어지고 있다.

또한, 최근에는 범죄 예측 시스템을 실제 환경에 적용하여 범죄 예측 시스템의 결과를 기반으로 범죄 예방을 위한 효과적인 순찰 경로를 구성하였고, 실제 범죄 발생 감소의 효과를 보여주고 있다.

기계 학습 기반의 범죄 예측 시스템은 일반적으로 과거 범죄 발생 기록을 통해 범죄의 발생 패턴을 학습하며, 이 외에도 인구, 경제, 교육 등의 해당 지역의 특성을 나타낼 수 있는 다양한 정보를 수집하여 추가적으로 학습에 사용해 왔다.

한국등록특허공보 제10-1628938호에 개시된 '주거침입절도범죄 예측 시스템 및 방법'에서는 대상지의 3차원 공간 특성과 범죄자 행동 특성 간의 상관관계를 분석하여 예측 알고리즘을 설계하는 방법을 제안하고 있다.

종래 기술에 따른 예측 방법은 범죄자의 행동 특성과 같은 단지 하나의 유형 데이터만을 이용하기 때문에, 해당 유형의 데이터와 실제 범죄 발생 간의 상관관계가 작은 경우 예측 정확성을 담보하기는 어려울 뿐만 아니라, 단순한 우연에 의해 결과가 좌우되는 부정확성을 피하기 어려운 문제점이 있다.

한국등록특허공보 등록번호 제10-1628938호(발명의 명칭: 주거침입절도범죄 예측 시스템 및 방법)

이러한 문제점을 해결하기 위하여, 본 발명은 범죄 발생과 같은 신고 데이터를 기반으로 신고 발생 예측과 신고 발생 중심지점을 도출하여 최적의 순찰 지점을 제공하는 신고 데이터 분석 시스템 및 방법을 제공하는 것을 목적으로 한다.

상기한 목적을 달성하기 위하여 본 발명의 일 실시 예는 신고 데이터 분석 시스템으로서, 복수의 도메인 서버로부터 범죄 발생 상관성 분석을 위한 임의의 데이터를 수집하고, 수집된 데이터 중에서 탐색적 분석(Exploratory Data Analysis)을 통해 선택한 변수들과 신고 데이터와의 교차 상관 분석으로 다중공선성을 유발하는 변수를 제거한 상관성 입력 변수를 추출하는 변수 상관 분석부; 상기 추출된 상관성 입력 변수를 인공지능 기반의 신고 발생 예측 모델을 이용하여 신고 발생 위험도를 분석하고, 상기 신고 발생 위험도를 기반으로 임의의 지역별 신고 발생 위험도를 예측하는 신고 발생 예측부; 및 상기 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정하고, 선정된 추천 대상 지역의 신고 데이터를 이용한 군집화 분석을 수행하여 신고 다발 지점을 추출하며, 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 신규 순찰 경로를 추천하는 신고 중심점 도출부;를 포함한다.

또한, 상기 실시 예에 따른 변수 상관 분석부는 네트워크를 통해 연결된 복수의 도메인 서버 1, 도메인 서버 2 내지 도메인 서버 n으로부터 범죄 발생 상관성 분석을 위한 신고 건수, 범죄 발생 위치, 범죄 발생 시간, 범죄 발생 날짜, 순찰 경로, 공휴일 정보, 날씨 정보, 계절 정보, 성별/연령별/시간대별 유동 인구 정보를 포함한 데이터를 수집하는 데이터 수집부; 상기 수집된 데이터에서 시간적 데이터와 공간적 데이터의 그룹화와, 불량 데이터의 제거와, 타겟 분석 범위에 포함된 데이터의 추출과, 분석 범위에서 제외된 데이터를 삭제하는 전처리부; 및 상기 전처리된 데이터를 탐색적 분석(Exploratory Data Analysis)을 통해 임의의 변수들과 신고 관련 데이터간의 변수 상관도 분석, 변수 중요도 분석, 다중공선성 분석, 데이터 값 분석에 기반한 교차 상관 분석을 통해 다중공선성을 유발하는 변수 제거, 변수 통합, 정규화된 상관성 입력 변수를 추출하는 상관 분석부;를 포함하는 것을 특징으로 한다.

또한, 상기 실시 예에 따른 신고 발생 예측부는 LASSO Regression, Elastic Net Regression, Gradient Boosting 및 Random Forest 중 어느 하나에 기반한 신고 발생 예측 모델을 이용하여 신고 발생 위험도 분석을 학습하는 모델 학습부; 및 상기 모델 학습부에서 하나 이상의 모델 학습을 수행한 학습 결과를 K-Fold Cross Validation을 이용하여 점수별 비교를 통한 최적의 모델을 선정하는 모델 생성부;를 포함하는 것을 특징으로 한다.

또한, 상기 실시 예에 따른 모델 학습부는 RMSE(Root Mean Square Error)를 이용한 모델 예측값과 실제값의 차이를 산출하는 것을 기반으로 신고 발생 예측 모델의 학습을 수행하는 것을 특징으로 한다.

또한, 상기 실시 예에 따른 신고 중심점 도출부는 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정하고, 선정된 추천 대상 지역의 신고 데이터를 기반으로 위치 좌표값을 산출하며, 산출된 위치 좌표값을 기반으로 군집화 분석을 수행하여 신고 다발 지점에 대한 중심 좌표값을 추출하는 군집화 생성부; 및 상기 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 신규 순찰 경로를 추천하는 경로 추천부;를 포함하는 것을 특징으로 한다.

또한, 상기 실시 예에 따른 신고 다발 지점은 빈도 기반의 TF-IDF(Term Frequency - Inverse Document Frequency)를 통해 산출되는 것을 특징으로 한다.

또한, 본 발명의 일 실시 예는 신고 데이터 분석 방법으로서, a) 신고 발생 예측 서버가 네트워크를 통해 연결된 복수의 도메인 서버로부터 범죄 발생 상관성 분석을 위한 임의의 데이터를 수집하고, 수집된 데이터 중에서 탐색적 분석(Exploratory Data Analysis)을 통해 선택한 변수들과 신고 데이터와의 교차 상관 분석으로 다중공선성을 유발하는 변수를 제거한 상관성 입력 변수를 추출하는 단계; b) 상기 신고 발생 예측 서버가 추출된 상관성 입력 변수를 인공지능 기반의 신고 발생 예측 모델을 이용하여 신고 발생 위험도를 분석하고, 상기 신고 발생 위험도를 기반으로 임의의 지역별 신고 발생 위험도를 예측하는 단계; 및 c) 상기 신고 발생 예측 서버가 예측된 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정하고, 선정된 추천 대상 지역의 신고 데이터를 이용한 군집화 분석을 수행하여 신고 다발 지점을 추출하며, 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 신규 순찰 경로를 추천하는 단계;를 포함한다.

또한, 상기 실시 예에 따른 a) 단계는 a-1) 신고 발생 예측 서버가 네트워크를 통해 연결된 복수의 도메인 서버 1, 도메인 서버 2 내지 도메인 서버 n으로부터 범죄 발생 상관성 분석을 위한 신고 건수, 범죄 발생 위치, 범죄 발생 시간, 범죄 발생 날짜, 순찰 경로, 공휴일 정보, 날씨 정보, 계절 정보, 성별/연령별/시간대별 유동 인구 정보를 포함한 데이터를 수집하는 단계; a-2) 상기 신고 발생 예측 서버가 수집된 데이터에서 시간적 데이터와 공간적 데이터의 그룹화와, 불량 데이터의 제거와, 타겟 분석 범위에 포함된 데이터의 추출과, 분석 범위에서 제외된 데이터를 삭제하는 전처리 단계; a-3) 상기 신고 발생 예측 서버가 전처리된 데이터를 탐색적 분석(Exploratory Data Analysis)을 통해 임의의 변수들과 신고 관련 데이터간의 변수 상관도 분석, 변수 중요도 분석, 다중공선성 분석, 데이터 값 분석에 기반한 교차 상관 분석을 수행하는 단계; 및 a-4) 상기 신고 발생 예측 서버가 분석 결과에 따라 다중공선성을 유발하는 변수 제거, 변수 통합, 정규화된 상관성 입력 변수를 추출하는 유효 데이터 추출 단계;를 포함하는 것을 특징으로 한다.

또한, 상기 실시 예에 따른 b) 단계는 b-1) 신고 발생 예측 서버가 LASSO Regression, Elastic Net Regression, Gradient Boosting 및 Random Forest 중 어느 하나에 기반한 신고 발생 예측 모델을 이용하여 신고 발생 위험도 분석을 학습하는 단계; 및 b-2) 상기 신고 발생 예측 서버가 하나 이상의 신고 발생 예측 모델이 학습을 수행한 학습 결과를 K-Fold Cross Validation을 이용하여 점수별 비교를 통한 최적의 신고 발생 예측 모델을 선정하고, 선정된 신고 발생 예측 모델을 이용하여 신고 발생 위험도를 예측하는 단계;를 포함하되, 상기 신고 발생 예측 모델은 RMSE(Root Mean Square Error)를 이용한 모델 예측값과 실제값의 차이를 산출하는 것을 기반으로 신고 발생 예측 모델의 학습을 수행하는 것을 특징으로 한다.

또한, 상기 실시 예에 따른 c) 단계는 c-1) 신고 발생 예측 서버가 예측된 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정하는 단계; c-2) 상기 신고 발생 예측 서버가 선정된 추천 대상 지역의 신고 데이터를 기반으로 위치 좌표값을 산출하며, 산출된 위치 좌표값을 기반으로 군집화 분석을 수행하여 신고 다발 지점에 대한 중심 좌표값을 추출하는 단계; 및 c-3) 상기 신고 발생 예측 서버가 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 신규 순찰 경로를 분석하여 추천하는 단계;를 포함하는 것을 특징으로 한다.

본 발명은 범죄 발생 또는 화재 발생 등의 신고 데이터를 기반으로 신고 발생 예측과 신고 발생 중심지점을 도출하여 최적의 순찰 지점을 제공할 수 있는 장점이 있다.

또한, 본 발명은 신고 발상 예측 데이터를 기반으로 신고 발생시 신속한 출동과 순찰 업무의 효율적인 개선을 제공할 수 있는 장점이 있다.

도1은 본 발명의 일 실시 예에 따른 신고 데이터 분석 시스템의 구성을 나타낸 블록도.
도2는 도1의 실시 예에 따른 신고 데이터 분석 시스템의 신고 발생 예측 서버의 구성을 나타낸 블록도.
도3은 도2의 실시 예에 따른 신고 발생 예측 서버의 변수 상관 분석부 구성을 나타낸 블록도.
도4는 도2의 실시 예에 따른 신고 발생 예측 서버의 신고 발생 예측부 구성을 나타낸 블록도.
도5는 도2의 실시 예에 따른 신고 발생 예측 서버의 신고 중심점 도출부 구성을 나타낸 블록도.
도6은 본 발명의 일 실시 예에 따른 신고 데이터 분석 방법을 설명하기 위해 나타낸 흐름도.
도7은 도6의 실시 예에 따른 신고 데이터 분석 방법의 데이터 수집 및 변수 상관/중요도 분석과정을 설명하기 위해 나타낸 흐름도.
도8은 도6의 실시 예에 따른 신고 데이터 분석 방법의 신고 발생 예측 모델 학습 및 생성과정을 설명하기 위해 나타낸 흐름도.
도9는 도6의 실시 예에 따른 신고 데이터 분석 방법의 신고 중심점 추출과정을 설명하기 위해 나타낸 흐름도.
도10은 도6의 실시 예에 따른 신고 데이터 분석 방법의 최적화된 순찰 경로를 설명하기 위해 나타낸 예시도.

이하에서는 본 발명의 바람직한 실시 예 및 첨부하는 도면을 참조하여 본 발명을 상세히 설명하되, 도면의 동일한 참조부호는 동일한 구성요소를 지칭함을 전제하여 설명하기로 한다.

본 발명의 실시를 위한 구체적인 내용을 설명하기에 앞서, 본 발명의 기술적 요지와 직접적 관련이 없는 구성에 대해서는 본 발명의 기술적 요지를 흩뜨리지 않는 범위 내에서 생략하였음에 유의하여야 할 것이다.

또한, 본 명세서 및 청구범위에 사용된 용어 또는 단어는 발명자가 자신의 발명을 최선의 방법으로 설명하기 위해 적절한 용어의 개념을 정의할 수 있다는 원칙에 입각하여 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다.

본 명세서에서 어떤 부분이 어떤 구성요소를 "포함"한다는 표현은 다른 구성요소를 배제하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다.

또한, "‥부", "‥기", "‥모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어, 또는 그 둘의 결합으로 구분될 수 있다.

또한, "적어도 하나의" 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다.

또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시 예에 따라 변경가능하다 할 것이다.

이하, 첨부된 도면을 참조하여 본 발명의 일 실시 예에 따른 신고 데이터 분석 시스템 및 방법의 바람직한 실시예를 상세하게 설명한다.

도1은 본 발명의 일 실시 예에 따른 신고 데이터 분석 시스템의 구성을 나타낸 블록도이고, 도2는 도1의 실시 예에 따른 신고 데이터 분석 시스템의 신고 발생 예측 서버의 구성을 나타낸 블록도이며, 도3은 도2의 실시 예에 따른 신고 발생 예측 서버의 변수 상관 분석부 구성을 나타낸 블록도이고, 도4는 도2의 실시 예에 따른 신고 발생 예측 서버의 신고 발생 예측부 구성을 나타낸 블록도이며, 도5는 도2의 실시 예에 따른 신고 발생 예측 서버의 신고 중심점 도출부 구성을 나타낸 블록도이다.

도1 내지 도5를 참조하면, 본 발명의 일 실시 예에 따른 신고 데이터 분석 시스템은 범죄 발생과 같은 신고 데이터를 기반으로 신고 발생 예측과 신고 발생 중심지점을 도출하여 최적의 순찰 지점을 제공하고, 신고 발상 예측 데이터를 기반으로 신고 발생시 신속한 출동과 순찰 업무의 효율적인 개선을 제공할 수 있도록 신고 발생 예측 서버(100)와, 인터넷 등의 네트워크를 통해 연결되어 상기 신고 발생 예측 서버(100)로 범죄 발생 상관성 분석을 위한 관련 데이터를 제공하는 복수의 도메인 서버 1(200), 도메인 서버 2(200a) 내지 도메인 서버 n(200b)를 포함하여 구성될 수 있다.

이를 위해, 상기 신고 발생 예측 서버(100)는 변수 상관 분석부(110)와, 신고 발생 예측부(120)와, 신고 중심접 도출부(130)를 포함하여 구성될 수 있다.

또한, 상기 신고 발생 예측 서버(100)는 도메인 서버 1(200), 도메인 서버 2(200a) 내지 도메인 서버 n(200b)으로부터 공휴일, 신고 건수, 범죄 발생 위치, 범죄 발생 시간, 범죄 발생 날짜 등의 경찰청 도메인의 신고 데이터와, 경찰 장비/경찰 인력/순찰 경로/순찰 지점수 등의 경찰청 내부 도메인의 현황 데이터와, 성별/연령별/시간대별 유동 인구 등의 인구 관련 도메인의 통계학적 데이터와, 온도/습도/날씨/계절 등의 기상 관련 도메인의 기상 데이터 등 범죄 발생 상관성 분석을 위한 관련 데이터를 제공받을 수 있다.

상기 변수 상관 분석부(110)는 네트워크를 통해 접속한 도메인 서버 1(200), 도메인 서버 2(200a) 내지 도메인 서버 n(200b)으로부터 유의미한 데이터 분석을 통해 범죄 발생에 영향을 주는 외부 환경과, 내부 환경, 인구 통계학적인 요인들과 관련된 데이터를 도출하고 범죄 발생 상관성 분석을 위한 데이터들을 수집할 수 있다.

또한, 상기 변수 상관 분석부(110)는 수집된 데이터 중에서 탐색적 분석(Exploratory Data Analysis)을 통해 선택한 변수들과 신고 데이터와의 교차 상관 분석으로 다중공선성을 유발하는 변수를 제거한 상관성 입력 변수를 추출할 수 있다.

이를 위해, 상기 변수 상관 분석부(110)는 데이터 수집부(111)와, 전처리부(112)와, 상관 분석부(113)를 포함하여 구성될 수 있다.

상기 데이터 수집부(111)는 도메인 서버 1(200), 도메인 서버 2(200a) 내지 도메인 서버 n(200b)으로부터 범죄 발생 상관성 분석을 위한 관련 데이터, 예를 들어, 공휴일, 신고 건수, 범죄 발생 위치, 범죄 발생 시간, 범죄 발생 날짜 등의 신고 데이터와, 경찰 장비/경찰 인력/순찰 경로/순찰 지점수 등의 경찰청 현황 데이터와, 성별/연령별/시간대별 유동 인구 등의 인구 통계학적 데이터와, 온도/습도/날씨/계절 등의 기상 데이터 등을 수집한다.

상기 전처리부(112)는 수집된 데이터에서 임의의 시간대로 분할한 시간적 데이터의 그룹화와, 순찰 노선에 따른 순찰 지점 좌표화, 표준 주소, 미해당 순찰 지점 제외, 특정 지역 매핑 등 공간적 데이터의 그룹화를 수행할 수 있다.

또한, 상기 전처리부(112)는 불량 데이터의 제거와, 타겟 분석 범위에 포함된 데이터의 추출과, 분석 범위에서 제외된 데이터의 삭제, 추가 데이터 수집 등을 수행할 수 있다.

즉, 상기 전처리부(112)는 예를 들어, 경찰 업무 중에서, 특정 사건 긴급 코드, 타기관 데이터, 타관서 데이터, 종결 코드, 특정 시간 또는 날짜 이후의 데이터, 위도/경도 좌표 변환 실패 데이터, 지령, 종결 사건 등의 데이터 등을 제외하거나 또는 표준화된 주소로 변환하여 추가 데이터를 수집할 수도 있다.

상기 상관 분석부(113)는 전처리된 데이터를 탐색적 분석(Exploratory Data Analysis)을 통해 데이터 항목의 개수, 속성, 목록 등과 데이터 가공 과정에서 데이터의 오류나 누락 등이 있는지 확인하고, 데이터를 구성하는 각 속성 값이 미리 예측한 범위와 분포를 가지는 확인하는 전체적인 데이터 분석을 수행한다.

또한, 상기 상관 분석부(113)는 탐색적 분석을 통해 데이터에 포함된 이상 값(Outlier)의 존재 유무와, 서로 상관 관계를 갖는 속성들의 조합을 검색하거나, 또는 분석 대상이 되는 속성의 종류, 예를 들어 질적 변수와 양적 변수 등의 속성 간이 관계를 분석하여, 임의의 변수들과 신고 관련 데이터간의 변수 상관도 분석과, 변수 중요도 분석을 수행할 수 있다.

또한, 상기 상관 분석부(113)는 일부 변수가 다른 변수와 상관 정도가 높아 데이터 분석 시 부정적인 영향을 미치는 것을 방지하기 위하여 다중공선성 분석을 수행할 수도 있다.

또한, 상기 상관 분석부(113)는 변수들과 신고 관련 데이터간의 변수 상관도 분석과, 변수 중요도 분석을 통해 신고 발생에 대한 중요도가 낮거나 또는 데이터 값 분석에 기반한 교차 상관 분석을 통해 다중공선성을 유발하는 변수를 제거할 수 있다.

또한, 상기 상관 분석부(113)는 다중공선성 분석을 통해 서로 상관 관계가 높게 나타나는 변수, 예를 들어 유동 인구 연령대 구간 값 확대와, 성별 변수 분리 등의 유동 인구 관련 변수를 통합할 수 있다.

또한, 상기 상관 분석부(113)는 데이터 값의 범위차가 크게 나타나는 점을 고려하여 각 변수 값들에 대해 '0'과 '1' 사이의 값으로 정규화 처리를 통해 정규화하고, 정규화된 상관성 입력 변수를 신고 발생 예측부(120)로 제공할 수 있다.

여기서, 상기 신고 발생 예측부(120)로 입력되는 상관성 입력 변수는 예를 들어, 특정 지역, 순찰 지점수, 경찰 인원수, 유동 인구, 온도, 습도, 공휴일, 계절 정보, 성별에 따른 유동 인구 비율, 연령대에 따른 유동 인구 등 다양한 변수가 입력 변수로 추출될 수 있지만, 이에 한정되는 것은 아니고 다양한 변수가 입력 변수로 추출될 수 있다.

상기 신고 발생 예측부(120)는 변수 상관 분석부(110)에서 추출된 상관성 입력 변수를 인공지능 기반의 신고 발생 예측 모델의 입력으로 하여 신고 발생 위험도를 분석할 수 있다.

또한, 상기 신고 발생 예측부(120)는 분석된 신고 발생 위험도를 기반으로 임의의 지역별 신고 발생 위험도를 예측할 수 있으며, 모델 학습부(121)와, 모델 생성부(122)를 포함하여 구성될 수 있다.

상기 모델 학습부(121)는 LASSO Regression(회귀분석), Elastic Net Regression(엘라스틱넷 회귀분석), Gradient Boosting(그레디언트 부스팅) 및 Random Forest(랜덤 포레스트) 중 어느 하나의 알고리즘에 기반한 신고 발생 예측 모델을 이용하여 신고 발생 위험도 분석을 학습할 수 있다.

또한, 상기 모델 학습부(121)는 예를 들어 신고 발생 기간 설정, 학습 데이터/검증 데이터 분할 비율 등을 설정하여 신고 발생 예측 모델을 학습할 수도 있다.

또한, 상기 모델 학습부(121)는 RMSE(Root Mean Square Error)를 이용한 모델 예측값과 실제값의 차이를 하기식을 통해 산출하는 것에 기반하여 신고 발생 예측 모델의 학습을 수행할 수 있다.

여기서, RMES는 평균 제곱근 오차이고, MSE는 모델 예측값이고, E는 실제 환경에서 관찰되는 값이다.

상기 모델 생성부(122)는 모델 학습부(121)에서 하나 이상의 알고리즘을 이용하여 모델 학습을 수행한 학습 결과로부터 K-Fold Cross Validation(교차 검증)을 이용하여 점수별 비교를 통해 최적의 모델을 선정하고, 선정된 신고 발생 예측 모델을 이용하여 신고 발생 위험도를 예측한다.

즉, 상기 모델 생성부(122)는 신고 발생 예측 모델이 여러 번의 모델 학습을 수행하여 결과를 산출하고, 산출된 각 모델의 평가 점수를 종합하며, 추가로 미리 설정된 테스트 셋을 사용하여 점수를 산출한 후, 모델별로 점수를 비교하여 최적의 모델을 선정할 수 있다.

또한, 상기 모델 생성부(122)는 복수의 신고 발생 예측 모델을 대상으로 일정 횟수 이상의 학습과 평가를 수행하여 모델 학습의 결과에 대한 신뢰성을 확보할 수 있도록 한다.

또한, 상기 모델 생성부(122)는 선정된 신고 발생 예측 모델과, 변수 상관 분석부(110)에서 추출된 상관성 입력 변수를 이용하여 신고 발생 위험도를 예측할 수 있다.

상기 신고 중심점 도출부(130)는 신고 발생 예측부(120)에서 예측된 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정하고, 선정된 추천 대상 지역의 신고 데이터를 이용한 군집화 분석을 수행하여 신고 다발 지점을 추출할 수 있다.

또한, 상기 신고 중심점 도출부(130)는 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 신규 순찰 경로를 추천할 수 있도록 군집화 생성부(131)와, 경로 추천부(132)를 포함하여 구성될 수 있다.

상기 군집화 생성부(131)는 예측된 신고 발생 위험도를 기반으로 범죄 발생 위험도 순위가 높은 복수의 추천 대상 지역(예를 들어, 행정 구역상의 법정동)을 순차적으로 선정할 수 있다.

또한, 상기 군집화 생성부(131)는 선정된 추천 대상 지역의 신고 데이터를 기반으로 위치 좌표값을 산출하며, 산출된 위치 좌표값을 기반으로 군집화 분석을 수행하여 일정 개수 만큼 신고 건이 포함된 신고 다발 지점에 대한 중심 좌표값을 추출할 수 있다.

즉, 상기 군집화 생성부(131)는 산출된 위치 좌표값을 K-평균 군집화(K-Means Cluster)를 통해 군집화(grouping)한다.

비지도 학습 기반인 K-평균 군집화(K-Means Cluster)는 비슷한 특성(예를 들어, 가까운 위치)을 가진 예를 들어, 법정동별 신고 다발 지점끼리 묶는 그루핑을 수행하여 K개의 군집을 생성한다.

또한, 상기 군집화 생성부(131)는 군집화된 법정동별 또는 신고 다발 지점별로 중앙값을 추출하고, 추출된 중앙값에 기반하여 가장 대표성이 높은 신고 다발 지점(위치 좌표 중심점)을 추출할 수 있다.

또한, 상기 군집화 생성부(131)는 빈도 기반의 TF-IDF(Term Frequency - Inverse Document Frequency)를 통해 신고 다발 지점을 산출할 수도 있다.

즉, 상기 군집화 생성부(131)는 TF-IDF에 기반한 신고 다발 지점을 미리 설정된 위험도 단계, 예를 들어, '위험', '의심', '주의', '양호' 등의 위험도 단계 키워드 또는 임의의 텍스트 데이터에 빈도 기반 가중치를 주고, 법정동별로 등장하는 위험도 단계 키워드 또는 텍스트에 기반하여 산출할 수도 있다.

상기 경로 추천부(132)는 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 신규 순찰 경로를 추천할 수 있다.

즉, 상기 경로 추천부(132)는 산출된 신고 다발 지점을 기반으로 기존 순찰 경로와 비교하고, 비교 결과에 따른 평가 정보를 생성하여 제공할 수 있다.

또한, 상기 경로 추천부(132)는 기존 순찰 경로에 따른 순찰 지점 개수를 고려하여 예측된 신고 발생 위험도와, 위험도 단계별 신고 다발 지점만큼 순찰 경로에 반영한 신규 순찰 경로를 추천할 수도 있다.

상기 도메인 서버 1(200), 도메인 서버 2(200a) 내지 도메인 서버 n(200b)은 공휴일, 신고 건수, 범죄 발생 위치, 범죄 발생 시간, 범죄 발생 날짜, 경찰 장비/경찰 인력/순찰 경로/순찰 지점수 등의 경찰청 정보를 제공하는 경찰청 서버, 성별/연령별/시간대별 유동 인구 등의 인구 관련 통계학적 데이터를 제공하는 통계청 서버, 온도/습도/날씨/계절 등의 기상 관련 데이터를 제공하는 기상청 서버일 수 있지만, 이에 한정되는 것은 아니고, 범죄 발생 상관성 분석을 위한 관련 데이터를 제공하는 서버는 모두 포함될 수 있다.

다음은 본 발명의 일 실시 예에 따른 신고 데이터 분석 방법을 설명한다.

도6은 본 발명의 일 실시 예에 따른 신고 데이터 분석 방법을 설명하기 위해 나타낸 흐름도이고, 도7은 도6의 실시 예에 따른 신고 데이터 분석 방법의 데이터 수집 및 변수 상관/중요도 분석과정을 설명하기 위해 나타낸 흐름도이며, 도8은 도6의 실시 예에 따른 신고 데이터 분석 방법의 신고 발생 예측 모델 학습 및 생성과정을 설명하기 위해 나타낸 흐름도이고, 도9는 도6의 실시 예에 따른 신고 데이터 분석 방법의 신고 중심점 추출과정을 설명하기 위해 나타낸 흐름도이다.

도1 내지 도9를 참조하면, 본 발명의 일 실시 예에 따른 신고 데이터 분석 방법은 신고 발생 예측 서버(100)가 네트워크를 통해 연결된 복수의 도메인 서버(200, 200a, 200b)로부터 범죄 발생 상관성 분석을 위한 임의의 데이터를 수집하고, 수집된 데이터 중에서 탐색적 분석(Exploratory Data Analysis)을 통해 선택한 변수들과 신고 데이터와의 교차 상관 분석으로 다중공선성을 유발하는 변수를 제거한 상관성 입력 변수를 추출(S100)한다.

상기 S100 단계에서, 신고 발생 예측 서버(100)는 네트워크를 통해 연결된 복수의 도메인 서버 1(200), 도메인 서버 2(200a) 내지 도메인 서버 n(200b)으로부터 범죄 발생 상관성 분석을 위한 신고 건수, 범죄 발생 위치, 범죄 발생 시간, 범죄 발생 날짜, 순찰 경로, 공휴일 정보, 날씨 정보, 계절 정보, 성별/연령별/시간대별 유동 인구 정보를 포함한 데이터를 수집하고, 수집된 데이터에서 시간적 데이터와 공간적 데이터의 그룹화와, 불량 데이터의 제거와, 타겟 분석 범위에 포함된 데이터의 추출과, 분석 범위에서 제외된 데이터를 삭제하는 전처리를 수행(S110)할 수 있다.

즉, 상기 S110 단계에서 신고 발생 예측 서버(100)는 수집된 데이터에서 임의의 시간대로 분할한 시간적 데이터의 그룹화와, 순찰 노선에 따른 순찰 지점 좌표화, 표준 주소, 미해당 순찰 지점 제외, 특정 지역 매핑 등 공간적 데이터의 그룹화를 수행할 수 있다.

또한, 상기 S110 단계에서 신고 발생 예측 서버(100)는 불량 데이터의 제거와, 타겟 분석 범위에 포함된 데이터의 추출과, 분석 범위에서 제외된 데이터의 삭제, 추가 데이터 수집 등을 수행할 수 있다.

상기 S110 단계를 수행한 후, 신고 발생 예측 서버(100)는 S110 단계에서 전처리된 데이터를 탐색적 분석(Exploratory Data Analysis)을 통해 임의의 변수들과 신고 관련 데이터간의 변수 상관도 분석, 변수 중요도 분석, 다중공선성 분석, 데이터 값 분석에 기반한 교차 상관 분석을 수행(S120)한다.

즉, 상기 S120 단계에서 신고 발생 예측 서버(100)는 전처리된 데이터를 탐색적 분석을 통해 데이터 항목의 개수, 속성, 목록 등과 데이터 가공 과정에서 데이터의 오류나 누락 등이 있는지 확인하고, 데이터를 구성하는 각 속성 값이 미리 예측한 범위와 분포를 가지는 확인하는 전체적인 데이터 분석을 수행할 수 있다.

또한, 상기 S120 단계에서 신고 발생 예측 서버(100)는 탐색적 분석을 통해 데이터에 포함된 이상 값(Outlier)의 존재 유무와, 서로 상관 관계를 갖는 속성들의 조합을 검색하거나, 또는 분석 대상이 되는 속성의 종류, 예를 들어 질적 변수와 양적 변수 등의 속성 간이 관계를 분석하여, 임의의 변수들과 신고 관련 데이터간의 변수 상관도 분석과, 변수 중요도 분석을 수행할 수 있다.

또한, 상기 S120 단계에서 신고 발생 예측 서버(100)는 일부 변수가 다른 변수와 상관 정도가 높아 데이터 분석 시 부정적인 영향을 미치는 것을 방지하기 위하여 다중공선성 분석을 수행할 수도 있다.

또한, 상기 S120 단계에서 신고 발생 예측 서버(100)는 변수들과 신고 관련 데이터간의 변수 상관도 분석과, 변수 중요도 분석을 통해 신고 발생에 대한 중요도가 낮거나 또는 데이터 값 분석에 기반한 교차 상관 분석을 통해 다중공선성을 유발하는 변수를 제거할 수 있다.

또한, 상기 S120 단계에서 신고 발생 예측 서버(100)는 다중공선성 분석을 통해 서로 상관 관계가 높게 나타나는 변수, 예를 들어 유동 인구 연령대 구간 값 확대와, 성별 변수 분리 등의 유동 인구 관련 변수를 통합할 수 있다.

또한, 상기 S120 단계에서 신고 발생 예측 서버(100)는 데이터 값의 범위차가 크게 나타나는 점을 고려하여 각 변수 값들에 대해 '0'과 '1' 사이의 값으로 정규화 처리를 통해 정규화하고, 정규화된 상관성 입력 변수를 제공할 수도 있다.

상기 S120 단계를 수행한 후, 신고 발생 예측 서버(100)는 S120 단계의 분석 결과에 따라 다중공선성을 유발하는 변수 제거, 변수 통합, 정규화된 상관성 입력 변수를 추출하는 유효 데이터 추출(S130)한다.

계속해서, 상기 신고 발생 예측 서버(100)는 추출된 상관성 입력 변수를 인공지능 기반의 신고 발생 예측 모델을 이용하여 신고 발생 위험도를 분석하고, 상기 신고 발생 위험도를 기반으로 임의의 지역별 신고 발생 위험도를 예측하는 단계(S200)를 수행할 수 있다.

상기 S200 단계에서, 신고 발생 예측 서버(100)는 LASSO Regression(회귀분석), Elastic Net Regression(엘라스틱넷 회귀분석), Gradient Boosting(그레디언트 부스팅) 및 Random Forest(랜덤 포레스트) 중 어느 하나의 알고리즘에 기반한 신고 발생 예측 모델을 이용하여 신고 발생 위험도 분석을 학습(S210)할 수 있다.

또한, 상기 S210 단계에서 신고 발생 예측 서버(100)는 예를 들어, 신고 발생 기간 설정, 학습 데이터/검증 데이터 분할 비율 등을 설정하여 신고 발생 예측 모델을 학습할 수도 있다.

또한, 상기 S210 단계에서 신고 발생 예측 서버(100)는 RMSE(Root Mean Square Error)를 이용한 모델 예측값과 실제값의 차이를 하기식을 통해 산출하는 것에 기반하여 신고 발생 예측 모델의 학습을 수행할 수 있다.

계속해서, 상기 신고 발생 예측 서버(100)는 S210 단계에서 하나 이상의 알고리즘을 이용하여 모델 학습을 수행한 학습 결과로부터 K-Fold Cross Validation(교차 검증)을 이용하여 점수별 비교를 통해 최적의 모델을 선정하고, 선정된 신고 발생 예측 모델을 이용하여 신고 발생 위험도를 예측(S220)할 수 있다.

즉, 상기 S220 단계에서 신고 발생 예측 서버(100)는 신고 발생 예측 모델이 여러 번의 모델 학습을 수행하여 결과를 산출하고, 산출된 각 모델의 평가 점수를 종합하며, 추가로 미리 설정된 테스트 셋을 사용하여 점수를 산출한 후, 모델별로 점수를 비교하여 최적의 모델을 선정할 수 있다.

또한, 상기 S220 단계에서 신고 발생 예측 서버(100)는 복수의 신고 발생 예측 모델을 대상으로 일정 횟수 이상의 학습과 평가를 수행하여 모델 학습의 결과에 대한 신뢰성을 확보할 수 있도록 한다.

또한, 상기 S220 단계에서 신고 발생 예측 서버(100)는 선정된 신고 발생 예측 모델과, 변수 상관 분석부(110)에서 추출된 상관성 입력 변수를 이용하여 신고 발생 위험도를 예측할 수 있다.

계속해서, 상기 신고 발생 예측 서버(100)는 예측된 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정하고, 선정된 추천 대상 지역의 신고 데이터를 이용한 군집화 분석을 수행하여 신고 다발 지점을 추출하며, 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 신규 순찰 경로를 추천하는 단계(S300)를 수행할 수 있다.

상기 S300 단계에서 신고 발생 예측 서버(100)는 예측된 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정(S310)할 수 있다.

즉, 상기 S310 단계에서 신고 발생 예측 서버(100)는 예측된 신고 발생 위험도를 기반으로 범죄 발생 위험도 순위가 높은 복수의 추천 대상 지역(예를 들어, 행정 구역상의 법정동)을 순차적으로 선정할 수 있다.

또한, 상기 신고 발생 예측 서버(100)는 선정된 추천 대상 지역의 신고 데이터를 기반으로 위치 좌표값을 산출하며, 산출된 위치 좌표값을 기반으로 군집화 분석을 수행하여 일정 개수 만큼 신고 건이 포함된 신고 다발 지점에 대한 중심 좌표값인 신고 중심점을 추출(S320)할 수 있다.

이때, 상기 S320 단계에서 신고 발생 예측 서버(100)는 산출된 위치 좌표값을 K-평균 군집화(K-Means Cluster)를 통해 비슷한 특성(예를 들어, 가까운 위치)을 가진 예를 들어, 법정동별 신고 다발 지점끼리 묶는 그루핑을 수행하여 K개의 군집을 생성하는 군집화(grouping)를 수행할 수 있다.

또한, 상기 S320 단계에서 신고 발생 예측 서버(100)는 군집화된 법정동별 또는 신고 다발 지점별로 중앙값을 추출하고, 추출된 중앙값에 기반하여 가장 대표성이 높은 신고 다발 지점(위치 좌표 중심점)을 추출할 수 있다.

또한, 상기 S320 단계에서 신고 발생 예측 서버(100)는 빈도 기반의 TF-IDF(Term Frequency - Inverse Document Frequency)에 기반한 신고 다발 지점을 미리 설정된 위험도 단계, 예를 들어, '위험', '의심', '주의', '양호' 등의 위험도 단계 키워드에 빈도 기반 가중치를 주고, 법정동별로 등장하는 위험도 단계 키워드에 기반하여 신고 다발 지점을 산출할 수도 있다.

계속해서, 상기 신고 발생 예측 서버(100)는 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 신규 순찰 경로를 분석하여 추천(S330)할 수 있다.

상기 S330 단계에서, 신고 발생 예측 서버(100)는 산출된 신고 다발 지점을 기반으로 기존 순찰 경로와 비교하고, 비교 결과에 따른 평가 정보를 생성하여 제공할 수 있다.

또한, 상기 S330 단계에서 신고 발생 예측 서버(100)는 기존 순찰 경로에 따른 순찰 지점 개수를 고려하여 예측된 신고 발생 위험도와, 위험도 단계별 신고 다발 지점만큼 순찰 경로에 반영한 신규 순찰 경로를 추천할 수도 있다.

즉, 도 10에 나타낸 바와 같이, 순찰 경로(300)에서 기존의 순찰 지점(310, 311, 312, 313, 314)에 대하여 예측된 신고 발생 위험도가 높은 추천 순찰 지점(310a)을 추가한 추천 경로(300a)와, 추천 순찰 지점 1(310b)을 추가한 추천 경로 1(300b)을 생성하여 제공할 수 있다.

따라서, 범죄 발생 또는 화재 발생 등의 신고 데이터를 기반으로 신고 발생 예측과 신고 발생 중심지점을 도출하여 최적의 순찰 지점을 제공할 수 있다.

또한, 신고 발상 예측 데이터를 기반으로 신고 발생시 신속한 출동과 순찰 업무의 효율적인 개선을 제공할 수 있다.

상기와 같이, 본 발명의 바람직한 실시 예를 참조하여 설명하였지만 해당 기술 분야의 숙련된 당업자라면 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

또한, 본 발명의 특허청구범위에 기재된 도면번호는 설명의 명료성과 편의를 위해 기재한 것일 뿐 이에 한정되는 것은 아니며, 실시예를 설명하는 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다.

또한, 상술된 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있으므로, 이러한 용어들에 대한 해석은 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.

또한, 명시적으로 도시되거나 설명되지 아니하였다 하여도 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기재사항으로부터 본 발명에 의한 기술적 사상을 포함하는 다양한 형태의 변형을 할 수 있음은 자명하며, 이는 여전히 본 발명의 권리범위에 속한다.

또한, 첨부하는 도면을 참조하여 설명된 상기의 실시예들은 본 발명을 설명하기 위한 목적으로 기술된 것이며 본 발명의 권리범위는 이러한 실시예에 국한되지 아니한다.

100 : 신고 발생 예측 서버 110 : 변수 상관 분석부
111 : 데이터 수집부 112 : 전처리부
113 : 상관 분석부 120 : 신고 발생 예측부
121 : 모델 학습부 122 : 모델 생성부
130 : 신고 중심점 도출부 131 : 군집화 생성부
132 : 경로 추천부 200 : 도메인 서버 1
200a : 도메인 서버 2 200b : 도메인 서버 n
300 : 순찰 경로 300a : 추천 경로
300b : 추천 경로 1 310, 311, 312, 313, 314 : 순찰 지점
310a : 추천 순찰 지점 310b : 추천 순찰 지점 1

Claims

네트워크를 통해 연결된 복수의 도메인 서버 1(200), 도메인 서버 2(200a) 내지 도메인 서버 n(200b)으로부터 범죄 발생 상관성 분석을 위한 신고 건수, 범죄 발생 위치, 범죄 발생 시간, 범죄 발생 날짜, 순찰 경로, 공휴일 정보, 날씨 정보, 계절 정보, 성별/연령별/시간대별 유동 인구 정보를 포함한 데이터를 수집하는 데이터 수집부(111)와,
상기 수집된 데이터에서 시간적 데이터와 공간적 데이터의 그룹화와, 불량 데이터의 제거와, 타겟 분석 범위에 포함된 데이터의 추출과, 분석 범위에서 제외된 데이터를 삭제하되, 불량 데이터의 제거와, 타겟 분석 범위에 포함된 데이터의 추출과, 분석 범위에서 제외된 데이터의 삭제, 추가 데이터의 수집을 수행하여 경찰 업무 중에서, 특정 사건 긴급 코드, 타기관 데이터, 타관서 데이터, 종결 코드, 특정 시간 또는 날짜 이후의 데이터, 위도/경도 좌표 변환 실패 데이터, 지령, 종결 사건 데이터를 제외하고, 표준화된 주소로 변환한 추가 데이터를 수집하는 전처리부(112)와, 상기 전처리된 데이터를 탐색적 분석(Exploratory Data Analysis)을 통해 임의의 변수들과 신고 관련 데이터간의 변수 상관도 분석, 변수 중요도 분석, 다중공선성 분석, 데이터 값 분석에 기반한 교차 상관 분석을 통해 다중공선성을 유발하는 변수 제거, 변수 통합, 각 변수 값들에 대해 '0'과 '1' 사이의 값으로 정규화 처리를 통해 정규화된 상관성 입력 변수를 추출하는 상관 분석부(113)를 구비한 변수 상관 분석부(110);
상기 추출된 상관성 입력 변수를 인공지능 기반의 신고 발생 예측 모델을 이용하여 신고 발생 위험도를 분석하되, LASSO Regression, Elastic Net Regression, Gradient Boosting 및 Random Forest 중 어느 하나에 기반한 신고 발생 예측 모델을 이용하여 신고 발생 위험도 분석을 학습하고, RMSE(Root Mean Square Error)를 이용한 모델 예측값과 실제값의 차이를 다음의 수식

- 여기서, RMES는 평균 제곱근 오차이고, MSE는 모델 예측값이고, E는 실제 환경에서 관찰되는 값임- 을 통해 산출하는 것에 기반하여 신고 발생 예측 모델의 학습을 수행하는 모델 학습부(121)와, 상기 모델 학습부(121)에서 하나 이상의 모델 학습을 수행한 학습 결과로부터 각 모델의 평가 점수를 종합하며, 추가로 설정된 테스트 셋을 사용하여 산출한 점수를 K-Fold Cross Validation(교차 검증)을 이용하여 점수별 비교를 통한 최적의 모델을 선정하는 선정된 신고 발생 예측 모델을 이용하여 분석된 신고 발생 위험도를 기반으로 임의의 지역별 신고 발생 위험도를 예측하는 모델 생성부(122);를 구비한 신고 발생 예측부(120); 및
상기 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정하고, 선정된 추천 대상 지역의 신고 데이터를 이용한 군집화 분석을 수행하여 복수개의 군집을 생성하며, 생성된 군집별로 중앙값을 추출하여 추출된 중앙값에 기반한 가장 대표성이 높은 신고 다발 지점을 추출하고, 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 예측된 신고 발생 위험도와 위험도 단계별 신고 다발 지점을 반영한 신규 순찰 경로를 추천하는 신고 중심점 도출부(130);를 포함하는 신고 데이터 분석 시스템.
삭제
삭제
제 1 항에 있어서,
상기 모델 학습부(121)는 RMSE(Root Mean Square Error)를 이용한 모델 예측값과 실제값의 차이를 산출하는 것을 기반으로 신고 발생 예측 모델의 학습을 수행하는 것을 특징으로 하는 신고 데이터 분석 시스템.
제 1 항에 있어서,
상기 신고 중심점 도출부(130)는 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정하고, 선정된 추천 대상 지역의 신고 데이터를 기반으로 위치 좌표값을 산출하며, 산출된 위치 좌표값을 기반으로 군집화 분석을 수행하여 복수개의 군집을 생성하며, 신고 다발 지점에 대한 중심 좌표값을 추출하는 군집화 생성부(131); 및
상기 생성된 군집별로 중앙값을 추출하여 추출된 중앙값에 기반한 가장 대표성이 높은 신고 다발 지점을 추출하고, 상기 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 신규 순찰 경로를 추천하는 경로 추천부(132);를 포함하는 것을 특징으로 하는 신고 데이터 분석 시스템.
제 5 항에 있어서,
상기 신고 다발 지점은 빈도 기반의 TF-IDF(Term Frequency - Inverse Document Frequency)를 통해 산출되는 것을 특징으로 하는 신고 데이터 분석 시스템.
a) 신고 발생 예측 서버(100)가 네트워크를 통해 연결된 복수의 도메인 서버 1(200), 도메인 서버 2(200a) 내지 도메인 서버 n(200b)으로부터 범죄 발생 상관성 분석을 위한 신고 건수, 범죄 발생 위치, 범죄 발생 시간, 범죄 발생 날짜, 순찰 경로, 공휴일 정보, 날씨 정보, 계절 정보, 성별/연령별/시간대별 유동 인구 정보를 포함한 데이터를 수집하고, 상기 수집된 데이터에서 시간적 데이터와 공간적 데이터의 그룹화와, 불량 데이터의 제거와, 타겟 분석 범위에 포함된 데이터의 추출과, 분석 범위에서 제외된 데이터를 삭제하되, 불량 데이터의 제거와, 타겟 분석 범위에 포함된 데이터의 추출과, 분석 범위에서 제외된 데이터의 삭제, 추가 데이터의 수집을 수행하여 경찰 업무 중에서, 특정 사건 긴급 코드, 타기관 데이터, 타관서 데이터, 종결 코드, 특정 시간 또는 날짜 이후의 데이터, 위도/경도 좌표 변환 실패 데이터, 지령, 종결 사건 데이터를 제외하고, 표준화된 주소로 변환한 추가 데이터를 수집하며, 상기 전처리된 데이터를 탐색적 분석(Exploratory Data Analysis)을 통해 임의의 변수들과 신고 관련 데이터간의 변수 상관도 분석, 변수 중요도 분석, 다중공선성 분석, 데이터 값 분석에 기반한 교차 상관 분석을 통해 다중공선성을 유발하는 변수 제거, 변수 통합, 각 변수 값들에 대해 '0'과 '1' 사이의 값으로 정규화 처리를 통해 정규화된 상관성 입력 변수를 추출하는 단계;
b) 상기 신고 발생 예측 서버(100)가 추출된 상관성 입력 변수를 인공지능 기반의 신고 발생 예측 모델을 이용하여 신고 발생 위험도를 분석하되, LASSO Regression, Elastic Net Regression, Gradient Boosting 및 Random Forest 중 어느 하나에 기반한 신고 발생 예측 모델을 이용하여 신고 발생 위험도 분석을 학습하고, RMSE(Root Mean Square Error)를 이용한 모델 예측값과 실제값의 차이를 다음의 수식

- 여기서, RMES는 평균 제곱근 오차이고, MSE는 모델 예측값이고, E는 실제 환경에서 관찰되는 값임- 을 통해 산출하는 것에 기반하여 신고 발생 예측 모델의 학습을 수행하며, 하나 이상의 모델 학습을 수행한 학습 결과로부터 각 모델의 평가 점수를 종합하며, 추가로 설정된 테스트 셋을 사용하여 산출한 점수를 K-Fold Cross Validation(교차 검증)을 이용하여 점수별 비교를 통한 최적의 모델을 선정하는 선정된 신고 발생 예측 모델을 이용하여 분석된 신고 발생 위험도를 기반으로 임의의 지역별 신고 발생 위험도를 예측하는 단계; 및
c) 상기 신고 발생 예측 서버(100)가 예측된 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정하고, 선정된 추천 대상 지역의 신고 데이터를 이용한 군집화 분석을 수행하여 복수개의 군집을 생성하며, 생성된 군집별로 중앙값을 추출하여 추출된 중앙값에 기반한 가장 대표성이 높은 신고 다발 지점을 추출하고, 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 예측된 신고 발생 위험도와 위험도 단계별 신고 다발 지점을 반영한 신규 순찰 경로를 추천하는 단계;를 포함하는 신고 데이터 분석 방법.
삭제
삭제
제 7 항에 있어서,
상기 c) 단계는 c-1) 신고 발생 예측 서버(100)가 예측된 신고 발생 위험도를 기반으로 복수의 추천 대상 지역을 선정하는 단계;
c-2) 상기 신고 발생 예측 서버(100)가 선정된 추천 대상 지역의 신고 데이터를 기반으로 위치 좌표값을 산출하며, 산출된 위치 좌표값을 기반으로 군집화 분석을 수행하여 복수개의 군집을 생성하며, 신고 다발 지점에 대한 중심 좌표값을 추출하는 단계; 및
c-3) 상기 신고 발생 예측 서버(100)가 생성된 군집별로 중앙값을 추출하여 추출된 중앙값에 기반한 가장 대표성이 높은 신고 다발 지점을 추출하고, 추출된 신고 다발 지점을 기반으로 기존 순찰 경로에 대한 평가와 신규 순찰 경로를 분석하여 추천하는 단계;를 포함하는 것을 특징으로 하는 신고 데이터 분석 방법.
제 10 항에 있어서,
상기 신고 다발 지점은 빈도 기반의 TF-IDF(Term Frequency - Inverse Document Frequency)를 통해 산출되는 것을 특징으로 하는 신고 데이터 분석 방법.