WO2022034984A1 - Device and method for predicting number of crime reports on basis of security and public data - Google Patents

Device and method for predicting number of crime reports on basis of security and public data Download PDF

Info

Publication number
WO2022034984A1
WO2022034984A1 PCT/KR2020/017257 KR2020017257W WO2022034984A1 WO 2022034984 A1 WO2022034984 A1 WO 2022034984A1 KR 2020017257 W KR2020017257 W KR 2020017257W WO 2022034984 A1 WO2022034984 A1 WO 2022034984A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
predictive model
prediction
crime
unit
Prior art date
Application number
PCT/KR2020/017257
Other languages
French (fr)
Korean (ko)
Inventor
김서연
이민정
이지윤
목충협
조용원
황하은
김성범
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority claimed from KR1020200163665A external-priority patent/KR102430920B1/en
Publication of WO2022034984A1 publication Critical patent/WO2022034984A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Definitions

  • the present invention relates to a method for predicting the number of crime reports based on public security and public data, and in particular, a device for predicting the number of crime reports at the time of prediction by generating a predictive model using the number of crime reports and weather data, etc. and methods.
  • the present invention intends to provide a result interpretation function by predicting the number of crimes based on a crime prediction model using machine learning technology and diagnosing predictive model factors.
  • the technical problem to be achieved by the present invention is to provide an apparatus and method for predicting the number of crime reports based on security and public data.
  • a predictive model generating apparatus includes a data collection unit that collects data using a crawling technique, a data processing unit that pre-processes the data, and the number of crime reports at the time of prediction using the pre-processed data. and a predictive model generator for generating a predictive model to predict.
  • the method for generating a predictive model is performed by a computing device including at least a processor, collecting data using a crawling technique, preprocessing the data, and using the preprocessed data and generating a predictive model for predicting the number of crime reports at the time of prediction.
  • a prediction apparatus includes a second data collection unit for collecting second data, a second data processing unit for pre-processing the second data, and any one of claims 5 to 7 It includes a prediction unit for predicting the number of crime reports at the time of prediction using a prediction model that is generated by the described prediction model generation method and that takes as an input the second data pre-processed.
  • the device and method for predicting the number of crime reports it is possible to predict the number of crime reports at the time of prediction, and based on the prediction result, it is possible to efficiently process reports and crimes by jurisdiction. there is.
  • FIG. 1 is a functional block diagram of an apparatus for generating a predictive model according to an embodiment of the present invention.
  • FIG. 2 shows important variables of crime occurrence predicted by the prediction unit shown in FIG. 1 .
  • FIG. 3 is a functional block diagram of a prediction apparatus according to an embodiment of the present invention.
  • FIG. 4 is a flowchart illustrating a prediction model generation method performed by the prediction model generation apparatus shown in FIG. 1 or a prediction method performed by the prediction apparatus illustrated in FIG. 3 .
  • first or second may be used to describe various elements, but the elements should not be limited by the terms. The above terms are used only for the purpose of distinguishing one component from another, for example without departing from the scope of the inventive concept, a first component may be termed a second component and similarly a second component A component may also be referred to as a first component.
  • FIG. 1 is a functional block diagram of an apparatus for generating a predictive model according to an embodiment of the present invention.
  • the predictive model generating apparatus 100 includes a data collecting unit 110 , a data processing unit 120 , a clustering unit 130 , a predictive model generating unit 140 , a predicting unit 150 , and storage. At least one of the units 160 may be included. That is, some components of the above-described predictive model generating apparatus 100 may be omitted according to embodiments, and the predictive model generating unit 140 may be implemented as a computing device including at least a processor and/or a memory.
  • the predictive model generating apparatus 100 uses the data collected by the data collection unit 110 or the data received through a predetermined input device and stored in the storage unit 160 to report the number of crimes (or the number of crimes) And/or it is possible to generate a predictive model for predicting crime occurrence factors.
  • the predictive model generating apparatus 100 may predict the number of crime reports (or the number of crimes) and/or a crime occurrence factor by using the generated predictive model.
  • the predictive model generating apparatus 100 may be referred to as a predictive apparatus.
  • the data collection unit 110 may collect necessary data in the process of generating a prediction model and performing a prediction operation.
  • the data is data for a predetermined time period and may include at least one of first data and/or second data.
  • the data collection unit 110 may collect data from a server that provides data through a crawling technique (or a portal site provided by the server). Data collected by the data collection unit 110 may be stored in the storage unit 160 .
  • the first data is data used in the learning process of the first predictive model for predicting the number of crime reports (or the number of crimes) and/or the process of predicting the number of reports of crimes (or the number of crimes) using the first predictive model. It may mean reported data. Table 1 below shows an example of crime report data.
  • the first data may include at least one of a date, time, place, report content, and type of crime when a crime report occurred.
  • the time at which the crime report occurred may mean the time at which the report was received or the time interval (time zone) at which the report was received.
  • the time period may be divided into predetermined time units. For example, the time interval is a division of 24 hours a day into n (n is an integer) time unit, 0 to 1 o'clock, 1 to 2 o'clock, ... , may mean any one of 23 to 24 hours.
  • the time when the crime report occurs is defined as a time interval
  • the first data may include the number of reports received during the corresponding time interval.
  • a place may mean a place where a crime occurred or a place where it was reported.
  • the place is a coordinate that can identify the place (eg, GPS coordinates), an address (the address of the location where the complainant is located or the address of the location where the crime occurred), administrative unit, police station, district unit, jurisdiction of a police box, etc.
  • the report contents are the contents of the report of the crime reporter, and may mean audio data containing the contents of the report, text data containing the contents of the report, or summary data summarizing the contents of the report.
  • the type of crime refers to the type of crime reported. It can mean any one of family, robbery/drugs, traffic, fraud, murder, women, suicide, theft, maintenance of order, youth, violence, customs, etc. there is.
  • crime report data corresponds to crime report data received through emergency phone number 112.
  • the content included in the above-described first data may be a crawling result of the data collecting unit 110 , but at least a portion may be a result processed by the data processing unit 120 to be described later.
  • the second data may refer to data used in the learning process of the second predictive model for predicting at least one crime occurrence factor having the most importance among the crime occurrence factors and/or the crime occurrence factor prediction process using the second predictive model.
  • the second data may mean at least one of weather data, assembly data, public holiday data, local public data, and floating population data.
  • the content included in the above-described second data may be a crawling result of the data collecting unit 110 , but at least some may be a result of processing by the data processing unit 120 to be described later.
  • the weather data may include past weather data and/or future weather forecast data.
  • the weather data may include past weather data and/or weather forecast data for a certain area (province, city, district, etc.).
  • the assembly data may refer to assembly report data reported for the assembly, past assembly occurrence data, and the like, and may include information on the date and time of the assembly, the assembly place, the number of assembly people, and the like.
  • the holiday data may refer to data regarding legal holidays, temporary holidays, and the like.
  • Local public data includes the presence or absence of childcare facilities (daycare centers, kindergartens, etc.) in the area (eg, a pre-defined area (gu, competent police station, competent government office, etc.) Current status, incidence rate, frequency of occurrence, etc.), distribution of parks in the area, death statistics by cause of death in the area, presence of public sports facilities in the area, presence of leisure welfare facilities for the elderly in the area, status of persons with disabilities in the area (distribution rate of persons with disabilities) etc.), the current status of low-income single-parent families in the area (distribution rate, etc.), the classification of the area of use in the area, whether there is a national or public middle school in the area, whether or not apartment houses are built in the area, whether there are residential welfare facilities for the elderly in the area, It may mean at least one of the presence of medical institutions, the presence of national and public high schools in the region, the status of vacant houses in the region, and the resident registration population of the region.
  • the floating population data may mean the floating population at a specific point in time (or a specific time period) in the region, and may be provided by a telecommunication company, etc.
  • the data collection unit 110 may be omitted from the predictive model generating apparatus 100 .
  • the predictive model generating apparatus 100 may generate and/or predict a predictive model using data previously stored in the storage 160 .
  • the data processing unit 120 may pre-process the data collected by the data collection unit 110 and/or data previously received and stored in the storage unit 160 . Specifically, if a specific time is included in the crime report data included in the first data, it can be grouped by a predetermined time section and converted into crime report data including the time section and the number of reports in the corresponding time section. When the crime report data included in the first data includes a specific place (GPS coordinates, address, etc.), the data processing unit 120 transmits the crime report data to the competent police station, a predetermined corresponding area (gu, dong, etc.) , and/or the competent authority (jurisdictional district or police box) may be added or converted.
  • the competent police station a predetermined corresponding area (gu, dong, etc.)
  • the competent authority jurisdictional district or police box
  • the type of crime may be determined based on the crime report and converted or added to crime report data including the crime type.
  • the data processing unit 120 may convert voice data included in the crime report data into text data, and may determine the type of crime by extracting keywords described in the text data.
  • the data processing unit 120 may delete data having missing values in the first data and/or the second data.
  • Data processed by the data processing unit 120 may be stored in the storage unit 160 . Also, when the preprocessing operation is unnecessary for the first data and/or the second data, the data processing unit 120 may be omitted from the predictive model generating apparatus 100 . In this case, the predictive model generating apparatus 100 may generate and/or predict a predictive model using data received by the data receiving unit 110 or data previously stored in the storage 160 . .
  • the clustering unit 130 may group the competent authorities into jurisdictions having a similar crime report pattern by using time-series crime report data.
  • Time-series crime report data may refer to first data.
  • the first data may include the number of crime reports for each jurisdiction in a predetermined time unit (eg, 1 day or n hours).
  • the clustering unit 130 may measure the similarity (or distance) of the patterns of the time series data and group the jurisdictions according to the measured similarity (or distance), and a predetermined clustering algorithm may be used.
  • An exemplary clustering algorithm is a K-means algorithm using dynamic time warping (DTW) as a distance scale.
  • the predictive model generating unit 140 reports a crime using the data received by the data receiving unit 110 , the data preprocessed by the data processing unit 120 , or data previously received and stored in the storage unit 160 . It is possible to create predictive models that predict the number and/or crime occurrence factors.
  • the predictive model may include at least one of a first predictive model for predicting the number of crime reports using the first data and/or second data and a second predictive model for predicting a crime occurrence factor using the second data. .
  • the predictive model generator 140 may generate the first predictive model by learning a time series model, for example, an artificial neural network such as a recurrent neural network (RNN) using the first data.
  • the prediction model generator 140 receives the number of crime reports before the prediction time using the first data, and learns the artificial neural network to predict the number of crime reports during a predetermined time interval (prediction interval) from the prediction time.
  • Prediction interval a predetermined time interval
  • the first predictive model can be generated. Prediction of the number of crime reports may be performed up to k days (k is an integer) from the time the prediction operation is performed.
  • the first predictive model may predict the number of crime reports for 7 days from the time the prediction operation is performed by day. Table 2 below shows an example of predicting the number of crime reports by day from the time the prediction operation is performed until 7 days later.
  • the first prediction model may predict the number of crime reports for each predetermined time unit (eg, 6 hour units). As another example, the first prediction model predicts the number of crime reports for each unit, but may also predict the number of crime reports for each predetermined time unit with respect to at least a partial prediction time (eg, one day later).
  • the first prediction model may include prediction models for each of the clusters clustered by the clustering unit 130 .
  • the predictive model generator 140 may train the predictive model for each of the clusters by using the learning data (data related to the corresponding cluster among the first data) corresponding to each of the clusters.
  • the predictive model generator 140 may generate a second predictive model for determining a crime occurrence factor by using the second data.
  • the predictive model generator 140 uses the second data to learn a decision tree model (or boosting decision tree model) that extracts at least one important variable that has the greatest impact on crime occurrence, thereby making the second A predictive model can be created.
  • Boosting decision tree model is a machine learning technique that combines multiple decision trees to output better results than a single decision tree.
  • the decision tree is one of the supervised learning models that can perform both classification and regression.
  • An exemplary boosting decision tree model is the CatBoost (Categorical Boost) technique.
  • the prediction unit 150 may perform a prediction operation using the prediction model generated by the prediction model generation unit 140 . Specifically, the prediction unit 150 may predict the number of crime reports by using the first predictive model and the second predictive model, and may additionally predict an important variable in the occurrence of a crime using the second predictive model.
  • the prediction unit 150 uses the first data (eg, crime report data for the last 30 days) in a predetermined area (eg, jurisdiction It is possible to predict the number of crime reports by police station or competent authority). At this time, the number of crime reports in each zone is predicted using one first prediction model, or the number of crime reports in each zone is predicted using a prediction model specialized for each zone (that is, a prediction model generated using data of the cluster to which the zone belongs). The number of crime reports can be predicted. Also, the prediction unit 150 may predict the number of reported crimes during a predetermined prediction period by using the first data.
  • first data eg, crime report data for the last 30 days
  • a predetermined area eg, jurisdiction It is possible to predict the number of crime reports by police station or competent authority.
  • the prediction unit 150 may predict the number of reported crimes during a predetermined prediction period by using the first data.
  • the prediction unit 150 uses the first data and/or the second data to predict the importance of the occurrence of the crime at the time of prediction (eg, 3 days later). variable can be extracted.
  • the prediction result of the important variable of the crime using the second prediction model is shown in FIG. 2 .
  • Efficient manpower allocation is possible through the prediction result of the prediction unit 150 .
  • the storage unit 160 In the storage unit 160, the data collected (or received) by the data collection unit 110, the data preprocessed by the data processing unit 120, the clustering result by the clustering unit 130, the predictive model generation unit ( The prediction model generated by 140 , the prediction result by the prediction unit 150 , and the like may be stored.
  • FIG. 3 is a functional block diagram of a prediction apparatus according to an embodiment of the present invention.
  • the description of the prediction apparatus 300 illustrated in FIG. 3 descriptions of contents overlapping with those described above will be omitted.
  • the prediction apparatus 300 may include at least one of a data collection unit 310 , a data processing unit 320 , a prediction unit 330 , and a storage unit 340 . That is, some components of the prediction apparatus 300 may be omitted according to embodiments, and the prediction apparatus 300 may be implemented as a computing device including at least a processor and/or a memory.
  • the prediction device 300 uses the data collected by the data collection unit 310 or the data received through a predetermined input device and stored in the storage unit 340 to determine the number of crime reports (or the number of crimes) and / Alternatively, the number of reported crimes (or the number of crimes) and/or factors of occurrence of crimes may be predicted by using a predictive model that predicts the factors causing the crime.
  • the predictive model may refer to a predictive model generated by the predictive model generating apparatus 100 shown in FIG. 1 or a predictive model generating method performed by the predictive model generating apparatus 100 shown in FIG. 1 . .
  • the data collection unit 310 may collect necessary data in the process of performing the prediction operation.
  • the data is data for a predetermined time period and may include at least one of first data and/or second data.
  • Data collected by the data collection unit 310 may be stored in the storage unit 340 .
  • the operation of the data collection unit 310 may be the same as that of the data collection unit 110 illustrated in FIG. 1 , and thus a detailed description thereof will be omitted.
  • the data collection unit 310 may be omitted from the prediction apparatus 300 .
  • the prediction apparatus 300 may perform a prediction operation using data previously stored in the storage unit 340 .
  • the data processing unit 320 may pre-process the data collected by the data collection unit 310 and/or data previously received and stored in the storage unit 340 .
  • a detailed operation of the data processing unit 32 may be the same as that of the data processing unit 120 illustrated in FIG. 1 , and thus a detailed description thereof will be omitted.
  • Data processed by the data processing unit 320 may be stored in the storage unit 340 . Also, when the preprocessing operation is unnecessary for the first data and/or the second data, the data processing unit 320 may be omitted from the prediction apparatus 300 . In this case, the prediction apparatus 300 may perform a prediction operation using data received by the data receiver 310 or data previously stored in the storage 340 .
  • the prediction unit 330 may perform a prediction operation using the prediction model generated by the prediction model generation unit 140 shown in FIG. 1 . Specifically, the prediction unit 330 may predict the number of crime reports using the first prediction model, and may predict an important variable in the occurrence of a crime using the second prediction model. Since the detailed operation of the prediction unit 330 may be the same as that of the prediction unit 330 of FIG. 1 , a detailed description thereof will be omitted.
  • the storage unit 340 stores (or received) data collected by the data collection unit 310 , data preprocessed by the data processing unit 320 , a prediction model, and a prediction result by the prediction unit 330 . can be
  • FIG. 4 is a flowchart illustrating a prediction model generation method or a prediction method performed by the prediction model generation apparatus illustrated in FIG. 1 or the prediction apparatus illustrated in FIG. 3 .
  • the data may include first data and/or second data.
  • the data may be previously received and stored through a predetermined storage device, and in this case, step S100 may be omitted.
  • Received data or previously received and stored data is processed (or pre-processed) into a format for generating a predictive model or a format for performing a predictive operation (S200).
  • Received data or previously received and stored data may be in a format for generating a predictive model or a format for performing a predictive operation, and in this case, step S200 may be omitted.
  • step S300 a plurality of competent authorities are grouped (or clustered) according to the pattern of the number of crime reports (S300). This is to generate different predictive models for each group, and when generating one predictive model, step S300 may be omitted.
  • the prediction method other than the prediction model generation method may not include step S300.
  • At least one predictive model may be generated ( S400 ). A detailed description of the predictive model generation method will be omitted.
  • a prediction step may be performed (S500).
  • the number of crime reports (or the number of crimes) and/or important variables of the occurrence of crimes may be predicted using the generated prediction model.
  • the device described above may be implemented as a hardware component, a software component, and/or a set of hardware components and software components.
  • devices and components described in the embodiments may include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable array (FPA), It may be implemented using one or more general purpose or special purpose computers, such as a Programmable Logic Unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions.
  • the processing device may execute an operating system (OS) and one or more software applications executed on the operating system.
  • a processing device may also access, store, manipulate, process, and generate data in response to execution of the software.
  • OS operating system
  • a processing device may also access, store, manipulate, process, and generate data in response to execution of the software.
  • the processing device includes a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that can include For example, the processing device may include a plurality of processors or one processor and one controller. Other Processing Configurations are also possible, such as a Parallel Processor.
  • the software may include a computer program, code, instructions, or a combination of one or more thereof, and configure the processing device to operate as desired or process it independently or in combination (Collectively) You can command the device.
  • the software and/or data may be any kind of machine, component, physical device, virtual equipment, computer storage medium or device, to be interpreted by or provide instructions or data to the processing device. , or may be permanently or temporarily embodied in a transmitted signal wave (Signal Wave).
  • the software may be distributed over networked computer systems and stored or executed in a distributed manner. Software and data may be stored in one or more computer-readable recording media.
  • the method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium.
  • the computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination.
  • the program instructions recorded on the medium may be specially designed and configured for the embodiment, or may be known and available to those skilled in the art of computer software.
  • Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magnetic media such as floppy disks.
  • Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like.
  • the hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

Abstract

Disclosed are a device and a method for generating a model for predicting the number of crime reports, on the basis of security and public data. The device for generating a prediction model comprises: a data collection unit for collecting data by using a crawling technique; a data processing unit for pre-processing the data; and a prediction model generation unit for generating a prediction model for predicting the number of crime reports at a prediction time point, by using the pre-processed data.

Description

치안 및 공공 데이터 기반 범죄 신고 수 예측 장치 및 방법Apparatus and method for predicting the number of crime reports based on security and public data
본 발명은 치안 및 공공 데이터 기반 범죄 신고 수 예측 방법에 관한 것으로, 특히 범죄 신고 수, 기상 데이터 등을 이용하여 예측모델을 생성함으로써 예측 시점에서의 범죄 신고 수를 미리 예측할 수 있는 범죄 신고 수 예측 장치 및 방법에 관한 것이다.The present invention relates to a method for predicting the number of crime reports based on public security and public data, and in particular, a device for predicting the number of crime reports at the time of prediction by generating a predictive model using the number of crime reports and weather data, etc. and methods.
인공지능 등의 정보통신의 발달로 치안 서비스의 지능화가 진행되고 있으며, 미국 등 주요 선진국들은 지난 10년 동안 범죄에 대한 경찰 빅데이터 분석을 통하여 한정된 경찰 인력을 효과적으로 활용하기 위해 많은 노력을 하고 있다.With the development of information and communication technologies such as artificial intelligence, the intelligence of security services is progressing, and major advanced countries such as the United States are making great efforts to effectively utilize the limited police force through police big data analysis on crimes over the past 10 years.
최근에는 범죄예측 모델을 통한 범죄테러 감지, 용의자의 차량 인식, 추적 등을 통하여 위험 상황을 사전에 예측하여 선제적인 대응 및 수사 지원을 위한 시스템 개발이 이루어지고 있다.Recently, a system for preemptive response and investigation support is being developed by predicting dangerous situations in advance through crime terror detection through a crime prediction model, vehicle recognition of suspects, and tracking.
사회 안전과 치안 유지를 위해 경찰 인력이 점점 증가하지만, 인력 충원만으로는 제약이 있기 때문에 새로운 기술의 도입이 시급하다. 종래의 기술은 전통 통계 방식 기반 범죄 예측을 수행하기 때문에 예측 성능 확보에 어려움이 있다. 이에 본 발명에서는 머신러닝 기술을 활용하여 범죄 예측 모델 기반으로 범죄 발생 건수 예측, 예측 모델 요인 진단을 통해 결과 해석 기능을 제공하고자 한다.Although the number of police personnel is increasing to maintain social safety and security, there is a limit to just recruiting manpower, so the introduction of new technologies is urgently needed. Since the prior art performs crime prediction based on a traditional statistical method, it is difficult to secure prediction performance. Accordingly, the present invention intends to provide a result interpretation function by predicting the number of crimes based on a crime prediction model using machine learning technology and diagnosing predictive model factors.
본 발명이 이루고자 하는 기술적인 과제는 치안 및 공공 데이터 기반 범죄 신고 수를 예측하는 장치 및 방법을 제공하는 것이다.The technical problem to be achieved by the present invention is to provide an apparatus and method for predicting the number of crime reports based on security and public data.
본 발명의 일 실시예에 따른 예측모델 생성 장치는 크롤링 기법을 이용하여 데이터를 수집하는 데이터 수집부, 상기 데이터를 전처리하는 데이터 가공부, 및 전처리된 데이터를 이용하여 예측 시점에서의 범죄 신고 수를 예측하는 예측모델을 생성하는 예측모델 생성부를 포함한다.A predictive model generating apparatus according to an embodiment of the present invention includes a data collection unit that collects data using a crawling technique, a data processing unit that pre-processes the data, and the number of crime reports at the time of prediction using the pre-processed data. and a predictive model generator for generating a predictive model to predict.
본 발명의 일 실시예에 따른 예측모델 생성 방법은 적어도 프로세서를 포함하는 컴퓨팅 장치에 의해 수행되고, 크롤링 기법을 이용하여 데이터를 수집하는 단계, 상기 데이터를 전처리하는 단계, 및 전처리된 데이터를 이용하여 예측 시점에서의 범죄 신고 수를 예측하는 예측모델을 생성하는 단계를 포함한다.The method for generating a predictive model according to an embodiment of the present invention is performed by a computing device including at least a processor, collecting data using a crawling technique, preprocessing the data, and using the preprocessed data and generating a predictive model for predicting the number of crime reports at the time of prediction.
본 발명의 일 실시예에 따른 예측 장치는 제2 데이터를 수집하는 제2 데이터 수집부, 상기 제2 데이터를 전처리하는 제2 데이터 가공부, 및 제5항 내지 제7항 중 어느 하나의 항에 기재된 예측모델 생성 방법에 의해 생성되고 전처리된 제2 데이터를 입력으로 하는 예측모델을 이용하여 예측 시점에서의 범죄 신고 수를 예측하는 예측부를 포함한다.A prediction apparatus according to an embodiment of the present invention includes a second data collection unit for collecting second data, a second data processing unit for pre-processing the second data, and any one of claims 5 to 7 It includes a prediction unit for predicting the number of crime reports at the time of prediction using a prediction model that is generated by the described prediction model generation method and that takes as an input the second data pre-processed.
본 발명의 실시예에 따른 범죄 신고 수 예측 장치 및 방법에 의할 경우, 예측 시점의 범죄 신고 수를 예측할 수 있고, 예측 결과에 기반하여 관할관서별 신고와 범죄를 효율적으로 처리할 수 있는 효과가 있다.According to the device and method for predicting the number of crime reports according to an embodiment of the present invention, it is possible to predict the number of crime reports at the time of prediction, and based on the prediction result, it is possible to efficiently process reports and crimes by jurisdiction. there is.
본 발명의 상세한 설명에서 인용되는 도면을 보다 충분히 이해하기 위하여 각 도면의 상세한 설명이 제공된다.In order to more fully understand the drawings recited in the Detailed Description, a detailed description of each drawing is provided.
도 1은 본 발명이 일 실시예에 따른 예측모델 생성 장치의 기능 블럭도이다.1 is a functional block diagram of an apparatus for generating a predictive model according to an embodiment of the present invention.
도 2는 도 1에 도시된 예측부에 의해 예측된 범죄 발생의 중요 변수를 도시한다.FIG. 2 shows important variables of crime occurrence predicted by the prediction unit shown in FIG. 1 .
도 3은 본 발명의 일 실시예에 따른 예측 장치의 기능 블럭도이다.3 is a functional block diagram of a prediction apparatus according to an embodiment of the present invention.
도 4는 도 1에 도시된 예측모델 생성 장치에 의해 수행되는 예측모델 생성 방법 또는 도 3에 도시된 예측 장치에 의해 수행되는 예측 방법을 설명하기 위한 흐름도이다.4 is a flowchart illustrating a prediction model generation method performed by the prediction model generation apparatus shown in FIG. 1 or a prediction method performed by the prediction apparatus illustrated in FIG. 3 .
본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시예들은 다양한 형태들로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.Specific structural or functional descriptions of the embodiments according to the concept of the present invention disclosed herein are only exemplified for the purpose of explaining the embodiments according to the concept of the present invention, and the embodiment according to the concept of the present invention These may be embodied in various forms and are not limited to the embodiments described herein.
본 발명의 개념에 따른 실시예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시예들을 도면에 예시하고 본 명세서에서 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시예들을 특정한 개시 형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물, 또는 대체물을 포함한다.Since the embodiments according to the concept of the present invention may have various changes and may have various forms, the embodiments will be illustrated in the drawings and described in detail herein. However, this is not intended to limit the embodiments according to the concept of the present invention to specific disclosed forms, and includes all modifications, equivalents, or substitutes included in the spirit and scope of the present invention.
제1 또는 제2 등의 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만, 예컨대 본 발명의 개념에 따른 권리 범위로부터 벗어나지 않은 채, 제1 구성 요소는 제2 구성 요소로 명명될 수 있고 유사하게 제2 구성 요소는 제1 구성 요소로도 명명될 수 있다.Terms such as first or second may be used to describe various elements, but the elements should not be limited by the terms. The above terms are used only for the purpose of distinguishing one component from another, for example without departing from the scope of the inventive concept, a first component may be termed a second component and similarly a second component A component may also be referred to as a first component.
어떤 구성 요소가 다른 구성 요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성 요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성 요소가 다른 구성 요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는 중간에 다른 구성 요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성 요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.When a component is referred to as being “connected” or “connected” to another component, it is understood that it may be directly connected or connected to the other component, but other components may exist in between. it should be On the other hand, when it is said that a certain element is "directly connected" or "directly connected" to another element, it should be understood that the other element does not exist in the middle. Other expressions describing the relationship between components, such as "between" and "immediately between" or "neighboring to" and "directly adjacent to", etc., should be interpreted similarly.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로서, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 본 명세서에 기재된 특징, 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used herein are used only to describe specific embodiments, and are not intended to limit the present invention. The singular expression includes the plural expression unless the context clearly dictates otherwise. In this specification, terms such as "comprise" or "have" are intended to designate that a feature, number, step, operation, component, part, or combination thereof described herein exists, but one or more other features It should be understood that it does not preclude the possibility of the presence or addition of numbers, steps, operations, components, parts, or combinations thereof.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related art, and should not be interpreted in an ideal or excessively formal meaning unless explicitly defined in the present specification. does not
이하, 본 명세서에 첨부된 도면들을 참조하여 본 발명의 실시예들을 상세히 설명한다. 그러나, 특허출원의 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. However, the scope of the patent application is not limited or limited by these embodiments. Like reference numerals in each figure indicate like elements.
도 1은 본 발명의 일 실시예에 따른 예측모델 생성 장치의 기능 블럭도이다.1 is a functional block diagram of an apparatus for generating a predictive model according to an embodiment of the present invention.
도 1은 참조하면, 예측모델 생성 장치(100)는 데이터 수집부(110), 데이터 가공부(120), 군집화부(130), 예측모델 생성부(140), 예측부(150), 및 저장부(160) 중 적어도 하나를 포함할 수 있다. 즉, 상술한 예측모델 생성 장치(100)의 일부 구성은 실시예에 따라 생략될 수도 있으며, 예측모델 생성부(140)는 적어도 프로세서 및/또는 메모리를 포함하는 컴퓨팅 장치로 구현될 수 있다.Referring to FIG. 1 , the predictive model generating apparatus 100 includes a data collecting unit 110 , a data processing unit 120 , a clustering unit 130 , a predictive model generating unit 140 , a predicting unit 150 , and storage. At least one of the units 160 may be included. That is, some components of the above-described predictive model generating apparatus 100 may be omitted according to embodiments, and the predictive model generating unit 140 may be implemented as a computing device including at least a processor and/or a memory.
예측모델 생성 장치(100)는 데이터 수집부(110)에 의해 수집된 데이터 또는 소정의 입력 장치를 통해 수신되어 저장부(160)에 저장되어 있는 데이터를 이용하여 범죄 신고 수(또는 범죄 발생 수) 및/또는 범죄 발생 요인을 예측하는 예측모델을 생성할 수 있다. 실시예에 따라, 예측모델 생성 장치(100)는 생성된 예측모델을 이용하여 범죄 신고 수(또는 범죄 발생 수) 및/또는 범죄 발생 요인을 예측할 수 있다. 이 경우, 예측모델 생성 장치(100)는 예측 장치로 명명될 수도 있다.The predictive model generating apparatus 100 uses the data collected by the data collection unit 110 or the data received through a predetermined input device and stored in the storage unit 160 to report the number of crimes (or the number of crimes) And/or it is possible to generate a predictive model for predicting crime occurrence factors. According to an embodiment, the predictive model generating apparatus 100 may predict the number of crime reports (or the number of crimes) and/or a crime occurrence factor by using the generated predictive model. In this case, the predictive model generating apparatus 100 may be referred to as a predictive apparatus.
데이터 수집부(110)는 예측모델의 생성과 예측 동작을 수행하는 과정에서 필요한 데이터를 수집할 수 있다. 데이터는 미리 정해진 시간 구간 동안의 데이터로 제1 데이터 및/또는 제2 데이터 중 적어도 하나를 포함할 수 있다. 데이터 수집부(110)는 크롤링 기법을 통해 데이터를 제공하는 서버(또는 서버에 의해 제공되는 포털 사이트)로부터 데이터를 수집할 수 있다. 데이터 수집부(110)에 의해 수집된 데이터는 저장부(160)에 저장될 수 있다.The data collection unit 110 may collect necessary data in the process of generating a prediction model and performing a prediction operation. The data is data for a predetermined time period and may include at least one of first data and/or second data. The data collection unit 110 may collect data from a server that provides data through a crawling technique (or a portal site provided by the server). Data collected by the data collection unit 110 may be stored in the storage unit 160 .
제1 데이터는 범죄 신고 수(또는 범죄 발생 수)를 예측하는 제1 예측모델의 학습 과정 및/또는 제1 예측모델을 이용한 범죄 신고 수(또는 범죄 발생 수) 예측 과정에 이용되는 데이터로써, 범죄 신고 데이터를 의미할 수 있다. 아래 표 1은 범죄 신고 데이터의 일 예를 나타낸다.The first data is data used in the learning process of the first predictive model for predicting the number of crime reports (or the number of crimes) and/or the process of predicting the number of reports of crimes (or the number of crimes) using the first predictive model. It may mean reported data. Table 1 below shows an example of crime report data.
월일month day 시간hour 신고 건수number of reports
4월 2일April 2 22~23시22-23 o'clock 44
4월 2일April 2 23~24시23-24 hours 22
4월 3일April 3 00~01시00 - 01:00 22
4월 3일April 3 01~02시01-2 o'clock 22
4월 3일April 3 02~03시02~03 o'clock 33
4월 3일April 3 03~04시03~04 o'clock 22
4월 3일April 3 04~05시04-05 o'clock 66
4월 3일April 3 05~06시05-06 o'clock 55
4월 3일April 3 06~07시06-07 o'clock 88
4월 3일April 3 07~08시07-8 o'clock 33
4월 3일April 3 08~09시08-09 o'clock 33
4월 3일April 3 09~10시09-10 o'clock 55
제1 데이터에는 범죄 신고가 발생한 일자, 시간, 장소, 신고 내용, 범죄의 유형, 중 적어도 하나를 포함할 수 있다. 범죄 신고가 발생한 시간은 신고가 접수된 시간을 의미하거나 신고가 접수된 시간 구간(시간대)을 의미할 수도 있다. 시간 구간은 미리 정해진 시간 단위로 구분될 수 있다. 예컨대, 시간 구간은 하루 24시간을 n(n은 정수) 시간 단위로 분할한 것으로, 0~1시, 1~2시, …, 23~24시 중 어느 하나를 의미할 수 있다. 범죄 신고가 발생한 시간이 시간 구간으로 정의된 경우, 제1 데이터는 해당 시간 구간 동안에 접수된 신고 건수를 포함할 수도 있다. 장소는 범죄가 발생한 장소 또는 신고된 장소를 의미할 수 있다. 실시예에 따라, 장소는 장소를 식별할 수 있는 좌표(예컨대, GPS 좌표), 주소(신고자가 위치한 위치의 주소 또는 범죄가 발생한 위치의 주소), 행정동 단위, 경찰서, 지구대, 파출소의 관할 구역 등을 의미할 수 있다. 신고 내용은 범죄 신고자의 신고 내용으로 신고 내용이 담긴 음성 데이터, 신고 내용이 기재된 텍스트 데이터, 또는 신고 내용을 요약한 요약 데이터 등을 의미할 수 있다. 범죄의 유형은 신고된 범죄의 유형을 의미하는 것으로, 가정, 강도·마약, 교통, 사기, 살인, 여성, 자살, 절도, 질서 유지, 청소년, 폭력, 풍속, 기타 등 중 어느 하나를 의미할 수 있다. 대한민국의 경우, 범죄 신고 데이터는 긴급 전화번호 112를 통해 접수된 범죄 신고 데이터에 해당한다. 상술한 제1 데이터에 포함된 내용은 데이터 수집부(110)의 크롤링 결과일 수도 있으나, 적어도 일부는 후술할 데이터 가공부(120)에 의해 가공된 결과일 수도 있다.The first data may include at least one of a date, time, place, report content, and type of crime when a crime report occurred. The time at which the crime report occurred may mean the time at which the report was received or the time interval (time zone) at which the report was received. The time period may be divided into predetermined time units. For example, the time interval is a division of 24 hours a day into n (n is an integer) time unit, 0 to 1 o'clock, 1 to 2 o'clock, ... , may mean any one of 23 to 24 hours. When the time when the crime report occurs is defined as a time interval, the first data may include the number of reports received during the corresponding time interval. A place may mean a place where a crime occurred or a place where it was reported. According to an embodiment, the place is a coordinate that can identify the place (eg, GPS coordinates), an address (the address of the location where the complainant is located or the address of the location where the crime occurred), administrative unit, police station, district unit, jurisdiction of a police box, etc. can mean The report contents are the contents of the report of the crime reporter, and may mean audio data containing the contents of the report, text data containing the contents of the report, or summary data summarizing the contents of the report. The type of crime refers to the type of crime reported. It can mean any one of family, robbery/drugs, traffic, fraud, murder, women, suicide, theft, maintenance of order, youth, violence, customs, etc. there is. In the case of the Republic of Korea, crime report data corresponds to crime report data received through emergency phone number 112. The content included in the above-described first data may be a crawling result of the data collecting unit 110 , but at least a portion may be a result processed by the data processing unit 120 to be described later.
제2 데이터는 범죄 발생 요인들 중 가장 중요도를 갖는 적어도 하나의 범죄 발생 요인을 예측하는 제2 예측모델의 학습 과정 및/또는 제2 예측모델을 이용한 범죄 발생 요인 예측 과정에 이용되는 데이터를 의미할 수 있다. 제2 데이터는 기상 데이터, 집회 데이터, 공휴일 데이터, 지역 공공 데이터, 및 유동인구 데이터 중 적어도 하나를 의미할 수 있다. 상술한 제2 데이터에 포함된 내용은 데이터 수집부(110)의 크롤링 결과일 수도 있으나, 적어도 일부는 후술할 데이터 가공부(120)에 의해 가공된 결과일 수도 있다.The second data may refer to data used in the learning process of the second predictive model for predicting at least one crime occurrence factor having the most importance among the crime occurrence factors and/or the crime occurrence factor prediction process using the second predictive model. can The second data may mean at least one of weather data, assembly data, public holiday data, local public data, and floating population data. The content included in the above-described second data may be a crawling result of the data collecting unit 110 , but at least some may be a result of processing by the data processing unit 120 to be described later.
기상 데이터는 과거의 기상 데이터 및/또는 미래의 기상 예보 데이터를 포함할 수 있다. 또한, 기상 데이터는 일정 구역(도, 시, 구 등)에 관한 과거의 기상 데이터 및/또는 기상 예보 데이터를 포함할 수도 있다.The weather data may include past weather data and/or future weather forecast data. In addition, the weather data may include past weather data and/or weather forecast data for a certain area (province, city, district, etc.).
집회 데이터는 집회를 하기 위해 신고된 집회 신고 데이터, 과거의 집회 발생 데이터 등을 의미할 수 있으며, 집회 일시, 집회 장소, 집회 인원 등에 관한 정보를 포함할 수 있다.The assembly data may refer to assembly report data reported for the assembly, past assembly occurrence data, and the like, and may include information on the date and time of the assembly, the assembly place, the number of assembly people, and the like.
공휴일 데이터는 법정 공휴일, 임시 공휴일 등에 관한 데이터를 의미할 수 있다.The holiday data may refer to data regarding legal holidays, temporary holidays, and the like.
지역 공공 데이터는 해당 지역(예컨대, 미리 정의된 구역(구, 관할경찰서, 관할관서 등))의 보육 시설(어린이집, 유치원 등)의 유무, 해당 월, 해당 지역의 범죄발생현황(5대범죄발생현황, 발생율, 발생빈도 등), 해당 지역의 공원 분포 여부, 해당 지역의 사망원인별 사망통계, 해당 지역의 공공체육시설 유무, 해당 지역의 노인여가복지시설 유무, 해당 지역의 장애인 현황(장애인 분포율 등), 해당 지역의 저소득한부모가족 현황(분포율 등), 해당 지역의 용도지역 구분, 해당 지역의 국공립중학교 유무, 해당 지역의 공동주택건립 여부, 해당 지역의 노인주거복지 시설의 유무, 해당 지역의 의료기관 유무, 해당 지역의 국공립고등학교 유무, 해당 지역의 빈집 현황, 해당 지역의 주민등록 인구 등 중 적어도 하나를 의미할 수 있다.Local public data includes the presence or absence of childcare facilities (daycare centers, kindergartens, etc.) in the area (eg, a pre-defined area (gu, competent police station, competent government office, etc.) Current status, incidence rate, frequency of occurrence, etc.), distribution of parks in the area, death statistics by cause of death in the area, presence of public sports facilities in the area, presence of leisure welfare facilities for the elderly in the area, status of persons with disabilities in the area (distribution rate of persons with disabilities) etc.), the current status of low-income single-parent families in the area (distribution rate, etc.), the classification of the area of use in the area, whether there is a national or public middle school in the area, whether or not apartment houses are built in the area, whether there are residential welfare facilities for the elderly in the area, It may mean at least one of the presence of medical institutions, the presence of national and public high schools in the region, the status of vacant houses in the region, and the resident registration population of the region.
유동인구 데이터는 해당 지역의 특정 시점(또는 특정 시간 구간)에서의 유동인구를 의미할 수 있으며, 통신사 등으로부터 제공받을 수 있다.The floating population data may mean the floating population at a specific point in time (or a specific time period) in the region, and may be provided by a telecommunication company, etc.
실시예에 따라, 데이터 수집부(110)는 예측모델 생성 장치(100)에서 생략될 수 있다. 이 경우, 예측모델 생성 장치(100)는 미리 저장부(160)에 저장되어 있는 데이터를 이용하여 예측모델의 생성 및/또는 예측 동작을 수행할 수 있다.In some embodiments, the data collection unit 110 may be omitted from the predictive model generating apparatus 100 . In this case, the predictive model generating apparatus 100 may generate and/or predict a predictive model using data previously stored in the storage 160 .
데이터 가공부(120)는 데이터 수집부(110)에 의해 수집된 데이터 및/또는 미리 수신되어 저장부(160)에 저장되어 있는 데이터를 전처리할 수 있다. 구체적으로, 제1 데이터에 포함된 범죄신고 데이터에 구체적인 시간이 포함되어 있는 경우, 미리 정해진 시간 구간 별로 그룹화하여 해당 시간 구간과 해당 시간 구간의 신고 건수를 포함하는 범죄 신고 데이터로 변환할 수 있다. 제1 데이터에 포함된 범죄신고 데이터에 구체적인 장소(GPS 좌표, 주소 등)가 포함되어 있는 경우, 데이터 가공부(120)는 해당 범죄 신고 데이터를 관할경찰서, 미리 정해진 해당 구역(구, 동 등), 및/또는 관할관서(관할 지구대 또는 관할 파출소)를 추가하거나 변환할 수 있다. 제1 데이터에 구체적인 신고 내용이 포함되어 있으나 범죄의 유형이 포함되어 있지 않는 경우, 범죄 신고에 기초하여 범죄의 유형을 결정하고 범죄 유형이 포함된 범죄 신고 데이터로 변환하거나 추가할 수 있다. 이를 위해, 데이터 가공부(120)는 범죄 신고 데이터에 포함된 음성 데이터를 텍스트 데이터로 변환할 수 있고, 텍스트 데이터에 기재된 키워드를 추출하는 방식 등으로 범죄의 유형을 결정할 수 있다.The data processing unit 120 may pre-process the data collected by the data collection unit 110 and/or data previously received and stored in the storage unit 160 . Specifically, if a specific time is included in the crime report data included in the first data, it can be grouped by a predetermined time section and converted into crime report data including the time section and the number of reports in the corresponding time section. When the crime report data included in the first data includes a specific place (GPS coordinates, address, etc.), the data processing unit 120 transmits the crime report data to the competent police station, a predetermined corresponding area (gu, dong, etc.) , and/or the competent authority (jurisdictional district or police box) may be added or converted. If the first data includes specific report contents but does not include the type of crime, the type of crime may be determined based on the crime report and converted or added to crime report data including the crime type. To this end, the data processing unit 120 may convert voice data included in the crime report data into text data, and may determine the type of crime by extracting keywords described in the text data.
또한, 데이터 가공부(120)는 제1 데이터 및/또는 제2 데이터에 결측치가 있는 데이터를 삭제할 수도 있다.Also, the data processing unit 120 may delete data having missing values in the first data and/or the second data.
데이터 가공부(120)에 의해 가공된 데이터는 저장부(160)에 저장될 수 있다. 또한, 제1 데이터 및/또는 제2 데이터에 전처리 동작이 불필요한 경우 데이터 가공부(120)는 예측모델 생성 장치(100)에서 생략될 수 있다. 이 경우, 예측모델 생성 장치(100)는 데이터 수신부(110)에 의해 수신된 데이터 또는 저장부(160)에 미리 저장되어 있는 데이터를 이용하여 예측모델의 생성 및/또는 예측 동작을 수행할 수 있다.Data processed by the data processing unit 120 may be stored in the storage unit 160 . Also, when the preprocessing operation is unnecessary for the first data and/or the second data, the data processing unit 120 may be omitted from the predictive model generating apparatus 100 . In this case, the predictive model generating apparatus 100 may generate and/or predict a predictive model using data received by the data receiving unit 110 or data previously stored in the storage 160 . .
군집화부(130)는 시계열적인 범죄 신고 데이터를 이용하여 관할관서들을 범죄 신고 패턴이 유사한 관할관서로 그룹화할 수 있다.The clustering unit 130 may group the competent authorities into jurisdictions having a similar crime report pattern by using time-series crime report data.
시계열적인 범죄 신고 데이터는 제1 데이터를 의미할 수 있다. 이때, 제1 데이터는 미리 정해진 시간 단위(예컨대, 1일 또는 n 시간)로 관할관서별 범죄 신고 건수를 포함할 수 있다.Time-series crime report data may refer to first data. In this case, the first data may include the number of crime reports for each jurisdiction in a predetermined time unit (eg, 1 day or n hours).
또한, 군집화부(130)는 시계열 데이터의 패턴의 유사도(또는 거리)를 측정하고 측정된 유사도(또는 거리)에 따라 관할관서들을 그룹화할 수 있으며, 소정의 군집화 알고리즘이 이용될 수 있다. 예시적인 군집화 알고리즘은 DTW(Dynamic time warping)를 거리척도로 활용한 K-means 알고리즘이다.In addition, the clustering unit 130 may measure the similarity (or distance) of the patterns of the time series data and group the jurisdictions according to the measured similarity (or distance), and a predetermined clustering algorithm may be used. An exemplary clustering algorithm is a K-means algorithm using dynamic time warping (DTW) as a distance scale.
예측모델 생성부(140)는 데이터 수신부(110)에 의해 수신된 데이터, 데이터 가공부(120)에 의해 전처리된 데이터, 또는 미리 수신되어 저장부(160)에 저장되어 있는 데이터를 이용하여 범죄 신고 수 및/또는 범죄 발생 요인을 예측하는 예측모델을 생성할 수 있다. 예측모델은 제1 데이터 및/또는 제2 데이터를 이용하여 범죄 신고 수를 예측하는 제1 예측모델과 제2 데이터를 이용하여 범죄 발생 요인을 예측하는 제2 예측모델 중 적어도 하나를 포함할 수 있다.The predictive model generating unit 140 reports a crime using the data received by the data receiving unit 110 , the data preprocessed by the data processing unit 120 , or data previously received and stored in the storage unit 160 . It is possible to create predictive models that predict the number and/or crime occurrence factors. The predictive model may include at least one of a first predictive model for predicting the number of crime reports using the first data and/or second data and a second predictive model for predicting a crime occurrence factor using the second data. .
구체적으로, 예측모델 생성부(140)는 제1 데이터를 이용하여 시계열 모델, 예컨대, RNN(Recurrent Neural Network)과 같은 인공 신경망을 학습시킴으로써 제1 예측모델을 생성할 수 있다. 구체적으로, 예측모델 생성부(140)는 제1 데이터를 이용하여 예측 시점 이전의 범죄 신고 수를 입력받아 예측 시점으로부터 미리 정해진 시간 구간(예측 구간) 동안의 범죄 신고 수를 예측하도록 인공 신경망을 학습시킴으로써 제1 예측모델을 생성할 수 있다. 범죄 신고 수의 예측은 예측 동작을 수행하는 시점으로부터 k일(k는 정수) 후까지 수행될 수 있다. 예컨대, 제1 예측모델은 예측 동작을 수행하는 시점으로부터 7일 후까지의 범죄 신고 수를 일별로 예측할 수 있다. 아래 표 2는 예측 동작을 수행하는 시점으로부터 7일 후까지 일별로 범죄 신고 수를 예측하는 예를 나타낸다.Specifically, the predictive model generator 140 may generate the first predictive model by learning a time series model, for example, an artificial neural network such as a recurrent neural network (RNN) using the first data. Specifically, the prediction model generator 140 receives the number of crime reports before the prediction time using the first data, and learns the artificial neural network to predict the number of crime reports during a predetermined time interval (prediction interval) from the prediction time. By doing so, the first predictive model can be generated. Prediction of the number of crime reports may be performed up to k days (k is an integer) from the time the prediction operation is performed. For example, the first predictive model may predict the number of crime reports for 7 days from the time the prediction operation is performed by day. Table 2 below shows an example of predicting the number of crime reports by day from the time the prediction operation is performed until 7 days later.
예측 시점prediction time 예측 건수(범죄 신고 수)Number of forecasts (number of crime reports)
1일 후(내일)1 day later (tomorrow) 4949
2일 후2 days later 3434
3일 후3 days later 7979
4일 후4 days later 2323
5일 후5 days later 4444
6일 후after 6 days 6161
7일 후after 7 days 3939
실시예에 따라, 제1 예측 모델은 미리 정해진 시간 단위(예컨대, 6시간 단위) 별로 범죄 신고 수를 예측할 수도 있다. 다른 예로, 제1 예측 모델은 일단위 별로 범죄 신고 수를 예측하되, 적어도 일부의 예측 시점(예컨대, 1일 후)에 관하여는 미리 정해진 시간 단위 별로 범죄 신고 수를 예측할 수도 있다.실시예에 따라, 제1 예측 모델은 군집화부(130)에 의해 군집화된 각 군집들 각각에 대한 예측모델들을 포함할 수도 있다. 이 경우, 예측모델 생성부(140)는 각 군집들 각각에 대응하는 학습 데이터(제1 데이터 중 해당 군집에 관한 데이터)를 이용하여 군집들 각각에 대한 예측모델을 학습시킬 수 있다.According to an embodiment, the first prediction model may predict the number of crime reports for each predetermined time unit (eg, 6 hour units). As another example, the first prediction model predicts the number of crime reports for each unit, but may also predict the number of crime reports for each predetermined time unit with respect to at least a partial prediction time (eg, one day later). , the first prediction model may include prediction models for each of the clusters clustered by the clustering unit 130 . In this case, the predictive model generator 140 may train the predictive model for each of the clusters by using the learning data (data related to the corresponding cluster among the first data) corresponding to each of the clusters.
또한, 예측모델 생성부(140)는 제2 데이터를 이용하여 범죄 발생 요인을 결정하는 제2 예측모델을 생성할 수 있다. 예컨대, 예측모델 생성부(140)는 제2 데이터를 이용하여, 범죄 발생에 가장 큰 영향을 미친 적어도 하나의 중요 변수를 추출하는 의사결정나무 모델(또는 부스팅 의사결정나무 모델)을 학습시킴으로써 제2 예측모델을 생성할 수 있다. 부스팅 의사결정나무 모델은 여러 개의 의사결정나무를 결합하여 하나의 의사결정나무보다 더 좋은 결과를 출력하도록 하는 머신러닝 기법이다. 의사결정나무는 분류와 회귀가 모두 가능한 지도학습 모델 중 하나이다. 예시적인 부스팅 의사결정나무 모델은 CatBoost(Categorical Boost) 기법이다.Also, the predictive model generator 140 may generate a second predictive model for determining a crime occurrence factor by using the second data. For example, the predictive model generator 140 uses the second data to learn a decision tree model (or boosting decision tree model) that extracts at least one important variable that has the greatest impact on crime occurrence, thereby making the second A predictive model can be created. Boosting decision tree model is a machine learning technique that combines multiple decision trees to output better results than a single decision tree. The decision tree is one of the supervised learning models that can perform both classification and regression. An exemplary boosting decision tree model is the CatBoost (Categorical Boost) technique.
예측부(150)는 예측모델 생성부(140)에 의해 생성된 예측모델을 이용하여 예측동작을 수행할 수 있다. 구체적으로, 예측부(150)는 제1 예측모델 및 제2 예측모델을 이용하여 범죄 신고 수를 예측할 수 있고, 제2 예측모델을 이용하여 범죄 발생의 중요 변수를 추가적으로 예측할 수도 있다.The prediction unit 150 may perform a prediction operation using the prediction model generated by the prediction model generation unit 140 . Specifically, the prediction unit 150 may predict the number of crime reports by using the first predictive model and the second predictive model, and may additionally predict an important variable in the occurrence of a crime using the second predictive model.
제1 예측모델 및 제2 예측모델을 이용하여 범죄 신고 수를 예측하는 경우, 예측부(150)는 제1 데이터(예컨대, 최근 30일 간의 범죄 신고 데이터)를 이용하여 미리 정해진 구역(예컨대, 관할 경찰서 또는 관할관서) 별로 범죄 신고 수를 예측할 수 있다. 이때, 하나의 제1 예측모델을 이용하여 각 구역의 범죄 신고 수를 예측하거나, 구역별로 특화된 예측모델(즉, 해당 구역이 속한 군집의 데이터를 이용하여 생성된 예측모델)을 이용하여 해당 구역의 범죄 신고 수를 예측할 수 있다. 또한, 예측부(150)는 제1 데이터를 이용하여 미리 정해진 예측 기간 동안이 범죄 신고 수를 예측할 수 있다.When the number of crime reports is predicted using the first prediction model and the second prediction model, the prediction unit 150 uses the first data (eg, crime report data for the last 30 days) in a predetermined area (eg, jurisdiction It is possible to predict the number of crime reports by police station or competent authority). At this time, the number of crime reports in each zone is predicted using one first prediction model, or the number of crime reports in each zone is predicted using a prediction model specialized for each zone (that is, a prediction model generated using data of the cluster to which the zone belongs). The number of crime reports can be predicted. Also, the prediction unit 150 may predict the number of reported crimes during a predetermined prediction period by using the first data.
제2 예측모델을 이용하여 범죄 발생의 중요 변수를 예측하는 경우, 예측부(150)는 제1 데이터 및/또는 제2 데이터를 이용하여 예측 시점(예컨대, 3일 후)에서의 범죄 발생의 중요 변수를 추출할 수 있다. 제2 예측모델을 이용한 범죄 발생의 중요 변수 예측 결과는 도 2에 도시되어 있다.In the case of predicting an important variable in the occurrence of a crime using the second prediction model, the prediction unit 150 uses the first data and/or the second data to predict the importance of the occurrence of the crime at the time of prediction (eg, 3 days later). variable can be extracted. The prediction result of the important variable of the crime using the second prediction model is shown in FIG. 2 .
예측부(150)의 예측 결과를 통해 효율적인 인력 배치가 가능하다. 예컨대, 범죄 신고 수가 많을 것으로 예측되는 시점의 경찰 근무 인력을 탄력적으로 증원하거나, 범죄 신고 수가 많을 것으로 예측되는 구역의 경찰 근무 인력을 증원할 수 있다. 또한, 범죄 발생의 중요 변수에 따라, 효과적으로 사전 대비가 가능하다. 일 예로, 범죄 발생의 중요 변수가 '보육시설'인 경우, 보육시설의 순찰과 경계를 강화함으로써 범죄 발생을 억제하거나 조기 검거가 가능할 것이다.Efficient manpower allocation is possible through the prediction result of the prediction unit 150 . For example, it is possible to flexibly increase the number of police personnel at a time when the number of crime reports is expected to be high, or increase the number of police personnel in an area where the number of crime reports is expected to be high. In addition, it is possible to effectively prepare in advance according to an important variable in the occurrence of a crime. For example, if an important variable in the occurrence of crimes is 'childcare facilities', it will be possible to suppress the occurrence of crimes or to make early arrests by strengthening patrols and vigilance at childcare facilities.
저장부(160)에는 데이터 수집부(110)에 의해 수집된(또는 수신된) 데이터, 데이터 가공부(120)에 의해 전처리된 데이터, 군집화부(130)에 의한 군집화 결과, 예측모델 생성부(140)에 의해 생성된 예측모델, 예측부(150)에 의한 예측 결과 등이 저장될 수 있다.In the storage unit 160, the data collected (or received) by the data collection unit 110, the data preprocessed by the data processing unit 120, the clustering result by the clustering unit 130, the predictive model generation unit ( The prediction model generated by 140 , the prediction result by the prediction unit 150 , and the like may be stored.
도 3은 본 발명의 일 실시예에 따른 예측 장치의 기능 블럭도이다. 도 3에 도시된 예측 장치(300)를 설명함에 있어서, 앞서 기재된 내용과 중복되는 내용에 관하여는 그 기재를 생략하기로 한다.3 is a functional block diagram of a prediction apparatus according to an embodiment of the present invention. In the description of the prediction apparatus 300 illustrated in FIG. 3 , descriptions of contents overlapping with those described above will be omitted.
도 3을 참조하면, 예측 장치(300)는 데이터 수집부(310), 데이터 가공부(320), 예측부(330), 및 저장부(340) 중 적어도 하나를 포함할 수 있다. 즉, 예측 장치(300)의 일부 구성은 실시예에 따라 생략될 수도 있으며, 예측 장치(300)는 적어도 프로세서 및/또는 메모리를 포함하는 컴퓨팅 장치로 구현될 수 있다.Referring to FIG. 3 , the prediction apparatus 300 may include at least one of a data collection unit 310 , a data processing unit 320 , a prediction unit 330 , and a storage unit 340 . That is, some components of the prediction apparatus 300 may be omitted according to embodiments, and the prediction apparatus 300 may be implemented as a computing device including at least a processor and/or a memory.
예측 장치(300)는 데이터 수집부(310)에 의해 수집된 데이터 또는 소정의 입력 장치를 통해 수신되어 저장부(340)에 저장되어 있는 데이터를 이용하여 범죄 신고 수(또는 범죄 발생 수) 및/또는 범죄 발생 요인을 예측하는 예측모델을 이용하여 범죄 신고 수(또는 범죄 발생 수) 및/또는 범죄 발생 요인을 예측할 수 있다. 예측모델은 도 1에 도시된 예측모델 생성 장치(100)의 의해 생성되거나 도 1에 도시된 예측모델 생성 장치(100)에 의해 수행되는 예측모델 생성 방법을 통해 생성된 예측모델을 의미할 수 있다.The prediction device 300 uses the data collected by the data collection unit 310 or the data received through a predetermined input device and stored in the storage unit 340 to determine the number of crime reports (or the number of crimes) and / Alternatively, the number of reported crimes (or the number of crimes) and/or factors of occurrence of crimes may be predicted by using a predictive model that predicts the factors causing the crime. The predictive model may refer to a predictive model generated by the predictive model generating apparatus 100 shown in FIG. 1 or a predictive model generating method performed by the predictive model generating apparatus 100 shown in FIG. 1 . .
데이터 수집부(310)는 예측 동작을 수행하는 과정에서 필요한 데이터를 수집할 수 있다. 데이터는 미리 정해진 시간 구간 동안의 데이터로 제1 데이터 및/또는 제2 데이터 중 적어도 하나를 포함할 수 있다. 데이터 수집부(310)에 의해 수집된 데이터는 저장부(340)에 저장될 수 있다. 데이터 수집부(310)의 동작은 도 1에 도시된 데이터 수집부(110)의 동작과 동일할 수 있으므로 구체적인 설명은 생략하기로 한다.The data collection unit 310 may collect necessary data in the process of performing the prediction operation. The data is data for a predetermined time period and may include at least one of first data and/or second data. Data collected by the data collection unit 310 may be stored in the storage unit 340 . The operation of the data collection unit 310 may be the same as that of the data collection unit 110 illustrated in FIG. 1 , and thus a detailed description thereof will be omitted.
실시예에 따라, 데이터 수집부(310)는 예측 장치(300)에서 생략될 수 있다. 이 경우, 예측 장치(300)는 미리 저장부(340)에 저장되어 있는 데이터를 이용하여 예측 동작을 수행할 수 있다.In some embodiments, the data collection unit 310 may be omitted from the prediction apparatus 300 . In this case, the prediction apparatus 300 may perform a prediction operation using data previously stored in the storage unit 340 .
데이터 가공부(320)는 데이터 수집부(310)에 의해 수집된 데이터 및/또는 미리 수신되어 저장부(340)에 저장되어 있는 데이터를 전처리할 수 있다. 데이터 가공부(32)의 구체적인 동작은 도 1에 도시된 데이터 가공부(120)의 동작과 동일할 수 있으므로 구체적인 설명은 생략하기로 한다.The data processing unit 320 may pre-process the data collected by the data collection unit 310 and/or data previously received and stored in the storage unit 340 . A detailed operation of the data processing unit 32 may be the same as that of the data processing unit 120 illustrated in FIG. 1 , and thus a detailed description thereof will be omitted.
데이터 가공부(320)에 의해 가공된 데이터는 저장부(340)에 저장될 수 있다. 또한, 제1 데이터 및/또는 제2 데이터에 전처리 동작이 불필요한 경우 데이터 가공부(320)는 예측 장치(300)에서 생략될 수 있다. 이 경우, 예측 장치(300)는 데이터 수신부(310)에 의해 수신된 데이터 또는 저장부(340)에 미리 저장되어 있는 데이터를 이용하여 예측 동작을 수행할 수 있다.Data processed by the data processing unit 320 may be stored in the storage unit 340 . Also, when the preprocessing operation is unnecessary for the first data and/or the second data, the data processing unit 320 may be omitted from the prediction apparatus 300 . In this case, the prediction apparatus 300 may perform a prediction operation using data received by the data receiver 310 or data previously stored in the storage 340 .
예측부(330)는 도 1에 도시된 예측모델 생성부(140)에 의해 생성된 예측모델을 이용하여 예측 동작을 수행할 수 있다. 구체적으로, 예측부(330)는 제1 예측모델을 이용하여 범죄 신고 수를 예측할 수 있고, 제2 예측모델을 이용하여 범죄 발생의 중요 변수를 예측할 수도 있다. 예측부(330)의 구체적인 동작은 도 1의 예측부(330)의 동작과 동일할 수 있으므로 구체적인 설명은 생략하기로 한다.The prediction unit 330 may perform a prediction operation using the prediction model generated by the prediction model generation unit 140 shown in FIG. 1 . Specifically, the prediction unit 330 may predict the number of crime reports using the first prediction model, and may predict an important variable in the occurrence of a crime using the second prediction model. Since the detailed operation of the prediction unit 330 may be the same as that of the prediction unit 330 of FIG. 1 , a detailed description thereof will be omitted.
저장부(340)에는 데이터 수집부(310)에 의해 수집된(또는 수신된) 데이터, 데이터 가공부(320)에 의해 전처리된 데이터, 예측모델, 예측부(330)에 의한 예측 결과 등이 저장될 수 있다.The storage unit 340 stores (or received) data collected by the data collection unit 310 , data preprocessed by the data processing unit 320 , a prediction model, and a prediction result by the prediction unit 330 . can be
도 4는 도 1에 도시된 예측모델 생성 장치 또는 도 3에 도시된 예측 장치에 의해 수행되는 예측모델 생성 방법 또는 예측 방법을 설명하기 위한 흐름도이다.FIG. 4 is a flowchart illustrating a prediction model generation method or a prediction method performed by the prediction model generation apparatus illustrated in FIG. 1 or the prediction apparatus illustrated in FIG. 3 .
우선, 예측모델을 생성하기 위한 데이터 또는 예측 동작을 수행하기 위한 데이터가 수집된다(S100). 데이터는 제1 데이터 및/또는 제2 데이터를 포함할 수 있다. 실시예에 따라, 데이터는 소정의 저장 장치를 통하여 미리 수신되어 저장되어 있을 수 있으며, 이 경우 S100 단계는 생략될 수 있다.First, data for generating a predictive model or data for performing a predictive operation are collected (S100). The data may include first data and/or second data. According to an embodiment, the data may be previously received and stored through a predetermined storage device, and in this case, step S100 may be omitted.
수신된 데이터 또는 미리 수신되어 저장되어 있는 데이터는 예측모델을 생성하기 위한 형식 또는 예측 동작을 수행하기 위한 형식으로 가공(또는 전처리)된다(S200). 수신된 데이터 또는 미리 수신되어 저장되어 있는 데이터는 예측모델을 생성하기 위한 형식 또는 예측 동작을 수행하기 위한 형식일 수 있으며, 이 경우 S200 단계는 생략될 수 있다.Received data or previously received and stored data is processed (or pre-processed) into a format for generating a predictive model or a format for performing a predictive operation (S200). Received data or previously received and stored data may be in a format for generating a predictive model or a format for performing a predictive operation, and in this case, step S200 may be omitted.
이후, 복수의 관할관서들이 범죄 신고 수의 패턴에 따라 그룹화(또는 군집화)된다(S300). 이는 각 그룹 별로 상이한 예측모델을 생성하기 위한 것으로, 하나의 예측모델을 생성하는 경우, S300 단계는 생략될 수 있다. 또한, 예측모델 생성 방법이 아닌 예측 방법은 S300 단계를 포함하지 않을 수 있다.Thereafter, a plurality of competent authorities are grouped (or clustered) according to the pattern of the number of crime reports (S300). This is to generate different predictive models for each group, and when generating one predictive model, step S300 may be omitted. In addition, the prediction method other than the prediction model generation method may not include step S300.
다음으로, 적어도 하나의 예측모델이 생성될 수 있다(S400). 예측모델 생성 방법에 관한 상세한 설명은 생략하기로 한다.Next, at least one predictive model may be generated ( S400 ). A detailed description of the predictive model generation method will be omitted.
추가적으로, 예측 단계가 수행될 수 있다(S500). 예측 단계는 생성된 예측모델을 이용하여 범죄 신고 수(또는 범죄 발생 수) 및/또는 범지 발생의 중요 변수들이 예측될 수 있다.Additionally, a prediction step may be performed (S500). In the prediction step, the number of crime reports (or the number of crimes) and/or important variables of the occurrence of crimes may be predicted using the generated prediction model.
이상에서 설명된 장치는 하드웨어 구성 요소, 소프트웨어 구성 요소, 및/또는 하드웨어 구성 요소 및 소프트웨어 구성 요소의 집합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성 요소는, 예를 들어, 프로세서, 콘트롤러, ALU(Arithmetic Logic Unit), 디지털 신호 프로세서(Digital Signal Processor), 마이크로컴퓨터, FPA(Field Programmable array), PLU(Programmable Logic Unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(Operation System, OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술 분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(Processing Element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(Parallel Processor)와 같은, 다른 처리 구성(Processing Configuration)도 가능하다.The device described above may be implemented as a hardware component, a software component, and/or a set of hardware components and software components. For example, devices and components described in the embodiments may include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable array (FPA), It may be implemented using one or more general purpose or special purpose computers, such as a Programmable Logic Unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications executed on the operating system. A processing device may also access, store, manipulate, process, and generate data in response to execution of the software. For convenience of understanding, although one processing device is sometimes described as being used, one of ordinary skill in the art will recognize that the processing device includes a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that can include For example, the processing device may include a plurality of processors or one processor and one controller. Other Processing Configurations are also possible, such as a Parallel Processor.
소프트웨어는 컴퓨터 프로그램(Computer Program), 코드(Code), 명령(Instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(Collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성 요소(Component), 물리적 장치, 가상 장치(Virtual Equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(Signal Wave)에 영구적으로, 또는 일시적으로 구체화(Embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more thereof, and configure the processing device to operate as desired or process it independently or in combination (Collectively) You can command the device. The software and/or data may be any kind of machine, component, physical device, virtual equipment, computer storage medium or device, to be interpreted by or provide instructions or data to the processing device. , or may be permanently or temporarily embodied in a transmitted signal wave (Signal Wave). The software may be distributed over networked computer systems and stored or executed in a distributed manner. Software and data may be stored in one or more computer-readable recording media.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM, DVD와 같은 광기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-optical Media), 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, etc. alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the embodiment, or may be known and available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical recording media such as CD-ROMs and DVDs, and magnetic media such as floppy disks. - Includes hardware devices specially configured to store and execute program instructions, such as Magneto-optical Media, ROM, RAM, Flash memory, and the like. Examples of program instructions include not only machine language codes such as those generated by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성 요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성 요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.Although the present invention has been described with reference to the embodiment shown in the drawings, which is only exemplary, those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom. For example, the described techniques are performed in a different order than the described method, and/or the described components of the system, structure, apparatus, circuit, etc. are combined or combined in a different form than the described method, or other components Or substituted or substituted by equivalents may achieve an appropriate result. Accordingly, the true technical protection scope of the present invention should be determined by the technical spirit of the appended claims.

Claims (9)

  1. 크롤링 기법을 이용하여 데이터를 수집하는 데이터 수집부;a data collection unit that collects data using a crawling technique;
    상기 데이터를 전처리하는 데이터 가공부; 및a data processing unit for pre-processing the data; and
    전처리된 데이터를 이용하여 예측 시점에서의 범죄 신고 수를 예측하는 예측모델을 생성하는 예측모델 생성부를 포함하는 예측모델 생성 장치.A predictive model generating device including a predictive model generator for generating a predictive model for predicting the number of crime reports at a predictive time by using the pre-processed data.
  2. 제1항에 있어서,According to claim 1,
    상기 데이터는 미리 정해진 시간 구간 동안 발생한 범죄 신고 데이터를 포함하고,The data includes crime report data that occurred during a predetermined time period,
    상기 예측모델 생성부는 상기 범죄 신고 데이터를 이용하여 인공 신경망(Artificial Neural Network)을 학습시켜 상기 예측 모델을 생성하는,The predictive model generation unit generates the predictive model by learning an artificial neural network using the crime report data,
    예측모델 생성 장치.Predictive model generation device.
  3. 제2항에 있어서,3. The method of claim 2,
    범죄 신고 수의 패턴 유사도에 따라 관할관서들을 군집화하는 군집화부를 더 포함하고,Further comprising a clustering unit that clusters the competent authorities according to the pattern similarity of the number of crime reports,
    상기 예측모델 생성부는 군집들 각각에 대한 예측모델을 생성하는,The predictive model generator generates a predictive model for each of the clusters,
    예측모델 생성 장치.Predictive model generation device.
  4. 제3항에 있어서,4. The method of claim 3,
    상기 군집화부는 DTW(Dynamic Time Warping)를 거리척도로 활용한 K-means 알고리즘을 이용하여 군집화하는,The clustering unit clusters using a K-means algorithm using DTW (Dynamic Time Warping) as a distance scale,
    예측모델 생성 장치.Predictive model generation device.
  5. 적어도 프로세서를 포함하는 컴퓨팅 장치에 의해 수행되는 예측모델 생성 방법에 있어서,In the predictive model generation method performed by a computing device comprising at least a processor,
    크롤링 기법을 이용하여 데이터를 수집하는 단계;collecting data using a crawling technique;
    상기 데이터를 전처리하는 단계; 및pre-processing the data; and
    전처리된 데이터를 이용하여 예측 시점에서의 범죄 신고 수를 예측하는 예측모델을 생성하는 단계를 포함하는 예측모델 생성 방법.A predictive model generating method comprising the step of generating a predictive model for predicting the number of crime reports at the time of prediction by using the pre-processed data.
  6. 제5항에 있어서,6. The method of claim 5,
    상기 데이터는 미리 정해진 시간 구간 동안 발생한 범죄 신고 데이터를 포함하고,The data includes crime report data that occurred during a predetermined time period,
    상기 예측모델을 생성하는 단계는, 상기 범지 신고 데이터를 이용하여 RNN(Recurrent Neural Network)을 학습시켜 상기 예측모델을 생성하는,The generating of the predictive model comprises learning a Recurrent Neural Network (RNN) using the report data to generate the predictive model,
    예측모델 생성 방법.How to create a predictive model.
  7. 제6항에 있어서,7. The method of claim 6,
    상기 전처리하는 단계 이후에,After the pretreatment step,
    범죄 신고 수의 패턴 유사도에 따라 관할관서들을 군집화하는 단계를 더 포함하고,Further comprising the step of clustering the competent authorities according to the pattern similarity of the number of crime reports,
    상기 예측모델을 생성하는 단계는, 군집들 각각에 대한 예측모델을 생성하는,The generating of the predictive model comprises generating a predictive model for each of the clusters,
    예측모델 생성 방법.How to create a predictive model.
  8. 제2 데이터를 수집하는 제2 데이터 수집부;a second data collection unit for collecting second data;
    상기 제2 데이터를 전처리하는 제2 데이터 가공부; 및a second data processing unit pre-processing the second data; and
    제5항 내지 제7항 중 어느 하나의 항에 기재된 예측모델 생성 방법에 의해 생성되고 전처리된 제2 데이터를 입력으로 하는 예측모델을 이용하여 예측 시점에서의 범죄 신고 수를 예측하는 예측부를 포함하는 예측 장치.Claims 5 to 7, comprising a prediction unit that predicts the number of crime reports at the time of prediction using a prediction model that is generated by the prediction model generation method according to any one of claims 5 to 7 and uses the second data pre-processed as input prediction device.
  9. 제8항에 있어서,9. The method of claim 8,
    상기 제2 데이터는 미리 정해진 시간 구간 동안 발생한 범죄 신고 데이터를 포함하는,The second data includes crime report data that occurred during a predetermined time period,
    예측 장치.prediction device.
PCT/KR2020/017257 2020-08-14 2020-11-30 Device and method for predicting number of crime reports on basis of security and public data WO2022034984A1 (en)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2020-0102512 2020-08-14
KR20200102512 2020-08-14
KR1020200163665A KR102430920B1 (en) 2020-08-14 2020-11-30 Device and method for predicting the number of crimes using security data and public data
KR10-2020-0163665 2020-11-30

Publications (1)

Publication Number Publication Date
WO2022034984A1 true WO2022034984A1 (en) 2022-02-17

Family

ID=80247023

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2020/017257 WO2022034984A1 (en) 2020-08-14 2020-11-30 Device and method for predicting number of crime reports on basis of security and public data

Country Status (1)

Country Link
WO (1) WO2022034984A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150112713A (en) * 2014-06-05 2015-10-07 주식회사 성우음향정보통신 The predicting system for anti-crime through analyzing server of images
KR101830522B1 (en) * 2016-08-22 2018-02-21 가톨릭대학교 산학협력단 Method for predicting crime occurrence of prediction target region using big data
KR20190077682A (en) * 2017-12-26 2019-07-04 부경대학교 산학협력단 System and Method for Analysing Urban Safety Index using Public Big Data and SNS Data
KR20190138350A (en) * 2018-06-05 2019-12-13 주식회사 웬즈데이에잇피엠 Personal crime probability prediction system using biometric information and behavior patterns collected from wearable devices
JP2020086581A (en) * 2018-11-16 2020-06-04 本田技研工業株式会社 Prediction device, prediction method, and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150112713A (en) * 2014-06-05 2015-10-07 주식회사 성우음향정보통신 The predicting system for anti-crime through analyzing server of images
KR101830522B1 (en) * 2016-08-22 2018-02-21 가톨릭대학교 산학협력단 Method for predicting crime occurrence of prediction target region using big data
KR20190077682A (en) * 2017-12-26 2019-07-04 부경대학교 산학협력단 System and Method for Analysing Urban Safety Index using Public Big Data and SNS Data
KR20190138350A (en) * 2018-06-05 2019-12-13 주식회사 웬즈데이에잇피엠 Personal crime probability prediction system using biometric information and behavior patterns collected from wearable devices
JP2020086581A (en) * 2018-11-16 2020-06-04 本田技研工業株式会社 Prediction device, prediction method, and program

Similar Documents

Publication Publication Date Title
CN106095928B (en) A kind of event type recognition methods and device
CN110009185A (en) AI dispatch control plateform system
CN111311869A (en) Fire safety monitoring method and system based on area alarm model and cloud platform
CN110334904B (en) LightGBM-based key information infrastructure type unit attribution determination method
Chow et al. Recognizing animal-caused faults in power distribution systems using artificial neural networks
WO2020122487A1 (en) Company bankruptcy prediction system and operating method therefor
CN109408574B (en) Complaint responsibility confirmation system based on text mining technology
CN111538741A (en) Deep learning analysis method and system for big data of alarm condition
WO2022034984A1 (en) Device and method for predicting number of crime reports on basis of security and public data
KR102430920B1 (en) Device and method for predicting the number of crimes using security data and public data
WO2022092497A1 (en) System for providing similar case information, and method therefor
WO2022102839A1 (en) Sound-based emergency bell control system and method therefor
WO2022163996A1 (en) Device for predicting drug-target interaction by using self-attention-based deep neural network model, and method therefor
Patel et al. Intellectual and enhance digital solution for police station
CN114186118A (en) Network public opinion topic information processing system, method, storage medium and terminal
CN111931995A (en) Public opinion real-time monitoring and early warning method for major sudden public health event
Nagayama et al. A study on intelligent security camera system based on sequential motion recognition by using deep learning
CN113837160B (en) Method for identifying normally-living people and vehicles without preset information
KR102593846B1 (en) System and method for linking Traffic information of transport information center
WO2019017550A1 (en) Integrated control system and method for personal information security products
WO2022211301A1 (en) Method and system for detection of abnormal behavior based on autoencoder ensemble
WO2023167497A1 (en) Market description event extraction method and system
CN111352171B (en) Method and system for realizing artificial intelligence regional shielding security inspection
WO2022124504A1 (en) Reporting system according to social crime characteristics and method therefor
Wang et al. Comprehensive Community Epidemic Prevention and Control Models to Repel COVID-19 Pandemic-Grid-based management and digital response Experience from Four Provinces of China

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 20949613

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 20949613

Country of ref document: EP

Kind code of ref document: A1