KR102228873B1 - Construction system of criminal suspect knowledge network using public security information and Method thereof - Google Patents
Construction system of criminal suspect knowledge network using public security information and Method thereof Download PDFInfo
- Publication number
- KR102228873B1 KR102228873B1 KR1020190175833A KR20190175833A KR102228873B1 KR 102228873 B1 KR102228873 B1 KR 102228873B1 KR 1020190175833 A KR1020190175833 A KR 1020190175833A KR 20190175833 A KR20190175833 A KR 20190175833A KR 102228873 B1 KR102228873 B1 KR 102228873B1
- Authority
- KR
- South Korea
- Prior art keywords
- criminal
- information
- suspect
- knowledge network
- person
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000010276 construction Methods 0.000 title claims description 8
- 238000013145 classification model Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 23
- 238000004422 calculation algorithm Methods 0.000 claims description 20
- 238000004458 analytical method Methods 0.000 claims description 13
- 238000005516 engineering process Methods 0.000 claims description 13
- 238000003058 natural language processing Methods 0.000 claims description 10
- 238000007635 classification algorithm Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 2
- 230000000153 supplemental effect Effects 0.000 claims description 2
- 230000004044 response Effects 0.000 claims 1
- 239000013589 supplement Substances 0.000 claims 1
- 238000007405 data analysis Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000011835 investigation Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Educational Administration (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
본 발명은 치안정보를 활용한 범죄인물 지식망 구축 시스템 및 그 방법에 관한 것으로서, 더욱 상세하게는 치안정보 데이터뱅크와 범죄인명추출모듈로부터 추출된 범죄인물 및 그 연관인물들로 인명 노드를 생성하고, 과거 범죄기록 정보 및 유사사건과의 연관성 정보를 통해 범죄인물 지식망을 구축하여 사용자에게 지원하는 치안정보를 활용한 범죄인물 지식망 구축 시스템 및 그 방법에 관한 것이다.The present invention relates to a system and method for constructing a criminal person knowledge network using security information, and more particularly, to create a life node with criminal figures extracted from the security information data bank and the criminal name extraction module and related figures, It relates to a criminal person knowledge network establishment system and its method using the police information that supports users by establishing a criminal person knowledge network through past criminal record information and information related to similar events.
범죄인물 지식망 구축 시스템에 관한 종래의 기술로서 특허문헌 1에 범죄용의자의 회전이미지 촬영장치를 이용하여 형성된 이미지 데이터에 지문정보와 음성정보 등을 포함하여 경찰청 데이터베이스에 저장한 후 각 공공기관의 전송망을 통해 용의자를 수배할 수 있는 시스템을 제시하고 있다.As a conventional technology related to the system for establishing a knowledge network for criminals, the image data formed using the rotating image photographing device of the criminal suspect in Patent Document 1, including fingerprint information and voice information, is stored in the National Police Agency database, and then the transmission network of each public institution It presents a system that can arrange for suspects through.
상기 기술은 범죄용의자에 대한 회전이미지 등 상세정보를 제공한다는 장점은 존재하나, 범죄는 단독적으로 행해지기도 하지만 조직적으로 행해지기도 하므로 입체적인 범죄예방 및 해결을 위해 용의자, 공범자, 피해자 및 목격자 등 주변인물과 그 서로 간의 역할관계 정보도 필요한데 이런 범죄인물 지식망은 제공되지 않는다는 점에서 미흡하다.The above technology has the advantage of providing detailed information such as rotating images of criminal suspects.However, since crimes are performed independently but are also conducted systematically, it is possible to prevent and solve a three-dimensional crime with surrounding people such as suspects, accomplices, victims, and witnesses. Information on the relationship between the roles of each other is also necessary, but it is insufficient in that such a knowledge network of criminals is not provided.
최근 경찰청이 관리하는 치안정보 빅데이터를 활용하여 사건 해결 또는 예측에 활용하고 치안정보 통합 관리의 주요 요소 중 하나인 인명사전을 자동 구축하고 이를 토대로 인명을 식별하는 시스템을 개발하였다. 이를 통해 각기 다른 시스템에 치안정보가 존재하여 연관정보로 활용하기 어려웠던 문제를 해결하고, 용의자 정보를 다각적으로 취합하여 사용자에게 정보를 지원하고 있다.Recently, using big data of public security information managed by the National Police Agency to solve or predict incidents, we automatically built a life dictionary, one of the main elements of integrated security information management, and developed a system to identify people based on this. Through this, the problem that it was difficult to use as related information due to the existence of security information in different systems is solved, and information is supported to users by collecting suspect information in various ways.
상기의 문제를 해결하고자 본 발명은 통합 치안정보 데이터 뱅크를 기반으로 다양한 빅데이터 분석기법과 검색기법을 활용하여 범죄인물 및 그 연관인물들로 인명 노드를 생성하고, 과거 범죄기록 정보 및 유사사건과의 연관성 정보를 통해 사건 내용을 재분석하여 재구성하고 범죄인물 지식망을 구축하여 사용자에게 용의자와 관련된 입체적인 정보를 제공하고자 한다.In order to solve the above problem, the present invention uses various big data analysis methods and search techniques based on an integrated security information data bank to create a human node with criminals and their related persons, and compares them with past criminal record information and similar cases. It is intended to provide three-dimensional information related to the suspect to users by reanalyzing and reconstructing the contents of the case through relevance information, and building a knowledge network for criminals.
상기의 과제를 해결하고자 하는 본 발명에 따른 치안정보를 활용한 범죄인물 지식망 구축 시스템은, 비정형 문서와 정형 데이터에서 범죄용의자를 식별하여 추출하는 범죄인명 후보추출모듈, 추출된 범죄용의자에 대한 학습을 통해 범죄인물로 추론하는 범죄인물추론모듈, 치안정보 데이터뱅크와 인명사전으로부터 추출된 범죄인물과 그 연관 인물을 태깅하고 노드 후보 목록을 작성하는 문서 내 범죄인명분류모듈, 치안정보 데이터뱅크와 범죄인명추출모듈로부터 추출된 범죄인물과 그 연관인물들로 인명 노드를 생성하고, 과거 범죄기록 정보 및 유사사건과의 연관성 정보를 통해 사건 내용을 재분석하고 재구성하여 범죄인물 지식망을 구축하는 지식망구축모듈 및 범죄인물 지식망 정보를 사용자에게 지원하는 정보지원모듈을 포함하는 것을 특징으로 한다.The criminal person knowledge network construction system using the security information according to the present invention to solve the above problems is a criminal name candidate extraction module that identifies and extracts a criminal suspect from unstructured documents and structured data, and learning about the extracted criminal suspects. A criminal character inference module that infers as a criminal through the security information data bank and the criminal name classification module in the document that tagging criminals and related persons extracted from the security information data bank and the personal name dictionary and creating a node candidate list, the security information data bank and the criminal name extraction A knowledge network building module that creates a human node with criminal characters extracted from the module and related characters, re-analyzes and reconstructs the contents of the case through the information on the association between the past criminal record information and similar incidents, and builds a knowledge network for criminal characters. It characterized in that it comprises an information support module for supporting the criminal person knowledge network information to the user.
상기 범죄인명 후보추출모듈의 비정형 문서에는 수사자료, 112신고 데이터 및 조서 등이 포함되고, 상기 비정형 문서와 정형 데이터를 자연어처리 기술을 통해 분석하고 기 구축된 인명사전을 참고하여 범죄인명 후보를 추출하여 목록을 작성하는 것을 특징으로 한다.The unstructured document of the criminal name candidate extraction module includes investigative data, 112 report data, and records, and the unstructured document and the structured data are analyzed through natural language processing technology, and the criminal name candidate is extracted by referring to the previously established personal name dictionary. It is characterized in that to create a list.
상기 범죄인물추론모듈은 추출된 범죄용의자의 위치정보와 상기 범죄용의자와 그 주변 관련자들의 어휘 목록 학습을 통하여 상기 범죄용의자를 범죄인물로 추론하는 것을 특징으로 한다.The criminal character inference module is characterized in that the criminal suspect is inferred as a criminal character through learning of the extracted location information of the criminal suspect and a vocabulary list of the criminal suspect and related persons around the criminal suspect.
상기 범죄인명분류모듈은 상기 범죄인명 후보추출모듈로부터 추출된 범죄인물 후보에 대해 상하위 범죄인명 노드 생성을 위해 상기 범죄인물 후보를 용의자, 신고자, 공범자, 목격자 등으로 태깅하여 분류하는 것을 특징으로 한다.The criminal name classification module is characterized in that the criminal name candidates extracted from the criminal name candidate extraction module are tagged and classified as suspects, reporters, accomplices, witnesses, etc. to generate upper and lower criminal name nodes.
상기 범죄인물 지식망구축모듈은 치안정보 데이터뱅크 내의 용의자 과거 범죄기록 정보를 분석하고 연관정보들을 취합하여 육하원칙에 입각한 스키마에 맞춰 데이터를 재구성하고 범죄인명 노드에 저장하여 범죄인물 지식망을 구축하고 확장하는 것을 특징으로 한다.The criminal person knowledge network building module analyzes the suspect's past criminal record information in the security information data bank, collects the related information, reconstructs the data according to the schema based on the rule of thumb, and stores it in the criminal person name node to build and expand the criminal person knowledge network. Characterized in that.
상기 정보지원모듈은 사용자에게 용의자 인명 선택과 동명이인 선택 중 택일하는 선택지를 제공하고 선택된 대상에 대한 범죄인물 정보지원 서비스를 제공하는 것을 특징으로 한다.The information support module is characterized in that it provides a user with a choice between selection of a suspect person's name and selection of a person of the same name, and providing a criminal person information support service for the selected target.
한편, 본 발명에 따른 치안정보를 활용한 범죄인물 지식망 구축 방법은, 비정형 문서와 정형 데이터에서 범죄인명 후보를 추출하는 추출단계, 상기 범죄인물 후보를 태깅하여 분류하는 분류단계, 치안정보 데이터뱅크 내의 용의자 정보를 분석하고 범죄인명 노드에 저장하는 범죄인물 지식망 구축단계 및 사용자가 선택한 대상에 대한 범죄인물 정보지원 서비스단계를 포함하는 것을 특징으로 한다.On the other hand, the method for constructing a criminal person knowledge network using security information according to the present invention includes an extraction step of extracting a criminal name candidate from unstructured documents and structured data, a classification step of tagging and classifying the criminal person candidate, and the security information data bank. It characterized by including a criminal person knowledge network construction step of analyzing the suspect information and storing it in the criminal person name node, and a criminal person information support service step for a target selected by the user.
상기 범죄인명 후보 추출단계는 비정형 문서와 정형 데이터를 자연어처리 기술을 이용하여 분석하는 단계와 인명사전, 근접어 사전으로부터 범죄인명 후보를 추출하는 단계와 추출된 후보의 주변 어휘 목록을 추출하는 단계와 해당 인명 후보가 진짜 본인인지 확인하는 단계를 거쳐 진짜 본인으로 확인되면 인명후보DB에 저장하고 아니면 추출을 보류하는 단계를 포함하는 것을 특징으로 한다.In the step of extracting candidate names of criminals, analyzing unstructured documents and structured data using natural language processing technology, extracting candidates for criminal names from dictionary and proximity dictionary, and extracting a list of vocabulary around the extracted candidates, and the corresponding steps. It characterized in that it includes the step of checking whether the candidate for human being is the real person, and storing it in the candidate DB if it is confirmed as the real person, or withholding the extraction.
상기 범죄인물 후보 분류단계는 문서 내 지위 분류 모델 생성 알고리즘과 인명 후보 분류 알고리즘을 포함하되,The criminal candidate classification step includes an algorithm for generating a status classification model in a document and a candidate classification algorithm,
상기 문서 내 지위 분류 모델 생성 알고리즘은, 문서 내 지위별 인명 표출 위치정보 및 주변단어 추출단계와 문서 내 지위 분류 모델 학습단계와 분류 모델 성능을 검정하여 정답률이 기준치 이하이면 문서 내 지위 분류 모델 학습단계로 되돌려 보내어 다시 학습시키는 루프 반복을 통해 정답률이 기준치 이상이 될 때 비로소 문서 내 지위 분류 모델DB에 저장하는 단계를 포함하고,The position classification model generation algorithm in the document includes the step of extracting location information and surrounding words for each position in the document, the step of learning the position classification model in the document, and the performance of the classification model, and if the correct answer rate is less than the reference value, the step of learning the position classification model in the document. It includes the step of storing in the position classification model DB in the document only when the correct answer rate becomes more than the reference value through loop iteration of returning to and retraining, and
상기 인명 후보 분류 알고리즘은, 신규 입력 문서에 대한 자연어처리 분석단계와 문서 내 지위 분류 모델을 통한 용의자 후보 추출 및 용의자 외 인명에 대한 문서 내 지위 분류단계와 인명 후보에 대한 문서 내 지위 자동 태깅 단계와 모든 인명 후보 태깅 완료 여부를 판단하여 태깅되지 않은 인명 후보가 있으면 용의자 외 인명에 대한 문서 내 지위 분류단계로 되돌아가는 루프 반복을 통해 태깅되지 않은 인명 후보가 없을 때 비로소 인명 정보 목록DB에 저장하는 단계를 포함하는 것을 특징으로 한다.The human candidate classification algorithm includes a natural language processing analysis step for new input documents, extraction of suspect candidates through a status classification model in the document, classification of status in documents for people other than suspects, and automatic tagging of status in documents for human candidates. It is the step of determining whether or not all candidate tagging has been completed, and if there are non-tagged candidates, the loop returns to the status classification stage in the document for non-suspects, and only when there are no non-tagged candidates, it is then stored in the personal information list DB. It characterized in that it comprises a.
상기 범죄인물 지식망 구축단계는 인명 노드 생성 알고리즘과 범죄인물 지식망 구축 알고리즘을 포함하되,The criminal person knowledge network construction step includes an algorithm for generating a human name node and an algorithm for building a criminal person knowledge network,
상기 인명 노드 생성 알고리즘은 인명 정보 목록을 통해 각 인명 정보들을 노드화하는 단계와 문서 내 지위 분류 태그를 통해 인명 노드 간의 관계를 명시하는 단계를 포함하고,The human name node generation algorithm includes the step of nodeizing each human name information through a human name information list and specifying a relationship between the human name nodes through a status classification tag in the document,
상기 범죄인물 지식망 구축 알고리즘은, 사용자 입력 문서로부터 용의자의 기초정보를 작성하는 단계와 치안정보 데이터뱅크 내에서 용의자의 과거 범죄기록 정보를 검색하여 분석하는 단계와 범죄인물 지식망을 구축하는 단계와 용의자와 별개의 유사사건을 검색하여 분석하는 단계와 범죄인물 지식망을 확장하여 범죄인물 지식망DB에 저장하는 단계를 포함하는 것을 특징으로 한다.The criminal person knowledge network building algorithm includes the steps of creating basic information of the suspect from the user input document, searching and analyzing the information of the suspect's past criminal records in the security information data bank, and establishing the criminal person knowledge network. It characterized by including the step of searching for and analyzing a similar event separate from and storing the criminal person knowledge network by expanding the criminal person knowledge network DB.
상기 범죄인물 지식망 구축 알고리즘에 있어서, 상기 용의자 기초정보 작성단계는, 사용자 입력 문서로부터 용의자의 기초정보를 추출하는 단계와 용의자 기초정보 스키마로부터 용의자의 기초정보를 작성하여 용의자 기초정보DB에 저장하되, 상기 기초정보 작성란에 미작성 칼럼(column)이 존재하는 경우, 지금까지 작성한 용의자의 기초정보로 치안정보 데이터뱅크를 검색하여 미작성 칼럼에 대한 보완 데이터를 추출하여 보완하고 용의자 기초정보DB에 저장하는 단계를 포함하는 것을 특징으로 한다.In the criminal person knowledge network building algorithm, in the step of creating the suspect basic information, extracting the basic information of the suspect from the user input document and creating the basic information of the suspect from the basic information schema of the suspect and storing it in the suspect basic information DB. , If an unwritten column exists in the basic information creation column, the security information data bank is searched with the basic information of the suspect prepared so far, and supplementary data for the unwritten column is extracted and supplemented, and stored in the suspect basic information DB. It characterized in that it comprises a step.
상기 범죄인물 지식망 구축 알고리즘에 있어서, 상기 용의자 과거범죄기록 검색 및 분석 단계는, 용의자 기초정보 및 치안정보 데이터뱅크를 통한 과거범죄기록 검색에서 과거범죄기록이 검색되지 않으면 초범이라는 정보를 추가하여 과거범죄기록 정보 목록DB에 저장하고, 과거범죄기록이 검색되면 인명 후보추출 단계, 인명 후보 분류(태깅) 단계, 용의자 과거사건 노드 생성, 인명 노드 생성 및 각 인명 노드에 대한 기초정보 작성 단계를 거처 과거범죄기록 정보 목록DB에 저장하는 것을 특징으로 한다.In the criminal person knowledge network building algorithm, in the step of searching and analyzing the suspect's past crime record, if the past crime record is not searched through the suspect's basic information and security information data bank, information that is the first crime is added to the previous crime. It is stored in the record information list DB, and when past crime records are retrieved, past crimes through the steps of extracting human candidates, classifying human candidates (tagging), creating a suspect's past event node, creating a human node, and creating basic information for each human node. It is characterized in that it is stored in the record information list DB.
상기 용의자의 기초정보 및 치안정보 데이터뱅크를 통한 과거범죄기록 검색 단계에서 과거범죄기록이 검색되면, 추가된 정보를 이용하여 노드 수정 및 범죄인물 지식망 추가구축 단계를 거치는 것을 특징으로 한다.When the past crime record is searched in the past crime record search step through the basic information and security information data bank of the suspect, it is characterized in that it goes through a step of modifying a node and additional building a criminal person knowledge network using the added information.
상기 범죄인물 지식망 구축 알고리즘에 있어서, 상기 용의자와 별개의 유사사건 검색 및 분석 단계는 사용자 입력 문서DB에서 주요 키워드를 추출하는 단계와 치안정보 데이터뱅크에서 유사사건을 검색하는 단계의 결과 유사사건 기록이 존재하지 않으면 프로세스를 종료하고, 존재하면 인명 후보추출 단계, 인명 후보 분류(태깅) 단계, 유사사건 노드 생성 단계, 인명 노드 생성 단계 및 각 인명 노드에 대한 기초정보 작성 단계를 거쳐 유사사건 정보 목록DB에 저장하는 것을 특징으로 한다.In the criminal person knowledge network building algorithm, the similar event search and analysis step separate from the suspect is a result of the step of extracting the main keyword from the user input document DB and the step of searching for the similar event from the security information data bank. If it does not exist, the process is terminated, and if it does exist, it goes through the step of extracting human candidates, classifying (tagging) human candidates, creating a similar event node, creating a human node, and creating basic information for each human node, and then a similar event information list DB It characterized in that it is stored in.
상기 용의자와 별개의 유사사건 검색 및 분석 단계의 결과 유사사건 기록이 존재하면 추가된 정보를 이용하여 노드 수정 및 범죄인물 지식망을 확장하는 단계를 거치는 것을 특징으로 한다.If a similar event record exists as a result of the similar event search and analysis step separate from the suspect, it is characterized in that it goes through a step of modifying a node and expanding a criminal person knowledge network by using the added information.
본 발명은 통합 치안정보 데이터 뱅크를 기반으로 다양한 빅데이터 분석기법과 검색기법을 활용하여 범죄인물 및 그 연관인물들로 인명 노드를 생성하고, 과거 범죄기록 정보 및 유사사건과의 연관성 정보를 통해 사건 내용을 재구성하여 범죄인물 지식망을 구축함으로써 사용자에게 용의자와 관련된 입체적인 정보를 제공하는 현저한 효과가 있다.The present invention uses various big data analysis methods and search techniques based on an integrated security information data bank to create a life-saving node with criminal characters and their related persons, and the case details through information on the relationship between past criminal records and similar incidents. It has a remarkable effect of providing three-dimensional information related to the suspect to the user by constructing a knowledge network for criminals.
도 1은 본 발명의 실시예에 따른 범죄인물 지식망 구축 시스템을 도시한 블록도이다.
도 2는 본 발명의 실시예에 따른 범죄인물 지식망 구축 방법을 도시한 흐름도이다.
도 3은 인명 후보 추출 방법을 도시한 흐름도이다.
도 4는 인명에 대한 문서 내 지위 분류 모델 생성 방법을 도시한 흐름도이다.
도 5는 인명 후보 분류 방법을 도시한 흐름도이다.
도 6은 인명 노드의 한 예시도이다.
도 7은 범죄인물 지식망 구축 방법을 도시한 흐름도이다.
도 8은 용의자 기초정보 작성 방법을 도시한 흐름도이다.
도 9는 용의자 과거범죄기록 검색 및 분석 방법을 도시한 흐름도이다.
도 10은 범죄인물 지식망 구축의 한 예시도이다.
도 11은 용의자와 별개의 유사사건 검색 및 분석 방법을 도시한 흐름도이다.
도 12는 범죄인물 지식망 확장의 한 예시도이다.1 is a block diagram showing a system for building a knowledge network for criminals according to an embodiment of the present invention.
2 is a flow chart showing a method of building a criminal person knowledge network according to an embodiment of the present invention.
3 is a flow chart illustrating a method for extracting a human candidate.
4 is a flowchart illustrating a method of generating a status classification model in a document for a person's life.
5 is a flowchart illustrating a method of classifying human candidates.
6 is an exemplary diagram of a human node.
7 is a flow chart illustrating a method of building a knowledge network for criminals.
8 is a flowchart showing a method of creating basic information about a suspect.
9 is a flowchart illustrating a method for searching and analyzing a suspect's past crime record.
10 is an exemplary diagram of building a knowledge network for criminals.
11 is a flowchart illustrating a method of searching and analyzing a similar event separate from a suspect.
12 is an exemplary diagram of an extension of a criminal person knowledge network.
이하, 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 실시예를 상세하게 설명하지만, 본 발명이 실시예에 의해 제한되거나 한정되는 것은 아니다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings and contents described in the accompanying drawings, but the present invention is not limited or limited by the embodiments.
본 발명은 통합 치안정보 데이터 뱅크를 기반으로 다양한 빅데이터 분석기법과 검색기법을 활용하여 범죄인물 지식망을 구축하고 사용자에게 용의자와 관련된 입체적인 정보를 제공하는 점에서 종래기술에 비해 훨씬 진보된 기술을 제시한다.The present invention proposes a much more advanced technology compared to the prior art in that it establishes a criminal person knowledge network by using various big data analysis methods and search techniques based on an integrated security information data bank and provides three-dimensional information related to the suspect to the user. do.
도 1은 본 발명의 실시예에 따른 범죄인물 지식망 구축 시스템을 도시한 블록도로서, 비정형 문서와 정형 데이터에서 범죄용의자를 식별하여 추출하는 범죄인명 후보추출모듈(10), 추출된 범죄용의자에 대한 학습을 통해 범죄인물로 추론하는 범죄인물추론모듈(20), 치안정보 데이터뱅크(100)와 인명사전으로부터 추출된 범죄인물과 그 연관 인물을 태깅하고 노드 후보 목록을 작성하는 문서 내 범죄인명분류모듈(30), 치안정보 데이터뱅크와 범죄인명추출모듈로부터 추출된 범죄인물과 그 연관인물들로 인명 노드를 생성하고, 과거 범죄기록 정보 및 유사사건과의 연관성 정보를 통해 사건 내용을 재분석하고 재구성하여 범죄인물 지식망을 구축하는 지식망구축모듈(40) 및 범죄인물 지식망 정보를 사용자에게 지원하는 정보지원모듈(50)을 포함한다.1 is a block diagram showing a system for constructing a criminal person knowledge network according to an embodiment of the present invention, in which a criminal name
상기 범죄인명 후보추출모듈(10)의 비정형 문서에는 수사자료, 112신고 데이터 및 조서 등이 포함된다.The unstructured document of the criminal name
본 발명의 추출 대상에는 비정형 문서를 포함하여 반정형 및 정형 문서도 포함될 수 있다.The extraction target of the present invention may include semi-structured and structured documents, including unstructured documents.
데이터는 정형화 정도에 따라 정형, 반정형, 비정형 데이터로 나뉘는데, 정형데이터는 일정한 형식을 갖춘 고정된 필드에 저장된 데이터로서 예를 들면 DB나 엑셀 등에 저장된 데이터를 의미하고, 반정형 데이터는 고정된 필드에 저장되지는 않지만 XML이나 HTML과 같이 메타데이터(metadata)나 스키마(schema) 등을 포함한 데이터로 볼 수 있고, 비정형 데이터는 페이스북이나 트위터 등 SNS에 게시한 글, 블로그에 게시한 글, 사진, 동영상, 댓글, DM(direct message)으로 나눈 대화, 카톡메시지, 스마트폰 GPS 위치정보 등 고정된 필드에 형식을 갖춰서 집어넣을 수 없는 종류의 데이터들을 의미한다.Data is divided into structured, semi-structured, and unstructured data according to the degree of standardization. Structured data is data stored in a fixed field with a certain format, for example, data stored in DB or Excel, and semi-structured data is a fixed field. Although it is not stored in, it can be viewed as data including metadata or schema, such as XML or HTML, and unstructured data is posts posted on social media such as Facebook or Twitter, posts posted on blogs, and photos. , Video, comment, DM (direct message) conversation, katok message, smartphone GPS location information, etc. It refers to types of data that cannot be inserted in a fixed field.
상기 비정형 문서와 정형 데이터를 자연어처리 기술을 통해 분석하고 기 구축된 인명사전을 참고하여 범죄인명 후보를 추출하여 목록을 작성한다.The unstructured document and the structured data are analyzed through natural language processing technology, and a list is prepared by extracting candidates for criminal names by referring to a previously established human name dictionary.
자연어처리 기술은 인공지능 기술에 기계학습(딥러닝)이 더해진 자동화 기술 분야 중 하나로서 인간언어 분석과 표현을 자동화하기 위한 계산 기법이다.Natural language processing technology is one of the fields of automation technology in which machine learning (deep learning) is added to artificial intelligence technology, and is a computational technique for automating human language analysis and expression.
추출한 인명 후보들의 주변 어휘 목록을 추출하여 해당 인명 후보가 진짜 본인인지 확인하여 본인으로 확인된 후보들을 저장한다.By extracting the list of vocabulary around the extracted human name candidates, confirming whether the corresponding human name candidate is the real person, and storing the identified candidates.
상기의 확인 과정에서 주격조사 결합 여부, 행위자 피행위자 표지 여부 등이 판단 항목에 포함될 수 있다. In the above confirmation process, whether or not the subject investigation is combined, whether the actor is marked as the subject, etc. may be included in the judgment items.
주격조사란 '△△가(이), △△는(은) 또는 △△들이(들은)' 등과 같이 행위의 주체를 가리키는 조사를 뜻하며, 상기 행위가 범죄일 경우 범죄의 주범이 될 가능성이 높아져서 인명 노드(node)의 중심 노드인 root 노드에 놓이게 될 가능성이 커진다.Nominal investigation refers to an investigation that refers to the subject of an action, such as'△△(i), △△(silver) or △△(heard)', and if the above act is a crime, the likelihood of becoming the main culprit of the crime increases. It is more likely to be placed on the root node, which is the central node of the human node.
행위자 피행위자 표지는 형태소 분석을 통해 어떤 인물이 어떤 행위의 행위자인지 피행위자인지 구분하는 요소로서, 예를 들면 '하다'는 행위자와 결합되고 '하게 되다'는 피행위자와 결합되는 표현으로 분류될 수 있다.The actor label is an element that distinguishes whether a person is an actor or an actor through morphological analysis.For example, it can be classified as an expression that is combined with the actor to'do' and the actor to'become'. I can.
범죄인물추론모듈(20)은 특정 용의자의 빈출 위치 정보 및 연령, 성별, 콤플렉스, 언어습관 등의 학습을 통해 범죄용의자를 범죄인물로 추론하는 모듈(module)로서, 확률 높은 추론모듈의 생성을 위해서는 프로파일러(profiler:범죄심리분석요원)의 자문이 필요할 수 있다.The criminal
상기 문서 내 범죄인명분류모듈(30)은 치안정보 데이터뱅크(100)와 인명사전으로부터 추출된 범죄인물과 그 연관 인물을 태깅하고 노드 후보 목록을 작성하는 작업을 수행한다.The criminal
치안정보 데이터뱅크는 경찰청이 관리하는 치안정보 빅데이터로서, 사건 해결 또는 예측에 활용되고 치안정보 통합 관리의 주요 요소 중 하나인 인명사전을 자동 구축하고, 이를 토대로 인명을 식별하는 시스템을 개발하여 각기 다른 시스템에 존재하는 치안정보를 연관정보로 활용할 수 있도록 용의자 정보를 다각적으로 취합하여 사용자에게 정보 제공하는 공공 서비스 중 하나다.The security information data bank is big data of security information managed by the National Police Agency.It is used for solving or predicting incidents and automatically constructs a life dictionary, which is one of the main elements of integrated security information management, and develops a system to identify people based on this. It is one of the public services that provides information to users by collecting suspect information in various ways so that the security information existing in the system can be used as related information.
상기 치안정보 데이터뱅크의 데이터에서 자연어분석을 통해 문서 내에서 용의자 인명이 나타나는 위치와 용의자와 함께 나타나는 주변 단어들을 추출하여 분류 모델에 학습시킨다.From the data of the security information data bank, through natural language analysis, the location where the name of the suspect appears in the document and the surrounding words appearing with the suspect are extracted and trained in a classification model.
구체적으로, 인공지능 기술을 활용하여 신규 입력 문서에 나타난 인명들을 용의자와 주변 인명들로 분류하고, 주변 인명들은 그 용의자와 어떤 관계를 가지고 있는지 자동으로 분석하며,Specifically, using artificial intelligence technology, the names of people appearing in the new input document are classified into suspects and people around them, and the relationship between people around them is automatically analyzed.
입력되는 문서들은 경찰조서나 사건문서 등으로서 비정형 문서이지만 어느 정도 구조화 되어 있을 확률이 높은 문서들로서 용의자, 공범자, 피해자, 목격자 등의 정보는 일정한 패턴을 보일 것으로 예상되므로 그 패턴이나 특징들을 인공지능 기술로 학습시켜 추출된 상기 인명들이 그 문서 내에서 가지는 지위나 역할을 자동으로 분류하고 태깅할 수 있다.The input documents are unstructured documents such as police records or case documents, but these are documents with a high probability of being structured to some extent, and the information on suspects, accomplices, victims, and witnesses is expected to show a certain pattern. It is possible to automatically classify and tag the positions or roles of the human names extracted by learning with the document.
예를 들면,'2019년 11월 1일 15시 30분 경, 용의자 홍길동이 서울시 금천구 소재 원룸에서 김철수가 집을 비운 틈을 타 원룸에 침입하여 100만원 상당의 금품을 훔친 사건 발생. 평소 조용하던 김철수의 집이 소란스러운 것을 이상하게 여긴 이웃 주민 이영희의 신고로 현장에서 현행범으로 체포.'라는 사건 문서로부터 자동 태깅 결과는 '홍길동/용의자, 김철수/피해자, 이영희/신고자'가 된다.For example,'on November 1, 2019, around 15:30, suspect Hong Gil-dong broke into the studio while Kim Chul-soo was away from his home in Geumcheon-gu, Seoul, and stole money worth 1 million won. The result of the automatic tagging from the incident document, ``Hong Gil-dong / Suspect, Kim Chul-soo / Victim, Lee Young-hee / Reporter'' from the incident document, was arrested as a current offender at the scene at the report of Lee Young-hee, a neighbor who felt strange that Kim Chul-soo's house was noisy.
또한, 분류 모델의 정답률을 검증하는 시스템이 범죄인명분류모듈(30)에 포함되어 있어서, 분류 모델의 정답률이 기준치 이상인지 수시로 검정되고 기준치 미달이면 기준치 이상이 될 때까지 재학습시키는 과정을 반복한다. 기준 정답률은 전문가의 자문을 통해 설정할 수도 있다.In addition, since the system for verifying the correct answer rate of the classification model is included in the criminal
또한, 범죄인물과 그 연관 인물에 대한 태깅 과정에서도 전문가 자문을 거친 기준 확률치가 적용된다. 즉, 용의자로서의 확률이 높은 순서로 분류하여 확률치가 기준치 이상인 인물에 대해 해당 지위를 태깅하고, 기준치 이하인 인물은 기타 분류로 태깅한다. 모든 지위 태그에 대하여 사용자가 확인 및 수정할 수 있도록 하는 것이 바람직하다.In addition, in the tagging process for criminals and related persons, the standard probability value obtained through expert advice is applied. That is, they are classified in the order of the highest probability of being a suspect, and the status is tagged for persons whose probability value is higher than or equal to the standard value, and persons below the standard value are tagged as other classifications. It is desirable to allow the user to check and modify all status tags.
상기 지식망구축모듈(40)은 치안정보 데이터뱅크와 범죄인명추출모듈로부터 추출된 범죄인물과 그 연관인물들로 인명 노드를 생성하고, 과거 범죄기록 정보 및 유사사건과의 연관성 정보를 통해 사건 내용을 재분석하고 재구성하여 범죄인물 지식망을 구축한다.The knowledge
인명 노드 생성은, 경찰청이 관리하는 치안정보 빅데이터인 치안정보 데이터뱅크와 비정형 및 정형 데이터에서 자연어처리 기술로 추출하여 구축한 범죄인명 후보에 대하여, 인명 정보 목록을 통해 각 인명 정보들을 노드화하고 문서 내 지위 분류 태그를 통하여 인명 노드 간의 관계를 명시하는 것이다.In the creation of a human name node, each human name information is noded and documented through the list of human name information for the security information data bank, which is the security information big data managed by the National Police Agency, and the criminal name candidates extracted by natural language processing technology from unstructured and structured data. It is to specify the relationship between the human nodes through the My Status Classification tag.
그 과정은 먼저 용의자 정보를 활용하여 root 노드를 생성하고, 용의자 이외의 인명 정보는 root 노드와의 관계에 따라 root 노드의 하위 노드로 생성하여 저장하고 문서 내 지위 태그를 활용하여 노드간의 관계를 표기하는 것이다. root 노드는 범죄인물 지식망에서 중심이 되는 노드로서 가장 먼저 생성되는 노드이며 용의자 후보이다.The process is to first create a root node using the suspect information, and then create and store the information of people other than the suspect as a lower node of the root node according to the relationship with the root node, and mark the relationship between nodes using the status tag in the document. It is to do. The root node is the central node in the criminal knowledge network, the first node to be created and a suspect candidate.
참고로 노드(node)는 점과 선으로 이루어진 트리(tree) 구조의 그래프에서 점에 해당한다. 최상위 노드를 루트(root node)라고 하고 최하위 노드를 잎이라고 하는데, 데이터 통신망에서는 데이터를 전송하는 통로에 접속되는 하나 이상의 기능 단위로서 주로 통신망의 분기점이나 단말기의 접속점을 이른다. 본 발명에서 노드는 용의자, 공범자, 피해자 또는 신고자 등 인명 정보와 매핑되며, 선은 이들 서로 간의 관계를 나타낸다.For reference, a node corresponds to a point in a tree-structured graph made up of points and lines. The highest node is called a root node and the lowest node is called a leaf. In a data communication network, it is one or more functional units connected to a path that transmits data, and it is a branch point of a communication network or a connection point of a terminal. In the present invention, a node is mapped with personal information such as a suspect, an accomplice, a victim or a reporter, and a line represents a relationship between them.
범죄인물 지식망 구축은, 치안정보 데이터뱅크 내에서 용의자의 과거 범죄기록 정보를 탐색하고 해당 정보를 분석하여 연관정보를 취합하고 육하원칙에 입각한 스키마에 맞춰 데이터를 재구성하고 범죄인명 노드에 저장하는 것이다.Establishing a criminal person knowledge network is to search for information on a suspect's past criminal records within the security information data bank, analyze the information, collect relevant information, reconstruct the data according to the schema based on the rule of law, and store the data in the criminal name node.
범죄인물 지식망 구축은, 사용자가 입력한 문서에서 기초정보를 추출하여 용의자에 대한 기초정보를 구성하고 부족한 사항들은 데이터뱅크에서 보완 데이터를 가져와서 기초정보를 작성하고; 용의자 기초정보로서, 데이터뱅크 검색 결과 해당 용의자의 과거범죄기록이 존재하면 그 기록을 분석하여 해당 사건에 대한 원본 문서를 과거사건 노드로 생성하고; 과거사건의 인명 노드들을 과거사건 노드의 하위 노드로 생성하고, 과거사건 분석 시 육하원칙에 기반한 스키마, 예를 들어 인물, 시간, 장소, 사건, 동기, 수법 등에 맞춰 사건 내용을 요약하고 그 정보를 사용자에게 제공하여 과거사건의 요점을 쉽게 파악할 수 있게 지원하고; 추가 정보를 이용하여 노드를 수정하고 범죄인물 지식망을 구축하고; 용의자와 별개로 키워드 추출 및 TF-IDF 등의 유사도 분석 기법을 통해 사용자가 입력한 문서에 나타난 사건과 유사한 사건 기록을 검색하고 그 기록을 분석하여 해당 유사사건의 원본 문서를 유사사건 노드로 생성하고 유사사건에 대한 인명 노드들을 유사사건 노드의 하위 노드로 생성하고; 유사사건 분석 시 육하원칙에 기반한 스키마, 예를 들어 인물, 시간, 장소, 사건, 동기, 수법 등에 맞춰 사건 내용을 요약하고 그 정보를 사용자에게 제공하여 유사사건의 요점을 쉽게 파악할 수 있게 지원하고; 추가 정보를 이용하여 노드를 수정하고 범죄인물 지식망을 확장하는 것 등을 말한다.In the construction of the criminal person knowledge network, basic information on the suspect is constructed by extracting basic information from the document input by the user, and for insufficient matters, the basic information is created by obtaining supplemental data from the data bank; As basic information of the suspect, if there is a record of the suspect's past crime as a result of searching the data bank, the record is analyzed and the original document for the case is created as a past event node; Creates the human nodes of the past event as sub-nodes of the past event node, and summarizes the contents of the event according to the schema based on the six-and-a-half principle when analyzing the past event, for example, person, time, place, event, motive, method, etc., and the information is user To provide support to make it easier to grasp the gist of past events; Modify the node using the additional information and build a criminal knowledge network; Separately from the suspect, through keyword extraction and similarity analysis techniques such as TF-IDF, search the event record similar to the event shown in the document entered by the user, analyze the record, and create the original document of the similar event as a similar event node. Create human nodes for the similar event as sub-nodes of the similar event node; When analyzing similar events, it summarizes the contents of the case according to the schema based on the six-and-a-half principle, for example, person, time, place, event, motive, technique, etc., and provides the information to users so that they can easily grasp the point of the similar event; It refers to modifying nodes using additional information and expanding the criminal knowledge network.
유사도 분석 기법 중 TF-IDF(Term Frequency-Inverse Document Frequency)는 단어의 빈출도와 단어의 특수성을 통해 문장 간 유사도를 계산하는 알고리즘이다.Among similarity analysis techniques, TF-IDF (Term Frequency-Inverse Document Frequency) is an algorithm that calculates the similarity between sentences through word frequency and word specificity.
상기 정보지원모듈(50)은 사용자에게 용의자 인명 선택과 동명이인 선택 중 택일하는 선택지를 제공하고 사용자가 선택한 대상에 대한 범죄인물 정보지원 서비스를 제공하는 것이다.The
정보지원모듈은, 시스템이 분석한 내용 전체 또는 사용자가 중간 선택지를 통해 범위를 좁힌 범죄인물 지식망을 시각화하여 제공하고; 과거사건이나 유사사건을 클릭할 때 육하원칙으로 요약한 내용을 표시하거나 원문보기를 클릭할 때 원문을 표시하는 등, 각 노드를 클릭할 때 그와 연결된 상세정보를 표시하고; root 용의자와 유사도가 높은 항목들을 색상 또는 선 굵기를 달리하여 표현하여 사용자가 용의자와 관련된 내용을 추적하기 쉽도록 지원하고; 용의자 정보를 중심 노드로 두고 공범자, 목격자, 피해자 등 사건과 관련된 인물들을 선으로 연결하여 확장해 나가는 범죄인물 지식망을 구축하고; 사용자가 범죄인물 지식망을 수정할 수 있도록 관리 도구를 제공하는 것 등을 말한다.The information support module visualizes and provides a knowledge network of criminals narrowed through the entire system analyzed or the user's intermediate option; When clicking on a past event or a similar event, a summary of the content is displayed in the six-and-a-half basis, or the original text is displayed when clicking View original text, and detailed information associated with each node is displayed when clicking on each node; Supports the user to easily track the contents related to the suspect by expressing items with high similarity to the root suspect in different colors or line thicknesses; Building a criminal knowledge network that expands by connecting people related to the case, such as accomplices, witnesses, and victims, with the suspect information as the central node; It refers to providing management tools so that users can modify the knowledge network of criminals.
도 2는 본 발명의 실시예에 따른 범죄인물 지식망 구축 방법을 도시한 흐름도로서, 비정형 문서와 정형 데이터에서 범죄인명 후보를 추출하는 추출단계, 상기 범죄인명 후보를 태깅하여 분류하는 단계, 치안정보 데이터뱅크 내의 용의자 정보를 분석하고 범죄인명 노드에 저장하는 범죄인물 지식망 구축단계 및 사용자가 선택한 대상에 대한 범죄인물 정보지원 서비스단계를 포함한다.2 is a flowchart showing a method of building a criminal person knowledge network according to an embodiment of the present invention, an extraction step of extracting a criminal name candidate from unstructured documents and structured data, tagging and classifying the criminal name candidate, and security information It includes the step of constructing a criminal person knowledge network that analyzes the suspect information in the data bank and stores it in the criminal person name node, and the criminal person information support service step for the target selected by the user.
도 3은 인명 후보 추출 방법을 도시한 흐름도로서, 비정형 문서와 정형 데이터를 자연어처리 기술을 이용하여 분석하는 단계와 인명사전, 근접어 사전으로부터 범죄인명 후보를 추출하는 단계와 추출된 후보의 주변 어휘 목록을 추출하는 단계와 해당 인명 후보가 진짜 본인인지 확인하는 단계를 거쳐 진짜 본인으로 확인되면 인명후보DB에 저장하고, 아니면 해당 인명 후부의 추출을 보류하고 다른 인명 후보에 대한 동일한 확인과정을 수행하는 루프(loop) 반복 단계를 포함한다.3 is a flow chart showing a method for extracting a candidate name, analyzing unstructured documents and structured data using natural language processing technology, extracting a candidate for a criminal name from a dictionary and a proximity dictionary, and a list of surrounding vocabulary of the extracted candidate A loop that performs the same verification process for other candidates after extracting and checking whether the candidate is the real person, and if it is verified as the real person, it is stored in the candidate DB. (loop) It includes a repeating step.
상기 루프 반복은 해당 인명 후보가 소진될 때까지 수행되거나 목표 인명 후보의 수를 미리 정하고 그 목표가 달성될 때까지 수행되도록 할 수 있다.The loop repetition may be performed until the corresponding life-saving candidates are exhausted, or the number of target life-saving candidates may be predetermined and performed until the target is achieved.
도 4는 인명에 대한 문서 내 지위 분류 모델 생성 알고리즘을 도시한 흐름도로서, 문서 내 지위별 인명 표출 위치정보 및 주변단어 추출단계와 문서 내 지위 분류 모델 학습단계와 분류 모델 성능을 검정하여 정답률이 기준치 이하이면 문서 내 지위 분류 모델 학습단계로 되돌려 보내어 다시 학습시키는 루프 반복을 통해 정답률이 기준치 이상이 될 때 비로소 문서 내 지위 분류 모델DB에 저장하는 단계를 포함한다.4 is a flow chart showing an algorithm for generating a position classification model in a document for a person's life, and the correct answer rate is a reference value by testing the position information of the person's name by position in the document and the extraction of surrounding words, the learning step of the position classification model in the document and the performance of the classification model In the following, it includes the step of storing in the position classification model DB in the document only when the correct answer rate exceeds the reference value through loop repetition of returning to the position classification model learning step in the document and retraining.
상기 루프 반복에서 루프 반복 회수를 미리 설정하고 그 회수 이내에서 상기 정답률이 기준치 이상이 되지 않으면 루프 반복을 중단하고 상기 정답률을 조정하거나 학습 모델을 재점검하도록 할 수 있다.In the loop repetition, the number of loop repetitions may be set in advance, and if the correct answer rate does not exceed the reference value within the number of times, the loop repetition may be stopped and the correct answer rate may be adjusted or the learning model may be rechecked.
도 5는 인명 후보 분류 방법을 도시한 흐름도로서, 신규 입력 문서에 대한 자연어처리 분석단계와 문서 내 지위 분류 모델을 통한 용의자 후보 추출 및 용의자 외 인명에 대한 문서 내 지위 분류단계와 인명 후보에 대한 문서 내 지위 자동 태깅 단계와 모든 인명 후보 태깅 완료 여부에 따라, 태깅되지 않은 인명 후보가 있으면 용의자 외 인명에 대한 문서 내 지위 분류단계로 되돌아가는 루프 반복을 통해 태깅되지 않은 인명 후보가 없을 때 비로소 인명 정보 목록DB에 저장하는 단계를 포함한다.5 is a flow chart showing a method for classifying human candidates, a natural language processing analysis step for a new input document, extraction of suspect candidates through a position classification model in the document, classification step in a document for persons other than the suspect, and a document for a human candidate Depending on the auto-tagging step of my status and whether all candidates are tagged, if there is an untagged candidate, a loop that returns to the status classification stage of the document for non-suspects will be repeated until there are no untagged candidates. It includes the step of storing in the list DB.
도 6은 인명 노드의 한 예시도로서, 인명 정보 목록을 통해 각 인명 정보들을 노드화하는 단계와 문서 내 지위 분류 태그를 통해 인명 노드 간의 관계를 명시하는 단계를 포함한다. 노드 간의 관계는 그래프의 일종인 트리(tree) 구조로 나타난다.FIG. 6 is an exemplary diagram of a human name node, which includes the steps of nodeizing each human name information through a human name information list and specifying a relationship between the human name nodes through a status classification tag in a document. The relationship between nodes appears in a tree structure, a kind of graph.
도 7은 범죄인물 지식망 구축 방법을 도시한 흐름도로서, 사용자 입력 문서로부터 용의자의 기초정보를 작성하는 단계와 치안정보 데이터뱅크 내에서 용의자의 과거 범죄기록 정보를 검색하여 분석하는 단계와 범죄인물 지식망을 구축하는 단계와 용의자와 별개의 유사사건을 검색하여 분석하는 단계와 범죄인물 지식망을 확장하여 범죄인물 지식망DB에 저장하는 단계를 포함한다.7 is a flowchart showing a method of building a criminal knowledge network, the steps of creating basic information of a suspect from a user input document, searching and analyzing the information of a suspect's past criminal records in the security information data bank, and the criminal person knowledge network It includes the steps of constructing and analyzing similar events separate from the suspect, expanding the criminal knowledge network and storing it in the criminal knowledge network DB.
본 발명의 다른 실시예로서 범죄인물 지식망 구축 방법은, 용의자 기초정보 작성단계는 도 8의 흐름도에서 보는 바와 같이, 사용자 입력 문서로부터 용의자의 기초정보를 추출하는 단계와 용의자 기초정보 스키마로부터 용의자의 기초정보를 작성하여 용의자 기초정보DB에 저장하되, 상기 기초정보 작성란에 미작성 칼럼(column)이 존재하는 경우, 지금까지 작성한 용의자의 기초정보로 치안정보 데이터뱅크를 검색하여 미작성 칼럼에 대한 보완 데이터를 추출하여 보완하고 용의자 기초정보DB에 저장하는 단계를 포함한다.As another embodiment of the present invention, a method for constructing a criminal knowledge network includes the step of creating the suspect's basic information, extracting the suspect's basic information from the user input document and the suspect's basic information schema, as shown in the flowchart of FIG. Prepare basic information and store it in the suspect's basic information DB, but if there is an unwritten column in the above basic information creation column, search the security information data bank with the basic information of the suspect created so far and supplementary data for the unwritten column. It includes the step of extracting, supplementing, and storing in the suspect basic information DB.
용의자 과거범죄기록 검색 및 분석 단계는, 도 9에서 보는 바와 같이, 용의자 기초정보 및 치안정보 데이터뱅크를 통한 과거범죄기록 검색에서 과거범죄기록이 검색되지 않으면 초범이라는 정보를 추가하여 과거범죄기록 정보 목록DB에 저장하고, 과거범죄기록이 검색되면 인명 후보추출 단계, 인명 후보 분류(태깅) 단계, 용의자 과거사건 노드 생성, 인명 노드 생성 및 각 인명 노드에 대한 기초정보 작성 단계를 거처 과거범죄기록 정보 목록DB에 저장하는 단계를 포함한다.In the step of searching and analyzing the suspect's past crime record, as shown in FIG. 9, if the past crime record is not searched in the search for the suspect's basic information and the security information data bank, the information of the first crime is added to the previous crime record information list DB. And the past crime records are retrieved, the past crime record information list goes through the steps of extracting human candidates, classifying human candidates (tagging), creating a suspect's past event node, creating a human node, and creating basic information for each human node. And storing it in.
용의자의 기초정보 및 치안정보 데이터뱅크를 통한 과거범죄기록 검색 단계에서 과거범죄기록이 검색되면, 도 10에서 보는 바와 같이, 추가된 정보를 이용하여 노드를 수정하고 범죄인물 지식망을 추가하여 구축한다.When the past crime record is searched in the past crime record search step through the basic information and security information data bank of the suspect, as shown in FIG. 10, the node is modified using the added information and a criminal person knowledge network is added to build it.
용의자와 별개의 유사사건 검색 및 분석 단계는, 도 11에서 보는 바와 같이, 사용자 입력 문서DB에서 주요 키워드를 추출하는 단계와 치안정보 데이터뱅크에서 유사사건을 검색하는 단계의 결과 유사사건 기록이 존재하지 않으면 프로세스를 종료하고, 존재하면 인명 후보추출 단계, 인명 후보 분류(태깅) 단계, 유사사건 노드 생성 단계, 인명 노드 생성 단계 및 각 인명 노드에 대한 기초정보 작성 단계를 거쳐 유사사건 정보 목록DB에 저장한다.In the similar event search and analysis step separate from the suspect, as shown in FIG. 11, if there is no similar event record as a result of the step of extracting the main keyword from the user input document DB and the step of searching for a similar event in the security information data bank. The process is terminated, and if it exists, it is stored in the similar event information list DB after the step of extracting human candidates, classifying (tagging) human candidates, creating a similar event node, creating a human node, and creating basic information for each human node. .
유사사건 검색 단계에서, 유사사건 검색 시 TF-IDF 등의 유사도 분석 알고리즘을 활용하여 사용자가 입력한 문서에 기술된 사건과 유사한 사건을 치안정보 데이터뱅크에서 검색한다.In the similar event search step, the case similar to the case described in the document entered by the user is searched in the security information data bank using similarity analysis algorithms such as TF-IDF when searching for similar events.
용의자와 별개의 유사사건 검색 및 분석 단계의 결과 유사사건 기록이 존재하면, 도 12에서 보는 바와 같이, 추가된 정보를 이용하여 노드 수정 및 범죄인물 지식망을 확장한다.As a result of the similar event search and analysis step separate from the suspect, if there is a similar event record, as shown in FIG. 12, the node is modified and the criminal person knowledge network is expanded using the added information.
10; 후보추출모듈 20; 범죄인물추론모듈
30; 범죄인명분류모듈 40; 지식망구축모듈
50; 정보지원모듈
100; 치안정보 데이터뱅크10;
30; Criminal
50; Information support module
100; Security Information Data Bank
Claims (10)
범죄인명분류모듈에서 범죄인명 후보와 치안정보 데이터뱅크로부터 추출된 범죄인명을 통합 태깅하여 분류하는 분류단계;
범죄인물 지식망구축모듈에서 태깅되어 분류된 범죄인명에 대한 인명 노드를 생성하고, 범죄 후보 인물들에 대한 치안정보 데이터뱅크 내의 과거 범죄기록 정보와 유사사건과의 연관성 정보를 통해 사건 내용을 재분석하고 재구성하여 범죄인물 지식망을 구축하는 범죄인물 지식망 구축단계 및
구축된 범죄인물 지식망을 사용자가 선택한 대상에 대응하여 정보지원하는 서비스단계를 포함하되,
상기 범죄인명 후보 분류단계는 문서 내 지위 분류 모델 생성 알고리즘과 인명 후보 분류 알고리즘을 포함하고,
상기 문서 내 지위 분류 모델 생성 알고리즘은, 문서 내 지위별 인명 표출 위치정보 및 주변단어 추출단계와 문서 내 지위 분류 모델 학습단계와 분류 모델 성능을 검정하여 정답률이 기준치 이하이면 문서 내 지위 분류 모델 학습단계로 되돌려 보내어 다시 학습시키는 루프 반복을 통해 정답률이 기준치 이상이 될 때 비로소 문서 내 지위 분류 모델DB에 저장하는 단계를 포함하고,
상기 인명 후보 분류 알고리즘은, 신규 입력 문서에 대한 자연어처리 분석단계와 문서 내 지위 분류 모델을 통한 용의자 후보 추출 및 용의자 외 인명에 대한 문서 내 지위 분류단계와 인명 후보에 대한 문서 내 지위 자동 태깅 단계와 모든 인명 후보 태깅 완료 여부를 판단하여 태깅되지 않은 인명 후보가 있으면 용의자 외 인명에 대한 문서 내 지위 분류단계로 되돌아가는 루프 반복을 통해 태깅되지 않은 인명 후보가 없을 때 비로소 인명 정보 목록DB에 저장하는 단계를 포함하는 것을 특징으로 하는 치안정보를 활용한 범죄인물 지식망 구축 방법.An extraction step of extracting a criminal name candidate from the unstructured document and the structured data in the criminal suspect candidate extraction module;
A classification step in which the criminal name candidate and the criminal name extracted from the security information data bank are integrated and tagged and classified in the criminal name classification module;
Re-analyze and reconstruct the contents of the case through the information on the relationship between the past criminal record information in the security information data bank and the similar case in the police information data bank for the criminal person names tagged and classified in the criminal person knowledge network building module To build a criminal person knowledge network
Including the service stage of supporting information in response to the target selected by the user, with the established knowledge network of criminals,
The criminal name candidate classification step includes an algorithm for generating a status classification model in a document and a candidate classification algorithm,
The position classification model generation algorithm in the document includes the step of extracting location information and surrounding words for each position in the document, the step of learning the position classification model in the document, and the performance of the classification model, and if the correct answer rate is less than the reference value, the step of learning the position classification model in the document. It includes the step of storing in the position classification model DB in the document only when the correct answer rate becomes more than the reference value through loop iteration of returning to and retraining, and
The human candidate classification algorithm includes a natural language processing analysis step for new input documents, extraction of suspect candidates through a status classification model in the document, classification of status in documents for people other than suspects, and automatic tagging of status in documents for human candidates. It is the step of determining whether or not all candidate tagging has been completed, and if there are non-tagged candidates, the loop returns to the status classification stage in the document for non-suspects, and only when there are no non-tagged candidates, it is then stored in the personal information list DB. A method of building a knowledge network for criminals using security information, characterized in that it comprises a.
상기 범죄인명 후보 추출단계는,
비정형 문서와 정형 데이터를 자연어처리 기술을 이용하여 분석하는 단계와 인명사전 및 근접어 사전으로부터 범죄인명 후보를 추출하는 단계; 추출된 범죄인명 후보의 주변 어휘 목록을 추출하는 단계;
해당 인명 후보가 진짜 본인인지 확인하는 단계 및
본인으로 확인되면 인명후보DB에 저장하고, 본인이 아니면 추출을 보류하는 단계를 포함하는 것을 특징으로 하는 치안정보를 활용한 범죄인물 지식망 구축 방법.The method of claim 5,
The criminal name candidate extraction step,
Analyzing the unstructured document and the structured data using natural language processing technology, and extracting candidate names of criminals from the human name dictionary and the adjacent word dictionary; Extracting a list of surrounding vocabulary of the extracted criminal name candidates;
Steps to verify that the candidate is the real person, and
A method of building a knowledge network for criminals using security information, comprising the step of storing in the human candidate DB when it is identified as the person and withholding the extraction if it is not the person.
상기 범죄인물 지식망 구축단계는 인명 노드 생성 알고리즘과 범죄인물 지식망 구축 알고리즘을 포함하되,
상기 인명 노드 생성 알고리즘은, 인명 정보 목록을 통해 각 인명 정보들을 노드화하는 단계와 문서 내 지위 분류 태그를 통해 인명 노드 간의 관계를 명시하는 단계를 포함하고,
상기 범죄인물 지식망 구축 알고리즘은, 사용자 입력 문서로부터 용의자의 기초정보를 작성하는 단계와 치안정보 데이터뱅크 내에서 용의자의 과거 범죄기록 정보를 검색하여 분석하는 단계와 범죄인물 지식망을 구축하는 단계와 용의자와 별개의 유사사건을 검색하여 분석하는 단계와 범죄인물 지식망을 확장하여 범죄인물 지식망DB에 저장하는 단계를 포함하는 것을 특징으로 하는 치안정보를 활용한 범죄인물 지식망 구축 방법.The method of claim 5,
The criminal person knowledge network construction step includes an algorithm for generating a human name node and an algorithm for building a criminal person knowledge network,
The life-saving node generation algorithm includes the steps of nodeizing each person-name information through a person-name information list and specifying a relationship between the person-name nodes through a status classification tag in the document,
The criminal person knowledge network building algorithm includes the steps of creating basic information of the suspect from the user input document, searching and analyzing the information of the suspect's past criminal records in the security information data bank, and establishing the criminal person knowledge network. A method for constructing a criminal knowledge network using security information, comprising the steps of searching and analyzing a similar event separate from and expanding the criminal person knowledge network and storing it in the criminal person knowledge network DB.
상기 용의자 기초정보 작성단계는 사용자 입력 문서로부터 용의자의 기초정보를 추출하는 단계와 용의자 기초정보 스키마로부터 용의자의 기초정보를 작성하여 용의자 기초정보DB에 저장하되, 상기 기초정보 작성란에 미작성 칼럼(column)이 존재하는 경우, 지금까지 작성한 용의자의 기초정보로 치안정보 데이터뱅크를 검색하여 미작성 칼럼에 대한 보완 데이터를 추출하여 보완하고 용의자 기초정보DB에 저장하는 단계를 포함하는 것을 특징으로 하는 치안정보를 활용한 범죄인물 지식망 구축 방법.In the criminal person knowledge network construction algorithm of claim 8,
In the step of creating basic information of a suspect, the basic information of the suspect is extracted from the user input document, and the basic information of the suspect is created from the basic information schema of the suspect and stored in the basic information DB of the suspect. ), if present, search the security information data bank with the basic information of the suspect prepared so far, extract supplemental data for the unwritten column, supplement it, and store the security information in the suspect basic information DB. How to build a knowledge network for criminals using.
상기 용의자 과거범죄기록 검색 및 분석 단계는, 용의자 기초정보 및 치안정보 데이터뱅크를 통한 과거범죄기록 검색에서 과거범죄기록이 검색되지 않으면 초범이라는 정보를 추가하여 과거범죄기록 정보 목록DB에 저장하고, 과거범죄기록이 검색되면 인명 후보추출 단계, 인명 후보 분류 단계, 용의자 과거사건 노드 생성, 인명 노드 생성 및 각 인명 노드에 대한 기초정보 작성 단계를 거처 과거범죄기록 정보 목록DB에 저장하는 것을 특징으로 하는 치안정보를 활용한 범죄인물 지식망 구축 방법.In the criminal person knowledge network construction algorithm of claim 8,
In the step of searching and analyzing the suspect's past crime record, if the previous crime record is not searched through the suspect's basic information and security information data bank, information that is the first crime is added and stored in the previous crime record information list DB. When a record is retrieved, it is stored in the past crime record information list DB through the steps of extracting human candidates, classifying human candidates, creating a suspect past event node, creating a human node, and creating basic information for each human node. How to build a knowledge network for criminals using.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190175833A KR102228873B1 (en) | 2019-12-27 | 2019-12-27 | Construction system of criminal suspect knowledge network using public security information and Method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190175833A KR102228873B1 (en) | 2019-12-27 | 2019-12-27 | Construction system of criminal suspect knowledge network using public security information and Method thereof |
Publications (1)
Publication Number | Publication Date |
---|---|
KR102228873B1 true KR102228873B1 (en) | 2021-03-17 |
Family
ID=75243490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190175833A KR102228873B1 (en) | 2019-12-27 | 2019-12-27 | Construction system of criminal suspect knowledge network using public security information and Method thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102228873B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114003743A (en) * | 2021-07-30 | 2022-02-01 | 浙江创邻科技有限公司 | Graph database system based on leveling system, construction method, device and medium |
CN118378224A (en) * | 2024-06-26 | 2024-07-23 | 湖南省公民信息管理局 | Case main body association analysis method based on semantic cognition |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010077335A (en) | 2000-02-02 | 2001-08-17 | 김대휴 | Method Of Price Liquidation Authentication Using CTI In Electronic Commerce |
-
2019
- 2019-12-27 KR KR1020190175833A patent/KR102228873B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010077335A (en) | 2000-02-02 | 2001-08-17 | 김대휴 | Method Of Price Liquidation Authentication Using CTI In Electronic Commerce |
Non-Patent Citations (2)
Title |
---|
어윤희, "MISCG(Mathematics in industry study group)", 국가수리과학연구소 연구동향, 2016.3.* * |
정태진, " 소셜네트워크분석과 빅데이터 분석을 통한 국제범죄와 테러리즘 대응 전략", 융합보안 논문지, 제16권 제2호, 2016.3.* * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114003743A (en) * | 2021-07-30 | 2022-02-01 | 浙江创邻科技有限公司 | Graph database system based on leveling system, construction method, device and medium |
CN118378224A (en) * | 2024-06-26 | 2024-07-23 | 湖南省公民信息管理局 | Case main body association analysis method based on semantic cognition |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Arbia | Spatial econometrics | |
US11122100B2 (en) | Detecting events from ingested data | |
US20180357211A1 (en) | Constructing a Narrative Based on a Collection of Images | |
Wang et al. | Retweet wars: Tweet popularity prediction via dynamic multimodal regression | |
Pohl et al. | Online indexing and clustering of social media data for emergency management | |
KR101605430B1 (en) | SYSTEM AND METHOD FOR BUINDING QAs DATABASE AND SEARCH SYSTEM AND METHOD USING THE SAME | |
Compton et al. | Using publicly visible social media to build detailed forecasts of civil unrest | |
US20200162534A1 (en) | Detecting an event from signal data | |
CN111597803B (en) | Element extraction method and device, electronic equipment and storage medium | |
Mensikova et al. | Ensemble sentiment analysis to identify human trafficking in web data | |
Nalluru et al. | Relevancy classification of multimodal social media streams for emergency services | |
CN111723256A (en) | Government affair user portrait construction method and system based on information resource library | |
CN112015928A (en) | Information extraction method and device of multimedia resource, electronic equipment and storage medium | |
KR102228873B1 (en) | Construction system of criminal suspect knowledge network using public security information and Method thereof | |
Keertipati et al. | Multi-level analysis of peace and conflict data in GDELT | |
Spranger et al. | MoNA: A Forensic Analysis Platform for Mobile Communication | |
Iqbal et al. | Artificial intelligence and digital forensics | |
Mandyam et al. | Natural Disaster Analysis using Satellite Imagery and Social-Media Data for Emergency Response Situations | |
Gao | Spatial Scientometrics | |
Prabhu et al. | Cyber Complaint Automation System | |
Sekarhati | Combating Hoax and Misinformation in Indonesia Using Machine Learning What is Missing and Future Directions | |
Syliongka et al. | Combining automatic and manual approaches: Towards a framework for discovering themes in disaster-related Tweets | |
Cambria | Sentic computing | |
Lee et al. | Repurpose image identification for fake news detection | |
KAHRAMAN et al. | DETECTION AND CLASSIFICATION NATURAL DISASTERS USING TWITTER DATA WITH DEEP LEARNING APPROACH |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |