KR102396388B1 - Method for profiling criminal offender, apparatus and computer program for performing the method - Google Patents

Method for profiling criminal offender, apparatus and computer program for performing the method Download PDF

Info

Publication number
KR102396388B1
KR102396388B1 KR1020210178734A KR20210178734A KR102396388B1 KR 102396388 B1 KR102396388 B1 KR 102396388B1 KR 1020210178734 A KR1020210178734 A KR 1020210178734A KR 20210178734 A KR20210178734 A KR 20210178734A KR 102396388 B1 KR102396388 B1 KR 102396388B1
Authority
KR
South Korea
Prior art keywords
information
criminal
actor
profile
activity
Prior art date
Application number
KR1020210178734A
Other languages
Korean (ko)
Inventor
김경한
신용희
장대일
지승구
한수호
우상태
Original Assignee
한국인터넷진흥원
주식회사 엔에스에이치씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국인터넷진흥원, 주식회사 엔에스에이치씨 filed Critical 한국인터넷진흥원
Priority to KR1020210178734A priority Critical patent/KR102396388B1/en
Application granted granted Critical
Publication of KR102396388B1 publication Critical patent/KR102396388B1/en
Priority to PCT/KR2022/013898 priority patent/WO2023113158A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/235Update request formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5846Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Alarm Systems (AREA)

Abstract

According to a preferred embodiment of the present invention, provided are a method for profiling criminals, a device performing the same, and a computer program. The method may update criminal profile information by profiling criminals based on search data collected online, and group criminals by crime type based on criminal profile information to obtain group profile information for each type of crime, so as to analyze actors of cyber crime.

Description

범죄 행위자 프로파일링 방법, 이를 수행하는 장치 및 컴퓨터 프로그램{Method for profiling criminal offender, apparatus and computer program for performing the method}Method for profiling criminal offender, apparatus and computer program for performing the method

본 발명은 범죄 행위자 프로파일링 방법, 이를 수행하는 장치 및 컴퓨터 프로그램에 관한 것으로서, 더욱 상세하게는 범죄 행위자를 프로파일링하는, 방법, 장치 및 컴퓨터 프로그램에 관한 것이다.The present invention relates to a method, apparatus and computer program for profiling a criminal offender, and more particularly, to a method, apparatus and computer program for profiling a criminal offender.

기존의 온라인 상에서 범죄 정보를 수집하는 기술은 범죄 은어와 관련된 데이터를 크롤링(crawling)하여 단순히 수집하는 것에 그치고 있어, 사이버 범죄의 행위자를 분석하는 기술의 개발이 필요하다.The existing technology for collecting criminal information on the Internet merely collects data related to criminal slang by crawling it, so it is necessary to develop a technology to analyze the actors of the cyber crime.

본 발명이 이루고자 하는 목적은, 온라인 상에서 수집한 검색 데이터들을 기반으로 범죄 행위자를 프로파일링하여 범죄 행위자 프로파일 정보를 업데이트하고, 범죄 행위자 프로파일 정보를 기반으로 범죄 행위자를 범죄 유형별로 그룹화하여 범죄 유형별 그룹 프로파일 정보를 획득하는, 범죄 행위자 프로파일링 방법, 이를 수행하는 장치 및 컴퓨터 프로그램을 제공하는 데 있다.An object of the present invention is to profile criminal actors based on search data collected online to update criminal actor profile information, and to group criminal actors by crime type based on criminal actor profile information to create a group profile for each type of crime An object of the present invention is to provide a method for profiling a criminal offender for obtaining information, an apparatus for performing the same, and a computer program.

본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 수 있다.Other objects not specified in the present invention may be additionally considered within the scope that can be easily inferred from the following detailed description and effects thereof.

상기의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일링 방법은, 미리 설정된 범죄 은어를 기반으로 검색 엔진을 통해 검색 데이터들을 수집하는 단계; 상기 검색 데이터들을 기반으로 상기 검색 데이터 각각에 대응되는 행위자 활동 정보를 획득하는 단계; 및 상기 검색 데이터 각각에 대응되는 상기 행위자 활동 정보를 기반으로 범죄 행위자 프로파일(profile) 정보를 업데이트하는 단계;를 포함한다.A criminal actor profiling method according to a preferred embodiment of the present invention for achieving the above technical problem comprises the steps of: collecting search data through a search engine based on a preset criminal slang; acquiring actor activity information corresponding to each of the search data based on the search data; and updating criminal actor profile information based on the actor activity information corresponding to each of the search data.

여기서, 상기 범죄 행위자 프로파일 정보는, 사용자 식별 정보를 최상위 속성 정보로 하여, 상기 최상위 속성 정보와 계층적으로 연결된 복수개의 하위 속성 정보를 포함하는 범죄 행위자 프로파일로 이루어질 수 있다.Here, the criminal actor profile information may be composed of a criminal actor profile including a plurality of sub-attribute information hierarchically linked to the highest-level attribute information, using user identification information as the highest-level attribute information.

여기서, 상기 행위자 활동 정보 획득 단계는, 상기 검색 데이터에 대응되는 텍스트 데이터를 기반으로 상기 텍스트 데이터에서 추출 대상 정보를 추출하고, 상기 추출 대상 정보를 포함하는 상기 행위자 활동 정보를 획득하는 것으로 이루어질 수 있다.Here, the step of obtaining the actor activity information may include extracting the extraction target information from the text data based on the text data corresponding to the search data, and obtaining the actor activity information including the extraction target information. .

여기서, 상기 행위자 활동 정보 획득 단계는, 상기 검색 데이터의 본문 내용에서 추출한 텍스트 및 상기 본문 내용의 식별 정보를 포함하는 상기 텍스트 데이터를 획득하는 것으로 이루어질 수 있다.Here, the step of acquiring the actor activity information may include acquiring the text data including the text extracted from the text content of the search data and identification information of the text content.

여기서, 상기 행위자 활동 정보 획득 단계는, 상기 검색 데이터에 이미지가 포함된 경우, 상기 이미지에서 텍스트를 추출하고, 상기 본문 내용에서 추출한 텍스트, 상기 이미지에서 추출한 텍스트 및 상기 본문 내용의 식별 정보를 포함하는 상기 텍스트 데이터를 획득하는 것으로 이루어질 수 있다.Here, in the step of obtaining the actor activity information, when the image is included in the search data, extracting text from the image, including text extracted from the text content, text extracted from the image, and identification information of the text content and obtaining the text data.

여기서, 상기 행위자 활동 정보 획득 단계는, 상기 텍스트 데이터에서 상기 추출 대상 정보를 획득하고, 상기 추출 대상 정보 및 상기 본문 내용의 식별 정보를 포함하는 상기 행위자 활동 정보를 획득하는 것으로 이루어질 수 있다.Here, the step of acquiring the actor activity information may include acquiring the extraction target information from the text data, and acquiring the actor activity information including the extraction target information and identification information of the text content.

여기서, 상기 행위자 활동 정보 획득 단계는, 상기 범죄 행위자 프로파일 정보의 기준 속성 정보를 기반으로 상기 추출 대상 정보를 획득하고, 상기 추출 대상 정보를 상기 텍스트 데이터에서 추출하는 것으로 이루어질 수 있다.Here, the step of obtaining the actor activity information may include obtaining the extraction target information based on reference attribute information of the criminal actor profile information, and extracting the extraction target information from the text data.

여기서, 상기 범죄 행위자 프로파일 정보 업데이트 단계는, 상기 범죄 행위자 프로파일 정보에 포함된 상기 범죄 행위자 프로파일 각각에 대하여, 상기 범죄 행위자 프로파일에 대응되는 상기 사용자 식별 정보를 기반으로 상기 행위자 활동 정보에서 상기 범죄 행위자 프로파일에 대응되는 활동 내역 정보를 획득하고, 상기 활동 내역 정보를 기반으로 상기 범죄 행위자 프로파일을 업데이트하는 것으로 이루어질 수 있다.Here, the step of updating the criminal actor profile information includes, for each of the criminal actor profiles included in the criminal actor profile information, the criminal actor profile from the actor activity information based on the user identification information corresponding to the criminal actor profile Obtaining activity history information corresponding to , and updating the criminal actor profile based on the activity history information.

여기서, 상기 범죄 행위자 프로파일 정보 업데이트 단계는, 상기 활동 내역 정보를 기반으로 상기 범죄 행위자 프로파일 정보의 기준 속성 정보별로 서브 활동 내역 정보를 획득하고, 상기 서브 활동 내역 정보를 기반으로 상기 서브 활동 내역 정보에 대응되는 속성 정보에 상기 서브 활동 내역 정보를 추가하여 상기 범죄 행위자 프로파일을 업데이트하는 것으로 이루어질 수 있다.Here, the step of updating the criminal actor profile information includes acquiring sub-activity history information for each reference attribute information of the criminal actor profile information based on the activity history information, and adding to the sub-activity history information based on the sub-activity history information. It may consist of updating the criminal actor profile by adding the sub-activity history information to the corresponding attribute information.

여기서, 상기 범죄 행위자 프로파일 정보 업데이트 단계는, 상기 서브 활동 내역 정보에 대응되는 속성 정보가 상기 범죄 행위자 프로파일에 존재하면, 상기 범죄 행위자 프로파일의 속성 정보의 값으로 상기 서브 활동 내역 정보를 추가하고, 상기 서브 활동 내역 정보에 대응되는 속성 정보가 상기 범죄 행위자 프로파일에 존재하지 않으면, 상기 범죄 행위자 프로파일 정보의 속성 연결 정보를 기반으로 속성 정보를 상기 범죄 행위자 프로파일에 추가하고, 추가한 속성 정보의 값으로 상기 서브 활동 내역 정보를 추가하는 것으로 이루어질 수 있다.Here, in the step of updating the criminal actor profile information, if the attribute information corresponding to the sub activity history information exists in the criminal actor profile, adding the sub activity history information as a value of the attribute information of the criminal actor profile; If the attribute information corresponding to the sub-activity history information does not exist in the criminal actor profile, attribute information is added to the criminal actor profile based on the attribute connection information of the criminal actor profile information, and the value of the added attribute information is This may be accomplished by adding sub-activity history information.

여기서, 상기 범죄 행위자 프로파일 정보를 기반으로 범죄 유형별 그룹 프로파일 정보를 획득하는 단계;를 더 포함할 수 있다.Here, the step of obtaining group profile information for each crime type based on the criminal actor profile information; may further include.

여기서, 상기 범죄 유형별 그룹 프로파일 정보 획득 단계는, 상기 범죄 행위자 프로파일 정보에 포함된 상기 범죄 행위자 프로파일 간의 유사도를 기반으로 상기 범죄 행위자 프로파일을 그룹화하여, 상기 범죄 유형별 프로파일 정보를 획득하는 것으로 이루어질 수 있다.Here, the step of obtaining the group profile information for each crime type may include grouping the criminal actor profiles based on the similarity between the criminal actor profiles included in the criminal actor profile information to obtain the profile information for each crime type.

여기서, 상기 범죄 유형별 그룹 프로파일 정보 획득 단계는, 상기 범죄 행위자 프로파일 간의 뎁스(depth)별 유사도를 기반으로 상기 범죄 행위자 프로파일을 그룹화하는 것으로 이루어질 수 있다.Here, the step of obtaining the group profile information for each crime type may include grouping the criminal actor profiles based on a similarity by depth between the criminal actor profiles.

여기서, 상기 범죄 유형별 그룹 프로파일 정보 획득 단계는, 상기 범죄 행위자 프로파일 간의 미리 설정된 뎁스(depth)의 유사도가 미리 설정된 기준값보다 크면, 상기 범죄 행위자 프로파일을 동일한 그룹으로 그룹화하는 것으로 이루어질 수 있다.Here, the step of obtaining group profile information for each crime type may include grouping the criminal actor profiles into the same group when a similarity of a preset depth between the criminal actor profiles is greater than a preset reference value.

여기서, 상기 범죄 유형별 그룹 프로파일 정보 획득 단계는, 상기 범죄 행위자 프로파일 정보의 기준 속성 정보 중에서 미리 설정된 유사도 판단 속성 정보를 기반으로 상기 범죄 행위자 프로파일 간의 유사도를 획득하는 것으로 이루어질 수 있다.Here, the step of obtaining the group profile information for each crime type may include acquiring the degree of similarity between the criminal actor profiles based on preset similarity determination attribute information among the reference attribute information of the criminal actor profile information.

상기의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른 컴퓨터 프로그램은 컴퓨터 판독 가능한 저장 매체에 저장되어 상기한 범죄 행위자 프로파일링 방법 중 어느 하나를 컴퓨터에서 실행시킨다.A computer program according to a preferred embodiment of the present invention for achieving the above technical problem is stored in a computer-readable storage medium and executes any one of the above-described criminal offender profiling methods in a computer.

상기의 기술적 과제를 달성하기 위한 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일링 장치는, 범죄 행위자를 프로파일링하는 장치로서, 범죄 행위자를 프로파일링하기 위한 하나 이상의 프로그램을 저장하는 메모리; 및 상기 메모리에 저장된 상기 하나 이상의 프로그램에 따라 범죄 행위자를 프로파일링하기 위한 동작을 수행하는 하나 이상의 프로세서;를 포함하며, 상기 프로세서는, 미리 설정된 범죄 은어를 기반으로 검색 엔진을 통해 검색 데이터들을 수집하고, 상기 검색 데이터들을 기반으로 상기 검색 데이터 각각에 대응되는 행위자 활동 정보를 획득하며, 상기 검색 데이터 각각에 대응되는 상기 행위자 활동 정보를 기반으로 범죄 행위자 프로파일(profile) 정보를 업데이트한다.A criminal offender profiling apparatus according to a preferred embodiment of the present invention for achieving the above technical problem, as an apparatus for profiling a criminal actor, a memory for storing one or more programs for profiling the criminal; and one or more processors that perform an operation for profiling criminal actors according to the one or more programs stored in the memory, wherein the processor collects search data through a search engine based on preset criminal slang and , obtains actor activity information corresponding to each of the search data based on the search data, and updates criminal actor profile information based on the actor activity information corresponding to each of the search data.

여기서, 상기 범죄 행위자 프로파일 정보는, 사용자 식별 정보를 최상위 속성 정보로 하여, 상기 최상위 속성 정보와 계층적으로 연결된 복수개의 하위 속성 정보를 포함하는 범죄 행위자 프로파일로 이루어질 수 있다.Here, the criminal actor profile information may be composed of a criminal actor profile including a plurality of sub-attribute information hierarchically linked to the highest-level attribute information, using user identification information as the highest-level attribute information.

여기서, 상기 프로세서는, 상기 범죄 행위자 프로파일 정보에 포함된 상기 범죄 행위자 프로파일 각각에 대하여, 상기 범죄 행위자 프로파일에 대응되는 상기 사용자 식별 정보를 기반으로 상기 행위자 활동 정보에서 상기 범죄 행위자 프로파일에 대응되는 활동 내역 정보를 획득하고, 상기 활동 내역 정보를 기반으로 상기 범죄 행위자 프로파일을 업데이트할 수 있다.Here, the processor, for each of the criminal actor profiles included in the criminal actor profile information, based on the user identification information corresponding to the criminal actor profile, the activity history corresponding to the criminal actor profile in the actor activity information The information may be obtained, and the criminal actor profile may be updated based on the activity history information.

여기서, 상기 프로세서는, 상기 범죄 행위자 프로파일 정보를 기반으로 범죄 유형별 그룹 프로파일 정보를 획득할 수 있다.Here, the processor may acquire group profile information for each crime type based on the criminal actor profile information.

여기서, 상기 프로세서는, 상기 범죄 행위자 프로파일 정보에 포함된 상기 범죄 행위자 프로파일 간의 유사도를 기반으로 상기 범죄 행위자 프로파일을 그룹화하여, 상기 범죄 유형별 프로파일 정보를 획득할 수 있다.Here, the processor may obtain the profile information for each crime type by grouping the criminal actor profiles based on the similarity between the criminal actor profiles included in the criminal actor profile information.

본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일링 방법, 이를 수행하는 장치 및 컴퓨터 프로그램에 의하면, 온라인 상에서 수집한 검색 데이터들을 기반으로 범죄 행위자를 프로파일링하여 범죄 행위자 프로파일 정보를 업데이트하고, 범죄 행위자 프로파일 정보를 기반으로 범죄 행위자를 범죄 유형별로 그룹화하여 범죄 유형별 그룹 프로파일 정보를 획득함으로써, 사이버 범죄의 행위자를 분석할 수 있다.According to the criminal actor profiling method according to a preferred embodiment of the present invention, an apparatus for performing the same, and a computer program, the criminal actor is profiled based on search data collected online to update the criminal actor profile information, and the criminal actor profile By grouping criminal actors by crime type based on the information to obtain group profile information for each type of crime, it is possible to analyze cybercriminal actors.

본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.Effects of the present invention are not limited to the above-mentioned effects, and other effects not mentioned will be clearly understood by those skilled in the art from the following description.

도 1은 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일링 장치를 설명하기 위한 블록도이다.
도 2는 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일링 방법을 설명하기 위한 흐름도이다.
도 3은 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일을 설명하기 위한 도면이다.
도 4는 도 2에 도시한 검색 데이터 수집 단계의 일례를 설명하기 위한 도면이다.
도 5는 도 2에 도시한 행위자 활동 정보 획득 단계를 설명하기 위한 도면이다.
도 6은 도 5에 도시한 행위자 활동 정보 획득 동작을 설명하기 위한 도면이다.
도 7은 도 6에 도시한 텍스트 데이터 획득 동작을 설명하기 위한 도면이다.
도 8은 도 6에 도시한 행위자 활동 정보 획득 동작의 상세 내용을 설명하기 위한 도면이다.
도 9는 도 2에 도시한 범죄 행위자 프로파일 정보 업데이트 단계를 설명하기 위한 도면이다.
도 10은 도 9에 도시한 범죄 행위자 프로파일 정보 업데이트 동작의 상세 내용을 설명하기 위한 도면이다.
도 11은 도 2에 도시한 범죄 유형별 그룹 프로파일 정보 획득 단계를 설명하기 위한 도면이다.
도 12는 도 11에 도시한 범죄 행위자 프로파일 간의 유사도 획득 동작을 설명하기 위한 도면이다.
1 is a block diagram illustrating a criminal offender profiling apparatus according to a preferred embodiment of the present invention.
2 is a flowchart illustrating a criminal offender profiling method according to a preferred embodiment of the present invention.
3 is a view for explaining a criminal offender profile according to a preferred embodiment of the present invention.
FIG. 4 is a diagram for explaining an example of the search data collection step shown in FIG. 2 .
FIG. 5 is a diagram for explaining the step of acquiring the actor activity information shown in FIG. 2 .
FIG. 6 is a diagram for explaining an operation of acquiring actor activity information shown in FIG. 5 .
FIG. 7 is a diagram for explaining an operation of acquiring text data shown in FIG. 6 .
FIG. 8 is a diagram for explaining details of an operation of acquiring actor activity information shown in FIG. 6 .
FIG. 9 is a diagram for explaining the step of updating criminal actor profile information shown in FIG. 2 .
FIG. 10 is a diagram for explaining details of an operation of updating criminal actor profile information shown in FIG. 9 .
FIG. 11 is a diagram for explaining a step of acquiring group profile information for each crime type shown in FIG. 2 .
FIG. 12 is a diagram for explaining an operation of obtaining a degree of similarity between criminal actor profiles shown in FIG. 11 .

이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 게시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. Advantages and features of the present invention and methods of achieving them will become apparent with reference to the embodiments described below in detail in conjunction with the accompanying drawings. However, the present invention is not limited to the embodiments published below, but may be implemented in various different forms, and only these embodiments make the publication of the present invention complete, and are common in the technical field to which the present invention pertains. It is provided to fully inform those with knowledge of the scope of the invention, and the present invention is only defined by the scope of the claims. Like reference numerals refer to like elements throughout.

다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.Unless otherwise defined, all terms (including technical and scientific terms) used herein may be used with the meaning commonly understood by those of ordinary skill in the art to which the present invention belongs. In addition, terms defined in a commonly used dictionary are not to be interpreted ideally or excessively unless specifically defined explicitly.

본 명세서에서 "제1", "제2" 등의 용어는 하나의 구성 요소를 다른 구성 요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예컨대, 제1 구성 요소는 제2 구성 요소로 명명될 수 있고, 유사하게 제2 구성 요소도 제1 구성 요소로 명명될 수 있다.In this specification, terms such as “first” and “second” are for distinguishing one component from other components, and the scope of rights should not be limited by these terms. For example, a first component may be referred to as a second component, and similarly, a second component may also be referred to as a first component.

본 명세서에서 각 단계들에 있어 식별부호(예컨대, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.In the present specification, identification numbers (eg, a, b, c, etc.) in each step are used for convenience of description, and identification numbers do not describe the order of each step, and each step is clearly in a specific order in context. Unless stated otherwise, it may occur differently from the specified order. That is, each step may occur in the same order as specified, may be performed substantially simultaneously, or may be performed in the reverse order.

본 명세서에서, "가진다", "가질 수 있다", "포함한다" 또는 "포함할 수 있다" 등의 표현은 해당 특징(예컨대, 수치, 기능, 동작, 또는 부품 등의 구성 요소)의 존재를 가리키며, 추가적인 특징의 존재를 배제하지 않는다.In this specification, expressions such as “have”, “may have”, “include” or “may include” indicate the presence of a corresponding feature (eg, a numerical value, function, operation, or component such as a part). and does not exclude the presence of additional features.

이하에서 첨부한 도면을 참조하여 본 발명에 따른 범죄 행위자 프로파일링 방법, 이를 수행하는 장치 및 컴퓨터 프로그램의 바람직한 실시예에 대해 상세하게 설명한다.Hereinafter, a preferred embodiment of a criminal offender profiling method, an apparatus for performing the same, and a computer program according to the present invention will be described in detail with reference to the accompanying drawings.

먼저, 도 1을 참조하여 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일링 장치에 대하여 설명한다.First, an apparatus for profiling criminal actors according to a preferred embodiment of the present invention will be described with reference to FIG. 1 .

도 1은 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일링 장치를 설명하기 위한 블록도이다.1 is a block diagram illustrating a criminal offender profiling apparatus according to a preferred embodiment of the present invention.

도 1을 참조하면, 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일링 장치(100)는 범죄 행위자를 프로파일링할 수 있다.Referring to FIG. 1 , the criminal offender profiling apparatus 100 according to a preferred embodiment of the present invention may profile a criminal offender.

즉, 범죄 행위자 프로파일링 장치(100)는 온라인 상에서 수집한 검색 데이터들을 기반으로 범죄 행위자를 프로파일링하여 범죄 행위자 프로파일(profile) 정보를 업데이트할 수 있다. 또한, 범죄 행위자 프로파일링 장치(100)는 범죄 행위자 프로파일 정보를 기반으로 범죄 행위자를 범죄 유형별로 그룹화하여 범죄 유형별 그룹 프로파일 정보를 획득할 수 있다. 이에 따라, 본 발명은 사이버 범죄의 행위자를 분석할 수 있다.That is, the criminal actor profiling apparatus 100 may update the criminal actor profile information by profiling the criminal based on the search data collected online. Also, the criminal actor profiling apparatus 100 may obtain group profile information for each crime type by grouping criminal actors by crime type based on the criminal actor profile information. Accordingly, the present invention can analyze the actors of cybercrime.

이를 위해, 범죄 행위자 프로파일링 장치(100)는 하나 이상의 프로세서(110), 컴퓨터 판독 가능한 저장 매체(130) 및 통신 버스(150)를 포함할 수 있다.To this end, the criminal actor profiling apparatus 100 may include one or more processors 110 , a computer-readable storage medium 130 , and a communication bus 150 .

프로세서(110)는 범죄 행위자 프로파일링 장치(100)가 동작하도록 제어할 수 있다. 예컨대, 프로세서(110)는 컴퓨터 판독 가능한 저장 매체(130)에 저장된 하나 이상의 프로그램(131)을 실행할 수 있다. 하나 이상의 프로그램(131)은 하나 이상의 컴퓨터 실행 가능 명령어를 포함할 수 있으며, 컴퓨터 실행 가능 명령어는 프로세서(110)에 의해 실행되는 경우 범죄 행위자 프로파일링 장치(100)로 하여금 범죄 행위자를 프로파일링하기 위한 동작을 수행하도록 구성될 수 있다.The processor 110 may control the criminal offender profiling apparatus 100 to operate. For example, the processor 110 may execute one or more programs 131 stored in the computer-readable storage medium 130 . The one or more programs 131 may include one or more computer-executable instructions, which, when executed by the processor 110 , cause the criminal offender profiling apparatus 100 to profile the criminal. may be configured to perform an action.

컴퓨터 판독 가능한 저장 매체(130)는 범죄 행위자를 프로파일링하기 위한 컴퓨터 실행 가능 명령어 내지 프로그램 코드, 프로그램 데이터 및/또는 다른 적합한 형태의 정보를 저장하도록 구성된다. 컴퓨터 판독 가능한 저장 매체(130)에 저장된 프로그램(131)은 프로세서(110)에 의해 실행 가능한 명령어의 집합을 포함한다. 일 실시예에서, 컴퓨터 판독 가능한 저장 매체(130)는 메모리(랜덤 액세스 메모리와 같은 휘발성 메모리, 비휘발성 메모리, 또는 이들의 적절한 조합), 하나 이상의 자기 디스크 저장 디바이스들, 광학 디스크 저장 디바이스들, 플래시 메모리 디바이스들, 그 밖에 범죄 행위자 프로파일링 장치(100)에 의해 액세스되고 원하는 정보를 저장할 수 있는 다른 형태의 저장 매체, 또는 이들의 적합한 조합일 수 있다.Computer-readable storage medium 130 is configured to store computer-executable instructions or program code, program data, and/or other suitable form of information for profiling a criminal offender. The program 131 stored in the computer-readable storage medium 130 includes a set of instructions executable by the processor 110 . In one embodiment, computer-readable storage medium 130 includes memory (volatile memory, such as random access memory, non-volatile memory, or a suitable combination thereof), one or more magnetic disk storage devices, optical disk storage devices, flash It may be memory devices, other types of storage media that can be accessed by the criminal actor profiling apparatus 100 and store desired information, or a suitable combination thereof.

통신 버스(150)는 프로세서(110), 컴퓨터 판독 가능한 저장 매체(130)를 포함하여 범죄 행위자 프로파일링 장치(100)의 다른 다양한 컴포넌트들을 상호 연결한다.Communication bus 150 interconnects various other components of criminal actor profiling apparatus 100 including processor 110 and computer readable storage medium 130 .

범죄 행위자 프로파일링 장치(100)는 또한 하나 이상의 입출력 장치를 위한 인터페이스를 제공하는 하나 이상의 입출력 인터페이스(170) 및 하나 이상의 통신 인터페이스(190)를 포함할 수 있다. 입출력 인터페이스(170) 및 통신 인터페이스(190)는 통신 버스(150)에 연결된다. 입출력 장치(도시하지 않음)는 입출력 인터페이스(170)를 통해 범죄 행위자 프로파일링 장치(100)의 다른 컴포넌트들에 연결될 수 있다.The criminal profiling device 100 may also include one or more input/output interfaces 170 and one or more communication interfaces 190 that provide interfaces for one or more input/output devices. The input/output interface 170 and the communication interface 190 are connected to the communication bus 150 . The input/output device (not shown) may be connected to other components of the criminal actor profiling device 100 through the input/output interface 170 .

그러면, 도 2 내지 도 12를 참조하여 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일링 방법에 대하여 설명한다.Then, a criminal offender profiling method according to a preferred embodiment of the present invention will be described with reference to FIGS. 2 to 12 .

본 발명에 따른 범죄 행위자 프로파일링 방법Criminal actor profiling method according to the present invention

도 2는 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일링 방법을 설명하기 위한 흐름도이고, 도 3은 본 발명의 바람직한 실시예에 따른 범죄 행위자 프로파일을 설명하기 위한 도면이다.2 is a flowchart for explaining a criminal offender profiling method according to a preferred embodiment of the present invention, and FIG. 3 is a diagram for explaining a criminal offender profile according to a preferred embodiment of the present invention.

도 2를 참조하면, 범죄 행위자 프로파일링 장치(100)의 프로세서(110)는 미리 설정된 범죄 은어를 기반으로 검색 엔진을 통해 검색 데이터들을 수집할 수 있다(S110).Referring to FIG. 2 , the processor 110 of the criminal profiling apparatus 100 may collect search data through a search engine based on preset criminal slang ( S110 ).

여기서, 범죄 은어 목록은 "마약", "성범죄" 등과 같은 범죄와 관련된 단어와 범죄 관련 단어를 지칭하는 은어를 포함하며, 미리 구축되어 저장될 수 있다.Here, the criminal slang list includes crime-related words such as “drugs” and “sex crime” and slang words that refer to crime-related words, and may be pre-constructed and stored.

그리고, 검색 엔진은 다크 웹(dark web)이나 표면 웹(surface web)의 웹 데이터들을 자동으로 수집하는 툴을 말하며, 엘라스틱서치(elasticsearch) 검색 엔진 등이 있다.In addition, the search engine refers to a tool that automatically collects web data of the dark web or the surface web, and includes an elasticsearch search engine.

그리고, 검색 데이터는 다크 웹(dark web)이나 표면 웹(surface web)의 웹 데이터들 중에서 범죄 은어가 포함된 웹 데이터들을 말한다. 검색 데이터는 텍스트, 이미지 및 영상 중 적어도 하나를 포함할 수 있다.And, the search data refers to web data including criminal slang among web data of the dark web or the surface web. The search data may include at least one of text, an image, and an image.

그런 다음, 프로세서(110)는 검색 데이터들을 기반으로 검색 데이터 각각에 대응되는 행위자 활동 정보를 획득할 수 있다(S120).Then, the processor 110 may acquire the actor activity information corresponding to each of the search data based on the search data (S120).

그런 다음, 프로세서(110)는 검색 데이터 각각에 대응되는 행위자 활동 정보를 기반으로 범죄 행위자 프로파일 정보를 업데이트할 수 있다(S130).Then, the processor 110 may update the criminal actor profile information based on the actor activity information corresponding to each of the search data (S130).

여기서, 행위자 활동 정보는 사용자의 관심 영역을 확인할 수 있는 정보로, 해당 사용자에 의해 작성된 웹 데이터를 기반으로 추출된 정보를 포함할 수 있다.Here, the actor activity information is information for identifying the user's area of interest, and may include information extracted based on web data created by the user.

그리고, 범죄 행위자 프로파일 정보는 사용자 식별 정보를 최상위 속성 정보로 하여, 최상위 속성 정보와 계층적으로 연결된 복수개의 하위 속성 정보를 포함하는 범죄 행위자 프로파일로 이루어질 수 있다. 범죄 행위자 프로파일 정보는 복수명의 복수 행위자 각각에 대한 범죄 행위자 프로파일을 포함할 수 있다.In addition, the criminal actor profile information may be composed of a criminal actor profile including a plurality of sub-attribute information hierarchically connected to the highest attribute information, using user identification information as the highest attribute information. The criminal actor profile information may include a criminal actor profile for each of a plurality of plural actors.

이때, 범죄 행위자 프로파일 정보는 기준 속성 정보와 속성 연결 정보를 포함할 수 있다.In this case, the criminal actor profile information may include reference attribute information and attribute connection information.

여기서, 기준 속성 정보는 범죄 행위자에 대한 범죄 행위자 프로파일을 구성할 때 이용되는 복수개의 속성 정보를 말한다. 속성 정보에는 아이디, 이메일 주소, 닉네임 등과 같이 사용자를 식별할 수 있는 고유 정보인 "사용자 식별 정보", 사용자가 작성한 글 등에 포함된 "범죄 은어", 사용자가 방문한 URL을 나타내는 "도메인(domain)", 사용자의 웹 사이트 등에 접속할 때의 IP 주소인 "IP 주소" 등이 있다. 이와 같은 속성 정보들 중에서 하나의 속성 정보가 키(key) 속성 정보, 즉 최상위 속성 정보로 지정되어 있을 수 있다. 예컨대, 사용자 식별 정보인 "아이디"가 키 속성 정보(최상위 속성 정보)로 지정될 수 있고, 이 경우 "이메일 주소", "닉네임" 등과 같은 다른 사용자 식별 정보는 "관련 사용자 식별 정보"로 하여 또 다른 속성 정보를 구성할 수 있다.Here, the reference attribute information refers to a plurality of attribute information used when constructing a criminal actor profile for a criminal actor. Attribute information includes "user identification information", which is unique information that can identify a user, such as ID, email address, nickname, etc., "criminal slang" included in text written by a user, and "domain" indicating the URL visited by the user. , "IP address", which is an IP address when accessing a user's website, etc. Among such attribute information, one attribute information may be designated as key attribute information, that is, uppermost attribute information. For example, "ID", which is user identification information, may be designated as key attribute information (top-level attribute information), and in this case, other user identification information such as "e-mail address" and "nickname" is referred to as "related user identification information" and You can configure other attribute information.

그리고, 속성 연결 정보는 기준 속성 정보에 따른 복수개의 속성 정보 간의 계층적 연결 관계를 나타내며, 속성 정보의 중요도에 따라 미리 지정되어 있을 수 있다. 이때, 복수개의 속성 정보는 서로 다른 뎁스(depth)를 가질 수 있다. 이에 따라, 범죄 행위자 프로파일의 뎁스(depth)는 속성 정보의 개수와 동일할 수 있다. 예컨대, 기준 속성 정보가 "아이디" 속성 정보, "범죄 은어" 속성 정보, "도메인(domain)" 속성 정보 및 "관련 사용자 식별 정보" 속성 정보로 이루어진 경우, 속성 연결 정보는 이와 같은 속성 정보들 중에서 키 속성 정보(최상위 속성 정보)로 지정된 "아이디" 속성 정보(depth 1)가 최상위 계층에 위치하고, "아이디" 속성 정보의 바로 아래 계층에 "범죄 은어" 속성 정보(depth 2)가 위치하며, "범죄 은어" 속성 정보의 바로 아래 계층에 "도메인(domain)" 속성 정보(depth 3)가 위치하고, "도메인(domain)" 속성 정보의 바로 아래 계층에 "관련 사용자 식별 정보" 속성 정보(depth 4)가 위치하도록 지정될 수 있다.In addition, the attribute connection information indicates a hierarchical connection relationship between a plurality of attribute information according to the reference attribute information, and may be predetermined according to the importance of the attribute information. In this case, the plurality of attribute information may have different depths. Accordingly, the depth of the criminal actor profile may be equal to the number of attribute information. For example, when the reference attribute information consists of "ID" attribute information, "criminal slang" attribute information, "domain" attribute information, and "related user identification information" attribute information, attribute connection information is one of the attribute information "ID" attribute information (depth 1) designated as key attribute information (topmost attribute information) is located in the uppermost layer, and "criminal slang" attribute information (depth 2) is located in a layer immediately below the "ID" attribute information, " “Domain” attribute information (depth 3) is located in a layer immediately below the “criminal slang” attribute information, and “related user identification information” attribute information (depth 4) in a layer immediately below the “domain” attribute information may be designated to be located.

보다 자세히 설명하면, 범죄 행위자 프로파일은 도 3에 도시된 바와 같이, 속성 정보 각각을 하나의 노드(node)로 하고, 속성 정보의 값은 해당 노드(node)에 연결된 값으로 하는 트리 형태로 이루어질 수 있다. 예컨대, 도 3에 도시된 노드(node)들 중 최상위 계층의 노드(node)인 "노드 1"에는 키 속성 정보(최상위 속성 정보)로 지정된 "아이디" 속성 정보가 위치할 수 있다. 그리고, "노드 1"의 아래에 위치하는 노드(node)들인 "노드 2, 노드 3, ..., 노드 n"에는 속성 연결 정보를 기반으로 속성 정보가 하나씩 위치할 수 있다.More specifically, as shown in FIG. 3 , the criminal actor profile can be formed in a tree form in which each attribute information is a node, and the value of the attribute information is a value connected to the corresponding node. there is. For example, "ID" attribute information designated as key attribute information (topmost attribute information) may be located in "node 1," which is a node of the highest layer among the nodes shown in FIG. 3 . In addition, one attribute information may be located in “node 2, node 3, ..., node n”, which are nodes located below “node 1”, based on attribute connection information.

그런 다음, 프로세서(110)는 범죄 행위자 프로파일 정보를 기반으로 범죄 유형별 그룹 프로파일 정보를 획득할 수 있다(S140).Then, the processor 110 may acquire group profile information for each crime type based on the criminal actor profile information (S140).

여기서, 범죄 유형별 그룹 프로파일 정보는 범죄 행위자 프로파일들을 범죄 유형별로 그룹화한 정보를 말한다. 범죄 유형에는 마약 그룹, 총기 그룹, 성범죄 그룹 등이 있다.Here, the group profile information for each crime type refers to information obtained by grouping criminal actor profiles by crime type. Types of crime include drug groups, gun groups, and sex crime groups.

이후, 프로세서(110)는 범죄 행위자 프로파일 정보 또는 범죄 유형별 그룹 프로파일 정보를 제공할 수 있다(S150).Thereafter, the processor 110 may provide criminal actor profile information or group profile information for each crime type ( S150 ).

즉, 프로세서(110)는 범죄 행위자 프로파일들로 이루어지는 범죄 행위자 프로파일 정보 또는 범죄 유형별 그룹 프로파일 정보를 사용자 단말(도시하지 않음)이나 관리자 단말(도시하지 않음)에 제공할 수 있다.That is, the processor 110 may provide criminal agent profile information comprising criminal agent profiles or group profile information for each crime type to a user terminal (not shown) or an administrator terminal (not shown).

이때, 프로세서(110)는 서로 다른 시점에서 획득한 범죄 행위자 프로파일 정보나 범죄 유형별 그룹 프로파일 정보를 사용자 단말이나 관리자 단말에 제공할 수 있다.In this case, the processor 110 may provide the criminal actor profile information or the group profile information for each crime type obtained at different points in time to the user terminal or the manager terminal.

또한, 프로세서(110)는 사용자 단말이나 관리자 단말의 요청에 의해 범죄 행위자 프로파일을 속성 정보(노드)별로 또는 뎁스(depth)별로 확대/축소하여 사용자 단말이나 관리자 단말에 제공할 수 있다.In addition, the processor 110 may enlarge/reduce the criminal actor profile by attribute information (node) or depth (depth) at the request of the user terminal or the manager terminal, and provide it to the user terminal or the manager terminal.

검색 데이터 수집 단계Steps to collect search data

도 4는 도 2에 도시한 검색 데이터 수집 단계의 일례를 설명하기 위한 도면이다.FIG. 4 is a diagram for explaining an example of the search data collection step shown in FIG. 2 .

도 4를 참조하면, 프로세서(110)는 범죄 은어를 기반으로 검색 엔진을 통해 검색 데이터들을 수집할 수 있다.Referring to FIG. 4 , the processor 110 may collect search data through a search engine based on criminal slang.

보다 자세히 설명하면, 프로세서(110)는 검색 엔진별로 할당된 복수개의 수집 인스턴스를 통해 복수개의 검색 엔진을 통해 범죄 언어가 포함된 검색 데이터들을 비동기식으로 수집할 수 있다. 예컨대, 도 4에 도시된 바와 같이, 프로세서(110)는 검색 엔진(검색 엔진 1, 검색 엔진 2, ..., 검색 엔진 n)의 개수와 동일한 개수의 수집 인스턴스(수집 인스턴스 1, 수집 인스턴스 2, ..., 수집 인스턴스 n)를 생성하여, 검색 엔진(검색 엔진 1, 검색 엔진 2, ..., 검색 엔진 n)별로 1개의 수집 인스턴스를 할당할 수 있다. 그러면, 복수개의 수집 인스턴스(수집 인스턴스 1, 수집 인스턴스 2, ..., 수집 인스턴스 n) 각각은 자신에게 할당된 검색 엔진을 통해 검색어인 범죄 은어가 포함된 검색 데이터들을 비동기식으로 수집할 수 있다.In more detail, the processor 110 may asynchronously collect search data including a criminal language through a plurality of search engines through a plurality of collection instances allocated to each search engine. For example, as shown in FIG. 4 , the processor 110 generates the same number of collection instances (collection instance 1, collection instance 2) as the number of search engines (search engine 1, search engine 2, ..., search engine n). , . Then, each of the plurality of collection instances (collection instance 1, collection instance 2, ..., collection instance n) may asynchronously collect search data including criminal slang as a search term through a search engine assigned to it.

물론, 프로세서(110)는 검색 엔진별로 검색된 데이터들의 양을 기반으로 특정 검색 엔진에 복수개의 수집 인스턴스를 할당하여 검색 데이터들을 수집하도록 할 수 있다.Of course, the processor 110 may collect search data by allocating a plurality of collection instances to a specific search engine based on the amount of data searched for each search engine.

그리고, 프로세서(110)는 하나의 검색 엔진에 할당된 수집 인스턴스를 통한 검색 데이터들의 수집이 완료되면, 검색 데이터들의 수집이 완료된 수집 인스턴스를 다른 검색 엔진에 할당하여 다른 검색 엔진을 통해 검색 데이터들을 수집하도록 스케쥴링할 수 있다.Then, when the collection of search data through the collection instance allocated to one search engine is completed, the processor 110 allocates the collection instance in which the collection of search data is completed to another search engine to collect search data through the other search engine. can be scheduled to do so.

이와 같이, 본 발명은 복수개의 수집 인스턴스를 통해 복수개의 검색 엔진을 통해 검색 데이터들을 비동기식으로 수집함으로써, 데이터 수집 효율을 높일 수 있고, 시스템 리소스 소모를 최소화할 수 있다.As described above, according to the present invention, data collection efficiency can be increased and system resource consumption can be minimized by asynchronously collecting search data through a plurality of search engines through a plurality of collection instances.

행위자 활동 정보 획득 단계Actor activity information acquisition stage

도 5는 도 2에 도시한 행위자 활동 정보 획득 단계를 설명하기 위한 도면이고, 도 6은 도 5에 도시한 행위자 활동 정보 획득 동작을 설명하기 위한 도면이며, 도 7은 도 6에 도시한 텍스트 데이터 획득 동작을 설명하기 위한 도면이고, 도 8은 도 6에 도시한 행위자 활동 정보 획득 동작의 상세 내용을 설명하기 위한 도면이다.FIG. 5 is a diagram for explaining the step of acquiring the actor activity information shown in FIG. 2 , FIG. 6 is a diagram for explaining the operation of acquiring the actor activity information shown in FIG. 5 , and FIG. 7 is the text data shown in FIG. 6 It is a diagram for explaining an operation of acquiring, and FIG. 8 is a diagram for explaining the details of the operation of acquiring the actor activity information shown in FIG. 6 .

도 5 내지 도 8을 참조하면, 프로세서(110)는 검색 데이터들을 기반으로 검색 데이터 각각에 대응되는 행위자 활동 정보를 획득할 수 있다. 예컨대, 도 5에 도시된 바와 같이, 프로세서(110)는 복수개의 검색 엔진(검색 엔진 1, ..., 검색 엔진 n) 각각을 통해 수집한 검색 데이터들 각각에 대하여, 검색 데이터를 기반으로 행위자 할동 정보를 획득할 수 있다.5 to 8 , the processor 110 may acquire actor activity information corresponding to each of the search data based on the search data. For example, as shown in FIG. 5 , the processor 110 performs an actor based on the search data for each of the search data collected through each of a plurality of search engines (search engine 1, ..., search engine n). Activity information can be obtained.

보다 자세히 설명하면, 프로세서(110)는 도 6에 도시된 바와 같이, 검색 데이터에 대응되는 텍스트 데이터를 기반으로 텍스트 데이터에서 추출 대상 정보를 추출하고, 추출 대상 정보를 포함하는 행위자 활동 정보를 획득할 수 있다.More specifically, as shown in FIG. 6 , the processor 110 extracts extraction target information from text data based on text data corresponding to the search data, and obtains actor activity information including the extraction target information. can

즉, 프로세서(110)는 도 7에 도시된 바와 같이, 검색 데이터의 본문 내용에서 텍스트를 추출하고, 검색 데이터에서 본문 내용의 식별 정보(아이디 등과 같이 본문 내용을 등록한 사용자를 식별할 수 있는 정보, 본문 내용이 등록된 도메인 주소, 본문 내용을 등록한 사용자의 IP 주소, 본문 내용을 등록한 시간, 본문 내용 자체를 식별할 수 있는 정보 등을 포함)를 획득할 수 있다. 여기서, 프로세서(110)는 KoNLP의 OKT(open korean text) 클래스 등과 같이 종래에 알려진 명사형 단어 추출 알고리즘을 이용하여 본문 내용에서 텍스트를 추출할 수 있다. 그리고, 프로세서(110)는 검색 데이터의 본문 내용에서 추출한 텍스트 및 본문 내용의 식별 정보를 포함하는 텍스트 데이터를 획득할 수 있다.That is, as shown in FIG. 7 , the processor 110 extracts text from the body contents of the search data, and identification information of the body contents from the search data (such as ID information that can identify the user who registered the body contents, etc.); It is possible to obtain the domain address where the body content is registered, the IP address of the user who registered the body content, the time when the body content was registered, information that can identify the body content itself, etc.). Here, the processor 110 may extract text from the text content by using a conventionally known noun word extraction algorithm, such as an open korean text (OKT) class of KoNLP. In addition, the processor 110 may acquire text data including identification information of text and text content extracted from the body content of the search data.

이때, 검색 데이터에 이미지가 포함된 경우, 프로세서(110)는 이미지에서 텍스트를 추출하고, 본문 내용에서 추출한 텍스트, 이미지에서 추출한 텍스트 및 본문 내용의 식별 정보를 포함하는 텍스트 데이터를 획득할 수 있다. 여기서, 프로세서(110)는 OCR API 등과 같이 종래에 알려진 텍스트 추출 알고리즘을 이용하여 이미지에서 텍스트를 추출할 수 있다.In this case, when the image is included in the search data, the processor 110 may extract text from the image and obtain text data including the text extracted from the text content, the text extracted from the image, and identification information of the text content. Here, the processor 110 may extract text from the image using a conventionally known text extraction algorithm such as OCR API.

그리고, 프로세서(110)는 텍스트 데이터에서 추출 대상 정보를 포함하는 행위자 활동 정보를 획득할 수 있다.Then, the processor 110 may acquire the actor activity information including the extraction target information from the text data.

보다 자세히 설명하면, 프로세서(110)는 도 8에 도시된 바와 같이, 텍스트 데이터에서 추출 대상 정보를 획득할 수 있다.More specifically, as shown in FIG. 8 , the processor 110 may obtain extraction target information from text data.

이때, 프로세서(110)는 범죄 행위자 프로파일 정보의 기준 속성 정보를 기반으로 추출 대상 정보를 획득하고, 추출 대상 정보를 텍스트 데이터에서 추출할 수 있다. 즉, 프로세서(110)는 기준 속성 정보에 따른 복수개의 속성 정보 각각에 대하여, 속성 정보에 대응되는 값을 텍스트 데이터에서 추출하여 추출 대상 정보를 획득할 수 있다. 예컨대, 기준 속성 정보가 "아이디" 속성 정보, "범죄 은어" 속성 정보, "도메인(domain)" 속성 정보 및 "관련 사용자 식별 정보" 속성 정보로 이루어진 경우, 프로세서(110)는 "아이디" 속성 정보, "범죄 은어" 속성 정보, "도메인(domain)" 속성 정보 및 "관련 사용자 식별 정보" 속성 정보 각각에 대응되는 값을 텍스트 데이터(텍스트 또는 본문 내용의 식별 정보)에서 추출하여 추출 대상 정보를 획득할 수 있다.In this case, the processor 110 may obtain the extraction target information based on the reference attribute information of the criminal actor profile information, and extract the extraction target information from the text data. That is, for each of the plurality of pieces of attribute information according to the reference attribute information, the processor 110 may extract a value corresponding to the attribute information from the text data to obtain the extraction target information. For example, when the reference attribute information consists of "ID" attribute information, "criminal slang" attribute information, "domain" attribute information, and "related user identification information" attribute information, the processor 110 configures the "ID" attribute information , "criminal slang" attribute information, "domain" attribute information, and "related user identification information" attribute information by extracting a value corresponding to each attribute information from text data (identification information of text or body content) to obtain extraction target information can do.

그리고, 프로세서(110)는 추출 대상 정보 및 본문 내용의 식별 정보를 포함하는 행위자 활동 정보를 획득할 수 있다.In addition, the processor 110 may acquire the actor activity information including the extraction target information and the identification information of the body content.

범죄 행위자 프로파일 정보 업데이트 단계Steps to update criminal offender profile information

도 9는 도 2에 도시한 범죄 행위자 프로파일 정보 업데이트 단계를 설명하기 위한 도면이고, 도 10은 도 9에 도시한 범죄 행위자 프로파일 정보 업데이트 동작의 상세 내용을 설명하기 위한 도면이다.FIG. 9 is a view for explaining the step of updating criminal actor profile information shown in FIG. 2 , and FIG. 10 is a view for explaining details of the criminal actor profile information updating operation shown in FIG. 9 .

도 9 및 도 10을 참조하면, 프로세서(110)는 행위자 활동 정보를 기반으로 범죄 행위자 프로파일 정보를 업데이트할 수 있다.9 and 10 , the processor 110 may update criminal actor profile information based on the actor activity information.

보다 자세히 설명하면, 프로세서(110)는 도 9에 도시된 바와 같이, 범죄 행위자 프로파일 정보에 포함된 범죄 행위자 프로파일 각각에 대하여, 범죄 행위자 프로파일에 대응되는 사용자 식별 정보(즉, 최상위 속성 정보로 지정된 속성 정보)를 기반으로 행위자 활동 정보에서 해당 범죄 행위자 프로파일에 대응되는 활동 내역 정보를 획득하고, 활동 내역 정보를 기반으로 해당 범죄 행위자 프로파일을 업데이트할 수 있다.More specifically, as shown in FIG. 9 , for each of the criminal actor profiles included in the criminal actor profile information, the processor 110 generates user identification information corresponding to the criminal actor profile (that is, the attribute designated as the highest attribute information). information) may acquire activity history information corresponding to the criminal actor profile from the actor activity information, and update the criminal actor profile based on the activity history information.

이때, 프로세서(110)는 도 10에 도시된 바와 같이, 활동 내역 정보를 기반으로 범죄 행위자 프로파일 정보의 기준 속성 정보별로 서브 활동 내역 정보를 획득하고, 서브 활동 내역 정보를 기반으로 서브 활동 내역 정보에 대응되는 속성 정보에 서브 활동 내역 정보를 추가하여 해당 범죄 행위자 프로파일을 업데이트할 수 있다.At this time, as shown in FIG. 10 , the processor 110 obtains sub-activity history information for each reference attribute information of the criminal actor profile information based on the activity history information, and adds the sub-activity history information to the sub-activity history information based on the sub-activity history information. By adding sub-activity history information to the corresponding attribute information, the corresponding criminal actor profile can be updated.

즉, 서브 활동 내역 정보에 대응되는 속성 정보가 해당 범죄 행위자 프로파일에 존재하면, 프로세서(110)는 해당 범죄 행위자 프로파일의 속성 정보의 값으로 서브 활동 내역 정보를 추가할 수 있다. 예컨대, 기준 속성 정보가 "아이디" 속성 정보, "범죄 은어" 속성 정보, "도메인(domain)" 속성 정보 및 "관련 사용자 식별 정보" 속성 정보로 이루어지고, 해당 범죄 행위자 프로파일이 "아이디" 속성 정보, "범죄 은어" 속성 정보 및 "관련 사용자 식별 정보" 속성 정보로 이루어진 경우, 서브 활동 내역 정보에 대응되는 속성 정보가 "범죄 은어" 속성 정보이면, 프로세서(110)는 해당 범죄 행위자 프로파일의 "범죄 은어" 속성 정보의 값으로 해당 서브 활동 내역 정보를 추가할 수 있다.That is, if the attribute information corresponding to the sub-activity history information exists in the criminal actor profile, the processor 110 may add the sub-activity history information as a value of the attribute information of the criminal actor profile. For example, the reference attribute information consists of "ID" attribute information, "criminal slang" attribute information, "domain" attribute information, and "related user identification information" attribute information, and the corresponding criminal actor profile is "ID" attribute information , "criminal slang" attribute information and "related user identification information" attribute information, if the attribute information corresponding to the sub-activity history information is "criminal slang" attribute information, the processor 110 is the "criminal You can add the corresponding sub-activity history information as the value of the "slang" attribute information.

반면, 서브 활동 내역 정보에 대응되는 속성 정보가 해당 범죄 행위자 프로파일에 존재하지 않으면, 프로세서(110)는 범죄 행위자 프로파일 정보의 속성 연결 정보를 기반으로 속성 정보를 해당 범죄 행위자 프로파일에 추가하고, 추가한 속성 정보의 값으로 서브 활동 내역 정보를 추가할 수 있다. 예컨대, 기준 속성 정보가 "아이디" 속성 정보, "범죄 은어" 속성 정보, "도메인(domain)" 속성 정보 및 "관련 사용자 식별 정보" 속성 정보로 이루어지고, 해당 범죄 행위자 프로파일이 "아이디" 속성 정보, "범죄 은어" 속성 정보 및 "관련 사용자 식별 정보" 속성 정보로 이루어진 경우, 서브 활동 내역 정보에 대응되는 속성 정보가 "도메인(domain)" 속성 정보이면, 프로세서(110)는 범죄 행위자 프로파일 정보의 속성 연결 정보를 기반으로 "도메인(domain)" 속성 정보를 해당 범죄 행위자 프로파일에 추가하고, 추가한 "도메인(domain)" 속성 정보의 값으로 해당 서브 활동 내역 정보를 추가할 수 있다.On the other hand, if the attribute information corresponding to the sub-activity history information does not exist in the criminal actor profile, the processor 110 adds attribute information to the criminal actor profile based on the attribute connection information of the criminal actor profile information, Sub activity history information can be added as a value of attribute information. For example, the reference attribute information consists of "ID" attribute information, "criminal slang" attribute information, "domain" attribute information, and "related user identification information" attribute information, and the corresponding criminal actor profile is "ID" attribute information , "criminal slang" attribute information and "related user identification information" attribute information, if the attribute information corresponding to the sub-activity history information is "domain" attribute information, the processor 110 of the criminal actor profile information Based on the attribute connection information, "domain" attribute information may be added to the corresponding criminal actor profile, and corresponding sub-activity information may be added as a value of the added "domain" attribute information.

범죄 유형별 그룹 프로파일 정보 획득 단계Stages of obtaining group profile information by crime type

도 11은 도 2에 도시한 범죄 유형별 그룹 프로파일 정보 획득 단계를 설명하기 위한 도면이고, 도 12는 도 11에 도시한 범죄 행위자 프로파일 간의 유사도 획득 동작을 설명하기 위한 도면이다.FIG. 11 is a diagram for explaining a step of acquiring group profile information for each crime type shown in FIG. 2 , and FIG. 12 is a diagram for explaining an operation for acquiring similarity between criminal actor profiles shown in FIG. 11 .

도 11 및 도 12를 참조하면, 프로세서(110)는 범죄 행위자 프로파일 정보를 기반으로 범죄 유형별 그룹 프로파일 정보를 획득할 수 있다.11 and 12 , the processor 110 may acquire group profile information for each crime type based on the criminal actor profile information.

보다 자세히 설명하면, 프로세서(110)는 도 11에 도시된 바와 같이, 범죄 행위자 프로파일 정보에 포함된 범죄 행위자 프로파일 간의 유사도를 기반으로 범죄 행위자 프로파일을 그룹화하여, 범죄 행위자 프로파일이 범죄 유형별로 그룹화된 복수개의 그룹 프로파일 정보를 포함하는 범죄 유형별 프로파일 정보를 획득할 수 있다.More specifically, as shown in FIG. 11 , the processor 110 groups the criminal actor profiles based on the similarity between the criminal actor profiles included in the criminal actor profile information, so that the criminal actor profiles are grouped by crime type. It is possible to obtain profile information for each crime type including group profile information of dogs.

이때, 프로세서(110)는 범죄 행위자 프로파일 간의 뎁스(depth)별 유사도를 기반으로 범죄 행위자 프로파일을 그룹화할 수 있다.In this case, the processor 110 may group the criminal actor profiles based on the similarity for each depth between the criminal actor profiles.

즉, 프로세서(110)는 범죄 행위자 프로파일 간의 미리 설정된 뎁스(depth)의 유사도가 미리 설정된 기준값보다 크면, 범죄 행위자 프로파일을 동일한 그룹으로 그룹화할 수 있다. 예컨대, 도 12에 도시된 "범죄 행위자 프로파일 A"와 "범죄 행위자 프로파일 B" 간의 유사도를 획득하는 경우, 프로세서(110)는 미리 설정된 뎁스(depth)인 "Depth 2"에 대응되는 속성 정보인 "노드 2"를 기준으로 아래의 [수학식 1]을 통해 유사도를 계산하고, 계산한 유사도가 미리 설정된 기준값(예컨대, 70% 등)보다 크거나 같으면 "범죄 행위자 프로파일 A"와 "범죄 행위자 프로파일 B"를 동일한 그룹으로 그룹화하고, 계산한 유사도가 미리 설정된 기준값(예컨대, 70% 등)보다 작으면 "범죄 행위자 프로파일 A"와 "범죄 행위자 프로파일 B"를 동일한 그룹으로 그룹화하지 않을 수 있다.That is, when the similarity of a preset depth between criminal actor profiles is greater than a preset reference value, the processor 110 may group the criminal actor profiles into the same group. For example, when obtaining the similarity between the "criminal actor profile A" and the "criminal actor profile B" shown in FIG. 12, the processor 110 determines the attribute information corresponding to "Depth 2," which is a preset depth. Based on Node 2, the similarity is calculated through [Equation 1] below, and if the calculated similarity is greater than or equal to a preset reference value (eg, 70%, etc.), “Criminal Actor Profile A” and “Criminal Actor Profile B” " is grouped into the same group, and if the calculated similarity is less than a preset reference value (eg, 70%, etc.), "criminal actor profile A" and "criminal actor profile B" may not be grouped into the same group.

Figure 112021144824505-pat00001
Figure 112021144824505-pat00001

여기서, Sn,A,B는 범죄 행위자 프로파일 A와 범죄 행위자 프로파일 B 간의 뎁스(depth) n에서의 유사도를 나타낸다. Vn,A는 범죄 행위자 프로파일 A의 뎁스(depth) n에서의 속성 정보의 값의 개수를 나타낸다. Vn,B는 범죄 행위자 프로파일 B의 뎁스(depth) n에서의 속성 정보의 값의 개수를 나타낸다. DVn,A,B는 뎁스(depth) n에서 범죄 행위자 프로파일 A와 범죄 행위자 프로파일 B 간에 중복되는 속성 정보의 값의 개수를 나타낸다.Here, S n, A, B represents the similarity in depth n between the criminal actor profile A and the criminal actor profile B. V n, A represents the number of values of attribute information in the depth n of the criminal actor profile A. V n,B represents the number of values of attribute information in the depth n of the criminal actor profile B. DV n, A, B represents the number of overlapping attribute information values between the criminal actor profile A and the criminal actor profile B at a depth n.

물론, 프로세서(110)는 뎁스(depth)별로 범죄 행위자 프로파일 간의 뎁스(depth) 유사도를 획득하고, 뎁스(depth)별로 획득한 뎁스 유사도를 기반으로 범죄 행위자 프로파일 간의 전체 유사도를 획득하며, 전체 유사도와 미리 설정된 기준값을 기반으로 동일한 그룹으로 그룹화할 수 있다. 예컨대, 프로세서(110)는 뎁스(depth)별로 획득한 뎁스 유사도를 기반으로 평균, 가중합 등의 방법을 통해 전체 유사도를 획득할 수 있다.Of course, the processor 110 obtains a depth similarity between criminal actor profiles for each depth, and acquires an overall similarity between criminal actor profiles based on the depth similarity acquired for each depth, and the overall similarity and It can be grouped into the same group based on a preset reference value. For example, the processor 110 may acquire the overall similarity through a method such as averaging and weighted summing based on the depth similarity acquired for each depth.

또한, 프로세서(110)는 범죄 행위자 프로파일 정보의 기준 속성 정보 중에서 미리 설정된 유사도 판단 속성 정보를 기반으로 범죄 행위자 프로파일 간의 유사도를 획득할 수 있다. 예컨대, 기준 속성 정보가 "아이디" 속성 정보, "범죄 은어" 속성 정보, "도메인(domain)" 속성 정보 및 "관련 사용자 식별 정보" 속성 정보로 이루어지고, 유사도 판단 속성 정보가 "범죄 은어" 속성 정보로 설정된 경우, 프로세서(110)는 "범죄 은어" 속성 정보에 대응되는 뎁스의 유사도를 기반으로 범죄 행위자 프로파일을 그룹화할 수 있다.Also, the processor 110 may acquire the similarity between criminal actor profiles based on preset similarity determination attribute information among reference attribute information of the criminal actor profile information. For example, the reference attribute information includes "ID" attribute information, "criminal slang" attribute information, "domain" attribute information, and "related user identification information" attribute information, and the similarity determination attribute information is a "criminal slang" attribute When set to information, the processor 110 may group criminal actor profiles based on a similarity of depth corresponding to "criminal slang" attribute information.

또한, 프로세서(110)는 범죄 행위자 프로파일 중에서 범죄 유형별로 미리 지정된 대표 범죄 행위자 프로파일을 기반으로 범죄 유형별로 범죄 행위자 프로파일을 그룹화할 수 있다. 예컨대, "성범죄 그룹"에는 "범죄 행위자 프로파일 B"가 대표 범죄 행위자 프로파일로 지정된 경우, 프로세서(110)는 "범죄 행위자 프로파일 B"를 "성범죄 그룹"의 중심 프로파일로 하여, 범죄 행위자 프로파일들과 "범죄 행위자 프로파일 B" 간의 유사도를 기반으로 "성범죄 그룹"으로 분류될 범죄 행위자 프로파일을 획득하여, "성범죄 그룹"에 대한 그룹 프로파일 정보를 획득할 수 있다.In addition, the processor 110 may group the criminal actor profiles by crime type based on the representative criminal actor profile previously designated for each crime type among the criminal actor profiles. For example, if "criminal actor profile B" is designated as a representative criminal actor profile in "sex crime group", the processor 110 uses "criminal actor profile B" as the central profile of "sex crime group", and " By acquiring a criminal actor profile to be classified as a “sex crime group” based on the similarity between the “criminal actor profiles B”, group profile information for the “sex crime group” may be acquired.

본 실시예들에 따른 동작은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능한 저장 매체에 기록될 수 있다. 컴퓨터 판독 가능한 저장 매체는 실행을 위해 프로세서에 명령어를 제공하는데 참여한 임의의 매체를 나타낸다. 컴퓨터 판독 가능한 저장 매체는 프로그램 명령, 데이터 파일, 데이터 구조 또는 이들의 조합을 포함할 수 있다. 예컨대, 자기 매체, 광기록 매체, 메모리 등이 있을 수 있다. 컴퓨터 프로그램은 네트워크로 연결된 컴퓨터 시스템 상에 분산되어 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 본 실시예를 구현하기 위한 기능적인(Functional) 프로그램, 코드, 및 코드 세그먼트들은 본 실시예가 속하는 기술 분야의 프로그래머들에 의해 용이하게 추론될 수 있을 것이다.Operations according to the present embodiments may be implemented in the form of program instructions that may be executed through various computer means and recorded in a computer-readable storage medium. Computer-readable storage media represents any medium that participates in providing instructions to a processor for execution. A computer-readable storage medium may include program instructions, data files, data structures, or a combination thereof. For example, there may be a magnetic medium, an optical recording medium, a memory, and the like. A computer program may be distributed over a networked computer system so that computer readable code is stored and executed in a distributed manner. Functional programs, codes, and code segments for implementing the present embodiment may be easily inferred by programmers in the technical field to which the present embodiment belongs.

본 실시예들은 본 실시예의 기술 사상을 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The present embodiments are for explaining the technical idea of the present embodiment, and the scope of the technical idea of the present embodiment is not limited by these embodiments. The protection scope of this embodiment should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be interpreted as being included in the scope of the present embodiment.

100 : 범죄 행위자 프로파일링 장치,
110 : 프로세서,
130 : 컴퓨터 판독 가능한 저장 매체,
131 : 프로그램,
150 : 통신 버스,
170 : 입출력 인터페이스,
190 : 통신 인터페이스
100: criminal offender profiling device;
110: processor;
130: computer-readable storage medium;
131: program;
150: communication bus;
170: input/output interface;
190: communication interface

Claims (21)

미리 설정된 범죄 은어를 기반으로 검색 엔진을 통해 검색 데이터들을 수집하는 단계;
상기 검색 데이터에 대응되는 텍스트 데이터를 기반으로 범죄 행위자 프로파일(profile) 정보의 기준 속성 정보를 이용하여 상기 텍스트 데이터에서 추출 대상 정보를 추출하고, 상기 추출 대상 정보를 포함하는 행위자 활동 정보를 획득하여, 상기 검색 데이터들을 기반으로 상기 검색 데이터 각각에 대응되는 상기 행위자 활동 정보를 획득하는 단계;
상기 검색 데이터 각각에 대응되는 상기 행위자 활동 정보를 기반으로 상기 범죄 행위자 프로파일 정보를 업데이트하는 단계; 및
상기 범죄 행위자 프로파일 정보를 기반으로 범죄 유형별로 미리 지정된 대표 범죄 행위자 프로파일을 이용하여 범죄 유형별 그룹 프로파일 정보를 획득하는 단계;
를 포함하며,
상기 범죄 행위자 프로파일 정보는, 사용자 식별 정보를 최상위 속성 정보로 하여, 상기 최상위 속성 정보와 계층적으로 연결된 복수개의 하위 속성 정보를 포함하는 범죄 행위자 프로파일로 이루어지고,
상기 범죄 행위자 프로파일 정보 업데이트 단계는, 상기 범죄 행위자 프로파일 정보에 포함된 상기 범죄 행위자 프로파일 각각에 대하여, 상기 범죄 행위자 프로파일에 대응되는 상기 사용자 식별 정보를 기반으로 상기 행위자 활동 정보에서 상기 범죄 행위자 프로파일에 대응되는 활동 내역 정보를 획득하고, 상기 활동 내역 정보를 기반으로 상기 범죄 행위자 프로파일 정보의 기준 속성 정보별로 서브 활동 내역 정보를 획득하며, 상기 서브 활동 내역 정보를 기반으로 상기 서브 활동 내역 정보에 대응되는 속성 정보에 상기 서브 활동 내역 정보를 추가하여 상기 범죄 행위자 프로파일을 업데이트하는 것으로 이루어지는,
범죄 행위자 프로파일링 방법.
collecting search data through a search engine based on a preset crime slang;
Extracting target information from the text data using reference attribute information of criminal actor profile information based on text data corresponding to the search data, and obtaining actor activity information including the extraction target information, obtaining the actor activity information corresponding to each of the search data based on the search data;
updating the criminal actor profile information based on the actor activity information corresponding to each of the search data; and
obtaining group profile information for each crime type by using a pre-designated representative criminal actor profile for each crime type based on the criminal actor profile information;
includes,
The criminal actor profile information consists of a criminal actor profile including a plurality of sub-attribute information hierarchically linked to the highest-level attribute information, using user identification information as top-level attribute information,
In the step of updating the criminal actor profile information, for each of the criminal actor profiles included in the criminal actor profile information, based on the user identification information corresponding to the criminal actor profile, the criminal activity information corresponds to the criminal actor profile Attribute corresponding to the sub-activity history information based on the activity history information being Comprising of updating the criminal actor profile by adding the sub-activity history information to information,
A method of profiling criminals.
삭제delete 삭제delete 제1항에서,
상기 행위자 활동 정보 획득 단계는,
상기 검색 데이터의 본문 내용에서 추출한 텍스트 및 상기 본문 내용의 식별 정보를 포함하는 상기 텍스트 데이터를 획득하는 것으로 이루어지는,
범죄 행위자 프로파일링 방법.
In claim 1,
The step of obtaining the activity information of the actor,
Consists of obtaining the text data including the text extracted from the text content of the search data and identification information of the text content,
A method of profiling criminals.
제4항에서,
상기 행위자 활동 정보 획득 단계는,
상기 검색 데이터에 이미지가 포함된 경우, 상기 이미지에서 텍스트를 추출하고, 상기 본문 내용에서 추출한 텍스트, 상기 이미지에서 추출한 텍스트 및 상기 본문 내용의 식별 정보를 포함하는 상기 텍스트 데이터를 획득하는 것으로 이루어지는,
범죄 행위자 프로파일링 방법.
In claim 4,
The step of obtaining the activity information of the actor,
When an image is included in the search data, extracting text from the image, and obtaining the text data including the text extracted from the text content, the text extracted from the image, and identification information of the text content,
A method of profiling criminals.
제5항에서,
상기 행위자 활동 정보 획득 단계는,
상기 텍스트 데이터에서 상기 추출 대상 정보를 획득하고, 상기 추출 대상 정보 및 상기 본문 내용의 식별 정보를 포함하는 상기 행위자 활동 정보를 획득하는 것으로 이루어지는,
범죄 행위자 프로파일링 방법.
In claim 5,
The step of obtaining the activity information of the actor,
Obtaining the extraction target information from the text data, and acquiring the actor activity information including the extraction target information and identification information of the text content,
A method of profiling criminals.
삭제delete 삭제delete 삭제delete 제1항에서,
상기 범죄 행위자 프로파일 정보 업데이트 단계는,
상기 서브 활동 내역 정보에 대응되는 속성 정보가 상기 범죄 행위자 프로파일에 존재하면, 상기 범죄 행위자 프로파일의 속성 정보의 값으로 상기 서브 활동 내역 정보를 추가하고,
상기 서브 활동 내역 정보에 대응되는 속성 정보가 상기 범죄 행위자 프로파일에 존재하지 않으면, 상기 범죄 행위자 프로파일 정보의 속성 연결 정보를 기반으로 속성 정보를 상기 범죄 행위자 프로파일에 추가하고, 추가한 속성 정보의 값으로 상기 서브 활동 내역 정보를 추가하는 것으로 이루어지는,
범죄 행위자 프로파일링 방법.
In claim 1,
The criminal actor profile information update step,
If the attribute information corresponding to the sub-activity history information exists in the criminal actor profile, adding the sub-activity history information as a value of the attribute information of the criminal actor profile,
If the attribute information corresponding to the sub-activity history information does not exist in the criminal actor profile, the attribute information is added to the criminal actor profile based on the attribute connection information of the criminal actor profile information, and as the value of the added attribute information Consists of adding the sub-activity history information,
A method of profiling criminals.
삭제delete 제1항에서,
상기 범죄 유형별 그룹 프로파일 정보 획득 단계는,
상기 범죄 행위자 프로파일 정보에 포함된 상기 범죄 행위자 프로파일 간의 유사도를 기반으로 상기 범죄 행위자 프로파일을 그룹화하여, 상기 범죄 유형별 그룹 프로파일 정보를 획득하는 것으로 이루어지는,
범죄 행위자 프로파일링 방법.
In claim 1,
The step of obtaining group profile information for each type of crime includes:
By grouping the criminal actor profiles based on the degree of similarity between the criminal actor profiles included in the criminal actor profile information, the group profile information for each type of crime is obtained.
A method of profiling criminals.
제12항에서,
상기 범죄 유형별 그룹 프로파일 정보 획득 단계는,
상기 범죄 행위자 프로파일 간의 뎁스(depth)별 유사도를 기반으로 상기 범죄 행위자 프로파일을 그룹화하는 것으로 이루어지는,
범죄 행위자 프로파일링 방법.
In claim 12,
The step of obtaining group profile information for each type of crime includes:
Consisting of grouping the criminal actor profiles based on the similarity for each depth between the criminal actor profiles,
A method of profiling criminals.
제13항에서,
상기 범죄 유형별 그룹 프로파일 정보 획득 단계는,
상기 범죄 행위자 프로파일 간의 미리 설정된 뎁스(depth)의 유사도가 미리 설정된 기준값보다 크면, 상기 범죄 행위자 프로파일을 동일한 그룹으로 그룹화하는 것으로 이루어지는,
범죄 행위자 프로파일링 방법.
In claim 13,
The step of obtaining group profile information for each type of crime includes:
If the degree of similarity of a preset depth between the criminal actor profiles is greater than a preset reference value, it consists of grouping the criminal actor profiles into the same group,
A method of profiling criminals.
제12항에서,
상기 범죄 유형별 그룹 프로파일 정보 획득 단계는,
상기 범죄 행위자 프로파일 정보의 기준 속성 정보 중에서 미리 설정된 유사도 판단 속성 정보를 기반으로 상기 범죄 행위자 프로파일 간의 유사도를 획득하는 것으로 이루어지는,
범죄 행위자 프로파일링 방법.
In claim 12,
The step of obtaining group profile information for each type of crime includes:
Comprising of obtaining the similarity between the criminal actor profiles based on preset similarity determination attribute information among the reference attribute information of the criminal actor profile information,
A method of profiling criminals.
제1항, 제4항 내지 제6항, 제10항, 제12항 내지 제15항 중 어느 한 항에 기재된 범죄 행위자 프로파일링 방법을 컴퓨터에서 실행시키기 위하여 컴퓨터 판독 가능한 저장 매체에 저장된 컴퓨터 프로그램.A computer program stored in a computer-readable storage medium for executing the criminal offender profiling method according to any one of claims 1, 4 to 6, 10, 12 to 15 on a computer. 범죄 행위자를 프로파일링하는 장치로서,
범죄 행위자를 프로파일링하기 위한 하나 이상의 프로그램을 저장하는 메모리; 및
상기 메모리에 저장된 상기 하나 이상의 프로그램에 따라 범죄 행위자를 프로파일링하기 위한 동작을 수행하는 하나 이상의 프로세서;
를 포함하며,
상기 프로세서는,
미리 설정된 범죄 은어를 기반으로 검색 엔진을 통해 검색 데이터들을 수집하고,
상기 검색 데이터에 대응되는 텍스트 데이터를 기반으로 범죄 행위자 프로파일(profile) 정보의 기준 속성 정보를 이용하여 상기 텍스트 데이터에서 추출 대상 정보를 추출하고, 상기 추출 대상 정보를 포함하는 행위자 활동 정보를 획득하여, 상기 검색 데이터들을 기반으로 상기 검색 데이터 각각에 대응되는 상기 행위자 활동 정보를 획득하며,
상기 검색 데이터 각각에 대응되는 상기 행위자 활동 정보를 기반으로 상기 범죄 행위자 프로파일 정보를 업데이트하고,
상기 범죄 행위자 프로파일 정보를 기반으로 범죄 유형별로 미리 지정된 대표 범죄 행위자 프로파일을 이용하여 범죄 유형별 그룹 프로파일 정보를 획득하며,
상기 범죄 행위자 프로파일 정보는, 사용자 식별 정보를 최상위 속성 정보로 하여, 상기 최상위 속성 정보와 계층적으로 연결된 복수개의 하위 속성 정보를 포함하는 범죄 행위자 프로파일로 이루어지고,
상기 프로세서는, 상기 범죄 행위자 프로파일 정보에 포함된 상기 범죄 행위자 프로파일 각각에 대하여, 상기 범죄 행위자 프로파일에 대응되는 상기 사용자 식별 정보를 기반으로 상기 행위자 활동 정보에서 상기 범죄 행위자 프로파일에 대응되는 활동 내역 정보를 획득하고, 상기 활동 내역 정보를 기반으로 상기 범죄 행위자 프로파일 정보의 기준 속성 정보별로 서브 활동 내역 정보를 획득하며, 상기 서브 활동 내역 정보를 기반으로 상기 서브 활동 내역 정보에 대응되는 속성 정보에 상기 서브 활동 내역 정보를 추가하여 상기 범죄 행위자 프로파일을 업데이트하는,
범죄 행위자 프로파일링 장치.
A device for profiling criminal actors, comprising:
a memory storing one or more programs for profiling criminal actors; and
one or more processors to perform an operation for profiling a criminal actor according to the one or more programs stored in the memory;
includes,
The processor is
Based on preset crime slang, search data is collected through a search engine,
Extracting target information from the text data using reference attribute information of criminal actor profile information based on text data corresponding to the search data, and obtaining actor activity information including the extraction target information, Obtaining the actor activity information corresponding to each of the search data based on the search data,
Update the criminal actor profile information based on the actor activity information corresponding to each of the search data,
Based on the criminal actor profile information, by using a representative criminal actor profile designated in advance for each type of crime, group profile information for each type of crime is obtained,
The criminal actor profile information consists of a criminal actor profile including a plurality of sub-attribute information hierarchically linked to the highest-level attribute information, using user identification information as top-level attribute information,
The processor, for each of the criminal actor profiles included in the criminal actor profile information, based on the user identification information corresponding to the criminal actor profile, activity history information corresponding to the criminal actor profile in the actor activity information obtain, based on the activity history information, obtain sub-activity history information for each reference attribute information of the criminal actor profile information, and add the sub-activity to attribute information corresponding to the sub-activity history information based on the sub-activity history information updating the criminal offender profile by adding historical information;
Criminal profiling device.
삭제delete 삭제delete 삭제delete 제17항에서,
상기 프로세서는,
상기 범죄 행위자 프로파일 정보에 포함된 상기 범죄 행위자 프로파일 간의 유사도를 기반으로 상기 범죄 행위자 프로파일을 그룹화하여, 상기 범죄 유형별 그룹 프로파일 정보를 획득하는,
범죄 행위자 프로파일링 장치.
In claim 17,
The processor is
grouping the criminal actor profiles based on the degree of similarity between the criminal actor profiles included in the criminal actor profile information to obtain the group profile information for each type of crime,
Criminal profiling device.
KR1020210178734A 2021-12-14 2021-12-14 Method for profiling criminal offender, apparatus and computer program for performing the method KR102396388B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210178734A KR102396388B1 (en) 2021-12-14 2021-12-14 Method for profiling criminal offender, apparatus and computer program for performing the method
PCT/KR2022/013898 WO2023113158A1 (en) 2021-12-14 2022-09-16 Criminal profiling method, device performing same, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210178734A KR102396388B1 (en) 2021-12-14 2021-12-14 Method for profiling criminal offender, apparatus and computer program for performing the method

Publications (1)

Publication Number Publication Date
KR102396388B1 true KR102396388B1 (en) 2022-05-10

Family

ID=81591406

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210178734A KR102396388B1 (en) 2021-12-14 2021-12-14 Method for profiling criminal offender, apparatus and computer program for performing the method

Country Status (2)

Country Link
KR (1) KR102396388B1 (en)
WO (1) WO2023113158A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023113158A1 (en) * 2021-12-14 2023-06-22 한국인터넷진흥원 Criminal profiling method, device performing same, and computer program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160001994A (en) * 2014-06-30 2016-01-07 김왕철 Server and method for managing crime using big data
KR101852107B1 (en) * 2017-11-22 2018-04-25 (주)유니스소프트 System and Method for analyzing criminal information in dark web
US20210360018A1 (en) * 2020-05-13 2021-11-18 ThreatNG Security Inc Holistic assessment, monitoring, and management of digital presence

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL216059A (en) * 2011-10-31 2016-11-30 Verint Systems Ltd System and method for target profiling using social network analysis
US11570188B2 (en) * 2015-12-28 2023-01-31 Sixgill Ltd. Dark web monitoring, analysis and alert system and method
KR102396388B1 (en) * 2021-12-14 2022-05-10 한국인터넷진흥원 Method for profiling criminal offender, apparatus and computer program for performing the method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160001994A (en) * 2014-06-30 2016-01-07 김왕철 Server and method for managing crime using big data
KR101852107B1 (en) * 2017-11-22 2018-04-25 (주)유니스소프트 System and Method for analyzing criminal information in dark web
US20210360018A1 (en) * 2020-05-13 2021-11-18 ThreatNG Security Inc Holistic assessment, monitoring, and management of digital presence

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023113158A1 (en) * 2021-12-14 2023-06-22 한국인터넷진흥원 Criminal profiling method, device performing same, and computer program

Also Published As

Publication number Publication date
WO2023113158A1 (en) 2023-06-22

Similar Documents

Publication Publication Date Title
CN111355697B (en) Detection method, device, equipment and storage medium for botnet domain name family
US9390176B2 (en) System and method for recursively traversing the internet and other sources to identify, gather, curate, adjudicate, and qualify business identity and related data
CN111417954B (en) Data de-identification based on detection of allowable configurations of data de-identification process
JP2015512095A (en) Method, apparatus and computer readable recording medium for image management in an image database
TW202020691A (en) Feature word determination method and device and server
US20110246441A1 (en) Constructing a domain-specific ontology by mining the web
CN109241223B (en) Behavior track identification method and system
CN103823879A (en) Method and system for automatically updating knowledge base oriented to online encyclopedia
CN109543410B (en) Malicious code detection method based on semantic mapping association
US20180189416A1 (en) Method and apparatus for visualizing relations between incident resources
KR102396388B1 (en) Method for profiling criminal offender, apparatus and computer program for performing the method
CN114637892A (en) Overview map generation method of system log dependency map for attack investigation and recovery
US20140250140A1 (en) Method and system for performing searches of graphs as represented within an information technology system
CN104392171A (en) Automatic memory evidence analyzing method based on data association
CN103679034A (en) Computer virus analyzing system based on body and virus feature extraction method
CN111597422A (en) Buried point mapping method and device, computer equipment and storage medium
CN111177481A (en) User identifier mapping method and device
CN109992960B (en) Counterfeit parameter detection method and device, electronic equipment and storage medium
CN112131259A (en) Similar malware recommendation method, device, medium and equipment
Velampalli et al. Discovering suspicious patterns using a graph based approach
CN115567305A (en) Sequential network attack prediction analysis method based on deep learning
CN112800286B (en) User relationship chain construction method and device and electronic equipment
Shaikh Web Usage Mining Using Apriori and FP Growth Alogrithm
CN105718801A (en) Loophole clustering method based on programming mode and mode matching
KR20110035582A (en) Structure of rule-base expert system for privacy violation certainty estimation

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant