KR20230038088A - Method for de-identifying personally identifiable information contained in video data, and device performing the same - Google Patents

Method for de-identifying personally identifiable information contained in video data, and device performing the same Download PDF

Info

Publication number
KR20230038088A
KR20230038088A KR1020220096384A KR20220096384A KR20230038088A KR 20230038088 A KR20230038088 A KR 20230038088A KR 1020220096384 A KR1020220096384 A KR 1020220096384A KR 20220096384 A KR20220096384 A KR 20220096384A KR 20230038088 A KR20230038088 A KR 20230038088A
Authority
KR
South Korea
Prior art keywords
image
identification model
virtual
generating
identification
Prior art date
Application number
KR1020220096384A
Other languages
Korean (ko)
Inventor
김진아
장성수
Original Assignee
주식회사 스마트랩스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 스마트랩스 filed Critical 주식회사 스마트랩스
Publication of KR20230038088A publication Critical patent/KR20230038088A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • G06T5/004
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Traffic Control Systems (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

A method for de-identifying personally identifiable information contained in video data, and a device performing the same are disclosed. A method for de-identifying personally identifiable information according to various embodiments may include: an operation of acquiring a first image by detecting one or more objects from original media; an operation of generating a second image in which only personally identifiable information of the first image is de-identified.

Description

영상 데이터에 포함된 개인식별정보 비식별화 방법 및 이를 수행하는 장치{METHOD FOR DE-IDENTIFYING PERSONALLY IDENTIFIABLE INFORMATION CONTAINED IN VIDEO DATA, AND DEVICE PERFORMING THE SAME}Method for de-identifying personal identification information included in video data and device for performing the same

본 발명의 다양한 실시예들은 영상 데이터에 포함된 개인식별정보 비식별화 방법 및 이를 수행하는 장치에 관한 것이다.Various embodiments of the present invention relate to a method for de-identifying personal identification information included in image data and an apparatus for performing the same.

인공지능 기술의 발달로 CNN 기반의 영상 처리 기술이 발전함에 따라 영상 데이터를 활용한 다양한 서비스 개발과 연구가 활발히 진행되고 있다. 영상 처리에 인공지능 기술을 활용하기 위해서는 학습 도메인에 맞는 많은 영상 데이터 수집이 필요하다. 하지만, 수집한 영상 데이터 속에는 의도하지 않은 다양한 개인식별정보(예: 얼굴, 신체, 이름, 차량 번호판 등)가 포함될 수 있으며, 이를 비식별화 하는 과정 또한 필수적이다.As CNN-based image processing technology develops with the development of artificial intelligence technology, various service development and research using image data are being actively conducted. In order to use artificial intelligence technology in image processing, it is necessary to collect a lot of image data suitable for the learning domain. However, the collected video data may contain unintended personal identification information (e.g., face, body, name, vehicle license plate, etc.), and the process of de-identification is also essential.

위에서 설명한 배경기술은 발명자가 본원의 개시 내용을 도출하는 과정에서 보유하거나 습득한 것으로서, 반드시 본 출원 전에 일반 공중에 공개된 공지기술이라고 할 수는 없다.The background art described above is possessed or acquired by the inventor in the process of deriving the disclosure of the present application, and cannot necessarily be said to be known art disclosed to the general public prior to the present application.

영상 속 개인식별정보를 비식별화하기 위해 blurring이나 blocking 방식을 사용할 경우 영상 속 객체의 특징이 유실되어 학습 데이터의 가치를 상실하게 될 수 있다. 예를 들어, 자율주행을 위한 주행학습 데이터를 수집할 때 보행자 영역을 blurring 방식으로 비식별화 하면 보행자라는 객체의 특징이 유실되어 학습에 사용할 수 없게 된다. 이에, 영상 데이터에 포함된 개인식별정보에 대해 blurring이나 blocking 방식이 아닌 다른 형태의 변형을 통해 학습 가능한 형태의 비식별화를 수행하는 자동화된 기술이 요구될 수 있다.If blurring or blocking methods are used to de-identify the personally identifiable information in the video, the characteristics of the object in the video may be lost and the value of the learning data may be lost. For example, when collecting driving learning data for autonomous driving, if the pedestrian area is de-identified using a blurring method, the feature of the object called a pedestrian is lost and cannot be used for learning. Accordingly, an automated technology that performs de-identification in a form that can be learned through a transformation other than a blurring or blocking method for personal identification information included in image data may be required.

다양한 실시예들은 영상 속 개인식별정보에 대응되는 가상 이미지의 합성을 통해 개인식별정보를 학습이 가능한 형태로 비식별화하는 기술을 제공할 수 있다.Various embodiments may provide a technology for de-identifying personal identification information in a form capable of learning through synthesis of virtual images corresponding to personal identification information in a video.

다만, 기술적 과제는 상술한 기술적 과제들로 한정되는 것은 아니며, 또 다른 기술적 과제들이 존재할 수 있다.However, the technical challenges are not limited to the above-described technical challenges, and other technical challenges may exist.

다양한 실시예에 따른 개인식별정보를 비식별화하는 비식별화 모델 생성 방법은 제1 학습 데이터에서 하나 이상의 객체를 분할한 제2 학습 데이터를 생성하는 동작과, 상기 제1 학습 데이터 및 상기 제2 학습 데이터에 기초하여 비식별화 모델을 생성하는 동작을 포함할 수 있다.A de-identification model generation method for de-identifying personal identification information according to various embodiments includes generating second learning data obtained by dividing one or more objects from first training data, and the first training data and the second training data. An operation of generating a de-identification model based on the training data may be included.

상기 비식별화 모델을 생성하는 동작은 상기 제1 학습 데이터 및 상기 제2 학습 데이터를 상기 비식별화 모델에 포함된 분할 모델에 입력시켜 상기 분할 모델을 학습시키는 동작을 포함할 수 있다.Generating the de-identification model may include inputting the first training data and the second training data to a segmentation model included in the de-identification model to learn the segmentation model.

상기 비식별화 모델을 생성하는 동작은 상기 분할 모델의 출력인 가상 영상 생성 학습 데이터 중 가상 얼굴 및 신체 생성 학습 데이터를 상기 비식별화 모델에 포함된 제1 비식별화 모델에 입력시켜 상기 제1 비식별화 모델을 학습시키는 동작을 더 포함할 수 있다.The operation of generating the de-identification model may include inputting virtual face and body generation learning data among virtual image generation learning data, which are outputs of the segmentation model, to a first de-identification model included in the de-identification model to generate the first de-identification model. An operation of learning a de-identification model may be further included.

상기 비식별화 모델을 생성하는 동작은 상기 분할 모델의 출력인 가상 영상 생성 학습 데이터 중 가상 텍스트 플레이트(text plate) 생성 학습 데이터를 상기 비식별화 모델에 포함된 제2 비식별화 모델에 입력시켜 상기 제2 비식별화 모델을 학습시키는 동작을 더 포함할 수 있다.The operation of generating the de-identification model is performed by inputting virtual text plate generation learning data among virtual image generation learning data, which is an output of the segmentation model, into a second de-identification model included in the de-identification model. An operation of learning the second de-identification model may be further included.

상기 비식별화 모델 생성 방법은 상기 제1 비식별화 모델 및 상기 제2 비식별화 모델을 병렬적으로 학습시키는 동작을 더 포함할 수 있다.The de-identification model generating method may further include an operation of training the first de-identification model and the second de-identification model in parallel.

다양한 실시예에 따른 개인식별정보 비식별화 방법은 원본 미디어로부터 하나 이상의 객체를 탐지하여 제1 이미지를 획득하는 동작과 상기 제1 이미지의 개인식별정보만 비식별화된 제2 이미지를 생성하는 동작을 포함할 수 있다.A method of de-identifying personal identification information according to various embodiments includes an operation of acquiring a first image by detecting one or more objects from original media and an operation of generating a second image in which only the personal identification information of the first image is de-identified. can include

상기 제1 이미지를 획득하는 동작은 상기 원본 미디어가 연속된 이미지로 이루어진 영상인 경우, 상기 원본 미디어에 오브젝트 트래킹(object tracking)을 수행하여 상기 제1 이미지를 획득하는 동작을 포함할 수 있다.Obtaining the first image may include acquiring the first image by performing object tracking on the original media when the original media is a video composed of continuous images.

상기 비식별화된 제2 이미지를 생성하는 동작은 상기 제1 이미지로부터 개인식별정보만 분할된 이미지를 생성하는 동작을 포함할 수 있다.The generating of the de-identified second image may include generating an image obtained by dividing only personal identification information from the first image.

상기 비식별화된 제2 이미지를 생성하는 동작은 상기 분할된 이미지에 대응하는 가상 이미지를 생성하는 동작을 더 포함할 수 있다.The generating of the de-identified second image may further include generating a virtual image corresponding to the divided image.

상기 비식별화된 제2 이미지를 생성하는 동작은 상기 제1 이미지에서 상기 원본 미디어에 상기 가상 이미지를 합성하는 동작을 더 포함할 수 있다.The generating of the de-identified second image may further include synthesizing the virtual image from the first image to the original media.

상기 가상 이미지는 상기 개인식별정보가 얼굴 및 신체 중 적어도 어느 하나인 경우, 상기 분할된 이미지에 대응하는 가상 얼굴 또는 가상 신체 중 적어도 어느 하나를 포함하고, 상기 개인식별정보가 텍스트 플레이트인 경우, 상기 분할된 이미지에 대응하는 가상 텍스트 플레이트(text plate)를 포함할 수 있다.The virtual image includes at least one of a virtual face or a virtual body corresponding to the divided image when the personal identification information is at least one of a face and a body, and when the personal identification information is a text plate, the virtual image A virtual text plate corresponding to the segmented image may be included.

다양한 실시예에 따른 개인식별정보를 비식별화하는 장치는 인스트럭션들을 포함하는 메모리 및 상기 메모리와 전기적으로 연결되고, 상기 인스트럭션들을 실행하기 위한 프로세서를 포함하고, 상기 프로세서에 의해 상기 인스트럭션들이 실행될 때, 상기 프로세서는, 원본 미디어로부터 하나 이상의 객체를 탐지하여 제1 이미지를 획득하고, 상기 제1 이미지의 개인식별정보만 비식별화된 제2 이미지를 생성할 수 있다.An apparatus for de-identifying personal identification information according to various embodiments includes a memory including instructions and a processor electrically connected to the memory and executing the instructions, and when the instructions are executed by the processor, The processor may obtain a first image by detecting one or more objects from original media, and generate a second image in which only personal identification information of the first image is de-identified.

상기 프로세서는 상기 원본 미디어가 연속된 이미지로 이루어진 영상인 경우, 상기 원본 미디어에 오브젝트 트래킹(object tracking)을 수행하여 상기 제1 이미지를 획득할 수 있다.When the original media is a video composed of continuous images, the processor may acquire the first image by performing object tracking on the original media.

상기 프로세서는 상기 제1 이미지로부터 개인식별정보만 분할된 이미지를 생성할 수 있다.The processor may generate an image in which only personal identification information is divided from the first image.

상기 프로세서는 상기 분할된 이미지에 대응하는 가상 이미지를 생성할 수 있다.The processor may generate a virtual image corresponding to the divided image.

상기 프로세서는 상기 원본 미디어에 상기 가상 이미지를 합성할 수 있다.The processor may combine the virtual image with the original media.

상기 가상 이미지는 상기 개인식별정보가 얼굴 및 신체 중 적어도 어느 하나인 경우, 상기 분할된 이미지에 대응하는 가상 얼굴 또는 가상 신체 중 적어도 어느 하나를 포함하고, 상기 개인식별정보가 텍스트 플레이트인 경우, 상기 분할된 이미지에 대응하는 가상 텍스트 플레이트(text plate)를 포함할 수 있다.The virtual image includes at least one of a virtual face or a virtual body corresponding to the divided image when the personal identification information is at least one of a face and a body, and when the personal identification information is a text plate, the virtual image A virtual text plate corresponding to the segmented image may be included.

도 1은 다양한 실시예에 따른 개인식별정보의 비식별화를 수행하는 전자 장치의 블록도이다.
도 2는 도 1에 도시된 객체 탐지기의 일 예를 설명하기 위한 도면이다.
도 3은 도 1에 도시된 비식별화 모델의 블록도이다.
도 4는 다양한 실시예에 따른 비식별화 모델을 생성하는 동작을 설명하기 위한 도면이다.
도 5는 다양한 실시예에 따른 분할 모델을 생성하는 동작을 설명하기 위한 도면이다.
도 6은 다양한 실시예에 따른 제1 비식별화 모델을 생성하는 동작을 설명하기 위한 도면이다.
도 7은 다양한 실시예에 따른 제2 비식별화 모델을 생성하는 동작을 설명하기 위한 도면이다.
도 8은 다양한 실시예에 따른 전자 장치의 동작 방법의 일 예에 대한 흐름도이다.
도 9는 다양한 실시예에 따른 전자 장치의 동작 방법의 다른 예에 대한 흐름도이다.
도 10은 다양한 실시예에 따른, 전자 장치의 다른 예를 나타낸다.
1 is a block diagram of an electronic device performing de-identification of personal identification information according to various embodiments.
FIG. 2 is a diagram for explaining an example of the object detector shown in FIG. 1 .
3 is a block diagram of the de-identification model shown in FIG. 1;
4 is a diagram for explaining an operation of generating a de-identification model according to various embodiments.
5 is a diagram for explaining an operation of generating a segmentation model according to various embodiments.
6 is a diagram for explaining an operation of generating a first de-identification model according to various embodiments.
7 is a diagram for explaining an operation of generating a second de-identification model according to various embodiments.
8 is a flowchart of an example of a method of operating an electronic device according to various embodiments.
9 is a flowchart of another example of a method of operating an electronic device according to various embodiments.
10 illustrates another example of an electronic device according to various embodiments.

실시예들에 대한 특정한 구조적 또는 기능적 설명들은 단지 예시를 위한 목적으로 개시된 것으로서, 다양한 형태로 변경되어 구현될 수 있다. 따라서, 실제 구현되는 형태는 개시된 특정 실시예로만 한정되는 것이 아니며, 본 명세서의 범위는 실시예들로 설명한 기술적 사상에 포함되는 변경, 균등물, 또는 대체물을 포함한다.Specific structural or functional descriptions of the embodiments are disclosed for illustrative purposes only, and may be changed and implemented in various forms. Therefore, the form actually implemented is not limited only to the specific embodiments disclosed, and the scope of the present specification includes changes, equivalents, or substitutes included in the technical idea described in the embodiments.

제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 이런 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 해석되어야 한다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.Although terms such as first or second may be used to describe various components, such terms should only be construed for the purpose of distinguishing one component from another. For example, a first element may be termed a second element, and similarly, a second element may be termed a first element.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다.It should be understood that when an element is referred to as being “connected” to another element, it may be directly connected or connected to the other element, but other elements may exist in the middle.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설명된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.Singular expressions include plural expressions unless the context clearly dictates otherwise. In this specification, terms such as "comprise" or "have" are intended to designate that the described feature, number, step, operation, component, part, or combination thereof exists, but one or more other features or numbers, It should be understood that the presence or addition of steps, operations, components, parts, or combinations thereof is not precluded.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 해당 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art. Terms such as those defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the related art, and unless explicitly defined in this specification, it should not be interpreted in an ideal or excessively formal meaning. don't

이하, 실시예들을 첨부된 도면들을 참조하여 상세하게 설명한다. 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일한 참조 부호를 부여하고, 이에 대한 중복되는 설명은 생략하기로 한다.Hereinafter, embodiments will be described in detail with reference to the accompanying drawings. In the description with reference to the accompanying drawings, the same reference numerals are given to the same components regardless of reference numerals, and overlapping descriptions thereof will be omitted.

도 1은 다양한 실시예에 따른 개인식별정보의 비식별화를 수행하는 전자 장치의 블록도이다. 도 2는 도 1에 도시된 객체 탐지기의 동작의 일 예를 설명하기 위한 도면이다.1 is a block diagram of an electronic device performing de-identification of personal identification information according to various embodiments. FIG. 2 is a diagram for explaining an example of an operation of the object detector shown in FIG. 1 .

도 1 및 도 2를 참조하면, 다양한 실시예에 따르면, 전자 장치(100)는 객체 탐지기(110) 및 비식별화 모델(140)를 포함할 수 있다. 비식별화 모델(140)은 도 4 내지 도 7를 참조하여 후술할 동작에 의해서 생성(예: 학습)된 것일 수 있다.Referring to FIGS. 1 and 2 , according to various embodiments, an electronic device 100 may include an object detector 110 and a de-identification model 140 . The de-identification model 140 may be generated (eg, learned) by an operation to be described later with reference to FIGS. 4 to 7 .

다양한 실시예에 따르면, 전자 장치(100)는 원본 미디어 내 객체의 특징을 유지하면서도 다양한 개인식별정보(예: 얼굴, 신체, 차량 번호판, 명판, 간판 등)를 비식별화할 수 있다. 객체의 특징이 여전히 유지되기 때문에, 비식별화된 미디어는 학습 데이터로서의 가치를 보존할 수 있다. 예를 들어, 자율 주행을 위한 주행 학습 데이터를 수집할 때 보행자 영역을 blurring이나 blocking방식을 사용한다면 미디어의 학습 데이터로서의 가치가 상실될 수 있다. 전자 장치(100)가 원본 미디어에서 객체의 특징을 유지하면서 개인식별정보만 비식별화함으로써, 보행자가 누구인지는 알 수 없으나, 보행자라는 객체의 특징이 유지되어 학습에 사용하기에 적합할 수 있다.According to various embodiments, the electronic device 100 may de-identify various personal identification information (eg, face, body, vehicle license plate, nameplate, signboard, etc.) while maintaining the characteristics of objects in the original media. Since the characteristics of the object are still maintained, de-identified media can preserve its value as learning data. For example, when collecting driving learning data for autonomous driving, if a pedestrian area is blurring or blocking, the value of media as learning data may be lost. Since the electronic device 100 de-identifies only the personal identification information while maintaining the characteristics of the object in the original media, it is not possible to know who the pedestrian is, but the characteristics of the object called the pedestrian are maintained and may be suitable for use in learning. .

다양한 실시예에 따르면, 객체 탐지기(110)는 원본 미디어를 획득(예: 수신)할 수 있다. 원본 미디어는 외부로부터 수집된 것일 수 있다. 객체 탐지기(110)는 원본 미디어에 포함된 하나 이상의 객체(예: 보행자, 차량 등)를 탐지하여 객체가 탐지된 제1 이미지를 출력할 수 있다.According to various embodiments, the object detector 110 may obtain (eg, receive) original media. Original media may be externally collected. The object detector 110 may detect one or more objects (eg, a pedestrian, a vehicle, etc.) included in the original media and output a first image in which the objects are detected.

다양한 실시예에 따르면, 객체 탐지기(110)의 동작 일 예는 도 2에 도시된 바와 같을 수 있다. 동작 210에서, 객체 탐지기(110)는 원본 미디어에 대해 관심있는 객체를 식별하는 오브젝트 디텍션(object detection)을 수행할 수 있다. 예를 들어, 객체 탐지기(110)는 frame differencing, optical flow, background subtraction, 또는 그와 실질적으로 동일한 기능을 하는 알고리즘 중에서 하나 이상을 이용하여 오브젝트 디텍션을 수행할 수 있다. 동작 220에서, 객체 탐지기(110)는 수신한 원본 미디어가 연속된 이미지로 이루어진 영상인지의 여부를 판단할 수 있다. 원본 미디어가 단일 이미지일 경우, 객체 탐지기(110)는 원본 미디어에 대한 오브젝트 디텍션 수행 결과를 출력할 수 있다. 원본 미디어가 영상일 경우, 객체 탐지기(110)는 연속된 이미지의 프레임에 걸쳐 동일 객체라고 판단된 객체를 추적하는 오브젝트 트래킹(object tracking)을 수행할 수 있다. 예를 들어, 객체 탐지기(110)는 point tracking, kernel tracking, silhouette 또는 그와 실질적으로 동일한 기능을 하는 알고리즘 중에서 하나 이상을 이용하여 오브젝트 트래킹을 수행할 수 있다.According to various embodiments, an example of an operation of the object detector 110 may be as shown in FIG. 2 . At operation 210, object detector 110 may perform object detection to identify objects of interest to the original media. For example, the object detector 110 may perform object detection using one or more of frame differencing, optical flow, background subtraction, or an algorithm having substantially the same function. In operation 220, the object detector 110 may determine whether the received original media is a video consisting of continuous images. If the original media is a single image, the object detector 110 may output a result of performing object detection on the original media. When the original media is a video, the object detector 110 may perform object tracking to track an object determined to be the same object over frames of consecutive images. For example, the object detector 110 may perform object tracking using one or more of point tracking, kernel tracking, silhouette, or an algorithm having substantially the same function.

다양한 실시예에 따르면, 비식별화 모델(140)은 객체 탐지기(110)로부터 출력된 제1 이미지를 수신할 수 있다. 제1 이미지는 개인식별정보를 포함할 수 있다. 비식별화 모델(140)은 제1 이미지에서 개인식별정보(예: 얼굴, 신체, 차량 번호판, 명판, 간판 등)에 대응하는 부분이 분할된 이미지를 생성할 수 있다. 또한, 비식별화 모델(140)은 개인식별정보에 대응하는 가상 이미지를 생성할 수 있다. 비식별화 모델(140)은 원본 미디어 및 제1 이미지에 기초하여 원본 미디어에 가상 이미지가 반영된 이미지를 생성할 수 있다. 예를 들어, 비식별화 모델(140)은 분할된 이미지의 위치에 기초하여 원본 미디어에 가상 이미지를 합성함으로써 제1 이미지의 개인식별정보가 비식별화된 제2 이미지를 생성할 수 있다.According to various embodiments, the de-identification model 140 may receive the first image output from the object detector 110 . The first image may include personal identification information. The de-identification model 140 may generate an image in which a portion corresponding to personal identification information (eg, face, body, vehicle license plate, name plate, signboard, etc.) in the first image is divided. Also, the de-identification model 140 may generate a virtual image corresponding to personal identification information. The de-identification model 140 may generate an image in which the virtual image is reflected in the original media based on the original media and the first image. For example, the de-identification model 140 may generate a second image in which personal identification information of the first image is de-identified by synthesizing a virtual image with original media based on the location of the divided image.

도 3은 다양한 실시예에 따른, 도 1에 포함된 비식별화 모델의 블록도이다.3 is a block diagram of the de-identification model included in FIG. 1 according to various embodiments.

도 3을 참조하면, 다양한 실시예에 따르면, 비식별화 모델(140)은 분할 모델(150), 제1 비식별화 모델(160), 및 제2 비식별화 모델(170)를 포함할 수 있다. 분할 모델(150)은 도 4 및 도 5를 참조하여 후술할 동작에 의해서 생성(예: 학습)된 것이고, 제1 비식별화 모델(160)은 도 4 및 도 6를 참조하여 후술할 동작에 의해서 생성(예: 학습)된 것이고, 제2 비식별화 모델(170)은 도 4 및 도 7를 참조하여 후술할 동작에 의해서 생성(예: 학습)된 것일 수 있다.Referring to FIG. 3 , according to various embodiments, a de-identification model 140 may include a segmentation model 150, a first de-identification model 160, and a second de-identification model 170. there is. The segmentation model 150 is generated (eg, learned) by an operation to be described later with reference to FIGS. 4 and 5, and the first de-identification model 160 is generated by an operation to be described later with reference to FIGS. 4 and 6. The second de-identification model 170 may be generated (eg, learned) by an operation to be described later with reference to FIGS. 4 and 7 .

다양한 실시예에 따르면, 분할 모델(150)은 제1 이미지를 수신할 수 있다. 제1 이미지는 개인식별정보(예: 얼굴, 신체, 차량 번호판, 명판, 간판 등)를 포함할 수 있다. 분할 모델(150)은 제1 이미지에서 개인식별정보에 상응하는 부분을 분할할 수 있다. 분할 모델(150)은 세그멘테이션 네트워크(155)(예: CNN 기반의 세그멘테이션 네트워크)를 포함할 수 있다.According to various embodiments, the segmentation model 150 may receive the first image. The first image may include personal identification information (eg, face, body, vehicle number plate, name plate, signboard, etc.). The segmentation model 150 may segment a portion corresponding to personal identification information in the first image. The segmentation model 150 may include a segmentation network 155 (eg, a CNN-based segmentation network).

다양한 실시예에 따르면, 분할 모델(150)은 제1 이미지에 기초하여 계층정보 데이터를 생성할 수 있다. 예를 들어, 분할 모델(150)은 제1 이미지에 포함된 객체의 정보를 추출하여 계층화함으로써 계층정보 데이터를 생성할 수 있다.According to various embodiments, the segmentation model 150 may generate hierarchical information data based on the first image. For example, the segmentation model 150 may generate hierarchical information data by extracting and stratifying object information included in the first image.

다양한 실시예에 따르면, 세그멘테이션 네트워크(155)는 제1 이미지를 수신하여 제1 이미지의 개인식별정보에 대응되는 부분이 분할된 이미지를 생성하고, 분할된 이미지를 출력할 수 있다.According to various embodiments, the segmentation network 155 may receive a first image, generate an image in which a portion of the first image corresponding to personal identification information is divided, and output the divided image.

다양한 실시예에 따르면, 비식별화 모델(140)은 객체의 종류에 기초하여 분할 모델(150)의 출력(예: 분할된 이미지)을 분류하여 제1 비식별화 모델(160) 또는 제2 비식별화 모델(170)로 출력하는 분류기(미도시)를 더 포함할 수 있다. 객체가 보행자인 경우에는 분할 모델(150)의 출력(예: 분할된 이미지)은 제1 비식별화 모델(160)로 출력될 수 있고, 객체가 사물(예: 자동차, 간판 등)인 경우에는 분할 모델(150)의 출력(예: 분할된 이미지)은 제2 비식별화 모델(170)로 출력될 수 있다.According to various embodiments, the de-identification model 140 classifies the output (eg, segmented image) of the segmentation model 150 based on the type of object to obtain a first de-identification model 160 or a second de-identification model 160. A classifier (not shown) outputting the identification model 170 may be further included. When the object is a pedestrian, the output of the segmentation model 150 (eg, a segmented image) may be output to the first de-identification model 160, and when the object is a thing (eg, a car, a signboard, etc.) An output (eg, a segmented image) of the segmentation model 150 may be output as the second de-identification model 170 .

다양한 실시예에 따르면, 제1 비식별화 모델(160)은 분할 모델(150)의 출력(예: 분할된 이미지)을 수신할 수 있다. 분할된 이미지는 얼굴 및 신체 중 적어도 어느 하나를 포함할 수 있다.According to various embodiments, the first de-identification model 160 may receive an output (eg, a segmented image) of the segmentation model 150 . The segmented image may include at least one of a face and a body.

다양한 실시예에 따르면, 제1 비식별화 모델(160)은 분할된 이미지로부터 정보를 추출할 수 있다. 추출된 정보는 분할된 이미지에 포함된 얼굴 및 신체 중 적어도 어느 하나를 구성하는 요소의 특징 중에서 적어도 어느 하나에 대한 정보를 포함할 수 있다. 제1 비식별화 모델(160)은 GAN 네트워크(165)를 포함할 수 있다.According to various embodiments, the first de-identification model 160 may extract information from the segmented image. The extracted information may include information on at least one of features of elements constituting at least one of a face and a body included in the segmented image. The first de-identification model 160 may include a GAN network 165 .

다양한 실시예에 따르면, GAN 네트워크(165)는 분할된 이미지 및 추출된 정보에 기초하여 분할된 이미지에 포함된 얼굴 및 신체 중 적어도 어느 하나에 대응하는 가상 이미지를 생성하고, 가상 이미지를 출력할 수 있다. GAN 네트워크(165)는 추출된 정보에 기초하여 분할된 이미지에 포함된 얼굴 및 신체 중 적어도 어느 하나가 가지는 요소의 특징을 유지하는 것을 조건으로 가상 이미지를 생성할 수 있다. 가상 이미지에 포함된 얼굴 및 신체 중 적어도 어느 하나는 분할된 이미지에 포함된 얼굴 및 신체 중 적어도 어느 하나와 전혀 다른 생김새일 수 있고, 크기는 동일할 수 있다.According to various embodiments, the GAN network 165 may generate a virtual image corresponding to at least one of a face and a body included in the divided image based on the divided image and the extracted information, and output the virtual image. there is. Based on the extracted information, the GAN network 165 may generate a virtual image under the condition that features of an element of at least one of a face and a body included in the segmented image are maintained. At least one of the face and body included in the virtual image may have a completely different appearance and may have the same size as at least one of the face and body included in the divided image.

다양한 실시예에 따르면, 제1 비식별화 모델(160)은 분할된 이미지의 위치에 기초하여 원본 미디어에 가상 이미지를 합성한 합성 이미지(예: 개인식별정보가 비식별화된 제2 이미지)를 생성할 수 있고, 합성 이미지를 출력할 수 있다. 예를 들어, 원본 미디어에 포함된 객체가 보행자일 경우, 제1 비식별화 모델(160)은 보행자의 얼굴 및 신체 중 적어도 어느 하나가 분할된 위치에 가상의 얼굴 및 가상의 신체 중 적어도 어느 하나를 합성할 수 있다. 제1 비식별화 모델(160)은 원본 미디어 내의 얼굴 또는 신체와 대응되는 가상 이미지를 원본 미디어 내의 얼굴 또는 신체의 기존 위치에 합성함으로써 이질감이 없고 자연스러운 합성 이미지를 생성할 수 있다.According to various embodiments, the first de-identification model 160 generates a synthesized image (eg, a second image in which personal identification information is de-identified) obtained by synthesizing a virtual image with original media based on the location of the divided image. can be created, and composite images can be output. For example, when an object included in the original media is a pedestrian, the first de-identification model 160 displays at least one of a virtual face and a virtual body at a location where at least one of the pedestrian's face and body is divided. can be synthesized. The first de-identification model 160 may generate a natural composite image without heterogeneity by synthesizing a virtual image corresponding to a face or body in the original media with an existing position of the face or body in the original media.

다양한 실시예에 따르면, 제1 비식별화 모델(160)의 출력인 합성 이미지를 학습 데이터로서 활용할 경우, 원본 미디어 내 기존의 얼굴 및 신체 중 적어도 어느 하나가 있던 위치에 가상의 얼굴 및 가상의 신체 중 적어도 어느 하나가 존재하므로 개인식별정보를 노출시키지 않을 수 있다. 또한, 합성 이미지는 이질감이 없고 자연스러우므로 학습 데이터로서의 가치를 보존할 수 있다.According to various embodiments, when the synthesized image, which is the output of the first de-identification model 160, is used as training data, a virtual face and a virtual body are placed at a location where at least one of the existing face and body was located in the original media. Since at least one of them exists, personal identification information may not be exposed. In addition, since the synthesized image has no sense of heterogeneity and is natural, its value as learning data can be preserved.

다양한 실시예에 따르면, 제2 비식별화 모델(170)은 분할 모델(150)의 출력(예: 분할된 이미지)을 수신할 수 있다. 예를 들어, 분할된 이미지는 텍스트 플레이트(예: 차량 번호판, 간판, 명판 등)를 포함할 수 있다.According to various embodiments, the second de-identification model 170 may receive an output (eg, a segmented image) of the segmentation model 150 . For example, the segmented image may include a text plate (eg, license plate number plate, signboard, name plate, etc.).

다양한 실시예에 따르면, 제2 비식별화 모델(170)은 분할된 이미지로부터 텍스트 플레이트 부분에 상응하는 부분을 검출할 수 있다. 텍스트 플레이트 부분은 개인식별정보를 포함할 수 있다. 텍스트 플레이트 부분에 상응하는 부분은 텍스트 데이터(예: 한글, 영어, 숫자 등) 및 텍스트 데이터를 제외한 나머지 부분인 이미지 데이터를 포함할 수 있다. 제2 비식별화 모델(170)은 텍스트 플레이트 부분에 상응하는 부분으로부터 텍스트 데이터(예: 한글, 영어, 숫자 등) 및 이미지 데이터를 추출해서 획득할 수 있다.According to various embodiments, the second de-identification model 170 may detect a portion corresponding to the text plate portion from the divided image. The text plate portion may include personal identification information. A portion corresponding to the text plate portion may include text data (eg, Korean, English, numbers, etc.) and image data, which is a remaining portion excluding the text data. The second de-identification model 170 may extract and obtain text data (eg, Korean, English, numbers, etc.) and image data from a portion corresponding to the text plate portion.

다양한 실시예에 따르면, 제2 비식별화 모델(170)은 텍스트 데이터를 변경할 수 있다. 제2 비식별화 모델(170)은 텍스트 데이터에서 텍스트(예: 한글, 영어, 숫자 등)를 변경한 텍스트 변형 데이터를 생성할 수 있다. 제2 비식별화 모델(170)은 텍스트를 규칙에 따라 변경하거나 규칙에 상관없이 랜덤하게 변경할 수 있다. 제2 비식별화 모델(170)은 GAN 네트워크(175)를 포함할 수 있다.According to various embodiments, the second de-identification model 170 may change text data. The second de-identification model 170 may generate text transformation data obtained by changing text (eg, Korean, English, numbers, etc.) in text data. The second de-identification model 170 may change text according to rules or randomly regardless of rules. The second de-identification model 170 may include a GAN network 175 .

다양한 실시예에 따르면, GAN 네트워크(175)는 이미지 데이터에 기초하여 텍스트 플레이트의 유형(예: 신형 자동차의 번호판, 구형 자동차의 번호판, 전기차의 번호판, 명판, 간판 등)을 파악할 수 있다. GAN 네트워크(175)는 텍스트 플레이트의 유형이 기재된 라벨을 생성할 수 있으며, 라벨을 출력할 수 있다.According to various embodiments, the GAN network 175 may determine the type of text plate (eg, license plate of a new car, license plate of an old car, license plate of an electric car, name plate, signboard, etc.) based on image data. The GAN network 175 may generate a label in which the type of text plate is described, and may output the label.

다양한 실시예에 따르면, 제2 비식별화 모델(170)은 라벨 및 텍스트 변형 데이터에 기초하여 합성 이미지(예: 개인식별정보가 비식별화된 제2 이미지)를 생성할 수 있다. 예를 들어, 제2 비식별화 모델(170)은 라벨에 기재된 텍스트 플레이트의 유형에 상응하는 이미지 데이터에 텍스트 변형 데이터를 합성하여 합성 이미지를 생성하고, 합성 이미지를 출력할 수 있다.According to various embodiments, the second de-identification model 170 may generate a synthesized image (eg, a second image in which personal identification information is de-identified) based on the label and text transformation data. For example, the second de-identification model 170 may create a synthesized image by synthesizing text modification data with image data corresponding to the type of text plate written on the label, and output the synthesized image.

다양한 실시예에 따른 제2 비식별화 모델(170)의 출력인 합성 이미지를 학습 데이터로 활용할 경우, 원본 미디어 내 기존의 텍스트 플레이트가 있던 위치에 가상의 텍스트 플레이트가 존재하므로 개인식별정보를 노출시키지 않을 수 있다. 또한, 합성 이미지는 이질감이 없고 자연스러우므로 학습 데이터로서의 가치를 보존할 수 있다.When the synthetic image, which is the output of the second de-identification model 170 according to various embodiments, is used as training data, a virtual text plate exists at the location where the existing text plate was located in the original media, so that personal identification information is not exposed. may not be In addition, since the synthesized image has no sense of heterogeneity and is natural, its value as learning data can be preserved.

도 4는 다양한 실시예에 따른 비식별화 모델을 생성하는 동작을 설명하기 위한 도면이다.4 is a diagram for explaining an operation of generating a de-identification model according to various embodiments.

도 4를 참조하면, 다양한 실시예에 따르면, 전자 장치(400)는 제1 학습 데이터 및 제1 학습 데이터로부터 획득한 제2 학습 데이터에 기초하여 비식별화 모델(440)을 생성(예: 학습)할 수 있다. 제2 학습 데이터는 전자 장치(400)에 포함된 데이터 수집기(410)에 의해 제1 학습 데이터로부터 획득될 수 있다.Referring to FIG. 4 , according to various embodiments, the electronic device 400 generates a de-identification model 440 based on first learning data and second learning data acquired from the first learning data (eg, learning )can do. The second learning data may be obtained from the first learning data by the data collector 410 included in the electronic device 400 .

다양한 실시예에 따르면, 데이터 수집기(410)는 제1 학습 데이터 및 제1 학습 데이터로부터 획득한 제2 학습 데이터를 수집할 수 있다. 제1 학습 데이터는 개인식별정보에 상응하는 데이터를 포함할 수 있다. 제2 학습 데이터는 개인식별정보(예: 얼굴, 신체, 텍스트 플레이트 등)에 상응하는 데이터일 수 있다. 데이터 수집기(410)는 추출 오픈소스(412) 및 개인식별정보 학습 데이터베이스(414)를 포함할 수 있다.According to various embodiments, the data collector 410 may collect first learning data and second learning data obtained from the first learning data. The first learning data may include data corresponding to personal identification information. The second learning data may be data corresponding to personal identification information (eg, face, body, text plate, etc.). Data aggregator 410 may include extract open source 412 and personally identifiable information learning database 414 .

다양한 실시예에 따르면, 추출 오픈소스(412)는 제1 학습 데이터로부터 제2 학습 데이터를 추출할 수 있다. 추출 오픈소스(412)는 데이터를 추출 또는 그와 실질적으로 동일한 기능을 하기 위한 모든 오픈소스를 포함한다. 제1 학습 데이터 및 제2 학습 데이터는 쌍으로 존재할 수 있다.According to various embodiments, the extraction open source 412 may extract second training data from the first training data. The extraction open source 412 includes all open sources for extracting data or performing substantially the same function. The first learning data and the second learning data may exist in pairs.

다양한 실시예에 따르면, 개인식별정보 학습 데이터베이스(414)는 데이터를 저장할 수 있다. 저장된 데이터는 수신한 제1 학습 데이터 및 제2 학습 데이터의 쌍의 집합일 수 있다.According to various embodiments, the personally identifiable information learning database 414 may store data. The stored data may be a set of pairs of received first and second training data.

다양한 실시예에 따르면, 비식별화 모델(440)은 입력한 이미지의 개인식별정보 부분만 비식별화한 이미지를 생성하도록 학습될 수 있고, 생성한 이미지를 출력할 수 있도록 학습될 수 있다.According to various embodiments, the de-identification model 440 may be trained to generate an image in which only the personal identification information portion of the input image is de-identified, and may be trained to output the generated image.

다양한 실시예에 따르면, 비식별화 모델(440)은 다량의 데이터를 기반으로 학습됨으로써 생성될 수 있다. 다량의 데이터는 개인식별정보 학습 데이터베이스(414)에서 공급될 수 있다. 비식별화 모델(440)은 분할 모델(442), 가상 영상 생성 학습 데이터베이스(444), 제1 비식별화 모델(446), 및 제2 비식별화 모델(448)을 포함할 수 있다. 분할 모델(442)은 제1 학습 데이터 및 제2 학습 데이터에 기초하여 학습됨으로써 생성될 수 있고, 제1 비식별화 모델(446) 및 제2 비식별화 모델(448)은 분할 모델(442)의 출력을 수신하여 제1 학습 데이터의 개인식별정보 부분을 비식별화하도록 학습됨으로써 생성될 수 있다.According to various embodiments, the de-identification model 440 may be generated by learning based on a large amount of data. A large amount of data may be sourced from personally identifiable information learning database 414 . The de-identification model 440 may include a segmentation model 442 , a virtual image generation learning database 444 , a first de-identification model 446 , and a second de-identification model 448 . The segmentation model 442 may be generated by learning based on the first training data and the second training data, and the first de-identification model 446 and the second de-identification model 448 are the segmentation model 442 It may be generated by receiving the output of and learning to de-identify the personally identifiable information part of the first training data.

도 5는 다양한 실시예에 따른 분할 모델을 생성하는 동작을 설명하기 위한 도면이다.5 is a diagram for explaining an operation of generating a segmentation model according to various embodiments.

도 5를 참조하면, 다양한 실시예에 따르면, 분할 모델(442)은 제1 학습 데이터 및 제1 학습 데이터로부터 획득한 제2 학습 데이터에 기초하여 학습됨으로써 생성될 수 있다. 분할 모델(442)은 제1 학습 데이터의 특정 부분을 분할하도록 학습될 수 있다. 특정 부분은 개인식별정보에 상응하는 부분일 수 있다. 분할 모델(442)은 계층정보 변환기(510) 및 세그멘테이션 네트워크(segmentation network)(예: CNN 기반의 세그멘테이션 네트워크)(520)를 포함할 수 있다.Referring to FIG. 5 , according to various embodiments, a segmentation model 442 may be generated by learning based on first training data and second training data obtained from the first training data. The segmentation model 442 may be trained to segment a specific portion of the first training data. The specific part may be a part corresponding to personal identification information. The segmentation model 442 may include a hierarchical information transformer 510 and a segmentation network (eg, a CNN-based segmentation network) 520 .

다양한 실시예에 따르면, 계층정보 변환기(510)는 제1 학습 데이터에 기초하여 계층정보 데이터를 생성할 수 있다. 예를 들어, 계층정보 변환기(510)는 제1 학습 데이터에 포함된 객체의 정보를 추출하여 객체의 정보를 계층화함으로써 계층정보 데이터를 생성할 수 있다.According to various embodiments, the hierarchical information converter 510 may generate hierarchical information data based on the first learning data. For example, the hierarchical information converter 510 may generate hierarchical information data by extracting object information included in the first training data and stratifying the object information.

다양한 실시예에 따르면, 세그멘테이션 네트워크(520)는 제1 학습 데이터, 제2 학습 데이터, 및 계층정보 데이터에 기초하여 학습될 수 있다. 예를 들어, 전자 장치(400)는 제1 학습 데이터 및 계층정보 데이터를 세그멘테이션 네트워크(520)에 입력시키고, 세그멘테이션 네트워크(520)의 출력과 제2 학습 데이터의 유사도를 증가시킴으로써 세그멘테이션 네트워크(520)를 학습시킬 수 있다.According to various embodiments, the segmentation network 520 may be trained based on the first training data, the second training data, and hierarchical information data. For example, the electronic device 400 inputs the first training data and hierarchical information data to the segmentation network 520, and increases the similarity between the output of the segmentation network 520 and the second training data, thereby increasing the segmentation network 520. can be learned.

다양한 실시예에 따르면, 분할 모델(442)의 출력은 가상 영상 생성 학습 데이터베이스(예: 도 4의 가상 영상 생성 학습 데이터베이스(444))에 저장될 수 있다. 가상 영상 생성 학습 데이터베이스(444)는 분할 모델(442)의 출력의 집합일 수 있다. 가상 영상 생성 학습 데이터 베이스(444)는 가상 얼굴 및 신체 생성 학습 데이터 및 가상 텍스트 플레이트 생성 학습 데이터를 포함할 수 있다.According to various embodiments, the output of the segmentation model 442 may be stored in a virtual image generation learning database (eg, the virtual image generation learning database 444 of FIG. 4 ). The virtual image generation learning database 444 may be a set of outputs of the segmentation model 442 . The virtual image generation learning database 444 may include virtual face and body generation learning data and virtual text plate generation learning data.

다양한 실시예에 따르면, 비식별화 모델(예: 도 4의 비식별화 모델(440))은 객체의 종류에 기초하여 가상 영상 생성 학습 데이터베이스(도 4의 가상 영상 생성 학습 데이터베이스(444))를 분류하여 제1 비식별화 모델(예: 도 4의 제1 비식별화 모델(446)) 또는 제2 비식별화 모델((예: 도 4의 제2 비식별화 모델(448))로 출력하는 분류기(미도시)를 더 포함할 수 있다. 객체가 사람인 경우에는 가상 영상 생성 학습 데이터베이스(444)를 가상 얼굴 및 신체 생성 학습 데이터로 분류하여 제1 비식별화 모델(446)로 출력될 수 있고, 객체가 사물(예: 자동차, 간판 등)인 경우에는 가상 영상 생성 학습 데이터베이스(444)를 가상 텍스트 플레이트 생성 학습 데이터로 분류하여 제2 비식별화 모델(448)로 출력될 수 있다.According to various embodiments, the de-identification model (eg, the de-identification model 440 of FIG. 4) uses a virtual image generation learning database (the virtual image generation learning database 444 of FIG. 4) based on the type of object. Classified and output as a first de-identification model (eg, the first de-identification model 446 of FIG. 4) or a second de-identification model (eg, the second de-identification model 448 of FIG. 4) When the object is a person, the virtual image generation learning database 444 is classified into virtual face and body generation learning data, and output to the first de-identification model 446. If the object is an object (eg, a car, a signboard, etc.), the virtual image generation learning database 444 may be classified as virtual text plate generation learning data and output to the second de-identification model 448 .

도 6은 다양한 실시예에 따른 제1 비식별화 모델을 생성하는 동작을 설명하기 위한 도면이다.6 is a diagram for explaining an operation of generating a first de-identification model according to various embodiments.

도 6을 참조하면, 다양한 실시예에 따르면, 제1 비식별화 모델(446)은 수신 이미지(예: 도 4의 가상 영상 생성 학습 데이터베이스(444) 중 가상 얼굴 및 신체 생성 학습 데이터), 수신 이미지로부터 추출한 정보, 및 랜덤 노이즈에 기초하여 학습됨으로써 생성될 수 있다. 수신 이미지는 얼굴 및 신체 중 적어도 어느 하나에 상응하는 부분을 포함할 수 있다. 수신 이미지로부터 추출한 정보는 얼굴 및 신체 중 적어도 어느 하나를 구성하는 요소의 특징 중에서 어느 하나에 대한 정보를 포함할 수 있다. 수신 이미지는 분할 모델(예: 도 4의 분할 모델(442))의 출력인 가상 영상 생성 학습 데이터베이스(예: 도 4의 가상 영상 생성 학습 데이터베이스 (444))에서 공급될 수 있다. 예를 들어, 수신 이미지는 가상 영상 생성 학습 데이터베이스(444)에 포함된 가상 얼굴 및 신체 생성 학습 데이터일 수 있다. 랜덤 노이즈는 외부로부터 입력될 것일 수 있다.Referring to FIG. 6 , according to various embodiments, the first de-identification model 446 includes a received image (eg, virtual face and body generation learning data from the virtual image generation learning database 444 of FIG. 4 ), the received image It can be generated by learning based on information extracted from and random noise. The received image may include a part corresponding to at least one of a face and a body. The information extracted from the received image may include information on any one of the characteristics of elements constituting at least one of a face and a body. The received image may be supplied from a virtual image generation learning database (eg, the virtual image generation learning database 444 of FIG. 4 ) that is an output of a segmentation model (eg, the segmentation model 442 of FIG. 4 ). For example, the received image may be virtual face and body generation learning data included in the virtual image generation learning database 444 . Random noise may be input from the outside.

다양한 실시예에 따르면, 제1 비식별화 모델(446)은 생성기(610) 및 판별기(630)를 포함할 수 있다. 제1 비식별화 모델(446)은 수신 이미지에서 얼굴 및 신체 중 적어도 어느 하나에 대한 정보를 추출할 수 있다. 추출된 정보는 수신 이미지에 포함된 얼굴 및 신체 중 적어도 어느 하나를 구성하는 요소의 특징 중에서 적어도 어느 하나에 대한 정보를 포함할 수 있다.According to various embodiments, the first de-identification model 446 may include a generator 610 and a discriminator 630 . The first de-identification model 446 may extract information about at least one of a face and a body from the received image. The extracted information may include information on at least one of features of elements constituting at least one of a face and a body included in the received image.

다양한 실시예에 따르면, 생성기(610) 및 판별기(630)는 GAN 기반 네트워크를 포함할 수 있다. 생성기(610)는 추출된 정보 및 랜덤 노이즈에 기초하여 수신 이미지에 포함된 얼굴 및 신체 중 적어도 어느 하나에 대응하는 가상 이미지를 생성하도록 학습될 수 있다. 생성기(610)는 추출된 정보에 기초하여 수신 이미지에 포함된 얼굴 및 신체 중 적어도 어느 하나가 가지는 요소의 특징을 유지하는 것을 조건으로 가상 이미지를 생성하도록 학습될 수 있다. 가상 이미지에 포함된 얼굴 및 신체 중 적어도 어느 하나는 수신 이미지에 포함된 얼굴 및 신체 중 적어도 어느 하나와 전혀 다른 생김새일 수 있고, 크기는 동일할 수 있다.According to various embodiments, generator 610 and discriminator 630 may include a GAN-based network. The generator 610 may be trained to generate a virtual image corresponding to at least one of a face and a body included in the received image based on the extracted information and random noise. The generator 610 may be trained to generate a virtual image based on the extracted information under the condition that features of an element of at least one of a face and a body included in the received image are maintained. At least one of the face and body included in the virtual image may have a completely different appearance and may have the same size as at least one of the face and body included in the received image.

다양한 실시예에 따르면, 제1 비식별화 모델(446)은 수신 이미지의 위치에 기초하여 제1 학습 데이터에 가상 이미지를 합성한 합성 이미지를 생성하고, 합성 이미지를 출력할 수 있다. 예를 들어, 제1 학습 데이터에 포함된 객체가 보행자일 경우, 제1 비식별화 모델(446)은 보행자의 얼굴 및 신체 중 적어도 어느 하나가 분할된 위치에 가상의 얼굴 및 가상의 신체 중 적어도 어느 하나를 합성할 수 있다.According to various embodiments, the first de-identification model 446 may generate a synthesized image by synthesizing a virtual image with the first training data based on the location of the received image, and output the synthesized image. For example, if the object included in the first learning data is a pedestrian, the first de-identification model 446 may perform at least one of the virtual face and the virtual body at a location where at least one of the pedestrian's face and body is divided. Either one can be synthesized.

다양한 실시예에 따르면, 판별기(630)는 수신 이미지 및 수신 이미지에서 추출된 정보에 기초하여 가상 이미지의 참/거짓 여부를 판별하도록 학습될 수 있다. 판별기(630)의 출력은 참 또는 거짓 중의 하나로 출력될 수 있다. 판별기(630)의 출력은 제1 비식별화 모델(446)에 포함된 생성기(610) 및 판별기(630)에 입력되어 피드백으로 작용할 수 있다.According to various embodiments, the determiner 630 may learn to determine whether a virtual image is true/false based on a received image and information extracted from the received image. The output of the discriminator 630 may be output as either true or false. An output of the discriminator 630 may be input to the generator 610 and the discriminator 630 included in the first de-identification model 446 to act as feedback.

도 7은 다양한 실시예에 따른 제2 비식별화 모델을 생성하는 동작을 설명하기 위한 도면이다.7 is a diagram for explaining an operation of generating a second de-identification model according to various embodiments.

도 7을 참조하면, 다양한 실시예에 따르면, 제2 비식별화 모델(448)은 수신 이미지(예: 도 4의 가상 영상 생성 학습 데이터베이스(444) 중 가상 텍스트 플레이트 생성 학습 데이터)에 기초하여 학습됨으로써 생성될 수 있다. 수신 이미지는 텍스트 플레이트(예: 차량 번호판, 명판, 간판 등)에 상응하는 부분을 포함할 수 있다. 수신 이미지는 분할 모델(예: 도 4의 분할 모델(442))의 출력인 가상 영상 생성 학습 데이터베이스(예: 도 4의 가상 영상 생성 학습 데이터 (444))에서 공급될 수 있다. 예를 들어, 수신 이미지는 가상 영상 생성 학습 데이터 베이스(444)에 포함된 가상 텍스트 플레이트(text plate) 생성 학습 데이터일 수 있다. Referring to FIG. 7 , according to various embodiments, the second de-identification model 448 is trained based on a received image (eg, virtual text plate generation training data among the virtual image generation learning database 444 of FIG. 4 ). can be created by The received image may include a portion corresponding to a text plate (eg, license plate, name plate, signboard, etc.). The received image may be supplied from a virtual image generation learning database (eg, virtual image generation training data 444 of FIG. 4 ) that is an output of a segmentation model (eg, segmentation model 442 of FIG. 4 ). For example, the received image may be virtual text plate generation training data included in the virtual image generation training database 444 .

다양한 실시예에 따르면, 제2 비식별화 모델(448)은 제1 추출 모듈(710), 제2 추출 모듈(730), 변경 모듈(750), 합성 모듈(770), 및 GAN 기반 네트워크(790)를 포함할 수 있다. 제1 추출 모듈(710)은 수신 이미지에서 텍스트(예: 한글, 영어, 숫자 등)에 대응되는 특정한 부분을 추출할 수 있다. 제2 추출 모듈(720)은 수신 이미지에서 특정한 부분을 제외한 나머지를 추출할 수 있다.According to various embodiments, the second de-identification model 448 includes a first extraction module 710, a second extraction module 730, a modification module 750, a synthesis module 770, and a GAN-based network 790. ) may be included. The first extraction module 710 may extract a specific part corresponding to text (eg, Korean, English, numbers, etc.) from the received image. The second extraction module 720 may extract the received image except for a specific part.

다양한 실시예에 따르면, GAN 기반 네트워크(790)는 제2 추출 모듈로부터 추출되는 부분에 기초하여 텍스트 플레이트의 유형(예: 신형 자동차의 번호판, 구형 자동차의 번호판, 전기차의 번호판, 명판, 간판 등)을 파악하도록 학습될 수 있다. GAN 기반 네트워크(790)는 텍스트 플레이트의 유형이 기재된 라벨을 생성하고 유형이 기재된 라벨을 출력하도록 학습될 수 있다.According to various embodiments, the GAN-based network 790 determines the type of text plate (eg, license plate of a new car, license plate of an old car, license plate of an electric vehicle, nameplate, signboard, etc.) based on the part extracted from the second extraction module. can be learned to grasp. The GAN-based network 790 can be trained to generate a label with the type of text plate written therein and output a label with the type written therein.

다양한 실시예에 따르면, 변경 모듈(750)은 제1 추출 모듈(710)에 의해 추출된 특정한 부분이 변경된 텍스트를 생성할 수 있다. 변경 모듈(750)은 텍스트(예: 한글, 영어, 숫자 등)를 변경한 텍스트를 생성할 수 있다. 변경 모듈(750)은 텍스트를 규칙에 따라 변경하거나 규칙에 상관없이 랜덤하게 변경할 수 있다.According to various embodiments, the change module 750 may generate text in which a specific part extracted by the first extraction module 710 is changed. The change module 750 may generate text by changing text (eg, Korean, English, numbers, etc.). The change module 750 may change text according to rules or randomly regardless of rules.

다양한 실시예에 따르면, 합성 모듈(770)은 라벨에 기재된 유형(예: 신형 자동차의 번호판, 구형 자동차의 번호판, 전기차의 번호판, 명판, 간판 등)에 상응하는 이미지(예: 신형 자동차의 번호판 이미지, 구형 자동차의 번호판 이미지, 전기차의 번호판 이미지, 명판 이미지, 간판 이미지 등)에 변경된 텍스트를 합성하여 합성 이미지를 생성하고, 합성 이미지를 출력할 수 있다.According to various embodiments, the synthesizing module 770 may perform an image (eg, a license plate image of a new car) corresponding to a type described on a label (eg, a license plate of a new car, a license plate of an old car, a license plate of an electric vehicle, a name plate, a signboard, etc.) , License plate image of an old car, license plate image of an electric vehicle, name plate image, sign image, etc.) and the changed text are synthesized to create a synthesized image, and the synthesized image can be output.

다양한 실시예에 따르면, 제2 비식별화 모델(448)은 제1 비식별화 모델(446)과 병렬적으로 학습될 수도 있다. 제1 비식별화 모델(446) 및 제2 비식별화 모델(448)의 학습은 순서 및 시기에 있어 무관하다.According to various embodiments, the second de-identification model 448 may be trained in parallel with the first de-identification model 446 . The learning of the first de-identification model 446 and the second de-identification model 448 is independent of order and timing.

도 8은 다양한 실시예에 따른 전자 장치의 동작 방법의 일 예에 대한 흐름도이다.8 is a flowchart of an example of a method of operating an electronic device according to various embodiments.

동작 810 및 동작 820은 전자 장치(100)가 전자 장치(100)에 입력된 원본 미디어(예: 정지 이미지, 동영상 이미지, 3차원 이미지, 비디오)의 개인식별정보를 비식별화하는 동작을 설명하기 위한 것일 수 있다.Operations 810 and 820 describe operations for the electronic device 100 to de-identify personal identification information of original media (eg, still images, moving images, 3D images, and videos) input to the electronic device 100. may be for

동작 810에서, 전자 장치(100)는 객체 탐지기(예: 도 1의 객체 탐지기(110))에 원본 미디어를 입력해서 원본 미디어가 영상 여부를 판단할 수 있다. 전자 장치(100)는 원본 미디어의 영상 여부에 따라 방법을 달리하여 객체를 탐지할 수 있다. 원본 미디어가 영상이 아닌 이미지일 경우, 전자 장치(100)는 오브젝트 디텍션에 의해 객체를 탐지할 수 있다. 원본 미디어가 영상인 경우, 전자 장치(100)는 오브젝트 트래킹에 의해 객체를 탐지할 수 있다. 전자 장치(100)는 원본 미디어로부터 하나 이상의 객체를 탐지하여 제1 이미지를 획득할 수 있다.In operation 810, the electronic device 100 inputs the original media to an object detector (eg, the object detector 110 of FIG. 1) and determines whether the original media is an image. The electronic device 100 may detect the object in a different way depending on whether or not the original media is an image. If the original media is an image rather than a video, the electronic device 100 may detect the object through object detection. If the original media is an image, the electronic device 100 may detect the object through object tracking. The electronic device 100 may acquire the first image by detecting one or more objects from the original media.

동작 820에서, 전자 장치(100)는 제1 이미지를 비식별화 모델(140)에 입력해서 제1 이미지의 개인식별정보만 비식별화된 제2 이미지를 생성할 수 있다. 전자 장치(100)는 제1 이미지에 포함된 개인식별정보를 분할한 이미지를 생성할 수 있다. 전자 장치(100)는 객체의 종류에 따라 분할된 이미지에 대응하는 가상 이미지를 생성할 수 있다. 전자 장치(100)는 분할된 이미지의 위치에 기초하여 원본 미디어에 가상 이미지를 합성하여 합성 이미지(예: 제1 이미지의 개인식별정보가 비식별화된 제2 이미지)를 생성할 수 있다.In operation 820, the electronic device 100 may input the first image to the de-identification model 140 to generate a second image in which only the personal identification information of the first image is de-identified. The electronic device 100 may create an image obtained by dividing the personal identification information included in the first image. The electronic device 100 according to the type of object A virtual image corresponding to the segmented image may be created. The electronic device 100 may generate a composite image (eg, a second image in which personal identification information of the first image is de-identified) by synthesizing a virtual image with original media based on the location of the divided image.

도 9는 다양한 실시예에 따른 전자 장치의 동작 방법의 다른 예에 대한 흐름도이다.9 is a flowchart of another example of a method of operating an electronic device according to various embodiments.

동작 910 내지 동작 930은 전자 장치(예: 도 4의 전자 장치(400))가 비식별화 모델을 생성하는 동작을 설명하기 위한 것일 수 있다.Operations 910 to 930 may be for describing operations of generating a de-identification model by an electronic device (eg, the electronic device 400 of FIG. 4 ).

동작 910에서, 전자 장치(400)는 제1 학습 데이터를 획득할 수 있다. 제1 학습 데이터는 하나 이상의 객체를 포함할 수 있다.In operation 910, the electronic device 400 may acquire first learning data. The first learning data may include one or more objects.

동작 920에서, 전자 장치(400)는 추출 오픈소스(예: 도 4의 추출 오픈소스(412))에 제1 학습 데이터를 입력하여 제1 학습 데이터의 개인식별정보에 대응하는 부분이 추출된 제2 학습 데이터를 생성할 수 있다. 제1 학습 데이터 및 제2 학습 데이터는 쌍으로 존재할 수 있으며, 개인식별정보 학습 데이터베이스(예: 도 4의 개인식별정보 학습 데이터베이스(414))는 제1 학습 데이터 및 제2 학습 데이터의 쌍을 저장할 수 있다.In operation 920, the electronic device 400 inputs the first learning data to the extracted open source (eg, the extracted open source 412 of FIG. 4), and the part corresponding to the personal identification information of the first learning data is extracted. 2 Can generate learning data. The first learning data and the second learning data may exist in pairs, and the personal identification information learning database (eg, the personal identification information learning database 414 of FIG. 4 ) stores the first learning data and the second learning data pair. can

동작 930에서, 전자 장치(400)는 제1 학습 데이터 및 제2 학습 데이터에 기초하여 비식별화 모델(예: 도 4의 비식별화 모델(440))을 생성(예: 학습)할 수 있다. 예를 들어, 전자 장치(400)는 제1 학습 데이터 및 제2 학습 데이터에 기초하여 제1 학습 데이터로부터 개인식별정보에 대응하는 부분을 분할하는 비식별화 모델(440)을 생성(예: 학습)할 수 있다. 전자 장치(400)는 개인식별정보에 대응하는 부분과 상응하는 가상 이미지를 생성하는 비식별화 모델(440)을 생성할 수 있다. 전자 장치(100)는 제1 학습 데이터에 가상 이미지를 합성하여 제1 학습 데이터의 개인식별정보를 비식별화하는 비식별화 모델(440)을 생성할 수 있다.In operation 930, the electronic device 400 may generate (eg, learn) a de-identification model (eg, the de-identification model 440 of FIG. 4) based on the first training data and the second training data. . For example, the electronic device 400 generates a de-identification model 440 that divides a part corresponding to personal identification information from the first learning data based on the first learning data and the second learning data (eg, learning )can do. The electronic device 400 may generate a de-identification model 440 that generates a virtual image corresponding to a portion corresponding to personal identification information. The electronic device 100 may generate a de-identification model 440 that de-identifies personal identification information of the first training data by synthesizing a virtual image with the first training data.

도 10은 다양한 실시예에 따른, 전자 장치의 다른 예를 나타낸다.10 illustrates another example of an electronic device according to various embodiments.

도 10을 참조하면, 다양한 실시예에 따르면, 비식별화 장치(1000)는 도 1의 전자 장치(100) 및/또는 도 4의 전자 장치(400)와 실질적으로 동일할 수 있다.Referring to FIG. 10 , according to various embodiments, a de-identification device 1000 may be substantially the same as the electronic device 100 of FIG. 1 and/or the electronic device 400 of FIG. 4 .

메모리(1010)는 프로세서(1030)에 의해 실행가능한 인스트럭션들(예: 프로그램)을 저장할 수 있다. 예를 들어, 인스트럭션들은 프로세서(1030)의 동작 및/또는 프로세서(1030)의 각 구성의 동작을 실행하기 위한 인스트럭션들을 포함할 수 있다.The memory 1010 may store instructions (eg, programs) executable by the processor 1030 . For example, the instructions may include instructions for executing an operation of the processor 1030 and/or an operation of each component of the processor 1030 .

프로세서(1030)는 메모리(1010)에 저장된 데이터를 처리할 수 있다. 프로세서(1030)는 메모리(1010)에 저장된 컴퓨터로 읽을 수 있는 코드(예를 들어, 소프트웨어) 및 프로세서(1030)에 의해 유발된 인스트럭션(instruction)들을 실행할 수 있다.The processor 1030 may process data stored in the memory 1010 . The processor 1030 may execute computer readable code (eg, software) stored in the memory 1010 and instructions triggered by the processor 1030 .

프로세서(1030)는 목적하는 동작들(desired operations)을 실행시키기 위한 물리적인 구조를 갖는 회로를 가지는 하드웨어로 구현된 데이터 처리 장치일 수 있다. 예를 들어, 목적하는 동작들은 프로그램에 포함된 코드(code) 또는 인스트럭션들(instructions)을 포함할 수 있다.The processor 1030 may be a data processing device implemented in hardware having a circuit having a physical structure for executing desired operations. For example, desired operations may include codes or instructions included in a program.

예를 들어, 하드웨어로 구현된 데이터 처리 장치는 마이크로프로세서(microprocessor), 중앙 처리 장치(central processing unit), 프로세서 코어(processor core), 멀티-코어 프로세서(multi-core processor), 멀티프로세서(multiprocessor), ASIC(Application-Specific Integrated Circuit), FPGA(Field Programmable Gate Array)를 포함할 수 있다.For example, a data processing unit implemented in hardware includes a microprocessor, a central processing unit, a processor core, a multi-core processor, and a multiprocessor. , Application-Specific Integrated Circuit (ASIC), and Field Programmable Gate Array (FPGA).

프로세서(1030)에 의해 수행되는 동작은 도 1 내지 도 3을 참조하여 설명한 전자 장치(100)의 동작과 실질적으로 동일할 수 있다. 도 1 내지 도 3에서 설명한 전자 장치(100)의 각 구성(예: 객체 탐지기(110), 및 비식별화 모델(140))은 프로세서(1030)에 의해 실행될 수 있다. 또한, 프로세서(1030)에 의해 수행되는 동작은 도 4 내지 도 7을 참조하여 설명한 전자 장치(400)의 동작과 실질적으로 동일할 수 있다. 이에, 상세한 설명은 생략하도록 한다.An operation performed by the processor 1030 may be substantially the same as that of the electronic device 100 described with reference to FIGS. 1 to 3 . Each component of the electronic device 100 described in FIGS. 1 to 3 (eg, the object detector 110 and the de-identification model 140) may be executed by the processor 1030. Also, an operation performed by the processor 1030 may be substantially the same as that of the electronic device 400 described with reference to FIGS. 4 to 7 . Accordingly, detailed descriptions will be omitted.

이상에서 설명된 실시예들은 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치, 방법 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 컨트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The embodiments described above may be implemented as hardware components, software components, and/or a combination of hardware components and software components. For example, the devices, methods and components described in the embodiments may include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate (FPGA). array), programmable logic units (PLUs), microprocessors, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and software applications running on the operating system. A processing device may also access, store, manipulate, process, and generate data in response to execution of software. For convenience of understanding, there are cases in which one processing device is used, but those skilled in the art will understand that the processing device includes a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that it can include. For example, a processing device may include a plurality of processors or a processor and a controller. Other processing configurations are also possible, such as parallel processors.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.Software may include a computer program, code, instructions, or a combination of one or more of the foregoing, which configures a processing device to operate as desired or processes independently or collectively. You can command the device. Software and/or data may be any tangible machine, component, physical device, virtual equipment, computer storage medium or device, intended to be interpreted by or provide instructions or data to a processing device. , or may be permanently or temporarily embodied in a transmitted signal wave. Software may be distributed on networked computer systems and stored or executed in a distributed manner. Software and data may be stored on computer readable media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 저장할 수 있으며 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer readable medium. The computer readable medium may store program instructions, data files, data structures, etc. alone or in combination, and the program instructions recorded on the medium may be specially designed and configured for the embodiment or may be known and usable to those skilled in the art of computer software. there is. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. - includes hardware devices specially configured to store and execute program instructions, such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of program instructions include high-level language codes that can be executed by a computer using an interpreter, as well as machine language codes such as those produced by a compiler.

위에서 설명한 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 또는 복수의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The hardware device described above may be configured to operate as one or a plurality of software modules to perform the operations of the embodiments, and vice versa.

이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 이를 기초로 다양한 기술적 수정 및 변형을 적용할 수 있다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.As described above, although the embodiments have been described with limited drawings, those skilled in the art can apply various technical modifications and variations based on this. For example, the described techniques may be performed in an order different from the method described, and/or components of the described system, structure, device, circuit, etc. may be combined or combined in a different form than the method described, or other components may be used. Or even if it is replaced or substituted by equivalents, appropriate results can be achieved.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents of the claims are within the scope of the following claims.

Claims (18)

개인식별정보를 비식별화하는 비식별화 모델을 생성하는 방법에 있어서,
제1 학습 데이터에서 하나 이상의 객체를 분할한 제2 학습 데이터를 생성하는 동작; 및
상기 제1 학습 데이터 및 상기 제2 학습 데이터에 기초하여 비식별화 모델을 생성하는 동작을 포함하는,
비식별화 모델 생성 방법.
In the method of generating a de-identification model for de-identification of personally identifiable information,
generating second training data by dividing one or more objects from the first training data; and
Generating a de-identification model based on the first training data and the second training data,
How to create a de-identification model.
제1항에 있어서,
상기 비식별화 모델을 생성하는 동작은,
상기 제1 학습 데이터 및 상기 제2 학습 데이터를 상기 비식별화 모델에 포함된 분할 모델에 입력시켜 상기 분할 모델을 학습시키는 동작
을 포함하는, 비식별화 모델 생성 방법.
According to claim 1,
The operation of generating the de-identification model,
An operation of inputting the first training data and the second training data to a segmentation model included in the de-identification model to learn the segmentation model.
Including, non-identification model generation method.
제2항에 있어서,
상기 비식별화 모델을 생성하는 동작은,
상기 분할 모델의 출력인 가상 영상 생성 학습 데이터 중 가상 얼굴 및 신체 생성 학습 데이터를 상기 비식별화 모델에 포함된 제1 비식별화 모델에 입력시켜 상기 제1 비식별화 모델을 학습시키는 동작
을 더 포함하는, 비식별화 모델 생성 방법.
According to claim 2,
The operation of generating the de-identification model,
An operation of learning the first de-identification model by inputting virtual face and body generation learning data among virtual image generation learning data, which are outputs of the segmentation model, to a first de-identification model included in the de-identification model.
Further comprising, non-identification model generation method.
제3항에 있어서,
상기 비식별화 모델을 생성하는 동작은,
상기 분할 모델의 출력인 가상 영상 생성 학습 데이터 중 가상 텍스트 플레이트(text plate) 생성 학습 데이터를 상기 비식별화 모델에 포함된 제2 비식별화 모델에 입력시켜 상기 제2 비식별화 모델을 학습시키는 동작
을 더 포함하는, 비식별화 모델 생성 방법.
According to claim 3,
The operation of generating the de-identification model,
Training the second de-identification model by inputting virtual text plate generation learning data among virtual image generation learning data, which is an output of the segmentation model, to a second de-identification model included in the de-identification model movement
Further comprising, non-identification model generation method.
제4항에 있어서,
상기 제1 비식별화 모델 및 상기 제2 비식별화 모델을 병렬적으로 학습시키는 동작
을 더 포함하는, 비식별화 모델 생성 방법.
According to claim 4,
Learning the first de-identification model and the second de-identification model in parallel
Further comprising, non-identification model generation method.
개인식별정보 비식별화 방법에 있어서,
원본 미디어로부터 하나 이상의 객체를 탐지하여 제1 이미지를 획득하는 동작;
상기 제1 이미지의 개인식별정보만 비식별화된 제2 이미지를 생성하는 동작
을 포함하는, 개인식별정보 비식별화 방법.
In the method of de-identifying personally identifiable information,
acquiring a first image by detecting one or more objects from the original media;
An operation of generating a second image in which only the personal identification information of the first image is de-identified.
Including, personally identifiable information de-identification method.
제6항에 있어서,
상기 제1 이미지를 획득하는 동작은,
상기 원본 미디어가 연속된 이미지로 이루어진 영상인 경우, 상기 원본 미디어에 오브젝트 트래킹(object tracking)을 수행하여 상기 제1 이미지를 획득하는 동작
을 포함하는, 개인식별정보 비식별화 방법.
According to claim 6,
The operation of obtaining the first image,
Obtaining the first image by performing object tracking on the original media when the original media is a video composed of continuous images.
Including, personally identifiable information de-identification method.
제6항에 있어서,
상기 비식별화된 제2 이미지를 생성하는 동작은,
상기 제1 이미지로부터 개인식별정보만 분할된 이미지를 생성하는 동작
을 포함하는, 개인식별정보 비식별화 방법.
According to claim 6,
The operation of generating the de-identified second image,
An operation of generating an image in which only personal identification information is divided from the first image
Including, personally identifiable information de-identification method.
제8항에 있어서,
상기 비식별화된 제2 이미지를 생성하는 동작은,
상기 분할된 이미지에 대응하는 가상 이미지를 생성하는 동작
을 더 포함하는, 개인식별정보 비식별화 방법.
According to claim 8,
The operation of generating the de-identified second image,
An operation of generating a virtual image corresponding to the divided image
Further comprising, personally identifiable information de-identification method.
제9항에 있어서,
상기 비식별화된 제2 이미지를 생성하는 동작은,
상기 원본 미디어에 상기 가상 이미지를 합성하는 동작
을 더 포함하는, 개인식별정보 비식별화 방법.
According to claim 9,
The operation of generating the de-identified second image,
An operation of combining the virtual image with the original media
Further comprising, personally identifiable information de-identification method.
제9항에 있어서,
상기 가상 이미지는,
상기 개인식별정보가 얼굴 및 신체 중 적어도 어느 하나인 경우,
상기 분할된 이미지에 대응하는 가상 얼굴 및 가상 신체 중 적어도 어느 하나를 포함하고,
상기 개인식별정보가 텍스트 플레이트인 경우,
상기 분할된 이미지에 대응하는 가상 텍스트 플레이트(text plate)를 포함하는, 개인식별정보 비식별화 방법.
According to claim 9,
The virtual image,
If the personal identification information is at least one of face and body,
Includes at least one of a virtual face and a virtual body corresponding to the divided image;
If the personal identification information is a text plate,
A method for de-identifying personal identification information comprising a virtual text plate corresponding to the divided image.
하드웨어와 결합되어 제1항 내지 제11항 중 어느 하나의 항의 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된 컴퓨터 프로그램
A computer program stored in a computer readable recording medium in order to execute the method of any one of claims 1 to 11 in combination with hardware
개인식별정보를 비식별화하는 장치에 있어서,
인스트럭션들을 포함하는 메모리; 및
상기 메모리와 전기적으로 연결되고, 상기 인스트럭션들을 실행하기 위한 프로세서
를 포함하고,
상기 프로세서에 의해 상기 인스트럭션들이 실행될 때, 상기 프로세서는,
원본 미디어로부터 하나 이상의 객체를 탐지하여 제1 이미지를 획득하고,
상기 제1 이미지의 개인식별정보만 비식별화된 제2 이미지를 생성하는, 장치.
In the device for de-identifying personally identifiable information,
memory containing instructions; and
A processor electrically connected to the memory and configured to execute the instructions
including,
When the instructions are executed by the processor, the processor:
Obtaining a first image by detecting one or more objects from the original media;
An apparatus for generating a second image in which only personal identification information of the first image is de-identified.
제13항에 있어서,
상기 프로세서는,
상기 원본 미디어가 연속된 이미지로 이루어진 영상인 경우, 상기 원본 미디어에 오브젝트 트래킹(object tracking)을 수행하여 상기 제1 이미지를 획득하는, 장치.
According to claim 13,
the processor,
If the original media is a video consisting of continuous images, obtaining the first image by performing object tracking on the original media.
제13항에 있어서,
상기 프로세서는,
상기 제1 이미지로부터 개인식별정보만 분할된 이미지를 생성하는, 장치.
According to claim 13,
the processor,
An apparatus for generating an image in which only personal identification information is divided from the first image.
제15항에 있어서,
상기 프로세서는,
상기 분할된 이미지에 대응하는 가상 이미지를 생성하는, 장치.
According to claim 15,
the processor,
An apparatus for generating a virtual image corresponding to the divided image.
제16항에 있어서,
상기 프로세서는,
상기 원본 미디어에 상기 가상 이미지를 합성하는, 장치.
According to claim 16,
the processor,
An apparatus for synthesizing the virtual image on the original media.
제16항에 있어서,
상기 가상 이미지는,
상기 개인식별정보가 얼굴 및 신체 중 적어도 어느 하나인 경우,
상기 분할된 이미지에 대응하는 가상 얼굴 및 가상 신체 중 적어도 어느 하나를 포함하고,
상기 개인식별정보가 텍스트 플레이트인 경우,
상기 분할된 이미지에 대응하는 가상 텍스트 플레이트(text plate)를 포함하는, 장치.

According to claim 16,
The virtual image,
If the personal identification information is at least one of face and body,
Includes at least one of a virtual face and a virtual body corresponding to the divided image;
If the personal identification information is a text plate,
and a virtual text plate corresponding to the segmented image.

KR1020220096384A 2021-02-26 2022-08-02 Method for de-identifying personally identifiable information contained in video data, and device performing the same KR20230038088A (en)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
KR20210026491 2021-02-26
KR1020210120917A KR20220122458A (en) 2021-02-26 2021-09-10 Method for de-identifying text plate contained in video data, and device performing the same
KR1020210120899A KR20220122456A (en) 2021-02-26 2021-09-10 Method for de-identifying personally identifiable information contained in video data, and device performing the same
KR1020210120899 2021-09-10
KR1020210120917 2021-09-10
KR1020210120907 2021-09-10
KR1020210120907A KR20220122457A (en) 2021-02-26 2021-09-10 Method for de-identifying face and body contained in video data, and device performing the same

Publications (1)

Publication Number Publication Date
KR20230038088A true KR20230038088A (en) 2023-03-17

Family

ID=83280940

Family Applications (7)

Application Number Title Priority Date Filing Date
KR1020210120899A KR20220122456A (en) 2021-02-26 2021-09-10 Method for de-identifying personally identifiable information contained in video data, and device performing the same
KR1020210120907A KR20220122457A (en) 2021-02-26 2021-09-10 Method for de-identifying face and body contained in video data, and device performing the same
KR1020210120917A KR20220122458A (en) 2021-02-26 2021-09-10 Method for de-identifying text plate contained in video data, and device performing the same
KR1020210120890A KR20220122455A (en) 2021-02-26 2021-09-10 Method for segmenting object contained in video data, and device performing the same
KR1020220096384A KR20230038088A (en) 2021-02-26 2022-08-02 Method for de-identifying personally identifiable information contained in video data, and device performing the same
KR1020220096380A KR102665700B1 (en) 2021-02-26 2022-08-02 Method for de-identifying text plate contained in video data, and device performing the same
KR1020220096372A KR20230038086A (en) 2021-02-26 2022-08-02 Method for de-identifying face and body contained in video data, and device performing the same

Family Applications Before (4)

Application Number Title Priority Date Filing Date
KR1020210120899A KR20220122456A (en) 2021-02-26 2021-09-10 Method for de-identifying personally identifiable information contained in video data, and device performing the same
KR1020210120907A KR20220122457A (en) 2021-02-26 2021-09-10 Method for de-identifying face and body contained in video data, and device performing the same
KR1020210120917A KR20220122458A (en) 2021-02-26 2021-09-10 Method for de-identifying text plate contained in video data, and device performing the same
KR1020210120890A KR20220122455A (en) 2021-02-26 2021-09-10 Method for segmenting object contained in video data, and device performing the same

Family Applications After (2)

Application Number Title Priority Date Filing Date
KR1020220096380A KR102665700B1 (en) 2021-02-26 2022-08-02 Method for de-identifying text plate contained in video data, and device performing the same
KR1020220096372A KR20230038086A (en) 2021-02-26 2022-08-02 Method for de-identifying face and body contained in video data, and device performing the same

Country Status (1)

Country Link
KR (7) KR20220122456A (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240061709A (en) * 2022-11-01 2024-05-08 (주) 경성테크놀러지 A service provision system that can de-identify personal information included in video screens
KR102515011B1 (en) * 2022-11-15 2023-03-29 주식회사 디비엔텍 Method and system for improving performance of de-identification of personal information in video
KR102533512B1 (en) * 2022-11-17 2023-05-18 (주)에이아이딥 Personal information object detection method and device

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101873576B1 (en) * 2016-10-31 2018-07-03 한국전자통신연구원 System and method for recognizing information from vehicle license plate

Also Published As

Publication number Publication date
KR20220122457A (en) 2022-09-02
KR20230038087A (en) 2023-03-17
KR20220122455A (en) 2022-09-02
KR20230038086A (en) 2023-03-17
KR102665700B1 (en) 2024-05-14
KR20220122458A (en) 2022-09-02
KR20220122456A (en) 2022-09-02

Similar Documents

Publication Publication Date Title
US11604964B2 (en) Recognizer, object recognition method, learning apparatus, and learning method for domain adaptation
Peng et al. Chained-tracker: Chaining paired attentive regression results for end-to-end joint multiple-object detection and tracking
US10614310B2 (en) Behavior recognition
Wodajo et al. Deepfake video detection using convolutional vision transformer
Zhu et al. Cms-rcnn: contextual multi-scale region-based cnn for unconstrained face detection
KR20230038088A (en) Method for de-identifying personally identifiable information contained in video data, and device performing the same
JP6446971B2 (en) Data processing apparatus, data processing method, and computer program
Zeng et al. Contrastive learning of global and local video representations
KR20200077321A (en) Semantic object region segmentation method and system based on weak map learning object detector
KR20190091806A (en) Video sequences generating system using generative adversarial networks and the method thereof
CN109905385A (en) A kind of webshell detection method, apparatus and system
CN112990122B (en) Complex behavior identification method based on video basic unit analysis
KR102664916B1 (en) Method and apparatus for performing behavior prediction using Explanable Self-Focused Attention
KR102185979B1 (en) Method and apparatus for determining type of movement of object in video
US12020510B2 (en) Person authentication apparatus, control method, and non-transitory storage medium
Chen et al. Online spatio-temporal action detection in long-distance imaging affected by the atmosphere
Sarma et al. Real-Time Indian Sign Language Recognition System using YOLOv3 Model
Do et al. Hand detection and tracking in videos for fine-grained action recognition
Yu et al. Reading digital video clocks
KR20200066134A (en) Method and device for multimodal character identification on multiparty dialogues
Gong et al. A Simple Mixed-Supervised Learning Method for Salient Object Detection
Xu et al. BPN: Bidirectional path network for instance segmentation
Yu et al. Reading Two Digital Video Clocks for Broadcast Basketball Videos
KR20230044787A (en) Method for augmenting training data specialized in object detection and device performing the same
US20230179496A1 (en) Method for detecting anomaly in time series data and computing device for executing the method

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application
E601 Decision to refuse application
E801 Decision on dismissal of amendment