KR20230053276A - A global cloud system providing regional independence - Google Patents

A global cloud system providing regional independence Download PDF

Info

Publication number
KR20230053276A
KR20230053276A KR1020210136622A KR20210136622A KR20230053276A KR 20230053276 A KR20230053276 A KR 20230053276A KR 1020210136622 A KR1020210136622 A KR 1020210136622A KR 20210136622 A KR20210136622 A KR 20210136622A KR 20230053276 A KR20230053276 A KR 20230053276A
Authority
KR
South Korea
Prior art keywords
data
region
cloud system
regional
independence
Prior art date
Application number
KR1020210136622A
Other languages
Korean (ko)
Inventor
노성운
오승진
Original Assignee
주식회사 인피닉
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 인피닉 filed Critical 주식회사 인피닉
Priority to KR1020210136622A priority Critical patent/KR20230053276A/en
Publication of KR20230053276A publication Critical patent/KR20230053276A/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/604Tools and structures for managing or administering access control systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/44Star or tree networks

Abstract

The present invention proposes a global cloud system that secures regional independence for the annotation process of artificial intelligence (AI) learning data. The system divides the cloud system into multiple global regions, where personal information within one region is isolated to prevent leakage to other regions unless there is a special exception. The regions can be defined by national boundaries or by the extent to which the export of personal information is restricted. The region is divided into at least a first region and a second region, wherein the first region and the second region cannot exchange data directly with each other. Instead, the regions can exchange data only via a sink connected to the regions at the center of a star-network structure. The present invention solves the problem that personal information contained in data collected in a country may be exported to other countries.

Description

지역별 독립성을 확보하는 글로벌 클라우드 시스템{A global cloud system providing regional independence}A global cloud system providing regional independence}

본 발명은 지역별 독립성을 확보하는 글로벌 클라우드 시스템에 관한 것이다. 보다 상세하게는, 인공지능(Artificial Intelligence, AI) 기계 학습용 데이터의 어노테이션 작업에 있어서 지역별 독립성을 확보하는 글로벌 클라우드 시스템에 기록된 컴퓨터 프로그램에 관한 것이다.The present invention relates to a global cloud system that secures regional independence. More specifically, it relates to a computer program recorded in a global cloud system that secures regional independence in annotation of data for artificial intelligence (AI) machine learning.

인공지능(AI)은 인간의 학습능력, 추론능력 및 지각능력 등의 일부 또는 전부를 컴퓨터 프로그램을 이용하여 인공적으로 구현하는 기술을 의미한다. 인공지능(AI)과 관련하여, 기계 학습(machine learning)은 다수의 파라미터로 구성된 모델을 이용하여 주어진 데이터로 파라미터를 최적화하는 학습을 의미한다. 이와 같은, 기계 학습은 학습용 데이터의 형태에서 따라, 지도 학습(supervised learning), 비지도 학습(unsupervised learning) 및 강화 학습(reinforcement learning)으로 구분된다.Artificial intelligence (AI) refers to a technology that artificially implements some or all of human learning abilities, reasoning abilities, and perception abilities using computer programs. In relation to artificial intelligence (AI), machine learning refers to learning to optimize parameters with given data using a model composed of multiple parameters. Such machine learning is classified into supervised learning, unsupervised learning, and reinforcement learning according to the form of learning data.

일반적으로, 인공지능(AI) 학습용 데이터의 설계는 데이터 구조의 설계, 데이터의 수집, 데이터의 정제, 데이터의 가공, 데이터의 확장 및 데이터의 검증 단계로 진행된다.In general, designing data for artificial intelligence (AI) learning proceeds in the steps of data structure design, data collection, data refinement, data processing, data expansion, and data verification.

각각의 단계에서 대하여 보다 구체적으로 설명하면, 데이터 구조의 설계는 온톨로지(ontology) 정의, 분류 체계의 정의 등을 통해 이루어진다. 데이터의 수집은 직접 촬영, 웹 크롤링(web crawling) 또는 협회/전문 단체 등을 통해 데이터를 수집하여 이루어진다. 데이터 정제는 수집된 데이터 내에서 중복 데이터를 제거하고, 개인 정보 등을 비식별화하여 이루어진다. 데이터의 가공은 어노테이션(annotation)을 수행하고, 메타데이터(metadata)를 입력하여 이루어진다. 데이터의 확장은 온톨로지 매핑(mapping)을 수행하고, 필요에 따라 온톨로지를 보완하거나 확장하여 이루어진다. 그리고, 데이터의 검증은 다양한 검증 도구를 활용하여 설정된 목표 품질에 따른 유효성을 검증하여 이루어진다.To describe each step in more detail, data structure design is performed through ontology definition, classification system definition, and the like. Data collection is performed by collecting data through direct filming, web crawling, or associations/professional organizations. Data purification is performed by removing redundant data from collected data and de-identifying personal information. Data processing is performed by performing annotation and inputting metadata. Data extension is performed by performing ontology mapping and supplementing or extending the ontology as needed. In addition, data verification is performed by verifying validity according to the set target quality using various verification tools.

수집장치는 인공지능 학습을 위해 수집한 데이터는 단순히 몇 개에 불과한 수준이 아닌, 실시간으로 촬영된 매우 많은 수로 구성된다. 이와 같이 수집된 데이터를 ㅅ수집장치가 데이터 수집 서버에 수많은 raw data들을 전송하는데 많은 부담이 존재한다. 또한, 일반적으로 수집 장치는 실시간 촬영을 통해 raw data들을 수집하므로, 수집된 raw data 중에는 서로 유사하여 인공지능 학습 효율이 낮은 데이터들이 포함될 수 있어 데이터 관리의 효율성이 부각된다.The data collected by the collection device for artificial intelligence learning is composed of a very large number of images taken in real time, not just a few. There is a lot of burden for the data collection device to transmit a lot of raw data to the data collection server for the collected data in this way. In addition, since the collection device generally collects raw data through real-time shooting, among the collected raw data, similar data with low artificial intelligence learning efficiency may be included, thereby highlighting the efficiency of data management.

글로벌 영역에 있어서 수많은 원시 데이터를 클라우드에 배포하여 글로벌 특정 국가에서 어노테이션을 수행하는 것을 고려할 수 있는데, 어노테이션을 수행하는 작업자가 내국인으로 국내에 작업을 수행하지 않고 외국인으로 국외에서 작업을 수행할 경우, 해당 외국인의 개인정보가 타 국가로 반출되거나, 또는 해당 국가에서 수집된 데이터에 포함된 개인 정보가 타 국가로 반출될 수 있는 문제점이 있다. 이와 같은, 개인정보의 타 국가 반출은 국가별 개인정보보호법 등의 위법 소지가 존재하므, 하나의 국가 내에서만 개인정보가 처리되고, 타 국가로 반출되지 않도록 보호할 필요성이 존재한다.In the global area, it is possible to consider distributing a lot of raw data to the cloud and performing annotation in a specific global country. There is a problem that the personal information of the foreigner may be taken out to other countries, or personal information included in data collected in the country may be taken out to other countries. Since such transfer of personal information to other countries may be illegal under the Personal Information Protection Act of each country, there is a need to protect personal information from being processed only within one country and exported to other countries.

대한민국 공개특허공보 제10-2020-0042629호, ‘인공지능 학습을 위한 모바일 기기의 터치 기반 어노테이션과 이미지 생성 방법 및 그 장치’, (2020.04.24. 공개)Korean Patent Laid-open Publication No. 10-2020-0042629, ‘Method and apparatus for generating touch-based annotations and images in mobile devices for artificial intelligence learning’, (published on April 24, 2020)

본 발명의 일 목적은 본 발명은 인공지능(Artificial Intelligence, AI) 학습 데이터의 어노테이션 작업의 지역별 독립성을 확보하는 글로벌 클라우드 시스템을 제공하는 것이다.One object of the present invention is to provide a global cloud system that secures regional independence of annotation work of artificial intelligence (AI) learning data.

본 발명의 다른 목적은 해당 국가에서 수집된 데이터에 포함된 개인 정보가 타 국가로 반출될 수 있는 문제를 해소하는 글로벌 클라우드 시스템을 제공하는 것이다.Another object of the present invention is to provide a global cloud system that solves the problem that personal information included in data collected in a corresponding country may be exported to other countries.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The technical problems of the present invention are not limited to the technical problems mentioned above, and other technical problems not mentioned will be clearly understood by those skilled in the art from the following description.

상술한 바와 같은 기술적 과제를 달성하기 위하여, 본 발명은 인공지능(Artificial Intelligence, AI) 학습 데이터의 어노테이션 작업의 지역별 독립성을 확보하는 글로벌 클라우드 시스템을 제안한다. In order to achieve the technical problem as described above, the present invention proposes a global cloud system that secures regional independence of annotation work of artificial intelligence (AI) learning data.

본 발명의 일 실시예에 따른 인공지능(Artificial Intelligence, AI) 학습 데이터의 어노테이션 작업의 지역별 독립성을 확보하는 글로벌 클라우드 시스템은, 클라우드 시스템을 복수 개의 글로벌 지역으로 분류하고, 하나의 지역 내의 개인정보는 특별한 사전에 없는 한 다른 지역으로 유출될 수 없게 격리되며, 상기 지역은 국가 단위이거나 개인정보의 반출 제약이 미치는 지역 단위이며, 상기 지역은 적어도 제1 지역과 제2 지역으로 구분되되, 제1 지역과 제2 지역은 서로 직접 데이터를 교환할 수 없으며, star-network 구조의 중심에서 지역들과 연결된 싱크를 통해서만 데이터를 교환하는 것을 A global cloud system that secures regional independence of annotation work of artificial intelligence (AI) learning data according to an embodiment of the present invention classifies the cloud system into a plurality of global regions, and personal information within one region It is isolated so that it cannot be leaked to other areas unless there is a special prior notice, and the area is a national unit or a regional unit subject to restrictions on the export of personal information. and the second region cannot directly exchange data with each other, and exchange data only through a sink connected to the regions at the center of the star-network structure.

상기 지역은 프로젝트 단위로 설정될 수 있으며, 지역의 범위와 크기는 프로젝트의 속성, 어노테이션 작업자의 작성 능력에 따라 설정되는 것을 고려할 수 있다.The region may be set on a project-by-project basis, and it may be considered that the range and size of the region are set according to project attributes and annotator's writing ability.

싱크는 지역의 single storage의 개인정보에 직접 접근할 수 없고 공개가 허용된 일정 영역의 정보만을 접근이 가능하도록 설정된 것을 특징으로 하는 지역별 독립성을 확보하는 것을 고려할 수 있다.Sink can consider securing independence by region, which is characterized by being set to allow access only to information in a certain area permitted to be disclosed without direct access to personal information in a single storage in the region.

상기 싱크는 사용자가 접근하면, 사용자의 국가를 특정할 수 있는 정보(위치 값, 언어 등)를 기초로 사용자의 위치하고 있는 국가를 식별하고, 식별된 국가에서 접속할 수 있는 지역으로 연결해주는 역할을 수행하는 것을 고려할 수 있다.When a user approaches, the sink identifies the country where the user is located based on information (location value, language, etc.) that can specify the user's country, and plays a role in connecting the identified country to an accessible area. can consider doing

상기 싱크는 사용자가 업로드를 요청하면 해당 사용자에게 허용된 지역으로만 업로드를 허용하고, 다른 지역으로의 업로드를 차단하는 것을 고려할 수 있다.When a user requests upload, the sink may consider allowing upload only to a region permitted to the user and blocking upload to other regions.

본 발명의 실시 예들에 따르면, 글로벌 영역에 있어서 수많은 원시 데이터를 클라우드에 배포하여 글로벌 특정 국가에서 어노테이션을 수행하는 것을 고려할 수 있는데, 어노테이션을 수행하는 작업자가 내국인으로 국내에 작업을 수행하지 않고 외국인으로 국외에서 작업을 수행할 경우, 해당 외국인의 개인정보가 타 국가로 반출되거나, 또는 해당 국가에서 수집된 데이터에 포함된 개인 정보가 타 국가로 반출될 수 있는 문제점을 해소하고, 하나의 국가 내에서만 개인정보가 처리되고, 타 국가로 반출되지 않도록 보호할 수 있는 효과가 있다.According to embodiments of the present invention, it is possible to consider performing annotation in a specific global country by distributing a lot of raw data in the cloud in the global area. When performing work abroad, solve the problem that the foreigner's personal information may be exported to another country, or personal information included in data collected in the country may be exported to another country, and only within one country It has the effect of protecting personal information from being processed and exported to other countries.

본 발명의 효과들은 이상에서 언급한 효과로 제한되지 아니하며, 언급되지 않은 또 다른 효과들은 청구범위의 기재로부터 본 발명이 속한 기술분야의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned will be clearly understood by those skilled in the art from the description of the claims.

본 명세서에서 사용되는 기술적 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아님을 유의해야 한다. 또한, 본 명세서에서 사용되는 기술적 용어는 본 명세서에서 특별히 다른 의미로 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 의미로 해석되어야 하며, 과도하게 포괄적인 의미로 해석되거나, 과도하게 축소된 의미로 해석되지 않아야 한다. 또한, 본 명세서에서 사용되는 기술적인 용어가 본 발명의 사상을 정확하게 표현하지 못하는 잘못된 기술적 용어일 때에는, 당업자가 올바르게 이해할 수 있는 기술적 용어로 대체되어 이해되어야 할 것이다. 또한, 본 발명에서 사용되는 일반적인 용어는 사전에 정의되어 있는 바에 따라, 또는 전후 문맥상에 따라 해석되어야 하며, 과도하게 축소된 의미로 해석되지 않아야 한다.It should be noted that the technical terms used in this specification are only used to describe specific embodiments and are not intended to limit the present invention. In addition, technical terms used in this specification should be interpreted in terms commonly understood by those of ordinary skill in the art to which the present invention belongs, unless specifically defined otherwise in this specification, and are overly inclusive. It should not be interpreted in a positive sense or in an excessively reduced sense. In addition, when the technical terms used in this specification are erroneous technical terms that do not accurately express the spirit of the present invention, they should be replaced with technical terms that those skilled in the art can correctly understand. In addition, general terms used in the present invention should be interpreted as defined in advance or according to context, and should not be interpreted in an excessively reduced sense.

또한, 본 명세서에서 사용되는 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "구성된다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 여러 구성 요소들, 또는 여러 단계들을 반드시 모두 포함하는 것으로 해석되지 않아야 하며, 그 중 일부 구성 요소들 또는 일부 단계들은 포함되지 않을 수도 있고, 또는 추가적인 구성 요소 또는 단계들을 더 포함할 수 있는 것으로 해석되어야 한다.Also, singular expressions used in this specification include plural expressions unless the context clearly indicates otherwise. In this application, terms such as "consisting of" or "having" should not be construed as necessarily including all of the various components or steps described in the specification, and some of the components or steps are included. It should be construed that it may not be, or may further include additional components or steps.

또한, 본 명세서에서 사용되는 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성 요소는 제2 구성 요소로 명명될 수 있고, 유사하게 제2 구성 요소도 제1 구성 요소로 명명될 수 있다. Also, terms including ordinal numbers such as first and second used in this specification may be used to describe various components, but the components should not be limited by the terms. These terms are only used for the purpose of distinguishing one component from another. For example, a first element may be termed a second element, and similarly, a second element may be termed a first element, without departing from the scope of the present invention.

어떤 구성 요소가 다른 구성 요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성 요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성 요소가 존재할 수도 있다. 반면에, 어떤 구성 요소가 다른 구성 요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성 요소가 존재하지 않는 것으로 이해되어야 할 것이다.When a component is referred to as being “connected” or “connected” to another component, it may be directly connected or connected to the other component, but other components may exist in the middle. On the other hand, when a component is referred to as “directly connected” or “directly connected” to another component, it should be understood that no other component exists in the middle.

이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성 요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 또한, 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다. 또한, 첨부된 도면은 본 발명의 사상을 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 발명의 사상이 제한되는 것으로 해석되어서는 아니 됨을 유의해야 한다. 본 발명의 사상은 첨부된 도면 외에 모든 변경, 균등물 내지 대체물에 까지도 확장되는 것으로 해석되어야 한다. Hereinafter, preferred embodiments according to the present invention will be described in detail with reference to the accompanying drawings, but the same or similar components are given the same reference numerals regardless of reference numerals, and redundant description thereof will be omitted. In addition, in describing the present invention, if it is determined that a detailed description of a related known technology may obscure the gist of the present invention, the detailed description will be omitted. In addition, it should be noted that the accompanying drawings are only for easily understanding the spirit of the present invention, and should not be construed as limiting the spirit of the present invention by the accompanying drawings. The spirit of the present invention should be construed as extending to all changes, equivalents or substitutes other than the accompanying drawings.

본 발명의 일 실시예에 따른 클라우드 시스템은 글로벌 영역에 있어서 수많은 원시 데이터를 클라우드에 배포하여 글로벌 특정 국가에서 어노테이션을 수행하는 것을 고려할 수 있다. The cloud system according to an embodiment of the present invention may consider performing annotation in a specific global country by distributing a lot of raw data to the cloud in the global area.

어노테이션을 수행하는 작업자가 내국인으로 국내에 작업을 수행하지 않고 외국인으로 국외에서 작업을 수행할 경우, 해당 외국인의 개인정보가 타 국가로 반출되거나, 또는 해당 국가에서 수집된 데이터에 포함된 개인 정보가 타 국가로 반출될 수 있는 문제점이 있다. 이와 같은, 개인정보의 타 국가 반출은 국가별 개인정보보호법 등의 위법 소지가 존재하므, 하나의 국가 내에서만 개인정보가 처리되고, 타 국가로 반출되지 않도록 보호할 필요성이 존재한다.If the worker performing the annotation does not work in Korea as a Korean national and works abroad as a foreigner, the foreigner's personal information is taken out to another country, or the personal information included in the data collected in that country There is a problem that can be exported to other countries. Since such transfer of personal information to other countries may be illegal under the Personal Information Protection Act of each country, there is a need to protect personal information from being processed only within one country and exported to other countries.

클라우드 시스템을 복수 개의 글로벌 지역으로 분류하는 것을 고려할 수 있다. 하나의 지역 내의 개인정보는 특별한 사전에 없는 한 다른 지역으로 유출될 수 없게 격리된다. 여기서 지역은 국가 단위일 수 있으며, 개인정보의 반출 제약이 미치는 지역 단위로 적용할 수 있다.Consider classifying cloud systems into multiple global regions. Personal information within one area is isolated so that it cannot be leaked to other areas unless there is a special prior notice. Here, the region may be a country unit, and may be applied to a regional unit subject to restrictions on export of personal information.

제1 지역과 제2 지역은 서로 직접 데이터를 교환할 수 없으며, star-network 구조의 중심에서 지역들과 연결된 싱크를 통해서만 데이터를 교환할 수 있다.The first region and the second region cannot directly exchange data with each other, but can exchange data only through a sink connected to the regions at the center of the star-network structure.

이와 같은 지역은 프로젝트 단위로 설정될 수 있으며, 지역의 범위와 크기는 프로젝트의 속성, 어노테이션 작업자의 작성 능력, 어노테이션 작업자의 수, 개인정보 관련 법규 등에 따라 정해질 수 있다.Such an area may be set on a project basis, and the scope and size of the area may be determined according to project attributes, annotator's writing ability, the number of annotation workers, laws related to personal information, and the like.

싱크는 지역의 single storage의 개인정보에 직접 접근할 수 없으며, 공개가 허용된 일정 영역의 정보만을 접근할 수 있다. 각각의 지역은 싱크를 통해 동기화된 비개인정보에 접근할 수 있다.Sink cannot directly access personal information in a local single storage, and can only access information in a certain area that is allowed to be disclosed. Each region can access synchronized non-personal information through Sync.

싱크는 사용자가 접근하면, 사용자의 국가를 특정할 수 있는 정보(위치 값, 언어 등)를 기초로 사용자의 위치하고 있는 국가를 식별하고, 식별된 국가에서 접속할 수 있는 지역으로 연결해주는 역할을 수행한다.When a user approaches, Sink identifies the country where the user is located based on information (location value, language, etc.) that can specify the user's country, and plays a role in connecting the identified country to an accessible area. .

한편, 싱크는 사용자가 업로드를 요청하면 해당 사용자에게 허용된 지역으로만 업로드를 허용하고, 다른 지역으로의 업로드를 차단한다.On the other hand, when a user requests upload, the sink allows uploading only to areas permitted to the user and blocks uploading to other areas.

본 발명의 일 실시예에 따른 인공지능 학습 시스템은 복수의 학습 데이터 수집 장치, 학습 데이터 생성 장치, 복수의 어노테이션 장치 및 인공지능 학습 장치를 포함하여 구성될 수 있다.An artificial intelligence learning system according to an embodiment of the present invention may include a plurality of learning data collection devices, a learning data generating device, a plurality of annotation devices, and an artificial intelligence learning device.

이와 같은, 일 실시예에 따른 인공지능 학습 시스템의 구성 요소들은 기능적으로 구분되는 요소들을 나타낸 것에 불과하므로, 둘 이상의 구성 요소가 실제 물리적 환경에서는 서로 통합되어 구현되거나, 하나의 구성 요소가 실제 물리적 환경에서는 서로 분리되어 구현될 수 있을 것이다.Since the components of the artificial intelligence learning system according to an embodiment are merely functionally distinct elements, two or more components are integrated and implemented in an actual physical environment, or one component is implemented in an actual physical environment. may be implemented separately from each other.

학습 데이터 생성 장치는 인공지능 학습 장치로부터 인공지능(AI) 학습과 관련된 프로젝트의 속성을 수신할 수 있다. 학습 데이터 생성 장치는 사용자의 제어 및 수신된 프로젝트의 속성을 기초로, 인공지능(AI) 학습을 위한 데이터 구조의 설계, 수집된 데이터의 정제, 데이터의 가공, 데이터의 확장 및 데이터의 검증을 수행할 수 있다.The learning data generating device may receive attributes of a project related to artificial intelligence (AI) learning from the artificial intelligence learning device. The learning data generation device performs data structure design, collected data refinement, data processing, data expansion, and data verification for artificial intelligence (AI) learning, based on the user's control and the attributes of the received project. can do.

우선적으로, 학습 데이터 생성 장치는 인공지능(AI) 학습을 위한 데이터 구조를 설계할 수 있다. 예를 들어, 학습 데이터 생성 장치는 사용자의 제어 및 수신된 프로젝트의 속성을 기초로, 인공지능(AI) 학습을 위한 온톨로지(ontology), 인공지능(AI) 학습을 위한 데이터의 분류 체계를 정의할 수 있다.First of all, the learning data generating device may design a data structure for artificial intelligence (AI) learning. For example, the learning data generating device may define an ontology for artificial intelligence (AI) learning and a classification system of data for artificial intelligence (AI) learning based on the properties of the user's control and the received project. can

학습 데이터 생성 장치는 설계된 데이터 구조를 기초로, 인공지능(AI) 학습을 위한 데이터를 수집할 수 있다. 이를 위하여, 학습 데이터 생성 장치는 학습 데이터 수집 장치로부터 감지 데이터들, 3D 점군 데이터들, 2D 이미지들 및 거리 정보들을 수신할 수 있다. 그러나, 이에 한정되지 아니하고, 학습 데이터 생성 장치는 웹 크롤링(web crawling)을 수행하거나, 또는 외부 기관의 장치로부터 데이터들을 다운로드할 수도 있다.The learning data generating device may collect data for artificial intelligence (AI) learning based on the designed data structure. To this end, the learning data generating device may receive sensing data, 3D point cloud data, 2D images, and distance information from the learning data collecting device. However, it is not limited thereto, and the learning data generating device may perform web crawling or download data from an external organization's device.

학습 데이터 생성 장치는 수집된 감지 데이터들, 3D 점군 데이터들, 2D 이미지들 및 거리 정보들 중에서 중복되거나 또는 극히 유사한 데이터를 제거할 수 있다. 학습 데이터 생성 장치는 학습 데이터 수집 장치가 2D 이미지를 대상으로 자동으로 비식별 처리한 개인 정보가 올바른지 여부를 검증할 수 있다.The learning data generating apparatus may remove redundant or extremely similar data from among the collected sensing data, 3D point cloud data, 2D images, and distance information. The learning data generating device may verify whether the personal information automatically de-identified for the 2D image by the learning data collecting device is correct.

한편, 학습 데이터 생성 장치는 학습 데이터 수집 장치가 수행하는 객체 검출의 자동화를 지원하기 위하여, 다수의 2D 이미지들을 대상으로 기존의 어노테이션 작업의 결과물을 기초로 기계 학습된 객체 검출 인공지능(AI)을 구비할 수 있다. 그리고, 학습 데이터 생성 장치는 객체 검출 인공지능(AI)을 이용하여 객체 검출 규칙을 생성하고, 생성된 객체 검출 규칙을 복수 개의 학습 데이터 수집 장치에 대하여 배포할 수 있다.On the other hand, in order to support the automation of object detection performed by the learning data collection device, the learning data generating device uses object detection artificial intelligence (AI) machine-learned based on the result of an existing annotation task targeting a plurality of 2D images. can be provided In addition, the learning data generating device may generate an object detection rule using object detection artificial intelligence (AI) and distribute the generated object detection rule to a plurality of learning data collection devices.

한편, 학습 데이터 생성 장치는 수집 및 정제된 감지 데이터들, 3D 점군 데이터들, 2D 이미지들 및 거리 정보들을 복수 개의 어노테이션 장치에 분배하여 전송할 수 있다. 이 경우, 학습 데이터 생성 장치는 어노테이션 장치의 작업자(즉, 라벨러)에 대하여 사전에 할당된 양에 대응하여, 감지 데이터들, 3D 점군 데이터들, 2D 이미지들 및 거리 정보들을 분배할 수 있다.Meanwhile, the learning data generating device may distribute and transmit collected and refined sensing data, 3D point cloud data, 2D images, and distance information to a plurality of annotation devices. In this case, the learning data generating device may distribute sensing data, 3D point cloud data, 2D images, and distance information corresponding to a pre-allocated amount for an operator (ie, labeler) of the annotation device.

학습 데이터 생성 장치는 각각의 어노테이션 장치로부터 어노테이션 작업 결과물을 수신할 수 있다. 학습 데이터 생성 장치는 수신된 어노테이션 작업 결과물을 패키징(packaging)하여 인공지능(AI) 학습용 데이터를 생성할 수 있다. 그리고, 학습 데이터 생성 장치는 생성된 인공지능(AI) 학습용 데이터를 인공지능 학습 장치에 전송할 수 있다. The learning data generating device may receive annotation work results from each annotation device. The learning data generating device may generate artificial intelligence (AI) learning data by packaging the received annotation work result. And, the learning data generating device may transmit the generated artificial intelligence (AI) learning data to the artificial intelligence learning device.

이와 같은 특징을 가지는, 학습 데이터 생성 장치는 학습 데이터 수집 장치, 어노테이션 장치 및 인공지능 학습 장치와 데이터를 송수신하고, 송수신된 데이터를 기초로 연산을 수행할 수 있는 장치라면 어떠한 장치라도 허용될 수 있다. 예를 들어, 학습 데이터 생성 장치는 데스크탑(desktop), 워크스테이션(workstation) 또는 서버(server)와 같은 고정식 컴퓨팅 장치 중 어느 하나가 될 수 있으나, 이에 한정되는 것은 아니다.Any device capable of transmitting and receiving data to and from a learning data collection device, an annotation device, and an artificial intelligence learning device, and performing calculations based on the transmitted and received data may be accepted as the learning data generation device having such characteristics. . For example, the learning data generating device may be any one of a fixed computing device such as a desktop, workstation, or server, but is not limited thereto.

어노테이션 장치는 입출력장치를 통해 선택된 툴에 따른 좌표를 입력 받을 수 있다. 그리고, 어노테이션 장치는 입력된 좌표를 기초로 바운딩 박스(bounding box)를 설정하여, 감지 데이터, 3D 점군 데이터, 2D 이미지 또는 거리 정보 속에 포함된 객체를 특정할 수 있다. The annotation device may receive coordinates according to the selected tool through an input/output device. In addition, the annotation device may specify an object included in sensing data, 3D point cloud data, 2D image, or distance information by setting a bounding box based on the input coordinates.

여기서, 바운딩 박스는 감지 데이터, 3D 점군 데이터, 2D 이미지 또는 거리 정보 속에 포함된 객체들 중에서 인공지능(AI) 학습의 대상이 되는 객체를 특정하기 위한 영역이다. 이와 같은, 바운딩 박스는 사각형(rectangle) 또는 정육면체(cube)의 형상을 가질 수 있으며, 이에 한정되는 것은 아니다.Here, the bounding box is an area for specifying an object to be learned by artificial intelligence (AI) among objects included in sensing data, 3D point cloud data, 2D image, or distance information. Such a bounding box may have a rectangle or cube shape, but is not limited thereto.

예를 들어, 어노테이션 장치는 입출력장치를 통해 두 개의 좌표를 입력 받고, 입력된 두 좌표를 기초로 감지 데이터, 3D 점군 데이터, 2D 이미지 또는 거리 정보 내에서 좌상단 꼭지점(vertex)의 좌표와 우하단 꼭지점의 좌표로 가지는 사각형을 기초로 바운딩 박스를 설정하여 객체를 특정할 수 있다. 이 경우, 두 개의 좌표는 사용자가 한 종류의 입력 신호를 두 번 입력(예들 들어, 마우스 클릭)하여 설정되거나, 사용자가 두 종류의 입력 신호를 한번씩 입력(예를 들어, 마우스 드래그)하여 설정될 수 있으나, 이에 한정되는 것은 아니다.For example, the annotation device receives two coordinates through an input/output device, and based on the inputted two coordinates, the coordinates of the upper left vertex and the lower right vertex within detection data, 3D point cloud data, 2D image, or distance information. An object can be specified by setting a bounding box based on a rectangle with coordinates of . In this case, the two coordinates may be set by the user inputting one type of input signal twice (eg, mouse click) or by the user inputting two types of input signal once (eg, mouse drag). It may, but is not limited thereto.

이와 다르게, 어노테이션 장치는 학습 데이터 생성 장치로부터 수신된 2D 이미지와, 해당 2D 이미지를 대상으로 학습 데이터 생성 장치에 의해 자동으로 검출된 객체에 관한 정보를 디스플레이에 출력할 수 있다. 그리고, 어노테이션 장치는 자동으로 검출된 객체에 관한 정보가 올바른지 여부를 검증한 결과를 사용자로부터 입력 받을 수 있다. 만약, 자동으로 검출된 객체에 관한 정보에 오류가 존재하는 경우, 어노테이션 장치는 입출력장치를 통해 사용자로부터 입력된 신호에 따라, 2D 이미지 속에 포함된 객체를 재특정할 수 있다.Alternatively, the annotation device may output information about the 2D image received from the learning data generating device and the object automatically detected by the learning data generating device for the corresponding 2D image to a display. In addition, the annotation device may receive input from the user as a result of verifying whether information on the automatically detected object is correct. If there is an error in the information about the automatically detected object, the annotation device may re-specify the object included in the 2D image according to a signal input from the user through the input/output device.

이와 같은 특징을 가지는, 어노테이션 장치는 학습 데이터 생성 장치와 데이터를 송수신하고, 송수신된 데이터를 기초로 연산을 수행할 수 있는 장치라면 어떠한 장치라도 허용될 수 있다. 예를 들어, 어노테이션 장치는 데스크탑(desktop), 워크스테이션(workstation) 또는 서버(server)와 같은 고정식 컴퓨팅 장치, 또는 스마트폰(smart phone), 랩탑(laptop), 태블릿(tablet), 패블릿(phablet), 휴대용 멀티미디어 재생장치(Portable Multimedia Player, PMP), 개인용 휴대 단말기(Personal Digital Assistants, PDA) 또는 전자책 단말기(E-book reader)과 같은 이동식 컴퓨팅 장치 중 어느 하나가 될 수 있다.As the annotation device having such characteristics, any device may be accepted as long as it is capable of transmitting and receiving data to and from the learning data generating device and performing calculations based on the transmitted and received data. For example, the annotation device may be a stationary computing device such as a desktop, workstation, or server, or a smartphone, laptop, tablet, or phablet. ), a portable multimedia player (PMP), a personal digital assistant (PDA), or an e-book reader.

지금까지 상술한 바와 같은, 복수 개의 학습 데이터 수집 장치와 학습 데이터 생성 장치는 이동통신망을 이용하여 데이터를 송수신할 수 있다. 예를 들어, 이동통신망에는 코드 분할 다중 접속(Code Division Multiple Access, CDMA), 와이드 밴드 코드 분할 다중 접속(Wideband CDMA, WCDMA), 고속 패킷 접속(High Speed Packet Access, HSPA), 롱텀 에볼루션(Long Term Evolution, LTE), 5세대 이동통신(5th generation mobile telecommunication)가 포함될 수 있으나, 이에 한정되는 것은 아니다. As described above, the plurality of learning data collection devices and learning data generating devices may transmit and receive data using a mobile communication network. For example, in a mobile communication network, Code Division Multiple Access (CDMA), Wideband CDMA (WCDMA), High Speed Packet Access (HSPA), Long Term Evolution (Long Term Evolution) Evolution, LTE) and 5th generation mobile telecommunication may be included, but is not limited thereto.

또한, 학습 데이터 생성 장치, 복수 개의 어노테이션 장치 및 인공지능 학습 장치는 장치들 사이를 직접 연결하는 보안 회선, 공용 유선 통신망 또는 이동통신망 중 하나 이상이 조합된 네트워크를 이용하여 데이터를 송수신할 수 있다. 예를 들어, 공용 유선 통신망에는 이더넷(ethernet), 디지털가입자선(x Digital Subscriber Line, xDSL), 광동축 혼합망(Hybrid Fiber Coax, HFC), 광가입자망(Fiber To The Home, FTTH)가 포함될 수 있으나, 이에 한정되는 것도 아니다. In addition, the learning data generating device, the plurality of annotation devices, and the artificial intelligence learning device may transmit and receive data using a network in which one or more of a security line, a common wired communication network, or a mobile communication network directly connects devices. For example, public wired communication networks may include Ethernet, x Digital Subscriber Line (xDSL), Hybrid Fiber Coax (HFC), and Fiber To The Home (FTTH). It may be, but is not limited thereto.

본 발명의 일 실시예에 따른 학습 데이터 수집 장치는 통신부, 입출력부, 다중 센서 제어부, 객체 식별부, 비식별화 처리부, 데이터 제공부 및 저장부를 포함하여 구성될 수 있다.An apparatus for collecting learning data according to an embodiment of the present invention may include a communication unit, an input/output unit, a multi-sensor control unit, an object identification unit, a de-identification processing unit, a data providing unit, and a storage unit.

이와 같은, 학습 데이터 수집 장치의 구성 요소들은 기능적으로 구분되는 요소들을 나타낸 것에 불과하므로, 둘 이상의 구성 요소가 실제 물리적 환경에서는 서로 통합되어 구현되거나, 하나의 구성 요소가 실제 물리적 환경에서는 서로 분리되어 구현될 수 있을 것이다.Since the components of the learning data collection device are merely functionally distinct elements, two or more components are integrated and implemented in an actual physical environment, or one component is implemented separately from each other in an actual physical environment. It could be.

각각의 구성 요소에 대하여 설명하면, 통신부는 차량에 설치된 다중 센서들과 학습 데이터 생성 장치와 데이터를 송수신할 수 있다.Describing each component, the communication unit may transmit/receive data between multiple sensors installed in the vehicle and the learning data generating device.

구체적으로, 통신부는 차량에 고정 설치된 레이더, 라이다, 카메라 및 초음파 센서로부터 감지 데이터, 3D 점군 데이터, 2D 이미지 및 거리 정보를 수신할 수 있다.Specifically, the communication unit may receive sensing data, 3D point cloud data, 2D image, and distance information from a radar, lidar, camera, and ultrasonic sensor fixedly installed in a vehicle.

통신부는 사전에 설정된 주기마다 학습 데이터 생성 장치와의 이동통신의 통신 품질을 측정할 수 있다. 예를 들어, 통신부는 사전에 설정된 주기마다 ICMP(Internet Control Message Protocol)의 ping 패킷(echo request)를 학습 데이터 생성 장치에 전송하고, 학습 데이터 생성 장치로부터 응답 패킷(echo reply)을 수신할 수 있다.The communication unit may measure communication quality of mobile communication with the learning data generating device at predetermined intervals. For example, the communication unit may transmit an Internet Control Message Protocol (ICMP) ping packet (echo request) to the learning data generating device at predetermined intervals and receive a response packet (echo reply) from the learning data generating device. .

통신부는 데이터 제공부의 제어에 따라, 감지 데이터, 3D 점군 데이터, 2D 이미지 및 거리 정보를 학습 데이터 생성 장치에 전송할 수 있다. 이 경우, 2D 이미지에는 객체 식별부에 의해 2D 이미지로부터 식별된 객체가 차지하고 있는 영역에 관한 정보 및 비식별 처리된 개인정보에 관한 정보가 포함될 수 있다.The communication unit may transmit sensing data, 3D point cloud data, 2D image, and distance information to the learning data generating device under the control of the data providing unit. In this case, the 2D image may include information about a region occupied by an object identified from the 2D image by the object identification unit and information about de-identified personal information.

그리고, 통신부는 객체 식별부 및 비식별화 처리부의 제어에 따라 객체 검출 규칙의 업데이트 요청 메시지 또는 비식별 처리 규칙의 업데이트 요청 메시지를 학습 데이터 생성 장치에 전송할 수 있다.The communication unit may transmit an update request message of an object detection rule or an update request message of a de-identification processing rule to the learning data generating device under the control of the object identification unit and the de-identification processing unit.

기본적으로, 데이터 제공부는 사전에 설정된 주기마다 학습 데이터 생성 장치와의 이동통신의 통신 품질을 측정하고, 측정된 통신 품질에 대응하여 버퍼의 크기를 조정할 수 있다.Basically, the data providing unit may measure the communication quality of mobile communication with the learning data generating device at predetermined intervals and adjust the size of the buffer in response to the measured communication quality.

구체적으로, 데이터 제공부는 통신부를 통해, 설정된 주기마다 ICMP의 ping 패킷을 학습 데이터 생성 장치에 전송하고, 학습 데이터 생성 장치로부터 수신된 응답 패킷에 포함된 RTT(Round Trip Time)와 TTL(Time To Live)을 기초로 버퍼의 크기를 결정할 수 있다. 이 경우, 데이터 제공부는 레이더, 라이다, 카메라 및 초음파 센서가 설치된 차량의 이동 속도에 반비례하여, ICMP의 ping 패킷을 전송할 주기를 조절할 수 있다. Specifically, the data providing unit transmits ICMP ping packets to the learning data generating device at set intervals through the communication unit, and RTT (Round Trip Time) and TTL (Time To Live) included in the response packet received from the learning data generating device ), the size of the buffer can be determined based on In this case, the data providing unit may adjust a period for transmitting ICMP ping packets in inverse proportion to a moving speed of a vehicle equipped with a radar, lidar, camera, and ultrasonic sensor.

한편, 응답 패킷에 포함된 TTL을 기초로 모든 패킷이 손실되는 것으로 판단되는 경우, 데이터 제공부는 학습 데이터 생성 장치와 직접 이동통신을 수행하지 아니하고, 다른 학습 데이터 수집 장치를 경유하여 학습 데이터 생성 장치와 이동통신을 수행하도록 제어할 수도 있다.On the other hand, when it is determined that all packets are lost based on the TTL included in the response packet, the data providing unit does not directly perform mobile communication with the learning data generating device, but communicates with the learning data generating device via another learning data collecting device. It can also be controlled to perform mobile communication.

학습 데이터 수집 장치는 프로세서(Processor), 메모리(Memory), 송수신기(Transceiver), 입출력장치(Input/output device, 165), 데이터 버스(Bus, 170) 및 스토리지(Storage)를 포함하여 구성될 수 있다. The learning data collection device may include a processor, memory, transceiver, input/output device 165, data bus 170, and storage. .

프로세서는 메모리에 상주된 본 발명의 실시예들에 따른 방법이 구현된 소프트웨어에 따른 명령어를 기초로, 학습 데이터 수집 장치의 동작 및 기능을 구현할 수 있다. 메모리에는 본 발명의 실시예들에 따른 방법이 구현된 소프트웨어가 상주(loading)될 수 있다. 송수신기는 레이더, 라이다, 카메라, 초음파 센서 및 학습 데이터 생성 장치와 데이터를 송수신할 수 있다. 입출력장치는 학습 데이터 수집 장치의 동작에 필요한 데이터를 입력 받고, 수집된 감지 데이터, 3D 점군 데이터, 2D 이미지 및 거리 정보를 출력할 수 있다. 데이터 버스는 프로세서, 메모리, 송수신기 입출력장치 및 스토리지와 연결되어, 각각의 구성 요소 사이가 서로 데이터를 전달하기 위한 이동 통로의 역할을 수행할 수 있다.The processor may implement the operation and function of the learning data collection device based on instructions according to software in which the method according to the embodiments of the present invention is implemented, which resides in the memory. Software in which a method according to embodiments of the present invention is implemented may be loaded in the memory. The transceiver may transmit and receive data to and from radar, lidar, cameras, ultrasonic sensors, and learning data generating devices. The input/output device may receive data necessary for the operation of the learning data collection device and output collected sensing data, 3D point cloud data, 2D image, and distance information. The data bus is connected to a processor, a memory, a transceiver input/output device, and a storage, and may serve as a movement path for transferring data between respective components.

스토리지는 본 발명의 실시예들에 따른 방법이 구현된 소프트웨어(180a)의 실행을 위해 필요한 애플리케이션 프로그래밍 인터페이스(Application Programming Interface, API), 라이브러리(library) 파일, 리소스(resource) 파일 등을 저장할 수 있다. 스토리지는 본 발명의 실시예들에 따른 방법이 구현된 소프트웨어 및 데이터베이스를 저장할 수 있다. 데이터베이스에는 객체 검출 규칙, 비식별 처리 규칙 및 객체의 유형별 3D 모델이 저장될 수 있다. The storage may store an application programming interface (API), a library file, a resource file, etc. necessary for the execution of the software 180a in which the method according to the embodiments of the present invention is implemented. . The storage may store software and a database in which a method according to embodiments of the present invention is implemented. Object detection rules, non-identification processing rules, and 3D models for each type of object may be stored in the database.

보다 구체적으로, 프로세서는 ASIC(Application-Specific Integrated Circuit), 다른 칩셋(chipset), 논리 회로 및/또는 데이터 처리 장치를 포함할 수 있다. 메모리는 ROM(Read-Only Memory), RAM(Random Access Memory), 플래쉬 메모리, 메모리 카드, 저장 매체 및/또는 다른 저장 장치를 포함할 수 있다. 송수신기(160)는 유무선 신호를 처리하기 위한 베이스밴드 회로를 포함할 수 있다. 입출력장치(165)는 키보드(keyboard), 마우스(mouse), 및/또는 조이스틱(joystick) 등과 같은 입력 장치 및 액정표시장치(Liquid Crystal Display, LCD), 유기 발광 다이오드(Organic LED, OLED) 및/또는 능동형 유기 발광 다이오드(Active Matrix OLED, AMOLED) 등과 같은 영상 출력 장치 프린터(printer), 플로터(plotter) 등과 같은 인쇄 장치를 포함할 수 있다. More specifically, the processor may include an Application-Specific Integrated Circuit (ASIC), other chipsets, logic circuits, and/or data processing devices. The memory may include read-only memory (ROM), random access memory (RAM), flash memory, memory cards, storage media, and/or other storage devices. The transceiver 160 may include a baseband circuit for processing wired/wireless signals. The input/output device 165 includes an input device such as a keyboard, a mouse, and/or a joystick, and a Liquid Crystal Display (LCD), an Organic LED (OLED), and/or a liquid crystal display (LCD). Alternatively, an image output device such as an active matrix OLED (AMOLED) may include a printing device such as a printer or a plotter.

본 명세서에 포함된 실시 예가 소프트웨어로 구현될 경우, 상술한 방법은 상술한 기능을 수행하는 모듈(과정, 기능 등)로 구현될 수 있다. 모듈은 메모리에 상주되고, 프로세서에 의해 실행될 수 있다. 메모리는 프로세서의 내부 또는 외부에 있을 수 있고, 잘 알려진 다양한 수단으로 프로세서와 연결될 수 있다.When the embodiments included in this specification are implemented as software, the above-described method may be implemented as a module (process, function, etc.) that performs the above-described functions. A module resides in memory and can be executed by a processor. The memory may be internal or external to the processor and may be coupled with the processor in a variety of well-known means.

펌웨어나 소프트웨어에 의한 구현의 경우, 본 발명의 일 실시예는 이상에서 설명된 기능 또는 동작들을 수행하는 모듈, 절차, 함수 등의 형태로 구현되어, 다양한 컴퓨터 수단을 통하여 판독 가능한 기록매체에 기록될 수 있다. 여기서, 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 예컨대 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM(Compact Disk Read Only Memory), DVD(Digital Video Disk)와 같은 광 기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치를 포함한다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 이러한, 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.In the case of implementation by firmware or software, an embodiment of the present invention is implemented in the form of a module, procedure, function, etc. that performs the functions or operations described above, and is recorded on a recording medium readable through various computer means. can Here, the recording medium may include program commands, data files, data structures, etc. alone or in combination. Program instructions recorded on the recording medium may be those specially designed and configured for the present invention, or those known and usable to those skilled in computer software. For example, recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs (Compact Disk Read Only Memory) and DVDs (Digital Video Disks), floptical It includes hardware devices specially configured to store and execute program instructions, such as magneto-optical media, such as a floptical disk, and ROM, RAM, flash memory, and the like. Examples of program instructions may include high-level language codes that can be executed by a computer using an interpreter or the like as well as machine language codes generated by a compiler. These hardware devices may be configured to operate as one or more pieces of software to perform the operations of the present invention, and vice versa.

이상과 같이, 본 명세서와 도면에는 본 발명의 바람직한 실시예에 대하여 개시하였으나, 여기에 개시된 실시예 외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명한 것이다. 또한, 본 명세서와 도면에서 특정 용어들이 사용되었으나, 이는 단지 본 발명의 기술 내용을 쉽게 설명하고 발명의 이해를 돕기 위한 일반적인 의미에서 사용된 것이지, 본 발명의 범위를 한정하고자 하는 것은 아니다. 따라서, 상술한 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니 되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 선정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.As described above, although preferred embodiments of the present invention have been disclosed in the present specification and drawings, it is in the technical field to which the present invention belongs that other modified examples based on the technical spirit of the present invention can be implemented in addition to the embodiments disclosed herein. It is self-evident to those skilled in the art. In addition, although specific terms have been used in the present specification and drawings, they are only used in a general sense to easily explain the technical content of the present invention and help understanding of the present invention, but are not intended to limit the scope of the present invention. Accordingly, the foregoing detailed description should not be construed as limiting in all respects and should be considered illustrative. The scope of the present invention should be selected by reasonable interpretation of the appended claims, and all changes within the equivalent scope of the present invention are included in the scope of the present invention.

Claims (5)

인공지능(Artificial Intelligence, AI) 학습 데이터의 어노테이션 작업의 지역별 독립성을 확보하는 글로벌 클라우드 시스템에 있어서,
클라우드 시스템을 복수 개의 글로벌 지역으로 분류하고, 하나의 지역 내의 개인정보는 특별한 사전에 없는 한 다른 지역으로 유출될 수 없게 격리되며,
상기 지역은 국가 단위이거나 개인정보의 반출 제약이 미치는 지역 단위이며,
상기 지역은 적어도 제1 지역과 제2 지역으로 구분되되, 제1 지역과 제2 지역은 서로 직접 데이터를 교환할 수 없으며, star-network 구조의 중심에서 지역들과 연결된 싱크를 통해서만 데이터를 교환 것을 특징으로 하는, 지역별 독립성을 확보하는 글로벌 클라우드 시스템.
In a global cloud system that secures regional independence of annotation work of artificial intelligence (AI) learning data,
The cloud system is classified into multiple global regions, and personal information within one region is isolated so that it cannot be leaked to other regions unless there is a special dictionary.
The above region is a national unit or a regional unit subject to restrictions on the export of personal information,
The area is divided into at least a first area and a second area, but the first area and the second area cannot directly exchange data with each other, and data is exchanged only through a sink connected to the areas in the center of the star-network structure. Characterized by a global cloud system that secures regional independence.
제1항에 있어서,
상기 지역은 프로젝트 단위로 설정될 수 있으며, 지역의 범위와 크기는 프로젝트의 속성, 어노테이션 작업자의 작성 능력에 따라 설정되는 것을 특징으로 하는 지역별 독립성을 확보하는 글로벌 클라우드 시스템.
According to claim 1,
The region can be set for each project, and the scope and size of the region are set according to the attributes of the project and the writing ability of the annotation worker.
제1항에 있어서,
싱크는 지역의 single storage의 개인정보에 직접 접근할 수 없고 공개가 허용된 일정 영역의 정보만을 접근이 가능하도록 설정된 것을 특징으로 하는 지역별 독립성을 확보하는 글로벌 클라우드 시스템.
According to claim 1,
Sink is a global cloud system that secures regional independence, characterized in that it is set to allow access only to information in a certain area that is allowed to be disclosed without direct access to personal information in a single storage in the region.
제3항에 있어서,
상기 싱크는 사용자가 접근하면, 사용자의 국가를 특정할 수 있는 정보(위치 값, 언어 등)를 기초로 사용자의 위치하고 있는 국가를 식별하고, 식별된 국가에서 접속할 수 있는 지역으로 연결해주는 역할을 수행하는 것을 특징으로 하는 지역별 독립성을 확보하는 글로벌 클라우드 시스템.
According to claim 3,
When a user approaches, the sink identifies the country where the user is located based on information (location value, language, etc.) that can specify the user's country, and plays a role in connecting the identified country to an accessible area. A global cloud system that secures regional independence.
제3항에 있어서,
상기 싱크는 사용자가 업로드를 요청하면 해당 사용자에게 허용된 지역으로만 업로드를 허용하고, 다른 지역으로의 업로드를 차단하는 것을 특징으로 하는 지역별 독립성을 확보하는 글로벌 클라우드 시스템.
According to claim 3,
The sink is a global cloud system that secures regional independence, characterized in that when a user requests an upload, it allows upload only to the region permitted to the user and blocks upload to other regions.
KR1020210136622A 2021-10-14 2021-10-14 A global cloud system providing regional independence KR20230053276A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210136622A KR20230053276A (en) 2021-10-14 2021-10-14 A global cloud system providing regional independence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210136622A KR20230053276A (en) 2021-10-14 2021-10-14 A global cloud system providing regional independence

Publications (1)

Publication Number Publication Date
KR20230053276A true KR20230053276A (en) 2023-04-21

Family

ID=86098563

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210136622A KR20230053276A (en) 2021-10-14 2021-10-14 A global cloud system providing regional independence

Country Status (1)

Country Link
KR (1) KR20230053276A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200042629A (en) 2018-10-16 2020-04-24 주식회사 키센스 Method for generating annotation and image based on touch of mobile device to learn artificial intelligence and apparatus therefor

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200042629A (en) 2018-10-16 2020-04-24 주식회사 키센스 Method for generating annotation and image based on touch of mobile device to learn artificial intelligence and apparatus therefor

Similar Documents

Publication Publication Date Title
US9262300B1 (en) Debugging computer programming code in a cloud debugger environment
KR102028252B1 (en) Autonomous memory architecture
US10956584B1 (en) Secure data processing
CN106415496A (en) Unified intermediate representation
CN106201861A (en) The detection method of a kind of code quality and device
CN106469022A (en) The memory management method of memory driver and system
CN113806253A (en) Detection of compromised storage device firmware
CN106919494A (en) The implementation method and device of Android application daily record
KR20110028212A (en) Autonomous subsystem architecture
KR102343056B1 (en) A method of reducing data load of images for annotation, and computer program recorded on record-medium for executing method thereof
CN102439567A (en) Processing method of distributed virtual machine visit abnormality and virtual machine monitor
US20180157605A1 (en) Configuration of a memory controller for copy-on-write
US9563572B2 (en) Migrating buffer for direct memory access in a computer system
US9380126B2 (en) Data collection and distribution management
KR102343043B1 (en) Annotation method capable of change of working condition simultaneously, and computer program recorded on record-medium for executing method thereof
KR102310592B1 (en) Annotation method capable of guiding change of working regulation, and computer program recorded on record-medium for executing method thereof
US10534562B2 (en) Solid state drive
KR20230053276A (en) A global cloud system providing regional independence
WO2021249030A1 (en) Method for generating random number sequence and random number engine
EP3846037B1 (en) Storage device configured to support multi-streams and operation method thereof
US20170293554A1 (en) Hardware-assisted garbage collection
KR102343036B1 (en) Annotation method capable of providing working guides, and computer program recorded on record-medium for executing method thereof
US11907051B1 (en) Correcting invalid zero value for data monitoring
KR20230053280A (en) A data purification method of a collection device and a computer program recorded on a recording medium to execute the same
US20240144084A1 (en) Data augmentation using semantic transforms