KR102663409B1 - 기계학습용 데이터 수집 장치 및 방법 - Google Patents

기계학습용 데이터 수집 장치 및 방법 Download PDF

Info

Publication number
KR102663409B1
KR102663409B1 KR1020230068992A KR20230068992A KR102663409B1 KR 102663409 B1 KR102663409 B1 KR 102663409B1 KR 1020230068992 A KR1020230068992 A KR 1020230068992A KR 20230068992 A KR20230068992 A KR 20230068992A KR 102663409 B1 KR102663409 B1 KR 102663409B1
Authority
KR
South Korea
Prior art keywords
machine learning
learning data
database
approval
data
Prior art date
Application number
KR1020230068992A
Other languages
English (en)
Inventor
김수진
김성민
Original Assignee
김수진
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김수진 filed Critical 김수진
Priority to KR1020230068992A priority Critical patent/KR102663409B1/ko
Application granted granted Critical
Publication of KR102663409B1 publication Critical patent/KR102663409B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/604Tools and structures for managing or administering access control systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Bioethics (AREA)
  • Evolutionary Computation (AREA)
  • Automation & Control Theory (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Feedback Control In General (AREA)
  • Numerical Control (AREA)

Abstract

일 실시예에 따른 데이터 수집 장치에 의해 수행되는 기계학습용 데이터 수집 방법은, 디바이스에 저장된 기계학습용 데이터에 접근하는 단계, 상기 디바이스에 대응하는 대상에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계, 상기 디바이스를 통해, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계 및 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계를 포함한다.

Description

기계학습용 데이터 수집 장치 및 방법{DATA COLLECTION APPARATUS AND METHOD FOR MACHINE LEARNING}
본 발명은 기계학습용 데이터를 수집하는 장치 및 방법에 관한 것이다.
인공지능(artificial intelligence)분야에서 중요한 역할을 하는 기계학습(machine learning)은 데이터를 이용하여 인공지능 모델을 학습하고 새로운 데이터에 대한 예측을 수행하는 방법이다.
개발 초기에는 상용화가 아닌 연구개발 단계로서, 인터넷 망으로 연결되어 있는 자료를 수집 시 개인의 권리에 대해 특별한 문제가 제기되지 않았다. 그러나 매우 빠른 속도로 진행되고 있는 기술의 발전속도 및 인공지능 형 서비스 보급 현황을 고려하면, 데이터 마이닝(data mining) 진행 시 민감한 정보가 포함될 수 있는 개인의 데이터를 보호할 수 있는 방법이 필요하다.
또한, 단 한 명의 개인의 정보를 사용하는 경우에도 로그 기록이 남게 되어, 인공지능 모델은 해당 정보를 수집하여 학습할 수 있고, 그에 따라 불특정 다수에게 해당 정보가 공개될 수 있는 문제가 있다.
이러한 경우, 공개된 정보가 무상의 정보라 하더라도 해당 정보를 바탕으로 학습되어 생성된 인공지능이 해당 정보로부터 도출된 결론을 불특정 다수에게 공개하는 것에 대해, 해당 정보 제공자에게 사전 동의가 이뤄지지 않고 있어 문제가 발생할 수 있다. 무상의 정보 제공이더라도 해당 정보 제공자는 본인의 위상, 예를 들면 해당 정보의 조회수, 인용 횟수 및 follower 등의 보상을 기대할 수 있기 때문에 무상 정보 제공을 하였다 하더라도 불특정 다수에게 정보를 무상 제공하는 것을 원하지 않을 수 있기 때문이다.
유상의 정보 제공을 한 경우에도 동일한 문제를 가지고 있다. 모든 제품의 사용자의 수에 따라 그 제품의 가격을 다르게 책정하는 것이 일반적이다. 따라서 유상의 정보를 수집한 경우에도, 해당 정보를 불특정 다수에게 공유해도 된다는 것을 의미하는 것은 아니며, 해당 정보를 불특정 다수에게 공개를 하는 경우에는 데이터 소유주와 사전 협의가 되어야 하는 것이 타당하다.
최근 네트워크를 통한 정보의 수집이 매우 용이해짐에 따라, 특정 정보를 제공하는 경우 그 정보를 사용하는 사람의 숫자를 표기하고, 그에 따라 금전적 가치를 대변할 수도 있는, 정보 제공자의 위상이 변할 수 있다(예로, 학계에서의 위상, 특허의 영향력 등).
이와 반대로, 인공지능에 문제의 소지가 있는 정보가 다량 제공된다면 인공지능의 학습 및 그 제공을 통해 잘못된 정보가 공신력을 가지거나 이로부터 피해가 발생될 수 있는 문제가 생길 수 있다.
한국공개특허공보, 10-2001-0091502호 (2001.10.23. 공개)
본 발명의 해결하고자 하는 과제는, 기계학습용 데이터를 기계학습에 사용하기 전, 데이터가 저장된 디바이스에 대응하는 대상에게 사용에 대한 승인을 받음으로써, 디바이스에 대응하는 대상의 의사와 관계없이 데이터가 불특정 다수에게 공개되는 것을 방지할 수 있는 장치 및 방법을 제공하는 것이다.
다만, 본 발명의 해결하고자 하는 과제는 이상에서 언급한 것으로 제한되지 않으며, 언급되지 않은 또 다른 해결하고자 하는 과제는 아래의 기재로부터 본 발명이 속하는 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
일 실시예에 따른 데이터 수집 장치에 의해 수행되는 기계학습용 데이터 수집 방법은, 디바이스에 저장된 기계학습용 데이터에 접근하는 단계, 상기 디바이스에 대응하는 대상에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계, 상기 디바이스를 통해, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계 및 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계를 포함한다.
일 실시예에 따른 기계학습 장치에 의해 수행되는 기계학습 방법은, 디바이스에 저장된 기계학습용 데이터에 접근하는 단계, 상기 디바이스에 대응하는 대상에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계, 상기 디바이스를 통해, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계, 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계 및 상기 학습용 데이터베이스를 기초로 기계학습을 수행하는 단계를 포함한다.
일 실시예에 따른 기계학습 장치에 의해 수행되는 데이터 수집 장치는, 컴퓨터 실행 가능한 명령어를 포함하는 메모리 및 상기 명령어를 실행함으로써, 디바이스에 저장된 기계학습용 데이터에 접근하고, 상기 디바이스에 대응하는 대상에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하고, 상기 디바이스를 통해, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하고, 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하도록 제어하는 프로세서를 포함한다.
일 실시예에 따른 기계학습 장치에 의해 수행되는 기계학습 장치는, 컴퓨터 실행 가능한 명령어를 포함하는 메모리 및 상기 명령어를 실행함으로써, 디바이스에 저장된 기계학습용 데이터에 접근하고, 상기 디바이스에 대응하는 대상에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하고, 상기 디바이스를 통해, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하고, 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하고, 상기 학습용 데이터베이스를 기초로 기계학습을 수행하도록 제어하는 프로세서를 포함한다.
일 실시예에 따른 컴퓨터 실행 가능한 명령어를 저장하고 있는 컴퓨터 판독 가능 기록매체는, 상기 컴퓨터 실행 가능한 명령어가 프로세서에 의해 실행되면, 디바이스에 저장된 기계학습용 데이터에 접근하는 단계, 상기 디바이스에 대응하는 대상에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계, 상기 디바이스를 통해, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계 및 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계를 포함하는 방법을 상기 프로세서가 수행하도록 하는 명령어를 포함한다.
일 실시예에 따른 컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램은, 프로세서에 의해 실행되면, 디바이스에 저장된 기계학습용 데이터에 접근하는 단계, 상기 디바이스에 대응하는 대상에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계, 상기 디바이스를 통해, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계 및 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계를 포함하는 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함한다.
본 발명의 실시예에 의하면, 기계학습용 데이터를 기계학습에 사용하기 전, 데이터가 저장된 디바이스에 대응하는 대상에게 사용에 대한 승인을 받음으로써, 디바이스에 대응하는 대상의 의사와 관계없이 데이터가 불특정 다수에게 공개되는 것을 방지할 수 있다.
디바이스에 대응하는 대상은 본인이 소유하고 있는 데이터를 기계학습에 사용한 대상을 파악할 수 있고, 그에 따라 데이터 사용에 대한 권리를 행사할 수 있으며, 본인이 소유하고 있는 데이터를 안정적으로 관리할 수 있다.
또한, 잘못된 정보의 재생산을 방지할 수 있으며, 문제 발생 시 그 출처를 확인할 수 있다.
본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 데이터 수집 장치(100)의 구성도이다.
도 2는 본 발명의 기계학습용 데이터가 저장된 디바이스(200)를 예시한다.
도 3은 본 발명의 일 실시예에 따라 기계학습용 데이터를 수집하는 과정에서 데이터 수집 장치(100)와 기계학습용 데이터가 저장된 디바이스(200)의 관계를 예시한다.
도 4는 본 발명의 일 실시예에 따른 기계학습용 데이터 수집 방법을 예시하고 있는 순서도이다.
도 5는 본 발명의 따른 기계학습용 데이터 수집 방법을 구체적으로 예시하고 있는 순서도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 발명의 실시예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.
본 명세서에서 사용되는 용어는 본 발명의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 '포함'한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다.
또한, 명세서에서 사용되는 '부'라는 용어는 소프트웨어 또는 FPGA나 ASIC과 같은 하드웨어 구성요소를 의미하며, '부'는 어떤 역할들을 수행한다. 그렇지만 '부'는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. '부'는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다. 따라서, 일 예로서 '부'는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 '부'들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 '부'들로 결합되거나 추가적인 구성요소들과 '부'들로 더 분리될 수 있다.
아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 데이터 수집 장치(100)의 구성도이고, 도 2는 본 발명의 기계학습용 데이터가 저장된 디바이스(200)를 예시하고 있으며, 도 3은 본 발명의 일 실시예에 따라 기계학습용 데이터를 수집하는 과정에서 데이터 수집 장치(100)와 기계학습용 데이터가 저장된 디바이스(200)의 관계를 예시한다. 이하, 도 1 내지 도 3을 참조하여 상세히 설명한다.
도 1에 나타난 바와 같이, 데이터 수집 장치(100)는 프로세서(130) 및 메모리(140)를 포함하고, 입력부(110) 또는 출력부(120)을 더 포함할 수 있다.
입력부(110)는 기계학습용 데이터를, 디바이스(200)로부터 통신망을 통해 입력 받을 수 있다. 통신망은 유선망 또는 무선망일 수 있다. 입력부(110)는 내부 장치를 이용하여 기계학습용 데이터를 직접 입력 받을 수도 있다.
입력부(110)가 기계학습용 데이터를 입력 받는 방법은 상술한 실시예에 한정되지 않는다.
출력부(120)는 기계학습용 데이터에 대한 정보, 기계학습용 데이터 수집 현황, 임시 데이터베이스(180) 또는 학습용 데이터베이스(190)에 전송된 기계학습용 데이터에 대한 현황, 기계학습용 데이터의 사용에 대한 승인 여부 및 승인 여부의 변경 현황 등을 포함하는 정보를 인터페이스 또는 디스플레이 수단을 통해 시각적인 정보로서 표시할 수 있다.
출력부(120)는 기계학습용 데이터에 대한 정보, 기계학습용 데이터 수집 현황, 임시 데이터베이스(180) 또는 학습용 데이터베이스(190)에 전송된 기계학습용 데이터에 대한 현황, 기계학습용 데이터의 사용에 대한 승인 여부 및 승인 여부의 변경 현황 등을 포함하는 정보를 컴퓨터에서 처리할 수 있는 데이터의 형태로 처리할 수 있다.
출력부(120)는 기계학습용 데이터에 대한 정보, 기계학습용 데이터 수집 현황, 임시 데이터베이스(180) 또는 학습용 데이터베이스(190)에 전송된 기계학습용 데이터에 대한 현황, 기계학습용 데이터의 사용에 대한 승인 여부 및 승인 여부의 변경 현황 등을 포함하는 정보를 통신망으로 연결된 외부 장치로 전송할 수 있다.
기계학습용 데이터에 대한 정보, 기계학습용 데이터 수집 현황, 임시 데이터베이스(180) 또는 학습용 데이터베이스(190)에 전송된 기계학습용 데이터에 대한 현황, 기계학습용 데이터의 사용에 대한 승인 여부 및 승인 여부의 변경 현황 등을 포함하는 정보는 지속적으로 업데이트되어 출력부(120)에 의해 외부 장치로 전송될 수 있다.
출력부(120)가 기계학습용 데이터에 대한 정보, 기계학습용 데이터 수집 현황, 임시 데이터베이스(180) 또는 학습용 데이터베이스(190)에 전송된 기계학습용 데이터에 대한 현황, 기계학습용 데이터의 사용에 대한 승인 여부 및 승인 여부의 변경 현황 등을 포함하는 정보를 출력하는 방법은 각종 출력 형태를 포함할 수 있으며, 상술한 실시예에 한정되지 않는다.
프로세서(130)는 프로그램 내에 포함된 코드 또는 명령으로 표현된 기능을 수행하기 위해 물리적으로 구조화된 회로를 갖는, 하드웨어에 내장된 데이터 처리 장치를 의미할 수 있다. 프로세서(130)는 마이크로프로세서(microprocessor), 중앙처리장치(central processing unit: CPU), GPU(graphic processing unit), 프로세서 코어(processor core), 멀티프로세서(multiprocessor), ASIC(application-specific integrated circuit), FPGA(field programmable gate array) 등의 처리 장치를 의미할 수 있으나, 상술한 실시예에 한정되지 않는다.
프로세서(130)는 디바이스(200)에 저장된 기계학습용 데이터에 접근하는 단계, 디바이스(200)에 대응하는 대상에게 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계, 디바이스(200)를 통해, 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계 및 승인 여부에 따라, 학습용 데이터베이스(190)로 기계학습용 데이터의 전송 여부를 결정하는 단계를 포함하는 기계학습용 데이터 수집 방법을 수행할 수 있다.
디바이스(200)에 대응하는 대상은 디바이스(200) 또는 디바이스(200)에 저장된 기계학습용 데이터와 관련된 대상을 의미할 수 있다. 예를 들면, 디바이스(200)에 대응하는 대상은 디바이스(200)의 소유주, 디바이스(200)의 소유주에 의해 권리를 인정 받은 권리자, 디바이스(200)에 저장된 기계학습용 데이터의 소유주, 디바이스(200)에 저장된 기계학습용 데이터의 소유주에 의해 권리를 인정 받은 권리자 등을 의미할 수 있다. 디바이스(200)에 대응하는 대상은 상술한 예시에 한정되지 않는다.
기계학습용 데이터를 수집하는 방법은 기존 존재하는 데이터 셋 수집, 공개 리포지토리, 로그 수집, 웹 스크래핑, 웹 크롤링, API 등이 있으나 상술한 실시예에 한정되지 않는다.
프로세서(130)는 접근한 기계학습용 데이터를 복호화하거나 벡터화할 수 있다.
프로세서(130)는 접근한 기계학습용 데이터내의 특정 단어를 검색할 수 있다.
프로세서(130)는 검색된 특정 단어를 확인 시, 새로운 기계학습용 데이터를 생성하여 임시 데이터베이스(180) 또는 학습용 데이터베이스(190)로 전송할 수 있다.
프로세서(130)는 기존 기계학습용 데이터와 새롭게 생성된 기계학습용 데이터 간 유사성 정도를 판단할 수 있고, 유사성 정도에 따라 이에 대응하는 라벨을 기존 기계학습용 데이터 또는 새롭게 생성된 기계학습용 데이터에 추가할 수 있다.
프로세서(130)는 디바이스(200)에 저장된 기계학습용 데이터에 접근하면, 로그 데이터를 생성할 수 있다.
프로세서(130)는 기계학습용 데이터에 접근하면, 임시 데이터베이스(180)로 기계학습용 데이터를 전송할 수 있다. 임시 데이터베이스(180)로 기계학습용 데이터를 전송하는 경우, 기계학습용 데이터를 암호화하여 임시 데이터베이스(180)로 전송할 수 있다.
프로세서(130)는 디바이스(200)에 저장된 기계학습용 데이터에 접근하면, 디바이스(200) 또는 기계학습용 데이터에서 기계학습용 데이터의 사용에 대한 승인 여부를 검색할 수 있다.
프로세서(130)는 기계학습용 데이터의 사용에 대한 미승인이 디바이스(200) 또는 기계학습용 데이터에 포함되어 있는 경우, 기계학습용 데이터에 접근하면, 임시 데이터베이스(180)로 기계학습용 데이터의 전송 여부를 선택할 수 있다.
프로세서(130)는 기계학습용 데이터의 사용에 대한 승인이 디바이스(200) 또는 기계학습용 데이터에 포함되어 있는 경우, 별도의 사용에 대한 요청 또는 승인이 없이 학습용 데이터베이스(190)로 기계학습용 데이터의 전송 여부를 선택할 수 있다.
프로세서(130)는 디바이스(200)에 저장된 기계학습용 데이터에 접근할 때, 디바이스(200) 정보, 접근 가능한 데이터의 양적 정보, 관계 정보, 분류 정보, 범위 정보, 유사성 정보, 접근횟수의 정보, 데이터 전처리 과정에서 활용될 수 있는 이상점, 평균점, 분산 등의 정보로 변환될 수 있는 확률적 정보, 기계학습용 데이터의 분류 코드, 디바이스(200)의 분류 코드, 집중도 정보 등을 생성할 수 있으며, 이는 상술한 실시예에 한정되지 않는다.
프로세서(130)은 기계학습용 데이터에 접근 시 생성한 정보를 임시 데이터베이스(180) 또는 학습용 데이터베이스(190)로 전송할 수 있다. 프로세서(130)는 기계학습용 데이터의 분류를 위한 데이터 전처리를 수행할 수 있다. 프로세서(130)에서는 기계학습용 데이터의 분류를 위해 기계학습용 데이터에 접근 시 생성한 정보를 활용할 수 있다.
기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 프로세서(130)는 기계학습용 데이터를 임시 데이터베이스(180)에 전송된 학습용 데이터베이스(190)로 전송할 수 있다.
기계학습용 데이터의 사용에 대한 미승인이 입력되면, 프로세서(130)는 임시 데이터베이스(180)에 전송된 기계학습용 데이터를 삭제할 수 있다.
기 정해진 시간을 초과하여 기계학습용 데이터의 사용에 대한 승인 여부가 입력되지 않는 경우, 프로세서(130)는 기 정해진 횟수에 따라 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 다시 출력하도록 제어할 수 있다. 인터페이스를 다시 출력한 횟수가 기 정해진 횟수를 초과하면, 프로세서(130)는 학습용 데이터베이스(190)로 기계학습용 데이터를 전송하지 않고 임시 데이터베이스(180)에 전송된 기계학습용 데이터를 삭제할 수 있다.
기계학습용 데이터의 사용에 대한 승인 여부와 상관없이, 프로세서(130)는 임시 데이터베이스(180)에 전송된 기계학습용 데이터를 삭제할 수 있다.
프로세서(130)는 사용에 대한 승인이 완료된 기계학습용 데이터를 학습용 데이터베이스(190)에 저장할 수 있다.
프로세서(130)는 학습용 데이터베이스(190)에 전송된 기계학습용 데이터를 삭제할 수 있다.
디바이스(200)에 저장된 기계학습용 데이터는, 기계학습용 데이터의 사용에 대한 승인을 요청한 이후, 추가적으로 생성된 다른 기계학습용 데이터를 포함할 수 있다. 기계학습용 데이터는 하나 또는 그 이상의 개수를 갖는 각각의 데이터일 수도 있고, 복수의 데이터 집단으로 구성된 데이터 그룹을 의미할 수도 있다. 기계학습용 데이터 또는 추가적으로 생성된 다른 기계학습용 데이터는 그 내용 등이 변경됨에 따라 수정될 수 있다.
프로세서(130)는 수정된 기계학습용 데이터 또는 추가적으로 생성된 다른 기계학습용 데이터에 대해서, 별도의 사용에 대한 승인을 통해, 학습용 데이터베이스(190)로 수정된 기계학습용 데이터 또는 추가적으로 생성된 다른 기계학습용 데이터를 전송할 수 있다. 이와 반대로, 프로세서(130)는 수정된 기계학습용 데이터 또는 추가적으로 생성된 다른 기계학습용 데이터에 대해서, 별도의 사용에 대한 승인 없이, 학습용 데이터베이스(190)로 수정된 기계학습용 데이터 또는 추가적으로 생성된 다른 기계학습용 데이터를 전송할 수 있다.
기계학습용 데이터의 사용에 대한 승인 여부가 입력된 이후에도 기계학습용 데이터의 사용에 대한 승인 여부를 다시 입력할 수 있다.
기계학습용 데이터의 사용에 대해 승인을 하는 제1 입력이 입력된 이후, 기계학습용 데이터의 사용에 대해 미승인을 하는 제2 입력이 다시 입력된 경우, 프로세서(130)는 제2 입력이 다시 입력된 시점부터 학습용 데이터베이스(190)로 기계학습용 데이터를 전송하지 않을 수 있다.
기계학습용 데이터의 사용에 대해 미승인을 하는 제3 입력이 입력된 이후, 기계학습용 데이터의 사용에 대해 승인을 하는 제4 입력이 다시 입력된 경우, 프로세서(130)는 제4 입력이 다시 입력된 시점부터 학습용 데이터베이스(190)로 기계학습용 데이터를 전송할 수 있다. 이에 따라, 임시 데이터베이스(180)에 전송된 기계학습용 데이터가 삭제된 이후에 기계학습용 데이터의 사용에 대해 승인에 대한 입력이 된 경우, 프로세서(130)는 기계학습용 데이터가 학습용 데이터베이스(190)로 전송될 수 있다.
메모리(140)에는 데이터 수집 프로그램(150) 및 데이터 수집 프로그램(150)의 실행에 필요한 정보가 저장될 수 있고, 프로세서(130)에 의한 처리 결과가 저장될 수도 있다. 메모리(140)에는 데이터 전처리 프로그램(160) 및 데이터 전처리 프로그램(160)의 실행에 필요한 정보가 저장될 수 있다. 메모리(140)에는 기계학습 프로그램(170) 및 기계학습 프로그램(170)의 실행에 필요한 정보가 저장될 수 있다. 메모리(140)는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 플래시 메모리(flash memory)와 같은 프로그램 명령어들을 저장하고 수행하도록 특별히 구성된 하드웨어 장치 등과 같이 컴퓨터 판독 가능한 기록매체를 의미할 수 있으나, 상술한 실시예에 한정되지 않는다. 또한 메모리(140)는 임시 데이터베이스(180) 및 학습용 데이터베이스(190)를 포함할 수 있다.
데이터 수집 장치(100)가 기계학습용 데이터에 접근하면, 기계학습용 데이터가 임시 데이터베이스(180)로 전송될 수 있다. 임시 데이터베이스(180)로 기계학습용 데이터를 전송하는 경우, 기계학습용 데이터를 암호화하여 임시 데이터베이스(180)로 전송할 수 있다.
기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 기계학습용 데이터가 임시 데이터베이스(180)에서 학습용 데이터베이스(190)로 전송될 수 있다.
기계학습용 데이터의 사용에 대한 미승인이 입력되면, 임시 데이터베이스(180)에 전송된 기계학습용 데이터가 삭제될 수 있다.
기 정해진 시간을 초과하여 기계학습용 데이터의 사용에 대한 승인 여부가 입력되지 않는 경우, 기 정해진 횟수에 따라 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 다시 출력할 수 있다. 인터페이스를 다시 출력한 횟수가 기 정해진 횟수를 초과하면, 학습용 데이터베이스(190)로 기계학습용 데이터를 전송하지 않고 임시 데이터베이스(180)에 전송된 기계학습용 데이터가 삭제될 수 있다.
기 정해진 시간 또는 기 정해진 횟수는 데이터 수집 장치(100)의 입력부(110)를 통해 입력되거나, 기계학습용 데이터가 저장된 디바이스(200)의 입력부(210)을 통해 입력 받을 수 있다.
기계학습용 데이터의 사용에 대한 승인 여부와 상관없이, 데이터 수집 장치(100)를 통해, 임시 데이터베이스(180)에 전송된 기계학습용 데이터를 삭제할 수 있다.
학습용 데이터베이스(190)에는 사용에 대한 승인이 완료된 기계학습용 데이터가 저장될 수 있다. 임시 데이터베이스(180)에 전송된 기계학습용 데이터에 대해, 기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 기계학습용 데이터가 임시 데이터베이스(180)에서 학습용 데이터베이스(190)로 전송될 수 있다. 데이터 수집 장치(100)를 통해, 학습용 데이터베이스(190)에 전송된 기계학습용 데이터를 삭제할 수 있다. 학습용 데이터베이스(190)에 저장된 기계학습용 데이터를 기초로, 기계학습 장치에 의해 기계학습이 수행될 수 있다.
도 2에 나타난 바와 같이, 기계학습용 데이터가 저장된 디바이스(200)는 입력부(210), 출력부(220), 메모리(230)를 포함할 수 있다. 디바이스(200)는 기계학습용 데이터가 저장되어 있는 곳으로서, 기록매체, 웹 서버, 장치 등을 포함할 수 있다. 기록매체는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 플래시 메모리(flash memory)와 같은 프로그램 명령어들을 저장하고 수행하도록 특별히 구성된 하드웨어 장치 등과 같이 컴퓨터 판독 가능한 기록매체를 의미할 수 있다. 기계학습용 데이터가 저장되어 있는 디바이스(200)는 상술한 실시예에 한정되지 않는다.
데이터 수집 장치(100)가 기계학습용 데이터의 사용에 대한 승인을 요청하면, 입력부(210)를 통해 승인 요청을 입력 받을 수 있다. 승인을 요청하는 방식은 알람, 메시지를 포함할 수 있으나 상술한 실시예에 한정되지 않는다.
입력부(210)을 통해 기계학습용 데이터의 사용에 대한 승인 여부가 입력될 수 있다. 입력부(210)를 통해 입력된 승인 여부에 따라, 학습용 데이터베이스(190)로 기계학습용 데이터의 전송 여부가 결정될 수 있다. 입력부(210)를 통해 입력된 승인 여부는 통신망을 통해 데이터 수집 장치(100)로 전송될 수 있다. 통신망은 유선망 또는 무선망일 수 있다.
출력부(220)는 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력할 수 있다. 출력부(220)는 인터페이스를 디스플레이 수단을 통해 시각적인 정보로서 표시할 수 있다. 출력부(220)는 인터페이스를 컴퓨터에서 처리할 수 있는 데이터의 형태로 처리할 수 있다. 출력부(220)는 인터페이스를 통신망으로 연결된 외부 장치로 전송할 수 있다. 출력부(220)가 인터페이스를 출력하는 방법은 각종 출력 형태를 포함할 수 있고, 상술한 실시예에 한정되지 않는다.
메모리(230)는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 플래시 메모리(flash memory)와 같은 프로그램 명령어들을 저장하고 수행하도록 특별히 구성된 하드웨어 장치 등과 같이 컴퓨터 판독 가능한 기록매체를 의미할 수 있으나, 상술한 실시예에 한정되지 않는다.
도 3에 나타난 바와 같이, 데이터 수집 장치(100)는 통신망을 통해 디바이스(200)에 저장된 기계학습용 데이터에 접근할 수 있다. 통신망은 유선망 또는 무선망일 수 있다. 데이터 수집 장치(100)는 내부 장치를 이용하여 디바이스(200)에 저장된 기계학습용 데이터에 직접 접근할 수 있다.
데이터 수집 장치(100)가 디바이스(200)에 저장된 기계학습용 데이터에 접근하는 방법은 상술한 실시예에 한정되지 않는다.
도 4는 본 발명의 일 실시예에 따른 기계학습용 데이터 수집 방법의 순서도이다.
도 4에 나타난 바와 같이, 데이터 수집 장치(100)에 의해 수행되는 기계학습용 데이터 수집 방법은, 디바이스에 저장된 기계학습용 데이터에 접근하는 단계(S100), 상기 디바이스에 대응하는 대상에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계(S200), 상기 디바이스를 통해, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계(S300) 및, 상기 승인 여부에 따라, 학습용 데이터베이스(190)로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계(S400)를 포함할 수 있다.
도 5는 본 발명의 따른 기계학습용 데이터 수집 방법을 구체적으로 예시하고 있는 순서도이다.
데이터 수집 장치(100)는 디바이스(200)에 저장된 기계학습용 데이터에 내부 장치를 이용하여 직접 접근하거나 통신망을 통해 접근할 수 있다.
데이터 수집 장치(100)가 디바이스(200)에 저장된 기계학습용 데이터에 접근하면, 로그 데이터를 생성할 수 있다. 생성된 로그 데이터는 데이터 수집 장치(100)의 메모리(140)에 저장될 수 있다. 생성된 로그 데이터는 디바이스(200)에 대응하는 대상에게 전송될 수 있다. 로그 데이터는 기계학습용 데이터에 접근한 시간, 접근 방법, IP 정보 또는 기타 고유 코드, 기계학습용 데이터를 수집한 횟수 또는 수집한 기계학습용 데이터를 이용하여 기계학습을 수행한 횟수를 포함할 수 있다. 서버의 로그 수집, 웹 로그, 트랜젝션 로그, 클릭 로그, DB 로그 데이터 등을 수집하여 로그 데이터를 생성할 수 있다. 로그 데이터를 생성하는 과정에서 애플리케이션 데이터, 로그와 리소스 사용량, 메시지, 이벤트 등의 데이터를 수집하고 인덱싱하고 조회하도록 구성될 수 있다. 로그 데이터를 수집하는 방법은 상술한 실시예에 한정되지 않고 다양한 수집 방식을 지원할 수 있다.
데이터 수집 장치(100)가 기계학습용 데이터에 접근하면, 기계학습용 데이터가 임시 데이터베이스(180)로 전송될 수 있다. 임시 데이터베이스(180)로 기계학습용 데이터를 전송하는 경우, 기계학습용 데이터를 암호화하여 임시 데이터베이스(180)로 전송할 수 있다.
기계학습용 데이터는 해당 기계학습용 데이터의 특성을 파악하거나 라벨 정보로 활용할 수 있는 디바이스(200)의 정보, 기계학습용 데이터에 대한 디바이스(200) 내, 외의 사용 빈도, 작성 및 접근 시기, 디바이스간의 관계 및 연결 구조, 통계적 정보 등의 정보를 포함할 수 있다. 디바이스(200)의 정보는 재가공 될 수 있다.
기 임시 데이터베이스(180) 또는 학습용 데이터베이스(190)로 전송된 기계학습용 데이터와 동일하다고 판단되는 경우, 해당 기계학습용 데이터는 임시 데이터베이스(180)에 전송하지 않을 수 있다.
기 임시 데이터베이스(180)로 전송된 기계학습용 데이터와 유사도가 높다고 판단되는 기계학습용 데이터의 경우, 기 임시 데이터베이스(180)로 전송된 기계학습용 데이터의 사용에 대한 승인이 입력되면, 별도의 사용에 대한 요청 또는 승인이 없이 학습용 데이터베이스(190)로 기계학습용 데이터의 전송 여부를 선택할 수 있다.
기 학습용 데이터베이스(190)로 전송된 기계학습용 데이터와 유사도가 높다고 판단되는 기계학습용 데이터의 경우, 별도의 사용에 대한 요청 또는 승인이 없이 학습용 데이터베이스(190)로 기계학습용 데이터의 전송 여부를 선택할 수 있다.
기 임시 데이터베이스(180)로 전송된 기계학습용 데이터와 동일한 또는 유사한 기계학습용 데이터를 분류하기 위한 방법으로는 수집된 기계학습용 데이터뿐 아니라 기계학습용 데이터에 접근 시 생성한 정보가 사용될 수 있다. 기계학습용 데이터에 접근 시 생성한 정보는 기계학습용 데이터의 사용에 대한 승인 여부를 필요로 하지 않고 학습용 데이터베이스(190)로 전송할 수 있다.
데이터의 분류, 디바이스(200) 출처 정보, 디바이스간의 관계정보로부터 파악된 연결구조 등 사용되는 용어 유사성 등의 다양한 접근 및 생성 가능한 데이터를 포함하며, 본 데이터 자체를 노출 하지 않고 데이터 전처리 기법으로 활용될 수 있는 기계학습을 통하여 차원 감소, 클러스터링, 그룹핑 매니폴드 등의 방법론 및 추후 개선된 방법 등을 포함하는 데이터 전처리 기법을 활용할 수 있다.
본 분석을 통하여 임시 데이터베이스(180)로 전송할 기계학습용 데이터, 학습용 데이터베이스(190)로 전송할 기계학습용 데이터, 사용에 대한 승인 요청을 진행할 기계학습용 데이터 셋을 구분할 수 있다.
기계학습용 데이터의 사용에 대한 미승인이 디바이스(200) 또는 기계학습용 데이터에 포함되어 있는 경우, 기계학습용 데이터에 접근하면, 임시 데이터베이스(180)로 기계학습용 데이터의 전송 여부를 선택할 수 있다. 기계학습용 데이터의 사용에 대한 승인이 디바이스(200) 또는 기계학습용 데이터에 포함되어 있는 경우, 별도의 사용에 대한 요청 또는 승인이 없이 학습용 데이터베이스(190)로 기계학습용 데이터의 전송 여부를 선택할 수 있다.
기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 기계학습용 데이터가 임시 데이터베이스(180)에서 학습용 데이터베이스(190)로 전송될 수 있다. 사용에 대한 승인이 입력된 기계학습용 데이터와 유사도가 높거나 동일하다고 판단되는 다른 기계학습용 데이터는 학습용 데이터베이스(190)로 전송될 수 있다. 이 때, 사용에 대한 승인이 입력된 기계학습용 데이터와 유사도가 높거나 동일하다고 판단되는 다른 기계학습용 데이터의 양적 정보를 포함할 수 있다.
기계학습용 데이터의 사용에 대한 미승인이 입력되면, 임시 데이터베이스(180)에에 전송된 기계학습용 데이터가 삭제될 수 있다. 이 경우, 임시 데이터베이스(180)에 전송된 기계학습용 데이터와 유사도가 높거나 동일하다고 판단되는 다른 기계학습용 데이터 중 일부만 삭제될 수 있다.
기 정해진 시간을 초과하여 기계학습용 데이터의 사용에 대한 승인 여부가 입력되지 않는 경우, 기 정해진 횟수에 따라 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 다시 출력할 수 있다. 인터페이스를 다시 출력한 횟수가 기 정해진 횟수를 초과하면, 학습용 데이터베이스(190)로 기계학습용 데이터를 전송하지 않고 임시 데이터베이스(180)에 전송된 기계학습용 데이터가 삭제될 수 있다. 이 경우, 임시 데이터베이스(180)에 전송된 기계학습용 데이터와 유사도가 높거나 동일하다고 판단되는 다른 기계학습용 데이터 중 일부만 삭제될 수 있다.
기 정해진 시간 또는 기 정해진 횟수는 데이터 수집 장치(100)의 입력부(110)를 통해 입력되거나, 기계학습용 데이터가 저장된 디바이스(200)의 입력부(210)을 통해 입력 받을 수 있다.
기계학습용 데이터의 사용에 대한 승인 여부와 상관없이, 데이터 수집 장치(100)를 통해, 임시 데이터베이스(180)에 전송된 기계학습용 데이터를 삭제할 수 있다.
학습용 데이터베이스(190)에는 사용에 대한 승인이 완료된 기계학습용 데이터 또는 생성 정보가 저장될 수 있다.
임시 데이터베이스(180)에 전송된 기계학습용 데이터에 대해, 기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 기계학습용 데이터 또는 생성 정보가 임시 데이터베이스(180)서 학습용 데이터베이스(190)로 전송될 수 있다. 데이터 수집 장치(100)를 통해, 학습용 데이터베이스(190)에 전송된 기계학습용 데이터를 삭제할 수 있다. 학습용 데이터베이스(190)에 저장된 기계학습용 데이터를 기초로, 기계학습 장치에 의해 기계학습이 수행될 수 있다.
디바이스(200)에 저장된 기계학습용 데이터는, 기계학습용 데이터의 사용에 대한 승인을 요청한 이후, 추가적으로 생성된 다른 기계학습용 데이터를 포함할 수 있다. 기계학습용 데이터는 하나 또는 그 이상의 개수를 갖는 각각의 데이터일 수도 있고, 복수의 데이터 집단으로 구성된 데이터 그룹을 의미할 수도 있다. 기계학습용 데이터 또는 추가적으로 생성된 다른 기계학습용 데이터는 그 내용 등이 변경됨에 따라 수정될 수 있다.
수정된 기계학습용 데이터 또는 추가적으로 생성된 다른 기계학습용 데이터에 대해서, 별도의 사용에 대한 승인을 통해, 학습용 데이터베이스(190)로 수정된 기계학습용 데이터 또는 추가적으로 생성된 다른 기계학습용 데이터를 전송할 수 있다. 이와 반대로, 수정된 기계학습용 데이터 또는 추가적으로 생성된 다른 기계학습용 데이터에 대해서, 별도의 사용에 대한 승인 없이, 학습용 데이터베이스(190)로 수정된 기계학습용 데이터 또는 추가적으로 생성된 다른 기계학습용 데이터를 전송할 수 있다.
기계학습용 데이터의 사용에 대한 승인 여부가 입력된 이후에도 기계학습용 데이터의 사용에 대한 승인 여부를 다시 입력할 수 있다.
기계학습용 데이터의 사용에 대해 승인을 하는 제1 입력이 입력된 이후, 기계학습용 데이터의 사용에 대해 미승인을 하는 제2 입력이 다시 입력된 경우, 제2 입력이 다시 입력된 시점부터 학습용 데이터베이스(190)로 기계학습용 데이터를 전송하지 않을 수 있다.
기계학습용 데이터의 사용에 대해 미승인을 하는 제3 입력이 입력된 이후, 기계학습용 데이터의 사용에 대해 승인을 하는 제4 입력이 다시 입력된 경우, 제4 입력이 다시 입력된 시점부터 학습용 데이터베이스(190)로 기계학습용 데이터를 전송할 수 있다. 이에 따라, 임시 데이터베이스(180)에 전송된 기계학습용 데이터가 삭제된 이후에 기계학습용 데이터의 사용에 대해 승인에 대한 입력이 된 경우, 기계학습용 데이터가 학습용 데이터베이스(190)로 전송될 수 있다.
학습용 데이터베이스(190)에 저장된 기계학습용 데이터를 기초로, 기계학습 장치에 의해 기계학습이 수행될 수 있다.
본 발명에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 인코딩 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 인코딩 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방법으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
또한, 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 품질에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 균등한 범위 내에 있는 모든 기술사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
100: 데이터 수집 장치
110: 입력부
120: 출력부
130: 프로세서
140: 메모리
150: 데이터 수집 프로그램
160: 데이터 전처리 프로그램
170: 기계학습 프로그램
180: 임시 데이터베이스
190: 학습용 데이터베이스
200: 기계학습용 데이터가 저장된 디바이스
210: 입력부
220: 출력부
230: 메모리

Claims (18)

  1. 데이터 수집 장치에 의해 수행되는 기계학습용 데이터 수집 방법에 있어서,
    디바이스에 저장된 기계학습용 데이터에 접근하는 단계;
    상기 기계학습용 데이터를 생성한 주체에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계;
    상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계; 및
    상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계를 포함하고,
    상기 디바이스에 저장된 상기 기계학습용 데이터는 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이후, 추가적으로 생성된 다른 기계학습용 데이터를 포함하고,
    상기 기계학습용 데이터는,
    상기 기계학습용 데이터의 전송 여부를 결정하는 단계 이전까지, 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이전 또는 이후에 생성되었는지 여부에 관계없이 수정될 수 있고,
    상기 방법은,
    수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터에 대해서, 별도의 사용에 대한 승인 필요 여부에 따라, 상기 학습용 데이터베이스로 상기 수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터를 전송하는 단계를 더 포함하고,
    상기 기계학습용 데이터의 전송 여부를 결정하는 단계에서,
    상기 기계학습용 데이터에 접근하면, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 간 유사도를 판단하여 상기 학습용 데이터베이스 또는 상기 임시 데이터 베이스로 상기 기계학습용 데이터의 전송 여부를 결정하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부가 동일하다고 판단되는 경우, 상기 기계학습용 데이터를 전송하지 않고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터의 사용에 대한 승인이 입력되면, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 미만인 경우, 상기 기계학습용 데이터를 상기 임시 데이터 베이스로 전송하고,
    상기 기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 상기 기계학습용 데이터를 상기 임시 데이터베이스에서 상기 학습용 데이터베이스로 전송하고, 상기 기계학습용 데이터의 사용에 대해 미승인이 입력되거나 기 정해진 시간을 초과하여 상기 기계학습용 데이터의 사용에 대한 승인 여부가 입력되지 않는 경우, 상기 임시 데이터베이스에서 상기 기계학습용 데이터를 삭제하는,
    기계학습용 데이터 수집 방법.
  2. 제1항에 있어서,
    상기 디바이스는 기록매체를 포함하는,
    기계학습용 데이터 수집 방법.
  3. 제1항에 있어서,
    상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이전에, 상기 디바이스를 통해, 상기 기계학습용 데이터의 사용에 대한 승인 여부가 미리 입력될 수 있는 단계를 더 포함하고,
    상기 미리 입력된 승인 여부가 상기 기계학습용 데이터의 사용에 대한 승인인 경우, 상기 기계학습용 데이터의 사용에 대한 별도의 승인 요청 없이 상기 학습용 데이터베이스로 상기 기계학습용 데이터를 전송할 수 있고,
    상기 미리 입력된 승인 여부가 상기 기계학습용 데이터의 사용에 대한 미승인인 경우, 상기 학습용 데이터베이스로 상기 기계학습용 데이터를 전송하지 않는,
    기계학습용 데이터 수집 방법.
  4. 제1항에 있어서,
    상기 인터페이스를 출력하는 단계는,
    상기 인터페이스에 대해, 기 정해진 시간을 초과하여 상기 승인 여부가 입력되지 않으면, 기 정해진 횟수에 따라 상기 인터페이스를 다시 출력하는 단계를 포함하고,
    상기 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계는,
    상기 인터페이스를 다시 출력한 횟수가 상기 기 정해진 횟수를 초과하면, 상기 학습용 데이터베이스로 상기 기계학습용 데이터를 전송하지 않는,
    기계학습용 데이터 수집 방법.
  5. 삭제
  6. 삭제
  7. 삭제
  8. 제1항에 있어서,
    상기 승인 여부가 입력된 이후, 상기 승인 여부가 다시 입력될 수 있는 단계를 더 포함하는,
    기계학습용 데이터 수집 방법.
  9. 제8항에 있어서,
    상기 승인 여부가 다시 입력될 수 있는 단계는,
    상기 기계학습용 데이터의 사용에 대해 승인을 하는 제1 입력이 입력된 이후, 상기 기계학습용 데이터의 사용에 대해 미승인을 하는 제2 입력이 다시 입력된 경우, 상기 제2 입력이 다시 입력된 시점부터 상기 학습용 데이터베이스로 상기 기계학습용 데이터를 전송하지 않고,
    상기 기계학습용 데이터의 사용에 대해 미승인을 하는 제3 입력이 입력된 이후, 상기 기계학습용 데이터의 사용에 대해 승인을 하는 제4 입력이 다시 입력된 경우, 상기 제4 입력을 다시 입력된 시점부터 상기 학습용 데이터베이스로 상기 기계학습용 데이터를 전송하는,
    기계학습용 데이터 수집 방법.
  10. 제1항에 있어서,
    상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계는,
    상기 디바이스에 저장된 상기 기계학습용 데이터에 접근하면, 로그 데이터를 생성하는 단계; 및
    상기 로그 데이터를 상기 기계학습용 데이터를 생성한 주체에게 전송하는 단계를 포함하는,
    기계학습용 데이터 수집 방법.
  11. 제10항에 있어서,
    상기 로그 데이터는 상기 기계학습용 데이터에 접근한 시간, 접근 방법, IP 정보 또는 기타 고유 코드, 상기 기계학습용 데이터를 수집한 횟수 또는 수집한 기계학습용 데이터를 이용하여 기계학습을 수행한 횟수를 포함하는,
    기계학습용 데이터 수집 방법.
  12. 삭제
  13. 제1항에 있어서,
    상기 임시 데이터베이스로 상기 기계학습용 데이터를 전송하는 단계는,
    상기 기계학습용 데이터를 암호화하여 상기 임시 데이터베이스로 전송하는,
    기계학습용 데이터 수집 방법.
  14. 기계학습 장치에 의해 수행되는 기계학습 방법에 있어서,
    디바이스에 저장된 기계학습용 데이터에 접근하는 단계;
    상기 기계학습용 데이터를 생성한 주체에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계;
    상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계;
    상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계; 및
    상기 학습용 데이터베이스를 기초로 기계학습을 수행하는 단계를 포함하고,
    상기 디바이스에 저장된 상기 기계학습용 데이터는 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이후, 추가적으로 생성된 다른 기계학습용 데이터를 포함하고,
    상기 기계학습용 데이터는,
    상기 기계학습용 데이터의 전송 여부를 결정하는 단계 이전까지, 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이전 또는 이후에 생성되었는지 여부에 관계없이 수정될 수 있고,
    상기 방법은,
    수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터에 대해서, 별도의 사용에 대한 승인 필요 여부에 따라, 상기 학습용 데이터베이스로 상기 수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터를 전송하는 단계를 더 포함하고,
    상기 기계학습용 데이터의 전송 여부를 결정하는 단계에서,
    상기 기계학습용 데이터에 접근하면, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 간 유사도를 판단하여 상기 학습용 데이터베이스 또는 상기 임시 데이터 베이스로 상기 기계학습용 데이터의 전송 여부를 결정하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부가 동일하다고 판단되는 경우, 상기 기계학습용 데이터를 전송하지 않고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터의 사용에 대한 승인이 입력되면, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 미만인 경우, 상기 기계학습용 데이터를 상기 임시 데이터 베이스로 전송하고,
    상기 기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 상기 기계학습용 데이터를 상기 임시 데이터베이스에서 상기 학습용 데이터베이스로 전송하고, 상기 기계학습용 데이터의 사용에 대해 미승인이 입력되거나 기 정해진 시간을 초과하여 상기 기계학습용 데이터의 사용에 대한 승인 여부가 입력되지 않는 경우, 상기 임시 데이터베이스에서 상기 기계학습용 데이터를 삭제하는,
    기계학습 방법.
  15. 컴퓨터 실행 가능한 명령어를 포함하는 메모리; 및
    상기 명령어를 실행함으로써, 디바이스에 저장된 기계학습용 데이터에 접근하고, 상기 기계학습용 데이터를 생성한 주체에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하고, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하고, 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하도록 제어하고, 상기 디바이스에 저장된 상기 기계학습용 데이터는 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이후, 추가적으로 생성된 다른 기계학습용 데이터를 포함하고, 상기 기계학습용 데이터는, 상기 기계학습용 데이터의 전송 여부를 결정하는 단계 이전까지, 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이전 또는 이후에 생성되었는지 여부에 관계없이 수정될 수 있고, 수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터에 대해서, 별도의 사용에 대한 승인 필요 여부에 따라, 상기 학습용 데이터베이스로 상기 수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터를 전송하는 프로세서를 포함하고,
    상기 프로세서는,
    상기 기계학습용 데이터에 접근하면, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 간 유사도를 판단하여 상기 학습용 데이터베이스 또는 상기 임시 데이터 베이스로 상기 기계학습용 데이터의 전송 여부를 결정하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부가 동일하다고 판단되는 경우, 상기 기계학습용 데이터를 전송하지 않고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터의 사용에 대한 승인이 입력되면, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 미만인 경우, 상기 기계학습용 데이터를 상기 임시 데이터 베이스로 전송하고,
    상기 기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 상기 기계학습용 데이터를 상기 임시 데이터베이스에서 상기 학습용 데이터베이스로 전송하고, 상기 기계학습용 데이터의 사용에 대해 미승인이 입력되거나 기 정해진 시간을 초과하여 상기 기계학습용 데이터의 사용에 대한 승인 여부가 입력되지 않는 경우, 상기 임시 데이터베이스에서 상기 기계학습용 데이터가 삭제되는,
    데이터 수집 장치.
  16. 컴퓨터 실행 가능한 명령어를 포함하는 메모리; 및
    상기 명령어를 실행함으로써, 디바이스에 저장된 기계학습용 데이터에 접근하고, 상기 기계학습용 데이터를 생성한 주체에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하고, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하고, 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하고, 상기 학습용 데이터베이스를 기초로 기계학습을 수행하도록 제어하고, 상기 디바이스에 저장된 상기 기계학습용 데이터는 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이후, 추가적으로 생성된 다른 기계학습용 데이터를 포함하고, 상기 기계학습용 데이터는, 상기 기계학습용 데이터의 전송 여부를 결정하는 단계 이전까지, 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이전 또는 이후에 생성되었는지 여부에 관계없이 수정될 수 있고, 수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터에 대해서, 별도의 사용에 대한 승인 필요 여부에 따라, 상기 학습용 데이터베이스로 상기 수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터를 전송하는 프로세서를 포함하고,
    상기 프로세서는,
    상기 기계학습용 데이터에 접근하면, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 간 유사도를 판단하여 상기 학습용 데이터베이스 또는 상기 임시 데이터 베이스로 상기 기계학습용 데이터의 전송 여부를 결정하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부가 동일하다고 판단되는 경우, 상기 기계학습용 데이터를 전송하지 않고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터의 사용에 대한 승인이 입력되면, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 미만인 경우, 상기 기계학습용 데이터를 상기 임시 데이터 베이스로 전송하고,
    상기 기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 상기 기계학습용 데이터를 상기 임시 데이터베이스에서 상기 학습용 데이터베이스로 전송하고, 상기 기계학습용 데이터의 사용에 대해 미승인이 입력되거나 기 정해진 시간을 초과하여 상기 기계학습용 데이터의 사용에 대한 승인 여부가 입력되지 않는 경우, 상기 임시 데이터베이스에서 상기 기계학습용 데이터를 삭제하는,
    기계학습 장치.
  17. 컴퓨터 실행 가능한 명령어를 저장하고 있는 컴퓨터 판독 가능 기록매체로서, 상기 컴퓨터 실행 가능한 명령어는, 프로세서에 의해 실행되면,
    디바이스에 저장된 기계학습용 데이터에 접근하는 단계, 상기 기계학습용 데이터를 생성한 주체에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계 및 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계를 포함하고, 상기 디바이스에 저장된 상기 기계학습용 데이터는 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이후, 추가적으로 생성된 다른 기계학습용 데이터를 포함하고, 상기 기계학습용 데이터는, 상기 기계학습용 데이터의 전송 여부를 결정하는 단계 이전까지, 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이전 또는 이후에 생성되었는지 여부에 관계없이 수정될 수 있고, 수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터에 대해서, 별도의 사용에 대한 승인 필요 여부에 따라, 상기 학습용 데이터베이스로 상기 수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터를 전송하는 단계를 더 포함하는 방법을 상기 프로세서가 수행하도록 하고,
    상기 기계학습용 데이터의 전송 여부를 결정하는 단계에서,
    상기 기계학습용 데이터에 접근하면, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 간 유사도를 판단하여 상기 학습용 데이터베이스 또는 상기 임시 데이터 베이스로 상기 기계학습용 데이터의 전송 여부를 결정하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부가 동일하다고 판단되는 경우, 상기 기계학습용 데이터를 전송하지 않고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터의 사용에 대한 승인이 입력되면, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 미만인 경우, 상기 기계학습용 데이터를 상기 임시 데이터 베이스로 전송하고,
    상기 기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 상기 기계학습용 데이터를 상기 임시 데이터베이스에서 상기 학습용 데이터베이스로 전송하고, 상기 기계학습용 데이터의 사용에 대해 미승인이 입력되거나 기 정해진 시간을 초과하여 상기 기계학습용 데이터의 사용에 대한 승인 여부가 입력되지 않는 경우, 상기 임시 데이터베이스에서 상기 기계학습용 데이터를 삭제하는,
    컴퓨터 판독 가능한 기록매체.
  18. 컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램으로서,
    상기 컴퓨터 프로그램은, 프로세서에 의해 실행되면
    디바이스에 저장된 기계학습용 데이터에 접근하는 단계, 상기 기계학습용 데이터를 생성한 주체에게 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계, 상기 기계학습용 데이터의 사용에 대한 승인 여부를 입력할 수 있는 인터페이스를 출력하는 단계 및 상기 승인 여부에 따라, 학습용 데이터베이스로 상기 기계학습용 데이터의 전송 여부를 결정하는 단계를 포함하고, 상기 디바이스에 저장된 상기 기계학습용 데이터는 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이후, 추가적으로 생성된 다른 기계학습용 데이터를 포함하고, 상기 기계학습용 데이터는, 상기 기계학습용 데이터의 전송 여부를 결정하는 단계 이전까지, 상기 기계학습용 데이터의 사용에 대한 승인을 요청하는 단계 이전 또는 이후에 생성되었는지 여부에 관계없이 수정될 수 있고, 수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터에 대해서, 별도의 사용에 대한 승인 필요 여부에 따라, 상기 학습용 데이터베이스로 상기 수정된 기계학습용 데이터 또는 상기 추가적으로 생성된 다른 기계학습용 데이터를 전송하는 단계를 더 포함하는 방법을 상기 프로세서가 수행하도록 하기 위한 명령어를 포함하고,
    상기 기계학습용 데이터의 전송 여부를 결정하는 단계에서,
    상기 기계학습용 데이터에 접근하면, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 간 유사도를 판단하여 상기 학습용 데이터베이스 또는 상기 임시 데이터 베이스로 상기 기계학습용 데이터의 전송 여부를 결정하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부가 동일하다고 판단되는 경우, 상기 기계학습용 데이터를 전송하지 않고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 임시 데이터 베이스로 기 전송된 기계학습용 데이터의 사용에 대한 승인이 입력되면, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 이상인 경우, 상기 기계학습용 데이터의 사용에 대한 승인없이 바로 상기 기계학습용 데이터를 상기 학습용 데이터베이스로 전송하고,
    상기 유사도 판단 결과, 상기 기계학습용 데이터와 상기 학습용 데이터베이스 및 임시 데이터 베이스로 기 전송된 기계학습용 데이터 중 적어도 일부의 유사도가 기 설정된 값 미만인 경우, 상기 기계학습용 데이터를 상기 임시 데이터 베이스로 전송하고,
    상기 기계학습용 데이터의 사용에 대한 승인이 입력되는 경우, 상기 기계학습용 데이터를 상기 임시 데이터베이스에서 상기 학습용 데이터베이스로 전송하고, 상기 기계학습용 데이터의 사용에 대해 미승인이 입력되거나 기 정해진 시간을 초과하여 상기 기계학습용 데이터의 사용에 대한 승인 여부가 입력되지 않는 경우, 상기 임시 데이터베이스에서 상기 기계학습용 데이터를 삭제하는,
    컴퓨터 판독 가능한 기록매체에 저장되어 있는 컴퓨터 프로그램.
KR1020230068992A 2023-05-30 2023-05-30 기계학습용 데이터 수집 장치 및 방법 KR102663409B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020230068992A KR102663409B1 (ko) 2023-05-30 2023-05-30 기계학습용 데이터 수집 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020230068992A KR102663409B1 (ko) 2023-05-30 2023-05-30 기계학습용 데이터 수집 장치 및 방법

Publications (1)

Publication Number Publication Date
KR102663409B1 true KR102663409B1 (ko) 2024-05-03

Family

ID=91077103

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020230068992A KR102663409B1 (ko) 2023-05-30 2023-05-30 기계학습용 데이터 수집 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102663409B1 (ko)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010091502A (ko) 2000-03-16 2001-10-23 황재웅 회원정보 거래방법
KR20140114945A (ko) * 2013-03-18 2014-09-30 한국전자통신연구원 게임 봇 탐지 방법 및 장치
KR20150105789A (ko) * 2014-03-10 2015-09-18 김상기 개인정보 관리 서버
KR20190112959A (ko) * 2018-03-27 2019-10-08 서울대학교산학협력단 암호화 데이터를 이용하는 기계학습 모델 운영방법 및 기계학습 모델 기반 장치
JP7129598B2 (ja) * 2017-02-03 2022-09-02 パナソニックIpマネジメント株式会社 学習済みモデル生成方法、学習済みモデル生成装置、および学習済みモデル利用装置
KR20220155700A (ko) * 2021-05-17 2022-11-24 (주)케이아이오티 인공지능을 이용한 군중 계수 장치 및 방법
JP2023069816A (ja) * 2021-11-08 2023-05-18 欽一 市川 書類保存支援システム、書類保存支援方法、およびコンピュータプログラム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010091502A (ko) 2000-03-16 2001-10-23 황재웅 회원정보 거래방법
KR20140114945A (ko) * 2013-03-18 2014-09-30 한국전자통신연구원 게임 봇 탐지 방법 및 장치
KR20150105789A (ko) * 2014-03-10 2015-09-18 김상기 개인정보 관리 서버
JP7129598B2 (ja) * 2017-02-03 2022-09-02 パナソニックIpマネジメント株式会社 学習済みモデル生成方法、学習済みモデル生成装置、および学習済みモデル利用装置
KR20190112959A (ko) * 2018-03-27 2019-10-08 서울대학교산학협력단 암호화 데이터를 이용하는 기계학습 모델 운영방법 및 기계학습 모델 기반 장치
KR20220155700A (ko) * 2021-05-17 2022-11-24 (주)케이아이오티 인공지능을 이용한 군중 계수 장치 및 방법
JP2023069816A (ja) * 2021-11-08 2023-05-18 欽一 市川 書類保存支援システム、書類保存支援方法、およびコンピュータプログラム

Similar Documents

Publication Publication Date Title
US20200050968A1 (en) Interactive interfaces for machine learning model evaluations
CA2953817C (en) Feature processing tradeoff management
US10824758B2 (en) System and method for managing enterprise data
US10019538B2 (en) Knowledge representation on action graph database
CN111753198A (zh) 信息推荐方法和装置、以及电子设备和可读存储介质
US11853329B2 (en) Metadata classification
US20220414468A1 (en) Predicting and visualizing outcomes using a time-aware recurrent neural network
Hammond et al. Cloud based predictive analytics: text classification, recommender systems and decision support
US20230325950A1 (en) Updating a document based on transaction analysis
US20230100996A1 (en) Data analysis and rule generation for providing a recommendation
Cao [Retracted] Mode Optimization and Rule Management of Intellectual Property Rights Protection of Educational Resource Data Based on Machine Learning Algorithm
US11283839B2 (en) Enforcement knowledge graph-based data security rule change analysis
KR102663409B1 (ko) 기계학습용 데이터 수집 장치 및 방법
CN117093556A (zh) 日志分类方法、装置、计算机设备及计算机可读存储介质
KR101418475B1 (ko) 개인 디지털 데이터 삭제 시스템 및 이를 이용한 개인 디지털 데이터 삭제 방법
CN117009509A (zh) 数据安全分级方法、装置、设备、存储介质和程序产品
Lydia et al. Data integration and data privacy through “pay-as-you-go” approach
Adamakis et al. Visualizing the risks of de-anonymization in high-dimensional data
CN113961811A (zh) 基于事件图谱的话术推荐方法、装置、设备及介质
Noaeen et al. Transportation engineering on social question and answer websites: an empirical case study
US20230010147A1 (en) Automated determination of accurate data schema
KR100347961B1 (ko) 상품/규칙 관리 시스템 및 방법, 그 프로그램의 소스를기록한 기록매체
KR20240059932A (ko) 악플과 관련된 판례 추천 방법 및 장치
CN116975014A (zh) 数据管理方法、装置、电子设备及存储介质
Blake et al. Artificial Intelligence for Urology Research: The Holy Grail of Data Science or Pandora's Box of Misinformation?

Legal Events

Date Code Title Description
AMND Amendment
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant