KR102361950B1 - Ai의 학습 및 적용을 위한 개체 데이터를 검출하는 방법 및 시스템 - Google Patents
Ai의 학습 및 적용을 위한 개체 데이터를 검출하는 방법 및 시스템 Download PDFInfo
- Publication number
- KR102361950B1 KR102361950B1 KR1020200031071A KR20200031071A KR102361950B1 KR 102361950 B1 KR102361950 B1 KR 102361950B1 KR 1020200031071 A KR1020200031071 A KR 1020200031071A KR 20200031071 A KR20200031071 A KR 20200031071A KR 102361950 B1 KR102361950 B1 KR 102361950B1
- Authority
- KR
- South Korea
- Prior art keywords
- data
- entity
- singularity
- detecting
- delete delete
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
본 발명은 AI의 학습 및 적용을 위한 개체 데이터를 검출하는 방법에 관한 것으로, 임의의 타입의 개체 데이터를 입력받는 단계; 상기 입력된 개체 데이터를 벡터화하는 단계; 상기 벡터화된 개체 데이터를 복수의 차원의 성분벡터로 분해하는 단계; 상기 분해된 성분벡터의 특이점을 추출하는 단계; 및 상기 추출된 특이점의 패턴에 기초하여 상기 개체 또는 상기 개체와 기 설정된 유사도를 갖는 타 개체를 검출하는 단계를 포함한다.
Description
본 발명은 AI의 학습 및 적용을 위한 개체 데이터를 검출하는 방법 및 시스템에 관한 것으로, 보다 구체적으로는 벡터화된 개체 데이터로부터 특이점을 추출하고 입력된 개체 데이터와 유사한 개체를 검출하여 이를 AI의 학습 데이터로 이용하거나 데이터 처리 결과로 이용하는 방법 및 시스템에 관한 것이다.
마우스나 전자펜 등과 같은 장치를 이용하여 그림이나 문자 등이 입력된 경우, 사람들은 해당 이미지를 보고 직관적으로 무엇을 의미하는지 알 수 있다.
하지만 AI와 같은 컴퓨터가 해당 이미지를 보고 인간과 같이 인식하기 위해서는 미리 컴퓨터 상에 무수히 많은 유사한 그림이나 사진을 학습시켜야만 가능하다.
이러한 컴퓨터의 학습을 위한 자료 준비를 학습용 데이터 처리라고 일컫는데, 현재까지는 이와 같은 방대하고 다양한 데이터를 수집하는데 상당한 노고가 필요하다.
만약 학습 데이터가 충분하지 않다면, 이미지의 경우 또다시 동일한 이미지를 대상으로 노이즈 처리, 위치 이동, 사이즈 조정 등과 같은 다양한 방법의 이미지 프로세싱을 거치는데, 이것 역시 연구자의 몫이며 이러한 작업에 수많은 시간과 노력 그리고 경제적인 부담이 요구된다.
따라서, AI의 학습을 위한 학습 데이터를 준비하는 것, 그리고 AI의 데이터 처리를 통해 개체 데이터를 검출하는 것을 보다 용이하게 하기 위한 기술이 필요한 실정이다.
상술한 바와 같은 문제점을 해결하기 위한 본 발명은 입력된 개체 데이터를 벡터화하고, 벡터화된 개체 데이터로부터 특이점을 추출하여 입력된 개체 데이터와 유사한 개체를 검출하고 이를 AI의 학습 데이터로 이용하거나 데이터 처리 결과로 이용하는 AI의 학습 및 적용을 위한 개체 데이터를 검출하는 방법 및 시스템을 제공하고자 한다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 과제를 해결하기 위한 본 발명의 제1측면에 따른 AI의 학습 및 적용을 위한 개체 데이터를 검출하는 방법은 임의의 타입의 개체 데이터를 입력받는 단계; 상기 입력된 개체 데이터를 벡터화하는 단계; 상기 벡터화된 개체 데이터를 복수의 차원의 성분벡터로 분해하는 단계; 상기 분해된 성분벡터의 특이점을 추출하는 단계; 및 상기 추출된 특이점의 패턴에 기초하여 상기 개체 또는 상기 개체와 기 설정된 유사도를 갖는 타 개체를 검출하는 단계를 포함한다.
일 실시예로, 상기 개체 데이터는 하나 이상의 특징화된 선으로 구성되며, 상기 특징화된 선은 제1차원의 성분벡터 및 제2차원의 성분벡터로 구성된 점들의 집합으로 구성될 수 있다.
일 실시예로, 상기 분해된 성분벡터의 특이점을 추출하는 단계는, 상기 특징화된 선에 포함된 점들의 분해된 성분벡터 중 동일 성분벡터별 그룹을 생성하여 상기 특이점을 추출할 수 있다.
일 실시예로, 상기 분해된 성분벡터의 특이점을 추출하는 단계는, 상기 동일 성분벡터별 그룹에 대한 크기 정보, 상기 크기에 대한 표준편차 정보, 위치점 정보, 평균이동 정보, 피크 사이의 거리 및 높이 정보 중 하나 이상에 기초하여 상기 성분벡터의 특이점을 추출할 수 있다.
일 실시예로, 상기 입력된 개체 데이터와 상기 검출된 개체 또는 타개체의 정보를 상기 AI 학습을 위한 학습 데이터로 제공하는 단계를 더 포함할 수 있다.
일 실시예로, 상기 임의의 타입의 개체 데이터를 입력받는 단계는, 상기 개체 데이터로 사인 데이터를 입력받고, 상기 추출된 특이점의 패턴에 기초하여 상기 개체 또는 상기 개체와 기 설정된 유사도를 갖는 타 개체를 검출하는 단계는, 상기 입력된 사인 데이터의 특이점에 기초하여 미리 저장된 사인 데이터를 검출할 수 있다.
일 실시예로, 상기 사인 데이터는 비공개용 사인 데이터이되, 상기 미리 저장된 비공개용 사인 데이터가 검출됨에 따라 상기 비공개용 사인 데이터에 대응하는 공개용 사인이 출력되어 인증이 완료될 수 있다.
일 실시예로, 특정 기능 또는 서비스의 활성화를 위한 1회 이상의 로그인 인증이 수행된 이후, 상기 로그인 인증의 해제를 위한 미리 설정된 시간이 경과하였는지 여부를 판별하는 단계; 상기 미리 설정된 시간이 경과한 경우, 상기 미리 저장된 사인 데이터의 검출 여부를 판별하는 단계; 및 상기 미리 저장된 사인 데이터가 검출된 경우 상기 로그인 인증을 유지시키는 단계를 더 포함할 수 있다.
일 실시예로, 상기 임의의 타입의 개체 데이터를 입력받는 단계는, 상기 개체 데이터로 위치 정보를 포함하고 있는 벡터 이미지를 입력받고, 상기 추출된 특이점의 패턴에 기초하여 상기 개체 또는 상기 개체와 기 설정된 유사도를 갖는 타 개체를 검출하는 단계는, 상기 입력된 벡터 이미지의 특이점에 기초하여 상기 벡터 이미지로 구성된 일러스트를 검출할 수 있다.
일 실시예로, 상기 임의의 타입의 개체 데이터를 입력받는 단계는, 상기 개체 데이터로 외곽선 및 중심선 중 하나 이상의 특징화된 선을 포함하는 이미지 데이터를 입력받고, 상기 분해된 성분벡터의 특이점을 추출하는 단계는, 상기 특징화된 선에 포함된 점들의 분해된 성분벡터 중 동일 성분벡터별 그룹을 생성하여 상기 특이점을 추출하며, 상기 추출된 특이점의 패턴에 기초하여 상기 개체 또는 상기 개체와 기 설정된 유사도를 갖는 타 개체를 검출하는 단계는, 상기 특이점의 패턴에 기초하여 상기 입력된 이미지 데이터에 대응되는 미리 저장된 이미지 데이터를 검출할 수 있다.
일 실시예로, 상기 벡터화된 개체 데이터를 복수의 차원의 성분벡터로 분해하는 단계는, 상기 이미지 데이터에 포함된 전체 또는 특정된 특징화된 선을 대상으로 하여 상기 성분벡터를 분해할 수 있다.
일 실시예로, 상기 이미지 데이터는 정적 이미지 데이터, 시계열적으로 생성되는 동적 이미지 데이터 및 실시간으로 생성되는 동적 이미지 데이터 중 하나 이상을 포함할 수 있다.
일 실시예로, 상기 이미지 데이터는 문자 이미지 데이터이되, 상기 벡터화된 개체 데이터를 복수의 차원의 성분벡터로 분해하는 단계는, 상기 문자 이미지 데이터에 포함된 문자의 외곽선 중 연결선과 상기 문자의 단일 중심선 중 하나 이상을 대상으로 하여 상기 성분벡터를 분해할 수 있다.
또한, 본 발명의 제2측면에 따른 AI의 학습 및 적용을 위한 개체 데이터를 검출하는 시스템은 임의의 타입의 개체 데이터를 수신하는 통신모듈, 상기 입력된 개체 데이터의 벡터 정보를 기반으로 기 설정된 유사도를 갖는 개체를 검출하기 위한 프로그램이 저장된 메모리 및 상기 메모리에 저장된 프로그램을 실행시키는 프로세서를 포함한다. 이때, 상기 프로세서는 상기 프로그램을 실행시킴에 따라, 상기 입력된 개체 데이터를 벡터화하고, 상기 벡터화된 개체 데이터를 복수의 차원의 성분벡터로 분해하여 특이점을 추출하며, 상기 추출된 특이점의 패턴에 기초하여 상기 개체 또는 상기 개체와 기 설정된 유사도를 갖는 타 개체를 검출한다.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공될 수 있다.
상기와 같은 본 발명에 따르면, 인공지능 학습을 위한 학습 데이터가 준비되지 않은 상태에서도 입력된 개체 데이터의 특이점 분석을 통해 검출된 개체를 자동으로 학습 데이터로 적용할 수 있다는 장점이 있다.
또한, 인공지능 연구에 있어 필수적인 데이터를 용이하게 획득할 수 있다. 특히, 경제적으로 양질의 데이터를 용이하게 획득할 수 있다. 이와 더불어, 인공지능을 통해 eSignature의 동일성 여부를 판단할 수 있도록 하기 위한 수단을 제공할 수 있다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 개체 데이터 검출 방법의 순서도이다.
도 2a 내지 도 2e는 개체 데이터를 통해 유사 개체를 판별하는 일 예시를 설명하기 위한 도면이다.
도 3a 내지 도 3e는 개체 데이터를 통해 유사 개체를 판별하는 다른 예시를 설명하기 위한 도면이다.
도 4a 및 도 4b는 사인과 관련된 실시예를 설명하기 위한 도면이다.
도 5a 및 도 5b는 평균이동 정보에 의한 문자 이미지 데이터를 검출하는 내용을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 개체 데이터 검출 시스템을 설명하기 위한 도면이다.
도 2a 내지 도 2e는 개체 데이터를 통해 유사 개체를 판별하는 일 예시를 설명하기 위한 도면이다.
도 3a 내지 도 3e는 개체 데이터를 통해 유사 개체를 판별하는 다른 예시를 설명하기 위한 도면이다.
도 4a 및 도 4b는 사인과 관련된 실시예를 설명하기 위한 도면이다.
도 5a 및 도 5b는 평균이동 정보에 의한 문자 이미지 데이터를 검출하는 내용을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 개체 데이터 검출 시스템을 설명하기 위한 도면이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
본 발명은 AI의 학습 및 적용을 위한 개체 데이터를 검출하는 방법 및 시스템(이하, 개체 데이터 검출 방법 및 시스템이라 한다)에 관한 것으로, 이하 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 개체 데이터 검출 방법의 순서도이다.
도 1을 참조하면, 개체 데이터 검출 시스템(100)에 이해 수행되는 방법은, 임의의 타입의 개체 데이터를 입력받는 단계(S110), 입력된 개체 데이터를 벡터화하는 단계(S120), 벡터화된 개체 데이터를 복수의 차원의 성분벡터로 분해하는 단계(S130), 분해된 성분벡터의 특이점을 추출하는 단계(S140) 및 추출된 특이점의 패턴에 기초하여 개체 또는 개체와 기 설정된 유사도를 갖는 타 개체를 검출하는 단계(S150)를 포함한다.
먼저, 임의의 타입의 개체 데이터를 입력받고(S110), 입력된 개체 데이터를 벡터화한다(S120).
이때, 입력되는 개체 데이터는 이미지로 표현할 수 있는 모든 대상을 의미한다. 즉, 정적, 동적 이미지 데이터와 음성 등을 표현할 수 있는 파형 이미지 등도 개체 데이터에 해당된다.
일 실시예로, 개체 데이터는 기존의 전용 전자펜과 같은 전자기기가 아닌 마우스를 통해 입력된 것일 수 있으나 반드시 이에 한정된 것은 아니다.
일 실시예로, 개체 데이터는 하나 이상의 특징화된 선(feature line)으로 구성될 수 있다. 그리고 특징화된 선은 제1차원이 성분벡터 및 제2차원의 성분벡터로 구성된 점들의 집합으로 구성될 수 있다. 즉, 본 발명의 일 실시예에서 특징화된 선들을 구성하는 점은 하나의 벡터일 수 있다.
한편, 본 발명의 일 실시예에서 특징화된 선을 구성하는 벡터들은 제1 및 제2차원으로 구성될 수 있으나, 반드시 이에 한정되는 것은 아니며 필요에 따라 2개 이상의 차원으로 구성되어 각 차원별 성분벡터로 분해될 수 있음은 물론이다.
다음으로, 벡터화된 개체 데이터를 복수의 차원의 성분벡터로 분해한다(S130).
즉, 전술한 특징화된 선에 포함된 벡터를 대상으로, 복수의 차원의 성분벡터로 분해한다. 예를 들어, 복수의 차원은 x 차원, y 차원일 수 있으나, 반드시 이에 한정되는 것은 아니다.
다음으로, 분해된 성분벡터의 특이점을 추출한다(S140).
일 실시예로, 본 발명은 특징화된 선에 포함된 점들의 분해된 성분벡터 중 동일 성분벡터별 그룹을 생성하여 특이점을 추출할 수 있다. 여기에서 생성된 동일 성분벡터별 그룹은 동일 성분벡터별로 정렬 또는 배열되어 있을 수 있다.
일 예로, 분해된 복수 개의 벡터 중 제1차원 성분벡터의 좌표값들은 제1차원 성분벡터끼리, 제2차원 성분벡터의 좌표값들은 제2차원 성분벡터끼리 그룹핑하고, 각 성분벡터 사이의 수학적 특이점을 추출할 수 있다.
이때, 본 발명의 일 실시예는 동일 성분벡터별 그룹에 대한 크기 정보, 크기에 대한 표준편차 정보, 위치점 정보, 평균이동 정보, 피크 사이의 거리 및 높이 정보 중 하나 이상에 기초하여 성분벡터의 특이점을 추출할 수 있다.
다음으로, 추출된 특이점의 패턴에 기초하여 개체 또는 개체와 기 설정된 유사도를 갖는 타 개체를 검출한다(S150).
이와 같이 입력된 개체 데이터와 대응되는 개체가 검출되고 나면, 입력된 개체 데이터와 검출된 개체 또는 타 개체의 정보는 AI의 학습을 위한 학습 데이터로 제공될 수 있다.
본 발명의 인공지능 적용과 구현에 있어서 유사도를 판단하는 프로세스는 아래의 식과 같이 두 입력 데이터 셋(DataSet)에서 특징(feature)의 차(Subtract)를 구한 후 시그모이드 활성?c수(Sigmoid activation)으로 진행할 수 있다. 이 프로세스는 가장 간단하며, 이 기법은 심층망에서도 유사한 기법으로 적용될 수 있다.
Anet = feature_model(A) //원본 입력 데이터셋
Bnet = feature_model(B) //비교 입력 데이터셋
Net = layers.Subtract(){[Anet,BNet]} //feature의 차
...
Net = layers.Dense(1, activation = 'sigmoid')(Net)
또한, 인공지능에 있어서 충분한 데이터 확보와 효과적인 모델 학습을 위해 본 발명은 아래와 같이 적용할 수 있다. 필요한 2개의 데이터 셋의 스케일링을 정규화한 후 산술적으로 데이터 셋의 크기가 n이고 1% 만큼 제외하고 선택하는 방법으로는 이론상 아래의 식에 의해 확률적으로 가능하다.
데이터 셋의 갯수 = nPr, 예: n = 1000 이면 1000!/(1000-10)!
그러므로 본 발명으로 인해 충분한 데이터 셋의 수를 확보할 수 있으므로 통상 인공지능에서 발생하는 데이터 부족으로 인한 과적합 문제의 해결에 큰 도움이 된다.
도 2a 내지 도 2e는 개체 데이터를 통해 유사 개체를 판별하는 일 예시를 설명하기 위한 도면이다.
도 2a는 마우스로 그려진 '컴퓨터' 그림으로, 하나의 그림을 그린 것으로 '같지만 다른', '다르지만 같은' 그림이다. 즉, 해당 그림들은 동일성과 함께 분명하게 같지 않다는 이질성을 동시에 가지고 있다. 이것은 단순히 이미지를 축소/확대한 것과는 분명하게 다르며 크게 또는 미세하게나마 다른 부분이 존재한다.
사람들은 도 2a의 그림을 보고 곧바로 '컴퓨터'임을 인식할 수 있지만, AI 즉 컴퓨터는 이를 곧바로 인식할 수 없다. 따라서, 해당 그림의 인식을 위해서는 무수히 많은 유사한 그림이나 사진을 통해 학습하는 과정이 필요하다.
하지만, 많은 학습 데이터를 수집하는 데에는 시간적, 경제적 비용이 요구되는바, 학습 데이터를 준비하는데 소모되는 비용을 최소화할 수 있는 방법이 필요하다.
본 발명의 일 실시예는 입력된 개체 데이터로부터 벡터의 성분을 분해하고, 분해된 각 차원의 성분벡터끼리의 그룹을 생성하여 이를 통해 특이점을 추출함으로써, 보다 용이하게 AI의 학습 데이터를 제공하는 것을 특징으로 한다.
도 2b와 도 2c는 제1차원 및 제2차원 성분벡터의 크기를 그래프로 표현한 것이고, 도 2d와 도 2e는 제1차원 및 제2차원 성분벡터의 크기의 표준편차를 그래프로 표현한 것이다.
도 2b 내지 도 2e의 그래프를 살펴보면, 그래프 상의 특이점 패턴이 유사한 것을 확인할 수 있다. 간단한 위치점과 평균이동 그리고 간단한 표준편차만으로도 특이점들의 패턴을 파악할 수 있다.
일 예로, 표준편차의 그래프는 마치 금속이나 세라믹 등의 물질들을 대상으로 x-선 회절 실험하였을 때의 결과치와 유사한 형태로, 각 그림에서 차이가 나는 부분은 각 피크 사이의 거리와 높이가 반드시 같지 않다는 점으로, 이는 각 그림에서의 벡터의 크기에 기인하는 것들이다.
도 3a 내지 도 3e는 개체 데이터를 통해 유사 개체를 판별하는 다른 예시를 설명하기 위한 도면이다.
도 3a는 도 2a의 예시에 비하여 보다 난이도가 높은 서명(Signature)을 대상으로 한 것이다.
도 3b와 도 3c는 제1차원 및 제2차원 성분벡터의 크기를 그래프로 표현한 것이고, 도 3d와 도 3e는 제1차원 및 제2차원 성분벡터의 크기의 표준편차를 그래프로 표현한 것이다.
도 3b 내지 도 3e의 그래프를 살펴보면, 다소 복잡한 서명의 경우에도 그래프 상의 특이점 패턴이 유사한 것을 확인할 수 있다.
이하에서는 본 발명의 구체적인 실시예를 설명하도록 한다.
먼저, 본 발명의 일 실시예는 사인 데이터의 검출에 적용될 수 있다.
구체적으로, 본 발명의 일 실시예는 개체 데이터로 사인 데이터를 입력받고, 입력된 사인 데이터의 특이점에 기초하여 미리 저장된 사인 데이터를 검출할 수 있다.
이를 통해 본 발명의 일 실시예는 다양하고 복잡한 사인에 대하여 여러 사용자들의 개별적인 사인들에 대한 충분한 데이터가 준비되지 않은 상태에서 부실하게 학습될 수밖에 없었던 종래기술과는 달리, 벡터 분석을 통한 높은 정확도가 확보된 학습 데이터를 이용하여 학습되게끔 할 수 있다.
위 실시예에서, 사인 데이터는 비공개용 사인 데이터일 수 있다.
공개적인 사인의 경우 외부로 노출되므로 모방이 가능하기 때문에, 온라인 상에서는 비공개용 사인 데이터를 이용할 경우 사인 모방을 방지할 수 있다.
즉, 사람마다 공개용 사인과 비공개용 사인을, 마치 암호에서의 공개키와 암호키와 같이 한 쌍을 가지고 있으며, 입력된 비공개용 사인이 일치하면 공개용 사인이 외부에 표시되는 형태로 운용될 수 있다. 여기에서 비공개용 사인은 DB나 기타 정적인 파일로 암호화되어 저장될 수 있다.
이에 따라, 본 발명의 일 실시예는 입력된 비공개용 사인 데이터의 특이점에 기초하여 미리 저장된 비공개용 사인 데이터가 검출됨에 따라, 비공개용 사인 데이터에 대응하는 공개용 사인이 출력되어 인증이 완료될 수 있다.
이러한 실시예는 개개인이 비공개용 사인을 숙지하고 있는 상태에서, 결제나 로그인 등 인증을 수행해야 함에 있어, 숙지된 비공개용 사인을 입력하고 인증을 받을 수 있으며, 인증이 완료됨은 공개용 사인이 출력되는 것을 통해 확인될 수 있다.
도 4a 및 도 4b는 사인과 관련된 실시예를 설명하기 위한 도면이다.
사인과 관련된 또 다른 실시예로, 본 발명은 미리 설정된 시간이 초과할 경우 로그인 인증이 해제되는 인증 방법에 있어, 사인 데이터의 검출을 통해 로그인 인증이 유지되게끔 할 수 있다.
AI에서의 로그인은 전체 로그인 과정을 인공지능적으로 관장하는 방법과, 부분적으로 관리하는 방법이 있을 수 있다. 예를 들어 2단계 또는 3단계 인증 전반의 과정을 전체적으로 또는 부분적으로 처리하는 방법이 있을 수 있다. 이는 각각의 단계가 인공지능에 의해 관리되는 것을 의미한다. 가령, ID와 패스워드와 같은 1단계 인증, OTP와 함께 결합한 2단계 인증, 또는 생체정보를 이용한 인증을 독립적으로 또는 병합하여 처리하는 단계 등을 전반적으로 인공지능을 통해 관리되도록 하는 것을 의미한다.
인공지능은 각각의 방법으로 로그인을 상황에 따라 처리할 수 있다. 예를 들어, 훗날 아이디나 패스워드 없이 사인만으로만 로그인을 할 수 있다. 그리고 전혀 다른 컴퓨터나 스마트폰을 통해 로그인을 하는 경우 암호화 패스워드 단계를 거치거나, 안면인식 또는 지문 등의 생체인식 방법으로 1단계 로그인을 할 수 있다. 이때, 스마트폰의 경우 초기 스마트폰의 첫 기동때의 기기에 대한 접근통제는 제외하도록 한다.
한편, 도 4a와 같이 아이디와 패스워드, 생체인증 등을 통해 특정 사이트(예를 들어, 은행 사이트, 포털 사이트 등)에 접속하고(S11), OTP 등 2차 인증까지 마친 상태에서(S12), 미리 설정된 시간이 경과하게 되면 서버에서는 로그인을 다시 요구하는 접근통제를 하게 된다. 사용자는 특별한 사정이 없는한 다시 위 2단계의 로그인 과정을 수행해야만 하며, 이는 결국 시간을 소요하게 되며 번거로움을 야기하게 된다(S13).
이러한 번거로움을 해소하기 위해서는 빠르고 손쉬울 뿐만 아니라 무한의 변수 속에서 유일하고 확실하면서 간단한 로그인 보조 수단이 필요하다.
이를 위해, 본 발명의 일 실시예는 도 4b와 같이 특정 기능 또는 서비스(예를 들어, 지문을 활용한 즉석 인증 서비스)의 활성화를 위한 1회 이상의 로그인 인증이 수행된 이후(S21, S22), 로그인 인증의 해제를 위한 미리 설정된 시간이 경과하였는지 여부를 판별한다(S23). 그리고 미리 설정된 시간이 경과한 경우, 미리 저장된 사인 데이터가 검출되었는지 여부를 판별하여, 검출된 경우 로그인 인증이 해제되지 않고 유지되도록 한다(S24).
다시 말해, 본 발명의 일 실시예는 미리 설정된 시간이 경과하더라도 사인을 이용한 인증을 추가적으로 수행함으로써 보안성을 유지함과 동시에 더욱 빠른 접속이 가능하게끔 할 수 있다.
다음으로, 본 발명의 일 실시예는 벡터 이미지를 통한 일러스트 검출에 적용될 수 있다.
구체적으로 본 발명은 개체 데이터로 위치 정보를 포함하고 있는 벡터 이미지를 입력받을 수 있으며, 해당 벡터 이미지의 성분벡터 분해를 통한 특이점을 추출하고, 입력된 벡터 이미지의 특이점에 기초하여 벡터 이미지로 구성된 일러스트를 검출할 수 있다.
즉, 벡터 이미지의 경우 각각의 위치 정보가 저장되어 있는 상태인바, SVG(Scalable Vector Graphics)나 Adobe 일러스트를 검출하는데 적용될 수 있다.
다음으로, 본 발명의 일 실시예는 이미지 데이터의 검출에 적용될 수 있다.
구체적으로 본 발명은 개체 데이터로 외곽선 및 중심선 중 하나 이상의 특징화된 선을 포함하는 이미지 데이터를 입력받을 수 있다. 이러한 이미지 데이터는 외곽선이나 중심선과 같은 특징화된 선을 포함하고 있으며, 본 발명의 일 실시예는 특징화된 선에 포함된 점들의 분해된 성분벡터 중 동일 성분벡터별 그룹을 생성하여 특이점을 추출할 수 있다.
이때, 본 발명의 일 실시예는 이미지 데이터에 포함된 전체 특징화된 선을 대상으로 성분벡터를 분해하거나, 특정된 특징화된 선, 예를 들어 선의 굵기, 곡선과 직선의 비율에 따른 특정, 연결점 유무 등을 고려하여 특정된 특징화된 선을 대상으로 하여 성분벡터를 분해할 수도 있다.
특이점이 추출되고 나면, 특이점 패턴에 기초하여 입력된 이미지 데이터에 대응되는 미리 저장된 이미지 데이터를 검출할 수 있다.
이를 통해 본 발명의 일 실시예는 외곽선이나 중심선을 이용하여 정적 이미지 데이터를 용이하게 검출할 수 있다.
한편, 이미지 데이터는 정적 이미지 데이터뿐만 아니라, 주식 차트 등과 같이 시계열적으로 생성되는 동적 이미지 데이터 간에도 적용될 수 있으며 이들 간의 유사 판단을 수행할 수도 있다. 또한, IoT나 CCTV와 같이 실시간으로 생성되는 동적 이미지 데이터 간에도 적용될 수 있으며, 그밖에 MRI나 CT 등과 같은 의료용 장비로부터 획득되는 영상 간에도 적용될 수 있다.
특히, 영상 내에서 특정 부위의 빠른 움직임을 캡쳐하기 위해서는 빠른 이미지 분석이 필요한데, 본 발명의 일 실시예에 따르면 인공지능 학습 데이터가 준비되지 않은 상태에서도 특이점 추출 및 분석을 통해 보다 빠르게 인공지능 학습을 위한 데이터를 자동으로 제공할 수 있다는 장점이 있다.
또한, 위 이미지 데이터 실시예에서, 이미지 데이터는 문자 이미지 데이터일 수 있다.
한글 인식은 OCR의 경우, 영어나 일본어에 비해 상대적으로 인식률이 낮은 편이나, 본 발명의 일 실시예의 경우 문자 이미지 데이터에 포함된 문자의 외곽선 중 연결선 위치를 추출하는 방법과 단일 중심선을 추출하는 방법 중 하나 이상을 통해 성분벡터를 분해하여 문자를 검출하는 과정을 통해, 학습 데이터를 제공하거나 문자 인식을 위한 인공지능으로의 적용이 가능하다.
도 5a 및 도 5b는 평균이동 정보에 의한 문자 이미지 데이터를 검출하는 내용을 설명하기 위한 도면이다.
일 실시예로, 본 발명은 문자 이미지 데이터에 있어, 합동의 경우와 닮음의 경우를 제외한 유사 문자 이미지를 평균이동 정보를 통해 검출할 수 있다.
도 5a의 경우는 도 5b에 비하여 상대적으로 큰 글자를 나타낸 것으로, 평균이동 정보에 따른 그래프의 굴곡이 도 5b보다 더 심한 것을 확인할 수 있다.
이러한 벡터의 평균이동 정보를 활용함으로써 본 발명의 일 실시예는 문자 이미지 데이터를 대상으로 하더라도 큰 글자와 작은 글자를 구별할 수 있게 된다.
한편, 상술한 설명에서, 단계 S110 내지 S150은 본 발명의 구현예에 따라서, 추가적인 단계들로 더 분할되거나, 더 적은 단계들로 조합될 수 있다. 또한, 일부 단계는 필요에 따라 생략될 수도 있고, 단계 간의 순서가 변경될 수도 있다. 아울러, 기타 생략된 내용이라 하더라도 후술하는 도 6의 내용은 도 1 내지 도 5b의 개체 데이터 검출 방법에도 적용될 수 있다.
이하에서는 도 6을 참조하여, 본 발명의 일 실시예에 따른 개체 데이터 검출 시스템(100)에 대하여 설명하도록 한다.
도 6은 본 발명의 일 실시예에 따른 개체 데이터 검출 시스템(100)을 설명하기 위한 도면이다.
도 6을 참조하면, 개체 데이터 검출 시스템(100)은 통신모듈(110), 메모리(120) 및 프로세서(130)를 포함한다.
통신모듈(110)은 임의의 타입의 개체 데이터를 수신한다.
메모리(120)에는 입력된 개체 데이터의 벡터 정보를 기반으로 기 설정된 유사도를 갖는 개체를 검출하기 위한 프로그램이 저장된다.
프로세서(130)는 메모리(120)에 저장된 프로그램을 실행시킨다. 프로세서(130)는 메모리(120)에 저장된 프로그램을 실행시킴에 따라, 입력된 개체 데이터를 벡터화하고, 벡터화된 개체 데이터를 복수의 차원의 성분벡터로 분해하여 특이점을 추출하며, 추출된 특이점의 패턴에 기초하여 개체 또는 개체와 기 설정된 유사도를 갖는 타 개체를 검출한다.
도 6을 참조하여 설명한 개체 데이터 검출 시스템(100)은 상술한 서버의 구성요소로 제공될 수 있다.
이상에서 전술한 본 발명의 일 실시예에 따른 개체 데이터 검출 방법은, 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 매체에 저장될 수 있다.
상기 전술한 프로그램은, 상기 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 상기 방법들을 실행시키기 위하여, 상기 컴퓨터의 프로세서(CPU)가 상기 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, Ruby, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 상기 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 상기 기능들을 상기 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 상기 기능들을 상기 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 상기 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 상기 컴퓨터의 프로세서가 상기 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 상기 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.
상기 저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 상기 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 상기 프로그램은 상기 컴퓨터가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 상기 컴퓨터상의 다양한 기록매체에 저장될 수 있다. 또한, 상기 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
100: 개체 데이터 검출 시스템
110: 통신모듈
120: 메모리
130: 프로세서
110: 통신모듈
120: 메모리
130: 프로세서
Claims (14)
- 시스템에 의해 수행되는, AI의 학습 및 적용을 위한 개체 데이터를 검출하는 방법에 있어서,
임의의 타입의 개체 데이터를 입력받는 단계;
상기 입력된 개체 데이터를 벡터화하는 단계;
상기 벡터화된 개체 데이터를 복수의 차원의 성분벡터로 분해하는 단계;
상기 분해된 성분벡터의 특이점을 추출하는 단계; 및
상기 추출된 특이점의 패턴에 기초하여 상기 개체 또는 상기 개체와 기 설정된 유사도를 갖는 타 개체를 검출하는 단계;를 포함하고,
상기 입력 단계는,
상기 개체 데이터로서, 마우스를 통해 드로잉된 이미지를 입력받고,
상기 추출 단계는,
상기 복수의 차원의 성분벡터로부터 동일 차원의 성분벡터끼리 각 그룹을 생성하고, 상기 생성된 각 그룹에 속한 성분벡터로부터 특이점을 추출하되, 상기 특이점으로서 상기 각 그룹에 속한 성분벡터의 크기에 대한 표준편차의 패턴을 추출하며,
상기 검출 단계는,
상기 추출된 표준편차의 패턴에 기초하여 상기 개체 또는 상기 타 개체를 검출하고,
상기 시스템은,
상기 개체 데이터로서 외곽선 및 중심선 중 하나 이상의 특징화된 선을 포함하는 이미지 데이터를 입력받고,
상기 특징화된 선에 포함된 점들의 분해된 성분벡터 중 동일 성분벡터별 그룹을 생성하여 상기 특이점을 추출하며,
상기 특이점의 패턴에 기초하여 상기 입력된 이미지 데이터에 대응되는 미리 저장된 이미지 데이터를 검출하고,
상기 분해된 성분벡터의 특이점을 추출할 때 상기 동일 성분벡터별 그룹에 대한 크기 정보, 상기 크기에 대한 표준편차 정보, 위치점 정보, 평균이동 정보, 피크 사이의 거리 및 높이 정보 중 하나 이상에 기초하여 상기 성분벡터의 특이점을 추출하고,
상기 이미지 데이터는 문자 이미지 데이터이고,
상기 시스템은,
상기 문자 이미지 데이터에 포함된 문자의 외곽선 중 연결선 위치를 추출하는 방법과 단일 중심선을 추출하는 방법 중 하나 이상을 이용하여 상기 성분벡터를 분해하는 것을 특징으로 하는,
개체 데이터 검출 방법.
- 제1항에 있어서,
상기 개체 데이터는 하나 이상의 특징화된 선으로 구성되며,
상기 특징화된 선은 제1차원의 성분벡터 및 제2차원의 성분벡터로 구성된 점들의 집합으로 구성되는 것인 개체 데이터 검출 방법.
- 삭제
- 삭제
- 제1항에 있어서,
상기 입력된 개체 데이터와 상기 검출된 개체 또는 타개체의 정보를 상기 AI 학습을 위한 학습 데이터로 제공하는 단계를 더 포함하는 개체 데이터 검출 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/KR2020/017237 WO2021125616A1 (ko) | 2019-12-19 | 2020-11-30 | Ai의 학습 및 적용을 위한 개체 데이터를 검출하는 방법 및 이의 시스템 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20190170372 | 2019-12-19 | ||
KR1020190170372 | 2019-12-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210079161A KR20210079161A (ko) | 2021-06-29 |
KR102361950B1 true KR102361950B1 (ko) | 2022-02-11 |
Family
ID=76626788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020200031071A KR102361950B1 (ko) | 2019-12-19 | 2020-03-13 | Ai의 학습 및 적용을 위한 개체 데이터를 검출하는 방법 및 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102361950B1 (ko) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014021779A (ja) | 2012-07-19 | 2014-02-03 | Nec Personal Computers Ltd | 認証情報入力装置、サーバ装置、認証システム及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1995016974A1 (en) * | 1993-12-17 | 1995-06-22 | Quintet, Incorporated | Method of automated signature verification |
KR101656212B1 (ko) * | 2015-02-13 | 2016-09-12 | 경일대학교산학협력단 | 손동작 인식을 이용한 접근 제어 시스템, 이를 위한 방법 및 이 방법이 기록된 컴퓨터 판독 가능한 기록매체 |
KR101884090B1 (ko) * | 2016-11-28 | 2018-08-01 | 공주대학교 산학협력단 | 서명 인증 장치 및 방법 |
KR101972231B1 (ko) * | 2017-09-28 | 2019-04-24 | 공주대학교 산학협력단 | 딥러닝을 이용한 서명 인증 장치 및 방법 |
KR20190075017A (ko) | 2019-06-10 | 2019-06-28 | 엘지전자 주식회사 | 인공 지능이 탑재된 차량 단말과 이를 이용한 학습 데이터의 수집 방법 및 인공 지능의 성능을 향상하기 위한 시스템 |
-
2020
- 2020-03-13 KR KR1020200031071A patent/KR102361950B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014021779A (ja) | 2012-07-19 | 2014-02-03 | Nec Personal Computers Ltd | 認証情報入力装置、サーバ装置、認証システム及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20210079161A (ko) | 2021-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8942431B2 (en) | Biometrics based methods and systems for user authentication | |
JP6167733B2 (ja) | 生体特徴ベクトル抽出装置、生体特徴ベクトル抽出方法、および生体特徴ベクトル抽出プログラム | |
US20080065900A1 (en) | Method and apparatus for biometrics | |
Benegui et al. | Convolutional neural networks for user identification based on motion sensors represented as images | |
KR20200083119A (ko) | 사용자 인증 장치 및 방법 | |
Kim et al. | Reconstruction of fingerprints from minutiae using conditional adversarial networks | |
CN111914769A (zh) | 用户合法性判定方法、装置、计算机可读存储介质及设备 | |
CN103873253B (zh) | 一种人类指纹生物密钥生成方法 | |
Lakshmi et al. | Off-line signature verification using Neural Networks | |
Salama et al. | Cancelable biometric system for IoT applications based on optical double random phase encoding | |
Chavez-Galaviz et al. | Embedded biometric cryptosystem based on finger vein patterns | |
Messerschmidt et al. | Biometric systems utilizing neural networks in the authentication for e-learning platforms | |
Jabberi et al. | Generative data augmentation applied to face recognition | |
Sadeghpour et al. | Protection of sparse retinal templates using cohort-based dissimilarity vectors | |
Shin et al. | Writer identification using intra-stroke and inter-stroke information for security enhancements in P2P systems | |
KR102361950B1 (ko) | Ai의 학습 및 적용을 위한 개체 데이터를 검출하는 방법 및 시스템 | |
Neha et al. | Biometric re-authentication: An approach towards achieving transparency in user authentication | |
Senarath et al. | BehaveFormer: A Framework with Spatio-Temporal Dual Attention Transformers for IMU-enhanced Keystroke Dynamics | |
Abed | Wrist and Palm Vein pattern recognition using Gabor filter | |
KR102181340B1 (ko) | 바이오매트릭스와 Fuzzy Vault를 이용하여 암호학적 키를 생성하는 방법 및 시스템 | |
CN103984918B (zh) | 一种基于类内及类间变化的人脸图像识别方法 | |
JP5279007B2 (ja) | 照合システム、照合方法、プログラム及び記録媒体 | |
Saračevič et al. | Possibilities of applying the triangulation method in the biometric identification process | |
Osadchy et al. | G en F ace: Improving Cyber Security Using Realistic Synthetic Face Generation | |
Kutzner et al. | Writer identification on mobile device based on handwritten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |