WO2021095987A1

WO2021095987A1 - 다중타입 엔티티에 기반한 지식 보완 방법 및 장치

Info

Publication number: WO2021095987A1
Application number: PCT/KR2019/018701
Authority: WO
Inventors: 박영택; 자그바랄바트셀렘; 이완곤; 노재승
Original assignee: 숭실대학교산학협력단
Priority date: 2019-11-14
Filing date: 2019-12-30
Publication date: 2021-05-20
Also published as: KR102223382B1

Abstract

다중타입 엔티티에 기반한 지식 보완 방법을 개시한다. 본 발명의 다른 일 실시예에 따른 다중타입 엔티티에 기반한 지식 보완 방법은 지식 그래프에 포함된 2개의 엔티티를 연결하는 복수의 경로 각각에 대하여, 개별 경로에 포함된 복수의 엔티티에 관한 정보인 엔티티정보와 상기 복수의 엔티티 중 2개의 관계에 관한 정보인 관계정보를 추출하는 단계; 상기 엔티티정보, 상기 관계정보, 상기 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보인 타입정보 및 소정의 임베딩 크기에 기초하여, 상기 복수의 경로 각각에 대응되는 경로벡터를 생성하는 단계; CNN(Convolutional Neural Network)과 Bi-LSTM(Bidirectional Long A Short-Term Memory)을 이용하여, 상기 경로벡터로부터 인코딩된 경로벡터를 산출하는 단계; 및 상기 복수의 경로 및 상기 복수의 인코딩된 경로벡터를 이용하여 상기 2개의 엔티티 간의 관계를 예측하도록 학습된 관계모델을 이용하여, 상기 2개의 엔티티 간에 소정의 목표 관계가 유효한지 판단하는 단계를 포함한다.

Description

다중타입 엔티티에 기반한 지식 보완 방법 및 장치

본 발명은 다중타입을 갖는 엔티티의 특징을 반영하여 지식 그래프 상에서 지식을 보완하는 방법 및 장치에 관한 것이다.

지식 그래프는 일반적으로 불완전하기 때문에 이에 대한 지식 보완은 반드시 필요하다. 지식 보완에 대한 성능이 우수한 기존 연구들은 크게 두 가지 방법으로 지식 그래프의 엔티티(entity)와 관계(relation)를 저차원으로 임베딩하여 누락된 링크를 예측하거나 경로를 기반으로 추론을 하는 방법을 사용하였다. 그러나, 이러한 연구들에서는 주로 직접 트리플(triple) 관계를 알아내는 데 중점을 두어 엔티티 간의 의미 관계 모델링에 어려움이 존재했다.

따라서, 기존 지식 보완 기법보다 더 정확하게 보완함으로써, 동적으로 변화하는 지식 그래프를 대상으로 보다 효율적인 처리를 가능하게 하는 기술에 대한 필요성이 대두되고 있다.

구체적으로는, 지식 그래프의 엔티티와 관계에 대한 임베딩 벡터를 사용하여 엔티티 간의 의미 있는 경로를 학습하며, 다양한 타입을 갖는 엔티티의 특성을 활용함으로써, 보다 우수한 성능을 나타내는 지식 그래프의 보완 기술에 대한 필요성이 제기되고 있다.

상술한 문제점을 해결하기 위해 본 발명은 다양한 타입을 가지는 엔티티의 특징을 반영하면서도, 기존 지식 보완 기법보다 우수한 성능과 대용량 지식 그래프를 대상으로 효율적 처리가 가능한 지식 보완 방법 및 장치를 제공하고자 한다.

상술한 목적을 달성하기 위한 본 발명의 일 실시예에 따른 다중타입 엔티티에 기반한 지식 보완 방법은 지식 그래프에 포함된 2개의 엔티티를 연결하는 복수의 경로 각각에 대하여, 개별 경로에 포함된 복수의 엔티티에 관한 정보인 엔티티정보와 상기 복수의 엔티티 중 2개의 관계에 관한 정보인 관계정보를 추출하는 단계; 상기 엔티티정보, 상기 관계정보, 상기 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보인 타입정보 및 소정의 임베딩 크기에 기초하여, 상기 복수의 경로 각각에 대응되는 경로벡터를 생성하는 단계; CNN(Convolutional Neural Network)과 Bi-LSTM(Bidirectional Long A Short-Term Memory)을 이용하여, 상기 경로벡터로부터 인코딩된 경로벡터를 산출하는 단계; 및 상기 복수의 경로 및 상기 복수의 인코딩된 경로벡터를 이용하여 상기 2개의 엔티티 간의 관계를 예측하도록 학습된 관계모델을 이용하여, 상기 2개의 엔티티 간에 소정의 목표 관계가 유효한지 판단하는 단계를 포함한다.

바람직하게는, 상기 복수의 경로 각각에 대응되는 경로벡터를 생성하는 단계는 상기 엔티티정보에 포함된 복수의 엔티티 각각에 대하여, 소정의 딥러닝 기법을 적용하여, 상기 타입정보에 포함된 적어도 하나의 엔티티타입에 대응되는 행과 상기 임베딩 크기에 대응되는 열을 갖는 제1 엔티티벡터를 학습시키는 단계; 상기 제1 엔티티벡터를 구성하는 각각의 열을 기준으로 모든 행의 값을 합하여 단일 행의 벡터를 생성한 후, 상기 복수의 엔티티 각각에 대한 상기 단일 행의 벡터를 결합하여 제2 엔티티벡터를 생성하는 단계; 상기 관계정보에 포함된 관계에 대응되는 행과 상기 임베딩 크기에 대응되는 열을 갖는 관계벡터를 생성하는 단계; 및 상기 제2 엔티티벡터와 상기 관계벡터를 조합하여, 상기 경로벡터를 생성하는 단계를 포함할 수 있다.

바람직하게는, 상기 제2 엔티티벡터와 상기 관계벡터를 조합하여, 상기 경로벡터를 생성하는 단계는 개별 경로를 구성하는 엔티티와 관계의 순서에 따라서, 상기 제2 엔티티벡터와 상기 관계벡터의 행을 조합하여 생성할 수 있다.

바람직하게는, 상기 타입정보는 상기 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보를 저장하는 데이터베이스에 저장될 수 있다.

바람직하게는, 상기 인코딩된 경로벡터를 산출하는 단계와 상기 소정의 목표 관계가 유효한지 판단하는 단계의 사이에, Attention 모델에 기초하여, 상기 복수의 경로 각각에 대응되는 상기 인코딩된 경로벡터에 상이한 가중치를 부여하는 단계를 더 포함하고, 상기 관계모델은 상기 상이한 가중치를 더 이용하여 학습될 수 있다.

또한, 상술한 목적을 달성하기 위한 본 발명의 일 실시예에 따른 다중타입 엔티티에 기반한 지식 보완 장치는 지식 그래프에 포함된 2개의 엔티티를 연결하는 복수의 경로 각각에 대하여, 개별 경로에 포함된 복수의 엔티티에 관한 정보인 엔티티정보와 상기 복수의 엔티티 중 2개의 관계에 관한 정보인 관계정보를 추출하는 데이터추출부; 상기 엔티티정보, 상기 관계정보, 상기 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보인 타입정보 및 소정의 임베딩 크기에 기초하여, 상기 복수의 경로 각각에 대응되는 경로벡터를 생성하는 경로생성부; CNN(Convolutional Neural Network)과 Bi-LSTM(Bidirectional Long A Short-Term Memory)을 이용하여, 상기 경로벡터로부터 인코딩된 경로벡터를 산출하는 학습부; 및 상기 복수의 경로 및 상기 복수의 인코딩된 경로벡터를 이용하여 상기 2개의 엔티티 간의 관계를 예측하도록 학습된 관계모델을 이용하여, 상기 2개의 엔티티 간에 소정의 목표 관계가 유효한지 판단하는 판단부를 포함한다.

바람직하게는, 상기 경로생성부는 상기 엔티티정보에 포함된 복수의 엔티티 각각에 대하여, 소정의 딥러닝 기법을 적용하여, 상기 타입정보에 포함된 적어도 하나의 엔티티타입에 대응되는 행과 상기 임베딩 크기에 대응되는 열을 갖는 제1 엔티티벡터를 학습시키고, 상기 제1 엔티티벡터를 구성하는 각각의 열을 기준으로 모든 행의 값을 합하여 단일 행의 벡터를 생성한 후, 상기 복수의 엔티티 각각에 대한 상기 단일 행의 벡터를 결합하여 제2 엔티티벡터를 생성하고, 상기 관계정보에 포함된 관계에 대응되는 행과 상기 임베딩 크기에 대응되는 열을 갖는 관계벡터를 생성하고, 상기 제2 엔티티벡터와 상기 관계벡터를 조합하여, 상기 경로벡터를 생성할 수 있다.

바람직하게는, 상기 경로생성부가 상기 제2 엔티티벡터와 상기 관계벡터를 조합하여, 상기 경로벡터를 생성할 때, 개별 경로를 구성하는 엔티티와 관계의 순서에 따라서, 상기 제2 엔티티벡터와 상기 관계벡터의 행을 조합하여 생성할 수 있다.

바람직하게는, Attention 모델에 기초하여, 상기 복수의 경로 각각에 대응되는 상기 인코딩된 경로벡터에 상이한 가중치를 부여하는 가중치설정부를 더 포함하고, 상기 관계모델은 상기 상이한 가중치를 더 이용하여 학습될 수 있다.

본 발명에 따른 다중타입 엔티티에 기반한 지식 보완 방법 및 장치는 인공신경망을 통해 기존 방식이 처리하지 못하는 부분인 다중타입 엔티티를 모델링하여 불완전한 지식 그래프를 보완할 수 있는 효과가 있다.

또한, 본 발명에 따른 다중타입 엔티티에 기반한 지식 보완 방법 및 장치는 다중타입을 갖는 엔티티에 대하여도 기존의 기술보다 우수한 성능을 나타내며, 대용량 지식 그래프를 대상으로 효율적 처리가 가능한 효과가 있다.

또한, 본 발명에 따른 다중타입 엔티티에 기반한 지식 보완 방법 및 장치는 사용자 개인에 특화된 맞춤 서비스와 같은 의미 있는 정보 추출이 용이하여, 인공지능의 다양한 서비스 분야(Q&A 시스템, 추천 시스템, 대화형 에이전트 시스템 등)에서 활용할 수 있는 효과가 있다.

도 1은 본 발명의 일 실시예에 따른 다중타입 엔티티에 기반한 지식 보완 방법을 설명하기 위한 흐름도이다.

도 2는 본 발명의 다른 실시예에 따른 다중타입 엔티티에 기반한 지식 보완 방법을 설명하기 위한 흐름도이다.

도 3은 본 발명의 다른 실시예에 따른 경로벡터 생성 방법을 설명하기 위한 흐름도이다.

도 4은 본 발명의 일 실시예에 따른 다중타입 엔티티에 기반한 지식 보완 장치를 나타내는 블록도이다.

도 5는 지식 그래프를 나타내는 도면이다.

도 6은 본 발명의 일 실시예에 따른 CNN과 Bi-LSTM을 이용하여 인코딩된 경로벡터를 생성하는 과정을 설명하기 위한 도면이다.

도 7은 본 발명의 일 실시예에 따른 엔티티의 다양한 타입을 설명하기 위한 도면이다.

도 8 내지 10은 발명의 일 실시예에 따른 경로벡터를 생성하는 방법을 설명하기 위한 도면이다.

도 11은 본 발명의 일 실시예에 따른 Attention 모델을 설명하기 위한 도면이다.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면을 참조하여 상세하게 설명하도록 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재 항목들의 조합 또는 복수의 관련된 기재 항목들 중의 어느 항목을 포함한다.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급될 때에는 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.

명세서 및 청구범위 전체에서, 어떤 부분이 어떤 구성 요소를 포함한다고 할때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있다는 것을 의미한다.

이하, 첨부된 도면을 참조하여 본 발명에 대해 상세하게 설명한다.

단계 S110에서는, 지식 보완 장치가 지식 그래프(knowledge graph)에 포함된 2개의 엔티티(entity)를 연결하는 복수의 경로(path) 각각에 대하여, 개별 경로에 포함된 복수의 엔티티에 관한 정보인 엔티티정보와 그 복수의 엔티티 중 2개의 관계에 관한 정보인 관계정보를 추출한다.

이때, 지식 보완 장치는 PRA(path ranking algorithm)을 이용하여, 지식 그래프로부터 그 2개의 엔티티에 관한 경로를 추출할 수 있다. 이때, 랜덤워크 온 그래프 알고리즘(random walk on graph algorithm)을 이용할 수 있으며, 랜덤워크 온 그래프 알고리즘은 소스 엔티티에서 출발하여 중간에 다른 엔티티를 통해 이동하면서 타겟 엔티티에 도달하는 단순하지만 효율적인 알고리즘이다.

예컨대, 도 5의 지식 그래프를 참조하면, 지식 그래프의 노드에 대응되는 2개의 엔티티인 Trump와 USA를 연결하는 복수의 경로가 존재한다. 구체적으로, “Trump bornIn NY locatedIn USA”, “Trump marriedTo Melania nationality USA”, “Trump workedIn WhiteHouse locatedAt Washington cityOf USA”와 같은 3개의 경로가 존재한다.

이때, 지식 보완 장치는 그 3개의 경로 각각에 대하여, 경로에 포함되는 노드에 해당하는 엔티티에 관한 정보인 엔티티정보와 경로에 포함된 2개의 엔티티 간의 관계에 관한 정보인 관계정보를 추출할 수 있다.

도 8을 참조하여 “Trump workedIn WhiteHouse locatedAt Washington cityOf USA”의 경로를 살펴보면, 엔티티정보에는 각각의 노드에 대응되는 Trump, WhiteHouse, Washington, USA가 포함되고, 관계정보에는 노드를 연결하는 링크에 대응되는 workedIn, locatedIn, cityOf가 포함된다.

단계 S120에서는, 지식 보완 장치가 엔티티정보, 관계정보, 그 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보인 타입정보 및 소정의 임베딩 크기에 기초하여, 그 복수의 경로 각각에 대응되는 경로벡터를 생성한다.

예컨대, 도 8을 참조하면, Trump의 엔티티에 대응되는 타입정보는 Person, President, Ceo, Male의 엔티티타입을 포함하고, WhiteHouse의 타입정보는 Workplace, Building의 엔티티타입을 포함하고, Washington의 타입정보는 State, Capital의 엔티티타입을 포함하고, USA의 타입정보는 Country의 엔티티타입을 포함한다.

나아가, 지식 보완 장치는 지식 그래프의 각 엔티티가 가지고 있는 타입에 대한 정보와 함께 스키마 데이터의 시맨틱 정보들로부터 타입들간의 관계를 확인하고, 이를 엔티티에 대한 정보로 사용하여 그래프를 확장하고, 추가적으로 필요한 단계까지 그래프를 확장하여, 각 엔티티에 대한 자세한 정보가 포함되도록 할 수 있다. 예컨대, 도 7을 참조하면, 지식 보완 장치는 타겟 관계(Target Relation)에 있는 2개의 엔티티에 대하여, 해당 엔티티에 대한 정보를 확장할 수 있다.

또한, 임베딩 크기는 지식 보완 장치가 엔티티정보 및 타입정보로부터 엔티티벡터를 생성하거나, 관계정보로부터 관계벡터를 생성할 때, 각 벡터에 임베딩되는 열의 개수에 대응되는 크기일 수 있다.

한편, 지식 보완 장치가 경로벡터를 생성하는 자세한 방법은 도 3에 대한 설명에서 구체적으로 후술한다.

다른 실시예에서는, 타입정보는 그 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보를 저장하는 데이터베이스에 저장할 수 있다.

이때, 지식 보완 장치는 데이터베이스를 내부에 포함하고 있거나, 데이터베이스와 유선 또는 무선의 네트워크를 통해 연결되어, 그 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보인 타입정보를 획득할 수 있다.

단계 S130에서는, 지식 보완 장치가 CNN(Convolutional Neural Network)와 Bi-LSTM(Bidirectional Long A Short-Term Memory)을 이용하여, 그 경로벡터로부터 인코딩된 경로벡터를 산출한다.

이때, 도 6을 참조하면, 지식 보완 장치는 CNN을 이용하여, 그 경로벡터에 포함된 개별 경로의 특성 정보를 추출할 수 있다. 그리고, 지식 보완 장치는 그 추출된 특성 정보를 Bi-LSTM에 입력하여, 각 개별 경로의 앞뒤로 입력된 경로와 관련된 문맥 정보를 모두 포함하는 인코딩된 경로벡터를 생성할 수 있다.

마지막으로 단계 S140에서는, 지식 보완 장치가 그 복수의 경로 및 복수의 인코딩된 경로벡터를 이용하여 그 2개의 엔티티 간의 관계를 예측하도록 학습된 관계모델을 이용하여, 그 2개의 엔티티 간에 소정의 목표 관계가 유효한지 판단한다.

이때, 지식 보완 장치는 그 2개의 엔티티에 대한 복수의 경로 및 그 복수의 경로에 대응되는 복수의 인코딩된 경로벡터를 이용하여, 관계모델을 학습시킬 수 있다. 또한, 관계모델은 그 2개의 엔티티 간에 특정한 관계가 유효(valid)한지를 0(false) 또는 1(true)로 판단(binary classification)할 수 있다.

즉, 지식 보완 장치는 2개의 엔티티와 목표 관계에 관한 트리플을 입력받는 경우, 그 학습된 관계모델을 이용하여 그 목표 관계가 유효한지에 대하여 0(무효) 또는 1(유효)로 판단할 수 있다.

예컨대, 도 5를 참조하면, 지식 보완 장치는 그 학습된 관계모델을 이용하여 2개의 엔티티인 Trump와 USA 간에 nationality라는 목표 관계가 유효한지를 판단할 수 있다. 그 결과, 지식 보완 장치는 Trump와 USA 간에 nationality라는 목표 관계가 유효하면, Trump와 USA 간에 nationality라는 새로운 관계를 추가하여 지식 그래프를 보완할 수 있다. 나아가, 지식 보완 장치는 지식 그래프 상에 존재하는 다양한 엔티티 간에 목표 관계의 유효성을 판단하여, 그 지식 그래프를 보완해 나갈 수 있다.

이와 같이, 본 발명에 따른 다중타입 엔티티에 기반한 지식 보완 방법은 인공신경망을 통해 기존 방식이 처리하지 못하는 부분인 다중타입 엔티티를 모델링하여 불완전한 지식 그래프를 보완할 수 있는 효과가 있다.

단계 S210에서는, 지식 보완 장치가 지식 그래프에 포함된 2개의 엔티티를 연결하는 복수의 경로 각각에 대하여, 개별 경로에 포함된 복수의 엔티티에 관한 정보인 엔티티정보와 그 복수의 엔티티 중 2개의 관계에 관한 정보인 관계정보를 추출한다.

단계 S220에서는, 지식 보완 장치가 엔티티정보, 관계정보, 그 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보인 타입정보 및 소정의 임베딩 크기에 기초하여, 그 복수의 경로 각각에 대응되는 경로벡터를 생성한다.

단계 S230에서는, 지식 보완 장치가 CNN와 Bi-LSTM을 이용하여, 그 경로벡터로부터 인코딩된 경로벡터를 산출한다.

단계 S240에서는, 지식 보완 장치가 Attention 모델에 기초하여, 그 복수의 경로 각각에 대응되는 그 인코딩된 경로벡터에 상이한 가중치를 부여한다.

기존의 경로 기반 추론 기법들은 max pooling 연산을 통해 가장 유력한 경로만을 사용하거나 mean 연산을 통해 모든 경로에 대하여 동일한 정도의 학습을 하여 각 경로들마다 가지는 중요도와 의미를 고려하지 않았다.

하지만, 도 11을 참조하면, 본 발명의 지식 보완 장치는 타겟 관계로 연결되는 두 엔티티 간에 생성된 경로들에 대하여 연산을 수행하는 Attention 레이어를 추가적으로 이용할 수 있다. 즉, 지식 보완 장치는 그 인코딩된 경로벡터에 포함된 경로들에 대하여 각각의 경로가 서로 다른 가중치를 가지며 보다 중요하거나 의미를 갖는 경로를 찾는 것을 목표로 하여, 가중치를 학습하는 모델을 생성할 수 있다.

이때, 스코어는 아래 수학식 1을 이용하여 산출될 수 있다.

[수학식 1]

여기서, p_i는 i번째 경로에 대한 인코딩된 경로벡터이고, u는 타겟 관계로 연결되는 두 엔티티 간의 경로이고, a_i는 매칭 스코어이고, q는 상태벡터이고, P(r|e_s,e_o)는 엔티티 쌍(e_s,e_o)의 관계 r에 대한 확률 스코어이다.

마지막으로 단계 S250에서는, 지식 보완 장치가 그 복수의 경로, 그 복수의 인코딩된 경로벡터 및 상기 상이한 가중치를 이용하여 그 2개의 엔티티 간의 관계를 예측하도록 학습된 관계모델을 이용하여, 그 2개의 엔티티 간에 소정의 목표 관계가 유효한지 판단한다.

이때, 지식 보완 장치는 그 2개의 엔티티에 대한 복수의 경로, 그 복수의 경로에 대응되는 복수의 인코딩된 경로벡터, 경로벡터별 상이한 가중치를 이용하여, 관계모델을 학습시킬 수 있다. 또한, 관계모델은 그 2개의 엔티티 간에 특정한 관계가 유효(valid)한지를 0 또는 1로 판단(binary classification)할 수 있다.

한편, 그 2개의 엔티티에 대한 복수의 경로는 트레이닝(training) 데이터셋, 밸리데이션(validation) 데이터셋 및 테스트(test) 데이터셋으로 3개의 데이터 셋으로 분리될 수 있다. 트레이닝 데이터는 관계모델 학습에 사용되고, 테스트 데이터셋은 학습된 모델의 성능을 평가하기 위해 사용되며, 밸리데이션 데이터셋은 학습된 모델을 통해 계산된 새로운 데이터의 점수를 비교하기 위한 threshold 값을 정하기 위해 사용될 수 있다. 이때, 테스트 데이터 셋의 경우 해당 타겟 관계에 대하여 1(true)로 존재하는 두 엔티티에 대하여 목적어 위치의 엔티티를 무작위로 다른 값으로 변경함으로써, 1(true) 또는 0(false) 에 해당하는 데이터를 모두 생성하여 classification 모델이 true로 편향된 모델이 아닌가에 대한 확인이 가능하도록 할 수 있다.

또한, 관계모델의 목적함수는 아래 수학식 2와 같이 정의될 수 있다.

이때, 목적함수의 목표는 올바른 트리플이 보다 높은 값을 가지도록 학습하는 것이다. 이는 관계모델의 loss를 낮추면서 동시에 잘못된 트리플의 점수를 낮추는 것에 영향을 주며, 지식 보완 장치는 binary cross entropy loss와 Adaptive Moment Estimation (Adam) optimizer를 통해 loss 값이 가장 최적이 될 때까지 관계모델을 반복적으로 학습하여 최적화된 관계모델을 생성할 수 있다.

[수학식 2]

여기서, L(θ)는 관계모델의 목적함수이고, θ는 관계모델에서 학습해야 하는 모든 파라미터이고, N은 트레이닝 데이터넷의 트리플 개수이고, T⁺와 T^-는 각각 정확한(correct) 트리플과 잘못된(corrupted) 트리플의 집합이다.

이와 같이, 본 발명에 따른 다중타입 엔티티에 기반한 지식 보완 방법은 경로들의 조합에 대하여 Attention 레이어를 사용함으로써, 각각의 경로가 서로 다른 가중치를 가지며 보다 중요하거나 의미를 갖는 경로를 찾을 수 있는 효과가 있다.

단계 S310에서는, 지식 보완 장치가 엔티티정보에 포함된 복수의 엔티티 각각에 대하여, 소정의 딥러닝 기법을 적용하여, 타입정보에 포함된 적어도 하나의 엔티티타입에 대응되는 행과 임베딩 크기에 대응되는 열을 갖는 제1 엔티티벡터를 학습시킨다.

예컨대, 도 8 및 9를 참조하면, 지식 보완 장치는 Obama 엔티티에 대응되는 엔티티타입인 Person, President, Ceo, Male에 대응되는 4개의 행과, 임베딩 크기인 6에 대응되는 6개의 열을 갖는 제1 엔티티벡터를 딥러닝 기법을 적용하여 학습시킬 수 있다. 예컨대, 지식 보완 장치는 Keras와 Lambda operation(Keras의 backend)을 이용하여 새로운 레이어를 생성함으로써, 제1 엔티티벡터를 생성할 수 있다. 마찬가지로, 지식 보완 장치는 WhiteHouse, Washington, USA 엔티티에 대하여도 제1 엔티티벡터를 생성할 수 있다.

단계 S320에서는, 지식 보완 장치가 그 제1 엔티티벡터를 구성하는 각각의 열을 기준으로 모든 행의 값을 합하여 단일 행의 벡터를 생성한 후, 그 복수의 엔티티 각각에 대한 단일 행의 벡터를 결합하여 제2 엔티티벡터를 생성한다.

예컨대, 도 9를 참조하면, 지식 보완 장치는 Obama 엔티티에 대응되는 제1 엔티티벡터에 대하여 첫번째 열에 대하여, 첫번째 행부터 네번째 행까지의 벡터값을 합(Element-wise sum)하여 단일 행의 벡터의 첫번째 열에 대한 벡터값으로 설정할 수 있다. 또한, 지식 보완 장치는 두번째 열부터 여섯번째 열까지 동일하게 첫번째 행부터 네번째 행까지의 벡터값을 합하여 단일 행의 벡터의 벡터값으로 설정할 수 있다.

그리고, 도 10을 참조하면, 지식 보완 장치는 Obama, WhiteHouse, Washington, USA 엔티티에 대한 단일 행의 벡터를 결합하여, 제2 엔티티벡터(Entity representations)를 생성할 수 있다.

단계 S330에서는, 지식 보완 장치가 관계정보에 포함된 관계에 대응되는 행과 임베딩 크기에 대응되는 열을 갖는 관계벡터를 생성한다.

예컨대, 도 10을 참조하면, 지식 보완 장치는 workedIn, locatedIn, cityOf 관계에 대한 3개의 행과 임베딩 크기인 6에 대응되는 6개의 열을 갖는 관계벡터를 생성할 수 있다.

단계 S340에서는, 지식 보완 장치가 그 제2 엔티티벡터와 관계벡터를 조합하여, 경로벡터를 생성한다.

즉, 지식 보완 장치는 제2 엔티티벡터와 관계벡터를 조합함으로써, 경로벡터를 생성할 수 있다.

다른 실시예에서는, 지식 보완 장치가 단계 S340에서 제2 엔티티벡터와 관계벡터를 조합하여 경로벡터를 생성할 때, 개별 경로를 구성하는 엔티티와 관계의 순서에 따라서, 제2 엔티티벡터와 관계벡터의 행을 조합하여 생성할 수 있다.

예컨대, 도 10을 참조하면, 지식 보완 장치는 개별 경로가 “Obama workedIn WhiteHouse locatedIn cityOf USA”인 경우, 그 개별 경로에 엔티티와 관계가 나열된 순서에 따라서, 제2 엔티티벡터와 관계벡터를 행 단위로 조합하여 경로벡터를 생성할 수 있다.

보다 구체적으로, 지식 보완 장치는 제2 엔티티벡터의 1행, 관계벡터의 1행, 제2 엔티티벡터의 2행, 관계벡터의 2행, 제2 엔티티벡터의 3행, 관계벡터의 3행, 제2 엔티티벡터의 4행의 순서로 조합하여, 경로벡터를 생성할 수 있다.

도 4를 참조하면, 본 발명의 일 실시예에 따른 다중타입 엔티티에 기반한 지식 보완 장치(400)는 데이터추출부(410), 경로생성부(420), 학습부(430) 및 판단부(440)를 포함한다. 또한, 선택적으로 가중치추출부(미도시)를 더 포함할 수 있다.

한편, 본 발명의 일 실시예에 따른 다중타입 엔티티에 기반한 지식 보완 장치(400)는 데스크탑PC, 노트북PC, 스마트폰, 태블릿PC 및 서버 컴퓨터 등에 탑재될 수 있다.

데이터추출부(410)는 지식 그래프에 포함된 2개의 엔티티를 연결하는 복수의 경로 각각에 대하여, 개별 경로에 포함된 복수의 엔티티에 관한 정보인 엔티티정보와 그 복수의 엔티티 중 2개의 관계에 관한 정보인 관계정보를 추출한다.

경로생성부(420)는 엔티티정보, 관계정보, 그 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보인 타입정보 및 소정의 임베딩 크기에 기초하여, 그 복수의 경로 각각에 대응되는 경로벡터를 생성한다.

다른 실시예에서는, 경로생성부(420)는 엔티티정보에 포함된 복수의 엔티티 각각에 대하여, 소정의 딥러닝 기법을 적용하여, 타입정보에 포함된 적어도 하나의 엔티티타입에 대응되는 행과 상기 임베딩 크기에 대응되는 열을 갖는 제1 엔티티벡터를 학습시키고, 그 제1 엔티티벡터를 구성하는 각각의 열을 기준으로 모든 행의 값을 합하여 단일 행의 벡터를 생성한 후, 그 복수의 엔티티 각각에 대한 단일 행의 벡터를 결합하여 제2 엔티티벡터를 생성하고, 관계정보에 포함된 관계에 대응되는 행과 임베딩 크기에 대응되는 열을 갖는 관계벡터를 생성하고, 그 제2 엔티티벡터와 관계벡터를 조합하여, 경로벡터를 생성할 수 있다.

또 다른 실시예에서는, 경로생성부(420)가 그 제2 엔티티벡터와 관계벡터를 조합하여, 경로벡터를 생성할 때, 개별 경로를 구성하는 엔티티와 관계의 순서에 따라서, 그 제2 엔티티벡터와 관계벡터의 행을 조합하여 생성할 수 있다.

또 다른 실시예에서는, 타입정보는 그 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보를 저장하는 데이터베이스에 저장될 수 있다.

학습부(430)는 CNN(Convolutional Neural Network)과 Bi-LSTM(Bidirectional Long A Short-Term Memory)을 이용하여, 경로벡터로부터 인코딩된 경로벡터를 산출한다.

판단부(440)는 그 복수의 경로 및 복수의 인코딩된 경로벡터를 이용하여 그 2개의 엔티티 간의 관계를 예측하도록 학습된 관계모델을 이용하여, 그 2개의 엔티티 간에 소정의 목표 관계가 유효한지 판단한다.

가중치설정부(미도시)는 Attention 모델에 기초하여, 그 복수의 경로 각각에 대응되는 그 인코딩된 경로벡터에 상이한 가중치를 부여한다.

이때, 관계모델은 그 상이한 가중치를 더 이용하여 학습될 수 있다.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 사람이라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims

지식 그래프에 포함된 2개의 엔티티를 연결하는 복수의 경로 각각에 대하여, 개별 경로에 포함된 복수의 엔티티에 관한 정보인 엔티티정보와 상기 복수의 엔티티 중 2개의 관계에 관한 정보인 관계정보를 추출하는 단계;

상기 엔티티정보, 상기 관계정보, 상기 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보인 타입정보 및 소정의 임베딩 크기에 기초하여, 상기 복수의 경로 각각에 대응되는 경로벡터를 생성하는 단계;

CNN(Convolutional Neural Network)과 Bi-LSTM(Bidirectional Long A Short-Term Memory)을 이용하여, 상기 경로벡터로부터 인코딩된 경로벡터를 산출하는 단계; 및

상기 복수의 경로 및 상기 복수의 인코딩된 경로벡터를 이용하여 상기 2개의 엔티티 간의 관계를 예측하도록 학습된 관계모델을 이용하여, 상기 2개의 엔티티 간에 소정의 목표 관계가 유효한지 판단하는 단계

를 포함하는 것을 특징으로 하는 다중타입 엔티티에 기반한 지식 보완 방법.
제1항에 있어서,

상기 복수의 경로 각각에 대응되는 경로벡터를 생성하는 단계는

상기 엔티티정보에 포함된 복수의 엔티티 각각에 대하여, 소정의 딥러닝 기법을 적용하여, 상기 타입정보에 포함된 적어도 하나의 엔티티타입에 대응되는 행과 상기 임베딩 크기에 대응되는 열을 갖는 제1 엔티티벡터를 학습시키는 단계;

상기 제1 엔티티벡터를 구성하는 각각의 열을 기준으로 모든 행의 값을 합하여 단일 행의 벡터를 생성한 후, 상기 복수의 엔티티 각각에 대한 상기 단일 행의 벡터를 결합하여 제2 엔티티벡터를 생성하는 단계;

상기 관계정보에 포함된 관계에 대응되는 행과 상기 임베딩 크기에 대응되는 열을 갖는 관계벡터를 생성하는 단계; 및

상기 제2 엔티티벡터와 상기 관계벡터를 조합하여, 상기 경로벡터를 생성하는 단계

를 포함하는 것을 특징으로 하는 다중타입 엔티티에 기반한 지식 보완 방법.
제2항에 있어서,

상기 제2 엔티티벡터와 상기 관계벡터를 조합하여, 상기 경로벡터를 생성하는 단계는

개별 경로를 구성하는 엔티티와 관계의 순서에 따라서, 상기 제2 엔티티벡터와 상기 관계벡터의 행을 조합하여 생성하는 것을 특징으로 하는 다중타입 엔티티에 기반한 지식 보완 방법.
제1항에 있어서,

상기 타입정보는

상기 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보를 저장하는 데이터베이스에 저장되는 것을 특징으로 하는 다중타입 엔티티에 기반한 지식 보완 방법.
제1항에 있어서

상기 인코딩된 경로벡터를 산출하는 단계와 상기 소정의 목표 관계가 유효한지 판단하는 단계의 사이에,

Attention 모델에 기초하여, 상기 복수의 경로 각각에 대응되는 상기 인코딩된 경로벡터에 상이한 가중치를 부여하는 단계

를 더 포함하고,

상기 관계모델은

상기 상이한 가중치를 더 이용하여 학습되는 것을 특징으로 하는 다중타입 엔티티에 기반한 지식 보완 방법.
지식 그래프에 포함된 2개의 엔티티를 연결하는 복수의 경로 각각에 대하여, 개별 경로에 포함된 복수의 엔티티에 관한 정보인 엔티티정보와 상기 복수의 엔티티 중 2개의 관계에 관한 정보인 관계정보를 추출하는 데이터추출부;

상기 엔티티정보, 상기 관계정보, 상기 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보인 타입정보 및 소정의 임베딩 크기에 기초하여, 상기 복수의 경로 각각에 대응되는 경로벡터를 생성하는 경로생성부;

CNN(Convolutional Neural Network)과 Bi-LSTM(Bidirectional Long A Short-Term Memory)을 이용하여, 상기 경로벡터로부터 인코딩된 경로벡터를 산출하는 학습부; 및

상기 복수의 경로 및 상기 복수의 인코딩된 경로벡터를 이용하여 상기 2개의 엔티티 간의 관계를 예측하도록 학습된 관계모델을 이용하여, 상기 2개의 엔티티 간에 소정의 목표 관계가 유효한지 판단하는 판단부

를 포함하는 것을 특징으로 하는 다중타입 엔티티에 기반한 지식 보완 장치.
제6항에 있어서,

상기 경로생성부는

상기 엔티티정보에 포함된 복수의 엔티티 각각에 대하여, 소정의 딥러닝 기법을 적용하여, 상기 타입정보에 포함된 적어도 하나의 엔티티타입에 대응되는 행과 상기 임베딩 크기에 대응되는 열을 갖는 제1 엔티티벡터를 학습시키고,

상기 제1 엔티티벡터를 구성하는 각각의 열을 기준으로 모든 행의 값을 합하여 단일 행의 벡터를 생성한 후, 상기 복수의 엔티티 각각에 대한 상기 단일 행의 벡터를 결합하여 제2 엔티티벡터를 생성하고,

상기 관계정보에 포함된 관계에 대응되는 행과 상기 임베딩 크기에 대응되는 열을 갖는 관계벡터를 생성하고,

상기 제2 엔티티벡터와 상기 관계벡터를 조합하여, 상기 경로벡터를 생성하는 것을 특징으로 하는 다중타입 엔티티에 기반한 지식 보완 장치.
제7항에 있어서,

상기 경로생성부가 상기 제2 엔티티벡터와 상기 관계벡터를 조합하여, 상기 경로벡터를 생성할 때,

개별 경로를 구성하는 엔티티와 관계의 순서에 따라서, 상기 제2 엔티티벡터와 상기 관계벡터의 행을 조합하여 생성하는 것을 특징으로 하는 다중타입 엔티티에 기반한 지식 보완 장치.
제6항에 있어서,

상기 타입정보는

상기 복수의 엔티티 각각에 대응되는 적어도 하나의 엔티티타입에 관한 정보를 저장하는 데이터베이스에 저장되는 것을 특징으로 하는 다중타입 엔티티에 기반한 지식 보완 장치.
제6항에 있어서,

Attention 모델에 기초하여, 상기 복수의 경로 각각에 대응되는 상기 인코딩된 경로벡터에 상이한 가중치를 부여하는 가중치설정부

를 더 포함하고,

상기 관계모델은

상기 상이한 가중치를 더 이용하여 학습되는 것을 특징으로 하는 다중타입 엔티티에 기반한 지식 보완 장치.