KR102655154B1

KR102655154B1 - 인공신경망 모델을 이용한 컨셉넷 자동 확장 방법

Info

Publication number: KR102655154B1
Application number: KR1020210129965A
Authority: KR
Inventors: 유승환; 장정훈; 채화종
Original assignee: 주식회사 와이즈넛
Priority date: 2021-09-30
Filing date: 2021-09-30
Publication date: 2024-04-05
Also published as: KR20230046686A; WO2023054784A1

Abstract

본 발명은 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법에 관합니다. 더욱 구체적으로는 컨셉넷의 지식에 대해 학습한 인공 신경망 모델을 활용해서 새로운 지식을 생성하고, 검증을 통해, 의미있는 지식을 최종 확장하는 방법에 관합니다.
컨셉넷의 지식을 추출하는 지식 추출 단계와, 추출된 지식을 활용해 새로운 연결 생성을 위한 인공 신경망 모델 및 새로운 연결 검증을 위한 인공 신경망 모델을 학습하는 모델 학습 단계와, 두 모델을 활용하여 컨셉넷을 확장하는 지식 확장 단계를 포함하는 구성을 특징으로 합니다.

Description

인공신경망 모델을 이용한 컨셉넷 자동 확장 방법{THE CONCEPTNET AUTO-SCALING METHOD USING ARTIFICIAL NEURAL NETWORK MODEL}

본 발명은 인공지능 기술에 관하며, 특히 인공신경망의 지식 베이스를 구축하는 기술에 관한다.

컨셉넷(ConceptNet)은 자연언어로 표현된 실세계의 지식을 노드(개념)와 에지(관계)로 표현해 놓은 그래프 형태의 지식 베이스를 뜻한다. 에지는 노드 간의 방향이 있는 관계를 나타낸다. 컨셉넷은 "재즈는 음악장르이다"와 같은 Is-A 관계뿐 아니라 "색소폰은 재즈에 사용된다"와 같은 일반 상식도 함께 다루는 지식 베이스이다.

컨셉넷은 질의-응답(question answering), 추론(reasoning)과 같은 인공지능의 여러 응용에 필수적인 지식 자원으로 사용될 수 있다. 그런데 컨셉넷은 Open Mind Common Sense(OMCS) 프로젝트의 결과물로 WordNet과 DBPedia와 같은 기존의 지식 베이스뿐만 아니라, OMCS 사이트를 방문한 사용자들이 직접 입력한 문장, 위키피디아 텍스트, 온라인 게임 문서 등을 자동 분석하여 추출한 지식도 포함되어 있다. 그런데 이와 같이 여러 다른 형태의 지식베이스를 수집하여 만들었기 때문에 노드와 노드 사이가 연결이 불완전하게 구축되어 있는 경우가 많다.

지식 베이스를 완벽하게 구축하는 것은 매우 어려운 작업이어서 대다수의 지식 베이스들은 불완전하게 구축된 지식 정보를 포함한다. 이와 같은 노드와 노드 간의 불완전한 연결 문제를 완화하기 위해서 사람이 직접 연결을 추가한다. 이런 작업에 소모되는 시간과 비용이 클 수밖에 없고, 무엇보다 이런 연결 또한 여전히 불완전할 가능성이 크다.

이러한 문제점을 해결하기 위해서는 컨셉넷에 이미 존재하는 지식을 바탕으로 노드와 노드의 연결을 자동으로 확장하여 완성도를 높일 수 있는 방법이 필요하고, 이런 방법을 구현하기 위해 본 발명자들은 오랜 시간 함께 노력하고 연구하고 토론한 끝에 본 발명을 완성하기에 이르렀다.

그러므로 본 발명의 목적은 컨셉넷을 자동으로 확장하는 방법을 제공함에 있다. 본 발명은 컨셉넷에 이미 존재하는 사실 주장을 이용하여 인공 신경망 모델을 학습시키고, 학습된 인공 신경망 모델을 활용해 새로운 연결 관계를 유추하고 검증하는 과정을 보여줄 것이다.

한편, 본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론 할 수 있는 범위 내에서 추가적으로 고려될 것이다.

위와 같은 과제를 달성하기 위한 본 발명은 컴퓨터 장치에 의해 미리 정해지는 하기의 단계들이 실행되는 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법으로서:

지식이 저장되어 있는 데이터베이스에서 노드, 에지 및 관계로 세 가지의 지식을 추출하여, 추출된 에지는 인공 신경망 모델 학습 프로세스로 전달하고, 추출된 노드와 관계는 지식 확장 프로세스로 전달하는 지식 추출 단계;

상기 에지를 시퀀스 형태로 데이터 전처리를 수행하여 지식 생성 모델 학습에 사용하고 상기 에지를 (노드, 관계, 노드) 형태의 트리플로 데이터 전처리를 수행하여 지식 검증 모델 학습에 사용하는 모델 학습 단계; 및

상기 지식 추출 단계에서 추출한 모든 노드와 관계를 상기 지식 생성 모델에 입력하여 새로운 연결 지식을 생성하고, 생성된 연결 지식을 상기 지식 검증 모델에 입력하여 연결 가능하다고 판단되는 지식을 검증한 후 이를 다시 지식이 저장되어 있는 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 한다.

또한, 본 발명의 바람직한 어느 실시예에 따른 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법에 있어서, 상기 (노드, 관계, 노드)의 트리플 형태의 에지는 각각 (주어, 술어, 목적어)에 해당하는 것이 좋다.

위와 같은 본 발명의 과제해결수단을 통해, 컨셉넷 지식에 대해 학습한 모델을 활용해 새로운 연결의 생성과 검증을 자동화할 수 있다. 이로써 사람이 컨셉넷 확장에 관여하지 않게 되므로 비용, 시간 등의 자원 소모를 줄일 수 있는 장점이 있다. 또한, 기계 학습을 활용해 컨셉넷의 연결 관계를 추가하여 완성도를 높일 수 있다. 컨셉넷을 지식 자원으로 활용하는 응용 시스템의 성능 향상도 기대할 수 있음은 물론이다.

한편, 여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급됨을 첨언한다.

도 1은 본 발명의 바람직한 어느 실시예에 따른 시스템 구성을 개략적으로 나타내었다.
도 2는 본 발명의 바람직한 어느 실시예에 따른 소프트웨어 모듈 예이다.
도 3은 컨셉넷 지식 베이스를 구성하는 세 가지 구성 요소와 그들의 기능을 대략적으로 예시하는 도면이다.
도 4는 본 발명의 바람직한 어느 실시예에 따른 방법의 전체 프로세스를 개략적으로 나타내었다.
※ 첨부된 도면은 본 발명의 기술사상에 대한 이해를 위하여 참조로서 예시된 것임을 밝히며, 그것에 의해 본 발명의 권리범위가 제한되지는 아니한다.

이하, 도면을 참조하여 본 발명의 다양한 실시예가 안내하는 본 발명의 구성과 그 구성으로부터 비롯되는 효과에 대해 살펴본다. 본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.

본 발명은 인공 신경망 모델을 이용하여 컨셉넷을 자동으로 확장하는 방법에 관한다. 이러한 방법은 컴퓨터 장치에 의해 실행된다. 도 1은 본 발명의 방법을 실행하는 컴퓨터 장치의 구성예를 예시적으로 그리고 개략적으로 나타냈다.

본 발명의 컴퓨터 장치에는 하나 또는 여러 개의 프로세서(10), 메모리(11) 및 각 컴포넌트를 연결하는 인터페이스, 고속 인터페이스와 저속 인터페이스를 포함한다. 프로세서(10)는 메모리(11)에 저장된 명령 또는 프로세서 외부의 입력/출력 장치(12, 13)(예를 들면, 인터페이스에 연결된 디스플레이 기기)에 GUI의 그래픽 정보를 나타내는 명령을 포함한 컴퓨터 장치 내에 실행한 명령을 처리할 수 있다. 필요하다면, 여러 컴퓨터 장치를 연결할 수 있고 각각의 컴퓨터 장치는 필요한 동작을 제공하면서 네트워크 시스템을 구축할 수 있다. 메모리(11)는 본 출원에서 제공하는 컴퓨터 판독 가능 저장 매체이다. 여기서 메모리는 적어도 하나의 프로세서로 실행한 명령을 저장할 수 있어 상기 적어도 하나의 프로세서가 본 출원에서 제공하는 인공 신경망 모델을 이용하여 컨셉넷을 자동으로 확장하는 방법을 실행할 수 있게 한다. 예컨대 본 발명의 방법에 대응하는 도 2의 지식 추출 모듈(100), 모델 학습 모듈(120), 지식 확장 모듈(130)과 같은 프로그램 명령/모듈을 저장한다. 프로세서(10)는 메모리(11)에 저장한 소프트웨어 프로그램, 명령 및 모듈을 통해서 컴퓨터 장치의 여러 기능 응용 및 데이터 처리를 실행한다. 즉, 인공 신경망 모델을 이용하여 컨셉넷을 자동으로 확장하는 방법을 구현한다. 메모리(11)는 프로그램 저장 구역과 데이터 저장 구역을 포함할 수 있다. 여기서 프로그램 저장 구역은 동작 시스템, 적어도 하나의 기능이 수요한 응용 프로그램을 저장할 수 있다. 또한 메모리(11)는 고속 랜덤 램을 포함할 수 있고 비일시적 메모리를 포함할 수도 있다. 예를 들면, 적어도 하나의 디스크 메 모리, 플래시 메모리 컴포넌트 또는 기타 비일시적 메모리 컴포넌트. 일부 실시예에서, 메모리(11)는 프로세서(10)와 원격에서 통신하는 메모리를 포함할 수 있다. 이 원거리 메모리들은 네트워크를 통해 컴퓨터 장치들에 연결할 수 있다. 상기 네트워크의 실시예는 인터넷, 인트라넷, 랜, 모바일 통신망 및 조합을 포함하며 그 종류에 한정되지 않는다.

본 발명의 인공 신경망 모델을 이용하여 컨셉넷을 자동으로 확장하는 방법을 실행하는 컴퓨터 장치에는 입력 장치(12)와 출력 장치(13)를 더 포함할 수 있다. 프로세서(10), 메모리(11), 입력 장치(12)와 출력 장치(13)는 서로 통신으로 연결된다. 입력 장치(12)는 입력한 숫자, 문자 부호 정보, 기능 제어에 관련되는 키 신호 입력을 할 수 있다. 예를 들면 터치 스크린, 키패드, 마우스, 트랙 패드, 터치 패드, 인디케이터, 하나 또는 여러 개의 마우스 버튼, 트랙 볼, 조이스틱 등 입력 장치가 포함될 수 있다. 출력 장치(13)는 대표적으로는 디스플레이 기기를 들 수 있다.

또한, 본 발명의 일 실시예에 따른 인공 신경망 모델을 이용하여 컨셉넷을 자동으로 확장하는 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독가능매체에 기록될 수 있다. 상기 컴퓨터 판독가능매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계 되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.

컴퓨터 판독가능매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크 (floptical disk)와 같은 자기-광 매체, 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급언어코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지다.

도 2는 본 발명의 바람직한 어느 실시예에 따른 소프트웨어 모듈 구성 예를 개략적으로 나타내었다.

지식을 저장하는 데이터베이스(50)는 컨셉넷 지식 베이스로 구축되어 있다. 본 발명의 컨셉넷 자동 확장 소프트웨어(100)는 지식 추출 모듈(110), 모델 학습 모듈(120) 및 지식 확장 모듈(130)을 포함한다.

지식 추출 모듈(110)은 데이터베이스(50)에 액세스하여 컨셉넷 지식 베이스에서 지식을 추출한다. 지식 추출 모듈(110)은 지식 베이스에서 노드(Nodes), 에지(Edges), 관계(Relations)들을 추출한다. 에지는 (노드, 관계, 노드) 형태의 트리플 구성이며, 각각이 주어, 술어 및 목적어에 해당한다. 주어 및 목적어에 해당하는 노드와 술어에 해당하는 관계는 중복없이 추출한다.

모델 학습 모듈(120)은 지식 추출 모듈(110)이 추출한 에지를 이용하여 새로운 연결 생성을 위한 지식 생성 모델과 새로운 연결 검증을 위한 지식 검증 모델을 학습한다. 인공 신경망을 이용한 기계 학습 방식으로 모델을 학습한다. 모델 학습 시 학습 데이터는 (노드, 관계, 노드) 형태의 트리플 구조의 에지를 활용한다. 바람직하게는 데이터 전처리를 통해서 그 활용을 돕는다.

지식 확장 모듈(130)은 지식 추출 모듈(110)로부터 노드와 관계를 전달받는다. 모델 학습 모듈(120)에서 학습된 지식 생성 모듈로 새로운 지식을 생성하고, 생성된 지식을 지식 검증 모델로 검증하여 정답으로 분류된 경우에 한해 데이터베이스(50)에서 컨셉넷에 연결을 추가하는 형태로 지식을 확장한다. 바람직하게는 추출된 노드와 관계를 입력으로 활용한다. 연결 추가 시, 컨셉넷에 이미 존재하는 연결인지 확인하는 단계를 더 포함하는 것이 좋다. 생성된 지식 노드가 컨셉넷에 존재하지 않는 새로운 노드인 경우에는 이를 다시 입력으로 하여 컨셉넷 확장에 추가적으로 이용한다.

도 3은 컨셉넷 지식 베이스를 구성하는 세 가지 구성 요소와 그들의 기능을 대략적으로 예시한다.

컨셉넷 지식 베이스는 도시되어 있는 것처럼 다수의 노드(101), 에지(102) 및 관계(103)으로 구성된다. 노드는 자연어의 단어 또는 구를 의미하고, 자연어의 다양한 의미적인 관계를 표현하는 수단이다. 노드와 노드 사이의 의미적인 관계를 연결한 것을 에지라 하며, "마스크는 얼굴에 위치한다", "사람은 얼굴을 가지고 있다", "사람과 마스크는 연관이 있다"와 같은 자연어의 의미적 관계를 102와 같은 형태로 표현할 수 있다.

도 4는 본 발명의 바람직한 어느 실시예에 따른 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법의 전체 프로세스를 개략적으로 나타내었다.

먼저 지식이 저장되어 있는 데이터베이스에서 노드, 에지 및 관계로 세 가지의 지식을 추출하여, 추출된 에지는 인공 신경망 모델 학습 프로세스로 전달하고, 추출된 노드와 관계는 지식 확장 프로세스로 전달한다(S100).

다음으로, 모델 학습 단계를 실행한다(S110). 한편으로는 지식 생성 모델 학습(S112)을 하고, 다른 한편으로는 지식 검증 모델 학습을 실시한다(S114). 이 두 단계를 실행하기 위해 데이터 전처리 과정이 사전에 실행된다(S111). 바람직하게는 지식 생성 모델 학습(S112)에 더 적합한 데이터 전처리와, 지식 검증 모델 학습(S114)에 더 적합한 데이터 전처리를 구별해서 실행하는 것이 좋다.

예컨대 지식 생성 모델을 학습하는 경우에는, 에지를 시퀀스(문장) 형태로 전처리하여 학습에 활용하는 것이 좋다. 전처리 시 각 노드를 의미를 가진 서브워드(subword)로 토큰화하는 Byte-pair encoding(BPE)을 통해 에지 시퀀스를 인덱싱을 통한 서브워드 조합으로 표현될 수 있도록 한다. 예를 들어 두 노드 'baseball', 'sport'가 'IsA' 관계로 연결된 에지의 경우, BPE 사전에 'a: 1', 'is: 2', 'base: 3', 'ball: 4', 'sport: 5'가 서브워드로 등록되어 있다면, 'baseball'은 '3,4', 'is a'는 '2,1', 'sport'는 '5'와 같은 서브워드 인덱스의 조합으로 표현될 수 있다. 이를 순차적으로 나열한 시퀀스로 전처리 할 때, 조합하는 서브워드의 개수에 따라 시퀀스 길이가 달라지지 않도록 하는 것이 좋다. 이를 위해 각 노드와 관계 표현에 고정 길이를 할당함으로써 모든 에지가 동일한 길이를 갖도록 한다. 첫 번째 노드 길이는 10, 관계 길이는 5, 두 번째 노드 길이는 15로, 길이를 할당했다고 가정해 보자. 그렇다면 본 예시의 에지 시퀀스 'baseball is a sport'는 전체 길이가 30인 '3,4,0,0,0,0,0,0,0,0,2,1,0,0,0,5,0,0,0,0,0,0,0,0,0,0,0,0,0,0'의 형태로 전처리된다.

지식 검증 모델을 학습하는 경우에는, 에지를 (노드, 관계, 노드) 형태의 트리플로 데이터 전처리를 수행하여 학습에 활용한다. 실제 존재하는 에지 데이터의 경우 스코어 값을 1로 라벨링해 정답으로 활용하고, 데이터의 각 노드에 대해 연결되는 관계와 노드를 랜덤 샘플링하여 임의의 에지 데이터를 생성한 후 스코어 값을 0으로 라벨링해 오답으로 활용하여 검증 및 테스트가 가능하도록 전처리 한다.

지식 생성 모델 학습(S112)의 경우, 바람직하게는, 멀티 헤드 어텐션 트랜스포머 모델을 활용하여 새로운 에지를 유추할 수 있도록 학습한다. 트랜스포머 모델은 어텐션 계층을 활용한 인코더-디코더 구조의 모델로 노드와 관계 시퀀스를 인코딩한 값을 디코딩할 때 특정 노드 시퀀스로 디코딩되도록 할 수 있다. 학습에는 에지에 대한 시퀀스가 모두 이용된다. 학습된 모델은 특정 노드와 관계 시퀀스를 입력 시 새로운 노드 시퀀스를 유추할 수 있고 이를 조합한 새로운 에지를 생성할 수 있다.

지식 검증 모델 학습(S114)의 경우, 바람직하게는, 신경 텐서망 모델을 활용하여 에지를 검증할 수 있도록 학습한다. 신경 텐서망 모델은 텐서와 표준 선형 계층으로 구성된 모델로 최대-마진(Max-margin)을 목적 함수로 사용한다. 학습된 모델은 트리플 형태의 에지가 입력으로 주어지면 해당 에지의 점수를 출력한다. 출력된 점수가 임계 값 이상인 경우, 연결 가능하다고 판단하는 이진 분류 모델로 구성한다.

다음으로 지식 추출 단계(S100)에서 추출한 모든 노드와 관계를 지식 생성 모델에 입력하여(S121) 새로운 연결 지식을 생성하고(S122), 생성된 연결 지식을 상기 지식 검증 모델에 입력하여(S124) 연결 가능하다고 판단되는 지식을 검증한 후(S125) 이를 다시 지식이 저장되어 있는 데이터베이스에 저장한다(S120). 이리하여 다시 컨셉넷에 저장하는 형태로 지식을 확장할 수 있다.

새로운 연결 지식 생성 시 새로운 노드가 예측되는 경우, 이를 노드로 하여 지식 생성 모델에 입력해 추가적인 연결 지식을 생성할 수 있으며 이 과정의 반복을 통해 연결을 자동으로 확장하고 컨셉넷의 완성도를 높일 수 있다.

본 발명의 보호범위가 이상에서 명시적으로 설명한 실시예의 기재와 표현에 제한되는 것은 아니다. 또한, 본 발명이 속하는 기술분야에서 자명한 변경이나 치환으로 말미암아 본 발명이 보호범위가 제한될 수도 없음을 다시 한 번 첨언한다.

Claims

컴퓨터 장치에 의해 미리 정해지는 하기의 단계들이 실행되는 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법으로서:
지식 추출 모듈이 지식이 저장되어 있는 데이터베이스에서 자연어의 단어 또는 구를 의미하는 ‘노드’, 노드와 노드 사이의 의미적인 관계를 연결한 ‘에지’ 및 ‘관계’로 세 가지의 지식을 추출하여, 추출된 에지는 인공 신경망 모델 학습 프로세스로 전달하고, 추출된 노드와 관계는 지식 확장 프로세스로 별도로 전달하는 지식 추출 단계(S100);
모델 학습 모듈이 상기 에지를 순차적으로 나열한 시퀀스 형태로 각 노드와 관계 표현에 고정 길이를 할당함으로써 모든 에지가 동일한 길이를 갖도록 데이터 전처리를 수행하여 <지식 생성 모델> 학습에 사용하고(S112), 상기 에지를 (노드, 관계, 노드) 형태의 트리플로 데이터 전처리를 수행하여 <지식 검증 모델> 학습에 사용하는(S114) 모델 학습 단계(S110); 및
지식 확장 모듈이 상기 지식 추출 단계에서 추출한 모든 노드와 관계를 학습된 상기 <지식 생성 모델>에 입력하여 새로운 연결 지식을 생성하고, 생성된 연결 지식을 학습된 상기 <지식 검증 모델>에 입력하여 연결 가능하다고 판단되는 지식을 검증한 후 이를 다시 지식이 저장되어 있는 데이터베이스에 저장하는 단계(S120)를 포함하며,
상기 지식 추출 단계에서 추출되는 에지는 (노드, 관계, 노드)의 트리플 형태의 에지는 각각 (주어, 술어, 목적어)에 해당하는 것을 특징으로 하는, 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법.
삭제