KR102655154B1 - 인공신경망 모델을 이용한 컨셉넷 자동 확장 방법 - Google Patents

인공신경망 모델을 이용한 컨셉넷 자동 확장 방법 Download PDF

Info

Publication number
KR102655154B1
KR102655154B1 KR1020210129965A KR20210129965A KR102655154B1 KR 102655154 B1 KR102655154 B1 KR 102655154B1 KR 1020210129965 A KR1020210129965 A KR 1020210129965A KR 20210129965 A KR20210129965 A KR 20210129965A KR 102655154 B1 KR102655154 B1 KR 102655154B1
Authority
KR
South Korea
Prior art keywords
knowledge
model
neural network
edges
artificial neural
Prior art date
Application number
KR1020210129965A
Other languages
English (en)
Other versions
KR20230046686A (ko
Inventor
유승환
장정훈
채화종
Original Assignee
주식회사 와이즈넛
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 와이즈넛 filed Critical 주식회사 와이즈넛
Priority to KR1020210129965A priority Critical patent/KR102655154B1/ko
Priority to PCT/KR2021/014116 priority patent/WO2023054784A1/ko
Publication of KR20230046686A publication Critical patent/KR20230046686A/ko
Application granted granted Critical
Publication of KR102655154B1 publication Critical patent/KR102655154B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/082Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

본 발명은 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법에 관합니다. 더욱 구체적으로는 컨셉넷의 지식에 대해 학습한 인공 신경망 모델을 활용해서 새로운 지식을 생성하고, 검증을 통해, 의미있는 지식을 최종 확장하는 방법에 관합니다.
컨셉넷의 지식을 추출하는 지식 추출 단계와, 추출된 지식을 활용해 새로운 연결 생성을 위한 인공 신경망 모델 및 새로운 연결 검증을 위한 인공 신경망 모델을 학습하는 모델 학습 단계와, 두 모델을 활용하여 컨셉넷을 확장하는 지식 확장 단계를 포함하는 구성을 특징으로 합니다.

Description

인공신경망 모델을 이용한 컨셉넷 자동 확장 방법{THE CONCEPTNET AUTO-SCALING METHOD USING ARTIFICIAL NEURAL NETWORK MODEL}
본 발명은 인공지능 기술에 관하며, 특히 인공신경망의 지식 베이스를 구축하는 기술에 관한다.
컨셉넷(ConceptNet)은 자연언어로 표현된 실세계의 지식을 노드(개념)와 에지(관계)로 표현해 놓은 그래프 형태의 지식 베이스를 뜻한다. 에지는 노드 간의 방향이 있는 관계를 나타낸다. 컨셉넷은 "재즈는 음악장르이다"와 같은 Is-A 관계뿐 아니라 "색소폰은 재즈에 사용된다"와 같은 일반 상식도 함께 다루는 지식 베이스이다.
컨셉넷은 질의-응답(question answering), 추론(reasoning)과 같은 인공지능의 여러 응용에 필수적인 지식 자원으로 사용될 수 있다. 그런데 컨셉넷은 Open Mind Common Sense(OMCS) 프로젝트의 결과물로 WordNet과 DBPedia와 같은 기존의 지식 베이스뿐만 아니라, OMCS 사이트를 방문한 사용자들이 직접 입력한 문장, 위키피디아 텍스트, 온라인 게임 문서 등을 자동 분석하여 추출한 지식도 포함되어 있다. 그런데 이와 같이 여러 다른 형태의 지식베이스를 수집하여 만들었기 때문에 노드와 노드 사이가 연결이 불완전하게 구축되어 있는 경우가 많다.
지식 베이스를 완벽하게 구축하는 것은 매우 어려운 작업이어서 대다수의 지식 베이스들은 불완전하게 구축된 지식 정보를 포함한다. 이와 같은 노드와 노드 간의 불완전한 연결 문제를 완화하기 위해서 사람이 직접 연결을 추가한다. 이런 작업에 소모되는 시간과 비용이 클 수밖에 없고, 무엇보다 이런 연결 또한 여전히 불완전할 가능성이 크다.
이러한 문제점을 해결하기 위해서는 컨셉넷에 이미 존재하는 지식을 바탕으로 노드와 노드의 연결을 자동으로 확장하여 완성도를 높일 수 있는 방법이 필요하고, 이런 방법을 구현하기 위해 본 발명자들은 오랜 시간 함께 노력하고 연구하고 토론한 끝에 본 발명을 완성하기에 이르렀다.
그러므로 본 발명의 목적은 컨셉넷을 자동으로 확장하는 방법을 제공함에 있다. 본 발명은 컨셉넷에 이미 존재하는 사실 주장을 이용하여 인공 신경망 모델을 학습시키고, 학습된 인공 신경망 모델을 활용해 새로운 연결 관계를 유추하고 검증하는 과정을 보여줄 것이다.
한편, 본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론 할 수 있는 범위 내에서 추가적으로 고려될 것이다.
위와 같은 과제를 달성하기 위한 본 발명은 컴퓨터 장치에 의해 미리 정해지는 하기의 단계들이 실행되는 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법으로서:
지식이 저장되어 있는 데이터베이스에서 노드, 에지 및 관계로 세 가지의 지식을 추출하여, 추출된 에지는 인공 신경망 모델 학습 프로세스로 전달하고, 추출된 노드와 관계는 지식 확장 프로세스로 전달하는 지식 추출 단계;
상기 에지를 시퀀스 형태로 데이터 전처리를 수행하여 지식 생성 모델 학습에 사용하고 상기 에지를 (노드, 관계, 노드) 형태의 트리플로 데이터 전처리를 수행하여 지식 검증 모델 학습에 사용하는 모델 학습 단계; 및
상기 지식 추출 단계에서 추출한 모든 노드와 관계를 상기 지식 생성 모델에 입력하여 새로운 연결 지식을 생성하고, 생성된 연결 지식을 상기 지식 검증 모델에 입력하여 연결 가능하다고 판단되는 지식을 검증한 후 이를 다시 지식이 저장되어 있는 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 한다.
또한, 본 발명의 바람직한 어느 실시예에 따른 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법에 있어서, 상기 (노드, 관계, 노드)의 트리플 형태의 에지는 각각 (주어, 술어, 목적어)에 해당하는 것이 좋다.
위와 같은 본 발명의 과제해결수단을 통해, 컨셉넷 지식에 대해 학습한 모델을 활용해 새로운 연결의 생성과 검증을 자동화할 수 있다. 이로써 사람이 컨셉넷 확장에 관여하지 않게 되므로 비용, 시간 등의 자원 소모를 줄일 수 있는 장점이 있다. 또한, 기계 학습을 활용해 컨셉넷의 연결 관계를 추가하여 완성도를 높일 수 있다. 컨셉넷을 지식 자원으로 활용하는 응용 시스템의 성능 향상도 기대할 수 있음은 물론이다.
한편, 여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급됨을 첨언한다.
도 1은 본 발명의 바람직한 어느 실시예에 따른 시스템 구성을 개략적으로 나타내었다.
도 2는 본 발명의 바람직한 어느 실시예에 따른 소프트웨어 모듈 예이다.
도 3은 컨셉넷 지식 베이스를 구성하는 세 가지 구성 요소와 그들의 기능을 대략적으로 예시하는 도면이다.
도 4는 본 발명의 바람직한 어느 실시예에 따른 방법의 전체 프로세스를 개략적으로 나타내었다.
※ 첨부된 도면은 본 발명의 기술사상에 대한 이해를 위하여 참조로서 예시된 것임을 밝히며, 그것에 의해 본 발명의 권리범위가 제한되지는 아니한다.
이하, 도면을 참조하여 본 발명의 다양한 실시예가 안내하는 본 발명의 구성과 그 구성으로부터 비롯되는 효과에 대해 살펴본다. 본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
본 발명은 인공 신경망 모델을 이용하여 컨셉넷을 자동으로 확장하는 방법에 관한다. 이러한 방법은 컴퓨터 장치에 의해 실행된다. 도 1은 본 발명의 방법을 실행하는 컴퓨터 장치의 구성예를 예시적으로 그리고 개략적으로 나타냈다.
본 발명의 컴퓨터 장치에는 하나 또는 여러 개의 프로세서(10), 메모리(11) 및 각 컴포넌트를 연결하는 인터페이스, 고속 인터페이스와 저속 인터페이스를 포함한다. 프로세서(10)는 메모리(11)에 저장된 명령 또는 프로세서 외부의 입력/출력 장치(12, 13)(예를 들면, 인터페이스에 연결된 디스플레이 기기)에 GUI의 그래픽 정보를 나타내는 명령을 포함한 컴퓨터 장치 내에 실행한 명령을 처리할 수 있다. 필요하다면, 여러 컴퓨터 장치를 연결할 수 있고 각각의 컴퓨터 장치는 필요한 동작을 제공하면서 네트워크 시스템을 구축할 수 있다. 메모리(11)는 본 출원에서 제공하는 컴퓨터 판독 가능 저장 매체이다. 여기서 메모리는 적어도 하나의 프로세서로 실행한 명령을 저장할 수 있어 상기 적어도 하나의 프로세서가 본 출원에서 제공하는 인공 신경망 모델을 이용하여 컨셉넷을 자동으로 확장하는 방법을 실행할 수 있게 한다. 예컨대 본 발명의 방법에 대응하는 도 2의 지식 추출 모듈(100), 모델 학습 모듈(120), 지식 확장 모듈(130)과 같은 프로그램 명령/모듈을 저장한다. 프로세서(10)는 메모리(11)에 저장한 소프트웨어 프로그램, 명령 및 모듈을 통해서 컴퓨터 장치의 여러 기능 응용 및 데이터 처리를 실행한다. 즉, 인공 신경망 모델을 이용하여 컨셉넷을 자동으로 확장하는 방법을 구현한다. 메모리(11)는 프로그램 저장 구역과 데이터 저장 구역을 포함할 수 있다. 여기서 프로그램 저장 구역은 동작 시스템, 적어도 하나의 기능이 수요한 응용 프로그램을 저장할 수 있다. 또한 메모리(11)는 고속 랜덤 램을 포함할 수 있고 비일시적 메모리를 포함할 수도 있다. 예를 들면, 적어도 하나의 디스크 메 모리, 플래시 메모리 컴포넌트 또는 기타 비일시적 메모리 컴포넌트. 일부 실시예에서, 메모리(11)는 프로세서(10)와 원격에서 통신하는 메모리를 포함할 수 있다. 이 원거리 메모리들은 네트워크를 통해 컴퓨터 장치들에 연결할 수 있다. 상기 네트워크의 실시예는 인터넷, 인트라넷, 랜, 모바일 통신망 및 조합을 포함하며 그 종류에 한정되지 않는다.
본 발명의 인공 신경망 모델을 이용하여 컨셉넷을 자동으로 확장하는 방법을 실행하는 컴퓨터 장치에는 입력 장치(12)와 출력 장치(13)를 더 포함할 수 있다. 프로세서(10), 메모리(11), 입력 장치(12)와 출력 장치(13)는 서로 통신으로 연결된다. 입력 장치(12)는 입력한 숫자, 문자 부호 정보, 기능 제어에 관련되는 키 신호 입력을 할 수 있다. 예를 들면 터치 스크린, 키패드, 마우스, 트랙 패드, 터치 패드, 인디케이터, 하나 또는 여러 개의 마우스 버튼, 트랙 볼, 조이스틱 등 입력 장치가 포함될 수 있다. 출력 장치(13)는 대표적으로는 디스플레이 기기를 들 수 있다.
또한, 본 발명의 일 실시예에 따른 인공 신경망 모델을 이용하여 컨셉넷을 자동으로 확장하는 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독가능매체에 기록될 수 있다. 상기 컴퓨터 판독가능매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계 되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독가능매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크 (floptical disk)와 같은 자기-광 매체, 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급언어코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지다.
도 2는 본 발명의 바람직한 어느 실시예에 따른 소프트웨어 모듈 구성 예를 개략적으로 나타내었다.
지식을 저장하는 데이터베이스(50)는 컨셉넷 지식 베이스로 구축되어 있다. 본 발명의 컨셉넷 자동 확장 소프트웨어(100)는 지식 추출 모듈(110), 모델 학습 모듈(120) 및 지식 확장 모듈(130)을 포함한다.
지식 추출 모듈(110)은 데이터베이스(50)에 액세스하여 컨셉넷 지식 베이스에서 지식을 추출한다. 지식 추출 모듈(110)은 지식 베이스에서 노드(Nodes), 에지(Edges), 관계(Relations)들을 추출한다. 에지는 (노드, 관계, 노드) 형태의 트리플 구성이며, 각각이 주어, 술어 및 목적어에 해당한다. 주어 및 목적어에 해당하는 노드와 술어에 해당하는 관계는 중복없이 추출한다.
모델 학습 모듈(120)은 지식 추출 모듈(110)이 추출한 에지를 이용하여 새로운 연결 생성을 위한 지식 생성 모델과 새로운 연결 검증을 위한 지식 검증 모델을 학습한다. 인공 신경망을 이용한 기계 학습 방식으로 모델을 학습한다. 모델 학습 시 학습 데이터는 (노드, 관계, 노드) 형태의 트리플 구조의 에지를 활용한다. 바람직하게는 데이터 전처리를 통해서 그 활용을 돕는다.
지식 확장 모듈(130)은 지식 추출 모듈(110)로부터 노드와 관계를 전달받는다. 모델 학습 모듈(120)에서 학습된 지식 생성 모듈로 새로운 지식을 생성하고, 생성된 지식을 지식 검증 모델로 검증하여 정답으로 분류된 경우에 한해 데이터베이스(50)에서 컨셉넷에 연결을 추가하는 형태로 지식을 확장한다. 바람직하게는 추출된 노드와 관계를 입력으로 활용한다. 연결 추가 시, 컨셉넷에 이미 존재하는 연결인지 확인하는 단계를 더 포함하는 것이 좋다. 생성된 지식 노드가 컨셉넷에 존재하지 않는 새로운 노드인 경우에는 이를 다시 입력으로 하여 컨셉넷 확장에 추가적으로 이용한다.
도 3은 컨셉넷 지식 베이스를 구성하는 세 가지 구성 요소와 그들의 기능을 대략적으로 예시한다.
컨셉넷 지식 베이스는 도시되어 있는 것처럼 다수의 노드(101), 에지(102) 및 관계(103)으로 구성된다. 노드는 자연어의 단어 또는 구를 의미하고, 자연어의 다양한 의미적인 관계를 표현하는 수단이다. 노드와 노드 사이의 의미적인 관계를 연결한 것을 에지라 하며, "마스크는 얼굴에 위치한다", "사람은 얼굴을 가지고 있다", "사람과 마스크는 연관이 있다"와 같은 자연어의 의미적 관계를 102와 같은 형태로 표현할 수 있다.
도 4는 본 발명의 바람직한 어느 실시예에 따른 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법의 전체 프로세스를 개략적으로 나타내었다.
먼저 지식이 저장되어 있는 데이터베이스에서 노드, 에지 및 관계로 세 가지의 지식을 추출하여, 추출된 에지는 인공 신경망 모델 학습 프로세스로 전달하고, 추출된 노드와 관계는 지식 확장 프로세스로 전달한다(S100).
다음으로, 모델 학습 단계를 실행한다(S110). 한편으로는 지식 생성 모델 학습(S112)을 하고, 다른 한편으로는 지식 검증 모델 학습을 실시한다(S114). 이 두 단계를 실행하기 위해 데이터 전처리 과정이 사전에 실행된다(S111). 바람직하게는 지식 생성 모델 학습(S112)에 더 적합한 데이터 전처리와, 지식 검증 모델 학습(S114)에 더 적합한 데이터 전처리를 구별해서 실행하는 것이 좋다.
예컨대 지식 생성 모델을 학습하는 경우에는, 에지를 시퀀스(문장) 형태로 전처리하여 학습에 활용하는 것이 좋다. 전처리 시 각 노드를 의미를 가진 서브워드(subword)로 토큰화하는 Byte-pair encoding(BPE)을 통해 에지 시퀀스를 인덱싱을 통한 서브워드 조합으로 표현될 수 있도록 한다. 예를 들어 두 노드 'baseball', 'sport'가 'IsA' 관계로 연결된 에지의 경우, BPE 사전에 'a: 1', 'is: 2', 'base: 3', 'ball: 4', 'sport: 5'가 서브워드로 등록되어 있다면, 'baseball'은 '3,4', 'is a'는 '2,1', 'sport'는 '5'와 같은 서브워드 인덱스의 조합으로 표현될 수 있다. 이를 순차적으로 나열한 시퀀스로 전처리 할 때, 조합하는 서브워드의 개수에 따라 시퀀스 길이가 달라지지 않도록 하는 것이 좋다. 이를 위해 각 노드와 관계 표현에 고정 길이를 할당함으로써 모든 에지가 동일한 길이를 갖도록 한다. 첫 번째 노드 길이는 10, 관계 길이는 5, 두 번째 노드 길이는 15로, 길이를 할당했다고 가정해 보자. 그렇다면 본 예시의 에지 시퀀스 'baseball is a sport'는 전체 길이가 30인 '3,4,0,0,0,0,0,0,0,0,2,1,0,0,0,5,0,0,0,0,0,0,0,0,0,0,0,0,0,0'의 형태로 전처리된다.
지식 검증 모델을 학습하는 경우에는, 에지를 (노드, 관계, 노드) 형태의 트리플로 데이터 전처리를 수행하여 학습에 활용한다. 실제 존재하는 에지 데이터의 경우 스코어 값을 1로 라벨링해 정답으로 활용하고, 데이터의 각 노드에 대해 연결되는 관계와 노드를 랜덤 샘플링하여 임의의 에지 데이터를 생성한 후 스코어 값을 0으로 라벨링해 오답으로 활용하여 검증 및 테스트가 가능하도록 전처리 한다.
지식 생성 모델 학습(S112)의 경우, 바람직하게는, 멀티 헤드 어텐션 트랜스포머 모델을 활용하여 새로운 에지를 유추할 수 있도록 학습한다. 트랜스포머 모델은 어텐션 계층을 활용한 인코더-디코더 구조의 모델로 노드와 관계 시퀀스를 인코딩한 값을 디코딩할 때 특정 노드 시퀀스로 디코딩되도록 할 수 있다. 학습에는 에지에 대한 시퀀스가 모두 이용된다. 학습된 모델은 특정 노드와 관계 시퀀스를 입력 시 새로운 노드 시퀀스를 유추할 수 있고 이를 조합한 새로운 에지를 생성할 수 있다.
지식 검증 모델 학습(S114)의 경우, 바람직하게는, 신경 텐서망 모델을 활용하여 에지를 검증할 수 있도록 학습한다. 신경 텐서망 모델은 텐서와 표준 선형 계층으로 구성된 모델로 최대-마진(Max-margin)을 목적 함수로 사용한다. 학습된 모델은 트리플 형태의 에지가 입력으로 주어지면 해당 에지의 점수를 출력한다. 출력된 점수가 임계 값 이상인 경우, 연결 가능하다고 판단하는 이진 분류 모델로 구성한다.
다음으로 지식 추출 단계(S100)에서 추출한 모든 노드와 관계를 지식 생성 모델에 입력하여(S121) 새로운 연결 지식을 생성하고(S122), 생성된 연결 지식을 상기 지식 검증 모델에 입력하여(S124) 연결 가능하다고 판단되는 지식을 검증한 후(S125) 이를 다시 지식이 저장되어 있는 데이터베이스에 저장한다(S120). 이리하여 다시 컨셉넷에 저장하는 형태로 지식을 확장할 수 있다.
새로운 연결 지식 생성 시 새로운 노드가 예측되는 경우, 이를 노드로 하여 지식 생성 모델에 입력해 추가적인 연결 지식을 생성할 수 있으며 이 과정의 반복을 통해 연결을 자동으로 확장하고 컨셉넷의 완성도를 높일 수 있다.
본 발명의 보호범위가 이상에서 명시적으로 설명한 실시예의 기재와 표현에 제한되는 것은 아니다. 또한, 본 발명이 속하는 기술분야에서 자명한 변경이나 치환으로 말미암아 본 발명이 보호범위가 제한될 수도 없음을 다시 한 번 첨언한다.

Claims (2)

  1. 컴퓨터 장치에 의해 미리 정해지는 하기의 단계들이 실행되는 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법으로서:
    지식 추출 모듈이 지식이 저장되어 있는 데이터베이스에서 자연어의 단어 또는 구를 의미하는 ‘노드’, 노드와 노드 사이의 의미적인 관계를 연결한 ‘에지’ 및 ‘관계’로 세 가지의 지식을 추출하여, 추출된 에지는 인공 신경망 모델 학습 프로세스로 전달하고, 추출된 노드와 관계는 지식 확장 프로세스로 별도로 전달하는 지식 추출 단계(S100);
    모델 학습 모듈이 상기 에지를 순차적으로 나열한 시퀀스 형태로 각 노드와 관계 표현에 고정 길이를 할당함으로써 모든 에지가 동일한 길이를 갖도록 데이터 전처리를 수행하여 <지식 생성 모델> 학습에 사용하고(S112), 상기 에지를 (노드, 관계, 노드) 형태의 트리플로 데이터 전처리를 수행하여 <지식 검증 모델> 학습에 사용하는(S114) 모델 학습 단계(S110); 및
    지식 확장 모듈이 상기 지식 추출 단계에서 추출한 모든 노드와 관계를 학습된 상기 <지식 생성 모델>에 입력하여 새로운 연결 지식을 생성하고, 생성된 연결 지식을 학습된 상기 <지식 검증 모델>에 입력하여 연결 가능하다고 판단되는 지식을 검증한 후 이를 다시 지식이 저장되어 있는 데이터베이스에 저장하는 단계(S120)를 포함하며,
    상기 지식 추출 단계에서 추출되는 에지는 (노드, 관계, 노드)의 트리플 형태의 에지는 각각 (주어, 술어, 목적어)에 해당하는 것을 특징으로 하는, 인공 신경망 모델을 이용한 컨셉넷 자동 확장 방법.
  2. 삭제
KR1020210129965A 2021-09-30 2021-09-30 인공신경망 모델을 이용한 컨셉넷 자동 확장 방법 KR102655154B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020210129965A KR102655154B1 (ko) 2021-09-30 2021-09-30 인공신경망 모델을 이용한 컨셉넷 자동 확장 방법
PCT/KR2021/014116 WO2023054784A1 (ko) 2021-09-30 2021-10-13 인공신경망 모델을 이용한 컨셉넷 자동 확장 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210129965A KR102655154B1 (ko) 2021-09-30 2021-09-30 인공신경망 모델을 이용한 컨셉넷 자동 확장 방법

Publications (2)

Publication Number Publication Date
KR20230046686A KR20230046686A (ko) 2023-04-06
KR102655154B1 true KR102655154B1 (ko) 2024-04-05

Family

ID=85783015

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210129965A KR102655154B1 (ko) 2021-09-30 2021-09-30 인공신경망 모델을 이용한 컨셉넷 자동 확장 방법

Country Status (2)

Country Link
KR (1) KR102655154B1 (ko)
WO (1) WO2023054784A1 (ko)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101835345B1 (ko) * 2016-02-29 2018-03-07 경기대학교 산학협력단 지식베이스 기반의 개념그래프 확장 시스템
KR101991320B1 (ko) * 2017-03-24 2019-06-21 (주)아크릴 온톨로지에 의해 표현되는 자원들을 이용하여 상기 온톨로지를 확장하는 방법
DE102019211651A1 (de) * 2019-08-02 2021-02-04 Robert Bosch Gmbh Vorrichtung und Verfahren zum Maschinenlernen und Ansteuern einer Maschine
CN111475658B (zh) * 2020-06-12 2020-12-25 北京百度网讯科技有限公司 知识表示学习方法、装置、设备以及存储介质
CN113282689B (zh) * 2021-07-22 2023-02-03 药渡经纬信息科技(北京)有限公司 基于领域知识图谱的检索方法、装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SOYEOP YOO 등, 'Automating the expansion of a knowledge graph', Expert Systems With Applications, Volume 141, Article number 112965, 2020.03*
김지호 외 2인,"KBCNN: CNN을 활용한 지식베이스 완성 모델",제30회 한글 및 한국어 정보처리 학술대회 논문집(HCLT), pp.465-469 (2018.10.12.)*

Also Published As

Publication number Publication date
KR20230046686A (ko) 2023-04-06
WO2023054784A1 (ko) 2023-04-06

Similar Documents

Publication Publication Date Title
CN105955889B (zh) 一种图形界面自动化测试方法
US7302677B2 (en) Event driven graph explorer for model-based testing of software
Umer et al. CNN-based automatic prioritization of bug reports
Balzer Transformational implementation: An example
Li et al. Story generation with crowdsourced plot graphs
US10877874B2 (en) Systems and methods for modeling and generating test requirements for software applications
Meinke et al. LBTest: a learning-based testing tool for reactive systems
Heule et al. Software model synthesis using satisfiability solvers
KR20160058947A (ko) 데이터에 적용되는 규칙 평가
Burns et al. A dataset for interactive vision-language navigation with unknown command feasibility
US11455150B2 (en) Accelerating application modernization
US10713429B2 (en) Joining web data with spreadsheet data using examples
Amalfitano et al. AGRippin: a novel search based testing technique for Android applications
KR20200071877A (ko) 자율 증강형 반복 학습을 이용한 정보 추출 방법 및 시스템
Pira Using Markov chain based estimation of distribution algorithm for model-based safety analysis of graph transformation
Gezici et al. Explainable AI for software defect prediction with gradient boosting classifier
Khaliq et al. A deep learning-based automated framework for functional User Interface testing
Pal et al. Constructing flow graphs from procedural cybersecurity texts
Kim Enhancing code clone detection using control flow graphs.
KR102655154B1 (ko) 인공신경망 모델을 이용한 컨셉넷 자동 확장 방법
Křena et al. Automated formal analysis and verification: an overview
KR102610431B1 (ko) 인공지능 분석 기반 프로그램 소스코드의 요약문 생성 장치 및 방법
CN116974554A (zh) 代码数据处理方法、装置、计算机设备和存储介质
Czarnecki et al. Ontologies vs. rules—comparison of methods of knowledge representation based on the example of IT services management
CN114416533A (zh) 基于人工智能的车载电子产品的用例生成方法和系统

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant