KR102273136B1 - Method and Apparatus for Completing Zero-Shot Knowledge Graph Using Multi-Hop Neighborhoods - Google Patents

Method and Apparatus for Completing Zero-Shot Knowledge Graph Using Multi-Hop Neighborhoods Download PDF

Info

Publication number
KR102273136B1
KR102273136B1 KR1020190129123A KR20190129123A KR102273136B1 KR 102273136 B1 KR102273136 B1 KR 102273136B1 KR 1020190129123 A KR1020190129123 A KR 1020190129123A KR 20190129123 A KR20190129123 A KR 20190129123A KR 102273136 B1 KR102273136 B1 KR 102273136B1
Authority
KR
South Korea
Prior art keywords
knowledge graph
relationship
shot
zero
entity
Prior art date
Application number
KR1020190129123A
Other languages
Korean (ko)
Other versions
KR20210045728A (en
Inventor
이경호
오병국
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to KR1020190129123A priority Critical patent/KR102273136B1/en
Publication of KR20210045728A publication Critical patent/KR20210045728A/en
Application granted granted Critical
Publication of KR102273136B1 publication Critical patent/KR102273136B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 실시예들은 지식 그래프 내 엔티티-관계와 새로운 트리플의 엔티티-관계 사이에 공유되는 엔티티 설명과 관계 이름을 구성하는 단어를 포함하는 부가 공유 정보를 활용하여 새로운 엔티티와 관계에 대한 귀납적 벡터 표현을 생성함으로써, 기존 지식 그래프의 학습 과정에서 보지 못했던 새로운 엔티티와 관계에 대한 지식 표현을 재학습없이 지식으로서의 타당성을 검증할 수 있는 제로샷 지식 그래프 완성 방법 및 장치를 제공한다.The present embodiments generate an inductive vector representation of new entities and relationships by utilizing additional shared information including words constituting the relationship names and entity descriptions shared between the entity-relationships in the knowledge graph and the entity-relationships of the new triple. By doing so, a method and apparatus for completing a zero-shot knowledge graph that can verify the validity of knowledge expressions for new entities and relationships that have not been seen in the learning process of the existing knowledge graph as knowledge without re-learning are provided.

Description

멀티 홉 이웃을 이용한 제로샷 지식 그래프 완성 방법 및 장치 {Method and Apparatus for Completing Zero-Shot Knowledge Graph Using Multi-Hop Neighborhoods}Method and Apparatus for Completing Zero-Shot Knowledge Graph Using Multi-Hop Neighborhoods

본 발명이 속하는 기술 분야는 컨볼루션 학습 기반의 제로샷 지식 그래프 완성 방법 및 장치에 관한 것이다.The technical field to which the present invention pertains relates to a method and apparatus for completing a zero-shot knowledge graph based on convolutional learning.

이 부분에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.The content described in this section merely provides background information for the present embodiment and does not constitute the prior art.

지식 그래프는 효과적인 데이터 모델링 중 하나이다. 지식 그래프는 엔티티 모호성, 질의 응답, 정보 검색 등의 다양한 어플리케이션에서 중요하게 활용되고 있다. A knowledge graph is one of the effective data modeling methods. The knowledge graph is being used importantly in various applications such as entity ambiguity, question and answer, and information retrieval.

지식 그래프는 팩트(fact)이라 불리는 트리플 <h,r,t>의 집합으로 구성되며, 헤드 엔티티 h와 테일 엔티티 t는 의미적 관계 r로 연결되어 있다. 지식 그래프는 개방형 연계 데이터(Linked Open Data)와 같은 거대한 이종의 소스 지식들을 통합하고 상호 운용을 가능하게 한다. The knowledge graph is composed of a set of triples <h,r,t> called facts, and the head entity h and the tail entity t are connected by a semantic relationship r. The knowledge graph integrates and interoperates with vastly disparate sources of knowledge, such as Linked Open Data.

예컨대, DBpedia, WikiData, Freebase, WordNet, 및 Google Knowledge Graph와 같은 다양한 지식 그래프들이 생성되었다. 이러한 지식 그래프들은 많은 정보들이 누락되거나 부정확하므로, 아직까지는 실세계에서 적극적으로 활용하는데 한계가 있다. For example, various knowledge graphs such as DBpedia, WikiData, Freebase, WordNet, and Google Knowledge Graph have been created. Since a lot of information is missing or inaccurate in these knowledge graphs, there is still a limit to being actively utilized in the real world.

지식 그래프에 관한 최신의 기술들은 엔티티 및 관계 집합이 고정된 정적 지식 그래프에 대해서만 학습한다. 실제 시나리오와 관계는 시간이 지남에 따라 엔티티를 지속적으로 추가/제거/변경을 수행한다.State-of-the-art knowledge graphs learn only from static knowledge graphs in which a set of entities and relationships is fixed. Real-world scenarios and relationships constantly add/remove/change entities over time.

한국등록특허공보 제10-1914853호 (2018.10.29)Korean Patent Publication No. 10-1914853 (2018.10.29)

본 발명의 실시예들은 제로샷 트리플 추론을 지원하는 귀납적(Inductive) 표현 학습에 관한 것으로, 지식 그래프 내 엔티티-관계와 새로운 트리플의 엔티티-관계 사이에 공유되는 엔티티 설명과 관계 이름을 구성하는 단어를 포함하는 부가 공유 정보를 활용하여 새로운 엔티티와 관계에 대한 귀납적 벡터 표현을 생성함으로써, 기존 지식 그래프의 학습 과정에서 보지 못했던 새로운 엔티티와 관계에 대한 지식 표현을 재학습없이 지식으로서의 타당성을 검증하고, 진화하는 엔티티와 관계를 일반화하고, 제로샷 지식 그래프를 확장하는 데 주된 목적이 있다.Embodiments of the present invention relate to inductive expression learning supporting zero-shot triple inference, wherein the word constituting the relationship name and the entity description shared between the entity-relationships in the knowledge graph and the entity-relationships of the new triple By generating an inductive vector expression for new entities and relationships using the included additional shared information, the knowledge expression for new entities and relationships that have not been seen in the learning process of the existing knowledge graph is validated as knowledge without re-learning, and evolution Its main purpose is to generalize the entities and relationships that

본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 수 있다.Other objects not specified in the present invention may be additionally considered within the scope that can be easily inferred from the following detailed description and effects thereof.

본 실시예의 일 측면에 의하면, 컴퓨팅 디바이스에 의한 제로샷 지식 그래프 완성 방법에 있어서, 지식 그래프에서 공유되는 부가 공유 정보를 이용하여 특정 관계 특징 정보를 추출하는 단계, 상기 지식 그래프에서 멀티 홉 이웃 관계에 있는 상기 특정 관계 특징 정보로부터 제로샷 트리플에 관한 종합 특징 정보를 생성하는 단계, 및 상기 종합 특징 정보의 타당성 점수를 산출하는 단계를 포함하는 제로샷 지식 그래프 완성 방법을 제공한다.According to an aspect of this embodiment, in a zero-shot knowledge graph completion method by a computing device, extracting specific relationship characteristic information using additional shared information shared in the knowledge graph, the multi-hop neighbor relationship in the knowledge graph There is provided a zero-shot knowledge graph completion method comprising the steps of generating comprehensive feature information on a zero-shot triple from the specific relational feature information, and calculating a validity score of the comprehensive feature information.

본 실시예의 다른 측면에 의하면, 하나 이상의 프로세서 및 상기 하나 이상의 프로세서에 의해 실행되는 하나 이상의 프로그램을 저장하는 메모리를 포함하는 제로샷 지식 그래프 완성 장치에 있어서, 상기 프로세서는 지식 그래프에서 공유되는 부가 공유 정보를 이용하여 특정 관계 특징 정보를 추출하고, 상기 프로세서는 상기 지식 그래프에서 멀티 홉 이웃 관계에 있는 상기 특정 관계 특징 정보로부터 제로샷 트리플에 관한 종합 특징 정보를 생성하고, 상기 프로세서는 상기 종합 특징 정보의 타당성 점수를 산출하는 것을 특징으로 하는 제로샷 지식 그래프 완성 장치를 제공한다.According to another aspect of this embodiment, in the zero-shot knowledge graph completion apparatus including one or more processors and a memory for storing one or more programs executed by the one or more processors, the processor includes additional shared information shared in the knowledge graph extracting specific relational characteristic information using , and the processor generates comprehensive characteristic information about a zero-shot triple from the specific relational characteristic information in a multi-hop neighbor relationship in the knowledge graph, and the processor generates the comprehensive characteristic information of the comprehensive characteristic information. It provides a zero-shot knowledge graph completion device, characterized in that for calculating a validity score.

이상에서 설명한 바와 같이 본 발명의 실시예들에 의하면, 지식 그래프 내 엔티티-관계와 새로운 트리플의 엔티티-관계 사이에 공유되는 엔티티 설명과 관계 이름을 구성하는 단어를 포함하는 부가 공유 정보를 활용하여 새로운 엔티티와 관계에 대한 귀납적 벡터 표현을 생성함으로써, 기존 지식 그래프의 학습 과정에서 보지 못했던 새로운 엔티티와 관계에 대한 지식 표현을 재학습없이 지식으로서의 타당성을 검증할 수 있는 효과가 있다.As described above, according to the embodiments of the present invention, the entity-relationship in the knowledge graph and the entity-relationship of the new triple are shared between the entity description and the additional shared information including the word constituting the relationship name to create new By generating an inductive vector representation of entities and relationships, there is an effect of verifying the validity of knowledge representations about new entities and relationships that have not been seen in the learning process of existing knowledge graphs as knowledge without re-learning.

여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급된다.Even if it is an effect not explicitly mentioned herein, the effects described in the following specification expected by the technical features of the present invention and their potential effects are treated as if they were described in the specification of the present invention.

도 1은 본 발명의 일 실시예에 따른 제로샷 지식 그래프 완성 장치를 예시한 블록도이다.
도 2는 본 발명의 다른 실시예에 따른 제로샷 지식 그래프 완성 방법을 예시한 흐름도이다.
도 3은 본 발명의 다른 실시예에 따른 제로샷 지식 그래프 완성 방법의 각 동작을 예시한 도면이다.
도 4는 본 발명의 다른 실시예에 따른 제로샷 지식 그래프 완성 방법이 처리하는 지식 그래프를 예시한 도면이다.
도 5는 본 발명의 다른 실시예에 따른 제로샷 지식 그래프 완성 방법이 특정 관계 특징 정보를 추출하는 동작을 예시한 도면이다.
도 6은 본 발명의 다른 실시예에 따른 제로샷 지식 그래프 완성 방법이 단어 임베딩을 수행하는 동작을 예시한 도면이다.
도 7은 본 발명의 다른 실시예에 따른 제로샷 지식 그래프 완성 방법이 어텐션 기반의 컨볼루션을 수행하는 동작을 예시한 도면이다.
도 8은 본 발명의 다른 실시예에 따른 제로샷 지식 그래프 완성 방법이 유형 매칭을 수행하는 동작을 예시한 도면이다.
도 9는 본 발명의 다른 실시예에 따른 제로샷 지식 그래프 완성 방법이 멀티 홉 이웃 관계에 있는 특정 관계 특징 정보로부터 종합 특징 정보를 생성하는 동작을 예시한 도면이다.
도 10은 본 발명의 다른 실시예에 따른 제로샷 지식 그래프 완성 방법이 셀프 어텐션을 적용하여 종합 특징 정보를 생성하는 동작을 예시한 도면이다.
1 is a block diagram illustrating an apparatus for completing a zero-shot knowledge graph according to an embodiment of the present invention.
2 is a flowchart illustrating a zero-shot knowledge graph completion method according to another embodiment of the present invention.
3 is a diagram illustrating each operation of a zero-shot knowledge graph completion method according to another embodiment of the present invention.
4 is a diagram illustrating a knowledge graph processed by a zero-shot knowledge graph completion method according to another embodiment of the present invention.
5 is a diagram illustrating an operation of extracting specific relational characteristic information by a zero-shot knowledge graph completion method according to another embodiment of the present invention.
6 is a diagram illustrating an operation of performing word embedding in a zero-shot knowledge graph completion method according to another embodiment of the present invention.
7 is a diagram illustrating an operation of performing an attention-based convolution in a zero-shot knowledge graph completion method according to another embodiment of the present invention.
8 is a diagram illustrating an operation of performing type matching in a zero-shot knowledge graph completion method according to another embodiment of the present invention.
9 is a diagram illustrating an operation in which a zero-shot knowledge graph completion method according to another embodiment of the present invention generates comprehensive feature information from specific relationship feature information in a multi-hop neighbor relationship.
10 is a diagram illustrating an operation of generating comprehensive feature information by applying self-attention in a zero-shot knowledge graph completion method according to another embodiment of the present invention.

이하, 본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하고, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다.Hereinafter, in the description of the present invention, if it is determined that the subject matter of the present invention may be unnecessarily obscured as it is obvious to those skilled in the art with respect to related known functions, the detailed description thereof will be omitted, and some embodiments of the present invention will be described. It will be described in detail with reference to exemplary drawings.

도 1은 본 발명의 일 실시예에 따른 제로샷 지식 그래프 완성 장치를 예시한 블록도이다.1 is a block diagram illustrating an apparatus for completing a zero-shot knowledge graph according to an embodiment of the present invention.

제로샷 지식 그래프 완성 장치(110)는 적어도 하나의 프로세서(120), 컴퓨터 판독 가능한 저장매체(130) 및 통신 버스(170)를 포함한다. The zero-shot knowledge graph completion device 110 includes at least one processor 120 , a computer-readable storage medium 130 , and a communication bus 170 .

프로세서(120)는 제로샷 지식 그래프 완성 장치(110)로 동작하도록 제어할 수 있다. 예컨대, 프로세서(120)는 컴퓨터 판독 가능한 저장 매체(130)에 저장된 하나 이상의 프로그램들을 실행할 수 있다. 하나 이상의 프로그램들은 하나 이상의 컴퓨터 실행 가능 명령어를 포함할 수 있으며, 컴퓨터 실행 가능 명령어는 프로세서(120)에 의해 실행되는 경우 제로샷 지식 그래프 완성 장치(110)로 하여금 예시적인 실시예에 따른 동작들을 수행하도록 구성될 수 있다.The processor 120 may control to operate as the zero-shot knowledge graph completion device 110 . For example, the processor 120 may execute one or more programs stored in the computer-readable storage medium 130 . The one or more programs may include one or more computer-executable instructions, which, when executed by the processor 120 , cause the zero-shot knowledge graph completion apparatus 110 to perform operations according to the exemplary embodiment. can be configured to

컴퓨터 판독 가능한 저장 매체(130)는 컴퓨터 실행 가능 명령어 내지 프로그램 코드, 프로그램 데이터 및/또는 다른 적합한 형태의 정보를 저장하도록 구성된다. 컴퓨터 판독 가능한 저장 매체(130)에 저장된 프로그램(140)은 프로세서(120)에 의해 실행 가능한 명령어의 집합을 포함한다. 일 실시예에서, 컴퓨터 판독한 가능 저장 매체(130)는 메모리(랜덤 액세스 메모리와 같은 휘발성 메모리, 비휘발성 메모리, 또는 이들의 적절한 조합), 하나 이상의 자기 디스크 저장 디바이스들, 광학 디스크 저장 디바이스들, 플래시 메모리 디바이스들, 그 밖에 지식 그래프 완성 장치(110)에 의해 액세스되고 원하는 정보를 저장할 수 있는 다른 형태의 저장 매체, 또는 이들의 적합한 조합일 수 있다.Computer-readable storage medium 130 is configured to store computer-executable instructions or program code, program data, and/or other suitable form of information. The program 140 stored in the computer-readable storage medium 130 includes a set of instructions executable by the processor 120 . In one embodiment, the computer-readable storage medium 130 includes memory (volatile memory, such as random access memory, non-volatile memory, or a suitable combination thereof), one or more magnetic disk storage devices, optical disk storage devices, It may be flash memory devices, other types of storage media that can be accessed by the knowledge graph completion apparatus 110 and store desired information, or a suitable combination thereof.

통신 버스(170)는 프로세서(120), 컴퓨터 판독 가능한 저장 매체(140)를 포함하여 제로샷 지식 그래프 완성 장치(110)의 다른 다양한 컴포넌트들을 상호 연결한다.The communication bus 170 interconnects various other components of the zero-shot knowledge graph completion apparatus 110 including the processor 120 and the computer-readable storage medium 140 .

제로샷 지식 그래프 완성 장치(110)는 또한 하나 이상의 입출력 장치를 위한 인터페이스를 제공하는 하나 이상의 입출력 인터페이스(150) 및 하나 이상의 통신 인터페이스(160)를 포함할 수 있다. 입출력 인터페이스(150) 및 통신 인터페이스(160)는 통신 버스(170)에 연결된다. 입출력 장치는 입출력 인터페이스(150)를 통해 제로샷 지식 그래프 완성 장치(110)의 다른 컴포넌트들에 연결될 수 있다.The zero-shot knowledge graph completion device 110 may also include one or more input/output interfaces 150 and one or more communication interfaces 160 that provide interfaces for one or more input/output devices. The input/output interface 150 and the communication interface 160 are connected to the communication bus 170 . The input/output device may be connected to other components of the zero-shot knowledge graph completion device 110 through the input/output interface 150 .

제로샷 지식 그래프 완성 장치(110)는 제로샷 트리플 추론을 지원하는 귀납적(Inductive) 표현 학습에 관한 것으로, 지식 그래프 내 엔티티-관계와 새로운 트리플의 엔티티-관계 사이에 공유되는 엔티티 설명과 관계 이름을 구성하는 단어를 포함하는 부가 공유 정보를 활용하여 새로운 엔티티와 관계에 대한 귀납적 벡터 표현을 생성함으로써, 기존 지식 그래프의 학습 과정에서 보지 못했던 새로운 엔티티와 관계에 대한 지식 표현을 재학습없이 지식으로서의 타당성(Plausibility)을 검증하고, 진화하는 엔티티와 관계를 일반화하고, 제로샷 지식 그래프를 확장할 수 있다.The zero-shot knowledge graph completion device 110 relates to inductive expression learning supporting zero-shot triple inference, and the entity description and relationship name shared between the entity-relationship in the knowledge graph and the entity-relationship of the new triple By generating an inductive vector expression for new entities and relationships by using additional shared information including constituting words, the knowledge expression for new entities and relationships that have not been seen in the learning process of the existing knowledge graph can be used as knowledge without re-learning. Plausibility), generalize evolving entities and relationships, and extend zero-shot knowledge graphs.

지식 그래프는 엔티티와 관련된 실세계의 사실을 구조화하고 기계 이해를 위해 사실을 유기적으로 연결하는 데이터 모델이다. 지식 그래프 내 각각의 사실은 일반적으로 방향성을 지닌 엣지(Edge)인 관계(Relationship) <h,r,t>로 표현되며, 노드(Node)인 헤드 엔티티 h와 테일 엔티티 t는 엣지 타입인 의미적 관계(Semantic Relation)를 통해 서로 연결된다.A knowledge graph is a data model that structures real-world facts related to entities and organically connects them for machine understanding. Each fact in the knowledge graph is generally expressed as a relation <h,r,t>, which is an edge with directionality, and a head entity h and a tail entity t, which are nodes, are semantic which is an edge type. They are connected to each other through a Semantic Relation.

링크 예측과 트리플 분류를 수행하는 지식 그래프 완성에서 지식 그래프 임베딩(KGE, Knowledge Graph Embedding)은 엔티티-관계 수준에서의 구조적 정보를 저차원 벡터로 표현되는 태스크 기반의 잠재 특징으로 변환한다.In knowledge graph completion that performs link prediction and triple classification, Knowledge Graph Embedding (KGE) transforms structural information at the entity-relationship level into task-based latent features expressed as low-dimensional vectors.

링크 예측은 사실 <h,r,t>에서 두 개의 요소가 주어지면(예를 들어 <?,r,t>, <h,?,t>, <h,r,?>), ?에 대한 엔티티 또는 관계 후보(예컨대, h, r, t)들에 대해 후보 사실을 평가하여 타당성 점수를 측정한다. 가장 높은 타당성 점수를 생산하는 ?를 결정한다.Link prediction is in fact given two elements in <h,r,t> (e.g. <?,r,t>, <h,?,t>, <h,r,?>) for ? A validity score is measured by evaluating candidate facts for entity or relationship candidates (eg, h, r, t). Determine the ? that produces the highest plausibility score.

트리플 분류는 학습 데이터 세트에서 보지 못한 사실이 유효한지 아닌지를 사전에 학습한 특정 관계 임계치를 기반으로 체크한다. 지식 그래프 완성은 지식 그래프 내 존재하는 사실의 전체적인 타당성 점수를 최대화하면서 학습을 수행한다. 주어진 사실의 타당성 점수에 기반하여, 지식 그래프 완성 태스크는 불완전하고 노이즈가 많은 지식 그래프를 정제할 수 있다.Triple classification checks whether facts not seen in the training data set are valid or not based on a specific relational threshold learned in advance. Knowledge graph completion performs learning while maximizing the overall validity score of the facts present in the knowledge graph. Based on the validity score of a given fact, the knowledge graph completion task can refine the incomplete and noisy knowledge graph.

기존의 지식 그래프 기술이 엔티티 및 관계 집합이 고정된 정적 지식 그래프에 대해서만 학습 가능한 문제를 해결하기 위해서, 본 실시예에 따른 제로샷 지식 그래프 완성 장치는 기존의 지식 그래프와 새로운(unseen) 트리플 사이의 공유되는 부가 정보로부터 새로운 엔티티와 관계가 포함된 트리플을 일반화하고 임베딩 벡터 표현을 귀납적(Inductive)으로 생성한다.In order to solve the problem that the existing knowledge graph technology can learn only for the static knowledge graph in which the entity and the relationship set are fixed, the zero-shot knowledge graph completion apparatus according to the present embodiment is provided between the existing knowledge graph and the new (unseen) triple. From the shared side information, we generalize a triple containing new entities and relationships, and inductively generate an embedding vector representation.

트리플에서 관계는 헤드 엔티티와 테일 엔티티의 유형을 제약하는 부가 정보를 포함하는 것을 고려하여, 제로샷 지식 그래프 완성 장치는 관계의 부가 정보인 엔티티 유형 제약사항과 관계 이름을 활용하여 엔티티의 설명, 유형, 이름으로부터 트리플의 특징 정보를 추출한다. 정교한 수준의 판단력을 가진 임베딩 벡터 표현을 생성하기 위해서 이웃 트리플 특징 정보를 수집하는 과정에서 이웃 트리플의 중요도에 따라 불필요한 정보를 최소화하면서 중요한 정보에 집중하여 수집한다. 즉, 그래프의 이웃 트리플에 어텐션 메커니즘을 적용하고, 관계의 유형 제약사항을 기반으로 이웃 정보를 전파하여 불필요한 정보 수집을 최소화한다.Considering that the relationship in the triple includes additional information constraining the types of the head entity and the tail entity, the zero-shot knowledge graph completion device utilizes the entity type constraint and relationship name, which are additional information of the relationship, to describe and type the entity. , extract the characteristic information of the triple from the name. In order to generate an embedding vector expression with a sophisticated level of judgment, in the process of collecting feature information of a neighboring triple, it is collected while minimizing unnecessary information according to the importance of a neighboring triple. That is, the attention mechanism is applied to the neighboring triples of the graph, and the neighbor information is propagated based on the type constraint of the relationship to minimize unnecessary information collection.

도 2는 본 발명의 다른 실시예에 따른 제로샷 지식 그래프 완성 방법을 예시한 흐름도이고, 도 3은 제로샷 지식 그래프 완성 방법의 각 동작을 예시한 도면이고, 도 4는 제로샷 지식 그래프 완성 방법이 처리하는 지식 그래프를 예시한 도면이다. 제로샷 지식 그래프 완성 방법은 컴퓨팅 디바이스 또는 제로샷 지식 그래프 완성 장치에 의하여 수행될 수 있다.2 is a flowchart illustrating a zero-shot knowledge graph completion method according to another embodiment of the present invention, FIG. 3 is a diagram illustrating each operation of the zero-shot knowledge graph completion method, and FIG. 4 is a zero-shot knowledge graph completion method It is a figure which exemplifies the knowledge graph to be processed. The zero-shot knowledge graph completion method may be performed by a computing device or a zero-shot knowledge graph completion apparatus.

단계 S210에서 프로세서는 지식 그래프를 획득한다. 지식 그래프는 자원 기술 프레임워크(Resource Description Framework, RDF) 규격을 만족하도록 정의될 수 있다. 도 3의 (a)는 획득된 지식 그래프를 예시한다.In step S210, the processor obtains a knowledge graph. The knowledge graph may be defined to satisfy a Resource Description Framework (RDF) standard. 3A illustrates an acquired knowledge graph.

단계 S220에서 프로세서는 지식 그래프에서 공유되는 부가 공유 정보를 이용하여 특정 관계 특징 정보를 추출한다. 단계 S220에서 프로세서는 (i) 관계 이름과 유형 제약사항을 포함하는 관계 정보 및 (ii) 엔티티 설명과 유형을 포함하는 엔티티 정보의 부가 공유 정보를 이용하여 특정 관계 특징 정보를 추출한다. 도 3의 (b)는 지식 그래프에서 추출된 특정 관계 특징 정보를 예시한다.In step S220, the processor extracts specific relational characteristic information by using the additional shared information shared in the knowledge graph. In step S220, the processor extracts specific relationship characteristic information using (i) relationship information including relationship name and type constraints and (ii) additional shared information of entity information including entity description and type. 3B illustrates specific relational characteristic information extracted from the knowledge graph.

단계 S230에서 프로세서는 지식 그래프에서 멀티 홉 이웃 관계에 있는 특정 관계 특징 정보로부터 제로샷 트리플에 관한 종합 특징 정보를 생성한다. 도 3의 (c)는 멀티 홉 이웃 관계를 기반으로 생성된 종합 특징 정보를 예시한다.In step S230, the processor generates comprehensive feature information about the zero-shot triple from specific relationship feature information in a multi-hop neighbor relationship in the knowledge graph. 3( c ) exemplifies comprehensive feature information generated based on the multi-hop neighbor relationship.

단계 S240에서 프로세서는 종합 특징 정보의 타당성 점수를 산출한다. 도 3의 (d)는 풀리 커넥티드 레이어 기반의 모델을 통해 산출된 점수를 예시한다.In step S240, the processor calculates a validity score of the comprehensive feature information. 3D illustrates a score calculated through a model based on a fully connected layer.

도 4의 지식 그래프를 참조하면, 헤드 엔티티(ex. Harvard_University) 및 테일 엔티티 (ex. Massachusetts)는 설명 및 복수의 유형과 같은 다양한 부가 정보를 갖는다. 관계 이름(ex. State) 및 유형 제약사항(ex. Thing, PopulatedPlace)는 사실 <Harvard_University, State, Massachusetts>에 대한 연관 설명을 획득하기 위한 정보를 제공한다. 제로샷 지식 그래프 완성 방법은 지식 그래프의 사실 간에 공유하는 부가 공유 정보로부터 특정 관계 특징 정보를 추출한다. 제로샷 시나리오에서 대상 사실 <h, r, t>은 기존의 지식 그래프에 속하지 않는 엔티티-관계와 기존의 지식 그래프에 속하는 적어도 하나의 엔티티를 포함하는 것으로 가정한다. 사실 벡터는 특징 정보로부터 귀납적으로 생성된다. Referring to the knowledge graph of FIG. 4 , a head entity (ex. Harvard_University) and a tail entity (ex. Massachusetts) have various additional information such as description and a plurality of types. The relationship name (ex. State) and type constraint (ex. Thing, PopulatedPlace) actually provides information for obtaining the associated description for <Harvard_University, State, Massachusetts>. The zero-shot knowledge graph completion method extracts specific relational characteristic information from additional shared information shared between facts of the knowledge graph. In the zero-shot scenario, it is assumed that the target fact <h, r, t> includes an entity-relationship not belonging to the existing knowledge graph and at least one entity belonging to the existing knowledge graph. In fact, vectors are generated inductively from feature information.

이하에서는 도 5 내지 도 8을 참조하여 특정 관계 특징 정보를 생성하는 동작을 설명하기로 한다.Hereinafter, an operation of generating specific relational characteristic information will be described with reference to FIGS. 5 to 8 .

도 5는 제로샷 지식 그래프 완성 방법이 특정 관계 특징 정보를 추출하는 동작을 예시한 도면이다.5 is a diagram illustrating an operation of extracting specific relational characteristic information by a zero-shot knowledge graph completion method.

대부분의 지식 그래프 완성 모델은 학습을 위한 유일한 벡터 표현을 가지므로, 새로운 엔티티-관계에 대한 새로운 임베딩을 생성하기 쉽지 않다.Since most knowledge graph completion models have unique vector representations for learning, it is not easy to create new embeddings for new entity-relationships.

프로세서는 단어 임베딩, 어텐션 기반의 컨볼루션, 및 유형 매칭을 통해 각각의 트리플에 대한 헤드 엔티티-관계 벡터와 테일 엔티티-관계 벡터로부터 특정 관계 특징 정보를 추출한다.The processor extracts specific relation characteristic information from the head entity-relation vector and the tail entity-relation vector for each triple through word embedding, attention-based convolution, and type matching.

도 6은 제로샷 지식 그래프 완성 방법이 단어 임베딩을 수행하는 동작을 예시한 흐름도이다. 6 is a flowchart illustrating an operation in which the zero-shot knowledge graph completion method performs word embedding.

제로샷 지식 그래프 완성 방법은 단어 임베딩을 통해 단어를 상징적 표현(Symbolic Representation)으로 변환한다. 대부분의 관계 이름은 어휘 집합에 존재하지 않으므로, 관계 이름을 동일한 어휘 집합에 의해 공유되는 단어 수준으로 인코딩한다. The zero-shot knowledge graph completion method converts words into symbolic representations through word embeddings. Since most relationship names do not exist in the lexicon, we encode the relationship names at the word level shared by the same lexical set.

단계 S610에서 프로세서는 관계 이름을 엔티티 설명과 공유되는 단어 집합으로 나눈다. 사실에서 관계와 두 엔티티 간의 상관 관계는 이름과 설명으로부터 획득될 수 있다. 단어 수준의 관계 모델링은 기존의 지식 그래프에 속하지 않는 관계를 포함하는 사실의 타당성을 예측하기 위해, 상관 관계로부터 기존의 지식 그래프에 속하지 않는 관계를 처리한다.In step S610, the processor divides the relationship name into a set of words shared with the entity description. In fact, a relationship and a correlation between two entities can be obtained from the name and description. Relational modeling at the word level processes relationships that do not belong to the existing knowledge graph from correlation in order to predict the validity of facts including relationships that do not belong to the existing knowledge graph.

단계 S620에서 프로세서는 각 단어에 대해서 품사 분석(Lemmaitzation) 대신에 단어의 약어(Abbreviation)를 중심으로 순차적으로 형태소 분석(Stemming)을 수행한다. In step S620, the processor sequentially performs stemming for each word focusing on the abbreviation of the word instead of the part-of-speech analysis (lemmaitzation).

단계 S630에서 프로세서는 단어를 동일한 어휘 집합에 의해 공유되는 단어 수준으로 인코딩한다. 엔티티 관련 정보는 엔티티 설명과 유형을 포함하고, 엔티티 설명에 포함된 단어 집합과 복수의 유형에 포함된 단어 집합은 상징적 표현을 나타낸다. 관계 정보는 관계 이름과 유형 제약사항을 포함하고, 유형 제약사항은 정의역(Domain)과 치역(Range)을 포함한다. 정의역(Domain)과 치역(Range)은 자원 기술 프레임워크에 의해 정의된다.In step S630, the processor encodes the word into a word level shared by the same vocabulary set. The entity-related information includes an entity description and a type, and a word set included in the entity description and a word set included in the plurality of types represent symbolic expressions. The relationship information includes a relationship name and type constraint, and the type constraint includes a domain and a range. Domain and Range are defined by the resource description framework.

각 단어는 임베딩 매트릭스

Figure 112019106016312-pat00001
의 d 차원 벡터 표현으로 인코딩된다. |w|는 어휘 집합의 크기이다.Each word has an embedding matrix
Figure 112019106016312-pat00001
is encoded as a d-dimensional vector representation of |w| is the size of the vocabulary set.

도 7은 제로샷 지식 그래프 완성 방법이 어텐션 기반의 컨볼루션을 수행하는 동작을 예시한 흐름도이다.7 is a flowchart illustrating an operation in which the zero-shot knowledge graph completion method performs attention-based convolution.

제로샷 지식 그래프 완성 방법은 어텐션 기반의 컨볼루션 모델을 통해 특정 관계 특징 정보를 생성한다. The zero-shot knowledge graph completion method generates specific relational characteristic information through an attention-based convolution model.

컨볼루션 모델은 컨볼루션 필터를 적용하여 특징 벡터를 추출하는 레이어를 포함한다. 레이어는 특징을 추출하는 컨볼루션 레이어(Convolution Layer)와 대표 특징을 선택하여 서브 샘플링을 수행하는 맥스 풀링 레이어(Max Pooling Layer)를 포함할 수 있다. 컨볼루션 모델은 컨볼루션 필터를 공유할 수 있고, 레이어는 파라미터를 포함할 수 있고, 레이어의 파라미터는 학습가능한 필터 집합을 포함한다. 파라미터는 노드 간의 가중치(ω) 및/또는 바이어스(b)를 포함할 수 있다.A convolution model includes a layer that extracts feature vectors by applying a convolution filter. The layer may include a convolution layer for extracting features and a max pooling layer for performing subsampling by selecting representative features. Convolutional models may share convolutional filters, layers may include parameters, and parameters of a layer include a set of learnable filters. The parameter may include a weight (ω) and/or a bias (b) between nodes.

단계 S710에서 프로세서는 임베딩 룩업을 통해 엔티티 설명의 단어 벡터를 엔티티 설명 매트릭스로 변환하고, 관계 이름의 단어 벡터를 관계 이름 매트릭스로 변환하고, 유형 제약사항의 단어 벡터를 유형 제약사항 매트릭스로 변환한다. 임베딩 룩업 테이블은 리스트 형태로 담긴 데이터를 입력받는 인덱스에 따라 룩업해서 사용한다.In step S710, the processor transforms the word vector of the entity description into the entity description matrix through the embedding lookup, the word vector of the relationship name into the relationship name matrix, and the word vector of the type constraint into the type constraint matrix. The embedding lookup table is used by looking up data in the form of a list according to the index it receives.

단계 S720에서 프로세서는 엔티티 설명 매트릭스에 관계 이름 매트릭스 및 유형 제약사항 매트릭스를 기준으로 어텐션 가중치를 적용한다. 프로세서는 관계 이름 매트릭스와 유형 제약사항 매트릭스를 결합하고 어텐션 기반의 컨볼루션 모델로 전달한다. 어텐션 매트릭스는 수학식 1과 같이 표현된다.In step S720, the processor applies an attention weight to the entity description matrix based on the relationship name matrix and the type constraint matrix. The processor combines the relationship name matrix and the type constraint matrix and passes it to the attention-based convolution model. The attention matrix is expressed as Equation (1).

Figure 112019106016312-pat00002
Figure 112019106016312-pat00002

A는 어텐션 매트릭스이고, W는 가중치 매트릭스이다. D'h는 컨볼루션 결과이다.A is the attention matrix, and W is the weight matrix. D' h is the convolution result.

추출된 특정 관계 특징 벡터는 수학식 2와 같이 표현된다. 프로세서는 헤드 엔티티-관계에 관한 특정 관계 특징 벡터와 테일 엔티티-관계에 관한 특정 관계 특징 벡터를 결합한다.The extracted specific relational feature vector is expressed as Equation (2). The processor combines the specific relational feature vector for the head entity-relationship and the specific relational feature vector for the tail entity-relationship.

Figure 112019106016312-pat00003
Figure 112019106016312-pat00003

도 8은 제로샷 지식 그래프 완성 방법이 유형 매칭을 수행하는 동작을 예시한 흐름도이다.8 is a flowchart illustrating an operation in which the zero-shot knowledge graph completion method performs type matching.

제로샷 지식 그래프 완성 방법은 유형 매칭을 통해 헤드 엔티티-관계 벡터와 테일 엔티티-관계 벡터에 대한 사실 표현의 유효성을 판단한다. 유형은 타당성의 범위를 줄이는데 사용된다.The zero-shot knowledge graph completion method determines the validity of the fact expression for the head entity-relation vector and the tail entity-relation vector through type matching. Types are used to narrow the scope of validity.

단계 S810에서 프로세서는 마스크를 통해 유형 제약사항 중에서 정의역(Domain)과 헤드 엔티티의 유형을 핫벡터로 변환하고 비교한 헤드 엔티티-관계 유효성(Validity)을 산출하고, 유형 제약사항 중에서 치역(Range)과 테일 엔티티의 유형을 핫벡터로 변환하고 비교한 테일 엔티티-관계 유효성을 산출한다. In step S810, the processor converts the types of the domain and the head entity into a hot vector among the type constraints through the mask and calculates the compared head entity-relationship validity (Validity), and the range and Convert the type of the tail entity to a hot vector and compute the compared tail entity-relationship validity.

단계 S810에서 프로세서는 헤드 엔티티-관계 유효성 및 테일 엔티티-관계 유효성을 특정 관계 특징 정보에 적용한다. 유효성은 0 또는 1의 값으로 표현될 수 있다. 유효성이 적용된 특정 관계 특징 정보는 수학식 3과 같이 표현된다.In step S810, the processor applies the head entity-relationship validity and the tail entity-relationship validity to the specific relationship characteristic information. Validity can be expressed as a value of 0 or 1. Specific relational characteristic information to which validity is applied is expressed as in Equation (3).

Figure 112019106016312-pat00004
Figure 112019106016312-pat00004

이하에서는 도 9 및 도 10을 참조하여 종합 특징 정보를 생성하는 동작을 설명하기로 한다.Hereinafter, an operation of generating comprehensive feature information will be described with reference to FIGS. 9 and 10 .

도 9는 제로샷 지식 그래프 완성 방법이 멀티 홉 이웃 관계에 있는 특정 관계 특징 정보로부터 종합 특징 정보를 생성하는 동작을 예시한 도면이고, 도 10은 제로샷 지식 그래프 완성 방법이 셀프 어텐션을 적용하여 종합 특징 정보를 생성하는 동작을 예시한 도면이다.9 is a diagram illustrating an operation in which the zero-shot knowledge graph completion method generates comprehensive feature information from specific relationship feature information in a multi-hop neighbor relationship, and FIG. 10 is a zero-shot knowledge graph completion method synthesized by applying self-attention. It is a diagram illustrating an operation of generating characteristic information.

지식 그래프의 임의 구조로 인하여, 기존의 지식 그래프 완성 모델은 1 홉 이웃 또는 관계 경로 등의 지역 이웃 구조를 이용한다. 제로샷 지식 그래프 완성 방법은 전역 구조 정보를 엔티티-관계 임베딩에 추가할 수 있다.Due to the arbitrary structure of the knowledge graph, the existing knowledge graph completion model uses a local neighbor structure such as a one-hop neighbor or a relationship path. The zero-shot knowledge graph completion method can add global structural information to entity-relationship embeddings.

프로세서는 특정 관계 특징 정보를 멀티 홉 이웃 관계에 따른 전파 경로를 통해 누적하여 종합 특징 정보를 생성한다. 멀티 홉 이웃을 탐색할 때, 최대 깊이 K에 따른 깊이 검색을 수행한다. 종합 특징 정보에 대한 타당성 점수를 산출할 수 있다.The processor generates comprehensive feature information by accumulating specific relationship feature information through a propagation path according to a multi-hop neighbor relationship. When searching for a multi-hop neighbor, a depth search is performed according to the maximum depth K. A validity score for the comprehensive feature information may be calculated.

프로세서는 중요도가 높은 이웃의 특정 관계 특징 정보를 수집하기 위해서 특정 관계 특징 정보에 셀프 어텐션을 적용한다. The processor applies self-attention to specific relational characteristic information in order to collect specific relational characteristic information of a neighbor with high importance.

깊이 K를 갖는 사실 f hrti 에 대해서 수집 함수 AGGREGATEk는 사실 f hrti 의 특정 관계 사실 벡터

Figure 112019106016312-pat00005
를 획득한다. N fhrti 는 사실 f hrti 의 다양한 크기를 갖는 자식 사실 세트이다. f hrtj 는 사실 f hrti 의 하나의 자식 사실이다. Nhrti 특정 관계 사실 벡터 집합에 관한 매트릭스 표현이다. For a fact f hrti of depth K, the collection function AGGREGATE k is a relational fact vector of fact f hrti .
Figure 112019106016312-pat00005
to acquire N fhrti is in fact a set of child facts of varying sizes of f hrti . f hrtj is actually a child fact of f hrti . N hrti is a matrix representation of a particular set of relational fact vectors.

어텐션 메커니즘은 자식 사실들 Nfhrti의 특정 관계 사실 벡터 Nfhrti와 부모 사실 벡터 fhrti를 이용하여 어텐션 가중치를 산출한다. 각 자식 사실과 부모 사실 간의 관계는 수학식 4와 같이 표현된다.Attention Attention mechanism to calculate the weighted using the vector N fhrti fact that a particular relationship of the child with the parent N fhrti facts Facts vector f hrti. The relationship between each child fact and the parent fact is expressed as Equation (4).

Figure 112019106016312-pat00006
Figure 112019106016312-pat00006

어텐션 가중치 aij는 부모 사실 fhrti을 고려하면서 자식 사실들 Nfhrti에 결합된 자식 사실 f hrtj 의 중요도를 나타내고,

Figure 112019106016312-pat00007
의 합을 1로 만드는 소프트맥스 함수를 통해 N fhrti 의 어텐션 점수로부터 획득된다. 어텐션 점수는 수학식 5와 같이 표현된다.The attention weight a ij is the child fact f hrtj coupled to the child facts N fhrti while taking the parent fact f hrti into account. indicates the importance of
Figure 112019106016312-pat00007
It is obtained from the attention score of N fhrti through the softmax function that makes the sum of . The attention score is expressed as in Equation 5.

Figure 112019106016312-pat00008
Figure 112019106016312-pat00008

Wa와 wa는 동일한 깊이 K를 공유하는 수집 함수의 파라미터이다.W a and w a are parameters of the acquisition function that share the same depth K.

특정 관계 사실 벡터

Figure 112019106016312-pat00009
는 어텐션 가중치와 결합된다.specific relation fact vector
Figure 112019106016312-pat00009
is combined with the attention weight.

Figure 112019106016312-pat00010
Figure 112019106016312-pat00010

cfhrti는 부모 사실 f hrti 의 문맥 정보를 나타내는 결합 벡터이다. 수학식 7과 같이 문맥 정보 cfhrti는 부모 사실 벡터 f hrti 와 결합된다.c fhrti is an associative vector representing the contextual information of the parent fact f hrti . As shown in Equation 7, the context information c fhrti is combined with the parent fact vector f hrti.

Figure 112019106016312-pat00011
Figure 112019106016312-pat00011

Figure 112019106016312-pat00012
f hrti 의 문맥 기반 특정 관계 사실 벡터이다. 종합 특징 벡터가 생성될 때까지 깊이 탐색을 수행하고, 경파 경로를 따라 특정 관계 사실 벡터 f hrti 를 문맥 기반 특정 관계 사실 벡터
Figure 112019106016312-pat00013
로 교체한다.
Figure 112019106016312-pat00012
is the context-specific relational fact vector of f hrti . A depth search is performed until a synthetic feature vector is generated, and the specific relational fact vector f hrti along the hard wave path is drawn into the context specific relational fact vector.
Figure 112019106016312-pat00013
replace with

Figure 112019106016312-pat00014
Figure 112019106016312-pat00014

프로세서는 타당성 점수를 산출한다. 프로세서는 풀리 커넥티드 레이어 기반의 점수 모델을 통해 제로샷 트리플에 대한 특정 관계 임계치를 만족하는지 여부를 평가한다.The processor calculates a plausibility score. The processor evaluates whether a certain relationship threshold for zero-shot triples is satisfied through a score model based on a fully connected layer.

지식 그래프 완성 방법은 사실의 타당성을 확인하기 위해 주어진 <h, r, t> 팩트에 점수를 매긴다. 후보 엔티티인 h 및 t 각각에 대해 점수화 함수로 <h, r, t> 팩트를 평가한다. The knowledge graph completion method scores the given <h, r, t> facts to check the validity of the facts. Evaluate the fact <h, r, t> as a scoring function for each of the candidate entities h and t.

제로샷 지식 그래프 완성 장치는 하드웨어, 펌웨어, 소프트웨어 또는 이들의 조합에 의해 로직회로 내에서 구현될 수 있고, 범용 또는 특정 목적 컴퓨터를 이용하여 구현될 수도 있다. 장치는 고정배선형(Hardwired) 기기, 필드 프로그램 가능한 게이트 어레이(Field Programmable Gate Array, FPGA), 주문형 반도체(Application Specific Integrated Circuit, ASIC) 등을 이용하여 구현될 수 있다. 또한, 장치는 하나 이상의 프로세서 및 컨트롤러를 포함한 시스템온칩(System on Chip, SoC)으로 구현될 수 있다.The zero-shot knowledge graph completion apparatus may be implemented in a logic circuit by hardware, firmware, software, or a combination thereof, or may be implemented using a general-purpose or special-purpose computer. The device may be implemented using a hardwired device, a field programmable gate array (FPGA), an application specific integrated circuit (ASIC), or the like. In addition, the device may be implemented as a system on chip (SoC) including one or more processors and controllers.

제로샷 지식 그래프 완성 장치는 하드웨어적 요소가 마련된 컴퓨팅 디바이스 또는 서버에 소프트웨어, 하드웨어, 또는 이들의 조합하는 형태로 탑재될 수 있다. 컴퓨팅 디바이스 또는 서버는 각종 기기 또는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신장치, 프로그램을 실행하기 위한 데이터를 저장하는 메모리, 프로그램을 실행하여 연산 및 명령하기 위한 마이크로프로세서 등을 전부 또는 일부 포함한 다양한 장치를 의미할 수 있다.The zero-shot knowledge graph completion apparatus may be mounted in the form of software, hardware, or a combination thereof on a computing device or server provided with hardware elements. A computing device or server is all or part of a communication device such as a communication modem for performing communication with various devices or a wired/wireless communication network, a memory for storing data for executing a program, and a microprocessor for executing operations and commands by executing the program It can mean a variety of devices, including

도 2, 도 6 내지 도 8에서는 각각의 과정을 순차적으로 실행하는 것으로 기재하고 있으나 이는 예시적으로 설명한 것에 불과하고, 이 분야의 기술자라면 본 발명의 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 도 2, 도 6 내지 도 8에 기재된 순서를 변경하여 실행하거나 또는 하나 이상의 과정을 병렬적으로 실행하거나 다른 과정을 추가하는 것으로 다양하게 수정 및 변형하여 적용 가능할 것이다.In Figures 2, 6 to 8, it is described as executing each process sequentially, but this is only an exemplary description, and if you are skilled in the art, in the range that does not depart from the essential characteristics of the embodiment of the present invention, Figure 2, It will be possible to apply various modifications and variations by changing the order described in FIGS. 6 to 8 , or executing one or more processes in parallel or adding other processes.

본 실시예들에 따른 동작은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능한 매체에 기록될 수 있다. 컴퓨터 판독 가능한 매체는 실행을 위해 프로세서에 명령어를 제공하는 데 참여한 임의의 매체를 나타낸다. 컴퓨터 판독 가능한 매체는 프로그램 명령, 데이터 파일, 데이터 구조 또는 이들의 조합을 포함할 수 있다. 예를 들면, 자기 매체, 광기록 매체, 메모리 등이 있을 수 있다. 컴퓨터 프로그램은 네트워크로 연결된 컴퓨터 시스템 상에 분산되어 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 본 실시예를 구현하기 위한 기능적인(Functional) 프로그램, 코드, 및 코드 세그먼트들은 본 실시예가 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있을 것이다.The operations according to the present embodiments may be implemented in the form of program instructions that can be performed through various computer means and recorded in a computer-readable medium. Computer-readable medium represents any medium that participates in providing instructions to a processor for execution. Computer-readable media may include program instructions, data files, data structures, or a combination thereof. For example, there may be a magnetic medium, an optical recording medium, a memory, and the like. A computer program may be distributed over a networked computer system to store and execute computer readable code in a distributed manner. Functional programs, codes, and code segments for implementing the present embodiment may be easily inferred by programmers in the technical field to which the present embodiment pertains.

본 실시예들은 본 실시예의 기술 사상을 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The present embodiments are for explaining the technical idea of the present embodiment, and the scope of the technical idea of the present embodiment is not limited by these embodiments. The protection scope of this embodiment should be interpreted by the following claims, and all technical ideas within the equivalent range should be interpreted as being included in the scope of the present embodiment.

Claims (14)

컴퓨팅 디바이스에 의한 제로샷 지식 그래프 완성 방법에 있어서,
지식 그래프에서 공유되는 부가 공유 정보를 이용하여 특정 관계 특징 정보를 추출하는 단계;
상기 지식 그래프에서 멀티 홉 이웃 관계에 있는 상기 특정 관계 특징 정보로부터 제로샷 트리플에 관한 종합 특징 정보를 생성하는 단계; 및
상기 종합 특징 정보의 타당성 점수를 산출하는 단계를 포함하며,
상기 타당성 점수를 산출하는 단계는, 풀리 커넥티드 레이어 기반의 점수 모델을 통해 상기 제로샷 트리플에 대한 특정 관계 임계치를 만족하는지 여부를 평가하는 것을 특징으로 하는 제로샷 지식 그래프 완성 방법.
In the zero-shot knowledge graph completion method by a computing device,
extracting specific relational characteristic information using additional shared information shared in the knowledge graph;
generating comprehensive feature information on a zero-shot triple from the specific relationship feature information in a multi-hop neighbor relationship in the knowledge graph; and
Comprising the step of calculating the validity score of the comprehensive feature information,
The calculating of the validity score comprises evaluating whether or not a specific relation threshold for the zero-shot triple is satisfied through a score model based on a fully connected layer.
제1항에 있어서,
상기 특정 관계 특징 정보를 추출하는 단계는,
(i) 관계 이름과 유형 제약사항을 포함하는 관계 정보 및 (ii) 엔티티 설명과 유형을 포함하는 엔티티 정보의 부가 공유 정보를 이용하여 상기 특정 관계 특징 정보를 추출하는 것을 특징으로 하는 제로샷 지식 그래프 완성 방법.
According to claim 1,
The step of extracting the specific relationship characteristic information,
Zero-shot knowledge graph, characterized in that the specific relationship characteristic information is extracted using (i) relationship information including relationship name and type constraints and (ii) additional shared information of entity information including entity description and type How to complete.
제2항에 있어서,
상기 특정 관계 특징 정보를 추출하는 단계는,
단어 임베딩, 어텐션 기반의 컨볼루션, 및 유형 매칭을 통해 각각의 트리플에 대한 헤드 엔티티-관계 벡터와 테일 엔티티-관계 벡터로부터 상기 특정 관계 특징 정보를 추출하는 것을 특징으로 하는 제로샷 지식 그래프 완성 방법.
3. The method of claim 2,
The step of extracting the specific relationship characteristic information,
A zero-shot knowledge graph completion method, characterized in that the specific relation feature information is extracted from the head entity-relation vector and the tail entity-relation vector for each triple through word embedding, attention-based convolution, and type matching.
제3항에 있어서,
상기 단어 임베딩은,
상기 관계 이름을 상기 엔티티 설명과 공유되는 단어 집합으로 나누고, 각 단어에 대해서 품사 대신에 약어를 중심으로 순차적으로 형태소 분석을 수행하고, 상기 단어를 동일한 어휘 집합에 의해 공유되는 단어 수준으로 인코딩하여, 상기 단어를 상징적 표현으로 변환하는 것을 특징으로 하는 제로샷 지식 그래프 완성 방법.
4. The method of claim 3,
The word embedding is
dividing the relationship name into a set of words shared with the entity description, sequentially morphological analysis centering on an abbreviation instead of a part-of-speech for each word, and encoding the word at the word level shared by the same vocabulary set, A zero-shot knowledge graph completion method, characterized in that the word is converted into a symbolic expression.
제3항에 있어서,
상기 어텐션 기반의 컨볼루션은,
임베딩 룩업을 통해 상기 엔티티 설명의 단어 벡터를 엔티티 설명 매트릭스로 변환하고, 상기 관계 이름의 단어 벡터를 관계 이름 매트릭스로 변환하고, 상기 유형 제약사항의 단어 벡터를 유형 제약사항 매트릭스로 변환하고,
상기 엔티티 설명 매트릭스에 상기 관계 이름 매트릭스 및 상기 유형 제약사항 매트릭스를 기준으로 어텐션 가중치를 적용하는 것을 특징으로 하는 제로샷 지식 그래프 완성 방법.
4. The method of claim 3,
The attention-based convolution is
transform the word vector of the entity description into an entity description matrix through an embedding lookup, transform the word vector of the relationship name into a relationship name matrix, transform the word vector of the type constraint into a type constraint matrix;
and applying an attention weight to the entity description matrix based on the relationship name matrix and the type constraint matrix.
제3항에 있어서,
상기 유형 매칭은,
마스크를 통해 상기 유형 제약사항 중에서 정의역(Domain)과 헤드 엔티티의 유형을 핫벡터로 변환하고 비교한 헤드 엔티티-관계 유효성을 산출하고, 상기 유형 제약사항 중에서 치역(Range)과 테일 엔티티의 유형을 핫벡터로 변환하고 비교한 테일 엔티티-관계 유효성을 산출하고,
상기 헤드 엔티티-관계 유효성 및 상기 테일 엔티티-관계 유효성을 상기 특정 관계 특징 정보에 적용하는 것을 특징으로 하는 제로샷 지식 그래프 완성 방법.
4. The method of claim 3,
The type matching is
Through the mask, the type of the domain and the head entity among the type constraints is converted into a hot vector and the comparison head entity-relationship validity is calculated, and the type of the range and the tail entity among the type constraints is hot Transform to a vector and compute the compared tail entity-relationship validity,
and applying the head entity-relationship validity and the tail entity-relationship validity to the specific relationship characteristic information.
제1항에 있어서,
상기 종합 특징 정보를 생성하는 단계는,
상기 특정 관계 특징 정보를 상기 멀티 홉 이웃 관계에 따른 전파 경로를 통해 누적하여 상기 종합 특징 정보를 생성하는 것을 특징으로 하는 제로샷 지식 그래프 완성 방법.
According to claim 1,
The step of generating the comprehensive feature information comprises:
The zero-shot knowledge graph completion method, characterized in that the comprehensive characteristic information is generated by accumulating the specific relational characteristic information through a propagation path according to the multi-hop neighbor relation.
제1항에 있어서,
상기 종합 특징 정보를 생성하는 단계는,
중요도가 높은 이웃의 특정 관계 특징 정보를 수집하기 위해서 상기 특정 관계 특징 정보에 셀프 어텐션을 적용하는 것을 특징으로 하는 제로샷 지식 그래프 완성 방법.
According to claim 1,
The step of generating the comprehensive feature information comprises:
A method of completing a zero-shot knowledge graph, characterized in that self-attention is applied to the specific relational characteristic information in order to collect specific relational characteristic information of a neighbor with high importance.
삭제delete 하나 이상의 프로세서 및 상기 하나 이상의 프로세서에 의해 실행되는 하나 이상의 프로그램을 저장하는 메모리를 포함하는 제로샷 지식 그래프 완성 장치에 있어서,
상기 프로세서는 지식 그래프에서 공유되는 부가 공유 정보를 이용하여 특정 관계 특징 정보를 추출하고,
상기 프로세서는 상기 지식 그래프에서 멀티 홉 이웃 관계에 있는 상기 특정 관계 특징 정보로부터 제로샷 트리플에 관한 종합 특징 정보를 생성하고,
상기 프로세서는 상기 종합 특징 정보의 타당성 점수를 산출하며, 상기 타당성 점수를 산출하는 것은, 풀리 커넥티드 레이어 기반의 점수 모델을 통해 상기 제로샷 트리플에 대한 특정 관계 임계치를 만족하는지 여부를 평가하는 것을 특징으로 하는 제로샷 지식 그래프 완성 장치.
A zero-shot knowledge graph completion apparatus comprising one or more processors and a memory for storing one or more programs executed by the one or more processors,
The processor extracts specific relational characteristic information using additional shared information shared in the knowledge graph,
The processor generates comprehensive feature information about a zero-shot triple from the specific relationship feature information in a multi-hop neighbor relationship in the knowledge graph,
The processor calculates a validity score of the comprehensive feature information, and calculating the validity score evaluates whether a specific relation threshold for the zero-shot triple is satisfied through a score model based on a fully connected layer Zero-shot knowledge graph completion device.
제10항에 있어서,
상기 프로세서는,
(i) 관계 이름과 유형 제약사항을 포함하는 관계 정보 및 (ii) 엔티티 설명과 유형을 포함하는 엔티티 정보의 부가 공유 정보를 이용하여 상기 특정 관계 특징 정보를 추출하는 것을 특징으로 하는 제로샷 지식 그래프 완성 장치.
11. The method of claim 10,
The processor is
Zero-shot knowledge graph, characterized in that the specific relationship characteristic information is extracted using (i) relationship information including relationship name and type constraints and (ii) additional shared information of entity information including entity description and type complete device.
삭제delete 제10항에 있어서,
상기 프로세서는,
단어 임베딩, 어텐션 기반의 컨볼루션, 및 유형 매칭을 통해 각각의 트리플에 대한 헤드 엔티티-관계 벡터와 테일 엔티티-관계 벡터로부터 상기 특정 관계 특징 정보를 추출하는 것을 특징으로 하는 제로샷 지식 그래프 완성 장치.
11. The method of claim 10,
The processor is
A zero-shot knowledge graph completion device, characterized in that the specific relation feature information is extracted from the head entity-relation vector and the tail entity-relation vector for each triple through word embedding, attention-based convolution, and type matching.
제10항에 있어서,
상기 프로세서는,
상기 특정 관계 특징 정보를 상기 멀티 홉 이웃 관계에 따른 전파 경로를 통해 누적하여 상기 종합 특징 정보를 생성하는 것을 특징으로 하는 제로샷 지식 그래프 완성 장치.
11. The method of claim 10,
The processor is
and generating the comprehensive feature information by accumulating the specific relationship feature information through a propagation path according to the multi-hop neighbor relationship.
KR1020190129123A 2019-10-17 2019-10-17 Method and Apparatus for Completing Zero-Shot Knowledge Graph Using Multi-Hop Neighborhoods KR102273136B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190129123A KR102273136B1 (en) 2019-10-17 2019-10-17 Method and Apparatus for Completing Zero-Shot Knowledge Graph Using Multi-Hop Neighborhoods

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190129123A KR102273136B1 (en) 2019-10-17 2019-10-17 Method and Apparatus for Completing Zero-Shot Knowledge Graph Using Multi-Hop Neighborhoods

Publications (2)

Publication Number Publication Date
KR20210045728A KR20210045728A (en) 2021-04-27
KR102273136B1 true KR102273136B1 (en) 2021-07-02

Family

ID=75725841

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190129123A KR102273136B1 (en) 2019-10-17 2019-10-17 Method and Apparatus for Completing Zero-Shot Knowledge Graph Using Multi-Hop Neighborhoods

Country Status (1)

Country Link
KR (1) KR102273136B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12001794B2 (en) 2022-01-14 2024-06-04 International Business Machines Corporation Zero-shot entity linking based on symbolic information

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815343A (en) 2019-01-28 2019-05-28 北京百度网讯科技有限公司 Obtain method, apparatus, equipment and the medium of the data model in knowledge mapping

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100837797B1 (en) * 2006-09-22 2008-06-13 고려대학교 산학협력단 Method for automatic construction of acronym dictionary based on acronym type, Recording medium thereof and Apparatus for automatic construction of acronym dictionary based on acronym type
KR101914853B1 (en) 2017-02-08 2018-11-02 경북대학교 산학협력단 Method and system for embedding knowledge gragh reflecting logical property of relations, recording medium for performing the method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109815343A (en) 2019-01-28 2019-05-28 北京百度网讯科技有限公司 Obtain method, apparatus, equipment and the medium of the data model in knowledge mapping

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Byungkook Oh et al., Knowledge Graph Completion by Context-Aware Convolutional Learning with Multi-Hop Neighborhoods, CIKM ‘18, 2018.10.22. pages 257-266. 1부.*
Deepak Nathani et al., Learning Attention-based Embeddings for Relation Prediction in Knowledge Graphs, <URL: https://arxiv.org/abs/1906.01195> 2019.06.04. 1부.*
Ruobing Xie et al., Representation Learning of Knowledge Graphs with Entity Descriptions, Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence, 2019.06.04. pages 2659-2665. 1부.*

Also Published As

Publication number Publication date
KR20210045728A (en) 2021-04-27

Similar Documents

Publication Publication Date Title
Ren et al. Label noise reduction in entity typing by heterogeneous partial-label embedding
JP6743934B2 (en) Method, apparatus and system for estimating causal relationship between observed variables
US20210192372A1 (en) Multi-layered knowledge base system and processing method thereof
US20190325316A1 (en) Apparatus and methods for program synthesis using genetic algorithms
CN101404033A (en) Automatic generation method and system for noumenon hierarchical structure
CN116150509B (en) Threat information identification method, system, equipment and medium for social media network
CN114936287A (en) Knowledge injection method for pre-training language model and corresponding interactive system
KR20210114256A (en) Context-Aware Cross-Sentence Relation Extraction Apparatus with Knowledge Graph, and Method Thereof
KR20200071877A (en) Method and System for information extraction using a self-augmented iterative learning
KR102189811B1 (en) Method and Apparatus for Completing Knowledge Graph Based on Convolutional Learning Using Multi-Hop Neighborhoods
Pei et al. A two-stream network based on capsule networks and sliced recurrent neural networks for DGA botnet detection
CN115617694A (en) Software defect prediction method, system, device and medium based on information fusion
CN103324641B (en) Information record recommendation method and device
US20220318715A1 (en) Machine learning models based methods and systems for determining prospective acquisitions between business entities
KR102273136B1 (en) Method and Apparatus for Completing Zero-Shot Knowledge Graph Using Multi-Hop Neighborhoods
CN116522912B (en) Training method, device, medium and equipment for package design language model
CN116661852B (en) Code searching method based on program dependency graph
CN112508178A (en) Neural network structure searching method and device, electronic equipment and storage medium
CN116955616A (en) Text classification method and electronic equipment
CN116842099A (en) Multi-source heterogeneous data processing method and system
JP5542732B2 (en) Data extraction apparatus, data extraction method, and program thereof
CN111078886B (en) Special event extraction system based on DMCNN
CN114091429A (en) Text abstract generation method and system based on heterogeneous graph neural network
CN115904918A (en) Code feature extraction method, code detection method, model training method and device
US11829735B2 (en) Artificial intelligence (AI) framework to identify object-relational mapping issues in real-time

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant