KR102206742B1 - 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치 - Google Patents

자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치 Download PDF

Info

Publication number
KR102206742B1
KR102206742B1 KR1020190030864A KR20190030864A KR102206742B1 KR 102206742 B1 KR102206742 B1 KR 102206742B1 KR 1020190030864 A KR1020190030864 A KR 1020190030864A KR 20190030864 A KR20190030864 A KR 20190030864A KR 102206742 B1 KR102206742 B1 KR 102206742B1
Authority
KR
South Korea
Prior art keywords
natural language
graph
knowledge graph
vocabulary knowledge
sentence
Prior art date
Application number
KR1020190030864A
Other languages
English (en)
Other versions
KR20200069200A (ko
Inventor
최기선
남상하
함영균
노영빈
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Publication of KR20200069200A publication Critical patent/KR20200069200A/ko
Application granted granted Critical
Publication of KR102206742B1 publication Critical patent/KR102206742B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치가 제시된다. 아래의 실시예들은 구문 분석 및 의미 분석 정보를 그래프화하는 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치에 관한 것이다. 실시예들은 자연언어 입력 문장을 원문 전체가 복원 가능한 형태의 어휘 지식 그래프로 표현하는 기술을 제공하고, 구분 분석 정보나 의미 분석 정보가 유입됨에 따라 어휘 지식 그래프의 형태를 변환하는 기술을 제공할 수 있다.

Description

자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치{METHOD AND APPARATUS FOR REPRESENTING LEXICAL KNOWLEDGE GRAPH FROM NATURAL LANGUAGE TEXT}
아래의 실시예들은 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치에 관한 것으로, 보다 구체적으로 구문 분석 및 의미 분석 정보를 그래프화하는 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치에 관한 것이다.
기계가 자연언어 텍스트를 읽어 구조화된 지식 형태로 만드는 정보 추출(Information Extraction)에 대한 연구는 자연어 처리(Natural Language Processing, NLP) 분야에서 필수적인 태스크(Task)이다.
이러한 정보 추출(Information Extraction)은 크게 2가지 방법으로 나눌 수 있다. 첫 번째는, 온톨로지컬 정보 추출(Ontological Information Extraction)이다. 이는 지식 기반 온톨로지에 정의된 틀에 맞는 지식만 추출 가능하여 손실되는 정보가 많다. 두 번째는, 개방 정보 추출(Open Information Extraction, OIE)이다. 이는 특정 지식 기반 온톨로지에 종속되지 않고 입력 텍스트(Text)만으로 구조화된 지식 그래프를 추출할 수 있다.
그러나 개방 정보 추출(OIE)을 위한 다양한 연구가 진행되었으나, 각 시스템이 서로 상이한 형태로 지식을 표현한다. 규칙 기반 개방 정보 추출(Rule-based OIE)의 경우, 미리 정의된 규칙(Pre-defined Rule)에 해당하는 문장만 지식 추출이 가능하다. 한 언어에서 정의한 규칙을 다른 언어에 바로 적용할 수 없다. 또한, 학습 기반 개방 정보 추출(Learning-based OIE)의 경우, 훈련 데이터(Training data)를 만드는 작업의 비용이 많이 드는 문제점이 있다. 규칙 기반으로 자동 생성한 훈련 데이터는 품질이 낮다. 그리고 개방 정보 추출(OIE)은 지식 추출 시 문장에서 놓치는 부분이 발생하고, 그로 인해 추출된 지식으로부터 원 문장을 복원할 수 없다는 문제가 발생한다.
한국공개특허 10-2017-0101609호는 이러한 지식베이스 기반의 개념 그래프 확장 시스템에 관한 기술을 기재하고 있다.
한국공개특허 10-2017-0101609호
실시예들은 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치에 관하여 기술하며, 보다 구체적으로 구문 분석 및 의미 분석 정보를 그래프화하는 자연언어 텍스트의 어휘 지식 그래프 표현 기술을 제공한다.
실시예들은 자연언어 텍스트를 기개발된 여러 그래프 이론을 활용하여 통계적 분석부터 응용(질의 응답)을 용이하게 하고, 구문 분석 및 의미 분석 정보를 그래프화함으로써 연구의 접근성 및 확장성을 높일 수 있는 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치를 제공하는데 있다.
일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 방법은, 입력된 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 단계; 및 표현된 상기 어휘 지식 그래프 형태로부터 상기 자연언어 문장의 원문을 복원하는 단계를 포함하고, 상기 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 단계는, 상기 자연언어 문장의 구문 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상을 어휘 지식 그래프 형태로 표현할 수 있다.
개방 정보 추출(Open Information Extraction)을 위해 구분 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상이 유입됨에 따라 어휘 지식 그래프의 형태를 변환하는 단계를 더 포함할 수 있다.
상기 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 단계는, 상기 자연언어 문장을 이루고 있는 모든 요소를 선형 그래프 형태로 표현하는 단계를 포함할 수 있다.
상기 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 단계는, 상기 선형 그래프 형태로 표현된 정보를 전달 받고, 구문 분석기로 취득한 상기 자연언어 문장의 구조를 구문 그래프 형태로 표현하는 단계를 더 포함할 수 있다.
상기 구문 분석기는, 상기 자연언어 문장을 이루고 있는 구성 성분으로 분해하고 상기 구성 성분들 사이의 위계 관계를 분석하여 문장의 구조를 결정할 수 있다.
상기 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 단계는, 상기 구문 그래프 형태로 표현된 정보를 전달 받고, 문장 의미 분석기로 취득한 정보를 의미 그래프 형태로 표현하는 단계를 더 포함할 수 있다.
상기 문장 의미 분석기는, 상기 자연언어 문장을 이루고 있는 구성 성분들 사이의 의미를 분석하고, 기계가 이해할 수 있는 형태로 표현할 수 있다.
복원된 상기 자연언어 문장의 원문을 지식베이스에 전달하여 저장하는 단계를 더 포함할 수 있다.
다른 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 장치는, 입력된 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 어휘 지식 그래프부를 포함하고, 상기 어휘 지식 그래프부는, 표현된 상기 어휘 지식 그래프 형태로부터 상기 자연언어 문장의 원문을 복원하고, 상기 자연언어 문장의 구문 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상을 어휘 지식 그래프 형태로 표현할 수 있다.
개방 정보 추출(Open Information Extraction)을 위해 구분 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상이 유입됨에 따라 어휘 지식 그래프의 형태를 변환하는 어휘 지식 그래프 변환부를 더 포함할 수 있다.
상기 어휘 지식 그래프부는, 상기 자연언어 문장을 이루고 있는 모든 요소를 선형 그래프 형태로 표현하는 선형 그래프 표현부를 포함할 수 있다.
상기 어휘 지식 그래프부는, 상기 선형 그래프 형태로 표현된 정보를 전달 받고, 구문 분석기로 취득한 상기 자연언어 문장의 구조를 구문 그래프 형태로 표현하는 구문 그래프 표현부를 더 포함할 수 있다.
상기 구문 분석기는, 상기 자연언어 문장을 이루고 있는 구성 성분으로 분해하고 상기 구성 성분들 사이의 위계 관계를 분석하여 문장의 구조를 결정할 수 있다.
상기 어휘 지식 그래프부는, 상기 구문 그래프 형태로 표현된 정보를 전달 받고, 문장 의미 분석기로 취득한 정보를 의미 그래프 형태로 표현하는 의미 그래프 표현부를 더 포함할 수 있다.
상기 문장 의미 분석기는, 상기 자연언어 문장을 이루고 있는 구성 성분들 사이의 의미를 분석하고, 기계가 이해할 수 있는 형태로 표현할 수 있다.
복원된 상기 자연언어 문장의 원문을 전달 받아 저장하는 지식베이스를 더 포함할 수 있다.
실시예들에 따르면 자연언어 텍스트를 여러 그래프 이론을 활용하여 통계적 분석부터 응용(질의 응답)을 용이하게 하고, 구문 분석 및 의미 분석 정보를 그래프화함으로써 연구의 접근성 및 확장성을 높일 수 있는 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치를 제공할 수 있다.
또한, 실시예들에 따르면 문장 전체를 빠짐없이 지식 그래프화하고 분석 결과를 그래프로 표현함으로써, 지식 그래프로부터 원문 복원이 가능하다. 특히, 실시예들에 따르면 언어 독립적인 모델을 제공함으로써 한국어는 물론 영어, 독일어 등의 다양한 언어권에서도 활용 가능하다.
도 1은 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 장치를 개략적으로 나타내는 도면이다.
도 2는 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 장치를 나타내는 개념도이다.
도 3은 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 방법을 나타내는 흐름도이다.
도 4는 일 실시예에 따른 선형 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 5는 일 실시예에 따른 구문 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 6은 일 실시예에 따른 의미 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 7은 일 실시예에 따른 트리플의 그래프 표현 예시를 나타내는 도면이다.
도 8은 일 실시예에 따른 선형 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 9는 일 실시예에 따른 구문 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 10은 일 실시예에 따른 의미 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 11은 일 실시예에 따른 트리플의 그래프 표현 예시를 나타내는 도면이다.
이하, 첨부된 도면을 참조하여 실시예들을 설명한다. 그러나, 기술되는 실시예들은 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 이하 설명되는 실시예들에 의하여 한정되는 것은 아니다. 또한, 여러 실시예들은 당해 기술분야에서 평균적인 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위해서 제공되는 것이다. 도면에서 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.
아래의 실시예들은 구문 분석 및 의미 분석 정보를 그래프화하는 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치에 관한 것이다. 실시예들은 자연언어 입력 문장을 원문 전체가 복원 가능한 형태의 어휘 지식 그래프로 표현하는 기술을 제공하고, 구분 분석 정보나 의미 분석 정보가 유입됨에 따라 어휘 지식 그래프의 형태를 변환하는 기술을 제공할 수 있다.
보다 구체적으로, 실시예들은 1) 원 문장으로 복원 가능한 지식 추출 방법을 제공하고, 2) 문장의 모든 단어를 빠짐없이 지식 그래프화하며, 3) 개방 정보 추출(Open Information Extraction, OIE) 시스템들에서 필요로 하는 구문 분석 및 의미 분석 정보를 지식 그래프로 표현하고, 4) 표준화된 개방 정보 추출(OIE) 출력 포맷을 제안하여 기존 개방 정보 추출(OIE) 시스템들의 한계를 보완할 수 있다.
도 1은 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 장치를 개략적으로 나타내는 도면이다.
도 1을 참조하면, 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 장치는 자연언어 문장(101)을 입력 받아 어휘 지식 그래프부(100)를 통해 문장 원문을 복원할 수 있다. 여기서, 자연언어 문장(101)은 자연언어 텍스트로 표현될 수 있으며, 어휘 지식 그래프의 생성 대상이 되는 자연언어 문장(101)이다. 자연언어 텍스트의 어휘 지식 그래프 표현 장치는 어휘 지식 그래프부(100)를 포함할 수 있다.
어휘 지식 그래프부(100)는 자연언어 문장(101)을 구성하는 모든 단어를 빠지지 않고 어휘 지식 그래프 형태로 표현하고, 생성한 어휘 지식 그래프로부터 원문 복원이 가능하다. 여기서 자연언어 문장(101)의 구문 분석 정보 및 의미 분석 등의 정보를 어휘 지식 그래프 형태로 표현할 수 있다.
이러한 어휘 지식 그래프부(100)는 선형 그래프 표현부(110), 구문 그래프 표현부(120) 및 의미 그래프 표현부(130)를 포함하여 이루어질 수 있다.
선형 그래프 표현부(110)는 문장을 이루고 있는 모든 요소를 선형 그래프 형태로 표현할 수 있다.
구문 그래프 표현부(120)는 구문 분석기로 취득한 문장의 구조를 그래프 형태로 표현할 수 있다. 여기서 구문 분석기는 문장을 그것을 이루고 있는 구성 성분으로 분해하고 그들 사이의 위계 관계를 분석하여 문장의 구조를 결정할 수 있다.
의미 그래프 표현부(130)는 문장 의미 분석기로 취득한 정보를 그래프 형태로 표현할 수 있다. 여기서 문장 의미 분석기는 문장을 이루고 있는 구성 성분 사이의 의미를 분석하고, 기계가 이해할 수 있는 형태로 표현할 수 있다.
자연언어 텍스트의 어휘 지식 그래프 표현 장치는 개방 정보 추출(OIE)에서 활용하기 용이한 형태의 어휘 지식 그래프 구성할 수 있다. 즉, 텍스트와 지식베이스 사이의 중간다리 역할을 할 수 있다.
이에 따라 자연언어 텍스트의 그래프화는 기개발된 여러 그래프 이론을 활용하여 통계적 분석부터 응용(질의 응답)을 용이하게 한다. 그리고 구문 분석 및 의미 분석 정보를 그래프화함으로써 연구의 접근성 및 확장성을 높일 수 있다.
실시예들에 따르면 자연언어 문장(101)에 대한 그래프 표현 방식의 표준화를 수행할 수 있으며, 단어 혹은 구(clause) 중심의 문장-그래프 표현 기술을 제공할 수 있다. 또한, 자연언어 문장(101)의 모든 단어를 하나의 그래프로 연결함으로써 그 내용을 온전히 보전하여 원문 복원이 가능한 모델을 제공할 수 있다.
여기에서는 자연언어 문장(101)과 그것의 분석 결과에 대한 그래프 표현 방식에 대해 설명하며, 자연언어 문장(101)에 대한 구문 분석, 의미 분석을 수행하는 장치의 출력 형식을 다루지 않고 생략하기로 한다.
아래에서 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 장치를 보다 상세히 설명하기로 한다.
도 2는 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 장치를 나타내는 개념도이다.
도 2를 참조하면, 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 장치(200)는 어휘 지식 그래프부(210)를 포함할 수 있고, 실시예에 따라 어휘 지식 그래프 변환부를 더 포함할 수 있다. 또한 지식베이스(240)를 더 포함할 수 있다.
어휘 지식 그래프부(210)는 입력된 자연언어 문장(201)을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현할 수 있고, 표현된 어휘 지식 그래프 형태로부터 자연언어 문장(201)의 원문을 복원할 수 있다. 여기서 어휘 지식 그래프(Knowledge Graph)는 개체(Entity - 실제 세계에 존재하는 물질, 이벤트, 상황, 개념 등)들간의 상호 연결된 설명(지식) 집합을 의미할 수 있다.
어휘 지식 그래프부(210)는 자연언어 문장(201)의 구문 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상을 어휘 지식 그래프 형태로 표현할 수 있다. 여기서, 구문 분석(Syntactic analysis)은 텍스트의 각 문장에 대한 구문 구조를 도출하는 것이다. 그 결과 트리 혹은 그래프로 표현할 수 있다. 또한 의미 분석(Semantic analysis)은 텍스트의 각 구성 성분끼리 가지는 의미적 분석 결과를 도출하는 것이다. 대표적인 예로, SRL(Semantic Role Labeling), FrameNet 등이 있다.
보다 구체적으로, 어휘 지식 그래프부(210)는 선형 그래프 표현부(211), 구문 그래프 표현부(212) 및 의미 그래프 표현부(213)를 포함하여 이루어질 수 있다.
선형 그래프 표현부(211)는 자연언어 문장(201)을 이루고 있는 모든 요소를 선형 그래프 형태로 표현할 수 있다.
구문 그래프 표현부(212)는 선형 그래프 형태로 표현된 정보를 전달 받고, 구문 분석기(220)로 취득한 자연언어 문장(201)의 구조를 구문 그래프 형태로 표현할 수 있다.
여기서, 구문 분석기(220)는 자연언어 문장(201)을 이루고 있는 구성 성분으로 분해하고 구성 성분들 사이의 위계 관계를 분석하여 문장의 구조를 결정할 수 있다. 이러한 구문 분석기(220)는 외부 장치로 존재할 수 있으며, 기존 구문 분석기(220)를 활용할 수 있다. 한편, 구문 분석기(220)를 자연언어 텍스트의 어휘 지식 그래프 표현 장치(200) 내에 구성하는 것도 가능하다.
의미 그래프 표현부(213)는 구문 그래프 형태로 표현된 정보를 전달 받고, 문장 의미 분석기(230)로 취득한 정보를 의미 그래프 형태로 표현할 수 있다.
여기서, 문장 의미 분석기(230)는 자연언어 문장(201)을 이루고 있는 구성 성분들 사이의 의미를 분석하고, 기계가 이해할 수 있는 형태로 표현할 수 있다. 이러한 문장 의미 분석기(230)는 외부 장치로 존재할 수 있으며, 기존 문장 의미 분석기(230)를 활용할 수 있다. 한편, 문장 의미 분석기(230)를 자연언어 텍스트의 어휘 지식 그래프 표현 장치(200) 내에 구성하는 것도 가능하다.
그리고, 복원된 자연언어 문장(201)의 원문을 전달 받아 지식베이스(240)에 저장할 수 있다. 예컨대 지식베이스(240)는 인공지능 에이전트가 사용될 분야와 관련하여 축적한 지식과 규칙 등이 저장되어 있는 데이터베이스가 될 수 있다.
어휘 지식 그래프 변환부는 개방 정보 추출(Open Information Extraction)을 위해 구분 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상이 유입됨에 따라 어휘 지식 그래프의 형태를 변환할 수 있다.
실시예들은 입력된 자연언어 문장(201)의 모든 단어로 구성된 어휘 지식 그래프로 원문 복원이 가능하고, 입력된 자연언어 문장(201)의 문법적 정보 및 의미적 정보가 유입됨에 따라 어휘 지식 그래프 형태가 변형될 수 있다. 이 때, 자연언어 문장(201)의 문법적 정보 및 의미적 정보는 각각 외부의 구문 분석기(220) 및 문장 의미 분석기(230)로부터 유입될 수 있다. 또한 문법적 정보 및 의미적 정보를 트리플(Triple) 형태로 표현할 수 있다.
또한, 실시예들은 개방 정보 추출(OIE)에 필요한 문법적 정보 및 의미적 정보를 저장하여 다양한 형태의 개방 정보 추출(OIE)를 수행할 수 있게 지원할 수 있고, 트리플(Triple) 표현은 W3C 표준 지식 표현 형태로 다양한 분야에서 응용 가능하다. 예컨대, 지식 구축, 질의 응답 등에 응용될 수 있다. 한편, W3C(World Wide Web Consortium)는 RDF(Resource Description Framework) 및 OWL(Web Ontology Language) 등이 있다.
도 3은 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 방법을 나타내는 흐름도이다.
도 3을 참조하면, 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 방법은 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 방법은, 입력된 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 단계(S110), 및 표현된 어휘 지식 그래프 형태로부터 자연언어 문장의 원문을 복원하는 단계(S120)를 포함하여 이루어질 수 있다.
실시예에 따라 개방 정보 추출(Open Information Extraction)을 위해 구분 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상이 유입됨에 따라 어휘 지식 그래프의 형태를 변환하는 단계(S130)를 더 포함할 수 있다.
또한, 복원된 자연언어 문장의 원문을 지식베이스에 전달하여 저장하는 단계를 더 포함할 수 있다.
아래에서 각 단계를 보다 상세히 설명하기로 한다.
일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 방법은 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 장치를 예를 들어 보다 구체적으로 설명할 수 있다. 일 실시예에 따른 자연언어 텍스트의 어휘 지식 그래프 표현 장치는 어휘 지식 그래프부를 포함할 수 있고, 실시예에 따라 어휘 지식 그래프 변환부를 더 포함할 수 있다. 또한, 어휘 지식 그래프부는 선형 그래프 표현부, 구문 그래프 표현부 및 의미 그래프 표현부를 포함하여 이루어질 수 있다.
단계(S110)에서, 어휘 지식 그래프부는 자연언어 텍스트의 어휘 지식 그래프 표현 방법은, 입력된 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현할 수 있다. 이 때, 자연언어 문장의 구문 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상을 어휘 지식 그래프 형태로 표현할 수 있다.
먼저, 선형 그래프 표현부는 자연언어 문장을 이루고 있는 모든 요소를 선형 그래프 형태로 표현할 수 있으며, 이후 구문 그래프 표현부는 선형 그래프 형태로 표현된 정보를 전달 받고, 구문 분석기로 취득한 자연언어 문장의 구조를 구문 그래프 형태로 표현할 수 있다. 그리고, 의미 그래프 표현부는 구문 그래프 형태로 표현된 정보를 전달 받고, 문장 의미 분석기로 취득한 정보를 의미 그래프 형태로 표현할 수 있다.
단계(S120)에서, 어휘 지식 그래프부는 표현된 어휘 지식 그래프 형태로부터 자연언어 문장의 원문을 복원할 수 있다. 이후, 복원된 자연언어 문장의 원문을 지식베이스에 전달하여 저장할 수 있다.
단계(S130)에서, 어휘 지식 그래프 변환부는 개방 정보 추출(Open Information Extraction)을 위해 구분 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상이 유입됨에 따라 어휘 지식 그래프의 형태를 변환할 수 있다.
기존에는 어휘 지식 그래프로 구성된 지식베이스가 있고, 새로운 텍스트가 입력으로 주어졌을 때 둘 간의 매칭으로 서브-그래프(Sub-graph)를 찾아내는 방법을 통해 질의 응답 분야에 활용되었다.
반면, 실시예들은 자연언어 문장과 그것의 분석 결과를 어휘 지식 그래프로 표현하는 방법을 제공하는 것으로, 자연언어 문장에 대한 어휘 지식 그래프화를 수행할 수 있다. 특히, 실시예들에 따르면 문장 전체를 빠짐없이 어휘 지식 그래프화하고, 이 때 그것의 분석 결과를 어휘 지식 그래프로 표현할 수 있다. 이에 따라 어휘 지식 그래프로부터 원문 복원이 가능하다.
이를 통해 지식 그래프 구축 시스템(지식 마이닝(knowledge mining)), 질의 응답 시스템, 문서 요약을 할 수 있다. 자연언어 처리 분야에 있어서 지식 그래프 구축은 매우 중요하며, 구글, 애플, 삼성 등 여러 기업에서 지식 그래프 구축에 대한 연구를 활발히 수행 중이고, 지식 그래프 구축은 시리(SIRI), 구글 나우(Google NOW), 빅스비(Bixby) 등 개인비서 시스템 등에도 필수적인 기술이다.
실시예들은 언어 독립적 어휘 지식 그래프 모델로, 다양한 개방 정보 추출(OIE) 시스템을 지원할 수 있게 구문 분석, 의미 분석 등의 정보를 가진 형태로 지식베이스 구축될 수 있다. 이 어휘 지식 그래프를 활용하는 질의 응답 시스템에서 더 많은 단서 제공 가능하다. LLOD(Linguistic Linked Open Data)와 융합될 수 있기에 시장성이 크다.
따라서, 실시예들은 웹-스케일(Web-scale)의 텍스트에 대한 지식 그래프 표현 방식을 제안함으로써, 빅데이터 및 지식 마이닝(knowledge mining) 분야에서 기본 지식베이스로서 활용 가능하다. 더욱이 다양한 그래프 이론, 활용 기술 등이 적용되어 그래프상 지식 추출, 추론, 확장, 요약 등이 가능하다.
또한, 실시예들에 따른 지식 그래프는 W3C 표준인 트리플(Triple) 형태로 SPARQL을 활용한 질의 응답 시스템에 적용 가능하다.
아래에서는 일례로 한국어로 이루어진 자연언어 문장을 입력하여 입력 문장의 모든 단어로 구성된 어휘 지식 그래프로 원문 복원을 수행하는 과정을 하나의 예를 들어 설명한다. 예시 문장은 "정현은 ATP 랭킹에서 19위를 기록했다."이다.
도 4는 일 실시예에 따른 선형 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 4를 참조하면, W3C 표준인 트리플(Triple) 형태로 나타내면 다음과 같다.
Triples
<기록했다(ranked)#m4,
Figure 112019027826683-pat00001
{post=은}, 정현(Jung-hyun)#m0>
<기록했다(ranked)#m4,
Figure 112019027826683-pat00002
{post=를}, 19위(19th)#m3>
<19위(19th)#m3,
Figure 112019027826683-pat00003
, 에서(in)#m2>
<에서(in)#m2,
Figure 112019027826683-pat00004
, ATP 랭킹(ATP ranking)#m1>
도 5는 일 실시예에 따른 구문 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 5를 참조하면, W3C 표준인 트리플(Triple) 형태로 나타내면 다음과 같다.
Triples
<기록했다(ranked)#m4,
Figure 112019027826683-pat00005
{post=은, syn=nsubj}, 정현(Jung-hyun)#m0>
<기록했다(ranked)#m4,
Figure 112019027826683-pat00006
{post=를, syn=dobj}, 19위(19th)#m3>
<기록했다(ranked)#m4,
Figure 112019027826683-pat00007
{syn=prep}, 에서(in)#m2>
<에서(in)#m2,
Figure 112019027826683-pat00008
{syn=pobj}, ATP 랭킹(ATP ranking)#m1>
도 6은 일 실시예에 따른 의미 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 6을 참조하면, W3C 표준인 트리플(Triple) 형태로 나타내면 다음과 같다.
Triples
<기록했다(ranked)#m4{frame=RECORDING#1},
Figure 112019027826683-pat00009
{post=은, syn=nsubj}, 정현(Jung-hyun)#m0{role#1=Agent}>
<기록했다(ranked)#m4{frame=RECORDING#1},
Figure 112019027826683-pat00010
{post=를, syn=dobj}, 19위(19th)#m3{role#1=Value}>
<기록했다(ranked)#m4{frame=RECORDING#1},
Figure 112019027826683-pat00011
{syn=prep}, 에서(in)#m2>
<에서(in)#m2, f{syn=pobj}, ATP 랭킹(ATP ranking)#m1{role#1=Phenomenon}>
도 7은 일 실시예에 따른 트리플의 그래프 표현 예시를 나타내는 도면이다.
도 7에 도시된 바와 같이, 자연언어 텍스트의 어휘 지식 그래프 표현을 트리플(Triple) 형태로 표현할 수 있으며, 이는 문법적 정보 및 의미적 정보를 포함할 수 있다.
실시예들은 개방 정보 추출(OIE)에 필요한 문법적 정보 및 의미적 정보를 저장하여 다양한 형태의 개방 정보 추출(OIE)를 수행할 수 있다.
아래에서는 다른 예로 영어로 이루어진 자연언어 문장을 입력하여 입력 문장의 모든 단어로 구성된 어휘 지식 그래프로 원문 복원을 수행하는 과정을 하나의 예를 들어 설명한다. 예시 문장은 "He nominated Sonia Sotomayor on May 26, 2009 to replace David Souter."이다.
도 8은 일 실시예에 따른 선형 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 8을 참조하면, W3C 표준인 트리플(Triple) 형태로 나타내면 다음과 같다.
Triples
<nominated#m1,
Figure 112019027826683-pat00012
, He#m0>
<nominated#m1,
Figure 112019027826683-pat00013
, Sonia Sotomayor#m2>
<Sonia Sotomayor#m2,
Figure 112019027826683-pat00014
, on#m3>
<on#m3,
Figure 112019027826683-pat00015
, May 26, 2009#m4>
<May 26, 2009#m4,
Figure 112019027826683-pat00016
, to#m5>
<to#m5,
Figure 112019027826683-pat00017
, replace#m6>
<replace#m6,
Figure 112019027826683-pat00018
, David Souter#m7>
도 9는 일 실시예에 따른 구문 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 9를 참조하면, W3C 표준인 트리플(Triple) 형태로 나타내면 다음과 같다.
Triples
<nominated#m1,
Figure 112019027826683-pat00019
{syn=nsubj}, He#m0>
<nominated#m1,
Figure 112019027826683-pat00020
{syn=dobj}, Sonia Sotomayor#m2>
<nominated#m1,
Figure 112019027826683-pat00021
{syn=prep}, on#m3>
<on#m3,
Figure 112019027826683-pat00022
{syn=pobj}, May 26, 2009#m4>
<nominated#m1,
Figure 112019027826683-pat00023
{syn=xcomp}, replace#m6>
<replace#m6,
Figure 112019027826683-pat00024
{syn=aux}, to#m5>
<replace#m6,
Figure 112019027826683-pat00025
{syn=dobj}, David Souter#m7>
도 10은 일 실시예에 따른 의미 그래프 표현부의 표현 예시를 나타내는 도면이다.
도 10을 참조하면, W3C 표준인 트리플(Triple) 형태로 나타내면 다음과 같다.
Triples
<nominated#m1{frame=Appointing#1},
Figure 112019027826683-pat00026
{syn=nsubj}, He#m0>
<nominated#m1{frame=Appointing#1},
Figure 112019027826683-pat00027
{syn=dobj, role#1=Appointee}, Sonia Sotomayor#m2>
<nominated#m1{frame=Appointing#1},
Figure 112019027826683-pat00028
{syn=prep, rhetoric=TEMPORAL}, on#m3>
<on#m3,
Figure 112019027826683-pat00029
{syn=pobj}, May 26, 2009#m4{role#1=Time}>
<nominated#m1{frame=Appointing#1},
Figure 112019027826683-pat00030
{syn=xcomp}, replace#m6>
<replace#m6{frame=Replacing#2},
Figure 112019027826683-pat00031
{syn=aux, rhetoric=PURPOSE}, to#m5>
<replace#m6{frame=Replacing#2},
Figure 112019027826683-pat00032
{syn=dobj}, David Souter#m7{role#2=New}>
도 11은 일 실시예에 따른 트리플의 그래프 표현 예시를 나타내는 도면이다.
도 11에 도시된 바와 같이, 자연언어 텍스트의 어휘 지식 그래프 표현을 트리플(Triple) 형태로 표현할 수 있으며, 이는 문법적 정보 및 의미적 정보를 포함할 수 있다.
지식베이스 구축 및 질의 응답 시스템은 질의 응답을 위해서는 입력 문장의 문법적, 의미적 정보를 분석하고, 이를 지식 그래프에 매칭하여 적절한 답을 찾는 일련의 과정이 필요하다. 실시예들에 따르면 지식베이스 구축에 필요한 정보를 저장하고 있는 어휘 지식 그래프를 제공할 수 있으며, 자연언어 질문에 대해서도 동일한 방법을 적용할 수 있다. 특히, 실시예들은 언어 독립적인 모델이므로 한국어는 물론 영어, 독일어 등의 다양한 언어권에서도 활용 가능하다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 컨트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 컨트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (16)

  1. 자연언어 텍스트의 어휘 지식 그래프 표현 장치를 통해 수행되는 자연언어 텍스트의 어휘 지식 그래프 표현 방법에 있어서,
    어휘 지식 그래프부에서 입력된 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 단계; 및
    상기 상기 어휘 지식 그래프부에서 표현된 상기 어휘 지식 그래프 형태로부터 상기 자연언어 문장의 원문을 복원하는 단계
    를 포함하고,
    상기 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 단계는,
    상기 자연언어 문장의 구문 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상을 어휘 지식 그래프 형태로 표현하며,
    선형 그래프 표현부에서 상기 자연언어 문장을 이루고 있는 모든 요소를 선형 그래프 형태로 표현하는 단계; 및
    구문 그래프 표현부에서 상기 선형 그래프 형태로 표현된 정보를 전달 받고, 구문 분석기로 취득한 상기 자연언어 문장의 구조를 구문 그래프 형태로 표현하는 단계
    를 포함하는, 자연언어 텍스트의 어휘 지식 그래프 표현 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 구문 분석기는,
    상기 자연언어 문장을 이루고 있는 구성 성분으로 분해하고 상기 구성 성분들 사이의 위계 관계를 분석하여 문장의 구조를 결정하는 것
    을 특징으로 하는, 자연언어 텍스트의 어휘 지식 그래프 표현 방법.
  6. 제1항에 있어서,
    상기 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 단계는,
    상기 구문 그래프 형태로 표현된 정보를 전달 받고, 문장 의미 분석기로 취득한 정보를 의미 그래프 형태로 표현하는 단계
    를 더 포함하는, 자연언어 텍스트의 어휘 지식 그래프 표현 방법.
  7. 제5항에 있어서,
    상기 문장 의미 분석기는,
    상기 자연언어 문장을 이루고 있는 구성 성분들 사이의 의미를 분석하고, 기계가 이해할 수 있는 형태로 표현하는 것
    을 특징으로 하는, 자연언어 텍스트의 어휘 지식 그래프 표현 방법.
  8. 제1항에 있어서,
    복원된 상기 자연언어 문장의 원문을 지식베이스에 전달하여 저장하는 단계
    를 더 포함하는, 자연언어 텍스트의 어휘 지식 그래프 표현 방법.
  9. 입력된 자연언어 문장을 구성하는 단어를 구조화된 어휘 지식 그래프 형태로 표현하는 어휘 지식 그래프부
    를 포함하고,
    상기 어휘 지식 그래프부는,
    표현된 상기 어휘 지식 그래프 형태로부터 상기 자연언어 문장의 원문을 복원하고, 상기 자연언어 문장의 구문 분석 정보 및 의미 분석 정보 중 적어도 어느 하나 이상을 어휘 지식 그래프 형태로 표현하며,
    상기 자연언어 문장을 이루고 있는 모든 요소를 선형 그래프 형태로 표현하는 선형 그래프 표현부; 및
    상기 선형 그래프 형태로 표현된 정보를 전달 받고, 구문 분석기로 취득한 상기 자연언어 문장의 구조를 구문 그래프 형태로 표현하는 구문 그래프 표현부
    를 포함하는, 자연언어 텍스트의 어휘 지식 그래프 표현 장치.
  10. 삭제
  11. 삭제
  12. 삭제
  13. 제9항에 있어서,
    상기 구문 분석기는,
    상기 자연언어 문장을 이루고 있는 구성 성분으로 분해하고 상기 구성 성분들 사이의 위계 관계를 분석하여 문장의 구조를 결정하는 것
    을 특징으로 하는, 자연언어 텍스트의 어휘 지식 그래프 표현 장치.
  14. 제9항에 있어서,
    상기 어휘 지식 그래프부는,
    상기 구문 그래프 형태로 표현된 정보를 전달 받고, 문장 의미 분석기로 취득한 정보를 의미 그래프 형태로 표현하는 의미 그래프 표현부
    를 더 포함하는, 자연언어 텍스트의 어휘 지식 그래프 표현 장치.
  15. 제14항에 있어서,
    상기 문장 의미 분석기는,
    상기 자연언어 문장을 이루고 있는 구성 성분들 사이의 의미를 분석하고, 기계가 이해할 수 있는 형태로 표현하는 것
    을 특징으로 하는, 자연언어 텍스트의 어휘 지식 그래프 표현 장치.
  16. 제9항에 있어서,
    복원된 상기 자연언어 문장의 원문을 전달 받아 저장하는 지식베이스
    를 더 포함하는, 자연언어 텍스트의 어휘 지식 그래프 표현 장치.
KR1020190030864A 2018-12-06 2019-03-19 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치 KR102206742B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20180155808 2018-12-06
KR1020180155808 2018-12-06

Publications (2)

Publication Number Publication Date
KR20200069200A KR20200069200A (ko) 2020-06-16
KR102206742B1 true KR102206742B1 (ko) 2021-01-25

Family

ID=71141813

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190030864A KR102206742B1 (ko) 2018-12-06 2019-03-19 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102206742B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102576350B1 (ko) * 2021-02-08 2023-09-07 서울대학교산학협력단 입력 문장을 사건구조프레임이 주석된 문장으로 출력하는 자동 주석방법
CN113157863B (zh) * 2021-04-25 2024-05-28 平安科技(深圳)有限公司 问答数据处理方法、装置、计算机设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050220351A1 (en) * 2004-03-02 2005-10-06 Microsoft Corporation Method and system for ranking words and concepts in a text using graph-based ranking
US20080243479A1 (en) * 2007-04-02 2008-10-02 University Of Washington Open information extraction from the web
US20170039211A1 (en) 2015-08-05 2017-02-09 Facebook, Inc. Systems and methods for determining content similarity

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101835345B1 (ko) 2016-02-29 2018-03-07 경기대학교 산학협력단 지식베이스 기반의 개념그래프 확장 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050220351A1 (en) * 2004-03-02 2005-10-06 Microsoft Corporation Method and system for ranking words and concepts in a text using graph-based ranking
US20080243479A1 (en) * 2007-04-02 2008-10-02 University Of Washington Open information extraction from the web
US20170039211A1 (en) 2015-08-05 2017-02-09 Facebook, Inc. Systems and methods for determining content similarity

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Bowman, Samuel R., et al. 'Generating sentences from a continuous space.' arXiv preprint arXiv:1511.06349v4, 2016.5.12.
Giulia Fanti et al., Building a RAPPOR with the unknown: Privacy-preserving learning of associations and data dictionaries, proc. on privacy enhancing technologies, vol.2016 no.3 pp.41-61(2016.05.06)
Le, Quoc, and Tomas Mikolov. 'Distributed representations of sentences and documents.' International Conference on Machine Learning. 2014.

Also Published As

Publication number Publication date
KR20200069200A (ko) 2020-06-16

Similar Documents

Publication Publication Date Title
US10409911B2 (en) Systems and methods for text analytics processor
US9740685B2 (en) Generation of natural language processing model for an information domain
US10262062B2 (en) Natural language system question classifier, semantic representations, and logical form templates
US9361587B2 (en) Authoring system for bayesian networks automatically extracted from text
US20200125482A1 (en) Code examples sandbox
US10503830B2 (en) Natural language processing with adaptable rules based on user inputs
CN113282762B (zh) 知识图谱构建方法、装置、电子设备和存储介质
EP3846089B1 (en) Generating a knowledge graph of multiple application programming interfaces
Solaimani et al. Spark-based political event coding
El Abdouli et al. Sentiment analysis of moroccan tweets using naive bayes algorithm
Gyawali et al. Mapping natural language to description logic
KR102206742B1 (ko) 자연언어 텍스트의 어휘 지식 그래프 표현 방법 및 장치
Simov et al. Using context information for knowledge-based word sense disambiguation
Utomo et al. New instances classification framework on Quran ontology applied to question answering system
CN108932225B (zh) 用于将自然语言需求转换成为语义建模语言语句的方法和系统
Gao et al. On the variability of software engineering needs for deep learning: Stages, trends, and application types
Mangairkarasi et al. Semantic based text summarization using universal networking language
Nevzorova et al. Ontology-driven processing of unstructured text
Revanth et al. Nl2sql: Natural language to sql query translator
Rajbhoj et al. A RFP system for generating response to a request for proposal
Le-Hong et al. Fast dependency parsing using distributed word representations
Sorvisto et al. Live Twitter sentiment analysis: Big data mining with Twitter’s public streaming API
Pandit et al. Ontology-guided extraction of complex nested relationships
Mathur Improving classification results using class imbalance solutions & evaluating the generalizability of rationale extraction techniques
Walsh Natural Language Processing

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant