KR20100047475A - 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출방법 - Google Patents
의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출방법 Download PDFInfo
- Publication number
- KR20100047475A KR20100047475A KR1020080106383A KR20080106383A KR20100047475A KR 20100047475 A KR20100047475 A KR 20100047475A KR 1020080106383 A KR1020080106383 A KR 1020080106383A KR 20080106383 A KR20080106383 A KR 20080106383A KR 20100047475 A KR20100047475 A KR 20100047475A
- Authority
- KR
- South Korea
- Prior art keywords
- syntax tree
- verb
- relation
- searching
- node
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (11)
- 대상 문장을 구문 분석하여 의존 문법 구문 트리를 생성하는 제1 단계;상기 제1 단계 후 생성된 의존 문법 구문 트리를 전처리하여 관계 추출을 위한 형태로 변환하는 제2 단계; 및,상기 제2 단계에서 변환된 의존 문법 구문 트리를 포스트오더(postorder) 방식으로 탐색하여 자동으로 관계 트리플을 추출하는 제3 단계를 포함하는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
- 청구항 1에 있어서,상기 제1 단계는 의존 문법 구문 분석기를 이용하여 의존 문법 구문 트리를 생성하는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
- 청구항 1에 있어서, 상기 제2 단계는,미리 정의된 텀 사전을 이용하여 상기 대상 문장에서 텀을 표시하고 구축하는 과정,상기 의존 문법 구문 트리에서 주어가 될 수 있는 개체명을 인식하는 과정,상기 의존 문법 구문 트리에서 To-부정사 및 동명사가 있는 경우, 이를 별도로 표시하는 과정,상기 의존 문법 구문 트리에서 연결 접속사를 처리하는 과정,상기 의존 문법 구문 트리에 관계 대명사가 있는 경우, 관계 대명사를 대용할 수 있는 명사를 탐색하는 과정,같은 동작에 대하여 2개 이상의 관계 트리플들을 하나로 묶는 데 사용할 Action을 표시하는 과정,부정 또는 빈도의 정보를 그것이 수식하는 동사 노드에 합치는 과정을 포함하는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
- 청구항 3에 있어서,상기 연결 접속사를 처리하는 과정은, 상기 연결 접속사로 연결된 두 단어의 품사가 같고, 상기 단어의 품사가 동사가 아닐 때, 상기 두 단어를 의존 문법 구문 트리의 하나의 노드를 묶는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
- 청구항 3에 있어서,상기 연결 접속사를 처리하는 과정은, 상기 연결 접속사로 연결된 두 단어의 품사가 같고, 상기 단어의 품사가 동사인 경우, 상기 동사가 모두 주어와 목적어를 각각 보유하면 문장을 나누는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
- 청구항 3에 있어서,상기 연결 접속사를 처리하는 과정은, 상기 연결 접속사로 연결된 두 단어의 품사가 같고, 상기 단어의 품사가 동사인 경우, 먼저 나온 동사만 주어를 갖고 뒤에 나온 동사가 주어를 가지지 않으면 두 동사를 하나의 노드로 묶는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
- 청구항 3에 있어서,상기 연결 접속사를 처리하는 과정은, 상기 연결 접속사로 연결된 두 단어의 품사가 같고, 상기 단어의 품사가 동사인 경우, 먼저 나온 동사가 주어와 목적어를 모두 보유하고, 뒤에 나온 동사가 주어를 보유하지 않으면 주어를 복사하여 아래쪽 동사에 붙이고 두 문장을 나누는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
- 청구항 3에 있어서,상기 관계 대명사를 대용할 수 있는 명사를 탐색하는 과정은 상기 관계 대명사가 지칭하는 명사에 대하여 링크를 걸어주는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
- 청구항 3에 있어서,상기 Action을 표시하는 과정에서, 상기 Action은 품사가 동사인 두 노드로서 주어와 목적어가 연결되어 하나 이상의 의미 관계를 가지며, 상기 두 노드를 제외한 자식 노드들 중 하나 이상의 텀을 보유하는 자식 노드가 존재하는 경우 그 노드를 Action으로 표시하는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
- 청구항 9에 있어서,상기 Action으로 표시된 노드의 동사를 동명사로 변환하여 관계 트리플을 추출하고 상기 동명사를 사용하여 인수 1 또는 인수 2를 수식하는 구조로 변환하여 표현함으로써 2개의 트리플 정보를 하나의 트리플 정보로 변환하는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
- 청구항 1에 있어서,상기 제3 단계에서 상기 의존 문법 구문 트리에 있는 각각의 노드는 Reserved Term(이하 'RT), Reserved Clue(이하 'RC), Relation Queue(이하 'RQ')의 세가지 데이터 구조를 보유하며, 상기 RT는 하나의 텀만을 보유하며, 상기 RC는 문자열을 보유하며, 상기 RQ는 Relation Block(여기서, Relation Block은 관계 트리플이 1개 이상 모인 집합)의 리스트를 보유하는 것을 특징으로 하는 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080106383A KR101012504B1 (ko) | 2008-10-29 | 2008-10-29 | 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출방법 |
PCT/KR2009/005265 WO2010050675A2 (ko) | 2008-10-29 | 2009-09-16 | 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080106383A KR101012504B1 (ko) | 2008-10-29 | 2008-10-29 | 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100047475A true KR20100047475A (ko) | 2010-05-10 |
KR101012504B1 KR101012504B1 (ko) | 2011-02-08 |
Family
ID=42129409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080106383A KR101012504B1 (ko) | 2008-10-29 | 2008-10-29 | 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출방법 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101012504B1 (ko) |
WO (1) | WO2010050675A2 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170088467A (ko) * | 2016-01-22 | 2017-08-02 | 서울대학교산학협력단 | 의미역 결정 기술을 활용한 온톨로지 기반 지식베이스 구축 방법 |
KR20200036367A (ko) * | 2018-09-28 | 2020-04-07 | 한국전자통신연구원 | 지식 그래프 기반 문장 분석 방법 |
KR20220072988A (ko) * | 2020-11-26 | 2022-06-03 | 주식회사 와이즈넛 | 지식 베이스 확장을 위한 인공기능 기반의 지식 트리플 추출 장치 및 그 방법 |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108874778B (zh) * | 2018-06-15 | 2023-01-17 | 广东蔚海数问大数据科技有限公司 | 语义实体关系抽取方法、装置及电子设备 |
CN108920614B (zh) * | 2018-06-28 | 2021-08-20 | 北京奇虎科技有限公司 | 在线查询数据的方法、装置及系统 |
CN109241538B (zh) * | 2018-09-26 | 2022-12-20 | 上海德拓信息技术股份有限公司 | 基于关键词和动词依存的中文实体关系抽取方法 |
CN110069639B (zh) * | 2019-04-01 | 2023-07-07 | 东华大学 | 一种构建甲状腺超声领域本体的方法 |
CN110134762B (zh) * | 2019-04-23 | 2023-07-11 | 南京邮电大学 | 基于事件主题分析的虚假信息识别系统及识别方法 |
CN110502642B (zh) * | 2019-08-21 | 2024-01-23 | 武汉工程大学 | 一种基于依存句法分析与规则的实体关系抽取方法 |
CN111160030B (zh) * | 2019-12-11 | 2023-09-19 | 北京明略软件系统有限公司 | 一种信息抽取方法、装置、及存储介质 |
US20230140938A1 (en) * | 2020-04-10 | 2023-05-11 | Nippon Telegraph And Telephone Corporation | Sentence data analysis information generation device using ontology, sentence data analysis information generation method, and sentence data analysis information generation program |
CN111651528A (zh) * | 2020-05-11 | 2020-09-11 | 北京理工大学 | 基于生成式对抗网络的开放式实体关系抽取方法 |
CN112434532B (zh) * | 2020-11-05 | 2024-05-28 | 西安交通大学 | 一种支持人机双向理解的电网环境模型及建模方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010088529A (ko) * | 2001-08-02 | 2001-09-28 | 정회경 | 전자문서 편집/변환처리장치와 그 방법 |
KR20030013656A (ko) * | 2001-08-08 | 2003-02-15 | 한국전자통신연구원 | 동적 질의어 튜닝 시스템 및 그 방법 |
KR100617318B1 (ko) * | 2004-12-08 | 2006-08-30 | 한국전자통신연구원 | 2단계 구문분석을 통한 자동 번역 장치 및 방법 |
KR100815563B1 (ko) * | 2006-08-28 | 2008-03-20 | 한국과학기술정보연구원 | Dbms 기반 지식 확장 및 추론 서비스 시스템 및 그방법 |
-
2008
- 2008-10-29 KR KR1020080106383A patent/KR101012504B1/ko active IP Right Grant
-
2009
- 2009-09-16 WO PCT/KR2009/005265 patent/WO2010050675A2/ko active Application Filing
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20170088467A (ko) * | 2016-01-22 | 2017-08-02 | 서울대학교산학협력단 | 의미역 결정 기술을 활용한 온톨로지 기반 지식베이스 구축 방법 |
KR20200036367A (ko) * | 2018-09-28 | 2020-04-07 | 한국전자통신연구원 | 지식 그래프 기반 문장 분석 방법 |
KR20220072988A (ko) * | 2020-11-26 | 2022-06-03 | 주식회사 와이즈넛 | 지식 베이스 확장을 위한 인공기능 기반의 지식 트리플 추출 장치 및 그 방법 |
Also Published As
Publication number | Publication date |
---|---|
WO2010050675A2 (ko) | 2010-05-06 |
WO2010050675A3 (ko) | 2010-06-24 |
KR101012504B1 (ko) | 2011-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101012504B1 (ko) | 의존 문법 구문 트리의 탐색을 통한 자동 관계 트리플 추출방법 | |
CN104679850B (zh) | 地址结构化方法及装置 | |
US20160048504A1 (en) | Conversion of interlingua into any natural language | |
CN108665141B (zh) | 一种从突发事件预案中自动抽取应急响应流程模型的方法 | |
Bond et al. | The combined wordnet bahasa | |
Kammoun et al. | The MORPH2 new version: A robust morphological analyzer for Arabic texts | |
CN106021224A (zh) | 一种双语篇章标注方法 | |
Borsley | Constructions, functional heads and comparative correlatives | |
Boguslavsky et al. | Development of a Dependency Treebank for Russian and its Possible Applications in NLP. | |
Azzopardi et al. | Integrating natural language and formal analysis for legal documents | |
Novák | Coreference Resolution System Not Only for Czech. | |
Höfler et al. | Constructing and exploiting an automatically annotated resource of legislative texts | |
Ogrodniczuk et al. | Rule-based coreference resolution module for Polish | |
Alkhalifa et al. | Automatically extending NE coverage of Arabic WordNet using Wikipedia | |
Pretkalniņa et al. | Universal Dependency treebank for Latvian: A pilot | |
Verma et al. | Representation of knowledge from software requirements expressed in natural language | |
Ramos et al. | Using Semantically Annotated Corpora to Build Collocation Resources. | |
KR101052004B1 (ko) | 번역서비스 제공방법 및 그 시스템 | |
Foufi et al. | Multilingual parsing and MWE detection | |
Habash et al. | Hybrid natural language generation from lexical conceptual structures | |
Augustinus et al. | The IPP effect in Afrikaans: a corpus analysis | |
Wallis | Searching treebanks and other structured corpora | |
Korobkin et al. | Extraction of structural elements of inventions from Russian-language patents | |
Çilden | Stemming Turkish words using snowball | |
Akeel et al. | Divergence and ambiguity control in an English to Arabic machine translation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20131231 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151229 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20161227 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20180102 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20190107 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20200106 Year of fee payment: 10 |