KR20140052328A - Rdf 기반의 문장 온톨로지 생성 장치 및 방법 - Google Patents
Rdf 기반의 문장 온톨로지 생성 장치 및 방법 Download PDFInfo
- Publication number
- KR20140052328A KR20140052328A KR1020120118333A KR20120118333A KR20140052328A KR 20140052328 A KR20140052328 A KR 20140052328A KR 1020120118333 A KR1020120118333 A KR 1020120118333A KR 20120118333 A KR20120118333 A KR 20120118333A KR 20140052328 A KR20140052328 A KR 20140052328A
- Authority
- KR
- South Korea
- Prior art keywords
- rdf
- sentence
- ontology
- predicate
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
Description
도 2는 본 발명의 실시 예에 따른 RDF 기반의 문장 온톨로지 생성 장치의 문장 분석부를 도시한 블록도이다.
도 3은 본 발명의 일 실시 예에 따른 RDF 기반의 문장 온톨로지 생성 장치의 RDF 생성부를 도시한 블록도이다.
도 4은 본 발명의 일 실시 예에 따른 RDF 기반의 문장 온톨로지 생성 장치의 RDF 확장부를 도시한 블록도이다.
도 5는 본 발명의 RDF 기반의 문장 온톨로지 생성 방법을 설명하기 위한 흐름도이다.
도 6는 본 발명의 RDF 기반의 문장 온톨로지 생성 방법을 설명하기 위한 예시도이다.
110: 문장 분리 모듈 130: 형태소 분석 모듈
150: 품사 태깅 모듈 170: 구문 분석 모듈
200: RDF 생성부(200) 210: 논항 추출 모듈
230: 술어 추출 모듈 300: RDF 확장부(300)
310: 원형 변환 모듈 330: 동의어 변환 모듈
350: RDF 수집 모듈
Claims (12)
- 자연어 문장을 형태소 단위로 구분하여 품사를 태깅하고, 상기 태깅된 품사에 기초하여 상기 문장의 구문 구조를 분석하는 문장 분석부; 및
상기 문장 분석부로부터 전달받은 구문 구조를 기반으로, 상기 문장의 술어 및 논항 요소들을 추출하고, 추출된 술어 및 논항 요소를 연결하여 RDF 트리플을 생성하는 RDF 생성부; 및
상기 RDF 생성부로부터 전달 받은 RDF 트리플의 각 요소들을 원형으로 변형하고, 유사어 및 동의어를 이용하여 상기 RDF 트리플의 각 요소들을 정규화하여 문장 온톨로지를 생성하는 RDF 확장부;
를 포함하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 장치. - 제 1 항에 있어서,
상기 문장 분석부는,
상기 문장을 형태소 단위로 분리하는 형태소 분석 모듈;
상기 형태소 분석 모듈로부터 전달 받은 형태소에 해당 품사를 태깅하는 품사 태깅 모듈; 및
상기 품사 태깅 모듈로부터 전달 받은 형태소의 품사 정보를 기반으로 상기 문장의 구문 구조를 분석하는 구문 분석 모듈;
를 포함하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 장치. - 제 2 항에 있어서,
상기 문장 분석부는,
하나 이상의 문장을 포함하는 문서를 입력 받아, 상기 문서를 문장 단위로 분리하는 문장 분리 모듈을 더 포함하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 장치. - 제 1 항에 있어서,
상기 RDF 생성부는,
상기 문장 분석부로부터 전송 받은 구문 구조의 동사를 술어로 추출하는 술어 추출 모듈; 및
상기 술어 추출 모듈이 추출한 술어의 논항 구조에 따라서, 상기 문장으로부터 상기 술어에 대응하는 논항 요소들을 추출하고, 추출된 술어 및 논항 요소를 연결하여 RDF 트리플을 생성하는 논항 추출 모듈;
을 포함하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 장치. - 제 1 항에 있어서,
상기 RDF 확장부는,
상기 RDF 생성부로부터 RDF 트리플을 전송 받아, 술어와 각 논항을 원형으로 변환하는 원형 변형 모듈; 및
상기 원형으로 변환 된 RDF트리플의 각 요소를 동의어, 유의어 사전에 따라 동의어 또는 유의어로 대체하여, 동일 의미를 갖는 하나 이상의 RDF 트리플을 더 생성하여 문장 온톨로지에 저장하는 동의어 변환 모듈;
을 포함하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 장치. - 제 5 항에 있어서,
상기 RDF 확장부는,
RDF 형태로 저장된 외부 리소스로부터 상기 생성한 RDF 트리플의 각 요소에 대한 정보를 획득하여 문장 온톨로지에 추가하는 RDF 수집 모듈을 더 포함하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 장치. - 자연어 문장을 형태소 단위로 분리하는 단계;
상기 분리된 각 형태소의 품사를 태그하고, 상기 각 형태소에 태그된 품사에 따라 구문 구조를 생성하는 단계;
상기 생성된 구문 구조의 동사로부터 술어를 추출하고, 상기 추출된 술어의 논항 구조에 따라 논항 요소들을 추출하여 RDF 트리플을 생성하는 단계;
상기 RDF 트리플을 원형으로 변경하고, 문장 온톨로지에 저장하는 단계;
를 포함하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 방법. - 제 7 항에 있어서,
상기 형태소 단위로 분리하는 단계는,
하나 이상의 문장을 포함하는 문서를 입력 받아, 입력된 문서에서 문장을 분리하는 단계를 더 포함하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 방법. - 제 7 항에 있어서,
상기 문장 온톨로지를 저장하는 단계는,
RDF 트리플을 매핑 테이블 형태로 저장하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 방법. - 제 7 항에 있어서,
상기 온톨로지를 저장하는 단계는,
원형으로 변환 된 RDF트리플의 각 요소를 동의어, 유의어 사전에 따라 동의어 또는 유의어로 대체하여, 동일 의미를 갖는 하나 이상의 RDF 트리플을 더 생성하여 문서 온톨로지에 저장하는 단계를 더 포함하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 방법. - 제 8 항에 있어서,
상기 온톨로지를 저장하는 단계는,
RDF 형태로 저장된 외부 리소스로부터 RDF 트리플의 각 요소에 대한 정보를 획득하여 문장 온톨로지에 추가하는 단계를 더 포함하는 것을 특징으로 하는 RDF 기반의 문장 온톨로지 생성 방법. - 제8항 내지 제11항 중 어느 한 항에 기재된 RDF 기반의 문장 온톨로지 생성 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능한 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120118333A KR20140052328A (ko) | 2012-10-24 | 2012-10-24 | Rdf 기반의 문장 온톨로지 생성 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120118333A KR20140052328A (ko) | 2012-10-24 | 2012-10-24 | Rdf 기반의 문장 온톨로지 생성 장치 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20140052328A true KR20140052328A (ko) | 2014-05-07 |
Family
ID=50885584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120118333A Ceased KR20140052328A (ko) | 2012-10-24 | 2012-10-24 | Rdf 기반의 문장 온톨로지 생성 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20140052328A (ko) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160000132A (ko) * | 2014-06-24 | 2016-01-04 | 주식회사 아이디인큐 | 데이터 처리 시스템 및 데이터 처리 시스템의 동작 방법 |
WO2016117920A1 (ko) * | 2015-01-20 | 2016-07-28 | 한국과학기술원 | 지식표현 확장 방법 및 장치 |
JP2016162054A (ja) * | 2015-02-27 | 2016-09-05 | 日本放送協会 | オントロジー生成装置、メタデータ出力装置、コンテンツ取得装置、オントロジー生成方法及びオントロジー生成プログラム |
KR20160108886A (ko) * | 2015-03-09 | 2016-09-21 | 포항공과대학교 산학협력단 | 개방형 정보 추출을 이용한 지식베이스 확장 방법 및 장치 |
WO2017122904A1 (ko) * | 2016-01-11 | 2017-07-20 | 한국과학기술원 | 구체화된 삼항 관계 추출을 위한 개방형 정보 추출 방법 및 시스템 |
WO2018096514A1 (en) | 2016-11-28 | 2018-05-31 | Thomson Reuters Global Resources | System and method for finding similar documents based on semantic factual similarity |
EP3404553A4 (en) * | 2016-01-11 | 2019-01-16 | Korea Advanced Institute of Science and Technology | METHOD AND SYSTEM FOR EXTRACTION OF OPEN INFORMATION FOR EXTRACTION OF TEMPERED REINFORCED RELATIONSHIP |
WO2022191368A1 (ko) * | 2021-03-09 | 2022-09-15 | 주식회사 마이데이터랩 | 자연어 의도를 분류하는 뉴럴 네트워크 훈련을 위한 데이터 처리 방법 및 장치 |
KR20230014040A (ko) * | 2021-07-20 | 2023-01-27 | 국민대학교산학협력단 | 계층 기반 단어 대체를 통한 텍스트 데이터 증강 장치 및 방법 |
-
2012
- 2012-10-24 KR KR1020120118333A patent/KR20140052328A/ko not_active Ceased
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160000132A (ko) * | 2014-06-24 | 2016-01-04 | 주식회사 아이디인큐 | 데이터 처리 시스템 및 데이터 처리 시스템의 동작 방법 |
WO2016117920A1 (ko) * | 2015-01-20 | 2016-07-28 | 한국과학기술원 | 지식표현 확장 방법 및 장치 |
JP2016162054A (ja) * | 2015-02-27 | 2016-09-05 | 日本放送協会 | オントロジー生成装置、メタデータ出力装置、コンテンツ取得装置、オントロジー生成方法及びオントロジー生成プログラム |
KR20160108886A (ko) * | 2015-03-09 | 2016-09-21 | 포항공과대학교 산학협력단 | 개방형 정보 추출을 이용한 지식베이스 확장 방법 및 장치 |
WO2017122904A1 (ko) * | 2016-01-11 | 2017-07-20 | 한국과학기술원 | 구체화된 삼항 관계 추출을 위한 개방형 정보 추출 방법 및 시스템 |
EP3404553A4 (en) * | 2016-01-11 | 2019-01-16 | Korea Advanced Institute of Science and Technology | METHOD AND SYSTEM FOR EXTRACTION OF OPEN INFORMATION FOR EXTRACTION OF TEMPERED REINFORCED RELATIONSHIP |
US20180150459A1 (en) | 2016-11-28 | 2018-05-31 | Thomson Reuters Global Resources | System and method for finding similar documents based on semantic factual similarity |
WO2018096514A1 (en) | 2016-11-28 | 2018-05-31 | Thomson Reuters Global Resources | System and method for finding similar documents based on semantic factual similarity |
EP3542259A4 (en) * | 2016-11-28 | 2020-08-19 | Thomson Reuters Enterprise Centre GmbH | SYSTEM AND METHOD FOR FINDING SIMILAR DOCUMENTS ON THE BASIS OF SEMANTIC FACTICAL SIMILARITY |
US11934465B2 (en) | 2016-11-28 | 2024-03-19 | Thomson Reuters Enterprise Centre Gmbh | System and method for finding similar documents based on semantic factual similarity |
WO2022191368A1 (ko) * | 2021-03-09 | 2022-09-15 | 주식회사 마이데이터랩 | 자연어 의도를 분류하는 뉴럴 네트워크 훈련을 위한 데이터 처리 방법 및 장치 |
KR20220126493A (ko) * | 2021-03-09 | 2022-09-16 | 주식회사 마이데이터랩 | 자연어 의도를 분류하는 뉴럴 네트워크 훈련을 위한 데이터 처리 방법 및 장치 |
KR20230014040A (ko) * | 2021-07-20 | 2023-01-27 | 국민대학교산학협력단 | 계층 기반 단어 대체를 통한 텍스트 데이터 증강 장치 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20140052328A (ko) | Rdf 기반의 문장 온톨로지 생성 장치 및 방법 | |
Deeptimahanti et al. | Semi-automatic generation of UML models from natural language requirements | |
Shinde et al. | Nlp based object oriented analysis and design from requirement specification | |
Al-Taani et al. | A top-down chart parser for analyzing arabic sentences. | |
Etaiwi et al. | Graph-based Arabic text semantic representation | |
SABRIYE et al. | AN APPROACH FOR DETECTING SYNTAX AND SYNTACTIC AMBIGUITY IN SOFTWARE REQUIREMENT SPECIFICATION. | |
KR101757222B1 (ko) | 한글 문장에 대한 의역 문장 생성 방법 | |
KR101409298B1 (ko) | 한국어 구문 인식을 위한 어휘의미패턴 재구성 방법 | |
Borin et al. | Chapter 8. Linguistics vs. language technology in constructicon building and use | |
Shrawankar et al. | Construction of news headline from detailed news article | |
Shatnawi et al. | Parse trees of arabic sentences using the natural language toolkit | |
Tiwari et al. | Mold-a framework for entity extraction and summarization | |
Amdouni et al. | Semantic annotation of requirements for automatic UML class diagram generation | |
Maranduc | A Multiform Balanced Dependency Treebank for Romanian | |
Ouersighni | Robust rule-based approach in Arabic processing | |
KR101092355B1 (ko) | 대용어 복원 방법 | |
Hensman et al. | Constructing conceptual graphs using linguistic resources | |
JP2007133905A (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
Patel et al. | Resolve the uncertainity in requirement specification to generate the UML diagram | |
Temizer et al. | Automatic subject-object-verb relation extraction | |
Frank et al. | Building literary corpora for computational literary analysis-a prototype to bridge the gap between CL and DH | |
Dione | Finite-state tokenization for a deep Wolof LFG grammar | |
Neumann et al. | HPSG-DOP: Data-oriented parsing with HPSG | |
Dixit et al. | Design of an automatic ontology construction mechanism using semantic analysis of the documents | |
Do | Building a Vietnamese lexicon ontology for syntactic parsing and document annotation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20121024 |
|
PG1501 | Laying open of application | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20170829 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20121024 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20181024 Patent event code: PE09021S01D |
|
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20190326 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20181024 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |