KR100331029B1 - 한국어개념분류체계구축방법과,수정방법및구축장치 - Google Patents
한국어개념분류체계구축방법과,수정방법및구축장치 Download PDFInfo
- Publication number
- KR100331029B1 KR100331029B1 KR1019980050332A KR19980050332A KR100331029B1 KR 100331029 B1 KR100331029 B1 KR 100331029B1 KR 1019980050332 A KR1019980050332 A KR 1019980050332A KR 19980050332 A KR19980050332 A KR 19980050332A KR 100331029 B1 KR100331029 B1 KR 100331029B1
- Authority
- KR
- South Korea
- Prior art keywords
- semantic
- error
- classification
- sentence
- information
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000010276 construction Methods 0.000 title claims abstract description 15
- 239000003550 marker Substances 0.000 claims description 4
- 238000003058 natural language processing Methods 0.000 description 8
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Creation or modification of classes or clusters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (11)
- 사용자 인터페이스장치와,상기 사용자 인터페이스장치를 통해 형태소 단위로 품사가 부착된 문장이 입력되면 상기 문장의 구문분석과 의미분석을 수행하는 구문/의미 분석모듈,상기 문장을 통해 제공되는 어휘에 대한 국어사전적 정의와, 백과사전적 정의, 및 용례 등을 탐색하는 세계 지식베이스 탐색모듈,상기 각 어휘별로 특성을 추가, 삭제, 편집하는 언어 지식베이스 탐색/편집모듈, 및작업의 진행을 관리하는 진행관리모듈을 포함한 것을 특징으로 하는 한국어 개념분류체계 구축장치.
- 제1항에 있어서, 상기 어휘의 개념분류체계를 수정할 때, 객관적인 절차에 따라 작업자에게 필요한 정보와 절차를 제공하는 개념분류 탐색/편집모듈을 더 포함한 것을 특징으로 하는 한국어 개념분류체계 구축장치.
- 형태소 단위로 품사가 부착된 문장이 입력되면, 상기 문장의 구문과 의미를 분석하는 제1단계와,상기 제1단계의 분석 결과, 문장의 구문적 애매성이 존재하면, 문장의 구문규칙 오류와, 전자사전의 구문정보 오류, 및 전자사전의 의미정보 오류 여부를 판단하여, 해당되는 오류 정보를 수정하는 제2단계,상기 제1단계의 분석 결과, 문장의 의미적 애매성이 존재하면, 전자사전의 의미정보 오류 여부를 판단하여 오류 정보를 수정하는 제3단계,상기 제1단계의 분석 결과, 구문적 애매성과 의미적 애매성이 존재하지 않지만 의미 선택 오류가 존재하면, 전자사전의 의미정보 오류 여부를 판단하여 오류 정보를 수정하는 제4단계, 및상기 구문적 애매성과 의미적 애매성 및 의미 선택 오류가 존재하지 않으면, 구문구조와 의미표지가 바르게 부착된 문장으로 출력하는 제5단계를 포함한 것을 특징으로 하는 한국어 개념분류체계 구축방법.
- 제3항에 있어서, 문장의 애매성을 해소하기 위하여 개념분류체계를 세분화할 필요가 있을 경우에는 개념분류체계를 수정하고, 문장 자체의 애매성에 의해 더 이상 개념분류체계를 세분화할 필요가 없을 경우에는 애매성이 내포된 문장을 출력하는 제6단계를 더 포함한 것을 특징으로 하는 한국어 개념분류체계 구축방법.
- 제3항 또는 제4항에 있어서, 상기 제2단계는,상기 구문규칙 오류가 발생하면, 잘못된 구문규칙을 제거하고 새로운 구문규칙을 추가하며 기준의 구문규칙을 세분화하여, 구문규칙을 수정하는 제7단계와,상기 전자사전의 구문정보 오류가 발생하면, 자연어 분석을 위해 필요한 정보들을 추가, 삭제, 수정하여, 전자사전의 구문정보를 수정하는 제8단계, 및상기 전자사전의 의미정보 오류가 발생하면, 표제어별로 전자사전에 기록되어 있는 의미정보의 오류를 수정하거나, 필요 없는 정보를 삭제하고 필요한 정보를 추가하여, 전자사전의 의미정보를 수정하는 제9단계를 포함한 것을 특징으로 하는 한국어 개념분류체계 구축방법.
- 제3항 또는 제4항에 있어서, 제3단계 및 제4단계는,상기 전자사전의 의미정보 오류가 발생하면, 표제어별로 전자사전에 기록되어 있는 의미정보의 오류를 수정하거나, 필요 없는 정보를 삭제하고 필요한 정보를 추가하여 전자사전의 의미정보를 수정하는 제10단계를 포함한 것을 특징으로 하는 한국어 개념분류체계 구축방법.
- 개념분류체계의 세분화가 필요한 어휘()에 대한 개념분류체계 구축에 사용될 의미들()을 찾아내는 제1단계와,상기 의미들()의 의미 범위가 명확해질 때까지 정해진 단계에 따라 의미를 제한하는 제2단계,상기 의미들()의 범위가 명확해지면, 의미들()의 개념을 포괄할 수 있는 어휘분류노드(C)가 존재하는 지를 판단하여, 해당되는 어휘분류노드의 어휘집합에 상기 어휘()를 등록하는 제3단계,상기 제3단계에서, 상기 의미들()이 어휘분류노드(C)나 그 하위 분류에속하지 않으면, 상기 어휘()를 분류불가집합에 등록하는 제4단계, 및상기 제3단계에서, 상기 의미들()이 어휘분류노드(C)의 하위 분류에 속하면, 상기 어휘분류노드에 새로운 하위 분류를 만들고 상기 어휘()를 새로운 하위 분류에 등록하는 제5단계를 포함한 것을 특징으로 하는 한국어 개념분류체계 수정방법.
- 제7항에 있어서, 상기 제1단계는,국어사전과 백과사전을 탐색하여 개념분류체계 구축에 사용할 의미의 종류를 선택하고, 구문/의미 해석과정에서 필요한 새로운 의미를 추가하는 단계인 것을 특징으로 하는 한국어 개념분류체계 수정방법.
- 제7항에 있어서, 상기 제2단계는,의미들() 자체를 이용하여 개념의 범위를 제한하는 제6단계와,유의어들과의 공통점과 유사점을 파악하여 개념적으로 상기 의미들()의 범위를 제한하는 제7단계,상기 의미들()이 포함되는 예문에 따라서 상기 의미들()의 개념범위를 제한하는 제8단계, 및상기 의미들() 범위에 대한 여론을 통일시켜 상기 의미들()의 의미영역을 명확하게 하는 제 9단계를 포함한 것을 특징으로 하는 한국어 개념분류체계 수정방법.
- 제7항에 있어서, 상기 제5단계는,상기 의미들()이 개념분류노드(C)의 하위 분류로 판단되면, 상기 개념분류노드의 다른 하위 분류(Ck)와 구별되는 특징이 있는 지를 판단하는 제10단계와,상기 제10단계의 판단 결과, 구별되는 특징이 있으면 상기 개념분류노드에 속하는 새로운 어휘분류를 만들고, 상기 어휘()를 상기 새로운 어휘분류에 등록하는 제11단계,상기 제10단계의 판단 결과, 구별되는 특징이 없으면 상기 어휘()를 대기집단에 넣는 제12단계, 및상기 대기집단에 모인 어휘들중 공통 특징으로 그룹핑되는 단어들을 모아서 하나의 어휘분류를 만들고, 상기 어휘()를 상기 새로운 어휘분류에 등록하는 제13단계를 포함한 것을 특징으로 하는 한국어 개념분류체계 수정방법.
- 제10항에 있어서, 상기 제11단계 또는 제13단계에서 새롭게 만들어진 하위 분류와 기존의 하위 분류가 개념적으로 그룹핑되는 지를 판단하는 제14단계와,상기 제14단계에서 그룹핑되는 개념들이 있으면, 상기 개념분류노드에 속하는 새로운 어휘분류를 만드는 제15단계를 포함한 것을 특징으로 하는 한국어 개념분류체계 수정방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019980050332A KR100331029B1 (ko) | 1998-11-24 | 1998-11-24 | 한국어개념분류체계구축방법과,수정방법및구축장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019980050332A KR100331029B1 (ko) | 1998-11-24 | 1998-11-24 | 한국어개념분류체계구축방법과,수정방법및구축장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20000033464A KR20000033464A (ko) | 2000-06-15 |
KR100331029B1 true KR100331029B1 (ko) | 2002-09-04 |
Family
ID=19559409
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019980050332A KR100331029B1 (ko) | 1998-11-24 | 1998-11-24 | 한국어개념분류체계구축방법과,수정방법및구축장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100331029B1 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010108586A (ko) * | 2000-05-29 | 2001-12-08 | 우요섭 | 의미정보를 이용한 이단계 단문 분할 장치 |
KR100378642B1 (ko) * | 2000-07-06 | 2003-03-31 | 김시환 | 정보 검색 시스템과 그 방법 |
KR100421530B1 (ko) * | 2001-03-06 | 2004-03-09 | 김시환 | 정보 검색 방법 |
KR100413966B1 (ko) * | 2000-12-18 | 2004-01-07 | 한국전자통신연구원 | 한국어 표준 문형 규칙에 의한 표준 문형 유도 장치 및 그방법 |
KR100515641B1 (ko) * | 2003-04-24 | 2005-09-22 | 우순조 | 모빌적 형상 개념을 기초로 한 구문 분석방법 및 이를이용한 자연어 검색 방법 |
KR100703697B1 (ko) * | 2005-02-02 | 2007-04-05 | 삼성전자주식회사 | 어휘 그룹 트리를 이용한 어휘 인식 방법 및 장치 |
KR101491581B1 (ko) * | 2008-04-07 | 2015-02-24 | 삼성전자주식회사 | 철자 오류 보정 시스템 및 방법 |
CN107292505A (zh) * | 2017-06-15 | 2017-10-24 | 北京航天长征科技信息研究所 | 非相关文献隐性关联知识发现方法在产品研发中的应用 |
CN114510548B (zh) * | 2021-12-29 | 2025-01-10 | 北京空间飞行器总体设计部 | 面向航天器试验鉴定评估的词典构建及分类的方法及装置 |
-
1998
- 1998-11-24 KR KR1019980050332A patent/KR100331029B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
KR20000033464A (ko) | 2000-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5878385A (en) | Method and apparatus for universal parsing of language | |
JP3114181B2 (ja) | 異言語交信用翻訳方法およびシステム | |
US6965857B1 (en) | Method and apparatus for deriving information from written text | |
US5680628A (en) | Method and apparatus for automated search and retrieval process | |
US5652896A (en) | Language conversion system and text creating system using such | |
US10296584B2 (en) | Semantic textual analysis | |
EP0971294A2 (en) | Method and apparatus for automated search and retrieval processing | |
EP0381288A1 (en) | Method and system for the representation of multiple analyses in dependency grammar and parser for generating such representation | |
US20060286540A1 (en) | Automated essay scoring | |
WO1998011491A9 (en) | Method and apparatus for universal parsing of language | |
WO1997004405A9 (en) | Method and apparatus for automated search and retrieval processing | |
US20030055625A1 (en) | Linguistic assistant for domain analysis methodology | |
Merlo | A corpus-based analysis of verb continuation frequencies for syntactic processing | |
KR100331029B1 (ko) | 한국어개념분류체계구축방법과,수정방법및구축장치 | |
Kaplan | Lexical resource reconciliation in the Xerox Linguistic Environment | |
Jing | Cut-and-paste text summarization | |
Chrupala | Acquiring verb subcategorization from spanish corpora | |
Nirenburg et al. | The analysis lexicon and the lexicon management system | |
Gurevych et al. | Annotating the semantic consistency of speech recognition hypotheses | |
JP2005134691A (ja) | ネットワークを経由した教育システムの自動採点装置 | |
JP2840258B2 (ja) | 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法 | |
Hoeppner | A multilayered approach to the handling of word formation | |
Smith | A Question-Answering System for Elementary Mathematics. | |
Galicia-Haro et al. | Acquiring syntactic information for a government pattern dictionary from large text corpora | |
Reitter et al. | Hybrid natural language processing in a customer-care environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19981124 |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 19981124 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20001228 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20011227 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20020320 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20020321 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20050302 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20060302 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20070302 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20080307 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20080307 Start annual number: 7 End annual number: 7 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |