KR970017011A - 정보 검색시스템에서의 자동 색인방법 - Google Patents
정보 검색시스템에서의 자동 색인방법 Download PDFInfo
- Publication number
- KR970017011A KR970017011A KR1019950028809A KR19950028809A KR970017011A KR 970017011 A KR970017011 A KR 970017011A KR 1019950028809 A KR1019950028809 A KR 1019950028809A KR 19950028809 A KR19950028809 A KR 19950028809A KR 970017011 A KR970017011 A KR 970017011A
- Authority
- KR
- South Korea
- Prior art keywords
- word
- keyword
- words
- pairs
- index
- Prior art date
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 대량의 전자 도서 제작시 자동 색인어 추출방법과 자동 색인어 추출과 자동 하이퍼 텍스트마킹 그리고 질의어 분석시에 빈번하게 나타나는 동음이의어로 인해 발생하는 어의 모호성을 해소하기 위해 필요한 지식 베이스 구축기 및 이를 이용한 어의 모호성 해소방법에 관한 것이다.
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명에 따른 키워드망 구축과정을 나타내는 흐름도,
제3도는 색인어 자동 추출 과정을 설명사기 위한 순서도.
Claims (3)
- 어떤 단어와 의미적으로 관련있는 단어들을 저장하고 있는 키워드망을 구축하는 방법에 있어서, 백과사전을 사용하여 사전내의 표제어에 특정 기호나 문자를 사용한 마킹을 수행하는 제1과정과; 상기 제1과정을 통하여 마킹되어진 표제어에서 단어쌍들을 추출하여 소정양식의 가중치를 할당하는 제2과정과; 상기 제2과정을 통하여 동일 가중을 할당받는 단어쌍들로 대칭화일을 형성하는 제3과정과; 한글로 시작하는 단어쌍들을 시작 자소별로 분류하고 한글이외의 단어쌍을 하나로 하여 소정갯수의 화일로 합병하여 정렬하는 제4과정과; 상지 제4과정을 통하여 동일 화일내에 정렬되어진 단어쌍 가운데 중복되어진 단어쌍에 대하여 각각의 가중치를 합하여 해당 단어쌍의 가중치를변화시키는 제5과정; 및 상기 제5과정이 종료되어진 후 각 표제어를 기준으로 연관된 단어쌍들들 가중치를 내림차순으로 정렬하여 키워드망을 형성하는 제6과정을 포함하는 것을 특징으로 하는 정보 검색시스템에서의 어의 모호성 해소를 위한 키위드망 형성 방법.
- 명사, 복합명사, 조사를 포함한 의미있는 어구등을 포함하는 키워드 사전을 구비하고 색인어를 자동 등록하는 방법에 있어서, 임의의 문장을 어절의 단위로 분리하는 제1과정과; 상기 제1과정에서 분리된 어절이 키워드 사전에 있는가를 검색하는 제2과정과; 상기 제2과정을 통하여 해당 어절이 키워드 사전에 속하고 동시에 이 어절로 시작하는 다른 형태의 키워드가 키워드 사전에 존재하는 경우 상기 어절을 색인어 후보로 추출하는 제3과정과; 상기 제2과정을 통하여 해당 어절이 키워드 사전에 속하고 이 어절로 시작하는 다른 형태의 키워드가 키워드 사전에 존재하지 않는 경우 상기 어절을 특정 기호나 문자를 사용한 마킹을 통하여 색인어로 등록하는 제4과정과; 상기 제2과정을 통하여 해당 어절이 키워드 사전에 속하지 않고 상기 어절로 시작하는 다른 형태의 키워드가 키워드 사전에 존재하는 경우 색인어 후보로 결정을 유보하는 제5과정; 및 상기 제2과정을 통하여 해당 어절이 키워드 사전에 속하지 않고 상기 어절로 시작하는 다른 형태의 키워드가 키워드 사전에 없는 경우 상기 어절 이전까지 결정된 색인어를 특정 기호나 문자를 사용한 마킹을 통하여 색인어를 등록하는 제6과정을 포함하는 것을 특징으로 하는 정보 검색시스템에서의 색인어 자동 등록방법.
- 어떤 단어와 의미적으로 관련있는 단어들을 저장하고 있는 키워드망에 기반한 정보 검색시스템의 자동 색인어 추출과 자동 하이퍼텍스트 추출시 동음이의어의 어의 모호성을 해소하기 위한 방법에 있어서, 각각의 키워드(색인어)가 동음이의어 인가를 동음이의어 데이타 베이스를 사용하여 검색하는 제1과정과; 상기 제1과정의 검색에서 동음이의어에 해당하는 경우 키워드망에서 동음이의어가 가지는 어의에 대한 종류와 갯수에 대한 데이타를 억세스하는 제2과정과; 상기 제2과정을 통하여 억세스되어진 각각의 어의에 대하여 각각의 키워드 확장리스트를 상기 키워드 망에서 억세스하는 제3과정과; 상기 제3과정에서 억세스 되어진 각각의 어의에 대한 키워드 확장리스트에서 모호성 해소 대상이 되는 단어 이외의 단어들에 대한 키워드 확장 리스트와 공통적인 단어의 갯수가 많은 어의순으로 정렬하는 제4과정; 상기 제4과정을 통해 임계값을 기준으로 어의를 선택하는 제5과정을 포함하는 것을 특징으로 하는 어의 모호성 해소 방법.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950028809A KR970017011A (ko) | 1995-09-04 | 1995-09-04 | 정보 검색시스템에서의 자동 색인방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950028809A KR970017011A (ko) | 1995-09-04 | 1995-09-04 | 정보 검색시스템에서의 자동 색인방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR970017011A true KR970017011A (ko) | 1997-04-28 |
Family
ID=66597102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950028809A KR970017011A (ko) | 1995-09-04 | 1995-09-04 | 정보 검색시스템에서의 자동 색인방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR970017011A (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100374114B1 (ko) * | 1999-06-28 | 2003-03-03 | 한국전자통신연구원 | 에이치티엠엘 기반 한글 용어/약어 하이퍼링크 생성기 |
CN115098617A (zh) * | 2022-06-10 | 2022-09-23 | 杭州未名信科科技有限公司 | 三元组关系抽取任务的标注方法、装置、设备及存储介质 |
-
1995
- 1995-09-04 KR KR1019950028809A patent/KR970017011A/ko not_active Application Discontinuation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100374114B1 (ko) * | 1999-06-28 | 2003-03-03 | 한국전자통신연구원 | 에이치티엠엘 기반 한글 용어/약어 하이퍼링크 생성기 |
CN115098617A (zh) * | 2022-06-10 | 2022-09-23 | 杭州未名信科科技有限公司 | 三元组关系抽取任务的标注方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2005203239B2 (en) | Phrase-based indexing in an information retrieval system | |
KR100813806B1 (ko) | 중심용어사전을 이용한 표제어의 중심용어 추출 방법 및그를 이용한 정보 검색 시스템 및 그 방법 | |
EP0597630B1 (en) | Method for resolution of natural-language queries against full-text databases | |
KR100666064B1 (ko) | 인터랙티브 검색 쿼리 개선 시스템 및 방법 | |
JP5038939B2 (ja) | 情報検索システム、方法及びプログラム | |
US9619571B2 (en) | Method for searching related entities through entity co-occurrence | |
CN105045852A (zh) | 一种教学资源的全文搜索引擎系统 | |
WO2002039320A1 (en) | Method for structuring and searching information | |
US20070136248A1 (en) | Keyword driven search for questions in search targets | |
Chen et al. | Template detection for large scale search engines | |
CN104850574A (zh) | 一种面向文本信息的敏感词过滤方法 | |
KR100847376B1 (ko) | 질의어 자동 추출을 이용한 검색 방법 및 장치 | |
JP2012230713A (ja) | 検索方法、類似度計算方法、類似度計算及び同一文書照合システムと、そのプログラム | |
Wechsler et al. | Multi-language text indexing for internet retrieval | |
Ridley | An expert system for quality control and duplicate detection in bibliographic databases | |
KR20020072092A (ko) | 단락 단위의 실시간 응답 색인을 이용한 자연어 질의-응답검색시스템 | |
JP2005242416A (ja) | 自然言語文の検索方法および検索装置 | |
CN105426551A (zh) | 文言文搜索方法和装置 | |
KR20030006201A (ko) | 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템 | |
Matsuoka et al. | Examination of effective features for CRF-based bibliography extraction from reference strings | |
KR970017011A (ko) | 정보 검색시스템에서의 자동 색인방법 | |
KR100659370B1 (ko) | 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법 | |
US20080027935A1 (en) | Anchored search engine results display | |
KR20020054254A (ko) | 사전구조를 이용한 한국어 형태소 분석방법 | |
KR20010107810A (ko) | 웹 검색시스템 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |