KR100885527B1 - 문맥 기반 색인데이터 생성장치와 문맥기반 검색장치 및 그방법 - Google Patents
문맥 기반 색인데이터 생성장치와 문맥기반 검색장치 및 그방법 Download PDFInfo
- Publication number
- KR100885527B1 KR100885527B1 KR1020070107155A KR20070107155A KR100885527B1 KR 100885527 B1 KR100885527 B1 KR 100885527B1 KR 1020070107155 A KR1020070107155 A KR 1020070107155A KR 20070107155 A KR20070107155 A KR 20070107155A KR 100885527 B1 KR100885527 B1 KR 100885527B1
- Authority
- KR
- South Korea
- Prior art keywords
- search
- index data
- context
- key phrase
- information
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (14)
- 색인생성의 대상이 되는 대상문서가 입력되는 입력부;상기 입력된 대상문서에서 색인데이터 생성의 단위 구문인 키프레이즈를 생성하는 생성부; 및상기 대상문서의 위치정보를 포함하는 아이디정보와 상기 생성된 키프레이즈 가 상호 연계된 색인 데이터를 생성하는 색인데이터생성부를 포함하고,상기 키프레이즈는,상기 대상문서에서 기술되고 있는 주대상 단어인 화제어 또는 상기 화제어가 상기 대상문서에서 가지는 내용적 의미인 문맥범주정보로 구성되며,상기 생성부는,형태소 패턴과 상기 형태소 패턴에 해당하는 문맥범주정보가 연계된 문맥패턴정보가 저장된 문맥패턴정보DB부;상기 입력된 대상문서를 대상으로 형태소 패턴 분석을 수행하는 형태소분석부; 및상기 형태소 패턴 분석 결과에 대응하는 상기 문맥패턴정보의 형태소 패턴이 존재하는 경우, 상기 행태소 패턴에 해당하는 문맥범주정보와 상기 형태소 패턴을 구성하는 화제어로 상기 키프레이즈를 생성하는 키프레이즈생성부를 포함하는 것을 특징으로 하는 문맥기반 색인데이터 생성장치.
- 제 1항에 있어서, 상기 키프레이즈는,상기 대상문서의 문장 또는 문단 단위로 생성되는 것을 특징으로 하는 문맥기반 색인데이터 생성장치.
- 삭제
- 제 1항에 있어서, 상기 색인데이터생성부는,타 기반 색인데이터와 상기 키프레이즈 기반의 색인데이터를 병합하여 색인데이터베이스를 생성하되, 상기 키프레이즈 기반의 색인데이터가 타 색인데이터와 구분 가능하도록 상기 색인데이터베이스를 생성하는 것을 특징으로 하는 문맥기반 색인데이터 생성장치.
- 사용자로부터 원하는 검색어를 입력받는 검색입력부;상기 입력된 검색어를 키프레이즈 형태 검색어로 변환하는 변환부;색인생성의 대상이 되는 대상문서의 키프레이즈와 상기 대상문서의 위치정보를 포함하는 아이디정보가 상호 연계된 색인데이터가 저장되는 색인데이터저장부; 및상기 키프레이즈 형태 검색어와 상기 색인데이터를 비교하여 상기 키프레이즈 형태 검색어에 해당하는 색인데이터의 문서를 제공하는 검색결과제공부를 포함하고,상기 키프레이즈는,상기 대상문서에서 기술되고 있는 주대상 단어인 화제어 또는 상기 화제어가 상기 대상문서에서 가지는 내용적 의미인 문맥범주정보로 구성되는 것을 특징으로 하는 문맥기반 검색장치.
- 제 5항에 있어서, 상기 변환부는,입력된 검색어의 내용적 의미를 기준으로 상기 입력된 검색어에 해당하는 정규화형태정보가 저장되는 정규화정보저장부;상기 입력된 검색어에서 불용어를 제거하는 불용어제거부; 및상기 불용어가 제거된 검색어를 대응되는 정규화형태정보로 변환하고, 부가어를 제거하여 상기 키프레이즈 형태 검색어로 변환하는 검색어변환부를 포함하는 것을 특징으로 하는 문맥기반 검색장치.
- 제 5항에 있어서, 상기 검색결과제공부는,상기 키프레이즈 형태 검색어에 해당하는 색인데이터를 키프레이즈의 종류별로 그룹핑하여 출력하는 것을 특징으로 하는 문맥기반 검색장치.
- 제 5항에 있어서, 상기 검색결과제공부는,상기 키프레이즈 형태의 검색어에 부합되는 정도에 따라 상기 색인데이터에 우선순위를 부여하여 출력하는 것을 특징으로 하는 문맥기반 검색장치.
- 제 5항에 있어서, 상기 검색입력부는,상기 사용자로부터 검색의 대상이 되는 문서의 종류정보를 더 입력받고,상기 검색결과제공부는,상기 색인데이터와 함께 타 기반 색인데이터가 더 저장된 색인데이터저장부를 제어하여 상기 입력된 문서의 종류정보에 해당하는 색인데이터의 문서를 제공하는 것을 특징으로 하는 문맥기반 검색장치.
- 제 5항에 있어서, 상기 검색입력부는,상기 사용자로부터 원하는 검색방식을 더 입력받고,상기 검색결과제공부는,상기 색인데이터와 함께 타 기반 색인데이터가 더 저장된 상기 색인데이터저장부를 제어하여, 상기 입력된 검색방식에 해당하는 색인데이터의 문서를 제공하는 것을 특징으로 하는 문맥기반 검색장치.
- 색인생성의 대상이 되는 대상문서가 입력되는 입력단계;상기 입력된 대상문서에서 색인데이터 생성의 단위 구문인 키프레이즈를 생성하는 생성단계; 및상기 대상문서의 위치정보를 포함하는 아이디정보와 상기 생성된 키프레이즈 가 상호 연계된 색인 데이터를 생성하는 색인데이터생성단계를 포함하고,상기 키프레이즈는,상기 대상문서에서 기술되고 있는 주대상 단어인 화제어 또는 상기 화제어가 상기 대상문서에서 가지는 내용적 의미인 문맥범주정보로 구성되며,상기 생성단계는,형태소 패턴과 상기 형태소 패턴에 해당하는 문맥범주정보가 연계된 문맥패턴정보가 저장되는 문맥패턴정보저장단계;상기 입력된 대상문서를 대상으로 형태소 패턴 분석을 수행하는 형태소분석단계; 및상기 형태소 패턴 분석 결과에 대응하는 상기 문맥패턴정보의 형태소 패턴이 존재하는 경우, 상기 형태소 패턴에 해당하는 문맥범주정보와 상기 형태소 패턴을 구성하는 화제어로 상기 키프레이즈를 생성하는 키프레이즈생성단계를 포함하는 것을 특징으로 하는 문맥기반 색인데이터 생성방법.
- 삭제
- 사용자로부터 원하는 검색어를 입력받는 검색입력단계;상기 입력된 검색어를 키프레이즈 형태 검색어로 변환하는 변환단계; 및색인생성의 대상이 되는 대상문서의 키프레이즈와 상기 대상문서의 위치정보를 포함하는 아이디정보가 상호 연계된 데이터인 색인데이터와 상기 키프레이즈 형태 검색어를 상호 비교하여 상기 키프레이즈 형태 검색어에 해당하는 색인데이터의 문서를 제공하는 검색결과제공단계를 포함하고,상기 키프레이즈는,상기 대상문서에서 기술되고 있는 주대상 단어인 화제어 또는 상기 화제어가 상기 대상문서에서 가지는 내용적 의미인 문맥범주정보로 구성되는 것을 특징으로 하는 문맥기반 검색방법.
- 제 13항에 있어서, 상기 변환단계는,입력된 검색어의 내용적 의미를 기준으로 상기 입력된 검색어에 해당하는 정규화형태정보가 저장되는 정규화정보저장단계;상기 입력된 검색어에서 불용어를 제거하는 불용어제거단계; 및상기 불용어가 제거된 검색어를 대응되는 정규화형태정보로 변환하고, 부가어를 제거하여 상기 키프레이즈 형태 검색어로 변환하는 검색어변환단계를 포함하는 것을 특징으로 하는 문맥기반 검색방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070107155A KR100885527B1 (ko) | 2007-10-24 | 2007-10-24 | 문맥 기반 색인데이터 생성장치와 문맥기반 검색장치 및 그방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070107155A KR100885527B1 (ko) | 2007-10-24 | 2007-10-24 | 문맥 기반 색인데이터 생성장치와 문맥기반 검색장치 및 그방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100885527B1 true KR100885527B1 (ko) | 2009-02-26 |
Family
ID=40682093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070107155A KR100885527B1 (ko) | 2007-10-24 | 2007-10-24 | 문맥 기반 색인데이터 생성장치와 문맥기반 검색장치 및 그방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100885527B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101174216B1 (ko) * | 2010-10-25 | 2012-08-14 | 엔에이치엔(주) | 지역기반의 검색어를 추천하는 시스템 및 그 방법 |
KR20190008673A (ko) | 2017-07-17 | 2019-01-25 | 주식회사 코난테크놀로지 | 비동기 방식을 사용하는 파일 색인장치 및 그 방법 |
CN118193682A (zh) * | 2024-05-13 | 2024-06-14 | 广东电网有限责任公司中山供电局 | 关键词匹配方法、计算机程序产品及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010004404A (ko) * | 1999-06-28 | 2001-01-15 | 정선종 | 키팩트기반 텍스트 검색시스템과, 이를 이용한 키팩트기반 텍스트 색인방법 및 검색방법 |
KR20030006201A (ko) * | 2001-07-12 | 2003-01-23 | 서정연 | 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템 |
KR20030094966A (ko) * | 2002-06-11 | 2003-12-18 | 주식회사 코스모정보통신 | 통제학습 기반의 문서 자동분류시스템 및 그 방법 |
KR20080001017A (ko) * | 2006-06-29 | 2008-01-03 | 김성훈 | 전자문서의 내용 검색을 위한 문맥반복성에 의한 색인 생성기법 및 시스템 |
-
2007
- 2007-10-24 KR KR1020070107155A patent/KR100885527B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010004404A (ko) * | 1999-06-28 | 2001-01-15 | 정선종 | 키팩트기반 텍스트 검색시스템과, 이를 이용한 키팩트기반 텍스트 색인방법 및 검색방법 |
KR20030006201A (ko) * | 2001-07-12 | 2003-01-23 | 서정연 | 홈페이지 자동 검색을 위한 통합형 자연어 질의-응답시스템 |
KR20030094966A (ko) * | 2002-06-11 | 2003-12-18 | 주식회사 코스모정보통신 | 통제학습 기반의 문서 자동분류시스템 및 그 방법 |
KR20080001017A (ko) * | 2006-06-29 | 2008-01-03 | 김성훈 | 전자문서의 내용 검색을 위한 문맥반복성에 의한 색인 생성기법 및 시스템 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101174216B1 (ko) * | 2010-10-25 | 2012-08-14 | 엔에이치엔(주) | 지역기반의 검색어를 추천하는 시스템 및 그 방법 |
US9460113B2 (en) | 2010-10-25 | 2016-10-04 | Nhn Corporation | System and method for recommending location-based keyword |
KR20190008673A (ko) | 2017-07-17 | 2019-01-25 | 주식회사 코난테크놀로지 | 비동기 방식을 사용하는 파일 색인장치 및 그 방법 |
CN118193682A (zh) * | 2024-05-13 | 2024-06-14 | 广东电网有限责任公司中山供电局 | 关键词匹配方法、计算机程序产品及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8060357B2 (en) | Linguistic user interface | |
US6470306B1 (en) | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens | |
KR101732342B1 (ko) | 신뢰 질의 시스템 및 방법 | |
US20050203900A1 (en) | Associative retrieval system and associative retrieval method | |
KR20010075026A (ko) | 지식 창조 능력을 가지는 문서 의미 분석/선택 시스템 및그 방법 | |
CN102214189B (zh) | 基于数据挖掘获取词用法知识的系统及方法 | |
US20090222409A1 (en) | Conceptual Reverse Query Expander | |
JP2011118689A (ja) | 検索方法及びシステム | |
Kallimani et al. | Summarizing news paper articles: experiments with ontology-based, customized, extractive text summary and word scoring | |
Litvak et al. | Degext: a language-independent keyphrase extractor | |
WO2019200699A1 (zh) | 政务系统发文方法、装置、计算机设备及存储介质 | |
JP3743678B2 (ja) | 自動自然言語翻訳 | |
Kerremans et al. | Using data-mining to identify and study patterns in lexical innovation on the web: The NeoCrawler | |
KR20200136636A (ko) | 형태소 기반 ai 챗봇 및 그의 문장의도 결정 방법 | |
EP4080381A1 (en) | Method and apparatus for generating patent summary information, and electronic device and medium | |
KR100885527B1 (ko) | 문맥 기반 색인데이터 생성장치와 문맥기반 검색장치 및 그방법 | |
JP4065346B2 (ja) | 単語間の共起性を用いたキーワードの拡張方法およびその方法の各工程をコンピュータに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
Bian et al. | Integrating query translation and document translation in a cross-language information retrieval system | |
KR101238927B1 (ko) | 전자도서컨텐츠 검색 서비스 시스템 및 전자도서컨텐츠 검색 서비스 방법 | |
Georgantopoulos | MSc in Speech and Language Processing Dissertation: Automatic summarising based on sentence extraction: A statistical approach | |
WO1997048058A1 (en) | Automated translation of annotated text | |
JP4452527B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
WO1997048058A9 (en) | Automated translation of annotated text | |
Milić-Frayling | Text processing and information retrieval | |
JP4138048B2 (ja) | 情報検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130214 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20140110 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20150102 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20160104 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20170105 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20180111 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20190108 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20191127 Year of fee payment: 12 |