KR100503950B1 - 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성시스템 및 방법 - Google Patents
인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성시스템 및 방법 Download PDFInfo
- Publication number
- KR100503950B1 KR100503950B1 KR10-2002-0069428A KR20020069428A KR100503950B1 KR 100503950 B1 KR100503950 B1 KR 100503950B1 KR 20020069428 A KR20020069428 A KR 20020069428A KR 100503950 B1 KR100503950 B1 KR 100503950B1
- Authority
- KR
- South Korea
- Prior art keywords
- search engine
- classification
- directory
- dictionary
- word
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (5)
- 메타 검색 엔진 기법을 이용하여 자동 분류 사전을 구성하는 시스템에 있어서,분류자에 의해 디자인된 분류맵과 분류 대상이 되는 분류어를 입력받고, 상기 분류맵을 현재 등록된 인터넷 검색엔진에 등록하는 분류맵 처리기;상기 인터넷 검색엔진에 대한 리스트를 관리하며 각 검색엔진의 AND 연산 방식에 대한 환경을 저장 관리하는 검색엔진 등록처리기;상기 검색엔진 등록처리기로부터 그 검색엔진의 AND 연산 방식을 문의하여 상기 분류맵 처리기를 통해 입력된 분류어로 각 검색엔진에 질의를 수행한 후에 각 검색엔진으로부터 추출된 페이지를 임시저장소에 상기 분류맵과 동일한 디렉토리를 생성하여 저장하는 에이전트 매니저; 및상기 에이전트 매니저를 통해 생성된 디렉토리를 이용해 방문 디렉토리 리스트를 생성하고, 각 디렉토리를 방문하여 가져온 페이지를 읽어들여 형태소를 분석하여 단어를 추출하고, 상기 추출한 단어마다 해당 디렉토리 명의 색인에 추가하여 상기 단어 정보의 위치를 포함하는 색인 사전을 구성하는 사전구성기;를 포함하는 것을 특징으로 하는 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성 시스템.
- 제 1 항에 있어서,상기 분류맵 처리기는 인터넷 검색엔진을 분류자에게 제시하여 그 결과를 가지고 있는 기능을 수행하며 새로운 인터넷 검색엔진을 등록할 수 있게 하는 것을 특징으로 하는 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성 시스템.
- 제 1 항에 있어서,상기 에이전트 매니저는 에이전트가 가지고 온 결과는 지정된 임시저장소에 저장하고 상기 에이전트는 시스템에서 설정한 패치해야 할 검색결과를 바탕으로 결과를 가져오게 되며, 상기 가져온 페이지 중에 질의어가 하이퍼링킹을 의미하는 href에 있을 경우 href에 있는 URL을 방문하여 페이지를 가져오는 것을 특징으로 하는 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성 시스템.
- 제 1 항에 있어서,상기 사전 구성기는 색인이 구성된 이후 특정 횟수 이상 나온 단어에 대해서는 별도의 각 사전을 구성하고 구성된 결과는 모드에 따라서 사전을 이용하는 분류기에 입력으로 사용되거나 분류자에게 제시하는 것을 특징으로 하는 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성 시스템.
- 메타 검색 엔진 기법을 이용하여 자동 분류 사전을 구성하는 방법에 있어서,분류자에 의해 분류맵이 디자인되어 상기 분류맵을 현재 등록된 인터넷 검색엔진에 등록하고, 상기 분류자로부터 분류 대상이 되는 분류어를 입력받는 단계;상기 인터넷 검색엔진의 AND 연산 방식을 문의하여 상기 단계에서 입력된 분류어로 각 검색엔진에 질의를 수행하는 단계;상기 단계에서 각 검색엔진으로부터의 질의 결과로 추출된 페이지를 임시저장소에 상기 분류맵과 동일한 디렉토리를 생성하여 저장하는 단계;상기 단계에서 생성된 디렉토리를 이용해 방문 디렉토리 리스트를 생성하고, 각 디렉토리를 방문하여 가져온 페이지를 읽어들여 형태소를 분석하여 단어를 추출하는 단계;상기 단계에서 추출된 단어마다 해당 디렉토리 명의 색인에 추가하여 상기 단어 정보의 위치를 포함하는 색인 사전을 구성하는 단계; 및상기 단계에서 생성된 색인 사전을 모드에 따라 분류기로 전송하거나 사용자이게 보여주는 단계를 포함하는 것을 특징으로 하는 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0069428A KR100503950B1 (ko) | 2002-11-09 | 2002-11-09 | 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성시스템 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2002-0069428A KR100503950B1 (ko) | 2002-11-09 | 2002-11-09 | 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040041256A KR20040041256A (ko) | 2004-05-17 |
KR100503950B1 true KR100503950B1 (ko) | 2005-07-26 |
Family
ID=37338357
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR10-2002-0069428A KR100503950B1 (ko) | 2002-11-09 | 2002-11-09 | 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성시스템 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100503950B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10268734B2 (en) * | 2016-09-30 | 2019-04-23 | International Business Machines Corporation | Providing search results based on natural language classification confidence information |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010064269A (ko) * | 1999-12-27 | 2001-07-09 | 오길록 | 계층 단어를 이용한 3차원 클러스터링 생성 시스템 및 그방법 |
KR20010104871A (ko) * | 2000-05-16 | 2001-11-28 | 임갑철 | 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템 |
KR20020016056A (ko) * | 2000-08-24 | 2002-03-04 | 모리시타 요이찌 | 문서 검색 및 분류 방법 및 장치 |
KR20030069640A (ko) * | 2002-02-22 | 2003-08-27 | 이의범 | 계층적 및 개념적 클러스터링에 의한 정보검색 시스템 및그 방법 |
KR20030094966A (ko) * | 2002-06-11 | 2003-12-18 | 주식회사 코스모정보통신 | 통제학습 기반의 문서 자동분류시스템 및 그 방법 |
-
2002
- 2002-11-09 KR KR10-2002-0069428A patent/KR100503950B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010064269A (ko) * | 1999-12-27 | 2001-07-09 | 오길록 | 계층 단어를 이용한 3차원 클러스터링 생성 시스템 및 그방법 |
KR20010104871A (ko) * | 2000-05-16 | 2001-11-28 | 임갑철 | 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템 |
KR20020016056A (ko) * | 2000-08-24 | 2002-03-04 | 모리시타 요이찌 | 문서 검색 및 분류 방법 및 장치 |
KR20030069640A (ko) * | 2002-02-22 | 2003-08-27 | 이의범 | 계층적 및 개념적 클러스터링에 의한 정보검색 시스템 및그 방법 |
KR20030094966A (ko) * | 2002-06-11 | 2003-12-18 | 주식회사 코스모정보통신 | 통제학습 기반의 문서 자동분류시스템 및 그 방법 |
Also Published As
Publication number | Publication date |
---|---|
KR20040041256A (ko) | 2004-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Elgazzar et al. | Clustering wsdl documents to bootstrap the discovery of web services | |
Chakrabarti | Mining the Web: Discovering knowledge from hypertext data | |
US6490579B1 (en) | Search engine system and method utilizing context of heterogeneous information resources | |
US7783668B2 (en) | Search system and method | |
US7499965B1 (en) | Software agent for locating and analyzing virtual communities on the world wide web | |
US7272595B2 (en) | Information search support system, application server, information search method, and program product | |
KR20130060720A (ko) | 목적 기반 시맨틱 서비스 디스커버리를 위한 서비스 목적 해석 장치 및 방법 | |
Wu et al. | Searching services" on the web": A public web services discovery approach | |
Liakos et al. | Focused crawling for the hidden web | |
KR20040017008A (ko) | 검색엔진을 활용한 정보 제공 시스템 및 그 방법 | |
JP4769822B2 (ja) | ページグループを用いた情報検索サービス提供サーバー、方法及びシステム | |
CN101661490A (zh) | 搜索引擎、其客户端及搜索网页的方法 | |
KR20000054312A (ko) | 맞춤 웹정보 구축 제공 방법 | |
CN104778232A (zh) | 一种基于长查询的搜索结果的优化方法和装置 | |
Cortez et al. | A flexible approach for extracting metadata from bibliographic citations | |
KR100503950B1 (ko) | 인터넷 검색엔진을 이용한 커스터마이징 분류 사전 구성시스템 및 방법 | |
Wang et al. | An application specific knowledge engine for researches in intelligent transportation systems | |
KR20060135173A (ko) | 파일관리 시스템 | |
Géry et al. | Toward a structured information retrieval system on the web: Automatic structure extraction of web pages | |
CN112100500A (zh) | 范例学习驱动的内容关联网站发掘方法 | |
KR100942902B1 (ko) | 웹페이지 검색 방법 및 상기 방법을 컴퓨터에서 구현하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 | |
Svátek et al. | Rainbow-multiway semantic analysis of Web sites | |
JP5559725B2 (ja) | 複数の情報ブロックに区分されたウェブページを用いた情報検索サービス提供方法 | |
Svatek et al. | URL as starting point for WWW document categorization. | |
Szymanski et al. | A method for indexing Web pages using Web bots |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130708 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20140603 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20150629 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20160701 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20170629 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20180625 Year of fee payment: 14 |