KR20060134701A - Distributed domain-oriented search services apparatus and method thereof using for centralized web resource automatic classification server - Google Patents

Distributed domain-oriented search services apparatus and method thereof using for centralized web resource automatic classification server Download PDF

Info

Publication number
KR20060134701A
KR20060134701A KR1020050054599A KR20050054599A KR20060134701A KR 20060134701 A KR20060134701 A KR 20060134701A KR 1020050054599 A KR1020050054599 A KR 1020050054599A KR 20050054599 A KR20050054599 A KR 20050054599A KR 20060134701 A KR20060134701 A KR 20060134701A
Authority
KR
South Korea
Prior art keywords
index database
field
documents
subsystem
search
Prior art date
Application number
KR1020050054599A
Other languages
Korean (ko)
Inventor
이세훈
김풍일
Original Assignee
이세훈
김풍일
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이세훈, 김풍일 filed Critical 이세훈
Priority to KR1020050054599A priority Critical patent/KR20060134701A/en
Publication of KR20060134701A publication Critical patent/KR20060134701A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24573Query processing with adaptation to user needs using data annotations, e.g. user-defined metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/282Hierarchical databases, e.g. IMS, LDAP data stores or Lotus Notes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

A device and a method for processing a search service in a categorized small/middle scale unit system by using a central service server are provided to increase a search speed/efficiency of a lower system, and reduce expenses needed for managing a search engine and system load by making a searcher of the lower system separately process the search service for a corresponding category. A unit system manager makes a data collection URL(Uniform Resource Locator) list for collecting data by the central search server and a request list according to a categorized data classification system. A lower system manager receives the request list. A crawler collects information and documents through application data, DBMS(DataBase Management System) data, file documents, and web documents according to the received request list. An indexer stores the collected information/documents to a database, and generates an index database according to each category of the received data classification system to perform indexing work for connecting the document and a keyword. An index database repository stores the categorized index database by operating the crawler and the indexer.

Description

중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리장치 및 방법{Distributed domain-oriented search services apparatus and method thereof using for centralized web resource automatic classification server}Distributed domain-oriented search services apparatus and method using using centralized web resource automatic classification server}

도 1은 종래의 검색엔진의 구성을 나타낸 도면.1 is a view showing the configuration of a conventional search engine.

도 2는 본 발명에 따른 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리장치를 나타낸 블록구성도.Figure 2 is a block diagram showing a search service processing apparatus in a small and medium-sized unit system for each field using a central search server according to the present invention.

도 3은 본 발명에 따른 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리방법을 나타낸 도면.3 is a diagram illustrating a search service processing method in a small and medium unit system for each field using a central search server according to the present invention;

본 발명은 중소규모 단위시스템 내에서 검색서비스를 구현할 경우, 상기 단위시스템 내부에 통합 검색엔진 서버시스템을 구축하지 않고도 단위시스템 내부 사용자에게 외부의 해당분야에 대한 정보와 자료를 제공해주기 위한 단위시스템 내에서의 검색서비스 처리장치 및 방법에 관한 것이다.In the present invention, when implementing a search service in a small and medium-sized unit system, the unit system for providing information and data on the external field to the user inside the unit system without building an integrated search engine server system inside the unit system. The present invention relates to an apparatus and method for processing a search service in.

최근 들어, 인터넷이 널리 보급됨으로써, 대부분의 문서를 컴퓨터로 작성하고 이들 문서를 인터넷을 통해 배포하고 획득하는 것이 일반화되고 있다. 따라서, 전문가뿐만 아니라 일반인들도 인터넷과 같은 통신망에 접속하여 관심 있는 분야에 대한 정보를 제공하거나 획득하는 경우가 많다. 이처럼 통신망을 통해 관심 있는 분야에 대한 정보를 불특정 다수의 일반인이 공유할 수 있도록 하기 위해서는 인터넷상에서 동작하는 검색엔진들이 이용되고 있다.In recent years, with the widespread use of the Internet, it has become common to write most documents on a computer and distribute and obtain these documents through the Internet. Therefore, not only experts but also ordinary people access to communication networks such as the Internet, and often provide or obtain information on areas of interest. As such, search engines operating on the Internet are being used to enable a large number of unspecified members of the public to share information on areas of interest through a communication network.

상기와 같은 검색엔진은 로봇이라 불리는 일종의 자동순회프로그램에 의해 인터넷을 이용하여 제공되는 모든 문서들에 대한 색인 정보 및 기본 정보들을 데이터베이스 형태로 저장한다. 이 때 문서들에 대한 기본 정보는 제목, 크기, 날짜, 해당 문서가 저장된 웹사이트의 주소, 요약문 등을 포함하고, 외부에서 문서를 검색하기 위한 질의어를 입력하면 상기 질의어에 의해 데이터베이스를 검색하여 검색 리스트를 해당 사용자에게 제공한다.Such a search engine stores index information and basic information about all documents provided using the Internet by a kind of automatic circulation program called a robot in a database form. At this time, basic information about the documents includes title, size, date, address of the website where the document is stored, summary statement, etc., and if a query is entered to search the document from the outside, the database is searched and searched by the query. Provide the list to the user.

도 1은 종래의 검색엔진의 구성을 나타낸 도면으로 상기 도 1에서 도시된 바와 같이 수집기(Crawler), 색인기(Indexer), 검색기(Searcher)로 구성되어 있다. 상기 수집기는 스파이더(Spider) 또는 펫처(Fetcher)라고 불리며, 자료수집대상 웹사이트들을 주기적으로 방문하여 사용자가 필요로 하는 정보와 문서 즉, 데이터베이스에 저장된 정보와 같이 정형화된 정보와 웹페이지 및 문서파일과 같은 비정형 화된 정보를 수집하는 기능을 수행한다. 상기 색인기(Indexer)는 수집기(Crawler)가 모아준 정보와 문서를 데이터베이스에 저장하는 작업을 하고, 빠르고 효율적인 검색을 위해 키워드와 문서를 연결해 주는 색인 작업을 수행하고, 상기 검색기(Searcher)는 수집기(Crawler)와 색인기(Indexer)의 처리결과로 생성된 색인데이터베이스의 내용은 질의어의 입력을 통한 검색 요청에 따라 즉시 해당 자료와 정보를 제공해 주기 위한 정보검색 서비스를 제공하는 형태로 구성된다.FIG. 1 is a diagram illustrating a configuration of a conventional search engine. As shown in FIG. 1, a collector, an indexer, and a searcher are configured. The collector is called a spider or a fetcher. The collector periodically visits data collection websites to form information and documents, such as information stored in a database, and web pages and document files. It collects unstructured information such as The indexer stores information and documents collected by a collector in a database, and indexes keywords and documents for fast and efficient retrieval. The contents of the index database generated as a result of the processing of the crawler and the indexer are configured in the form of providing an information retrieval service for providing the relevant data and information immediately upon a search request through the input of a query word.

상기에서 설명한 검색엔진 중 특히 단위시스템에 구축되는 검색엔진의 성능과 품질은 90% 이상이 수집기와 색인기에 의해 좌우될 뿐만 아니라 최상의 운영을 위해서는 사용자 환경에 맞는 수집기와 색인기의 지속적인 최적화가 요구되고, 상기 검색엔진의 운영·유지 관리의 대부분이 수집기와 색인기의 최적화에 소요되는 것이다. 따라서, 초·중·고등학교, 개인병원 등 일반 중소규모 단위시스템에서 내부 사용자 및 내부 고객을 위한 검색서비스를 구현하기 위해서 검색엔진을 도입하여 구축할 경우 비용뿐만 아니라 상기 검색엔진을 최적화하고 관리하는데 많은 노력과 비용이 투입되어 투자대비 효과를 거두는 것은 현실적으로 불가능했다.Among the search engines described above, the performance and quality of the search engines built in the unit system are not only 90% or more dependent on the collector and the indexer, but for the best operation, the continuous optimization of the collector and the indexer for the user environment is required. Most of the operation and maintenance of the search engine is required to optimize the collector and the indexer. Therefore, when implementing a search engine to implement a search service for internal users and internal customers in general small and medium-sized unit systems such as elementary, middle and high schools, and private hospitals, it is not only expensive but also optimized and managed. It was virtually impossible to achieve the return on investment from the effort and expense.

그러므로 많은 노력과 비용 그리고 전문 관리자가 필요한 검색엔진의 수집기와 색인기를 중앙의 검색서버가 통합적으로 대행 처리를 하고, 그 처리결과인 분야별 색인데이터베이스만을 해당 하위시스템에 제공케 하여, 상기 하위시스템에 설치된 검색기만으로 검색서비스가 구현될 수 있는 간단하고 시스템적 부하가 없는 초 경량의 검색엔진이 요구되고 있다.Therefore, the search engine collector and indexer, which requires a lot of effort and cost, and a professional manager, are integrated with the central search server, and only the sector-based index database is provided to the corresponding subsystem. There is a need for a very lightweight search engine without a simple and systemic load that enables a search service to be implemented using only a search machine.

본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로 하위시스템에서의 검색방법은 중앙검색서버의 수집기 및 색인기를 이용하여 상기 하위시스템에 해당하는 각각의 색인데이터베이스를 생성하고, 이를 하위시스템의 검색기가 이용하기 위한 중앙검색서버의 수집기 및 색인기와 하위시스템 검색기간 연동장치 및 방법을 제공하고, 상기 하위시스템의 사용자 환경을 고려한 중앙검색서버의 수집기 및 색인기 제어방법과 상기 하위시스템에서의 색인데이터베이스의 관리 및 전달방법을 제공하는 것을 목적으로 한다.The present invention has been made to solve the above problems, the search method in the sub-system generates each index database corresponding to the sub-system using the collector and the indexer of the central search server, the search of the sub-system The present invention provides a system and a method for interworking with a collector and an indexer of a central search server and a subsystem search period, and a method of controlling the collector and indexer of a central search server in consideration of a user environment of the subsystem and an index database in the subsystem. Its purpose is to provide management and delivery methods.

상기와 같은 목적을 달성하기 위해 본 발명에서는 하위시스템의 검색기를 중앙검색서버에서 제공된 해당분야 색인데이터베이스와 함께 하위시스템에 두어 상기 해당분야에 대한 검색서비스를 단독으로 처리토록 하여 상기 하위시스템에서의 검색속도와 검색효율을 높이며, 검색엔진에 관리에 소요되는 비용을 줄이고, 검색엔진의 성능을 좌우하는 수집기, 색인기, 제어기는 상기 중앙검색서버에서 일괄적으로 대행 처리토록 하여 시스템의 부하를 최소화한다.In order to achieve the above object, in the present invention, a searcher of a sub-system is placed in a sub-system together with an index database of a corresponding field provided by a central search server, so that a search service for the corresponding field may be processed independently. Collectors, indexers, and controllers, which speed and search efficiency, reduce the cost of management of the search engine, and influence the performance of the search engine, are processed by the central search server collectively to minimize the load on the system.

본 발명에 따른 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리장치를 첨부된 도 2를 참조하여 상세히 설명하면,Referring to Figure 2 attached to the search service processing apparatus in the small and medium-sized unit system for each field using the central search server according to the present invention,

상기 중앙검색서버에서 수집될 자료의 자료수집 URL 목록과 분야별 자료분류체계에 따라 요청 목록을 작성하는 단위시스템 관리기와 상기 단위시스템 관리기에 의해 작성된 요청 목록을 중앙검색서버에 전달하기 위해 상기 중앙검색서버에 설치된 하위시스템 관리기와 상기 하위시스템 관리기에서 전달받은 요청 목록에 따라 수집기(Crawler)는 애플리케이션 데이터, 데이터베이스관리시스템(DBMS, Database Management System) 데이터, 파일문서, 웹 문서를 통해 정보와 문서를 수집한다.The central search server for delivering the request list created by the unit system manager and the unit system manager for creating a request list according to the data collection URL list of the data to be collected by the central search server and the data classification system by sector. The collector collects information and documents through application data, database management system (DBMS) data, file documents, and web documents according to the subsystem manager installed in the system and the request list received from the subsystem manager. .

상기 수집기에 의해 수집된 정보와 문서를 상기 색인기(Indexer)에서는 데이터베이스에 저장하는 작업을 하고, 빠르고 효율적인 검색을 위해 키워드와 문서를 연결해 주는 색인 작업을 수행하여 분야별 하위시스템에서 요청한 자료분류체계에 따라 분야별로 색인데이터베이스를 각각 생성하여 해당되는 분야별 하위시스템에서 색인데이터베이스를 제공한다.The indexer stores information and documents collected by the collector in a database, and performs indexing to connect keywords and documents for fast and efficient retrieval according to the data classification system requested by the sub-system. Create an index database for each sector to provide an index database in the sector-specific subsystem.

상기 수집기와 색인기의 처리결과로 생성된 색인데이터베이스를 분야별로 생성될 수 있도록 하기 위한 상기 제어기(Controller)는 분야별 자료수집 URL 목록, 분야별 자료분류체계의 설정에 따라 상기 수집기와 색인기를 제어할 수 있도록 구성한다.The controller for generating the index database generated as a result of the processing of the collector and the indexer for each field may control the collector and the indexer according to the data collection URL list for each field and the setting of the data classification system for each field. Configure.

상기 수집기와 색인기를 가동시켜 하위시스템 분야별로 생성된 색인데이터베 이스는 색인데이터베이스 저장소에서 분야별로 저장되고, 상기 색인데이터베이스 저장소에 저장된 분야별 정보와 문서를 해당분야 색인데이터베이스로 전송하는 색인데이터베이스 전송기와 상기 색인데이터베이스 전송기에서 전송한 분야별 정보와 문서를 수신하여 해당분야 색인데이터베이스로 전달하는 색인데이터베이스 수신기에 의해 상기 색인데이터베이스 저장소에 저장된 분야별 정보와 문서는 해당분야 색인데이터베이스로 전송된다.The index database generated by each sub-system field by operating the collector and the indexer is stored for each field in an index database repository, and an index database transmitter for transmitting sector-specific information and documents stored in the index database repository to a corresponding field index database. The sector information and documents stored in the index database repository are transmitted to the sector index database by an index database receiver which receives the sector information and the document transmitted from the index database transmitter and transmits the document to the sector index database.

상기 분야별 하위시스템에서 요청하는 자료수집 URL과 자료분류체계는 하위시스템 관리기에 의해 중앙검색서버 하위시스템 관리기에 전달되어 하위시스템 분야별 요청목록이 작성된다. 상기 중앙검색서버 제어기는 하위시스템 분야별 요청목록을 참조하여 수집기와 색인기를 가동시켜 하위시스템 분야별로 색인데이터베이스를 각각 생성하고 이를 색인데이터베이스 저장소에 보내 분야별로 저장하게 된다. 상기 중앙검색서버 색인데이터베이스 전송기는 하위시스템 관리기를 참조하여 해당되는 분야의 색인데이터베이스를 요청한 하위시스템의 색인데이터베이스 수신기에 전달되고, 상기 색인데이터베이스는 하위시스템에 검색서버에 저장되어 하위시스템 검색기에 의해 사용자에게 검색서비스를 제공한다.The data collection URL and the data classification system requested by the sector-specific subsystems are delivered to the central search server subsystem manager by the subsystem manager to create a request list for each subsystem field. The central search server controller operates the collector and the indexer with reference to the request list for each sub-system field to generate an index database for each sub-system field, and sends the index database to the index database repository for storing by field. The central search server index database transmitter is transmitted to an index database receiver of a subsystem that requests an index database of a corresponding field by referring to a subsystem manager, and the index database is stored in a search server in a subsystem and is stored by a user by a subsystem searcher. Provide search services to

분야별 하위시스템의 검색기는 상기 하위시스템에 설치되어 중앙검색서버에서 제공하는 상기 색인데이터베이스 저장소에서 전송하는 정보와 문서를 저장하는 해당분야 색인데이터베이스 내에서 질의어의 입력을 통한 검색 요청에 따른 검색결 과를 웹브라우저를 통해 접속한 하위시스템의 사용자에게 제공한다.The searcher of the sector-specific sub-system is installed in the subsystem and displays the search result according to the search request through the input of a query in the corresponding sector index database that stores information and documents transmitted from the index database repository provided by the central search server. It is provided to users of subsystems accessed through web browsers.

상기 수집기, 색인기, 제어기, 하위시스템 관리기, 하위시스템 분야별 색인데이터베이스 저장소는 상기 중앙검색서버에 설치되고, 해당분야 색인데이터베이스, 검색기는 하위시스템에 설치되는 것을 특징으로 한다.The collector, indexer, controller, subsystem manager, and index database repository for each sub-system field are installed in the central search server, and the corresponding field index database and searcher are installed in the subsystem.

도 3을 참조하여 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리방법을 상세히 설명하면, 상기 분야별 하위시스템에서 요청하는 자료수집 URL과 자료분류체계는 하위시스템 관리기에 의해 중앙검색서버 하위시스템관리기에 전달되어 하위시스템 분야별 요청목록이 작성하는 제1단계와;Referring to FIG. 3, a method of processing a search service in a small and medium-sized unit system for each sector using a central search server will be described in detail. A first step delivered to the system manager to create a request list for each sub-system field;

상기 제1단계에서 작성된 요청목록에 따라 상기 중앙검색서버의 제어기가 하위시스템 분야별 요청목록을 참조하여 수집기와 색인기를 가동시키는 제2단계와;A second step of controlling, by the controller of the central search server, the collector and the indexer by referring to the request list for each sub-system field according to the request list created in the first step;

상기 제2단계에서 수집기와 색인기를 가동시켜 하위시스템 분야별로 색인데이터베이스를 각각 생성하고 이를 색인데이터베이스 저장소에 보내 분야별로 저장하는 제3단계와;A third step of operating the collector and the indexer in the second step to generate an index database for each sector of the subsystem and to send it to the index database repository for storage for each sector;

상기 제3단계에서 색인데이터베이스 저장소에 저장된 분야별 정보와 문서를 하위시스템 관리기를 참조하여 색인데이터베이스 전송기를 통해 하위시스템의 색인데이터베이스로 전송하는 제4단계와;A fourth step of transmitting, by the third step, field-specific information and documents stored in the index database repository to the index database of the subsystem through the index database transmitter with reference to the subsystem manager;

상기 제4단계에서 색인데이터베이스 전송기로 전송한 분야별 정보와 문서가 상기 하위시스템의 색인데이터베이스 수신기에 전달되는 제5단계와;A fifth step of transmitting sector-specific information and documents transmitted to the index database transmitter in the fourth step to the index database receiver of the subsystem;

상기 제5단계에서 분야별 정보와 문서를 전달받은 색인데이터베이스 수신기가 하위시스템의 색인데이터베이스로 상기 분야별 정보와 문서를 전달하여 저장하는 제6단계와;A sixth step of, by the index database receiver receiving the sector information and the document in the fifth step, transferring the sector information and the document to the index database of the subsystem;

상기 제6단계에서 분야별 정보와 문서가 저장된 하위시스템 색인데이터베이스를 이용하여 하위시스템 검색기가 질의어에 따른 검색결과를 제공하는 제7단계; 로 이루어진다.A seventh step of providing a search result according to a query word by a subsystem searcher using a subsystem index database in which field information and documents are stored in the sixth step; Is made of.

상기 제2단계에서 하위시스템 관리기에서 전달받은 요청 목록에 따라 애플리케이션 데이터, 데이터베이스관리시스템 데이터, 파일문서, 웹 문서를 통해 분야별 정보와 문서를 수집하고, 상기 수집된 정보를 키워드와 문서를 연결해 주는 색인 작업하며, 상기 제7단계에서 웹브라우저로 접속한 사용자가 입력한 질의어에 따른 검색결과를 제공하는 것을 특징으로 한다.According to the request list received from the sub-system manager in the second step, information and documents for each field are collected through application data, database management system data, file documents, and web documents, and the indexes linking the collected information with keywords and documents. And providing a search result according to a query input by a user connected to the web browser in the seventh step.

상술한 바와 같이 본 발명에 따른 바람직한 실시예를 설명하였지만, 본 발명은 상기한 실시예에 한정되지 않고, 이하의 특허청구의 범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명의 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변경 실시가 가능한 범위까지 본 발명의 기술적 정신이 있다고 할 것이다.As described above, the preferred embodiment according to the present invention has been described, but the present invention is not limited to the above-described embodiments, and the present invention is not limited to the scope of the following claims without departing from the gist of the present invention. Anyone with ordinary knowledge will have the technical spirit of the present invention to the extent that various modifications can be made.

이상에서 설명한 바와 같이 본 발명에 따른 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리장치 및 방법은 중소규모의 단위시스템에서 검색서비스를 구현하고자 할 경우, 검색엔진을 도입하고 그에 따른 시스템 관리자가 투입되어야 하지만 대다수의 중소규모 단위시스템의 운영기관은 검색엔진을 도입하거나 시스템 관리자가 투입되기에는 어려운 실정이기 때문에 중앙검색서버에서 수집기와 색인기, 하위시스템 분야별 색인데이터베이스 저장소를 관리하여 상기 하위시스템에서는 초경량의 검색엔진을 제공함으로써, 검색엔진의 구입과 시스템 관리자가 없어도 자체적인 검색서비스를 구현할 수 있도록 하는 효과가 있다.As described above, an apparatus and method for processing a search service in a small and medium-sized unit system for each field using a central search server according to the present invention introduces a search engine and implements a system when a search service is implemented in a small-sized unit system. Managers should be put in, but most small and medium-sized unit systems are difficult to introduce search engines or system administrators. Therefore, the central search server manages collectors, indexers and sub-database index databases to manage the subsystems. By providing an ultra lightweight search engine, it is possible to implement its own search service without purchasing a search engine and a system administrator.

또한, 계층적 구조를 갖는 대규모 시스템의 경우, 각각의 단위시스템을 독립적이고 개별적으로 운영하면서 각자 특성에 맞는 검색서비스 시스템을 구축하고자 할 때, 각각의 단위시스템에서 검색엔진을 구입하지 않고도 검색서비스 시스템을 구축할 수 있다.In addition, in the case of a large-scale system having a hierarchical structure, when a user wants to build a search service system that suits their characteristics while operating each unit system independently and individually, the search service system without purchasing a search engine in each unit system Can be built.

Claims (6)

하위시스템의 검색기를 중앙검색서버에서 제공된 해당분야 색인데이터베이스와 함께 하위시스템에 두어 상기 해당분야에 대한 검색서비스를 단독으로 처리하는 중소규모 단위시스템에서의 검색서비스 처리장치에 있어서,In a search service processing apparatus for a small- and medium-sized unit system that performs a search service for the corresponding field alone by placing a searcher of the sub-system together with the corresponding field index database provided by the central search server, 상기 중앙검색서버에서 수집될 자료의 자료수집 URL 목록과 분야별 자료분류체계에 따라 요청 목록을 작성하는 단위시스템 관리기와;A unit system manager for creating a request list according to a data collection URL list of data to be collected by the central search server and a data classification system for each field; 상기 단위시스템 관리기에 의해 작성된 요청 목록을 중앙검색서버에 전달하기 위해 상기 중앙검색서버에 설치된 하위시스템 관리기와;A sub-system manager installed in the central search server for delivering the list of requests made by the unit system manager to the central search server; 상기 하위시스템 관리기에서 전달받은 요청 목록에 따라 애플리케이션 데이터, 데이터베이스관리시스템 데이터, 파일문서, 웹 문서를 통해 정보와 문서를 수집하는 수집기와;A collector for collecting information and documents through application data, database management system data, file documents, and web documents according to the request list received from the subsystem manager; 상기 수집기에 의해 수집된 정보와 문서를 데이터베이스에 저장하는 작업을 하고, 키워드와 문서를 연결해 주는 색인 작업을 수행하여 상기 분야별 하위시스템에서 요청한 자료분류체계에 따라 분야별로 색인데이터베이스를 각각 생성하는 색인기와;An indexer for storing the information and documents collected by the collector in a database, and indexing the keywords and documents, thereby creating an index database for each field according to the data classification system requested by the sector-specific subsystem. ; 상기 수집기와 색인기의 처리결과로 생성된 색인데이터베이스를 분야별로 생성될 수 있도록 상기 분야별 자료수집 URL 목록, 분야별 자료분류체계의 설정에 따라 상기 수집기와 색인기를 제어할 수 있도록 구성된 제어기와;A controller configured to control the collector and the indexer according to the data collection URL list for each field and the data classification system for each field so as to generate the index database generated as a result of the processing of the collector and the indexer for each field; 상기 수집기와 색인기를 가동시켜 하위시스템 분야별로 생성된 색인데이터베 이스를 분야별로 저장하는 색인데이터베이스 저장소와;An index database storage configured to operate the collector and the indexer to store the index database generated for each sub-system field by field; 상기 수집기, 색인기, 제어기, 하위시스템 관리기, 하위시스템 분야별 색인데이터베이스 저장소는 상기 중앙검색서버에 설치되고,The collector, indexer, controller, subsystem manager, index database repository for each subsystem field is installed in the central search server, 상기 색인데이터베이스 저장소에 저장된 분야별 정보와 문서를 해당분야 색인데이터베이스로 전송하는 색인데이터베이스 전송기와;An index database transmitter for transmitting sector-specific information and documents stored in the index database repository to a corresponding sector index database; 상기 색인데이터베이스 전송기에서 전송한 분야별 정보와 문서를 수신하여 해당분야 색인데이터베이스로 전달하는 색인데이터베이스 수신기와;An index database receiver configured to receive field-specific information and documents transmitted from the index database transmitter and transmit the received field-specific information to a corresponding field index database; 상기 색인데이터베이스 전송기와 수신기를 통해 상기 색인데이터베이스 저장소의 정보와 문서를 저장하는 해당분야 색인데이터베이스 내에서 질의어의 입력으로 검색 요청에 따른 검색결과를 웹브라우저를 통해 접속한 사용자에게 제공하는 검색기; 로 이루어진 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리장치.A searcher for providing a search result according to a search request to a user connected through a web browser through input of a query in a corresponding field index database storing information and documents of the index database repository through the index database transmitter and receiver; Search service processing unit in the small and medium-sized unit system for each field using a central search server consisting of. 제1항에 있어서,The method of claim 1, 상기 중앙검색서버 색인데이터베이스 전송기는 하위시스템 관리기를 참조하여 해당되는 분야의 색인데이터베이스를 요청한 하위시스템의 색인데이터베이스 수신기에 전달되고, 상기 색인데이터베이스는 하위시스템에 검색서버에 저장되어 하위시스템 검색기에 의해 질의어에 따른 검색결과를 제공하는 것을 특징으로 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리장치.The central search server index database transmitter is transmitted to an index database receiver of a subsystem that requests an index database of a corresponding field by referring to a subsystem manager, and the index database is stored in a search server in a subsystem and is queried by a subsystem searcher. Search service processing apparatus in the small and medium-sized unit system for each field using a central search server, characterized in that to provide the search results according to. 제1항에 있어서,The method of claim 1, 상기 해당분야 색인데이터베이스, 검색기는 상기 하위시스템에 설치되는 것을 특징으로 하는 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리장치.The apparatus for searching a service in a small and medium-sized unit system for each field using a central search server, wherein the corresponding field index database and a searcher are installed in the sub-system. 수집기, 색인기, 제어기를 중앙검색서버에서 설치하여 일괄적으로 대행 처리토록 하는 중앙검색서버를 이용한 분야별 하위시스템에서의 검색서비스 처리방법에 있어서,In the search service processing method in the sub-system for each field using a central search server to install the collector, indexer, controller in the central search server to collectively process the agent, 상기 분야별 하위시스템에서 요청하는 자료수집 URL과 자료분류체계는 하위시스템 관리기에 의해 중앙검색서버 하위시스템 관리기에 전달되어 하위시스템 분야별 요청목록이 작성하는 제1단계와;A first step in which the data collection URL and the data classification system requested by the sector sub-system are delivered to the central search server subsystem manager by the sub-system manager to create a request list for each sub-system sector; 상기 제1단계에서 작성된 요청 목록에 따라 상기 중앙검색서버의 제어기가 하위시스템 분야별 요청 목록을 참조하여 수집기와 색인기를 가동시키는 제2단계와;A second step of the controller of the central search server operating the collector and the indexer by referring to the request list for each sub-system field according to the request list created in the first step; 상기 제2단계에서 수집기와 색인기를 가동시켜 하위시스템 분야별로 색인데이터베이스를 각각 생성하고 이를 색인데이터베이스 저장소에 보내 분야별로 저장하는 제3단계와;A third step of operating the collector and the indexer in the second step to generate an index database for each sector of the subsystem and to send it to the index database repository for storage for each sector; 상기 제3단계에서 색인데이터베이스 저장소에 저장된 분야별 정보와 문서를 하위시스템 관리기를 참조하여 색인데이터베이스 전송기를 통해 하위시스템의 색인데이터베이스로 전송하는 제4단계와;A fourth step of transmitting, by the third step, field-specific information and documents stored in the index database repository to the index database of the subsystem through the index database transmitter with reference to the subsystem manager; 상기 제4단계에서 색인데이터베이스 전송기로 전송한 분야별 정보와 문서가 상기 하위시스템의 색인데이터베이스 수신기에 전달되는 제5단계와;A fifth step of transmitting sector-specific information and documents transmitted to the index database transmitter in the fourth step to the index database receiver of the subsystem; 상기 제5단계에서 분야별 정보와 문서를 전달받은 색인데이터베이스 수신기가 하위시스템의 색인데이터베이스로 상기 분야별 정보와 문서를 전달하여 저장하는 제6단계와;A sixth step of, by the index database receiver receiving the sector information and the document in the fifth step, transferring the sector information and the document to the index database of the subsystem; 상기 제6단계에서 분야별 정보와 문서가 저장된 하위시스템 색인데이터베이스를 이용하여 하위시스템 검색기가 질의어에 따른 검색결과를 제공하는 제7단계; 로 이루어진 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리방법.A seventh step of providing a search result according to a query word by a subsystem searcher using a subsystem index database in which field information and documents are stored in the sixth step; A search service processing method in a small and medium sized unit system by field using a central search server. 제4항에 있어서,The method of claim 4, wherein 상기 제2단계에서 하위시스템 관리기에서 전달받은 요청 목록에 따라 애플리케이션 데이터, 데이터베이스관리시스템 데이터, 파일문서, 웹 문서를 통해 분야별 정보와 문서를 수집하고, 상기 수집된 정보를 키워드와 문서를 연결해 주는 색인 작업하는 것을 특징으로 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리방법.According to the request list received from the sub-system manager in the second step, information and documents for each field are collected through application data, database management system data, file documents, and web documents, and the indexes linking the collected information with keywords and documents. Search service processing method in the small and medium-sized unit system by field using the central search server. 제4항에 있어서,The method of claim 4, wherein 상기 제7단계에서 하위시스템 색인데이터베이스를 이용하여 하위시스템 검색기가 웹브라우저로 접속한 사용자가 입력한 질의어에 따라 검색결과를 제공하는 것을 특징으로 하는 중앙검색서버를 이용한 분야별 중소규모 단위시스템에서의 검색서비스 처리방법.In the seventh step, the sub-system searcher provides a search result according to a query input by a user connected to a web browser using a sub-system index database. How to handle the service.
KR1020050054599A 2005-06-23 2005-06-23 Distributed domain-oriented search services apparatus and method thereof using for centralized web resource automatic classification server KR20060134701A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050054599A KR20060134701A (en) 2005-06-23 2005-06-23 Distributed domain-oriented search services apparatus and method thereof using for centralized web resource automatic classification server

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050054599A KR20060134701A (en) 2005-06-23 2005-06-23 Distributed domain-oriented search services apparatus and method thereof using for centralized web resource automatic classification server

Publications (1)

Publication Number Publication Date
KR20060134701A true KR20060134701A (en) 2006-12-28

Family

ID=37813038

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050054599A KR20060134701A (en) 2005-06-23 2005-06-23 Distributed domain-oriented search services apparatus and method thereof using for centralized web resource automatic classification server

Country Status (1)

Country Link
KR (1) KR20060134701A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014145099A1 (en) * 2013-03-15 2014-09-18 Western Digital Technologies, Inc. Shared media crawler database method and system

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014145099A1 (en) * 2013-03-15 2014-09-18 Western Digital Technologies, Inc. Shared media crawler database method and system
US9171003B2 (en) 2013-03-15 2015-10-27 Western Digital Technologies, Inc. Shared media crawler database method and system

Similar Documents

Publication Publication Date Title
US8600963B2 (en) System and method for presenting multiple sets of search results for a single query
US6718365B1 (en) Method, system, and program for ordering search results using an importance weighting
CN101641694B (en) Federated search implemented across multiple search engines
CN101320373B (en) Safety search engine system of website database
US20060122994A1 (en) Automatic generation of taxonomies for categorizing queries and search query processing using taxonomies
US7860857B2 (en) Digital data processing apparatus and methods for improving plant performance
WO2007068522A1 (en) Service broker realizing structuring of portlet services
US20080201317A1 (en) Ranking documents
US20100125781A1 (en) Page generation by keyword
US20040267961A1 (en) In a World Wide Web communications network simplifying the Uniform Resource Locators (URLS) displayed in association with received web documents
KR20110122719A (en) Systems and methods for a search engine results page research assistant
WO2001055909A1 (en) System and method for bookmark management and analysis
Roszkowski et al. A distributed architecture for resource discovery using metadata
CN105574037A (en) Information processing method and device
KR20060134701A (en) Distributed domain-oriented search services apparatus and method thereof using for centralized web resource automatic classification server
Kumar Document clustering approach for meta search engine
US7856430B1 (en) Method for generating increased numbers of leads via the internet
JP3565117B2 (en) Access method for multiple different information sources, client device, and storage medium storing multiple different information source access program
US7225221B2 (en) Method and system for retrieving information, and computer product
JP2007087349A (en) Information sharing system
Yue Design of information management system for structural monitoring based on network fragmentation
JP2009122995A (en) Management system and management method of related process record
JP2003271647A (en) Browsing file data providing method, browsing frequency data providing method, relay device therefor, program and storage medium
Eichmann Advances in network information discovery and retrieval
Zouzias et al. Templated search over relational databases

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application