KR100493399B1 - Information search management system and method tereof - Google Patents

Information search management system and method tereof Download PDF

Info

Publication number
KR100493399B1
KR100493399B1 KR20030044284A KR20030044284A KR100493399B1 KR 100493399 B1 KR100493399 B1 KR 100493399B1 KR 20030044284 A KR20030044284 A KR 20030044284A KR 20030044284 A KR20030044284 A KR 20030044284A KR 100493399 B1 KR100493399 B1 KR 100493399B1
Authority
KR
Grant status
Grant
Patent type
Prior art keywords
search
document
database
client
information
Prior art date
Application number
KR20030044284A
Other languages
Korean (ko)
Other versions
KR20050005261A (en )
Inventor
최윤수
류범종
강무영
서정현
최성필
안성수
진두석
주원균
이민호
김광영
김진숙
김현
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Grant date

Links

Images

Abstract

본 발명은 데이터베이스(DB) 정보를 검색하고 관리하는 정보검색 관리 시스템 및 그 방법에 관한 것으로, 데이터베이스에 대한 검색기능 외에 안정적인 관리 기능을 추가시켜 구성함으로써, 저비용 및 고효율의 정보시스템 구축이 가능한 효과가 있다. The present invention relates to an information search control system and method for searching and managing a database (DB) information, by constructing by adding the secure management features in addition to the search function for a database, the effect capable of building information system of low cost and high efficiency have. 이를 위한 본 발명에 의한 정보검색 관리 방법은 잡 스케줄러, 제 1 내지 제 n 파이어, 셋 매니저, 데이터 매니저를 포함하는 정보검색 관리시스템의 정보검색 관리 방법에 있어서, 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 데이터베이스의 정보를 요청하여 수신받는 제 1 단계; IR management method according to the invention for this purpose is according to the job scheduler, the first to n-th fire, the three managers, IR management method for an information search control system comprising a data manager, wherein the client via the job scheduler, step 1 to receive a first to n-th fire to request information from the database; 상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 데이터베이스의 섹션 리스트를 요청하여 수신받는 제 2 단계; The second stage receives the reception to the first to n-th fire request a section list of the database is the client via the job scheduler; 상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색을 요청하여 검색 결과를 수신받는 제 3 단계; A third step of receiving the client has received the request via the job scheduler, the search for the first to n-th fire search results; 상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 유사문서검색을 요청하여 검색 결과를 수신받는 제 4 단계; A fourth step of receiving by the first to request a similar document search at the n-th fire the client via the job scheduler receives the search results; 상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색 결과 리스트를 요청하여 수신받는 제 5 단계; A fifth step of receiving receives said first to n-th request a list of search results to the client firewall via the job scheduler; 및 상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 문서의 원문을 요청하여 수신받는 제 6 단계를 포함하여 구성된 것을 특징으로 한다. And it characterized in that configured by a sixth step of receiving the request received by the text of the document to the first to n-th fire the client via the job scheduler.

Description

정보검색 관리시스템 및 그 방법{INFORMATION SEARCH MANAGEMENT SYSTEM AND METHOD TEREOF} IR control system and method {INFORMATION SEARCH MANAGEMENT SYSTEM AND METHOD TEREOF}

본 발명은 데이터베이스(DB) 정보를 검색하고 관리하는 정보검색 관리시스템 및 그 방법에 관한 것이다. The present invention relates to an information search control system and method for searching and managing a database (DB) information. 특히 데이터베이스에 대한 검색기능 외에 안정적인 관리 기능을 추가시켜 구성함으로써, 저비용 및 고효율의 정보시스템 구축이 가능한 정보검색 관리시스템 및 그 방법에 관한 것이다. In particular by adding to a stable configuration management functions in addition to the database search function, it relates to information systems available to build low-cost and highly efficient information retrieval management system and method.

과거에는 특정계층의 전유물로 인식되었던 인터넷이 웹의 등장으로 대중화되면서 일반인들을 위한 정보 공유의 장이 되었으며, 기하급수적으로 증가되는 정보의 홍수 속에서 자신의 필요한 정보를 찾고자 하는 사용자들의 요구에 의해 정보 검색 시스템에 대한 수요가 크게 증가하였다. In searching for information by the needs of the users to find their required information in the flood of information that is as popular as the Internet is the emergence of the web was recognized as the exclusive property of a particular layer was head of information-sharing for the general public, increasing exponentially the past the demand for the system was greatly increased.

정보 검색 시스템이 데이터 보관 저장 장소로 데이터베이스 관리시스템(database management system: DBMS) 활용 추세가 급증하면서 역 파일 구조의 정보검색시스템과 데이터베이스 관리시스템(DBMS)의 정형 데이터를 결합하여 검색을 지원하는 시스템이 주류를 이루고 있다. The system supports the search by combining structured data of: (DBMS database management system) information of the inverted file structure, while leveraging the trend is growing search system and database management system (DBMS) information retrieval system as a data storage repository database management system It is the mainstream. 즉, 데이터베이스 관리 시스템(DBMS)은 데이터의 관리를 담당하고, 정보 검색 시스템은 색인을 수행하고 사용자 검색에 대응하는 방식이다. In other words, a database management system (DBMS) responsible for the management of data and information retrieval systems is how to perform the index corresponds to your search.

그러나, 정보서비스를 위해 데이터베이스 관리시스템(DBMS)과 정보검색시스템을 동시에 사용하는 것은 서비스 구축 비용을 증가시키고, 개발속도를 느리게 하며, 전체적으로 시스템이 중량화되는 단점이 있었다. However, the use of a database management system (DBMS) and information retrieval systems for information services at the same time increases the service deployment costs, and slow down the speed of development, there is a disadvantage that the weight of the system as a whole screen.

또한, 인터넷 사용자의 기하급수적인 증가에 따라 인터넷에 있는 정보량 또한 급속도로 증가하며 정보 갱신도 자주 일어나고 있다. In addition, the increase in rapid addition amount of information to the Internet in accordance with the exponential growth of the Internet user and taking place frequently updated information. 이러한 정보의 홍수 속에서 자신이 필요한 정보를 찾고자 하는 사용자들의 요구에 의해 정보 검색 시스템은 대용량의 색인 및 잦은 데이터 갱신이 요구되고 있다. Informed by the needs of users in the flood of information to find the information you need, the search system is required to index and frequent updating of large amounts of data.

종래의 정보 검색 시스템은 대용량 데이터의 처리(색인)가 힘들거나 많은 사용자에 대한 응답 시간이 오래 걸렸으며, 시스템 자원을 많이 소모하였다. Was a conventional information retrieval system response time took on a tough process (index) of large amounts of data or number of users longer, and consume a lot of system resources. 또한, 데이터 갱신을 한번에 모아서 처리하는 벌크 방식을 통한 적재로 인하여 잦은 데이터 갱신이 요구되는 분야에서는 적용하는데 어려움이 있었다. In addition, it was difficult to apply in the field which requires frequent updating due to the data loaded by the bulk method for processing the collected update data at a time. 그리고, 여러 분야에서 많이 사용되고 있는 종래의 데이터베이스 시스템은 잦은 데이터 갱신은 가능하나, 많은 양의 비정형 문서를 처리하기에는 많은 시간이 걸리는 단점이 있었다. And, the conventional database system that is used a lot in several areas frequently updated data is possible, there are many disadvantages hagieneun time-consuming process large amounts of unstructured documents.

따라서, 본 발명은 상기 문제점을 해결하기 위해 이루어진 것으로, 본 발명의 목적은 데이터베이스에 대한 검색기능 외에 안정적인 관리 기능을 추가시켜 구성함으로써, 저비용 및 고효율의 정보시스템 구축이 가능한 정보검색 관리시스템 및 그 방법을 제공하는데 있다. Accordingly, the present invention has been made to solve the above problems, by the purpose of the present invention is configured by adding a secure management features in addition to search capabilities for databases, possible to construct information systems of low-cost, high-efficiency information search control system and method to provide for.

또한, 본 발명의 다른 목적은 유니코드를 지원함으로써, 고어/한자 및 다국어 언어를 저장엔진 수준에서 지원 가능하도록 한 정보검색 관리시스템 및 그 방법을 제공하는데 있다. In addition, another object of the present invention is to provide an information retrieval system management and how to be supported by in support for Unicode, Gore / Chinese and store multilingual engine level.

또한, 본 발명의 또 다른 목적은 문서 및 색인 데이터베이스에 대한 압축을 지원함으로써, 문서 크기의 세배정도 되는 색인 데이터베이스에 대한 공간을 축소하여 저장 공간을 효율적으로 이용하도록 한 정보검색 관리시스템 및 그 방법을 제공하는데 있다. In addition, a further object is a document, and by supporting the compression of the index database, information to a reduced space for the index database which is three times of the document size, efficient use of storage space, the search control system and method of the present invention to provide.

또한, 본 발명의 다른 목적은 기존의 정보검색 시스템과 데이터베이스 시스템의 장점을 취하여 대용량 데이터의 저장 및 빠른 검색, 많은 동시 사용자 처리 그리고 잦은 데이터 갱신이 가능하도록 한 정보검색 관리시스템 및 그 방법을 제공하는데 있다. Further, in another object of the present invention to provide a traditional information retrieval system and take advantage of the database system, storage of large amounts of data and quick search, many concurrent users, processes and information search control system and method with frequent data updates to be have.

상기 목적을 달성하기 위한 본 발명에 의한 정보검색 관리 시스템은, Information search control system according to the present invention for achieving the above object,

목록 데이터베이스를 저장하고 있는 목록 데이터베이스 볼륨; Save the list of databases and database list of volumes;

하나 또는 여러 개의 문서 데이터베이스를 분산하여 저장하고 있는 문서 데이터베이스 볼륨; Save to disperse one or several document databases and document database volumes;

하나 또는 여러 개의 사전 데이터베이스를 분산하여 저장하고 있는 사전 데이터베이스 볼륨; Save to disperse one or several dictionary databases and dictionary database volumes;

상기 목록 및 문서 데이터베이스 볼륨과 사용자 메모리간의 데이터 입출력을 수행하며, 상기 목록 및 문서 데이터베이스 볼륨내의 파일 및 디렉토리, 레코드, 역화일을 관리하는 커널; The list of documents and database volumes and performs data input and output between the user memory, the kernel to manage files and directories, records, reverse file in the list and document database volume;

상기 커널을 이용하여 데이터베이스에 대한 메타정보를 보관하는 카탈로그 관리, 문서 및 색인에 대한 관리를 수행하는 저장엔진; Storage engine that performs the management of catalog management, document and index using the kernel keep meta information for the database;

사용자의 질의에 대한 검색을 수행하는 검색엔진; Search engine to conduct a search for the user's query;

상기 사용자가 입력한 문서에 대한 색인어를 상기 사전 데이터베이스를 이용하여 추출하는 색인기; Indexer for extracting by using the dictionary database, the index terms for the document which the user input; And

관리자가 작성한 스키마 파일을 입력받아 데이터베이스를 생성하고 원시문서 묶음을 벌크적재하고 색인을 수행하는 데이터관리기를 포함하여 구성된 것을 특징으로 한다. Receiving a schema file created by the administrator creates a database and wherein configured to include a data manager for bulk loading source document bundle and do the index.

상기 커널은 상기 목록 및 문서 데이터베이스 볼륨의 접근을 위한 페이지 및 버퍼를 관리하고, 이를 위한 로깅 및 잠금 기능을 수행하는 기능을 더 포함하는 것을 특징으로 한다. The kernel further include the ability to manage and perform logging and locking feature for this page and buffer for access to the list of documents and a database volume.

상기 커널은 레코드가 저장되어 있는 디스크의 물리적인 식별자를 논리적인 식별자로 매핑하여 접근을 용이하게 하고, 여러개의 볼륨에 대해 논리적 식별자를 발행하는 파일 및 디렉토리 관리기; The kernel file and the directory manager and to facilitate access to map a physical identifier of a disk that is a record is stored in a logical identifier, issued by the logical identifier for the multiple of the volume; 내부적으로 한 페이지에 저장할 수 있는 객체와 한 페이지 이상되는 긴 자료항목에 대한 관리를 지원하며, 화일내의 레코드를 처음부터 순차적으로 접근하는 기능, 레코드에 대한 삽입, 수정, 삭제와 관련된 갱신 연산을 지원하는 레코드 관리기; Support the management of long data entry of more than one and objects that can be stored on one page, the page internally, and supports the update operation associated with the insert, update, delete on the features, records that the records in the file from the beginning accessed sequentially care device to record; 저장공간의 효율을 위해 키에 대한 압축을 수행하며, 삽입, 수정, 삭제, 검색 기능을 하는 역화일 관리기; Station to the file manager, and performs compression for a key to the efficiency of the storage space, insert, modify, delete, search function; 트랜잭션의 시작과 종료, 중단, 세이브 포인트(Save Point) 기능, 트랜잭션의 정보를 로그 파일에 기록하는 기능을 제공하는 트랜잭션 관리기; Start and end of a transaction, stop, save points (Save Point) function, transaction manager, which provides the ability to record information in a transaction log file; 및 상기 목록 및 문서 데이터베이스 볼륨과 사용자 메모리간의 데이터 입출력을 관리하는 입출력 관리기를 포함하여 구성된 것을 특징으로 한다. And it is characterized in that is configured including input and output manager for managing data input and output between the list and the document database volume and the user memory.

상기 트랜잭션 관리기는 회복시간을 줄이기 위해 체크 포인트를 사용하며, 지정된 작업이 중간에 실패하면 모든 작업은 트랜잭션의 시작점으로 복귀되도록 하여 데이터의 무결성을 유지시키는 것을 특징으로 한다. Wherein the transaction manager uses the checkpoint to reduce recovery time, if the designated operation fails in the middle characterized in that all the operations are to maintain the integrity of the data to ensure the return to the starting point of the transaction.

상기 입출력 관리기는 상기 목록 및 문서 데이터베이스 볼륨에 페이지를 할당, 삭제, 유지보수를 수행하는 페이지관리기; The input and output manager page manager to perform the assigned page in the list, and document database volume, deletion, and maintenance; 상기 디스크의 페이지를 메모리의 페이지로 매핑을 담당하는 버퍼관리기; A buffer manager that is responsible for mapping the page of the disk to the page of memory; 및 서로 다른 요구 사항들이 동일한 객체를 접근할 때 사용하는 잠금관리기를 포함하여 구성된 것을 특징으로 한다. And to each other by other requirements have included a lock manager that is used to access the same object, characterized in that configured.

상기 저장 엔진은 구축하고자 하는 데이터베이스의 구조에 대한 정보를 관리하는 카탈로그 관리기; The storage engine catalog manager that manages information about the structure of the database you want to build; 원본 문서를 내부 문서구조로 변환하여 삽입, 기존 문서의 삭제 또는 수정에 대한 연산을 수행하는 문서 관리기; Document care device to operate on the insertion, deletion, or modification of an existing document by converting the original document into the document structure; 및 상기 색인기를 이용하여 추출된 색인 정보를 검색에 적합한 구조로 구성하는 색인 관리기를 포함하여 구성된 것을 특징으로 한다. And it is characterized in that is configured to include index managers that are part of the extracted index information using the indexer to the structure suitable for retrieval.

상기 데이터베이스의 구조에 대한 정보는 문서 구조, 색인 방법, 기본키 정보, 압축여부, 불용어를 포함하는 것을 특징으로 한다. Information about the structure of the database is characterized in that it includes a document map, indexing methods, the primary key information, whether compressed, stopwords.

상기 목적을 달성하기 위한 본 발명에 의한 다른 정보검색 관리 시스템은, Other search management system according to the present invention for achieving the above object,

목록 데이터베이스를 저장하고 있는 목록 데이터베이스 볼륨; Save the list of databases and database list of volumes;

하나 또는 여러 개의 문서 데이터베이스를 분산하여 저장하고 있는 문서 데이터베이스 볼륨; Save to disperse one or several document databases and document database volumes;

상기 목록 및 문서 데이터베이스의 디렉토리와 볼륨, 데이터베이스 그룹, 섹션의 정의, 섹션의 색인 방식, 원시 문서의 구조, 원시 문서로부터 데이터베이스로의 적재 방법에 대한 정보를 기술하는 데이터베이스 스키마 파일; The definition of the lists and directories and volumes, database group, the section of the document database, the index scheme of the section of the source document structure, database schema files from the source document describing information on how to load the database;

상기 문서 데이터베이스에 적재될 원시 문서들로 구성된 원시 문서 파일; Raw text file, consisting of raw documents to be loaded into the document database;

상기 목록 데이터베이스에 적재될 불용어 목록; Stopword list to be loaded on the list of databases; And

상기 데이터베이스 스키마 파일로부터 수신된 정보에 의해 상기 문서 데이터베이스 생성 및 문서 적재를 수행하며, 상기 문서 데이터베이스 생성 및 문서 적재를 위한 명령어를 관리자로부터 입력받는 로더를 포함하여 구성된 것을 특징으로 한다. By the information received from the database schema file, and performs the document generation and document database load, characterized in that configured to include the document database generation and Loader: receiving a command from the manager for the document stacking.

상기 데이터베이스 스키마 파일에 기술되어 있는 원시 문서의 구조를 통하여 이종 구조를 가진 문서도 하나의 데이터베이스에 적재가 가능한 것을 특징으로 한다. FIG documents with heterogeneous structure for the structure of the original document that is described in the database schema file is characterized in that loading is possible in a single database.

상기 목적을 달성하기 위한 본 발명에 의한 또 다른 정보검색 관리 시스템은, Another information search control system according to the present invention for achieving the above object,

클라이언트로부터 수신된 연결 요청을 제 1 내지 제 n 파이어들의 상태에 따라 작업을 분배해 주며, 온라인 문서관리시 데이터 매니저에 문서 관리를 요청하여 그 결과를 클라이언트에게 전송하며, 데이터베이스 변경시 데이터 매니저, 제 1 내지 제 n 파이어, 셋 매니저에게 데이터베이스가 변경되었음을 알리는 잡 스케줄러; Gives to distribute according to a connection request received from the client, the state of the first to n-th fire operation, requests the document management in the online document management when the data manager and transmits the result to the client, when the database changes the data manager, the 1 to n Fire, job scheduler to notify the manager that the database is set to change;

상기 잡 스케줄러로부터 수신된 서비스 요청에 대한 작업을 수행하며 그 결과를 상기 클라이언트에게 전송하며, 검색 결과를 셋 매니저에게 저장 요청하는 제 1 내지 제 n 파이어; First to n-th fire to work with the service request received from the job scheduler, and transmits the result to the client, storing the search results to the set manager requests;

상기 제 1 내지 제 n 파이어로부터 수신된 서비스 요청에 대한 작업을 수행하며 그 결과를 상기 제 1 내지 제 n 파이어에게 전송하는 셋 매니저; The first to n-th to work with the service request received from the fire and set manager that the first to be sent to the n-th fire the result; And

상기 잡 스케줄러로부터 수신된 서비스 요청에 대한 작업을 수행하며 그 결과를 상기 잡 스케줄러에게 전송하는 데이터 매니저를 포함하여 구성된 것을 특징으로 한다. Including the data managers to perform tasks for the service request received from the job scheduler, and transmits the result to the job scheduler, characterized in that configured.

상기 목적을 달성하기 위한 본 발명에 의한 정보검색 관리 방법은, IR management method according to the present invention for achieving the above object,

잡 스케줄러, 제 1 내지 제 n 파이어, 셋 매니저, 데이터 매니저를 포함하는 정보검색 관리시스템의 정보검색 관리 방법에 있어서, According to the job scheduler, the first to n-th fire, the three managers, IR management method for an information search control system comprising a data manager,

클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 데이터베이스의 정보를 요청하여 수신받는 제 1 단계; A first step the client via the job scheduler receives the first to receive the n-th fire to request information from the database;

상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 데이터베이스의 섹션 리스트를 요청하여 수신받는 제 2 단계; The second stage receives the reception to the first to n-th fire request a section list of the database is the client via the job scheduler;

상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색을 요청하여 검색 결과를 수신받는 제 3 단계; A third step of receiving the client has received the request via the job scheduler, the search for the first to n-th fire search results;

상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 유사문서검색을 요청하여 검색 결과를 수신받는 제 4 단계; A fourth step of receiving by the first to request a similar document search at the n-th fire the client via the job scheduler receives the search results;

상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색 결과 리스트를 요청하여 수신받는 제 5 단계; A fifth step of receiving receives said first to n-th request a list of search results to the client firewall via the job scheduler; And

상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 문서의 원문을 요청하여 수신받는 제 6 단계를 포함하여 구성된 것을 특징으로 한다. Characterized in that said client is configured to receive via said job scheduler comprises a sixth step of receiving the request, the full text of the document to the first to n-th fire.

상기 제 1 단계에서 상기 제 1 내지 제 n 파이어는 상기 잡 스케줄러를 통해 수신한 상기 클라이언트의 요청에 의해 데이터베이스 정보를 검색하여 상기 클라이언트에게 전송하는 것을 특징으로 한다. In the first step of the first to n-th fire it is characterized in that the search transmitted to the client database information at the request of the client received via the job scheduler.

상기 제 2 단계에서 상기 제 1 내지 제 n 파이어는 상기 잡 스케줄러를 통해 수신한 상기 클라이언트의 요청에 의해 데이터베이스의 섹션 리스트를 검색하여 상기 클라이언트에게 전송하는 것을 특징으로 한다. In the second step of the first to n-th fire it is characterized by transmitting to the client by searching the list section of the database at the request of the client received via the job scheduler.

상기 제 3 단계에서 상기 클라이언트는 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 질의, 검색대상 데이터베이스 리스트, 섹션을 포함한 검색 정보를 전송하는 것을 특징으로 한다. In the third step the client is characterized in that through the job scheduler sends the search information, including the query, the search target database list, the section to the first to n-th fire.

상기 제 3 단계는 상기 제 1 내지 제 n 파이어에서 상기 클라이언트로부터 수신된 상기 검색 정보에 의해 검색을 수행한 후 검색 결과를 상기 셋 매니저에게 전송하는 단계; The third step is a step of transmitting after performing a search by the search information received from the client from the first to n-th fire search result to the set manager; 상기 셋 매니저에서 상기 제 1 내지 제 n 파이어로부터 수신된 검색 결과를 저장한 후, 결과 셋 번호와 문서 개수를 상기 제 1 내지 제 n 파이어에게 전송하는 단계; , At the set manager sent to the first through n then stores the search results received from the fire, the result set number and the first to n-th fire the number of documents; 및 상기 제 1 내지 제 n 파이어에서 상기 셋 매니저로부터 수신된 결과 셋 번호와 문서 개수를 상기 클라이언트에게 전송하는 단계를 포함하여 구성된 것을 특징으로 한다. And in the first to n-th fire characterized in that configured by comprising the step of transmitting the result set number and the number of documents received from the set manager to the client.

상기 제 4 단계에서 상기 클라이언트는 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색 문서번호, 검색대상 데이터베이스 리스트, 섹션, 검색 방법을 포함한 유사문서 검색 정보를 전송하는 것을 특징으로 한다. In the fourth step the client is characterized in that it transmits a similar document search information, including the first to retrieve the document number, the search target database list section search method at the n-th fire through the job scheduler.

상기 제 4 단계는 상기 제 1 내지 제 n 파이어에서 상기 클라이언트로부터 수신된 상기 유사문서 검색 정보에 의해 검색을 수행한 후 검색 결과를 상기 셋 매니저에게 전송하는 단계; The fourth step is transmitting after performing a search by the similar document search information received from the client from the first to n-th fire search result to the set manager; 상기 셋 매니저에서 상기 제 1 내지 제 n 파이어로부터 수신된 검색 결과를 저장한 후, 결과 셋 번호와 문서 개수를 상기 제 1 내지 제 n 파이어에게 전송하는 단계; , At the set manager sent to the first through n then stores the search results received from the fire, the result set number and the first to n-th fire the number of documents; 및 상기 제 1 내지 제 n 파이어에서 상기 셋 매니저로부터 수신된 결과 셋 번호와 문서 개수를 상기 클라이언트에게 전송하는 단계를 포함하여 구성된 것을 특징으로 한다. And in the first to n-th fire characterized in that configured by comprising the step of transmitting the result set number and the number of documents received from the set manager to the client.

상기 제 5 단계에서 상기 클라이언트는 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색 시 수신한 결과 셋 번호, 보여줄 섹션과 수신받을 검색 결과 리스트의 개수를 포함한 검색 결과 리스트 정보를 전송하는 것을 특징으로 한다. In the fifth step the client is characterized by transmitting a search result list information including the number of the first to the n results received during the search in Fire set number, the search to receive the receiving section and show the result list through the job scheduler, It shall be.

상기 제 5 단계는 상기 제 1 내지 제 n 파이어에서 상기 클라이언트로부터 수신한 상기 검색 결과 리스트 정보를 상기 셋 매니저에게 전송하는 단계; The fifth step is the step of transmitting the search result list information received from the client from the first to n-th fire to the set manager; 상기 셋 매니저에서 상기 제 1 내지 제 n 파이어로부터 수신한 상기 검색 결과 리스트 정보에 포함된 검색 결과 리스트의 개수 만큼의 문서를 상기 제 1 내지 제 n 파이어에게 전송하는 단계; Wherein the sending the document as many as the number of the search result list including the one to which the search result list information received from the n-th fire to the first to n-th fire in the set manager; 및 상기 제 1 내지 제 n 파이어에서 상기 셋 매니저로부터 수신된 문서를 가지고 상기 클라이언트가 요구한 섹션 정보를 검색하여 검색 결과를 상기 문서와 같이 상기 클라이언트에게 전송하는 단계를 포함하여 구성된 것을 특징으로 한다. And in the first to n-th fire characterized in that configured to include a step of the client is searching for a section information request transmits a search result to the client, such as the document with the document received from the set manager.

상기 제 6 단계에서 상기 클라이언트는 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 문서 번호를 전송하는 것을 특징으로 한다. In the sixth step the client is characterized in that the transmission of document number to the first to n-th fire through the job scheduler.

상기 제 6 단계는 상기 제 1 내지 제 n 파이어는 상기 클라이언트로부터 수신한 상기 문서 번호에 해당하는 문서의 문서 내용을 상기 클라이언트에게 전송하는 것을 특징으로 한다. The sixth step is the first to n-th fire is characterized by sending a document to the document corresponding to the document number received from the client to the client.

상기 목적을 달성하기 위한 본 발명에 의한 다른 정보검색 관리 방법은, Other management information search method according to the present invention for achieving the above object,

잡 스케줄러, 제 1 내지 제 n 파이어, 셋 매니저, 데이터 매니저를 포함하는 정보검색 관리시스템의 정보검색 관리 방법에 있어서, According to the job scheduler, the first to n-th fire, the three managers, IR management method for an information search control system comprising a data manager,

클라이언트가 문서와 삽입 또는 변경할 데이터베이스 정보를 상기 잡 스케줄러로 전송하는 단계; Steps that the client sends to the job scheduler and a document insert or change the database information;

상기 잡 스케줄러에서 상기 클라이언트가 전송한 정보를 상기 데이터 매니저에게 전송하는 단계; Transmitting the client data transmitted by the scheduler in the job to said data manager;

상기 데이터 매니저에서 문서 저장 또는 변경 후 결과를 상기 잡 스케줄러에게 전송하는 단계; Sending the job to the scheduler, the results after the document storage or change in the data manager;

상기 잡 스케줄러에서 삽입 또는 변경이 성공적이면 셋 매니저에게 결과 셋을 갱신할 것을 명령하는 단계; Instructing you to update the result set, or if the change is to insert three successful manager in the job scheduler;

상기 셋 매니저에서 명령 수행 결과를 상기 잡 스케줄러에게 전송하는 단계; Transmitting to said job scheduler command execution results from the three managers;

상기 잡 스케줄러에서 최종 결과를 상기 제 1 내지 제 n 파이어에게 전송하는 단계; Wherein the first to be sent to the n-th fire the end result in the job scheduler; And

상기 제 1 내지 제 n 파이어에서 데이터베이스를 다시 오픈하고 결과를 상기 클라이언트에게 전송하는 단계를 구비한 한 개의 문서를 삽입 및 변경하는 방법을 포함하여 구성된 것을 특징으로 한다. Said first characterized in that configured in the first to the n-th re-open the database results in the fire includes a method of insertion and changing the one document comprising the step of transmitting to the client.

상기 정보검색 관리 방법은 상기 클라이언트에서 삭제할 문서의 아이디(ID)를 상기 잡 스케줄러로 전송하는 단계; The management information search method comprises the steps of transmitting the identity (ID) of the document to be deleted from the client to the job scheduler; 상기 잡 스케줄러에서 상기 클라이언트로부터 수신한 삭제할 문서의 아이디(ID)를 상기 데이터 매니저로 전송하는 단계; Transmitting the identity (ID) of the document to be deleted is received from the client in the job scheduler in the data manager; 상기 데이터 매니저에서 문서 삭제 후 결과를 상기 잡 스케줄러에게 전송하는 단계; Sending the job to the scheduler, the results after deleting a document in the data manager; 상기 잡 스케줄러에서 삭제가 성공적이면 셋 매니저에게 결과 셋을 갱신할 것을 명령하는 단계; Instructing that has been deleted from the job scheduler to update the results to the three managers if successful three; 상기 셋 매니저에서 명령 수행 결과를 상기 잡 스케줄러에게 전송하는 단계; Transmitting to said job scheduler command execution results from the three managers; 상기 잡 스케줄러에서 최종 결과를 상기 제 1 내지 제 n 파이어에게 전송하는 단계; Wherein the first to be sent to the n-th fire the end result in the job scheduler; 및 상기 제 1 내지 제 n 파이어에서 데이터베이스를 다시 오픈하고 결과를 상기 클라이언트에게 전송하는 단계를 구비한 한 개의 문서를 삭제하는 방법을 더 포함하여 구성된 것을 특징으로 한다. And as the first to the n being configured to further include a method of deleting a single document comprising the step of re-opening the database in the fire and sends the result to the client.

이하, 첨부된 도면을 참조하여 본 발명의 실시예에 대해 상세히 설명하기로 한다. With reference to the accompanying drawings, it will be described in detail for an embodiment of the present invention.

도 1은 본 발명에 의한 정보검색 관리시스템의 전체 구성 블록도이다. 1 is an overall configuration block diagram of an information search control system according to the present invention.

상기 도 1에 도시된 바와 같이, 상기 정보검색 관리시스템은 크게 커널(10), 저장엔진(20), 검색엔진(30), 색인기(40), 사전 데이터베이스(DB)(50), 데이터 관리기(60), 목록 데이터베이스 볼륨(volume)(70), 문서 데이터베이스 볼륨(80)을 포함하여 구성한다. As described above in Figure 1, the search control system greatly kernel 10, the storage engine 20, search engine 30, indexer 40, a dictionary database (DB) (50), data manager ( 60), and configured to include a list of the database volume (volume) (70), a document database volume 80.

상기 커널(10)은 상기 정보검색 관리시스템의 하부구조로서, 물리적인 디스크와 사용자 메모리간의 데이터 입출력을 담당하며, 크게 파일 및 디렉토리 관리기(11), 레코드 관리기(12), 역화일 관리기(13), 트랜잭션 관리기(14), 입출력 관리기(15)를 포함하여 구성한다. The kernel 10 is a lower structure of the IR control system, and is responsible for data input and output between the physical disks and the user memory, large file and directory manager 11, a record manager 12, an inverse file manager 13 and configured to include a transaction manager 14, the input-output manager (15).

여기서, 상기 파일 및 디렉토리 관리기(11)는 물리적인 디스크 공간에 논리적으로 동일한 집합인 레코드나 역화일을 구성하기 위해 사용되는 단위로서, 페이지들의 묶음인 익스텐트 단위로 할당된다. Here, the files and directories care device 11 is a unit that is used to configure the same logical set of records or files to the station on the physical disk space is allocated in the stack of units the extent of the page. 레코드가 저장되어 있는 디스크의 물리적인 식별자를 논리적인 식별자로 매핑하여 접근을 용이하게 하고, 여러개의 볼륨에 대해 유일한 논리적 식별자를 발행할 수 있다. Facilitate access to map a physical identifier of a disk that is a record is stored in a logical identifier, it is possible to issue a unique logical identifier for the multiple volumes.

상기 레코드 관리기(12)는 내부적으로 한 페이지에 저장할 수 있는 객체와, 한 페이지 이상되는 긴 자료항목에 대한 관리를 지원하며, 화일내의 레코드를 처음부터 순차적으로 접근하는 기능, 레코드에 대한 삽입, 수정, 삭제와 관련된 갱신 연산을 지원한다. Insert on the features, it records that the records manager (12) supports the management of long data entry of more than one and objects that can be stored on a single page internally, pages, and access to the records in the file sequentially from the start, modify, It supports update operations related, removed.

상기 역화일 관리기(13)는 B트리를 사용하여 구현되었으며, 키 부분은 정수, 실수, 가변길이 문자열 중 하나를 사용할 수 있고, 엘레멘트 부분에는 사용자가 정의한 구조체를 저장한다. The file manager station (13) is implemented by a B-tree, the key portion may be an integer, real number, one of the variable-length string, the element portion is to store a user-defined structure. 저장공간의 효율을 위해 키에 대한 압축을 수행할 수 있으며, 삽입, 수정, 삭제, 검색 등의 기능을 제공한다. It provides features such as compression can be performed for the key to the efficiency of the storage space, insert, edit, delete, and search.

상기 트랜잭션 관리기(14)는 사용자가 지정한 작업의 단위를 안정적으로 수행하기 위한 일련의 기능을 제공한다. The transaction manager 14 provides a set of functions for performing a unit operation of the user-specified reliably. 즉, 트랜잭션의 시작과 종료, 중단, 세이브 포인트(Save Point) 기능, 트랜잭션의 정보를 로그 파일에 기록하는 기능을 제공하고, 회복시간을 줄이기 위해 체크 포인트를 사용한다. In other words, providing the ability to record the start and finish, stop, save points (Save Point) functionality, information on the transactions in a transaction log file, and use checkpoints to reduce the recovery time. 지정된 작업이 중간에 실패한다면 모든 작업은 트랜잭션의 시작점으로 복귀되어 데이터의 무결성을 유지한다. If the specified task failed in the middle of all jobs are returned to the starting point of a transaction to maintain the integrity of the data.

상기 입출력 관리기(15)는 물리적인 디스크에 페이지를 할당, 삭제, 유지보수를 수행하는 페이지관리기와, 디스크의 페이지를 메모리의 페이지로 매핑을 담당하는 버퍼관리기와, 서로 다른 요구 사항들이 동일한 객체를 접근할 때 사용하는 잠금관리기 등으로 구성되며, 저장시스템의 버퍼는 공유메모리로 구현되어, 동시에 여러개의 프로세스가 접근할 수 있도록 한다. And a page manager for the input-output manager (15) performs the assigning a page to the physical disk, delete, maintenance, and the page in the disk buffer manager that is responsible for mapping to a page in the memory, the locations are the same object different requirements when access is configured as a lock manager, such as using, in the buffer storage system is implemented as a shared memory, at the same time it makes it possible to access the multiple processes.

다음, 상기 저장엔진(20)은 상기 커널(10)을 하부구조로 이용하여 설계되었으며, 카탈로그 관리기(21), 문서 관리기(22), 색인 관리기(23)를 포함하여 구성한다. Next, the storage engine 20 is designed by using the kernel 10 to the lower structure, and configured to include a catalog manager 21, a document manager 22, an index manager (23).

여기서, 상기 카탈로그 관리기(21)는 문서 구조, 색인 방법, 기본키 정보, 압축여부, 불용어 등 구축하고자 하는 데이터베이스의 구조에 대한 정보를 관리한다. Here, the catalog manager 21 manages information about the structure of the database you want to build such a document structures, indexing methods, primary key information, whether or not compressed, stopwords. 그리고, 상기 문서 관리기(22)는 원본 문서를 내부 문서구조로 변환하여 삽입, 기존 문서의 삭제 또는 수정에 대한 연산을 수행하고, 상기 색인 관리기(23)는 상기 색인기(40)를 이용하여 추출된 색인 정보를 검색에 적합한 구조로 구성한다. Further, the said document manager (22) is to operate on the insertion, deletion, or modification of an existing document by converting the original document into the document structure, and the index manager 23 is extracted by using the indexer 40 constitute the index information in a structure appropriate to the search.

상기 저장엔진(20)은 레코드(객체)의 크기에 제한이 없으며, 안정적인 온라인 삽입, 삭제를 위해 트랜잭션 처리를 통한 회복기능을 제공한다. The storage engine (20) provides a recovery function through the transaction process to a size not restricted, reliable online insertion, deletion of records (objects). 또한 XML, SGML과 같은 구조문서 및 멀티미디어 데이터등 다양한 타입의 객체 저장 및 검색을 지원한다. It also supports the document structure, and various types of object storage and retrieval of multimedia data, such as XML, SGML.

다음, 상기 검색 엔진(30)은 크게 부울 모델과 확장 벡터 모델을 지원한다. Next, the search engine 30 is largely support the Boolean model and the vector model expansion. 이 때, 부울 모델은 기본 불리언의 확장으로서 불리언 연산자(and, or, not), 근접도 연산자(near, within), 관계연산자(=,<=,<,>=,>), 범위연산자(range), 그리고 절단 연산자를 지원한다. At this time, the Boolean model Boolean operators as an extension of the basic boolean (and, or, not), proximity operators (near, within), relational operators (=, <=, <,> =,>), the range operator (range ), and supports cutting operators. 확장 벡터 모델은 사용자 질의와 문서간의 유사도 값의 계산에 따라 검색 결과를 내는 순수 벡터 모델을 확장한 모델로서 벡터 연산을 기본으로 하되, 불리언 모델의 근접도 연산자를 제외한 나머지 연산자를 허용한다. Expansion vector model allows the rest of the operator other than the user's query, but with a vector calculated as a model extends the pure model vector that results in accordance with the calculated value of the degree of similarity between the document to the default, close-up of the Boolean models operator.

다음, 상기 색인기(40)는 다양한 색인형식을 제공하여 사용자가 특정한 섹션에 대하여 적합한 색인형식을 선택하게 하였고, 유니코드 기반으로 구성되어 고어/한자 및 다국어로 구성된 문서도 쉽게 처리가 가능하다. Next, the indexer 40 provides a number of index format was selected the appropriate format index to the user a particular section, consists of a Unicode-based it is possible to easily process documents consisting of Gore / Chinese characters and languages. 영어에 대해서는 단어의 어근을 색인할 수 있는 스테밍 옵션과, 한자에 대해서는 한글로 변환하여 색인할 수 있는 옵션을 제공한다. For about English to index the root of the word stemming options and convert Hangul to Chinese characters and provides you the option to index. 한글에 대해서는 실질형태소 사전, 어미사전, 조사사전, 결합형 보조용어 사전, 불용어 처리용 형식형태소 사전 등을 이용하여 처리한다. For Hangul it will be processed using a real morpheme dictionary, Dictionary endings, pre-irradiation, coupled auxiliary word dictionary, morphological type, such as for pre-processing stopwords.

다음, 상기 데이터관리기(60)는 관리자가 작성한 스키마를 이용하여 대용량의 벌크데이터를 데이터베이스에 적재 및 색인한다. Next, the data manager 60 loading and indexing a large amount of bulk data to the database using the schema created by the administrator. 적재에 사용되는 데이터는 일반 텍스트 파일과 함께, 지집(gzip)으로 압축된 압축파일도 포함하며, 저장시에도 공간효율을 위해 압축을 하여 저장할 수 있다. Data that is used for mounting can be saved to a compressed for space efficiency, even with a plain text file, and also contain the compressed file compressed by jijip (gzip), during storage. 또한, 유니코드의 지원을 위해, 다른 형식의 문서는 내부적으로 UTF-8형식으로 인코딩하여 저장한다. Furthermore, for the support of Unicode, other types of document and stores internally encoded in UTF-8 format. 적재시 기본키를 점검하여 동일한 문서의 적재를 방지하고, 디스크의 연속된 공간에 데이터를 효과적으로 배치하여, 대용량 문서 및 색인을 신속하게 수행하고 후에 접근을 용이하게 한다. Check the load when the primary key to prevent loading of the same document, to effectively place the data in a contiguous space on the disk, quickly perform large documents and index, and facilitates the access later.

다음, 상기 목록 데이터베이스 볼륨(70)은 목록 데이터베이스를 저장하고 있고, 상기 문서 데이터베이스 볼륨(80)은 하나 또는 여러 개의 문서 데이터베이스를 분산하여 저장하고 있다. Next, the list of the database volume 70, and stores the list of the database, said document database volume 80 has been stored by dispersing one or more document databases. 여기서, 상기 문서 데이터베이스는 구축하려는 실제의 문서들과 그 문서들에 대한 색인을 저장하며, 목록 데이터베이스는 데이터베이스들에 대한 문서 구조, 색인 방법, 기본 키(Primary Key), 압축여부, 불용어 등에 대한 정보들을 저장하여 유지한다. Here, the information on the document database stores an index for a real document and the document that you want to build, list database document structure for database, index methods, the primary key (Primary Key), Compressed, StopWords It maintains to the store.

상기 문서 데이터베이스는 도 1에 도시된 바와 같이, 하나 이상의 저장 장치(Document Volume)에 걸쳐 분산 저장된다. The document databases are distributed throughout the storage, one or more storage devices (Document Volume) as shown in FIG. 이는 대용량 데이터베이스를 처리하기 위한 방법의 일환으로 대용량 데이터베이스에 대한 검색성능을 향상시키기 위해서 멀티쓰레드를 이용한 분산검색을 이용한다. This uses a distributed search with a multi-thread in order to improve search performance for large databases, as part of a method for processing a large database.

본 발명에 의한 정보검색 관리시스템은 여러 개의 데이터베이스에서 레코드를 식별하기 위해 각 레코드마다 논리적인 문서 식별자(Record Identifier: RID)를 부여한다. IR administration of the present invention system is a logical document identifier for each record in order to identify the record in multiple databases: gives the (Record Identifier RID). 논리적 문서 식별자는 데이터베이스 그룹 전체에서 유일하도록 시스템에 의해 자동으로 부여되며, 볼륨 식별자와 레코드번호로 구성된다. Logical document identifier is automatically assigned by the system to only one in the entire database group, it consists of the volume identifier and the record number.

§문서 구조 § Document Structure

본 발명에 의한 정보검색 관리시스템은 주로 '단행본 도서', '연구보고서', '논문' 또는 '신문기사' 등과 같은 비정형의 텍스트 문서에 대한 검색을 지원한다. Information Retrieval Management System according to the present invention is mainly supported the search for unstructured text documents like "Paperback Book ',' Research Report ',' paper 'or' newspaper '. 이 시스템에서 데이터베이스는 텍스트 문서 개체들의 집합체이며, 하나의 문서는 '제목', '저자명', '초록' 등의 섹션들로 구성된다. In this system, the database is a collection of text documents, objects, one of the document consists of sections such as 'Title', 'Author', 'green'. 이것은 관계형 데이터베이스에서의 테이블(또는 릴레이션)이 레코드들로 구성되며, 각각의 레코드가 여러 개의 필드(또는 속성)들로 구성되는 계층구조에 비유될 수 있다. This consists of a table (or relations) in a relational database records, and each record can be compared to a layer structure consisting of a number of fields (or attributes). 본 발명에 의한 정보검색 관리시스템에서 문서를 구성하는 섹션들은 다음과 같이 세 가지로 분류된다. Sections that make up the document from the information search control system according to the present invention are categorized into three as follows.

●기본 섹션(Basic Section) ● main section (Basic Section)

기본 섹션은 하나의 문서를 구성하는 최소 단위의 문서 구성요소이다. The default section is the smallest unit of the document components that make up a single document. 사용자는 데이터베이스 검색 과정에서 문서 검색의 범위를 지정하기 위한 기본단위로서 기본섹션을 사용할 수 있다. You can use the default section as a basic unit for specifying a range of documents retrieved from a database search process. 예를 들면, '제목', '저자명', '저자의 소속 기관', '초록', '본문' 등은 모두 논문을 구성하는 기본 섹션이 될 수 있다. For example, 'Title', 'Author', 'institution of the author', 'green', 'body', etc. can all be primary sections that make up the paper. 그리고 사용자는 검색 범위를 '논문 제목'과 '초록'이라는 두개의 기본 섹션에 한정시킴으로써 질의의 수행을 지시할 수 있다. And the user can instruct the execution of a query by limiting the scope of the search in two main sections called 'Title' and 'green'. 또한 기본 섹션은 문서 색인을 위한 단위로 사용되기도 한다. In addition, the main section is also used as a basis for document indexing. 다시 말해, 본 발명에 의한 정보검색 관리시스템은 문서의 빠른 검색을 위해 기본 섹션별로 색인 화일을 구성한다. In other words, the management information retrieval system according to the present invention is configured to index files by default sections for quick retrieval of documents. 상기 정보검색 관리시스템의 기본 섹션의 내용은 문자열, 숫자 모두 지원한다. The contents of the main section of the Information Retrieval Management System supports both strings and numbers.

●가상 섹션(Virtual Section) ● virtual sections (Virtual Section)

본 발명에 의한 정보검색 관리시스템에서는 기본 섹션들에 대한 다양한 색인타입을 지원하기 위해 물리적으로 하나의 의미를 갖는 새로운 섹션을 구성할 수 있다. In the information search control system according to the present invention can form a new section having a single physical means in order to support various types of indexes for the main section. 이 섹션 형태를 가상 섹션이라고 한다. This section of the form is called a virtual section. 또한 가상 섹션은 기본 섹션과 결합하여 결합 섹션을 구성할 수 있다. The virtual section can be configured to combine sections in conjunction with the main section. 예를 들어, '제목'의 기본 섹션에 대해 '제목 2', '제목 3'의 가상섹션을 구성하고 각각을 부분 일치(INDEX_BY_MA), 완전 일치(INDEX_AS_IS)등 다양한 타입의 색인을 구성할 수 있다. For example, it is possible to configure the virtual section of the "title 2", "title 3" for the base section of the "title" and configure the various types of indexing and partial match (INDEX_BY_MA), respectively, the match (INDEX_AS_IS) .

●결합 섹션(Union Section) ● combined sections (Union Section)

본 발명에 의한 정보검색 관리시스템에서는 여러 개의 기본 섹션 및 가상섹션들을 결합하여 논리적으로 하나의 의미를 갖는 새로운 섹션을 구성할 수 있다. In the information search control system according to the present invention can form a new section has a meaning as a logical combination of several primary section and the virtual section. 이러한 섹션을 결합 섹션이라고 부르는데, 이것은 실제 색인을 생성하지 않으면서 사용자의 관점에서 하나의 섹션 단위로 인식되는 가상의 섹션이다. Bureuneunde these sections that combine the section, which is a section of the virtual recognized in terms of an index without generating actual users as a single section unit. 예를 들어, '주제목', '부제목', '소제목'의 기본섹션 또는 가상섹션을 결합하여 '제목'이라는 결합 섹션을 구성할 수 있다. For example, the 'main title', 'Subtitle', by combining the main section or sections of the virtual 'subtitle' can constitute a binding section called "Title".

§색인 형태 § Index form

일반적으로 색인은 시스템의 검색 속도를 높일 뿐만 아니라 검색 효과에도 큰 영향을 미치는 것으로 알려져 있다. Typically, the index is known to have a significant impact, as well as speed the search for effective search systems. 따라서 적절한 색인 방법의 지정은 시스템의 성능과 질을 크게 향상 시킬 수 있다. Therefore, specify the appropriate indexing method can greatly improve the performance and quality of the system. 본 발명에 의한 정보검색 관리시스템은 문서의 색인을 위해 여러 가지의 색인 방식을 지원하며, 데이터베이스 설계자는 문서의 기본 섹션 및 가상 섹션 마다 이들 색인 방식 중의 하나를 적용한다. Search management system according to the present invention supports multiple ways of indexing for indexing a document, database designers must apply one of these methods for each index the main section and the virtual section of the document. 또한 한자와 스테밍(STEMMING) 처리에 대한 옵션이 제공된다. This option is also available for Chinese and stemming (STEMMING) process. 한자2한글(HANJA2HANGLE) 옵션이 참(TRUE)인 경우는 한자로 된 문서인 경우에 한자를 한글로 변환한 후 이를 색인 방식에 따라 색인어를 추출하고, 한자2한글(HANJA2HANGLE) 옵션이 거짓(FALSE)인 경우는 한글로 변환하지 않고 한자를 색인 방식에 따라 색인어를 추출한다. Chinese two Hangul (HANJA2HANGLE) option is true (TRUE) in the case after converting the kanji in the case of a by Chinese documents in Hangul along which the index method to extract the index term, Chinese 2 Hangul (HANJA2HANGLE) option is false (FALSE if) the extracts index terms in accordance with the Chinese character, without conversion into the index system Hangul. 영문의 경우 스테밍(STEMMING) 옵션이 참(TRUE)인 경우에만 스테밍(STEMMING) 처리를 한다. For the US only if Stemming (STEMMING) option is true (TRUE) and the stemming (STEMMING) process.

본 발명에 의한 정보검색 관리시스템은 INDEX_AS_IS, INDEX_BY_TOKEN, INDEX_BY_MA, INDEX_BY_CHAR, INDEX_AS_NUMERIC, INDEX_AS_IS_MA 등과 같은 6가지의 기본 색인 방식을 구비한다. Information search control system according to the present invention comprises six main index manner, such as INDEX_AS_IS, INDEX_BY_TOKEN, INDEX_BY_MA, INDEX_BY_CHAR, INDEX_AS_NUMERIC, INDEX_AS_IS_MA.

●INDEX_AS_IS ● INDEX_AS_IS

상기 INDEX_AS_IS는 문서에서 섹션의 내용 또는 값 전체를 하나의 색인어로 추출한다. The INDEX_AS_IS extracts the entire contents or values ​​of the section of the document to one of the index terms. 그렇게 함으로써 그 섹션에 대한 완전 일치(Exact matching)의 검색을 지원한다. By doing so, support the search for a match (Exact matching) for that section. INDEX_AS_IS로 색인된 섹션에 대해 단지 문자열 값의 일치(Character String equality)여부만을 확인하는 수준에서의 검색을 수행한다. For the section index to INDEX_AS_IS just do a search in the levels check only whether the consistent string value (Character String equality). 관계연산자(<,<=,>,>=,>)를 이용한 문자열 값의 비교는 가능하다. Comparison of string values ​​using the relational operators (<, <=,>,> =,>) is available. INDEX_AS_IS 색인 방식은 '제어번호'와 같이 레코드를 구별할 수 있도록 유일하게 부여된 기본 섹션에 주로 사용된다. INDEX_AS_IS index method is mainly used in the default section only granted to distinguished record as "control number".

예) 제 목 : "정보검색에 관한 연구" Example) Title: "Research on Information Retrieval"

색인어 : "정보검색에 관한 연구" Index terms: "Research on Information Retrieval"

예) 제 목 : "情報檢索에 관한 硏究" Example) Title: "硏 究 about 情報 檢索"

색인어 : "情報檢索에 관한 硏究" Index terms: "硏 究 on 情報 檢索"

예) 제어번호 : "AN00012" For example) control number: "AN00012"

색인어 : "AN00012" Index terms: "AN00012"

●INDEX_BY_TOKEN ● INDEX_BY_TOKEN

상기 INDEX_BY_TOKEN은 텍스트 검색과 같이 내용 기반의 부분 일치(Partial matching) 검색을 지원해야 하는 섹션에 적용 가능하다. The INDEX_BY_TOKEN is applicable to the section that you need to support the matching of the content, such as text-based search (Partial matching) the search. 상기 INDEX_BY_TOKEN 색인 방식은 섹션의 내용 또는 값 전체를 색인어로 사용하는 것이 아니라, 섹션내의 어절 또는 단어들 중에서 색인어를 선정한다. The INDEX_BY_TOKEN index method is not to use the entire contents or values ​​of the section to the index term, the index term among the selected Eojeol or word in the section. 상기 INDEX_BY_TOKEN은 섹션에서 불용어를 제외한 어절 또는 단어들을 색인어로 추출하는 초보적인 색인 방식으로, 별도의 후처리를 수행하지 않고 원문에 나타난 형태 그대로를 색인어로 사용한다. The INDEX_BY_TOKEN is a rudimentary method of extracting index Eojeol or word other than the stopwords in section to index term, the index term is used in the form as it appears in the original text, without performing a separate after-treatment. 따라서 이 방식은 '사람 이름'이나 '지명'과 같은 고유명사들을 주로 포함하고 있는 섹션이나 논문의 '키워드 리스트'와 같이 별다른 후처리가 필요 없는 섹션들에 적합하다. Therefore, this method is suitable for the section that does not require much post-processing, such as "person's name" or "appointed" as a proper noun or a section of the paper, which mainly include "keyword list" like.

HANJA2HANGLE(거짓)인 경우 If HANJA2HANGLE (false)

예) 제 목 : "정보검색에 관한 연구" Example) Title: "Research on Information Retrieval"

색인어 : "정보검색에", "관한", "연구" Index term "information retrieval", "about", "R"

예) 제 목 : "情報檢索에 관한 硏究" Example) Title: "硏 究 about 情報 檢索"

색인어 : "情報檢索","에","관한","硏究" Index terms: "情報 檢索", "to", "about", "硏 究"

HANJA2HANGLE(참)인 경우 If HANJA2HANGLE (true)

예) 제 목 : "정보검색에 관한 연구" Example) Title: "Research on Information Retrieval"

색인어 : "정보검색에", "관한", "연구" Index term "information retrieval", "about", "R"

예) 제 목 : "情報檢索에 관한 硏究" Example) Title: "硏 究 about 情報 檢索"

색인어 : "정보검색에","관한","연구" Index term "information retrieval", "about", "R"

●INDEX_BY_MA ● INDEX_BY_MA

상기 INDEX_BY_MA는 INDEX_BY_TOKEN의 색인 방식에서 한 단계 더 나아가 한글 텍스트의 색인을 위해 한글 형태소 해석기(Morphological analyzer)를 사용하며 영어 텍스트의 경우에는 옵션으로 스테머(stmmer)를 이용한다. The INDEX_BY_MA uses Ste Merced (stmmer) to go one step further and use Hangul morphological analyzer (Morphological analyzer) to the index of the Hangul text and options in the case of the English text in the index mode of INDEX_BY_TOKEN. 한글 텍스트의 각 어절에 대해 형태소 해석을 수행함으로써 명사, 조사, 접미사, 동사, 형용사 등의 최소 형태소 단위를 구분한 후, 섹션의 내용을 대표할 수 있는 단순 명사를 색인어로 추출한다. Then by performing a morphological analysis for each of the Hangul text Eojeol distinguish the minimum unit of morphological noun, research, suffixes, verbs, adjectives, etc., to extract the simple nouns that can represent the contents of the section to the index term. 그리고 영어의 경우에는 규칙적인 복수형 및 동사의 시제 변화 등을 처리하여 어간을 추출한다. And in the case of English, to handle regular plurals and verb tense changes, such as to extract the stem. 따라서 이 방식은 단순한 INDEX_BY_TOKEN의 어절 단위 색인보다 양질의 색인을 수행한다. Therefore, this method performs a quality index higher than the index of unit Eojeol simple INDEX_BY_TOKEN. 따라서 INDEX_BY_MA는 '논문 제목'이나 '초록'과 같은 기본 섹션에 적합하다. Therefore INDEX_BY_MA is suitable for the main sections, such as 'Title' or 'green'.

HANJA2HANGLE(거짓)인 경우 If HANJA2HANGLE (false)

예) 제 목 : "정보검색에 관한 연구" Example) Title: "Research on Information Retrieval"

색인어 : "정보","검색","정보검색","연구" Index term "information", "search", "search", "R"

예) 제 목 : "情報檢索에 관한 硏究" Example) Title: "硏 究 about 情報 檢索"

색인어 : "情報檢索","硏究" Index terms: "情報 檢索", "硏 究"

예) 제 목 : "Information Systems" Example) Title: "Information Systems"

색인어 : "informat", "system" Index terms: "informat", "system"

HANJA2HANGLE(참)인 경우 If HANJA2HANGLE (true)

예) 제 목 : "정보검색에 관한 연구" Example) Title: "Research on Information Retrieval"

색인어 : "정보","검색","정보검색","연구" Index term "information", "search", "search", "R"

예) 제 목 : "情報檢索에 관한 硏究" Example) Title: "硏 究 about 情報 檢索"

색인어 : "정보","검색","정보검색","연구" Index term "information", "search", "search", "R"

●INDEX_BY_CHAR ● INDEX_BY_CHAR

상기 INDEX_BY_CHAR는 기본 섹션에서 영어인 경우에는 한 음절씩, 한글인 경우에는 두 음절씩을 추출하여 색인어를 생성한다. The INDEX_BY_CHAR the case of the case of English in the base section by one syllable, two syllables ssikeul Hangul is extracted to generate the index term. 이 방식은 한글 내용이 담긴 기본 섹션중에서 '사람 이름'과 같은 섹션에 주로 사용한다. This method is mainly used in sections such as "person name" from the basic section containing information Hangul. 즉, 사람 이름이 '홍 길동', '홍길동', '홍 길 동'등과 같이 한글 띄어쓰기가 자유롭게 되어 있는 경우 '홍','길','동'과 같이 음절 단위로 색인하여 저장하면, 사용자가 사람 이름을 검색할 경우 띄어 쓰기에 관계없이 검색이 가능하도록 한다. In other words, if you save a person's name to index into syllables, such as "Smith, John, '' John Doe ',' Red ',' Road ',' East ', if that is freely Hangul spaces, such as" John Doe, "you If you search for a person's name to search for a possible regardless of the letter it brings up.

HANJA2HANGLE(거짓)인 경우 If HANJA2HANGLE (false)

예) 이 름 : "홍 길동" For example) the name, "Smith, John"

색인어 : "홍","길","동" Index terms: "Red", "Road", "East"

예) 이 름 : "洪 吉童" Example) Name: "洪 吉 童"

색인어 : "洪","吉","童" Index terms: "洪", "吉", "童"

HANJA2HANGLE(참)인 경우 If HANJA2HANGLE (true)

예) 이 름 : "홍 길동" For example) the name, "Smith, John"

색인어 : "홍","길","동" Index terms: "Red", "Road", "East"

예) 이 름 : "洪 吉童" Example) Name: "洪 吉 童"

색인어 : "홍","길","동" Index terms: "Red", "Road", "East"

●INDEX_AS_NUMERIC ● INDEX_AS_NUMERIC

상기 INDEX_AS_NUMERIC은 숫자로 구성된 기본 섹션에 대하여 색인어를 추출한다. The INDEX_AS_NUMERIC extracts the index terms with respect to the base section of numbers. 상기 INDEX_AS_NUMERIC로 지정된 섹션은 단일의 값(atomic value)만을 갖는 것으로 가정하며, 이들 섹션에 대해서는 관계연산(<,<=,>,>=,=,-)이 가능하다. Section specified by the INDEX_AS_NUMERIC is a single value (atomic value) only and assumed to have, between operations (<, <=,>,> =, =, -) for these sections are possible. 이색인 방식은 '날짜'와 같이 년월일 형태로 일정한 형식이 갖추어지고 숫자로 이루어진 섹션에 대해 주로 사용한다. Unique way is mainly used for the section is equipped with a certain type of numbers to the date of the form, such as "Date".

예) 날 짜 : "19961214" For example), the date "19961214"

색인어 : 19961214 Index terms: 19961214

●INDEX_AS_IS_MA ● INDEX_AS_IS_MA

상기 INDEX_AS_IS_MA는 앞서 설명한 INDEX_AS_IS 색인방식을 다소 변형시킨 방법과 INDEX_BY_MA 색인방식을 동시에 만족하는 색인 방식이다. The INDEX_AS_IS_MA is an index scheme that satisfies the method and INDEX_BY_MA index method was slightly modified method previously described INDEX_AS_IS index at the same time. 즉, 문서에서 섹션의 내용 전체를 색인어로 추출하고, 동시에 한글 텍스트의 각 어절에 대해 형태소 해석을 수행함으로써 명사, 조사, 접미사, 동사, 형용사 등의 최소 형태소 단위를 구분한 후, 섹션의 내용을 대표할 수 있는 단순 명사를 색인어로 추출한다. That is, after extracting the entire contents of the sections in the document indexing terms and simultaneously identify the minimum morphological units of nouns, research, suffixes, verb, adjective, etc. by performing a morphological analysis for each Eojeol the Hangul text, the contents of the section simple nouns that can be extracted as a representative index terms.

HANJA2HANGLE(거짓)인 경우 If HANJA2HANGLE (false)

예) 제 목 : "정보검색에 관한 연구" Example) Title: "Research on Information Retrieval"

색인어 : "정보검색에 관한 연구","정보","검색","정보검색","연구" Index terms: "Research on Information Retrieval", "information", "search", "search", "R"

예) 제 목 : "情報檢索에 관한 硏究" Example) Title: "硏 究 about 情報 檢索"

색인어 : "情報檢索에 관한 硏究", "情報檢索", "硏究" Index terms: "硏 究 on 情報 檢索", "情報 檢索", "硏 究"

HANJA2HANGLE(참)인 경우 If HANJA2HANGLE (true)

예) 제 목 : "정보검색에 관한 연구" Example) Title: "Research on Information Retrieval"

색인어 : "정보검색에 관한 연구","정보","검색", "정보검색", "연구" Index terms: "Research on Information Retrieval", "information", "search", "search", "R"

예) 제 목 : "情報檢索에 관한 硏究" Example) Title: "硏 究 about 情報 檢索"

색인어 : "정보검색에 관한 연구", "정보", "검색", "정보검색", "연구" Index terms: "Research on Information Retrieval", "information", "search", "search", "R"

●DO_NOT_INDEX ● DO_NOT_INDEX

상기 DO_NOT_INDEX로 지시된 섹션에 대해서는 색인을 수행하지 않는다. For the section indicated by the DO_NOT_INDEX does not perform the index. 현재 이들 방식으로 지정된 섹션에 대해서는 아무런 탐색 경로가 제공되지 않는다. For the current section, specified by these methods does not provide any navigation path.

도 2는 본 발명에 의한 정보검색 관리시스템의 데이터 베이스의 적재 과정을 개념적으로 나타낸 개념도이다. 2 is a conceptual diagram showing the mounting process of the database of information search control system according to the present invention.

상기 도 2에서, 데이터베이스 스키마 파일(Database Schema File)(101), 원시 문서 파일(Documents)(102), 불용어 목록(Stopwords)(103)은 데이터베이스 관리자가 준비해야 하는 파일이다. In FIG. 2, the database schema file (Database Schema File) (101), source document files (Documents) (102), stopwords list (Stopwords) (103) is a file that the database administrator will need to prepare.

상기 데이터베이스 스키마 파일(Database Schema File)(101)은 데이터베이스 디렉토리와 문서 볼륨, 데이터베이스 그룹, 섹션의 정의, 섹션의 색인 방식, 원시 문서의 구조, 원시 문서로부터 데이터베이스로의 적재 방법 등에 대한 정보를 기술한다. The database schema file (Database Schema File) (101) describes the information about the database directory and the document volumes, database group, defined in this section, the index scheme of the section of the source document structure, loading instructions from the source document to the database .

상기 원시 문서 파일(Documents)(102)은 데이터베이스에 적재될 원시 문서들로, 이종 구조를 가진 문서도 데이터베이스 스키마 파일(101)에 기술되어 있는 원시 문서의 구조를 통하여 하나의 데이터베이스에 적재가 가능하다. The source document file (Documents) (102) is in the source document to be loaded into the database, it is loaded is available in a database through the structure of the original document in FIG documents with heterogeneous structure are listed in the database schema file 101 .

상기 불용어 목록(Stopwords)(103)은 데이터베이스에 적재될 불용어 목록으로서, 검색할 때에만 참조하고 검색대상에서는 제외한다. The list of stopwords (Stopwords) (103) is a list of stopwords be loaded into the database with reference only to retrieve and excluded from the search. 만일, 사용자가 불용어를 검색에 포함하고자 하면 질의어 앞에 '+'를 붙여 검색해야 한다. If, and when users want to include in the search should search for stopwords put a "+" before the query.

상기 데이터베이스 스키마 파일(101), 원시 문서 파일(102), 불용어 목록(103)이 준비되면 로더(Loader)(110)를 이용하여 데이터베이스를 적재하게 된다. Using the database schema file 101, when the source document file 102, a list of stopwords 103 is ready loader (Loader) (110) is loaded into the database. 상기 로더(Loader)(110)는 데이터베이스를 적재하기 위해 사용하는 프로그램으로, 데이터베이스 적재에 필요한 모든 정보를 데이터베이스 스키마 파일(101)로부터 가져온다. The Loader (Loader) (110) is a program that is used to load the database, bring all the necessary information in the database loaded from the database schema file (101). 상기 로더(110)는 명령행(command line)에서 옵션을 통해 스키마 파일을 읽어 수행하는 일종의 명령어 해석기(command line interpreter)로서, 관리자는 이 프로그램에게 데이터베이스 생성 및 문서 적재를 위한 명령어를 입력할 수 있다. The loader 110 is a command line (command line) kind of command interpreter (command line interpreter) to perform schema files through the options in reading, the administrator can enter the command for creating a database and a document loaded to the program . 관리자는 편의를 위해 상기 로더(110)에 입력할 목적으로 명령어들로 구성된 파일을 만들어서 사용하는 것이 편리하다. The administrator, it is convenient to use by creating a file made up of commands for the purpose of input to the loader 110, for convenience. 본 발명의 정보검색 관리시스템에서는 이를 데이터베이스 스키마 파일(또는, 스키마 파일)이라 한다. In the information search control system according to the present invention it will be referred to as a database schema file (or the schema file).

도 3은 본 발명에 의한 정보검색 관리시스템의 구성 프로세스들과의 통신 형태를 개념적으로 나타낸 개념도이다. 3 is a conceptual diagram showing a communication mode with the configuration of the information search control system according to the present invention the process conceptually.

상기 정보검색 관리시스템은 상기 도 3에 도시된 바와 같이, 크게 잡 스케줄러(Job Scheduler)(210), 제 1 내지 제 n 파이어(Fire)(220/1∼220/n), 셋 매니저(Set Manager)(230), 데이터 매니저(Data Manager)(240), 클라이언트(Client)(도시되지 않음) 등 다섯 종류의 프로세스로 구성되며, 프로세스들 사이는 소켓 통신이나 파이프 통신을 통하여 데이터를 전송한다. The search management system, as illustrated in the Figure 3, the larger the job scheduler (Job Scheduler) (210), first to n-th fire (Fire) (220 / 1~220 / n), set manager (Set Manager ) 230, a data manager (data manager) (240), the client (client) (consists of five kinds of process such as not shown), between the process transmits the data through the socket communication or the communication pipe. 상기 프로세스들의 기능을 다음과 같다. As a function of the process follows.

상기 잡 스케줄러(Job Scheduler)(210)는 클라이언트로부터 들어오는 연결 요청을 수락하고 제 1 내지 제 n 파이어(220/1∼220/n)들의 상태에 따라 작업을 분배해 준다. The job scheduler (Job Scheduler) (210) gives for accepting the incoming connection requests from clients and to distribute the task according to the status of the first to n-th fire (220 / 1~220 / n). 그리고, 온라인 문서관리시 데이터 매니저(240)에 문서 관리를 요청하며 그 결과를 클라이언트에게 전송한다. And, at the request document management, online document management data manager (240) and sends the results to the client. 또한, 데이터베이스 변경시 데이터 매니저(240), 제 1 내지 제 n 파이어(220/1∼220/n), 셋 매니저(230)에게 데이터베이스가 변경되었음을 알린다. In addition, it indicates that a change to the database, the data manager 240, the first to n-th fire (220 / 1~220 / n), set manager 230, a database is changed.

상기 제 1 내지 제 n 파이어(220/1∼220/n)는 검색 수행이 주 기능이며, 상기 잡 스케줄러(Job Scheduler)(210)로부터 넘어오는 서비스 요청에 대해서 작업 후 클라이언트에게 결과를 넘겨준다. The first to n-th fire (220 / 1~220 / n) is a hand over the results to the client after the service request operation for the coming over from the main functions and search performed, the job scheduler (Job Scheduler) (210). 그리고, 검색 결과를 셋 매니저(230)에게 저장 요청을 한다. In addition, the search results are stored in the request to the three managers (230).

상기 셋 매니저(Set Manager)(230)는 검색 결과 저장 및 관리가 주 기능이며, 상기 제 1 내지 제 n 파이어(220/1∼220/n)로부터 넘어오는 서비스 요청에 대해 작업 후 상기 제 1 내지 제 n 파이어(220/1∼220/n)에게 결과를 넘겨준다. The manager sets (Set Manager) (230) after the action for the service requests coming from the reservoir over the search results, and is managed by the main functions, the first to n-th fire (220 / 1~220 / n) of the first to the n and passes the results to the firewall (220 / 1~220 / n).

상기 데이터 매니저(Data Manager)(240)는 온라인 문서 관리가 주 기능이며, 잡 스케줄러(Job Scheduler)(210)로부터 넘어오는 서비스 요청에 대해 작업 후 상기 잡 스케줄러(Job Scheduler)(210)에게 결과를 넘겨준다. The data manager (Data Manager) (240) are the main features, online document management, after working for the coming service requests across from the job scheduler (Job Scheduler) (210) results to the job scheduler (Job Scheduler) (210) It passes.

상기 클라이언트(Client)는 사용자의 요구를 상기 잡 스케줄러(Job Scheduler)(210)에게 전송한다. The client (Client) sends the user's request to the job scheduler (Job Scheduler) (210).

본 발명에 의한 정보검색 관리시스템의 클라이언트 측 서비스는 검색 서비스, 온라인 문서관리 서비스, 에러처리 서비스 세가지가 있으며, 이 중 정보검색 관리시스템 서버 측에 전송되는 서비스는 검색 서비스, 온라인 문서관리 서비스 두 가지이다. Client-side services of the information search control system according to the invention is the search service, and an online document management services, error handling services three kinds, of which the service is sent to the search management system, the server side, the two search services, online document management service to be.

도 4a 내지 도 4f는 본 발명에 의한 정보검색 관리시스템의 클라이언트 측의 검색 서비스를 개념적으로 나타낸 개념도이다. Figure 4a-4f are schematic diagrams illustrating a search service on the client side of the information search control system according to the present invention.

먼저, 도 4a는 클라이언트가 데이터베이스의 정보를 얻는 방법을 나타낸 개념도이다. First, Figure 4a is a conceptual diagram showing the way the client to obtain information from the database.

상기 도 4a에 도시된 바와 같이, 상기 검색 서비스는 클라이언트(310)에서 데이터베이스 정보를 요청하면(단계 S1), 잡 스케줄러(320)에서는 상기 클라이언트(310)가 요청한 데이터베이스 정보를 유휴 상태인 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S2). As described above, illustrated in Figure 4a, the search service database information that the client 310 requested in the request database information from the client 310 (step S1), a job scheduler 320, the idle state of the first to the n and transmits to the fire (330 / 1~330 / n) (step S2). 그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)에서는 상기 클라이언트(310)가 요청한 데이터베이스 정보를 검색하여 상기 클라이언트(310)에게 전송한다(단계 S3). Next, in the first to n-th fire (330 / 1~330 / n) by the client 310 retrieves the requested database information transmitted to the client 310 (step S3).

도 4b는 클라이언트가 데이터베이스의 섹션 리스트를 얻는 방법을 나타낸 개념도이다. Figure 4b is a conceptual diagram illustrating a method of obtaining the client is a section list of the database.

상기 도 4b에 도시된 바와 같이, 상기 검색 서비스는 클라이언트(310)에서 데이터베이스의 섹션 리스트를 요청한다(단계 S11). As described above, illustrated in Figure 4b, the search service requests the list section of the database on the client 310 (step S11). 그 다음, 잡 스케줄러(320)에서는 상기 클라이언트(310)가 요청한 데이터베이스의 섹션 리스트를 유휴 상태인 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S12). In the following, a job scheduler 320, and transmits the list of the database, the client section 310 is requested to idle the first to n-th fire (330 / 1~330 / n) (step S12). 그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)에서는 상기 클라이언트(310)가 요청한 데이터베이스의 섹션 리스트를 검색하여 상기 클라이언트(310)에게 전송한다(단계 S13). In the following, the first to n-th fire (330 / 1~330 / n) and to the client 310 retrieves the selection list of the requested database sent to the client 310 (step S13).

도 4c는 클라이언트가 검색을 요청하는 방법을 나타낸 개념도이다. Figure 4c is a conceptual diagram illustrating a method in which a client requests a search.

상기 도 4c에 도시된 바와 같이, 상기 검색 서비스는 클라이언트(310)에서 질의, 검색대상 데이터베이스 리스트 및 섹션 등의 정보를 전송한다(단계 S21). As described above, illustrated in Figure 4c, the search service sends information such as a query, the search target database list and the section on the client 310 (step S21). 그 다음, 잡 스케줄러(320)에서는 상기 클라이언트(310)가 전송한 정보를 유휴 상태인 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S22). In the following, a job scheduler 320 transmits the transmission information by the client 310 to the idle state of the first to the n fire (330 / 1~330 / n) (step S22). 그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)에서는 상기 클라이언트(310)가 전송한 정보를 검색한 후 검색 결과를 셋 매니저(340)에게 전송한다(단계 S23). Then, the transmission to the first to n-th fire (330 / 1~330 / n) set in the client manager 340, the results after 310 searches the transmission information (step S23). 그 다음, 상기 셋 매니저(340)는 수신된 검색 결과를 저장한 후, 결과 셋 번호와 문서 개수를 상기 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S24). Is then transmitted to the set manager (340) storing the received search result, the result set number and the number of documents the first to the n-th fire (330 / 1~330 / n) (step S24). 그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)는 상기 셋 매니저(340)로부터 수신된 검색 정보를 상기 클라이언트(310)로 전송한다(단계 S25). Then, the first to n-th fire (330 / 1~330 / n) is sent to the client 310, the received search information from the set manager 340 (step S25).

도 4d는 클라이언트가 유사문서검색을 요청하는 방법을 나타낸 개념도이다. Figure 4d is a conceptual diagram illustrating a method in which a client requests a similar document search.

상기 도 4d에 도시된 바와 같이, 상기 검색 서비스는 클라이언트(310)에서 검색 문서번호, 검색대상 데이터베이스 리스트, 섹션, 검색 방법 등의 정보를 전송한다(단계 S31). As described above, illustrated in Figure 4d, the search service sends the search information, such as document number, the search target database list, a section, a scan method on the client 310 (step S31). 그 다음, 잡 스케줄러(320)에서는 상기 클라이언트(310)가 전송한 정보를 유휴 상태인 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S32). In the following, a job scheduler 320 transmits the transmission information by the client 310 to the idle state of the first to the n fire (330 / 1~330 / n) (step S32). 그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)에서는 상기 클라이언트(310)가 전송한 정보를 검색한 후 검색 결과를 셋 매니저(340)에게 전송한다(단계 S33). Then, the transmission to the first to n-th fire (330 / 1~330 / n) set in the client manager 340, the results after 310 searches the transmission information (step S33). 그 다음, 상기 셋 매니저(340)는 수신된 검색 결과를 저장한 후, 결과 셋 번호와 문서 개수를 상기 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S34). Then, the transmission to the set manager 340 a stores the received search result, the result set number and the number of documents the first to the n-th fire (330 / 1~330 / n) (step S34). 그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)는 상기 셋 매니저(340)로부터 수신된 검색 정보를 상기 클라이언트(310)로 전송한다(단계 S35). Then, the first to n-th fire (330 / 1~330 / n) is sent to the client 310, the received search information from the set manager 340 (step S35).

도 4e는 클라이언트가 검색 결과 리스트를 요청하는 방법을 나타낸 개념도이다. Figure 4e is a conceptual diagram illustrating a method for a client request, the search result list.

상기 도 4e에 도시된 바와 같이, 상기 검색 서비스는 클라이언트(310)에서 검색 시 얻은 결과 셋 번호, 보여줄 섹션과 얻어올 결과의 개수를 전송한다(단계 S41). As described above, illustrated in Figure 4e, the search service sends the result set number, the section and the number of all results obtained show obtained for search by the client 310 (step S41). 그 다음, 잡 스케줄러(320)에서는 상기 클라이언트(310)가 전송한 정보를 유휴 상태인 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S42). In the following, a job scheduler 320 transmits the transmission information by the client 310 to the idle state of the first to the n fire (330 / 1~330 / n) (step S42). 그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)에서는 상기 클라이언트(310)가 전송한 요청 정보를 셋 매니저(340)에게 전송한다(단계 S43). It is then transmitted to the first to n-th fire (330 / 1~330 / n) in the client (310) a set manager 340, the request information is transmitted (step S43). 그 다음, 상기 셋 매니저(340)는 요청한 개수만큼의 검색 결과를 상기 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S44). Then, the set manager 340 transmits the search results in as many as the number requested by the first to n-th fire (330 / 1~330 / n) (step S44). 그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)는 상기 셋 매니저(340)로부터 수신된 검색 정보를 상기 클라이언트(310)로 전송한다(단계 S45). Then, the first to n-th fire (330 / 1~330 / n) is sent to the client 310, the received search information from the set manager 340 (step S45).

도 4f는 클라이언트가 문서의 원문을 요청하는 방법을 나타낸 개념도이다. Figure 4f is a schematic diagram showing the method of the client requesting the text of the document.

상기 도 4f에 도시된 바와 같이, 상기 검색 서비스는 클라이언트(310)에서 문서 번호를 잡 스케줄러(320)에게 전송한다(단계 S51). As described above, shown in Figure 4f, the search service sends the article number from the client 310 to the job scheduler 320 (step S51). 그 다음, 잡 스케줄러(320)에서는 상기 클라이언트(310)로부터 수신한 문서번호를 유휴 상태인 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S52). In the following, a job scheduler 320, transmits the document number received from the client 310 to the idle state of the first to the n fire (330 / 1~330 / n) (step S52). 그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)에서는 해당 문서의 문서 내용을 상기 클라이언트(310)에게 전송한다(단계 S53). In the following, the first to n-th fire (330 / 1~330 / n) and transmits the document information of the document to the client 310 (step S53).

도 5a 및 도 5b는 본 발명에 의한 정보검색 관리시스템의 온라인 문서 관리 서비스를 개념적으로 나타낸 개념도이다. Figures 5a and 5b is a schematic diagram showing an online document management service of the information search control system according to the present invention.

먼저, 도 5a는 한 개의 문서를 삽입 및 변경하는 방법을 나타낸 개념도이다. First, Figure 5a is a conceptual diagram showing a method of insertion and changing the one document.

상기 도 5a에 도시된 바와 같이, 상기 한 개의 문서를 삽입 및 변경하는 방법은 클라이언트(310)에서 문서와 삽입 또는 변경할 데이터베이스 이름 등의 삽입 및 변경 정보를 잡 스케줄러(320)로 전송한다(단계 S61). As described above, illustrated in Figure 5a, the method of inserting and changing the one document is transmitted to the insertion and changing information, such as documents and insert or change the database name in the client 310 to the job scheduler 320 (step S61 ).

그 다음, 상기 잡 스케줄러(320)에서는 상기 클라이언트(310)로부터 수신한 삽입 및 변경 정보를 데이터 매니저(350)로 전송한다(단계 S62). In the following, the job scheduler 320 transmits the insertion and change information received from the client 310 to the data manager 350 (step S62).

그 다음, 상기 데이터 매니저(350)에서는 문서 저장 또는 변경 후 결과를 상기 잡 스케줄러(320)에게 전송한다(단계 S63). Then, the data manager 350, and transmits the job to the scheduler 320, the results after the documents stored or changed (step S63).

그 다음, 상기 잡 스케줄러(320)에서는 삽입 또는 변경이 성공적이면 셋 매니저(340)에게 결과 셋을 갱신(Refresh)할 것을 명령한다(단계 S64). Then, in the job scheduler 320 and ordered to the result set to the inserted or if successful set manager 340 is changed update (Refresh) (step S64).

그 다음, 상기 셋 매니저(340)는 명령 수행 결과를 상기 잡 스케줄러(320)에게 전송한다(단계 S65). Then, the set manager 340 transmits the job to the scheduler 320, the execution result of the command (step S65).

그 다음, 상기 잡 스케줄러(320)는 최종 결과를 유휴 상태의 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S66). Then, the job scheduler 320 transmits the final results to the first to n-th fire (330 / 1~330 / n) in the idle state (step S66).

그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)에서는 데이터베이스를 다시 오픈하고 결과를 상기 클라이언트(310)에게 전송한다(단계 S67). And that in the following, the first to n-th fire (330 / 1~330 / n) open a database, and sends the result to the client 310 (step S67).

도 5b는 한 개의 문서를 삭제하는 방법을 나타낸 개념도이다. Figure 5b is a conceptual diagram illustrating a method for deleting a single document.

상기 도 5b에 도시된 바와 같이, 상기 한 개의 문서를 삭제하는 방법은 클라이언트(310)에서 삭제할 문서의 아이디(ID)를 잡 스케줄러(320)로 전송한다(단계 S71). As described above, it illustrated in Figure 5b, how to remove the above-mentioned documents and transmits the identity (ID) of the document to be deleted from the client 310 to the job scheduler 320 (step S71).

그 다음, 상기 잡 스케줄러(320)에서는 상기 클라이언트(310)로부터 수신한 삭제할 문서의 아이디(ID)를 데이터 매니저(350)로 전송한다(단계 S72). Then, in the job scheduler 320, and transmits an ID (ID) of the document to be deleted is received from the client 310 to the data manager 350 (step S72).

그 다음, 상기 데이터 매니저(350)에서는 문서 삭제 후 결과를 상기 잡 스케줄러(320)에게 전송한다(단계 S73). Then, the data manager 350, and transmits the job to the scheduler 320, the results after deleting the document (step S73).

그 다음, 상기 잡 스케줄러(320)에서는 삭제가 성공적이면 셋 매니저(340)에게 결과 셋을 갱신(Refresh)할 것을 명령한다(단계 S74). In the following, the job scheduler 320 instructs the deletion is successful is to set the manager 340 sets the update (Refresh) to result (step S74).

그 다음, 상기 셋 매니저(340)는 명령 수행 결과를 상기 잡 스케줄러(320)에게 전송한다(단계 S75). Then, the set manager 340 transmits the job to the scheduler 320, the execution result of the command (step S75).

그 다음, 상기 잡 스케줄러(320)는 최종 결과를 유휴 상태의 제 1 내지 제 n 파이어(330/1∼330/n)에게 전송한다(단계 S76). Then, the job scheduler 320 transmits the final results to the first to n-th fire (330 / 1~330 / n) in the idle state (step S76).

그 다음, 상기 제 1 내지 제 n 파이어(330/1∼330/n)에서는 데이터베이스를 다시 오픈하고 결과를 상기 클라이언트(310)에게 전송한다(단계 S77). And that in the following, the first to n-th fire (330 / 1~330 / n) open a database, and sends the result to the client 310 (step S77).

본 발명에 의한 정보검색 관리 시스템에서는 기본적으로 불리언(Boolean)과 확장 벡터 모델을 지원한다. In the information search control system according to the present invention basically supports the Boolean (Boolean) and the extension vector model. 불리언 모델은 기본 불리언의 확장으로서 불리언 연산자{AND(&), OR(|), NOT(!)}, 근접도 연산자{NEAR(/N), WITHIN(/W)}, 관계연산자(=,<=,<,>=,>), 범위연산자(∼), 그리고 절단 연산자를 지원한다. Boolean models Boolean operators {AND (&), OR (|) (!), NOT} As an extension of the basic Boolean, proximity operators {NEAR (/ N), WITHIN (/ W)}, relational operators (=, < =, <,> =,>), and supports a range operator (~), and a cutting operator. 또한 벡터 모델은 순수 벡터 모델의 확장으로서 벡터 연산을 기본으로 하되 불리언 모델의 근접도 연산자를 제외한 나머지 연산자를 허용한다. Vector model also allows the rest of the operator other than the operator proximity of the Boolean model, but the vector operations with base as an extension of pure vector model.

다음은, 본 발명에 의한 정보검색 관리 시스템에서 제공하는 기본적인 2가지 모델인 불리언과 확장 벡터에서 질의를 작성하는 기본적인 방법에 대해 설명한다. The following, a description will be given of a basic two models of the basic method of creating a Boolean query in the extended vector provided by the information search control system according to the present invention.

상기 정보검색 관리 시스템의 데이터베이스 검색 엔진은 섹션이라 불리는 검색 대상 식별자를 검색의 기본 단위로 삼기 때문에, 질의는 검색 대상 식별자, 검색범위지시자(섹션지정자, 관계연산자, 범위연산자), 단어들로 구성된 탐색어의 구성으로부터 시작된다. Since the database search engine, the search management system is complaining to the search target identifier called a section as a basic unit of the search query navigation consisting of the search target identifiers, search directive (section specifiers, relational operators, the range operator), the words It is started from the configuration of the air. 이 탐색어들은 하나 이상의 불리언 연산자(Boolean Operator)/근접도 연산자와 괄호에 의해 결합될 수 있다(단, 벡터 검색의 경우는 검색 연산자가 특별히 존재하지 않음을 참고한다). The navigation control are one or more Boolean operators (Boolean Operator) / proximity can be combined by the operator and the brackets (provided that when the reference vector of the search is a search operator does not particularly exist).

다음은, 질의문 작성의 기본형식을 보여준다. The following shows the basic format of the query is created.

<질의어>=(<질의어>) <Query> = (<query>)

<질의어><불리언 연산자><탐색어> <Query> <bool operator> <navigation control>

<탐색어><근접도 연산자><탐색어> <Air Navigation> <Proximity Operators> <navigation control>

<탐색어> <Air Navigation>

<탐색어>=<섹션리스트>:<검색 단어 리스트> <Air Navigation> = <section lists> <search term list>

<섹션리스트>:(<검색 단어 리스트>) <Section lists> (<return to word list>)

<섹션리스트><관계 연산자><검색 단어> <Section lists> <relational operator> <search term>

<섹션리스트><검색 단어><범위연산자><검색 단어> <Section lists> <search term> <Range operator> <search term>

<섹션 리스트>=<섹션리스트>,<섹션> <Section lists> = <List section> <section>

<섹션> <Section>

<검색 단어>="<단어>" <Search term> = "<word>"

+<단어> + <Word>

<단어>* <Word> *

여기서, ','를 이용하여 여러 섹션을 지정 할 수 있다. Here, you can specify the number of sections using the '.' 그리고, 검색 단어 리스트는 공백으로 구분된 문자열로 구성할 수 있다. Then, the search word list can be configured as a space-separated string.

●검색 대상 섹션 지정 방법(탐색어의 구성 방법) ● How to specify the search target section (how to configure the navigation control)

본 발명의 정보검색 관리 시스템에서 섹션은 데이터베이스의 필드에 해당하는 것으로, SQL에서의 필드 조건 지정과 유사하지만, 특정 섹션을 지정하는 과정에서 상기 정보검색 관리 시스템의 색인 방법에 따른 데이터 타입을 반영한다. In the IR control system of the present invention the section is a reflection of the data type in accordance with the indexing method of the IR control system in the course of that corresponding to a field of the database, similar to the specified field conditions in the SQL, however, specify a particular section . 표 1은 색인 타입에 따른 탐색어 구성 방법을 보여준다. Table 1 shows the search control method configured according to the index type. 상기 정보검색 관리 시스템은 총 6가지의 색인 방법을 제공하는데, 섹션 지정자(:)는 문자열 타입의 검색어의 지정에 사용하는 것으로 총 5가지의 문자열 색인 타입에서 사용될 수 있고, 관계 연산자(=,<,>,<=,>=)는 숫자형과 문자열 일부에서 사용되는 것으로, 표 1과 같이 2가지의 색인타입에서 사용될 수 있다. The search management system to provide a total of six ways of indexing, section specifier (:) can be used in a total of five types of string index that used to specify the type of query string, relational operators (=, < ,>, <=,> =) it may be used in the two types of indexes such as that used by the numeric string, and a part, in Table 1. 마지막으로 범위 연산은 관계연산자와 같은 적용 범위를 가진다. Finally, the range of operation has a coverage such as a relational operator.

색인 타입에 따른 탐색어 구성 Navigation control configuration according to the index type

지정자 Specifier 데이터 타입 Data Types 색인 타입 Index Type 탐색어 구성 예 Navigation control configuration example
섹션지정자(:) Section specifier (:) 문자열 Strings INDEX_BY_MA INDEX_BY_CHAR INDEX_AS_IS INDEX_BY_TOKEN INDEX_AS_IS_MA INDEX_BY_MA INDEX_BY_CHAR INDEX_AS_IS INDEX_BY_TOKEN INDEX_AS_IS_MA SECTION: WORD SECTION: WORD_LIST SECTION: "WORD" SECTION: "WORD_LIST" SECTION: +WORD SECTION: WORD SECTION: WORD_LIST SECTION: "WORD" SECTION: "WORD_LIST" SECTION: + WORD
관계연산자 Relational operators 문자열 Strings INDEX_AS_IS INDEX_AS_IS SECTION = WORD SECTION < WORD SECTION > WORD SECTION <= WORD SECTION >= WORD SECTION = WORD SECTION <WORD SECTION> WORD SECTION <= WORD SECTION> = WORD
숫자형 Numeric INDEX_AS_NUMERIC INDEX_AS_NUMERIC
범위연산자(∼) Range operator (~) 문자열 Strings INDEX_AS_IS INDEX_AS_IS SECTION: WORD∼WORD SECTION: WORD~WORD
숫자형 Numeric INDEX_AS_NUMERIC INDEX_AS_NUMERIC

다음은 검색 대상 섹션 지정 방법에 따른 사용 예를 간단하게 보인 것으로 타이틀(TITLE)은 문자열 타입으로 색인되었고, 날짜(DATE)는 숫자형 타입으로 색인되었다고 가정한다. The following title (TITLE) to be seen simple examples used in accordance with the method specified search target section has been indexed by the string type, date (DATE) assumes that the numeric index type.

TITLE : 유전자 TITLE: Gene

TITLE : 유전자 정보 TITLE: Genetic Information

TITLE : (가정용 컴퓨터 시스템) TITLE: (a home computer system)

DATE > 1990 DATE> 1990

DATE : 1990 ∼ 2000 DATE: 1990 ~ 2000

위의 예처럼 색인 타입에 따른 데이터 타입을 정확하게 알고 탐색어를 구성하여야 올바른 검색결과를 얻을 수 있다. Like the example above, you know exactly the type of data to be configured according to the index type a search word can get the right results. 물론 타입을 제대로 고려하지 않고 사용할 경우에는 에러 코드와 메시지가 출력된다. Of course, when using the type without considering expected, and output an error code and message.

다만 기존의 정보검색 관리 시스템 질의와의 호환을 위해서 표 1에 명시되지 않은 문법을 제공하는데, 그것은 숫자형 타입에 섹션지정자(:)의 사용을 허용한다는 점이다. However, for compatibility with existing information management system, search queries to provide unspecified syntax shown in Table 1, it is that it allows the use of the designator section (:), the numeric type. 즉, 위의 예에서 날짜(DATE) 타입은 (1)과 같이 사용될 수 있으며, 그 의미는 (2)와 같다. That is, in the above example, the date (DATE) type can be used as (1), the meaning is the same as (2).

DATE : 1990 ..................(1) DATE: 1990 .................. (1)

DATE = 1990 ..................(2) DATE = 1990 .................. (2)

본 발명의 정보검색 관리 시스템에서는 기본적으로 검색어에 하나의 섹션이 지정되지만, 검색 대상 섹션을 두 개 이상 지정할 경우에는 섹션 명 다음에 컴마(,) 그리고 섹션 명을 차례로 입력하여 사용할 수 있다. The search management system of the present invention can basically be used, but one section, specify the query, specifying the search target section contains at least two sections by name, and then type a comma (,) and the section name in turn. (3)은 "정보 검색"이라는 검색어에 제목(TITLE)과 컨텐트(CONTENT)의 두 가지 섹션을 지정한 것으로, 이것은 (4)와 같은 의미를 가진다. (3) as specified by the two sections of the title (TITLE) and content (CONTENT) in the search term "Search", which has the same meaning as in (4).

TITLE, CONTENT : 정보 검색 ...................(3) TITLE, CONTENT: Search ................... (3)

TITLE : 정보 검색|CONTENT : 정보 검색 .......(4) TITLE: Search | CONTENT: Search ....... (4)

이와 같이 섹션 지정자 ':'은 색인 타입과 무관하게 모든 색인 섹션에 사용될 수 있다. Thus, the section designator '' can be used on all sections irrespective of the index and the index type.

●지정된 검색 대상 섹션이 영향을 미치는 범위 ● Search for a specified section of the scope affects

원칙적으로, 모든 검색 단어에는 섹션이 명시되어야 하며, 그렇지 않은 경우에는 오류가 발생된다. In principle, any search word, and the section is to be specified, otherwise there is an error. 이전 검색 단어의 섹션 지정을 그대로 계승하는 경우에 한해서 질의 문맥의 의미에 따른 섹션 생략을 부분적으로 허용하는데, 그 예는 다음에서 설명한다. Only if that inherit the section specified in the previous search term to allow the partial section not according to the meaning of the query context, and examples thereof are described in the following. 단, 섹션 지정자(:)가 사용된 경우에만 그 생략을 허용하고, 관계연산이나 범위연산이 사용된 경우에는 섹션을 명시하여야 한다. However, it allows that not only the section designator (:) is used, if the relational operations or operation range is used, shall specify the section.

∥ 허용하는 경우 If you allow ∥

표 2의 경우 사용자는 제목(TITLE)에서 'car audio system'을 찾고자 하는 것으로, 표 2의 오른쪽 열과 같이 표현되어야 하지만, 사용의 편의성을 위해 왼쪽 열의 질의 형태를 허용한다. In the case of Table 2 allows a user to query the left column form for ease of use should, however, as represented in the right column to Table 2 to find the 'car audio system' in the title (TITLE). 왼쪽 열에서 괄호의 사용은 무방하고, 'car', 'audio', 'system'은 모두 제목(TITLE)이라는 섹션 지정이 된 것으로 간주한다. The use of parentheses in the left column and mubang, 'car', 'audio', 'system' are all considered in this section specifies that the title (TITLE).

허용 질의 vs 원질의 의미 Allow queries vs original query means

허용 질의 Allow queries 원 질의 의미 Won query means
TITLE:car & audio & systemTITLE:(car & audio & system)TITLE:(car) & audio & systemTITLE:((car & audio) & system) TITLE: car & audio & systemTITLE: (car & audio & system) TITLE: (car) & audio & systemTITLE: ((car & audio) & system) TITLE:car & TITLE:audio & TITLE:system TITLE: car & TITLE: audio & TITLE: system

¶허용하지 않는 경우 ¶ If you do not allow

(5)와 같은 형태도 허용하는데, 이 경우 'system'은 이전 섹션인 'TITLE'을 기본적으로 계승하기 때문에 가능한 경우이고, (6)의 경우 'car'는 이전 섹션이 존재하지 않기 때문에 에러로 처리 한다. 'Car' In and 5 and to allow the form of the same, in which case the 'system', if possible, because inherit the previous section, 'TITLE' by default, 6 is in error since the previous section does not exist processes.

(TITLE:car & audio)&system ................(5) (TITLE: car & audio) & system ................ (5)

car & TITLE:audio & system ................(6) car & TITLE: audio & system ................ (6)

관계 연산자와 범위 연산자의 경우는 섹션 생략이 허용되지 않는데, 이 경우에 대한 예제는 표 3과 같다. In the case of relational operators and scope operator does not section is not permitted, for example in this case are given in Table 3.

섹션의 생략이 허용되지 않는 예제 This example does not allow the omission of a section

관계 연산자의 사용 The use of relational operators 범위 연산자의 사용 The use of the range operator
DATE > 1990 & 2000 DATE > (1990 & 2000) DATE = 1990 & 2000 DATE = (1990 & 2000) DATE> 1990 & 2000 DATE> (1990 & 2000) DATE = 1990 & 2000 DATE = (1990 & 2000) 1990∼2000 1990-2000

●연산자 우선 순위 ● Operator Precedence

질의 문에 여러 가지 연산자를 혼합하여 사용할 경우에는 연산 우선순위를 적용하여 연산자 간의 연산 순위를 결정한다. If you use a mixture of various operators in the query statement applies the calculation to determine the priority ranking calculation between operators. 표 4는 본 발명의 정보검색 관리 시스템의 검색 엔진에서 제공하는 연산자들의 우선 순위를 예시하고 있다. Table 4 illustrates the priority of operators provided by the search engine of the search information management system of the present invention.

연산자 우선 순위 Operator Precedence

우선순위 Priority 연산자 Operator
높다↑ ↓낮다 High low ↑ ↓ 불용어 지정자문자열 지정자괄호섹션 지정자관계 연산자범위 연산자근접도 연산자불리언 연산자 StopWords specifier string specifiers in parentheses section designator range between operators Operators Proximity Operators Boolean operators +" "( );,= > < >= <=-/W /NAND(&) OR(|) NOR(!) + "" (); - | (!), => <> = <= / W / NAND (&) OR () NOR

● 불용어(STOPWORD) 처리 ● StopWords (STOPWORD) processing

데이버베이스(DB) 관리자가 상기 정보검색 관리 시스템 데이터 적재기를 사용하여 데이터를 적재할 때, 각 섹션에 불용어를 지정할 수 있다. Day server database (DB) when the administrator loads the data using the information retrieval system management data for lifts, you can specify stopwords in each section. 이때 지정한 불용어는 검색 시 사용하는데, 사용자가 검색 단어를 입력하면 검색기는 사용자가 입력한(섹션, 검색 단어) 쌍을 불용어와 비교하여 불용어로 등록된 것은 검색에서 제외한다. The stopwords specified when the user uses a search word for search input searcher is compared to the user and a (section, search terms), and the pair of input stopwords registered in stopwords excluded from the search. 이러한 불용어를 검색에서 제외하는 방법은 일반적으로 전문 검색의 성능향상을 가져오기 때문에 사용한다. How to exclude these stopwords in search is used, because usually get better performance of specialized search.

그러나, 불용어를 검색에 포함시키기를 원하는 사용자를 위해서 특수한 지정자('+')를 제공하는데, '+'를 검색 단어의 앞에 붙여 줌으로서 해당 단어가 불용어의 경우라도 검색에 포함시키도록 한다. However, to provide a special designator ( '+') for users who want to include in the search for stopwords, put a "+" in front of a search term as a handful of that word, even if the stopwords to be included in the search.

예를 들어 '시스템'이 불용어일 경우 (7)과 (8)은 다른 검색 결과를 제시한다. For example, if the "system" stopwords 7 and 8 present the other search results.

TITLE: 자동차 오디오 시스템 ...............(7) TITLE: car audio system ............... (7)

TITLE: 자동차 오디오 + 시스템 ...............(8) TITLE: + car audio system ............... (8)

(7)의 경우는 제목(TITLE)에 '자동차'와 '오디오'만이 포함된 문서를 찾아주고, (8)은 세 검색 단어가 모두 포함된 문서를 찾아준다. Find give the 'car' and documents 'Audio' only included in the title (TITLE) In the case of (7), (8) gives find documents that contain all three search terms.

불용어 지정자의 사용시, 단지 검색어와 함께 검색어의 앞에 공백 없이 사용하여야 하고, 다음과 같이 연산자에 붙여 사용하는 경우는 허용하지 않는다. Use of stopwords specifier, should be used only with no spaces in front of the query with search terms, and is not allowed if you use the Paste operator as follows:

TITLE: 정보 +& 검색 TITLE: + Information & Search

다만 아래에서 설명할 문자열 지정자와 같이 사용하는 것은 허용한다. Just allow it to use as a string specifiers described below.

TITLE: +"정보 검색" TITLE: + "information retrieval"

● 문자열 지정자의 사용 ● The use of string specifiers

문자열 지정자("")는 검색 단어의 구분 시 공백이나 특수 문자와 관계 없이 전체를 하나의 검색 단어로 구분하기 위한 방법으로써, 문자열 지정자 안에 명시 된 내용은 섹션의 색인 타입과 관계없이 전체가 하나의 색인어로 간주된다. String specifier ( "") is a full one as a way to distinguish between full, regardless nine minutes when spaces or special characters in the search term as a single search term, the information specified in the string specifiers, regardless of the index type of the section It is considered to index terms. 주로 INDEX_AS_IS에서 유용하게 사용될 수 있다. Mainly it can be useful in INDEX_AS_IS.

도 6은 문서의 제목(TITLE) 섹션을 두 가지의 색인 방식에 따라 색인 한 것으로, INDEX_AS_IS 방식에서는 공백이나 특수 문자를 고려하지 않기 때문에 총 1개의 색인어가 생성되고, INDEX_BY_TOKEN 방식에서는 구분자를 이용하기 때문에 총 3개의 색인어가 생성됨을 볼 수 있다. Figure 6 is a title (TITLE) section of the document to be indexed by two indexing scheme, since the INDEX_AS_IS approach does not take into account any spaces or special characters, a total of 1 index terms is created, the INDEX_BY_TOKEN way because they use a delimiter a total of 3 index terms can be seen created.

이 경우 만약 사용자가 제목(TITLE)을 INDEX_AS_IS와 같은 방식으로 색인 하였다면, 검색 시 (9)와 같이 문자열 지정자를 사용하여 질의 구성하여야만 올바른 결과를 얻을 수 있다. In this case, if the user If the index title (TITLE) in the same manner as INDEX_AS_IS, using a string specifier such as search (9) hayeoyaman configure the query can get the right result. (10)과 같이 문자열 지정자를 사용하지 않는 단어의 나열은 여러 개의 색인어를 생성시키기 때문이다. Lists of words that do not use a string specifier such as 10, is due to generate multiple index terms.

TITLE: "AN20020808 공지 사항" ................(9) TITLE: "AN20020808 Notice" ................ (9)

TITLE: AN20020808 공지 사항 ................(10) TITLE: AN20020808 announcements ............. 10

그 예를 보면, (9)는 ""안의 내용이 공백이나 특수 문자에 관계없이 동일한 제목(TITLE)을 가지는 올바른 문서를 찾아내는 반면에, (10)은 질의 처리 과정에서 세 개의 검색 단어를 생성 시키기 때문에, 사용자가 기대하는 결과를 얻을 수 없다. In the example, while the 9 "" What a find the correct document with the same title (TITLE), regardless of space or special characters in (10) to produce the three search terms in the query processing Therefore, you do not get the results you expect.

●불리언(Boolean) 검색 ● Boolean (Boolean) search

불리언 검색은 검색 시스템에서 가장 기본적으로 사용되는 검색 모델이다. Boolean search is the default search model that is used in the search system. 불리언 검색에서 지원하는 연산자는 표 5와 같은데, 연산자는 대문자로 표기되어야 한다. Boolean search operators supported by the sounds and Table 5, the operator should be capitalized.

불리안 연산자 Boolean operators 관계 연산자 Relational operators 범위 연산자 Range operator 근접도 연산자 Proximity Operators 절단 연산자 Cutting operators
&(AND)|(OR)!(NOR) & (AND) |! (OR) (NOR) =<=<>=> = <= <> => - N(NEAR)W(WITHIN) N (NEAR) W (WITHIN) * *

●불리언 연산 검색 ● Boolean operation search

상기 정보검색 관리 시스템에서 사용하는 불리언 연산자는 모두 바이너리 연산자이다. Boolean operators used in the management information retrieval systems are all binary operators. 다음은 불리언 연산 예제이다. The following is an example Boolean operations.

ABS:(정보 & 검색) ...............(11) ABS :( Information & search) ........... 11

ABS:(정보 |검색) ...............(12) ABS :( Information | search) ........... 12

TI:(정보 ! 검색) ...............(13) Information TI :(! Search) ........... 13

ABS:! ABS :! 검색 ...............(14) Search .......... 14

질의 (11)의 검색 결과는 ABS 섹션에서 "정보"와 "검색"이 모두 포함하는 단어를 검색한다. Results of query (11) searches for a word that contains both "information" and "search" in the ABS section. 질의 (12)는 ABS 섹션에서 "정보" 또는 "검색" 중에 하나 이상의 단어가 포함하는 단어를 검색한다. Query 12 search words that contain one or more words in the "information" or "Search" from the ABS section. 질의 (13)은 TI 섹션에서 "정보"를 포함하는 문서 중에서 "검색" 단어가 포함하지 않는 문서를 검색한다. Query (13) searches for documents that do not contain the "search" word from the document that contains the "information" from TI section. 질의 (14)는 상기 정보검색 관리 시스템에서 지원하지 않는 연산이다. Query (14) is an operation that is not supported by the IR control system. 상기 '!' remind '!' 연산자는 "AND NOT"의 의미를 갖는다. Operators have the meaning of "AND NOT".

● 관계 연산 검색 ● related operational search

DATE >= 20020101 ......................(15) DATE> = 20020101 ...................... (15)

질의 (15)의 검색 결과는 날짜(DATE) 섹션에서 날짜가 2002년 1월 1일보다 크거나 같은 날짜를 포함하는 모든 문서를 검색한다. Results of query (15) retrieves all documents that date from the Date (DATE) section contains a date equal to or greater than 1 January 2002.

●근접도 연산 검색 ● Proximity search operations

ABS: (정보 /W2 검색) ....................(16) ABS: (Information / W2 search) ........... 16

ABS: (정보 /N2 검색) ....................(17) ABS: (Information / N2 search) ........... 17

질의 (16)의 검색 결과는 ABS 섹션에서 단어간의 거리가 2이하이고 인접한 단어간의 순서대로 "정보"와 "검색"이 모두 포함하는 단어를 검색한다. Results of the query (16) retrieves the words are for the "information" and "search" in the order of 2 or less and the distance between adjacent word among words in the ABS section. 질의 (17)의 검색 결과는 ABS 섹션에서 단어간의 거리가 2이하이고 인접한 단어간에 순서에 상관 없이 "정보"와 "검색"이 모두 포함하는 단어를 검색한다. Search query (17) the result is to retrieve the word, including the distance between two words or less, and "information" and "search" in any order between the adjacent word in both the ABS section.

●절단 연산 검색 ● cutting operation Search

상기 정보검색 관리 시스템에서 지원하는 절단 연산자는 '*'이고, 우측 절단에 한해서만 활용될 수 있다. Cutting operator supported by the information search control system is a "*", can be used only for cutting right.

ABS: 정보* .......................(18) ABS: Information ....................... * (18)

질의 (18)의 검색 결과는 ABS 섹션에서 "정보","정보검색","정보시스템","정보처리" 등 "정보"를 포함하는 모든 단어를 검색한다. Results of the query (18) retrieves all words that contain "information", "Search", the "system", "information" and "information" from the ABS section.

●문자열 확장 검색 ● string extended search

문자열 확장에는 복합명사 확장과 다수 문자열 확장의 두 가지 형태가 있는데, 이것들은 재현율(recall)과 정확도(precision)를 향상시키기 위해 사용하는 방법이다. There are a string extension are two types of compound nouns expansion and extension number string, these are the methods used to improve the recall (recall) and accuracy (precision).

첫째, 복합명사 확장에서는 복합 명사를 각 구성 명사의 형태로 분해한 후, 연산자를 조합함으로써 재현율과 정확도를 향상시킨다. First, the compound nouns expansion after decomposing the compound noun in the form of the structural noun, thereby by combining the operator improves the reproducibility and accuracy. 예를 들어, 사용자가 "TI: 정보검색"이라는 질의를 입력하였고, TI는 INDEX_AS_MA로 색인되었다고 가정하자. For example, users: We enter a query named "TI Search", TI is assumed that the index into INDEX_AS_MA. 검색 시스템은 '정보검색'을 색인기의 입력으로 주어 구성명사 '정보', '검색'의 두 가지 분해 결과를 얻는다. Search system obtains two decomposition result of the "search" given as the input to the indexer configuration noun "information", "Search". 동일 레벨의 구성 명사 사이에는 WITHIN 연산자를 적용시킴으로써 (20)과 같은 질의를 생성해 낸다. Between the configuration of the same level to produce a noun has generated the query, such as by 20 applying the WITHIN operator.

TI: 정보검색 .................(19) TI: Search ................. 19

→TI:(정보 /W1 검색) ........(20) → :( information TI / W1 search) ........ 20

질의 (19)의 복합명사는 질의 (20)으로 확장 된다. Compound nouns of the query (19) is expanded to the query (20). 질의 (19)의 검색 결과는 TI 섹션에서 "정보"와 "검색"이 순서대로 인접한 문서를 검색한다. Results of query (19) retrieves the adjacent document as the "information" and "search" in the section TI order.

그 밖에도 이와 유사하게 처리되는 질의의 형태는 다음과 같다. Other types of queries that are similarly processed this way is as follows.

공백 이외의 단어 구분자로 연결된 단어 : red-eared Associated with the word separator of non-blank words: red-eared

둘째, 다수 문자열 확장은 공백으로 구분된 여러 검색 단어를 입력할 경우에 연산자를 적용하여 검색하는 방법으로서 사용되는 기본 연산자는 '&'이다. Second, many string extension is the default operator that is used when you want to enter multiple search words separated by spaces as a way to search by applying the operator "&". 그러나, 사용자가 그 의미를 변경하여 사용하는 것을 허용한다. However, it allows the user to use by changing the meaning.

TI: 정보 검색 연구 ...............(21) TI: Information Retrieval research ................. 21

→TI:(정보 & 검색 & 연구) ........(22) → TI :( & Information Search & R) ........ 22

질의 (21)은 검색 시스템에서 내부적으로 (22)형태로 처리된다. Query (21) is treated in the form internally 22 in the search system.

TI: 정보 검색 연구 .................(23) TI: Information Retrieval research ................. 23

→TI:((정보 & 검색) & 연구) ........(24) → TI: ((information and search) and Research) ........ 24

질의 (23)은 복합명사와 여러 검색 단어가 혼합되어 있는 것으로서 (24)와 같이 처리된다. Query (23) is treated as in as in the compound nouns with multiple search word of a mixture (24).

● 확장 벡터(Extended Vector) 검색 ● Scalable Vector (Extended Vector) Search

상기 정보검색 관리 시스템에서 확장 벡터 검색은 일반적으로 알려진 확장벡터 모델과는 달리 기본적인 벡터검색에 추가적으로 WITHIN/NEAR 근접도 연산자를 이용한 가중치 계산을 지원하는 모델이다. The information extension vector search from the management system is further WITHIN / NEAR close to the basic vector search otherwise generally known and is extended to vector models model also supports the weight calculation by the operator. 기본적으로 벡터 표현 방법으로 주어진 것에서는 벡터 연산을 지원하고, 불리언 연산이 사용 된 것들에는 불리언 연산자를 그대로 지원함으로써, 벡터와 불리언 검색의 이점을 모두 취할 수 있는 방법이다. By default, from a given expression vector is a support vector operations, and those operations the Boolean method is used, which can take all of the benefits of the support as by Boolean operators, and the vector Boolean search. 확장된 벡터 모델에서 지원하는 연산자는 표 6과 같다. Operators supported by the extended vector model are shown in Table 6.

불리안 연산자 Boolean operators 관계 연산자 Relational operators 범위 연산자 Range operator 근접도 연산자 Proximity Operators 절단 연산자 Cutting operators
&(AND),|(OR),!(NOT) & (AND), |! (OR), (NOT) =<=<>=> = <= <> => - N(NEAR)W(WITHIN) N (NEAR) W (WITHIN) * *

●기본적인 벡터 검색 ● basic vector search

TI: 정보 검색 시스템 ..............................(25) TI: Information Retrieval System ............... 25

질의 (25)의 검색 결과는 TI 섹션에서 "정보 검색 시스템"에 대한 벡터 가중치를 적용하여 랭킹(ranking) 처리된 문서들을 검색한다. Results of query (25) by applying a weighting vector for "information retrieval" section and search for TI in the ranking (ranking) the processed document.

●불리언 연산 검색 ● Boolean operation search

TI: 정보 검색 & ABS: 검색 시스템 ...................(26) TI: Search & ABS: Search system ................... 26

TI: 정보 검색 | ABS: 검색 처리 ...................(27) TI: Search | ABS: search process ................... 27

질의 (26)의 검색 결과는 TI 섹션에서 "정보 검색"에 대한 벡터가중치를 적용하여 랭킹 처리 된 문서들의 집합과 ABS 섹션에서 "검색 시스템"에 대한 벡터 가중치를 적용하여 랭킹 처리 된 문서들의 집합을 교집합(Intersection)한 문서를 검색한다. Results of query (26) by applying the vector weights for the "Search" in the TI section to apply the vector weights for the "search system" in the ABS section a set of rankings processed documents intersection set of rankings processed documents (Intersection) to retrieve a document. 질의 (27)의 검색 결과는 TI 섹션에서 "정보 검색"에 대한 벡터 가중치를 적용하여 랭킹 처리된 문서들의 집합과 ABS 섹션에서 "검색 처리"에 대한 벡터 가중치를 적용하여 랭킹 처리 된 문서들의 집합을 '|' 처리된 문서를 검색한다. Results of query (27) by applying the vector weights for the "search process" in the ABS section a set of rankings processed documents by applying a vector weights for the "Search" in the TI section, a set of ranking the treated article " | searches for 'processed documents.

●관계 연산 검색 ● related operational search

DATE >= 20020101 .....................(28) DATE> = 20020101 ..................... (28)

질의 (28)의 겸색 결과는 DATE 섹션에서 날짜가 2002년 1월 1일보다 크거나 같은 날짜를 포함하는 모든 문서를 검색한다. Search results might query (28) retrieves all documents that contain a date in the DATE section is equal to or greater than the date of 1 January 2002.

●절단 연산 검색 ● cutting operation Search

ARS: 정보* ........................(29) ARS: * Information .......... 29

질의 (29)의 검색 결과는 ABS 섹션에서 "정보", "정보검색", "정보시스템", "정보처리" 등 "정보"를 포함하는 모든 단어를 검색한다. Results of the query (29) retrieves all words that contain "information", "Search", the "system", "information" and "information" from the ABS section.

●복합 명사 확장 검색 ● compound nouns extended search

TI: 정보검색 ..................(30) TI: Search .................. 30

→TI: 정보 /W 검색 ............(31) → TI: Information / W Search ............ 31

질의 (30)에서 복합명사는 질의 (31)로 질의가 확장 된다. Compound nouns in the query (30) is extended a query from a query (31). 질의 (31)의 검색 결과는 TI 섹션에서 "정보 검색"에 대한 벡터 가중치와 거리 가중치를 적용하여 랭킹 처리된 문서를 검색한다. Results of the query (31) is applied to the weight vector and the distance weight for "IR" TI in section to search for a document ranking process.

이상의 본 발명은 상기에 기술된 실시예들에 의해 한정되지 않고, 당업자들에 의해 다양한 변형 및 변경을 가져올 수 있으며, 이는 첨부된 특허청구범위에서 정의되는 본 발명의 취지와 범위에 포함되는 것으로 보아야 할 것이다. The present invention is not limited by the embodiments set forth above, it can result in various modifications and changes by those skilled in the art, which is intended to be included in the spirit and scope of the invention as defined in the appended claims or more something to do.

이상에서 살펴본 바와 같이, 본 발명에 의한 정보검색 관리시스템 및 그 방법에 의하면, 데이터베이스에 대한 검색기능 외에 안정적인 관리 기능을 추가시켜 구성함으로써, 저비용 및 고효율의 정보시스템 구축이 가능하다. As described above, according to the information search control system and method according to the present invention, by constructing by adding the secure management features in addition to search capabilities for databases, it is possible to construct a low-cost, high-efficiency information system.

또한, 유니코드를 지원함으로써, 고어/한자 및 다국어 언어를 저장엔진 수준에서 지원이 가능하다. In addition, support is possible by support Unicode, the Gore / Chinese Language and languages ​​in a storage engine level.

또한, 문서 및 색인 데이터베이스에 대한 압축을 지원함으로써, 문서 크기의 세배정도 되는 색인 데이터베이스에 대한 공간을 축소하여 저장 공간을 효율적으로 이용할 수 있다. In addition, by supporting the compression of documents and indexing databases, reducing the space for the index database that is approximately three times the size of the document it can efficiently use storage space.

또한, 색인기를 위한 전문 분야에 대한 용어사전 구축에 따른 표준화 및 관리 기법의 개발로 지속적인 용어사전의 확장을 통해, 한국어 정보처리 기술의 근간이 되는 언어자료 인프라가 구축되며, 한국어 정보처리 기술에 대한 체계적인 접근을 통해 언어정보처리 기술의 식민지화를 방지하고 국내 연구자들의 연구 기반을 마련할 수 있다. In addition, the development of standards and management techniques in accordance with the terms of pre-built for the professional sector for the indexer through the expansion of an ongoing glossary, and build a corpus infrastructure that is the backbone of the Korean information processing technology for the Korean language information processing technology preventing the colonization of language information processing technology through a systematic approach and can provide a research infrastructure of Korean researchers.

또한, 전체 시스템의 기능을 여러 개의 프로세서가 나누어 처리함으로써, 시스템의 부하를 최소화하고 안정적인 온라인 트랜잭션 처리와 데이터 관리를 보장한다. In addition, by processing the function of the whole system is divided into multiple processors, thereby minimizing the load on the system and ensure reliable online transaction processing and data management. 그리고, 기존의 정보검색 시스템에서의 데이터 추가, 변경, 삭제는 검색 서비스를 하면서 동시에 처리할 수 없는데, 본 발명의 시스템에서는 4개의 프로세서로 나뉘어 문서 관리만 담당하는 프로세서가 따로 존재하고 데이터 변경이 이루어졌는지를 감지하여 검색 서비스를 담당하는 프로세스에게 전파하는 프로세서가 따로 존재하기 때문에 자연스럽게 검색서비스를 하면서 온라인으로 데이터의 변경이 이루어지는 효과가 있다. Then, the data in the conventional information retrieval system to add, change, delete, is just can not be processed while the search service at the same time, the system of the present invention, the processor in charge of only the divided document managed by four processors exist apart from the data changes made a processor that processes preached to detect whether the search service is responsible for the effect of the changes made to the data, while online search services because they naturally exist separately. 따라서, 전문분야 포탈이나 기업포탈 등의 인터넷서비스 분야, 전자도서관 분야, 논문검색 시스템, 전자 문서 관리 시스템(EDMS)/그룹웨어 분야, 더 나아가 지식 관리 시스템(KMS) 분야 등에 활용가치가 높다. Thus, the higher the utilization value such expertise portal or corporate portals, such as Internet services, e-library applications, paper retrieval system, electronic document management system (EDMS) / groupware applications, further knowledge management system (KMS) sector.

도 1은 본 발명에 의한 정보검색 관리시스템의 전체 구성 블록도 1 is an overall configuration block diagram of an information search control system according to the invention

도 2는 본 발명에 의한 정보검색 관리시스템의 데이터 베이스의 적재 과정을 개념적으로 나타낸 개념도 Figure 2 is a schematic diagram showing the loading process of the database of information search control system according to the present invention conceptually

도 3은 본 발명에 의한 정보검색 관리시스템의 구성 프로세스들과의 통신 형태를 개념적으로 나타낸 개념도 3 is a conceptual diagram schematically illustrating a form of communication with the configuration of the information search control system according to the present invention process is conceptually

도 4a 내지 도 4f는 본 발명에 의한 정보검색 관리시스템의 클라이언트 측의 검색 서비스를 개념적으로 나타낸 개념도로서, Figure 4a-4f is a schematic diagram showing a search service on the client side of the information search control system according to the present invention conceptually,

도 4a는 클라이언트가 데이터베이스의 정보를 얻는 방법을 나타낸 개념도, Figure 4a is a conceptual diagram illustrating a method of obtaining the client information in the database,

도 4b는 클라이언트가 데이터베이스의 섹션 리스트를 얻는 방법을 나타낸 개념도, Figure 4b is a conceptual diagram illustrating a method of obtaining the client is a section list of the database,

도 4c는 클라이언트가 검색을 요청하는 방법을 나타낸 개념도, Figure 4c is a conceptual diagram illustrating a method in which a client requests a search,

도 4d는 클라이언트가 유사문서검색을 요청하는 방법을 나타낸 개념도, Fig. 4d is a schematic diagram showing the client how to request a similar document search,

도 4e는 클라이언트가 검색 결과 리스트를 요청하는 방법을 나타낸 개념도, Figure 4e is a conceptual diagram illustrating a method for a client requesting a search result list,

도 4f는 클라이언트가 문서의 원문을 요청하는 방법을 나타낸 개념도이다. Figure 4f is a schematic diagram showing the method of the client requesting the text of the document.

도 5a 및 도 5b는 본 발명에 의한 정보검색 관리시스템의 온라인 문서 관리 서비스를 개념적으로 나타낸 개념도로서, Figures 5a and 5b is a schematic diagram showing an online document management service of the information search control system according to the present invention conceptually,

도 5a는 한 개의 문서를 삽입 및 변경하는 방법을 나타낸 개념도, Figure 5a is a conceptual diagram showing a method of insertion and changing the one document,

도 5b는 한 개의 문서를 삭제하는 방법을 나타낸 개념도이다. Figure 5b is a conceptual diagram illustrating a method for deleting a single document.

도 6은 문서의 제목 섹션을 두 가지의 색인 방식에 따라 색인 한 것을 나타낸 도면 Figure 6 is a view showing that the index along the heading section of the document and the two index scheme

<도면의 주요 부분에 대한 부호의 설명> <Description of the Related Art>

10 : 커널 11 : 파일 및 디렉토리 관리기 10: 11 kernel: file and directory manager

12 : 레코드 관리기 13 : 역화일 관리기 12: 13 records manager: File Station manager

14 : 트랜잭션 관리기 15 : 입출력 관리기 14: 15 Transaction manager: IO manager

20 : 저장엔진 21 : 카탈로그 관리기 20: Storage Engine 21: catalog manager

22 : 문서관리기 23 : 색인관리기 22: 23 article manager: managers index

30 : 검색엔진 40 : 색인기 30 Search Engines 40: indexer

50 : 사전 데이터베이스 60 : 데이터 관리기 50: 60 dictionary databases: data manager

70 : 목록 데이터베이스 볼륨 80 : 문서 데이터베이스 볼륨 70: 80 list of database volumes: a document database volume

101 : 데이터베이스 스키마 파일 102 : 원시 문서 파일 101: 102 Database schema files: source document files

103 : 불용어 목록 110 : 로더 103: 110 stopwords list: Loaders

210 : 잡 스케줄러 210: Job Scheduler

220/1∼220/n, 330/1∼330/n : 제 1 파이어 내지 제 n 파이어 220 / 1~220 / n, 330 / 1~330 / n: first to n-th fire Fire

230 : 셋 매니저 232 : 셋(set) 230: 232 three managers: three (set)

240 : 데이터 매니저 250 : 목록 데이터베이스 240: 250 Data Manager: List Database

260 : 제 1 내지 제 n 데이터베이스 260: first to n-th database

310 : 클라이언트 320 : 잡 스케줄러 310: Client 320: Job Scheduler

340 : 셋 매니저 350 : 데이터 매니저 340: Set Manager 350: the data manager

Claims (23)

  1. 목록 데이터베이스를 저장하고 있는 목록 데이터베이스 볼륨; Save the list of databases and database list of volumes;
    하나 또는 여러 개의 문서 데이터베이스를 분산하여 저장하고 있는 문서 데이터베이스 볼륨; Save to disperse one or several document databases and document database volumes;
    하나 또는 여러 개의 사전 데이터베이스를 분산하여 저장하고 있는 사전 데이터베이스 볼륨; Save to disperse one or several dictionary databases and dictionary database volumes;
    상기 목록 및 문서 데이터베이스 볼륨과 사용자 메모리간의 데이터 입출력을 수행하며, 상기 목록 및 문서 데이터베이스 볼륨내의 파일 및 디렉토리, 레코드, 역화일을 관리하는 커널; The list of documents and database volumes and performs data input and output between the user memory, the kernel to manage files and directories, records, reverse file in the list and document database volume;
    상기 커널을 이용하여 데이터베이스에 대한 메타정보를 보관하는 카탈로그 관리, 문서 및 색인에 대한 관리를 수행하는 저장엔진; Storage engine that performs the management of catalog management, document and index using the kernel keep meta information for the database;
    사용자의 질의에 대한 검색을 수행하는 검색엔진; Search engine to conduct a search for the user's query;
    상기 사용자가 입력한 문서에 대한 색인어를 상기 사전 데이터베이스를 이용하여 추출하는 색인기; Indexer for extracting by using the dictionary database, the index terms for the document which the user input; And
    관리자가 작성한 스키마 파일을 입력받아 데이터베이스를 생성하고 원시문서 묶음을 벌크적재하고 색인을 수행하는 데이터관리기를 포함하여 구성된 것을 특징으로 하는 정보검색 관리 시스템. Receiving a schema file created by the administrator creates a database and wherein configured to include a data manager to bulk load the raw document collections and perform the index search management systems.
  2. 제 1 항에 있어서, 상기 커널은, According to claim 1, wherein said kernel,
    상기 목록 및 문서 데이터베이스 볼륨의 접근을 위한 페이지 및 버퍼를 관리하고, 이를 위한 로깅 및 잠금 기능을 수행하는 기능을 더 포함하는 것을 특징으로 하는 정보검색 관리 시스템. Information Retrieval Management System according to claim 1, further including the ability to manage and perform logging and locking feature for this page and buffer for access to the list of documents and a database volume.
  3. 제 1 항에 있어서, 상기 커널은, According to claim 1, wherein said kernel,
    레코드가 저장되어 있는 디스크의 물리적인 식별자를 논리적인 식별자로 매핑하여 접근을 용이하게 하고, 여러개의 볼륨에 대해 논리적 식별자를 발행하는 파일 및 디렉토리 관리기; File and directory manager for facilitating access to map a physical identifier of a disk that is a record is stored in a logical identifier and issuing a logical identifier for a number of volume;
    내부적으로 한 페이지에 저장할 수 있는 객체와 한 페이지 이상되는 긴 자료항목에 대한 관리를 지원하며, 화일내의 레코드를 처음부터 순차적으로 접근하는 기능, 레코드에 대한 삽입, 수정, 삭제와 관련된 갱신 연산을 지원하는 레코드 관리기; Support the management of long data entry of more than one and objects that can be stored on one page, the page internally, and supports the update operation associated with the insert, update, delete on the features, records that the records in the file from the beginning accessed sequentially care device to record;
    저장공간의 효율을 위해 키에 대한 압축을 수행하며, 삽입, 수정, 삭제, 검색 기능을 하는 역화일 관리기; Station to the file manager, and performs compression for a key to the efficiency of the storage space, insert, modify, delete, search function;
    트랜잭션의 시작과 종료, 중단, 세이브 포인트(Save Point) 기능, 트랜잭션의 정보를 로그 파일에 기록하는 기능을 제공하는 트랜잭션 관리기; Start and end of a transaction, stop, save points (Save Point) function, transaction manager, which provides the ability to record information in a transaction log file; And
    상기 목록 및 문서 데이터베이스 볼륨과 사용자 메모리간의 데이터 입출력을 관리하는 입출력 관리기를 포함하여 구성된 것을 특징으로 하는 정보검색 관리 시스템. IR management system, characterized in that configured including input and output manager for managing data input and output between the list and the document database volume and the user memory.
  4. 제 3 항에 있어서, 4. The method of claim 3,
    상기 트랜잭션 관리기는 회복시간을 줄이기 위해 체크 포인트를 사용하며, 지정된 작업이 중간에 실패하면 모든 작업은 트랜잭션의 시작점으로 복귀되도록 하여 데이터의 무결성을 유지시키는 것을 특징으로 하는 정보검색 관리 시스템. The transaction manager search management system uses checkpoints to reduce the recovery time, if the specified action fails in the middle to ensure that all jobs are returned to the starting point of a transaction comprising a step of maintaining the integrity of the data.
  5. 제 3 항에 있어서, 상기 입출력 관리기는, 4. The method of claim 3 wherein the input and output manager,
    상기 목록 및 문서 데이터베이스 볼륨에 페이지를 할당, 삭제, 유지보수를 수행하는 페이지관리기; Page manager to perform allocation, deletion, and maintenance pages in the list and the document database volume;
    상기 디스크의 페이지를 메모리의 페이지로 매핑을 담당하는 버퍼관리기; A buffer manager that is responsible for mapping the page of the disk to the page of memory; And
    서로 다른 요구 사항들이 동일한 객체를 접근할 때 사용하는 잠금관리기를 포함하여 구성된 것을 특징으로 하는 정보검색 관리 시스템. Different requirements to manage information retrieval system wherein the manager is configured to include a lock that is used to access the same object.
  6. 제 1 항에 있어서, 상기 저장 엔진은, The method of claim 1, wherein the storage engine,
    구축하고자 하는 데이터베이스의 구조에 대한 정보를 관리하는 카탈로그 관리기; Catalog manager that manages information about the structure of the database you want to build;
    원본 문서를 내부 문서구조로 변환하여 삽입, 기존 문서의 삭제 또는 수정에 대한 연산을 수행하는 문서 관리기; Document care device to operate on the insertion, deletion, or modification of an existing document by converting the original document into the document structure; And
    상기 색인기를 이용하여 추출된 색인 정보를 검색에 적합한 구조로 구성하는 색인 관리기를 포함하여 구성된 것을 특징으로 하는 정보검색 관리 시스템. IR management system that is configured including an index manager for configuring the extracted index information using the indexer to the structure suitable for retrieval, characterized.
  7. 제 1 항에 있어서, According to claim 1,
    상기 데이터베이스의 구조에 대한 정보는 문서 구조, 색인 방법, 기본키 정보, 압축여부, 불용어를 포함하는 것을 특징으로 하는 정보검색 관리 시스템. Information Retrieval Management System which comprises information about the structure of the database contains the document structure, and indexing methods, primary key information, whether or not compressed, stopwords.
  8. 목록 데이터베이스를 저장하고 있는 목록 데이터베이스 볼륨; Save the list of databases and database list of volumes;
    하나 또는 여러 개의 문서 데이터베이스를 분산하여 저장하고 있는 문서 데이터베이스 볼륨; Save to disperse one or several document databases and document database volumes;
    상기 목록 및 문서 데이터베이스의 디렉토리와 볼륨, 데이터베이스 그룹, 섹션의 정의, 섹션의 색인 방식, 원시 문서의 구조, 원시 문서로부터 데이터베이스로의 적재 방법에 대한 정보를 기술하는 데이터베이스 스키마 파일; The definition of the lists and directories and volumes, database group, the section of the document database, the index scheme of the section of the source document structure, database schema files from the source document describing information on how to load the database;
    상기 문서 데이터베이스에 적재될 원시 문서들로 구성된 원시 문서 파일; Raw text file, consisting of raw documents to be loaded into the document database;
    상기 목록 데이터베이스에 적재될 불용어 목록; Stopword list to be loaded on the list of databases; And
    상기 데이터베이스 스키마 파일로부터 수신된 정보에 의해 상기 문서 데이터베이스 생성 및 문서 적재를 수행하며, 상기 문서 데이터베이스 생성 및 문서 적재를 위한 명령어를 관리자로부터 입력받는 로더를 포함하여 구성된 것을 특징으로 하는 정보검색 관리 시스템. IR management system, characterized in that by the information received from the database schema file is configured to include a loader for receiving the instruction from the manager for the document database generation and document loading, performing the above document database generation and document loading.
  9. 제 1 항에 있어서, According to claim 1,
    상기 데이터베이스 스키마 파일에 기술되어 있는 원시 문서의 구조를 통하여 이종 구조를 가진 문서도 하나의 데이터베이스에 적재가 가능한 것을 특징으로 하는 정보검색 관리 시스템. Search document management system with a heterogeneous structure through the structure of the source document that are listed in the database schema file, wherein the loading is available in a single database.
  10. 클라이언트로부터 수신된 연결 요청을 제 1 내지 제 n 파이어들의 상태에 따라 작업을 분배해 주며, 온라인 문서관리시 데이터 매니저에 문서 관리를 요청하여 그 결과를 클라이언트에게 전송하며, 데이터베이스 변경시 데이터 매니저, 제 1 내지 제 n 파이어, 셋 매니저에게 데이터베이스가 변경되었음을 알리는 잡 스케줄러; Gives to distribute according to a connection request received from the client, the state of the first to n-th fire operation, requests the document management in the online document management when the data manager and transmits the result to the client, when the database changes the data manager, the 1 to n Fire, job scheduler to notify the manager that the database is set to change;
    상기 잡 스케줄러로부터 수신된 서비스 요청에 대한 작업을 수행하며 그 결과를 상기 클라이언트에게 전송하며, 검색 결과를 셋 매니저에게 저장 요청하는 제 1 내지 제 n 파이어; First to n-th fire to work with the service request received from the job scheduler, and transmits the result to the client, storing the search results to the set manager requests;
    상기 제 1 내지 제 n 파이어로부터 수신된 서비스 요청에 대한 작업을 수행하며 그 결과를 상기 제 1 내지 제 n 파이어에게 전송하는 셋 매니저; The first to n-th to work with the service request received from the fire and set manager that the first to be sent to the n-th fire the result; And
    상기 잡 스케줄러로부터 수신된 서비스 요청에 대한 작업을 수행하며 그 결과를 상기 잡 스케줄러에게 전송하는 데이터 매니저를 포함하여 구성된 것을 특징으로 하는 정보검색 관리 시스템. IR management system, characterized in that configured to include a data manager to perform an operation on the service request received from the job scheduler, and transmits the result to the job scheduler.
  11. 제 10 항의 잡 스케줄러, 제 1 내지 제 n 파이어, 셋 매니저, 데이터 매니저를 포함하는 정보검색 관리시스템의 정보검색 관리 방법에 있어서, According to claim 10 the job scheduler, the first to n-th fire, the three managers, IR management method for an information search control system comprising a data manager,
    클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 데이터베이스의 정보를 요청하여 수신받는 제 1 단계; A first step the client via the job scheduler receives the first to receive the n-th fire to request information from the database;
    상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 데이터베이스의 섹션 리스트를 요청하여 수신받는 제 2 단계; The second stage receives the reception to the first to n-th fire request a section list of the database is the client via the job scheduler;
    상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색을 요청하여 검색 결과를 수신받는 제 3 단계; A third step of receiving the client has received the request via the job scheduler, the search for the first to n-th fire search results;
    상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 유사문서검색을 요청하여 검색 결과를 수신받는 제 4 단계; A fourth step of receiving by the first to request a similar document search at the n-th fire the client via the job scheduler receives the search results;
    상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색 결과 리스트를 요청하여 수신받는 제 5 단계; A fifth step of receiving receives said first to n-th request a list of search results to the client firewall via the job scheduler; And
    상기 클라이언트가 상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 문서의 원문을 요청하여 수신받는 제 6 단계를 포함하여 구성된 것을 특징으로 하는 정보검색 관리 방법. IR management method characterized in that the client is configured to receive via said job scheduler comprises a sixth step of receiving the request, the full text of the document to the first to n-th fire.
  12. 제 11 항에 있어서, 상기 제 1 단계에서 상기 제 1 내지 제 n 파이어는, 12. The method of claim 11, wherein the first to n-th fire in the first step,
    상기 잡 스케줄러를 통해 수신한 상기 클라이언트의 요청에 의해 데이터베이스 정보를 검색하여 상기 클라이언트에게 전송하는 것을 특징으로 하는 정보검색 관리 방법. IR management method characterized in that to by the request from the client received via the job scheduler searches the database information transmitted to the client.
  13. 제 11 항에 있어서, 상기 제 2 단계에서 상기 제 1 내지 제 n 파이어는, 12. The method of claim 11, wherein the first to n-th fire in the second step,
    상기 잡 스케줄러를 통해 수신한 상기 클라이언트의 요청에 의해 데이터베이스의 섹션 리스트를 검색하여 상기 클라이언트에게 전송하는 것을 특징으로 하는 정보검색 관리 방법. IR management method characterized in that to by the request from the client received via the job scheduler retrieves the selection list of the database transmitted to the client.
  14. 제 11 항에 있어서, 상기 제 3 단계에서 상기 클라이언트는, 12. The method of claim 11, wherein in the third step of the client,
    상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 질의, 검색대상 데이터베이스 리스트, 섹션을 포함한 검색 정보를 전송하는 것을 특징으로 하는 정보검색 관리 방법. IR management method characterized in that via the job scheduler sends the search information, including the query, the search target database list, the section to the first to n-th fire.
  15. 제 14 항에 있어서, 상기 제 3 단계는, 15. The method of claim 14 wherein the third step,
    상기 제 1 내지 제 n 파이어에서 상기 클라이언트로부터 수신된 상기 검색 정보에 의해 검색을 수행한 후 검색 결과를 상기 셋 매니저에게 전송하는 단계; Transmitting the first to n-th in the fire after performing a search by the search information received from the client, the search results to the set manager;
    상기 셋 매니저에서 상기 제 1 내지 제 n 파이어로부터 수신된 검색 결과를 저장한 후, 결과 셋 번호와 문서 개수를 상기 제 1 내지 제 n 파이어에게 전송하는 단계; , At the set manager sent to the first through n then stores the search results received from the fire, the result set number and the first to n-th fire the number of documents; And
    상기 제 1 내지 제 n 파이어에서 상기 셋 매니저로부터 수신된 결과 셋 번호와 문서 개수를 상기 클라이언트에게 전송하는 단계를 포함하여 구성된 것을 특징으로 하는 정보검색 관리 방법. IR management method in the first to the n-th fire characterized in that configured by comprising the step of transmitting the result set number and the number of documents received from the set manager to the client.
  16. 제 11 항에 있어서, 상기 제 4 단계에서 상기 클라이언트는, 12. The method of claim 11, wherein in the fourth step of the client,
    상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색 문서번호, 검색대상 데이터베이스 리스트, 섹션, 검색 방법을 포함한 유사문서 검색 정보를 전송하는 것을 특징으로 하는 정보검색 관리 방법. IR management method characterized in that via the job scheduler sends a similar document search information, including the first to retrieve the document number, the search target database list section search method at the n-th fire.
  17. 제 16 항에 있어서, 상기 제 4 단계는, 17. The method of claim 16 wherein the fourth step,
    상기 제 1 내지 제 n 파이어에서 상기 클라이언트로부터 수신된 상기 유사문서 검색 정보에 의해 검색을 수행한 후 검색 결과를 상기 셋 매니저에게 전송하는 단계; Transmitting the first to n-th in the fire after performing a search by the similar document search information received from the client, the search results to the set manager;
    상기 셋 매니저에서 상기 제 1 내지 제 n 파이어로부터 수신된 검색 결과를 저장한 후, 결과 셋 번호와 문서 개수를 상기 제 1 내지 제 n 파이어에게 전송하는 단계; , At the set manager sent to the first through n then stores the search results received from the fire, the result set number and the first to n-th fire the number of documents; And
    상기 제 1 내지 제 n 파이어에서 상기 셋 매니저로부터 수신된 결과 셋 번호와 문서 개수를 상기 클라이언트에게 전송하는 단계를 포함하여 구성된 것을 특징으로 하는 정보검색 관리 방법. IR management method in the first to the n-th fire characterized in that configured by comprising the step of transmitting the result set number and the number of documents received from the set manager to the client.
  18. 제 11 항에 있어서, 상기 제 5 단계에서 상기 클라이언트는, The method of claim 11, wherein in the fifth step the client,
    상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 검색 시 수신한 결과 셋 번호, 보여줄 섹션과 수신받을 검색 결과 리스트의 개수를 포함한 검색 결과 리스트 정보를 전송하는 것을 특징으로 하는 정보검색 관리 방법. IR management method characterized in that via the job scheduler transmits the first through the search result list information n including result set number, the section number and the receive receiving a search result list to show a receipt for search to fire.
  19. 제 18 항에 있어서, 상기 제 5 단계는, 19. The method of claim 18, wherein the fifth step includes:
    상기 제 1 내지 제 n 파이어에서 상기 클라이언트로부터 수신한 상기 검색 결과 리스트 정보를 상기 셋 매니저에게 전송하는 단계; Wherein said first to n-th in the fire transmits the list of the search result information received from the client to the set manager;
    상기 셋 매니저에서 상기 제 1 내지 제 n 파이어로부터 수신한 상기 검색 결과 리스트 정보에 포함된 검색 결과 리스트의 개수 만큼의 문서를 상기 제 1 내지 제 n 파이어에게 전송하는 단계; Wherein the sending the document as many as the number of the search result list including the one to which the search result list information received from the n-th fire to the first to n-th fire in the set manager; And
    상기 제 1 내지 제 n 파이어에서 상기 셋 매니저로부터 수신된 문서를 가지고 상기 클라이언트가 요구한 섹션 정보를 검색하여 검색 결과를 상기 문서와 같이 상기 클라이언트에게 전송하는 단계를 포함하여 구성된 것을 특징으로 하는 정보검색 관리 방법. Search information for the first to in the n-th fire characterized in that configured to include a step of searching for the section information by the client request sends the search result to the client, such as the document with the document received from the set manager management.
  20. 제 11 항에 있어서, 상기 제 6 단계에서 상기 클라이언트는, 12. The method of claim 11, wherein in the sixth step the client,
    상기 잡 스케줄러를 통해 상기 제 1 내지 제 n 파이어로 문서 번호를 전송하는 것을 특징으로 하는 정보검색 관리 방법. IR management method characterized in that via the job scheduler, sending the first document number to the n-th fire.
  21. 제 20 항에 있어서, 상기 제 6 단계는, 21. The method of claim 20, wherein the sixth step includes
    상기 제 1 내지 제 n 파이어는 상기 클라이언트로부터 수신한 상기 문서 번호에 해당하는 문서의 문서 내용을 상기 클라이언트에게 전송하는 것을 특징으로 하는 정보검색 관리 방법. The first to n-th fire information search method as characterized in that for transmitting the documents to the document corresponding to the document number received from the client to the client.
  22. 제 10 항의 잡 스케줄러, 제 1 내지 제 n 파이어, 셋 매니저, 데이터 매니저를 포함하는 정보검색 관리시스템의 정보검색 관리 방법에 있어서, According to claim 10 the job scheduler, the first to n-th fire, the three managers, IR management method for an information search control system comprising a data manager,
    클라이언트가 문서와 삽입 또는 변경할 데이터베이스 정보를 상기 잡 스케줄러로 전송하는 단계; Steps that the client sends to the job scheduler and a document insert or change the database information;
    상기 잡 스케줄러에서 상기 클라이언트가 전송한 정보를 상기 데이터 매니저에게 전송하는 단계; Transmitting the client data transmitted by the scheduler in the job to said data manager;
    상기 데이터 매니저에서 문서 저장 또는 변경 후 결과를 상기 잡 스케줄러에게 전송하는 단계; Sending the job to the scheduler, the results after the document storage or change in the data manager;
    상기 잡 스케줄러에서 삽입 또는 변경이 성공적이면 셋 매니저에게 결과 셋을 갱신할 것을 명령하는 단계; Instructing you to update the result set, or if the change is to insert three successful manager in the job scheduler;
    상기 셋 매니저에서 명령 수행 결과를 상기 잡 스케줄러에게 전송하는 단계; Transmitting to said job scheduler command execution results from the three managers;
    상기 잡 스케줄러에서 최종 결과를 상기 제 1 내지 제 n 파이어에게 전송하는 단계; Wherein the first to be sent to the n-th fire the end result in the job scheduler; And
    상기 제 1 내지 제 n 파이어에서 데이터베이스를 다시 오픈하고 결과를 상기 클라이언트에게 전송하는 단계를 구비한 한 개의 문서를 삽입 및 변경하는 방법을 포함하여 구성된 것을 특징으로 하는 정보검색 관리 방법. IR management method, characterized in that configured to include a method of re-opening the database in the first to n-th fire and insertion and change a single document comprising the step of transmitting the result to the client.
  23. 제 22 항에 있어서, 상기 정보검색 관리 방법은, The method of claim 22, wherein the management information search method comprising:
    상기 클라이언트에서 삭제할 문서의 아이디(ID)를 상기 잡 스케줄러로 전송하는 단계; Transmitting the identity (ID) of the document to be deleted from the client to the job scheduler;
    상기 잡 스케줄러에서 상기 클라이언트로부터 수신한 삭제할 문서의 아이디(ID)를 상기 데이터 매니저로 전송하는 단계; Transmitting the identity (ID) of the document to be deleted is received from the client in the job scheduler in the data manager;
    상기 데이터 매니저에서 문서 삭제 후 결과를 상기 잡 스케줄러에게 전송하는 단계; Sending the job to the scheduler, the results after deleting a document in the data manager;
    상기 잡 스케줄러에서 삭제가 성공적이면 셋 매니저에게 결과 셋을 갱신할 것을 명령하는 단계; Instructing that has been deleted from the job scheduler to update the results to the three managers if successful three;
    상기 셋 매니저에서 명령 수행 결과를 상기 잡 스케줄러에게 전송하는 단계; Transmitting to said job scheduler command execution results from the three managers;
    상기 잡 스케줄러에서 최종 결과를 상기 제 1 내지 제 n 파이어에게 전송하는 단계; Wherein the first to be sent to the n-th fire the end result in the job scheduler; And
    상기 제 1 내지 제 n 파이어에서 데이터베이스를 다시 오픈하고 결과를 상기 클라이언트에게 전송하는 단계를 구비한 한 개의 문서를 삭제하는 방법을 더 포함하여 구성된 것을 특징으로 하는 정보검색 관리 방법. IR management method, characterized in that configured to re-open the database from the first to n-th fire and further includes a way to delete a single document comprising the step of transmitting the result to the client.
KR20030044284A 2003-07-01 2003-07-01 Information search management system and method tereof KR100493399B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20030044284A KR100493399B1 (en) 2003-07-01 2003-07-01 Information search management system and method tereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20030044284A KR100493399B1 (en) 2003-07-01 2003-07-01 Information search management system and method tereof

Publications (2)

Publication Number Publication Date
KR20050005261A true KR20050005261A (en) 2005-01-13
KR100493399B1 true KR100493399B1 (en) 2005-06-07

Family

ID=37219672

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20030044284A KR100493399B1 (en) 2003-07-01 2003-07-01 Information search management system and method tereof

Country Status (1)

Country Link
KR (1) KR100493399B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013112415A1 (en) * 2012-01-27 2013-08-01 Microsoft Corporation Indexing structures using synthetic document summaries

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100677601B1 (en) * 2004-11-11 2007-02-02 삼성전자주식회사 Storage medium recording audio-visual data including meta data, reproduction apparatus thereof and method of searching audio-visual data using meta data
KR100907095B1 (en) * 2007-08-21 2009-07-09 인시아넷 주식회사 Information gathering system using apparatus of seperated storage and the method thereof

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013112415A1 (en) * 2012-01-27 2013-08-01 Microsoft Corporation Indexing structures using synthetic document summaries

Also Published As

Publication number Publication date Type
KR20050005261A (en) 2005-01-13 application

Similar Documents

Publication Publication Date Title
Ley The DBLP computer science bibliography: Evolution, research issues, perspectives
Agrawal et al. DBXplorer: A system for keyword-based search over relational databases
Chen et al. D (k)-index: An adaptive structural summary for graph-structured data
Chou et al. Design and implementation of the Wisconsin storage system
US6584468B1 (en) Method and apparatus to retrieve information from a network
US7437358B2 (en) Methods and systems for managing data
US6421683B1 (en) Method and product for performing data transfer in a computer system
US6658406B1 (en) Method for selecting terms from vocabularies in a category-based system
US6760719B1 (en) Method and apparatus for high speed parallel accessing and execution of methods across multiple heterogeneous data sources
US6981217B1 (en) System and method of obfuscating data
US5467471A (en) Maintaining databases by means of hierarchical genealogical table
US5873079A (en) Filtered index apparatus and method
US5727196A (en) Optimized query interface for database management systems
US5870739A (en) Hybrid query apparatus and method
US6145003A (en) Method of web crawling utilizing address mapping
US6985950B1 (en) System for creating a space-efficient document categorizer for training and testing of automatic categorization engines
US6167393A (en) Heterogeneous record search apparatus and method
US6704728B1 (en) Accessing information from a collection of data
US7593938B2 (en) Systems and methods of directory entry encodings
US6714905B1 (en) Parsing ambiguous grammar
US6321228B1 (en) Internet search system for retrieving selected results from a previous search
US20040133544A1 (en) System and method for managing content with event driven actions to facilitate workflow and other features
US6278992B1 (en) Search engine using indexing method for storing and retrieving data
US20020007373A1 (en) System, method, and computer program product for knowledge management
US6745206B2 (en) File system with access and retrieval of XML documents

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110509

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee