KR101910191B1 - Integrated Search Service Providing System - Google Patents

Integrated Search Service Providing System Download PDF

Info

Publication number
KR101910191B1
KR101910191B1 KR1020180059329A KR20180059329A KR101910191B1 KR 101910191 B1 KR101910191 B1 KR 101910191B1 KR 1020180059329 A KR1020180059329 A KR 1020180059329A KR 20180059329 A KR20180059329 A KR 20180059329A KR 101910191 B1 KR101910191 B1 KR 101910191B1
Authority
KR
South Korea
Prior art keywords
search
user
module
data
customer information
Prior art date
Application number
KR1020180059329A
Other languages
Korean (ko)
Inventor
유형록
Original Assignee
주식회사 갑인정보기술
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 갑인정보기술 filed Critical 주식회사 갑인정보기술
Priority to KR1020180059329A priority Critical patent/KR101910191B1/en
Application granted granted Critical
Publication of KR101910191B1 publication Critical patent/KR101910191B1/en

Links

Images

Classifications

    • G06F17/30864
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F17/273
    • G06F17/2755
    • G06F17/30619

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to an integrated search service providing system which can be optimized in a search keyword of a user and can provide latest information. The integrated search service providing system includes: a data collection module for collecting a search object or collecting an attached file; an index processing module for performing document filtering, language processing and data index processing; a search processing module for processing a search result by processing a query word and an operator in a search word and then searching for data corresponding to the search word among index-processed data; an additional service providing module for providing an additional service; and an in-memory search module for storing extracted data on a memory of the user, processing the search result in preference to the search processing module and providing the search result to the user if a search for the stored data is requested from the user. Accordingly, the present invention can provide a convenient search environment.

Description

통합 검색 서비스 제공 시스템{Integrated Search Service Providing System}[0001] Integrated Search Service Providing System [

본 발명은 통합 검색 서비스 제공 시스템에 관한 것으로, 더욱 상세하게는 사용자의 검색 키워드에 최적화되고 최신의 정보를 제공할 수 있는 통합 검색 서비스 제공 시스템에 관한 것이다.The present invention relates to an integrated search service providing system, and more particularly, to an integrated search service providing system that is optimized for a search keyword of a user and can provide the latest information.

일반적으로, 인터넷 상에 존재하는 수많은 웹사이트들과 웹 문서 중 자신이 원하는 정보를 얻기 위해서는, 단말기를 통해 검색서비스를 제공하는 포털 사이트에 접속한 다음 포털 사이트에서 제공하는 검색창에 검색어를 입력하여 검색이 이루어지게 하는 과정을 거치게 된다.Generally, in order to obtain information desired from among a large number of web sites and web documents existing on the Internet, a user accesses a portal site providing a search service through a terminal, and then inputs a search word into a search window provided in the portal site So that the search is performed.

이때, 포털 사이트의 검색 서비스는, 소정의 검색 엔진을 통해 사용자가 입력한 검색어를 포함하는 웹사이트 및 웹 문서들을 검색하고, 그 결과를 사용자의 단말기로 전송해 줌으로써 사용자가 원하는 정보를 제공받을 수 있도록 한다.At this time, the search service of the portal site retrieves web sites and web documents including a search word input by a user through a predetermined search engine, and transmits the result to the user's terminal, .

종래의 검색 엔진들 중 예컨대, 야후와 같은 검색 엔진은, 각 사이트와 웹 문서를 색인(indexing)하여 데이터베이스로 구축하고, 인터넷에 있는 정보를 사회, 문화, 예술, 스포츠, 정치 등과 같은 사용자의 주제 검색에 따라 이미 설정해 놓은 주제 분류에 따라 점차 주제를 압축해 나가면서 최종 자료에 접근할 수 있도록 하였다.Among the conventional search engines, for example, a search engine such as Yahoo searches index sites and web documents to build a database, and distributes information on the Internet to user's subjects such as society, culture, art, sports, According to the search, according to the subject classification already set, the topic is compressed gradually so that the final data can be accessed.

이와 같이 검색 서비스를 제공하는 검색 서비스 시스템은, 사용자로부터 검색어가 입력되면 검색어에 대응하는 검색 결과(예를 들면, 상기 검색어를 포함하는 웹 사이트, 검색어를 포함하는 기사, 검색어를 포함하는 파일명을 갖는 이미지 등)를 사용자에게 제공하여 왔다.When a search word is input from a user, a search service system that provides a search service has a search result corresponding to a search word (e.g., a website including the search word, an article including a search word, Images, etc.) to the user.

2015년에 생산된 디지털 컨텐츠 중 비정형 정보가 차지하는 비중은 90%에 이르고, 세계적으로 존재하는 모든 정보 중 디지털 컨텐츠 정보의 용량 증가 비중은 48%에 이르며, 2016년 현재 사용중인 데이터 웨어 하우스 중 비정형 정보의 처리를 포함하여 새로운 정보 증가 속도와 복잡성을 만족하지 못 하는 데이터 웨어 하우스의 비중은 75%에 이르며, 기업 생산성 유지를 위하여 필요한 정보를 필요한 시기에 제공하지 못하는 기업들의 비중은 86%에 이르는 등 현재 기업들은 폭발적으로 증가하고 있는 비정형 정보를 효율적으로 활용하고 있지 못한 실정이다.Of the digital content produced in 2015, atypical information accounts for 90% of the total, and the proportion of the digital content information to be used is 48% of all information in the world. In 2016, unstructured information The data warehouses that do not satisfy the new information growth rate and complexity including the processing of the information are 75%, and the proportion of companies that can not provide the necessary information for maintaining productivity is 86% Currently, companies are not effectively using unstructured information, which is increasing explosively.

이에 따라, 혁신적인 비즈니스 모델을 개발하고, 더 나은 제품과 서비스를 창조하며, 고객경험(Customer Experience)을 개선시키며, 지속적인 경쟁 대비 강점을 유지시킴으로써 정보의 힘으로 혁신을 주도하고, 정보 자산을 활용하여 효율적인 업무 개선을 이루는 것이 필요하다.As a result, we are driving innovation through the power of information by developing innovative business models, creating better products and services, improving customer experience, and sustaining competitive advantage. It is necessary to achieve efficient business improvement.

한국공개특허 제10-2017-0108718호Korean Patent Publication No. 10-2017-0108718 한국등록특허 제10-1835854호Korean Patent No. 10-1835854

본 발명의 일측면은 다양한 환경 및 파일 형태를 지원하여 시스템으로부터 구애 받지 않는 구성, 개인별 특성을 고려한 맞춤형 결과, 다양한 검색 부가 기능 및 시스템의 관리의 편의성을 제공할 수 있는 통합 검색 서비스 제공 시스템을 제공한다.One aspect of the present invention provides an integrated search service providing system capable of supporting various environments and file types, providing a configuration free from the system, customized results considering individual characteristics, various search function, and convenience of management of the system do.

본 발명의 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The technical problem of the present invention is not limited to the technical problems mentioned above, and other technical problems which are not mentioned can be understood by those skilled in the art from the following description.

본 발명의 일 실시예에 따른 통합 검색 서비스 제공 시스템은, 자료 수집기를 이용하여 웹상의 데이터베이스로부터 검색 대상을 수집하거나, 첨부파일을 수집하는 자료 수집 모듈; 상기 자료 수집 모듈에서 수집된 자료를 한글 형태소 분석기를 이용하여 문서 필터링, 언어 처리 및 데이터 색인 처리를 수행하는 색인 처리 모듈; 표준 Xml 기반의 검색 인터페이스로 구동되며, 사용자로부터 검색이 요청된 검색어를 질의어 및 연산자 처리한 후, 상기 색인 처리 모듈에서 색인 처리된 자료 중에서 검색어에 해당하는 자료를 검색하여 검색 결과를 처리하는 검색 처리 모듈; 스펠링 체크, 검색어 자동 완성, 검색어 추천, 최근 검색어 제공, 인기 검색어 제공, 개인화 기능 제공 및 개체 추출 기능을 포함하는 부가 서비스를 제공하는 부가 서비스 제공 모듈; 및 상기 자료 수집 모듈에서 수집된 자료의 타이틀, 작성자 및 상품명을 추출한 후 색인 하여 자신의 메모리 상에 저장해 두며, 사용자로부터 해당 저장된 자료에 대한 검색 요청이 있는 경우 상기 검색 처리 모듈에 우선하여 검색 결과를 처리하여 사용자에게 제공하는 인메모리 검색 모듈을 포함한다.The integrated search service providing system according to an embodiment of the present invention includes a data collection module for collecting search objects from a database on the web using a data collector or collecting attached files; An index processing module for performing document filtering, language processing, and data indexing processing on data collected by the data collection module using a Korean morphological analyzer; A search process which is driven by a search interface based on a standard Xml and which processes a query term that is requested to be searched by a user and a query term and an operator, module; An additional service providing module for providing an additional service including a spell check, an automatic completion of a search word, a search word recommendation, a recent search word provision, a popular search word provision, a personalization function, and an object extraction function; And a title, a creator, and a product name of the data collected by the data collection module are extracted and stored in the memory of the user. When there is a search request for the stored data from the user, And provides the in-memory search module to the user.

일 실시예에서, 개방형 시스템을 만들기 위한 기초 인터페이스인 표준 XML을 지원할 수 있도록 SOAP 또는 OPEN API를 지원하고, XML에 의한 색인 정보 입/출력과 검색결과를 출력하며, XML 구조 검색을 위한 XPath 연산을 수행하며, 검색 엔진과 소통을 위한 Get/Post 방식의 질의 명령을 수행하며, 요청된 Query 조합 및 명령에 따른 검색결과를 XML 형태로 제공하고, 응용 프로그램 단에서 XML 결과를 사용자 레벨의 검색화면으로 치환하여 결과를 제공하되, 상기 통합 검색 서비스 제공 시스템은 통합 검색 서비스에 로그인한 사용자가 통합 검색 서비스에 접속한 컴퓨팅 장치의 지피에스 모듈이 수집한 위치 정보에 기초하여 상기 사용자가 상기 통합 검색 서비스에 접속 시점 별 국가 정보를 추출하여 접속시점이 많은 순서대로 5개의 국가를 추출하고, 상기 사용자로부터 검색어가 입력되고 5초 이내에 검색 요청이 없으면 접속시점이 제일 많은 국가 언어로 된 검색 결과를 제공하고, 상기 접속시점이 제일 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 1분 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 두번째로 많은 국가 언어로 된 검색 결과를 제공하고, 상기 접속시점이 두번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 50초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 세번째로 많은 국가 언어로 된 검색 결과를 제공하고, 상기 접속시점이 세번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 40초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 네번째로 많은 국가 언어로 된 검색 결과를 제공하고, 상기 접속시점이 네번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 40초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 다섯번째로 많은 국가 언어로 된 검색 결과를 제공하고, 상기 접속시점이 다섯번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 30초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 국가 선택 탭을 제공하는 자동 언어 변환 검색 모듈을 더 포함할 수 있다. In one embodiment, SOAP or OPEN API is supported to support standard XML, which is a basic interface for creating an open system, output of index information input / output by XML, search result, and XPath operation for searching XML structure And executes the Get / Post query command to communicate with the search engine. The search result according to the requested query combination and command is provided in XML format. The application program unit provides the XML result to the user level search screen Wherein the integrated search service providing system provides the integrated search service providing system with the integrated search service providing system in which the user who is logged in to the integrated search service can access the integrated search service based on the location information collected by the GPS module of the computing device, Extracts country information by time of day, extracts five countries in order of the number of access points, If a search query is input within five seconds and a search request is not received within five seconds, a search result in the national language in which the connection time is the largest is provided, and within one minute from a point in time when the search result in the highest- If there is no selection for the search result, the search result is provided in the second largest number of national languages at the point of connection, and the search result is provided from the user within 50 seconds from the point at which the connection point provides the search result in the second- The selection of the search result from the user within 40 seconds from the point in time when the search result in the third largest number of national languages is provided, If there is no connection, the search results will be in the fourth largest national language, If the search result is not selected by the user within 40 seconds from the time when the search result in the fourth largest number of national languages is provided at the connection time point, And an automatic language translation search module for providing a country selection tab if there is no selection of the search result from the user within 30 seconds from the time when the search result of the fifth largest country language is provided.

일 실시예에서, 사용자로부터 입력된 검색어에 심층 검색을 명령하는 명령어를 포함하고 있는 경우, 명령형 검색어에 포함되어 있는 '대분류', '중분류', 및 '소분류'를 판독하며, 사용자가 각각의 '류'를 특정하여 입력한 경우 특정된 '류'에 대응하여 검색을 실행하며, 사용자로부터 '대분류'가 특정되지 아니하고 속성만 특정된 명령형 검색어가 입력된 경우 '대분류'에 해당하는 검색 가능한 사이트 및 해당 사이트에서 검색된 검색 결과를 일괄하여 사용자에게 출력하거나, '대분류'에 해당하는 검색 가능한 사이트를 일차적으로 출력하여 검색하고자 하는 사이트를 사용자로 하여금 선택하도록 요청한 후 사용자로부터 선택 받은 사이트만을 검색하는 심층 검색 처리 모듈을 더 포함할 수 있다.In one embodiment, when the search word input from the user includes an instruction for instructing a deep search, 'major category', 'middle category', and 'minor category' included in the imperative search word are read, The search is performed in correspondence with the specified 'current'. If the 'major category' is not specified by the user and the imputed search word whose only attribute is specified is input, the searchable site corresponding to the 'major category' The search result of the site is collectively output to the user or the searchable site corresponding to the 'major category' is firstly outputted to request the user to select the site to be searched, Processing module.

상술한 본 발명의 일측면에 따르면, Open Source 기반의 검색 엔진으로 빠른 색인 및 검색 기능, 다양한 서버 환경 지원과 표준화된 Xml기반의 검색 인터페이스 및 다양한 검색 부가 기능의 제공으로 편리한 검색 환경을 제공할 수 있다.According to an aspect of the present invention, an Open Source-based search engine can provide a convenient search environment by providing a fast index and search function, various server environment support, a standardized Xml-based search interface, and various search function have.

도 1은 본 발명의 일 실시예에 따른 통합 검색 서비스 제공 시스템의 개략적인 구성이 도시된 도면이다.
도 2 및 도 3은 도 1에 있는 색인 처리 모듈을 설명하는 도면이다.
도 4 및 도 5은 본 발명의 다른 실시예에 따른 통합 검색 서비스 제공 시스템의 개략적인 구성이 도시된 도면이다.
1 is a diagram illustrating a schematic configuration of an integrated search service providing system according to an embodiment of the present invention.
Figs. 2 and 3 are diagrams illustrating the index processing module in Fig. 1. Fig.
4 and 5 are views showing a schematic configuration of a system for providing an integrated search service according to another embodiment of the present invention.

후술하는 본 발명에 대한 상세한 설명은, 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 당업자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예와 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.The following detailed description of the invention refers to the accompanying drawings, which illustrate, by way of illustration, specific embodiments in which the invention may be practiced. These embodiments are described in sufficient detail to enable those skilled in the art to practice the invention. It should be understood that the various embodiments of the present invention are different, but need not be mutually exclusive. For example, certain features, structures, and characteristics described herein may be implemented in other embodiments without departing from the spirit and scope of the invention in connection with an embodiment. It is also to be understood that the position or arrangement of the individual components within each disclosed embodiment may be varied without departing from the spirit and scope of the invention. The following detailed description is, therefore, not to be taken in a limiting sense, and the scope of the present invention is to be limited only by the appended claims, along with the full scope of equivalents to which such claims are entitled, if properly explained. In the drawings, like reference numerals refer to the same or similar functions throughout the several views.

이하, 도면들을 참조하여 본 발명의 바람직한 실시예들을 보다 상세하게 설명하기로 한다.Hereinafter, preferred embodiments of the present invention will be described in more detail with reference to the drawings.

자동화에 따른 업무 패턴의 변화에 의한 일상적인 업무(예를 들어, 물건을 창고에 나열하는 업무, 은행 수납 업무 또는 설계 도면을 토대로 소재 가공)의 감소 및 증가하는 창의적인 업무(예를 들어, 여러 분야로부터 모여서 신제품 런칭 전략을 협의하는 업무 또는 시장 조사를 통해 경영 전략을 세우는 업무 등)의 지원을 위한 정보 활용을 위하여 다양한 검색 기술의 적용이 필요로 한 실정이다.Reduction of daily work by changing work patterns due to automation (for example, sorting objects in a warehouse, material processing based on bank receipt work or design drawings) and increasing creative work (for example, To gather information from a variety of sources, such as negotiating a new product launch strategy, or establishing a business strategy through market research).

또한, 정보 활용에 따른 업무 환경의 경우에도, 기존의 일상적 업무 패턴에서 창의적 업무 패턴으로 변화하고 있으며, 물리적 공간으로부터 가상 공간으로 업무 환경이 변화하고 있다.Also, even in the case of the work environment based on the information utilization, the work environment changes from the conventional daily work pattern to the creative work pattern, and from the physical space to the virtual space.

상술한 바와 같은 업무 환경에 있어서, 업무 능력 향상을 위한 효율적인 정보 활용의 첫 걸음으로써 가장 중요한 것은 검색이라고 할 것이다.In the above-mentioned work environment, the most important thing as the first step of efficient information utilization for improving the business ability is called search.

도 1은 본 발명의 일 실시예에 따른 통합 검색 서비스 제공 시스템의 개략적인 구성이 도시된 도면이다.1 is a diagram illustrating a schematic configuration of an integrated search service providing system according to an embodiment of the present invention.

도 1을 참조하면, 통합 검색 서비스 제공 시스템(10)은, 자료 수집 모듈(100), 색인 처리 모듈(200), 검색 처리 모듈(300) 및 부가 서비스 제공 모듈(400)을 포함한다.Referring to FIG. 1, the integrated search service providing system 10 includes a data collection module 100, an index processing module 200, a search processing module 300, and an additional service providing module 400.

자료 수집 모듈(100)은, 자료 수집기(예를 들어, JBulker등)를 이용하여 웹상의 데이터베이스로부터 검색 대상을 수집하거나, 첨부파일을 수집한다.The data collection module 100 collects search objects from a database on the web using a data collector (for example, JBulker, etc.), or collects attached files.

색인 처리 모듈(200)은, 자료 수집 모듈(100)에서 수집된 자료를 한글 형태소 분석기(형태소를 비롯하여, 어근, 접두사/접미사, 품사(POS, part-of-speech) 등 다양한 언어적 속성의 구조를 파악하는 것)를 이용하여 문서 필터링(filtering), 언어 처리 및 데이터 색인 처리를 수행한다.The index processing module 200 analyzes the data collected by the data collection module 100 using a Korean morphological analyzer (including a morpheme, a structure of various linguistic attributes such as a root, a prefix / suffix, and a part-of-speech) To perform document filtering, language processing, and data indexing processing.

도 2를 참조하면, 색인 처리 모듈(200)은, 1) Fetching(인터넷 상에서 FTP에 의해 파일의 업로드, 다운로드를 하기 위한 셰어 웨어), 2) Extracting(추출), 3) Concat(Concatenate, 복수의 문자열(character string)을 하나의 문자열로 모아서 연결시키는 것), 4) Transfer(전송) 및 5) Indexing(색인)의 과정으로 색인 기능을 수행할 수 있다.Referring to FIG. 2, the index processing module 200 may include: 1) Fetching (shareware for uploading and downloading files by FTP on the Internet) 2) Extracting 3) Concat 4) Transfer and 5) Indexing can be performed in the process of indexing the character string.

여기서, Extracting은 문서 필터링과 형태소 분석을 통해 데이터를 추출하게 되며, Concatenate은 추출된 데이터를 Metadata, ACLs 및 Textual Content를 포함하는 데이터로 가공하여 용량을 10 내지 20%로 줄일 수 있다.Here, extracting extracts data through document filtering and morphological analysis, and Concatenate can process the extracted data into data including metadata, ACLs, and textual content, thereby reducing the capacity by 10 to 20%.

도 3을 참조하면, 색인 처리 모듈(200)에 의한 색인 속도는, 원시 데이터(DB등)로부터 대상 자료를 수집하는 시간(수집된 문서를 필터링하는 과정 포함함)과, 실제 수집된 자료를 검색 엔진으로 색인 처리 하는 시간으로 구성되어있다.Referring to FIG. 3, the indexing speed by the indexing module 200 includes a time for collecting the target data from the raw data (DB, etc.) (including a process of filtering the collected document) And the time required for indexing by the engine.

대상 자료를 수집하는 시간은 원시 데이터 시스템 및 네트워크의 속도 등에 따라 유동적으로 결정되며, 수집된 대상 자료를 색인 처리하는 시간은 본 발명의 색인 처리 모듈(200)의 정확하고 빠른 형태소 분석기를 이용한 색인어 추출에 의해 결정된다.The time for collecting the object data is determined dynamically according to the speed of the original data system and the network, and the time for index processing of the collected object data is determined by extracting the index word using the accurate and quick morpheme analyzer of the index processing module 200 of the present invention .

또한, 색인 처리 모듈(200)은, MS-Office 파일, 아래아한글, PDF 등 다양한 문서 파일의 필터를 지원할 수 있다.In addition, the index processing module 200 can support filters of various document files such as MS-Office files, Hangeul Hangul, and PDF.

검색 처리 모듈(300)은, 표준 Xml 기반의 검색 인터페이스로 구동되며, 사용자로부터 검색이 요청된 검색어를 질의어 및 연산자 처리한 후, 색인 처리 모듈(200)에서 색인 처리된 자료 중에서 검색어에 해당하는 자료를 검색하여 검색 결과를 처리한다.The search processing module 300 is operated by a search interface based on a standard Xml and processes a query term that is requested to be searched by a user as a query word and an operator and then processes data corresponding to a query word among the index processed data in the index processing module 200 And processes the search results.

Figure 112018051200764-pat00001
Figure 112018051200764-pat00001

일 실시예에서, 검색 처리 모듈(300)은, 표 1에서 예시한 바와 같은 다양한 질의어와 연산자를 제공한다.In one embodiment, the search processing module 300 provides various query terms and operators as illustrated in Table 1.

부가 서비스 제공 모듈(400)은, 스펠링 체크, 검색어 자동 완성, 검색어 추천, 최근 검색어 제공, 인기 검색어 제공, 개인화 기능 제공 및 개체 추출 기능을 포함하는 부가 서비스를 제공한다.The additional service providing module 400 provides an additional service including a spelling check, a search term automatic completion, a search term recommendation, a recent search term provision, a popular search term provision, a personalization function, and an entity extraction function.

부가 서비스 제공 모듈(400)이 제공할 수 있는 첫 번째 기능으로서 스펠링 체크는, 검색로그/문서에서 오타 보정의 대상 단어를 추출하며, 색인 대상 문서를 통한 오타 보정 대상 단어 추출로 검색 쿼리가 적은 경우라도 보정이 가능하도록 하며, 단어별 쿼리 가중치와 문서에서 추출한 가중치 값을 합산하여 최적의 보정 단어를 제안할 수 있으며, 배치 작업으로 오타 보정 지식셋에 자동으로 반영할 수 있으며, 오타 보정 지식셋에 대한 운영자 관리 기능으로 사용자 편의성을 제공할 수 있다.As a first function that can be provided by the additional service providing module 400, the spelling check extracts target words of the omission correction from the search log / document, extracts the word to be corrected by the search target document, And the optimal correction word can be proposed by summing the weight values extracted from the document by the query weights for each word and automatically reflected in the correction error information set by the batch operation, User management can be provided by the operator management function.

부가 서비스 제공 모듈(400)이 제공할 수 있는 두 번째 기능으로서 최근 검색어/인기 검색어 제공 기능은, 사용자 검색 편의를 돕기 위해 로그 정보를 활용한 최근 검색어 및 최근 문서 기능과 인기 검색어 및 연관 검색어 등 다양한 부가 기능을 제공할 수 있다.As a second function that can be provided by the supplementary service providing module 400, the recent search term / popular search term providing function is a function for providing a variety of search terms and recent document functions utilizing log information, Additional functions can be provided.

이에 따라, 로그인한 사용자는 자신의 검색 이력이나 열람한 정보 등 자신의 과거 검색 이력 정보를 확인하거나 재열람 할 수 있으며, 다른 사용자들이 검색한 검색어를 분석하여 검색어의 변동 현황 및 인기 검색어를 제공하고, 엔진의 기본query로그를 사용한 검색어 통계 방식과 응용에서 기록하는 검색어를 집계하는 2가지 방식을 제공할 수 있다.Accordingly, the logged-in user can check or re-browse his / her previous search history information such as his / her search history or browsed information, analyzes the search words searched by other users, and provides a change status of the search word and popular search terms , The query statistic method using the basic query log of the engine and the two methods of counting the search words to be recorded in the application can be provided.

부가 서비스 제공 모듈(400)이 제공할 수 있는 세 번째 기능으로서 검색어 자동 완성 기능은, 사용자가 입력한 검색어의 의미를 분석하여 사용자가 미처 인지하지 못했던 정보를 제공하고, 가장 연관성이 높다고 판단되는 검색어를 자동 완성 형태로 출력하여 제공할 수 있다.As a third function that can be provided by the supplementary service providing module 400, the keyword auto-completion function analyzes the meaning of the keyword entered by the user, provides the user with information that the user has not known yet, Can be output and provided in an auto complete form.

해당 기능을 구현하기 위해, 의미에 따른 분석기법을 적용하거나, 검색어와 문서 간의 관계를 다각도로 분석함으로써 미인지 연관 정보를 추천할 수 있는 '의미 분석 기법'이 사용될 수 있다.In order to implement the function, a 'semantic analysis technique' can be used, which can apply semantic analysis techniques or recommend the unrecognized association information by analyzing the relationship between a search word and a document in various angles.

또한, 가나다순 외 중요도순 검색어 자동완성 목록 제시하거나, 문서의 핵심 컨셉 기반의 자동 완성형 데이터를 만들고 연관도 및 정확도 등의 문서 통계에 기반한 키워드 가중치를 부여하여 가중치의 순서대로 출력하거나, 가중치에 대한 사용자 정의 기능 제공하거나, 사용자 키 입력 시 한글 자 소단위의 검색어 자동완성 외, 끝 단어 더 보기, 기능 끄기, 영문오타보정 등의 기능을 제공할 수 있는 '자동 완성 형태 제공 기법'이 사용될 수 있다.In addition, it is possible to present a list of autocompletion words in order of the alphabetical order of importance, to generate autocomplete data based on the core concept of the document, to output keyword weightings based on document statistics such as relevance and accuracy, Or 'automatic completion type providing technique' which can provide a function of providing a definition function or a function of automatic completion of a Korean character sub-title when inputting a user key, a function of displaying more end words, a function of turning off the function, and correction of English characters.

부가 서비스 제공 모듈(400)이 제공할 수 있는 네 번째 기능으로서 개인화(Agent/Mailing) 기능은, 사용자가 등록한 문서, 관심 키워드를 기반으로 학습된 개인별 관심 목록을 반환하고 SMTP(Simple Mail Transfer Protocol)를 이용하여 색인되는 시점에 사용자 등록/관심 정보에 대한 메일 전송 및 알림 기능을 수행할 수 있다.As a fourth function that can be provided by the additional service providing module 400, the personalizing agent / mailing function returns an individual interest list learned based on a document registered by the user and a keyword of interest, The user can perform mail transmission and notification of user registration / interest information at the time of indexing.

이를 구현하기 위해, 로그인한 후 사용자는 관심 키워드 혹은 문서를 시스템에 등록하여 학습시키면, 검색 엔진은 등록된 개인별 관심 정보를 'Agent'로 명명된 개별 항목으로 학습하여 차별화된 군집 기능을 실행하게 되며, 개인별로 등록된 'Agent'에 따라 관심 추천정보를 반환하게 되며, 개인별로 등록한 관심 정보와 유사한 추천정보가 신규로 발생하면 이메일을 통하여 전송하게 된다.In order to realize this, when the user registers the interest keyword or document in the system and learns, the search engine learns the registered individual interest information as an individual item named 'Agent' to execute the differentiated community function , Recommendation information is returned according to 'Agent' registered for each individual, and recommendation information similar to the interest information registered for each individual is newly transmitted through e-mail.

상술한 바와 같은 구성을 가지는 통합 검색 서비스 제공 시스템(10)은, 인메모리 검색 모듈(500)을 더 포함할 수 있다.The integrated search service providing system 10 having the above-described configuration may further include an in-memory search module 500.

인메모리 검색 모듈(500)은, 자료 수집 모듈(100)에서 수집된 자료의 타이틀, 작성자 및 상품명을 추출한 후 색인 하여 자신의 메모리 상에 저장해 두며, 사용자로부터 해당 저장된 자료에 대한 검색 요청이 있는 경우 검색 처리 모듈(300)에 우선하여 검색 결과를 처리하여 사용자에게 제공한다.The in-memory search module 500 extracts a title, an author, and a product name of the collected data from the data collection module 100, stores the extracted title, the creator, and the product name on the memory of the in-memory search module 500. If there is a search request for the stored data from the user The search processing module 300 preferentially processes the search result and provides it to the user.

이에 따라, 인메모리 검색 모듈(500)은, 빠른 검색이 필요한 데이터에 대해서 단순한 색인 구조로 메모리 상에서 색인 및 검색 할 수 있는 기능뿐만 아니라, 실시간 색인 추가 및 삭제 기능 및 파일 기반 색인/검색 대비 빠른 검색 속도를 제공할 수 있다.Accordingly, the in-memory search module 500 has a function of not only indexing and searching in memory in a simple index structure for data requiring quick search, but also real-time index addition and deletion functions and quick search for file-based index / Speed can be provided.

상술한 바와 같은 구성을 가지는 통합 검색 서비스 제공 시스템(10)은, SOAP, OPEN API 등 개방형 시스템을 만들기 위한 기초 인터페이스인 표준 XML을 지원하여, XML에 의한 색인 정보 입/출력과 검색결과 출력 기능을 제공할 수 있으며, XML 구조 검색을 위한 XPath 연산 역시 제공할 수 있다.The integrated search service providing system 10 having the above-described configuration supports standard XML, which is a basic interface for creating an open system such as SOAP and OPEN APIs, and provides index information input / output and search result output function by XML , And can also provide XPath operations for searching XML structures.

또한, 검색 엔진과 간편한 소통을 위해 Get/Post 방식의 질의 명령을 수행하며, 요청된 Query 조합 및 명령에 따른 검색결과를 XML 형태로 제공하고, 응용 프로그램 단에서 XML 결과를 사용자 레벨의 검색화면으로 치환하여 결과를 제공할 수 있다.In addition, it executes Get / Post query command for easy communication with the search engine, provides search result according to the requested query combination and command in XML format, and displays the XML result at the application program level as a search screen at the user level Can be substituted to provide the result.

이에 따른 XML 검색 결과의 처리에 있어서, 검색화면 디자인 개편, 시스템간 연동 등의 이슈에 검색 엔진 전문가 도움이 없이도 처리할 수 있는 확장성과 유연성을 함께 제공할 수 있다.As a result, in the processing of XML search results, it is possible to provide scalability and flexibility that can be handled without need of a search engine expert in issues such as reorganization of search screen design and interworking between systems.

상술한 바와 같은 구성을 가지는 통합 검색 서비스 제공 시스템(10)은, 랜섬웨어 차단 모듈(600)을 포함할 수 있다.The integrated search service providing system 10 having the above-described configuration may include a random access protection module 600.

랜섬웨어 차단 모듈(600)은, 백업된 정보(예를 들어, 사용자 정보, 검색어 정보 또는 데이터베이스에 저장된 각종 정보들)를 악성 프로그램, 특히 랜섬웨어 등으로부터 보호하기 위해 다음과 같은 기능들을 수행한다.The RAN firmware block module 600 performs the following functions to protect the backed up information (for example, user information, query word information, or various information stored in the database) from a malicious program, particularly, Ransomware or the like.

일 실시예에서, 랜섬웨어 차단 모듈(600)은, 랜섬웨어의 침입이 감지되면, PC의 CPU의 클럭 수를 비정상적으로 저하(예를 들어, 정상 클럭의 1 내지 3% 등)시켜 컴퓨터의 연산 속도를 비정상적으로 줄임으로써, 랜섬웨어의 설치 및 확인 속도를 저하시킬 수 있다.In one embodiment, the Raman-webware blocking module 600 abnormally lowers the number of clocks of the CPU of the PC (for example, 1 to 3% of the normal clock, etc.) when intrusion of the Raman- By reducing the speed abnormally, it is possible to reduce the speed of installing and checking the firmware.

이때, 동기화 프로그램을 위한 PC의 자원을 미리 독립적으로 확보해 두었다가, 랜섬웨어의 침입이 감지되면, 다른 자원과는 별도로 활용하여 클럭 수의 저하에도 지장 없이 동기화를 수행하도록 함이 바람직하다.At this time, it is preferable that the resources of the PC for the synchronization program are independently secured in advance, and when the intrusion of the Raman software is detected, the synchronization is preferably performed separately from the other resources so that the synchronization can be performed without hindrance of the decrease in the number of clocks.

일 실시예에서, 랜섬웨어 차단 모듈(600)은, 사용자로부터 미리 지정 받은 동기화 순서에 따라 동기화를 수행하거나, 랜섬웨어로부터 고객 정보를 효율적으로 보호하기 위해 용량이 적은 고객 정보로부터 클라우드에 업로드 하거나, 사용자로부터 지정 받은 전체 고객 정보를 일괄하여 업로드 하기 위해 전체 고객 정보에 대한 압축 고객 정보를 생성시킨 후 한 번에 업로드 할 수 있다.In one embodiment, the Raman-webware blocking module 600 performs synchronization in accordance with a predetermined synchronization sequence from the user, uploads the customer information with a small capacity to the cloud in order to efficiently protect customer information from Rangumware, Compressed customer information for all customer information can be generated and uploaded at once in order to collectively upload all customer information specified by the user.

이때, 랜섬웨어 차단 모듈(600)은, 고객 정보의 용량, 사용자로부터 지정된 고객 정보인지 여부 및 사용자가 고객 정보를 확인한 횟수에 기초하여 클라우드에 업로드 하는 순서를 결정한다.At this time, the RAN webware blocking module 600 determines the order of uploading to the cloud based on the capacity of the customer information, whether it is customer information designated by the user, and the number of times the user confirms the customer information.

첫 번째 업로드 순서 결정 방법을 설명하면 다음과 같다.The method of determining the first upload order is as follows.

특정 고객의 검색 이력이 다른 고객에 비하여 상대적으로 많다면, 검색행위에 따른 누적 데이터도 많게 되어 고객의 고객 정보의 용량이 큼은 자명하다. 상기 고객 정보는 고객의 검색 이력, 고객의 이름, 주소 등 고객과 관련된 모든 정보를 포함한다.If the search history of a specific customer is relatively larger than those of other customers, it is obvious that the cumulative data according to the search behavior is large, and the capacity of the customer information of the customer is large. The customer information includes all information related to the customer such as a customer's search history, a customer's name, and an address.

랜섬웨어 차단 모듈(600)은, 모든 고객 정보를 크기별로 10개의 그룹으로 분류할 수 있는데, 이때 각각의 그룹에 포함된 고객 정보의 개수는 모든 고객 정보의 개수를 그룹 수로 나눈 값과 동일하다.The RAN webware blocking module 600 can classify all customer information into ten groups by size, wherein the number of customer information included in each group is the same as the value obtained by dividing the number of all customer information by the number of groups.

예를 들어, 모든 고객 정보가 1000 개라면, 그룹의 개수는 10 개이기 때문에 각 그룹에는 100 개의 고객 정보가 포함하는데, 고객 정보의 용량의 크기가 작은 순서로 10 개의 그룹으로 분류하게 된다.For example, if all the customer information is 1000, since the number of groups is 10, each group includes 100 pieces of customer information, and the group of the customer information is divided into 10 groups in ascending order of capacity.

구체적으로, 용량의 크기가 가장 작은 고객 정보들이 속한 그룹을 그룹 1로 정의 하고, 용량의 크기가 두 번째로 작은 고객 정보들이 속한 그룹을 그룹 2로 정의 하고, 용량의 크기가 세 번째로 작은 고객 정보들이 속한 그룹을 그룹 3으로 정의 하고, 용량의 크기가 네 번째로 작은 고객 정보들이 속한 그룹을 그룹 4로 정의 하고, 용량의 크기가 다섯 번째로 작은 고객 정보들이 속한 그룹을 그룹 5로 정의 하고, 용량의 크기가 여섯 번째로 작은 고객 정보들이 속한 그룹을 그룹 6으로 정의 하고, 용량의 크기가 일곱 번째로 작은 고객 정보들이 속한 그룹을 그룹 7로 정의 하고, 용량의 크기가 여덟 번째로 작은 고객 정보들이 속한 그룹을 그룹 8로 정의 하고, 용량의 크기가 아홉 번째로 작은 고객 정보들이 속한 그룹을 그룹 9로 정의 하고, 용량의 크기가 열 번째로 작은 고객 정보들이 속한 그룹을 그룹 10으로 정의 한다.Specifically, a group to which customer information having the smallest capacity is included is defined as group 1, a group to which customer information having the smallest capacity is included is defined as group 2, The group to which the information belongs is defined as group 3, the group to which the customer information having the smallest capacity size belongs is defined as group 4, the group to which the customer information having the smallest capacity size belongs is defined as group 5 , A group to which the customer information having the smallest capacity size is included is defined as group 6, a group to which the customer information having the smallest capacity size belongs is defined as group 7, The group to which the information belongs is defined as group 8, the group to which the customer information having the smallest capacity size belongs is defined as group 9, The group with the smallest customer information is defined as group 10.

그리고, 그룹 1에는 10점, 그룹2 에는 9점, 그룹 3에는 8점, 그룹 4에는 7점, 그룹 5에는 6점, 그룹 6에는 5점, 그룹 7에는 4점, 그룹 8에는 3점, 그룹 9에는 2점 그룹 10에는 1점을 부여한다.10 points for group 1, 9 points for group 2, 8 points for group 3, 7 points for group 4, 5 points for group 6, 4 points for group 7, 3 points for group 8, In Group 9, one point is assigned to the two-point group 10.

이는, 짧은 시간에 최대한 많은 고객 정보를 보호하기 위해 용량이 작은 고객 정보에 더 큰 점수를 부여하기 위함이다.This is to give a higher score to small capacity customer information in order to protect as much customer information as possible in a short time.

두 번째 업로드 순서 결정 방법을 설명하면 다음과 같다.The method of determining the second upload order is as follows.

반면, 랜섬웨어 차단 모듈(600)은, 사용자가 지정한 고객 정보에는 5점을 부여하고, 사용자에게 지정을 받지 못한 고객 정보에는 0점을 부여한다.On the other hand, the RAN firmware block module 600 assigns 5 points to the customer information designated by the user and 0 points to the customer information that is not designated to the user.

사용자가 중요시한 고객 정보를 빨리 업로드 할 수 있도록 사용자가 지정한 고객 정보에 더 큰 점수를 부여함으로써, VIP 고객의 고객 정보에 보다 높은 보안 서비스를 제공하고자 하는 것이다.In order to allow the user to upload important customer information quickly, a higher score is given to the customer information designated by the user, thereby providing a higher security service to the customer information of the VIP customer.

따라서, 서버에 저장되어 있는 모든 고객 정보를 클라우드 서비스에 업로드 하기에는 많은 시간이 걸리기때문에 랜섬웨어로부터 효율적으로 고객 정보들을 보호하기 어려운 바, 사용자는 랜섬웨어의 침입에 대비하여 최소한의 중요 고객 정보를 미리 선택하여 지정해 둠이 바람직하다.Therefore, since it takes a long time to upload all the customer information stored in the server to the cloud service, it is difficult to efficiently protect the customer information from the Ransomware. Therefore, It is desirable to select and specify.

세 번째 업로드 순서 결정 방법을 설명하면 다음과 같다.The third method of determining the upload order is as follows.

랜섬웨어 차단 모듈(600)은, 랜섬웨어의 침입이 감지된 시점으로부터 1달 이내에 고객 정보가 확인된 횟수에 기초하여 10 개의 그룹으로 분류한다.The RAN webware blocking module 600 classifies into 10 groups based on the number of times the customer information is confirmed within one month from the time when the intrusion of the RAN webware is detected.

사용자가 고객 정보를 확인한다는 것은, 의도적으로 특정 고객 정보에 접근하여 고객 정보에 포함된 내용을 확인했다는 것을 의미하며, 특별히 지정한 것은 아니지만, 여러 이유로 특정 고객 정보를 확인했다는 것은 중요하게 관리될 필요가 있는 고객 정보임을 암시하기 때문이다.The fact that the user confirms the customer information implies that the customer has intentionally accessed the specific customer information and confirmed the contents contained in the customer information. Although it is not specially designated, the confirmation of the specific customer information for various reasons needs to be managed This is because it implies that it is customer information.

각각의 그룹에 포함된 고객 정보의 개수는 모든 고객 정보의 개수를 그룹 수로 나눈 값과 동일하다. 즉, 모든 고객 정보가 1000 개라면, 그룹의 개수는 10 개이기 때문에 각 그룹에는 100 개의 고객 정보가 포함된다. 이 경우, 랜섬웨어 차단 모듈(600)은 확인된 횟수가 큰 순서로 10 개의 그룹으로 분류한다.The number of customer information included in each group is the same as the number of all customer information divided by the number of groups. That is, if all the customer information is 1000, since the number of groups is 10, each group includes 100 pieces of customer information. In this case, the random access protection module 600 classifies the groups into ten groups in ascending order of the number of times of confirmation.

예를 들어, 확인된 횟수가 가장 많은 고객 정보가 속한 그룹을 그룹 1로 정의 하고, 확인된 횟수가 두 번째로 많은 고객 정보가 속한 그룹을 그룹 2로 정의 하고, 확인된 횟수가 세 번째로 많은 고객 정보가 속한 그룹을 그룹 3으로 정의 하고, 확인된 횟수가 네 번째로 많은 고객 정보가 속한 그룹을 그룹 4로 정의 하고, 확인된 횟수가 다섯 번째로 많은 고객 정보가 속한 그룹을 그룹 5로 정의 하고, 확인된 횟수가 여섯 번째로 많은 고객 정보가 속한 그룹을 그룹 6으로 정의 하고, 확인된 횟수가 일곱 번째로 많은 고객 정보가 속한 그룹을 그룹 7로 정의 하고, 확인된 횟수가 여덟 번째로 많은 고객 정보가 속한 그룹을 그룹 8로 정의 하고, 확인된 횟수가 아홉 번째로 많은 고객 정보가 속한 그룹을 그룹 9로 정의 하고, 확인된 횟수가 가장 적은 고객 정보가 속한 그룹을 그룹 10로 정의 한다.For example, the group with the highest number of confirmed customer information is defined as group 1, the group with the second highest number of confirmed customer information is defined as group 2, and the number of confirmed times is the third largest Define the group to which the customer information belongs as group 3, define the group to which the customer information with the fourth highest number of confirmed times belongs as group 4, define the group to which the customer information having the fifth highest number of confirmed times belongs to group 5 The group to which the customer information with the sixth highest number of confirmed times belongs is defined as group 6, the group to which the customer information with the seventh largest number of confirmed times belongs is defined as the group 7, and the confirmed number is the eighth The group to which the customer information belongs is defined as the group 8, the group to which the customer information having the number of confirmed times is the ninth largest is defined as the group 9, It defines the group as a group of 10.

이때, 확인된 횟수에 따라 구분된 그룹 1 내지 10은 첫 번째 결정 방법에서의 용량의 크기에 따라 구분된 그룹과 상이함은 자명하다.At this time, it is obvious that the groups 1 to 10 classified according to the confirmed number are different from the groups classified according to the size of the capacity in the first determination method.

그리고, 확인된 횟수에 따라 구분된 그룹 1 내지 10에 대하여, 그룹 1에는 10점, 그룹 2에는 9점, 그룹 3에는 8점, 그룹 4에는 7점, 그룹 5에는 6점, 그룹 6에는 5점, 그룹 7에는 4점, 그룹 8에는 3점, 그룹 9에는 2점 그룹 10에는 1점을 부여한다.10 points for group 1, 9 points for group 2, 8 points for group 3, 7 points for group 4, 6 points for group 5, and 5 points for group 6 for groups 1 to 10 classified according to the confirmed number of times 4 points for group 7, 3 points for group 8, and 1 point for two points group 10 in group 9.

사용자가 지정하지 않았더라도, 확인된 횟수가 많다는 것은 사용자가 필요로 하는 고객 정보인 것으로 추정하여, 확인 횟수가 많은 고객 정보에 더 큰 점수를 부여한다.Even if the user does not designate it, it is assumed that the number of times of confirmation is large is the customer information required by the user, and a larger score is given to the customer information having a large number of times of confirmation.

상술한 바와 같이 랜섬웨어 차단 모듈(600)은, 고객 정보의 용량, 사용자로부터 지정된 고객 정보인지 여부 및 사용자가 고객 정보를 확인한 횟수에 따라 부여된 점수가 높은 순으로 클라우드에 업로드 할 수 있다.As described above, the Raman-software interception module 600 can upload to the cloud in descending order of the score given according to the capacity of the customer information, whether it is the customer information designated by the user, and the number of times the user confirms the customer information.

더 나아가, 랜섬웨어 차단 모듈(600)은, 고객 정보의 최초 취득 날짜 및 우수 고객 정보인지 여부를 추가적으로 고려하여 클라우드에 업로드 하는 순서를 결정한다.Further, the Raman-Webware blocking module 600 determines the order of uploading to the cloud, taking into consideration whether the customer information is the first acquisition date and the superior customer information.

랜섬웨어 차단 모듈(600)의 첫 번째 추가적인 순서 결정 방법은, 모든 고객 정보를 최초 취득 날짜별로 4 개의 그룹으로 분류하는 것으로, 이때 각각의 그룹에 포함된 고객 정보의 개수는 모든 고객 정보의 개수를 그룹 수로 나눈 값과 동일하다.The first additional order determination method of the RAN webware blocking module 600 classifies all customer information into four groups according to the initial acquisition date. In this case, the number of customer information included in each group corresponds to the number of all customer information It is the same value divided by the number of groups.

즉, 모든 고객 정보가 1000 개라면, 그룹의 개수는 4 개이기 때문에 각 그룹에는 250 개의 고객 정보가 포함되는데, 여기서 고객 정보는 특정 고객의 고객 정보로 고객 정보가 1000 개라는 것은 고객 1000 명에 대한 고객 정보가 존재한다는 것이므로, 고객 정보를 최초로 취득 날짜가 느린 순서로 4개의 그룹으로 분류한다.In other words, if all the customer information is 1000, the number of groups is 4, so 250 pieces of customer information are included in each group. Here, the customer information is a customer information of a specific customer, The customer information is classified into four groups in the order of the first acquisition date.

랜섬웨어 차단 모듈(600)은, 최초 취득 날짜가 가장 늦은 고객 정보들이 속한 그룹을 그룹 1로 정의 하고, 최초 취득 날짜가 두 번째로 늦은 고객 정보들이 속한 그룹을 그룹 2로 정의 하고, 최초 취득 날짜가 세 번째로 늦은 고객 정보들이 속한 그룹을 그룹 3으로 정의 하고, 최초 취득 날짜가 네 번째로 늦은 고객 정보들이 속한 그룹을 그룹 4로 정의 한다. 그리고 그룹 1에는 10점, 그룹 2에는 9점, 그룹 3에는 8점, 그룹 4에는 7점을 부여한다.The RAN webware blocking module 600 defines a group to which the customer information with the earliest acquisition date belongs as group 1, a group to which the customer information with the second earliest acquisition date belongs is defined as group 2, Defines the group to which the third-party customer information belongs to as group 3, and the group to which the customer information whose earliest acquisition date is late belongs to as group 4 is defined. 10 points for group 1, 9 points for group 2, 8 points for group 3, and 7 points for group 4.

이때, 최초 취득 날짜에 따라 구분된 그룹 1 내지 4는 전술한 그룹들과 상이함은 자명하다.At this time, it is apparent that the groups 1 to 4 classified according to the initial acquisition date are different from the above-mentioned groups.

최근에 취득된 고객 정보일수록 신규한 고객의 정보이기 때문에 최초 취득 날짜가 늦은 고객 정보일수록 더 높은 점수를 부여한다.The more recently acquired customer information is the information of the new customer, the higher the score of the customer information with the earliest acquisition date is given.

랜섬웨어 차단 모듈(600)의 두 번째 추가적인 순서 결정 방법은, 고객 정보가 우수 고객 정보인지 여부를 판단한 뒤, 우수 고객 정보인 경우에는 5점을 부여하고, 무료 고객 정보인 경우에는 0점을 부여함으로써, 우수 고객 정보가 손상된 경우에는 다시 비용을 지불하고 고객 정보를 구입해야 하는 만큼 우수 고객 정보에 더 큰 점수를 부여하는 것이다.The second additional order determination method of the RAN webware blocking module 600 is to determine whether the customer information is good customer information, to give 5 points if the customer information is excellent customer, and to add 0 if the customer information is free customer information Thus, in the case where the excellent customer information is damaged, a higher score is given to the excellent customer information as much as the customer has to pay the fee again.

우수 고객 정보인지 여부는, 고객의 검색 서비스 이용에 따른 결재 비용이 기준치 이상인지에 따라 결정되는데, 매달 결재 비용이 기 설정된 액수(예를 들어, 백 만 원을 초과 등)를 초과하면 우수 고객으로 설정된다.Whether the customer information is good or not is determined according to whether the payment cost of the customer using the search service is higher than the standard value. If the monthly payment exceeds the predetermined amount (for example, over one million won) Respectively.

상술한 업로드 순서 설정 방법을 종합하여 랜섬웨어 차단 모듈(600)은, 고객 정보의 용량, 사용자로부터 지정된 고객 정보인지 여부, 사용자가 고객 정보를 확인한 횟수, 고객 정보의 최초 취득 날짜 및 우수 고객 정보인지 여부에 따라 부여된 점수를 모두 합산하여 점수가 높은 순으로 클라우드에 업로드 한다.In consideration of the above-described upload order setting method, the Raman-webware blocking module 600 determines whether or not the capacity of the customer information, whether it is customer information designated by the user, the number of times the user confirmed the customer information, Add up all the points awarded and upload them to the cloud in descending order of score.

상술한 업로드 순서 설정 방법에 따른 랜섬웨어로부터의 정보 보호 방법 이외에도 랜섬웨어 차단 모듈(600)은, PC의 데이터 즉, 고객 정보들을 주기적(예를 들어, 하루 또는 격일 등)으로 백업하여 별도로 형성되는 저장장치 등에 저장해 두며, 랜섬웨어의 침입이 감지되면 상술한 바와 같이 PC의 성능을 조절하여 랜섬웨어의 설치 및 확인 속도를 저하시킨 후 PC의 모든 데이터를 일시에 삭제하며, 침입한 랜섬웨어의 치료가 완료된 후 백업해 둔 자료를 이용하여 랜섬웨어의 침입 이전 시기의 상태로 롤백(Roll Back, 현재의 데이터가 유효하지 않거나 망가졌을 때 기존 데이터로 되돌리는 행위)할 수 있다.In addition to the above-described method of protecting information from the Rangemouse according to the upload order setting method, the Raman software interception module 600 backs up data of the PC, that is, customer information periodically (for example, day or every other day) Storage and so on. When the intrusion of the Raman software is detected, the performance of the PC is adjusted as described above, and the speed of the installation and the verification of the Raman software is decreased. Then, all data of the PC is deleted at once, Rollback (roll back (returning the existing data when the current data is invalid or lost) to the state of the pre-intrusion of the Raman software by using the backed-up data after the completion of the process.

좀 더 자세하게 살펴보면, 랜섬웨어 차단 모듈(600)은, PC에 저장된 고객 정보들을 주기적 클라우드에 업로드 하되, 고객 정보의 용량, 사용자로부터 지정된 고객 정보인지 여부, 사용자가 고객 정보를 확인한 횟수, 고객 정보의 최초 취득 날짜 및 우수 고객 정보인지 여부에 따라 부여된 점수가 낮은 순서로 클라우드에 우선적으로 업로드 한다.More specifically, the RAN firmware block module 600 uploads the customer information stored in the PC to the periodic cloud, and determines whether or not the capacity of the customer information, whether the customer information is designated by the user, the number of times the user confirms the customer information, Priority is uploaded to the cloud in the order of the lowest number of points awarded, depending on whether it is the first acquisition date and the best customer information.

랜섬웨어가 침입한 후에는 점수가 높은 순서로 클라우드에 업로드 하여 고객 정보를 보호할 수 있기 때문에, 랜섬웨어가 침입하기 이전에는 침입한 후와는 반대로 점수가 낮은 그룹으로부터 업로드 시켜 보호함으로써 고객 정보를 효율적으로 보호할 수 있다.After the Ransomware has been infected, it can be uploaded to the cloud in the order of high score to protect customer information. Therefore, before Ransomware enters, Can be efficiently protected.

상술한 바와 같은 구성을 가지는 통합 검색 서비스 제공 시스템(10)은, 운영체제(Operation System; OS), 즉 시스템을 기반으로 다양한 소프트웨어를 실행하거나 제작할 수 있다. 상기 운영체제는 소프트웨어가 장치의 하드웨어를 사용할 수 있도록 하기 위한 시스템 프로그램으로서, 안드로이드 OS, iOS, 윈도우 모바일 OS, 바다 OS, 심비안 OS, 블랙베리 OS 등 모바일 컴퓨터 운영체제 및 윈도우 계열, 리눅스 계열, 유닉스 계열, MAC, AIX, HP-UX 등 컴퓨터 운영체제를 모두 포함할 수 있다.The integrated search service providing system 10 having the above-described configuration can execute or produce various software based on an operating system (OS), i.e., a system. The operating system is a system program for allowing software to use the hardware of a device. The operating system includes a mobile computer operating system such as Android OS, iOS, Windows Mobile OS, Sea OS, Symbian OS, Blackberry OS, MAC, AIX, and HP-UX.

상술한 바와 같은 통합 검색 서비스 제공 시스템(10)은, 애플리케이션으로 구현되거나 다양한 컴퓨터 구성요소를 통하여 수행될 수 있는 프로그램 명령어의 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능한 기록 매체는 프로그램 명령어, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.The integrated search service providing system 10 as described above may be implemented in an application or may be implemented in the form of program instructions that can be executed through various computer components and recorded in a computer-readable recording medium. The computer-readable recording medium may include program commands, data files, data structures, and the like, alone or in combination.

상기 컴퓨터 판독 가능한 기록 매체에 기록되는 프로그램 명령어는 본 발명을 위하여 특별히 설계되고 구성된 것들이거니와 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수도 있다.The program instructions recorded on the computer-readable recording medium may be ones that are specially designed and configured for the present invention and are known and available to those skilled in the art of computer software.

컴퓨터 판독 가능한 기록 매체의 예에는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CDROM, DVD 와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 ROM, RAM, 플래시 메모리 등과 같은 프로그램 명령어를 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape, optical recording media such as CDROMs and DVDs, magneto-optical media such as floptical disks, , And hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like.

프로그램 명령어의 예에는, 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함된다. 상기 하드웨어 장치는 본 발명에 따른 처리를 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Examples of program instructions include machine language code such as those generated by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. The hardware device may be configured to operate as one or more software modules for performing the processing according to the present invention, and vice versa.

도 4는 본 발명의 다른 실시예에 따른 통합 검색 서비스 제공 시스템의 개략적인 구성이 도시된 도면이다.4 is a diagram illustrating a schematic configuration of an integrated search service providing system according to another embodiment of the present invention.

도 4를 참조하면, 통합 검색 서비스 제공 시스템(20)은, 자료 수집 모듈(100), 색인 처리 모듈(200), 검색 처리 모듈(300), 부가 서비스 제공 모듈(400) 및 심층 검색 처리 모듈(700)을 포함한다. 여기서, 자료 수집 모듈(100), 색인 처리 모듈(200), 검색 처리 모듈(300) 및 부가 서비스 제공 모듈(400)은, 도 1의 구성요소와 동일하므로 그 설명을 생략한다.4, the integrated search service providing system 20 includes a data collection module 100, an index processing module 200, a search processing module 300, an additional service providing module 400 and a deep search processing module 700). Here, the data collection module 100, the index processing module 200, the search processing module 300, and the supplementary service provision module 400 are the same as those of FIG. 1, and a description thereof will be omitted.

심층 검색 처리 모듈(700)은, 사용자로부터 검색어가 입력될 경우(도 5의 S110), 입력된 검색어가 심층 검색을 명령하는 명령어를 포함하고 있지 아니한 단순 검색어인지, 또는 심층 검색을 명령하는 명령어를 포함하고 있는 명령형 검색어인지를 판독한 후, 판독된 검색어가 단순 검색어인 경우(도 5의 S120의 No의 경우) 도 1에서 상술한 바와 동일하게 검색 처리 모듈(300)을 통해 웹상에서 해당 검색어를 검색(도 5의 S130)하여 사용자에게 제공(도 5의 S140)하게 된다.5), the in-depth search processing module 700 determines whether the inputted search term is a simple search word that does not include an instruction for instructing a deep search or an instruction for instructing a deep search If the read query is a simple search term (No in S120 in FIG. 5), the search query module 300 searches the web for the search term in the same manner as described above with reference to FIG. (S130 in FIG. 5) and provides it to the user (S140 in FIG. 5).

만약, 사용자로부터 입력된 검색어에 심층 검색을 명령하는 명령형 검색어인 경우(도 5의 S120의 Yes의 경우), 심층 검색 처리 모듈(700)은, 명령형 검색어에 포함되어 있는 '대분류', '중분류', 및 '소분류'를 판독한 후, 사용자가 '대분류', '중분류', 및 '소분류' 를 특정하고 있는 경우 해당 '대분류' (도 5의 S160), '중분류' (도 5의 S170), 및 '소분류' (도 5의 S180)에 따른 검색을 실행하게 된다.5), the in-depth search processing module 700 determines whether or not the " major category ", " middle category ", " (S 160 in FIG. 5), 'middle classification' (S 170 in FIG. 5), and 'partial classification' (step S 160 in FIG. 5) when the user specifies 'large classification', 'middle classification' And " small classification " (S180 in FIG. 5).

이때, '대분류'는, 웹 상의 각 사이트들의 속성을 지칭하는 것으로, 예를 들어, 사진, 운동, 여행 또는 맛집과 같이 각각의 분류들이 해당 속성을 가지고 있는 특정 '중분류'를 포함하고 있는 가장 큰 카테고리를 지칭할 수 있다.In this case, 'major category' refers to the property of each site on the web. For example, each category such as photograph, movement, travel, or restaurant has the largest Category. ≪ / RTI >

예를 들어, 속성이 사진인 경우, 사진 관련 정보를 다수 포함하고 있는 'SLRCLUB', '팝코넷', 기타 사진 카페 또는 사진 블로그 등이 '대분류'에 해당할 수 있다.For example, if the attribute is a photograph, 'SLRCLUB', 'popcornet', other photo cafes or photo blogs, which contain a lot of photograph related information, may correspond to 'major category'.

'중분류'는, '대분류'에 해당하는 사이트를 이루고 있는 각각의 자유게시판, 질문게시판, 포럼, 또는 공지게시판 등을 지칭하는 것으로, 사이트를 이루고 있는 사이트맵(site map) 상에서 사용자 혹은 크롤러가 해당 웹사이트를 이용할 때 웹사이트의 접근 가능한 페이지의 목록을 지칭한다. 'Sub-category' refers to each free bulletin board, question bulletin board, forum, or bulletin board that constitute the site corresponding to 'major category', and the user or the crawler is notified on the site map that constitutes the site. Refers to a list of accessible pages of a website when using the website.

'소분류'는, 해당 사이트에서 사용자가 검색하고자 하는 검색어를 지칭한다.A "small category" refers to a search term that a user wants to search for in the site.

좀 더 자세하게 살펴보면, 사용자가 "사진 사이트의 사진게시판에서 강아지를 검색해줘"라는 검색어가 입력된 경우, "사진 사이트"가 '대분류'가 될 것이고, "사진게시판"이 '중분류'가 될 것이며, "강아지"가 '소분류'가 될 것이다.In more detail, if a user inputs a search term such as "Search dogs on a photo bulletin board on a photo site," the "photo site" will be a "major category," a "photo bulletin board" The "puppy" will become a "small category".

그리고, 입력된 검색어가 단순 검색어인지 또는 명령형 검색어인지는, 해당 검색어의 말미에 위치하는 단어의 형태를 통해 판독하게 된다.Whether the inputted search term is a simple search term or an imperative search term is read through the type of a word located at the end of the search term.

상기 예의 경우에는, 말미에 "검색해줘"라는 명령어가 위치하는 바, 심층 검색 처리 모듈(700)은, 해당 명령어를 통해 명령형 검색어 여부를 판단하게 된다.In the case of the above example, a command "search" is placed at the end, and the in-depth search processing module 700 determines whether the command is an imperative search word through the command.

이러한, 단어의 형태 판독은, 상술한 색인 처리 모듈(200)의 형태소 분석기에 의해 수행될 수도 있다.This type of word reading may be performed by the morpheme analyzer of the index processing module 200 described above.

다음으로, 사용자가 "사진 사이트의 사진게시판에서 강아지를 검색해줘"라는 검색어를 입력한 경우, '대분류'에서 사이트를 특정하지 아니하고, 단순히 속성만을 특정하고 있는바, 심층 검색 처리 모듈(700)은, "사진 사이트"에 해당할 수 있는 검색 가능한 모든 사이트를 검색하게 될 것이고, 검색된 각각의 사이트의 "사진게시판"에서 "강아지"를 검색하게 될 것이다.Next, when the user inputs a search word " Search dogs on a photo bulletin board on a photo site ", the in-depth search processing module 700 specifies only the attributes without specifying the site in the & Will search all searchable sites that may correspond to "photo sites", and will search for "dogs" in "photo bulletin boards" of each site searched.

이때, 사용자로서는 "사진게시판" 대신 다른 페이지(예를 들어, "포럼", "장터" 또는 "공지게시판" 등)를 지정하여도 무방하다At this time, the user may designate another page (for example, "forum "," marketplace "or" bulletin board "

만약, 사용자로부터 "SLRCLUB 의 사진게시판에서 강아지를 검색해줘"와 같이 사용자로부터 사진의 속성을 가지는 특정 사이트인 "SLRCLUB"이 '대분류'로 특정된 경우라면, 심층 검색 처리 모듈(700)은, "사진 사이트"에 해당할 수 있는 검색 가능한 모든 사이트를 검색하는 대신 "SLRCLUB"만을 검색하여 진입할 것인 바, 사용자로부터 '대분류'가 특정되지 아니한 경우보다 월등히 빠른 시간 내에 검색이 완료할 수 있을 것이다.If the specific site "SLRCLUB" having the photo attribute from the user is specified as "major category", such as "retrieve the dog from the photo bulletin board of the SLRCLUB" from the user, the in-depth search processing module 700 sets " Quot; SLRCLUB "instead of searching all searchable sites corresponding to the " photo site ", it is possible to complete the search much faster than when the " .

일 실시예에서, 심층 검색 처리 모듈(700)은, 사용자로부터 '대분류'가 특정되지 아니하고 속성만 특정된 명령형 검색어가 입력된 경우, 상술한 바와 같이'대분류'에 해당하는 검색 가능한 사이트 및 해당 사이트에서 검색된 검색 결과를 일괄하여 사용자에게 출력하는 대신, '대분류'에 해당하는 검색 가능한 사이트를 일차적으로 출력하여 검색하고자 하는 사이트를 사용자로 하여금 선택하도록 요청한 후, 사용자로부터 선택 받은 사이트만을 검색함으로써 검색에 소요되는 시간과 자원을 줄이도록 할 수 있다.In one embodiment, when the 'major category' is not specified by the user and an imperative search term in which only the attribute is specified is input, the in-depth search processing module 700 searches the searchable site corresponding to 'major category' Instead of collectively outputting the search results retrieved from the user, a searchable site corresponding to the 'major classification' is firstly output to request the user to select a site to be searched, Time and resources can be reduced.

다만, 심층 검색 처리 모듈(700)은, 명령어를 포함하고 있는 명령형 검색어 자체가 검색이 요청된 단어인지를 먼저 판독한 후, 해당 명령어에 대한 검색 결과가 없는 경우에 한하여(도 5의 S150의 Yes의 경우) 상술한 바와 같이 명령형 검색어의 검색 과정을 거침으로써, 사용자의 검색 요청에 보다 부합하게 검색을 수행하게 된다.However, the in-depth search processing module 700 first reads whether the imperative search word itself including the command is a word for which a search is requested, and then, if there is no search result for the command word (Yes in S150 in FIG. 5) ) As described above, by performing the search process of the imperative search word, the search is more performed in accordance with the user's search request.

도 1 내지 5에 도시되어 있지 않지만, 본 발명에 따른 통합 검색 서비스 제공 시스템은 자동 언어 변환 검색 모듈을 더 포함한다. 통합 검색 서비스 제공 시스템은 통합 검색 서비스에 로그인한 사용자가 통합 검색 서비스에 접속한 컴퓨팅 장치의 지피에스 모듈이 수집한 위치 정보에 기초하여 상기 사용자가 상기 통합 검색 서비스에 접속 시점 별 국가 정보를 추출하여 접속시점이 많은 순서대로 5개의 국가를 추출하고, 상기 사용자로부터 검색어가 입력되고 5초 이내에 검색 요청이 없으면 접속시점이 제일 많은 국가 언어로 된 검색 결과를 제공하고, Although not shown in FIGS. 1 to 5, the integrated search service providing system according to the present invention further includes an automatic language translation search module. The integrated search service providing system extracts country information by time of access to the integrated search service based on the location information collected by the GPS module of the computing device connected to the integrated search service by the user logged into the integrated search service, Extracting five countries in ascending order of time, providing a search result in a national language having the highest access time when a search word is input from the user and there is no search request within five seconds,

상기 접속시점이 제일 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 1분 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 두번째로 많은 국가 언어로 된 검색 결과를 제공하고,If the search result is not selected from the user within one minute from the time of providing the search result in the country language in which the connection time is the largest, the connection point provides search results in the second largest number of national languages,

상기 접속시점이 두번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 50초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 세번째로 많은 국가 언어로 된 검색 결과를 제공하고,If the search result is not selected from the user within 50 seconds from the time when the connection time is provided in the second largest number of national languages, the connection time point provides search results in the third largest number of national languages,

상기 접속시점이 세번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 40초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 네번째로 많은 국가 언어로 된 검색 결과를 제공하고,If the search result is not selected from the user within 40 seconds from the time when the search result in the third largest number of national languages is provided, the connection point provides search results in the fourth largest number of national languages,

상기 접속시점이 네번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 40초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 다섯번째로 많은 국가 언어로 된 검색 결과를 제공하고,If the search result is not selected from the user within 40 seconds from the time when the connection time is provided in the fourth largest number of national languages,

상기 접속시점이 다섯번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 30초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 국가 선택 탭을 제공하는 자동 언어 변환 검색 모듈을 더 포함한다.And an automatic language conversion search module for providing a country selection tab when there is no selection of the search result from the user within 30 seconds from the time when the connection time is the fifth largest in the national language.

사용자가 사용하는 컴퓨팅 장치는 지피에스(GPS) 모듈이 내장되어 사용자가 통합 검색 서비스에 접속한 시점에 따른 위치를 통합 검색 서비스 제공 시스템으로 제공한다. 이에 따라, 자동 언어 변환 검색 모듈은 로그인한 사용자가 통합 검색 서비스에 접속한 컴퓨팅 장치의 지피에스 모듈이 수집한 위치 정보에 기초하여 상기 사용자가 상기 통합 검색 서비스에 접속 시점 별 국가 정보를 추출할 수 있다. 만약 사용자가 미국에서 상기 통합 검색 서비스에 10번 접속하고, 중국에서 9번 접속하고, 일본에서 5번접속하고, 배트남에서 3번 접속하고, 프랑스에서 2번 접속했다면, 상기 자동 언어 변환 검색 모듈은 접속시점이 많은 순서대로 5개의 국가인 미국, 중국, 일본, 배트남, 프랑스를 추출한다.A computing device used by a user has a built-in GPS module and provides a location according to a point of time when a user accesses the integrated search service as an integrated search service providing system. Accordingly, the automatic language translation search module can extract the country information by the time of access to the integrated search service based on the location information collected by the GPS module of the computing device connected to the integrated search service by the logged-in user . If the user accesses the integrated search service 10 times in the United States, 9 times in China, 5 times in Japan, 3 times in Vietnam, and 2 times in France, the automatic language translation search module We extract five countries: USA, China, Japan, Vietnam, France.

사용자로부터 검색어가 입력되었다는 것은 검색창에 검색어가 입력되었다는 것이다. 그리고, 검색 요청은 상기 검색어를 입력하고 엔터, 확인등의 추가적인 요청 신호가 입력된 것이다. 종래 기술에 따르면 사용자가 검색어만 입력한 상태에서 아무리 많은 시간이 경과하더라도 아무런 결과를 제공하지 않는다.The input of a search word from the user means that the search word is entered in the search window. The search request is input to the search word, and an additional request signal such as enter and confirm is input. According to the related art, no matter how much time elapses while the user inputs only the search word, no result is provided.

그리나 본 발명에 따르면, 상기 사용자로부터 검색어가 입력되고 5초 이내에 검색 요청이 없으면 접속시점이 제일 많은 국가 언어로 된 검색 결과를 제공한다. 전술한 예를 이어서 설명하면 접속시점이 제일 많은 국가 언어인 영어로 된 검색 결과를 제공한다.However, according to the present invention, if a search word is input from the user and there is no search request within five seconds, a search result in the national language having the largest access time is provided. The above-described example will be described in the following, which provides search results in English, which is the national language having the highest connection time.

그리고, 상기 접속시점이 제일 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 1분 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 두번째로 많은 국가 언어로 된 검색 결과를 제공한다. 사용자는 본인이 원하는 검색결과가 나오지 않으면, 검색 결과를 선택하지 않을 것이다. 이 경우 기설정된 시간인 1분이 소요되면 접속시점이 두번째로 많은 국가 언어인 중국어로 된 검색 결과를 제공한다. 같은 방식으로 접속시점이 세번째, 네번째 그리고 다섯번째로 많은 국가 언어로 된 검색 결과를 제공한다. 이때, 접속 시점에서의 국가에 기초하여 사용자의 상기 국가의 방문 횟수를 가늠할 수 있고, 사용자의 방문 횟수가 적은 국가 일수록 방문 횟수가 많은 국가 보다 상대적으로 관심이 떨어진다고 볼 수 있기 때문에 다음 검색 결과를 제공하는 기준 시간은 점점 짧아진다. 그리고 다섯번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 30초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 국가 선택 탭을 제공하여 사용자가 원하는 국가 언어로된 검색 결과를 제공할 수 있도록 한다.If there is no selection of the search result from the user within one minute from the time of providing the search result in the country language in which the connection time is the largest, the connection point provides search results in the second largest number of national languages. The user will not select a search result unless the desired search result is displayed. In this case, when the preset time is 1 minute, the search result is provided in Chinese, which is the second most frequently used language. In the same way, the connection point provides search results in the third, fourth and fifth country languages. At this time, it is possible to determine the number of visits of the user in the country based on the country at the time of connection, and since the country having a smaller number of visits by the user can be regarded as a relatively less interested country than the country with a large number of visits, The reference time to be set becomes shorter. And, if there is no selection of the search result from the user within 30 seconds from the time when the fifth search result of the national language is provided, the country selection tab is provided so that the user can provide the search result in the desired national language .

포탈에서 제공하고 있는 기존의 검색 서비스 또는 지식 답변 서비스의 경우, 사용자로서는 검색 엔진에 의해 포괄적으로 검색된 결과를 일괄적으로 제공받거나, 국내 포털사이트인 "네이버"의 "지식인"과 같이 검색 엔진 자체가 아닌 해당 서비스를 이용하고 있는 개인의 답변에 의존할 수 밖에 없었다.In the case of the existing search service or knowledge response service provided by the portal, the user may be provided with a comprehensive search result by the search engine collectively or the search engine itself such as "intellectual" of the domestic portal site "Naver" I was forced to rely on an answer from the individual who is using the service.

그러나, 상술한 바와 같은 구성을 가지는 통합 검색 서비스 제공 시스템(20)은, 사용자가 검색하고자 하는 검색 속성, 검색 사이트, 검색 사이트 내의 검색 페이지까지 특정하여 검색을 할 수 있는 심층적이고 보다 세분화된 검색 서비스를 제공함으로써, 기존의 검색 엔진 또는 지식 답변 서비스에서 제공하지 못하였던 사용자 맞춤형 검색 서비스를 제공할 수 있다.However, the integrated search service providing system 20 having the above-described configuration is capable of searching for a search page in a search attribute, a search site, and a search site to be searched by a user, It is possible to provide a user-customized search service which has not been provided by the existing search engine or knowledge response service.

이상에서는 실시예들을 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.It will be apparent to those skilled in the art that various modifications and variations can be made in the present invention without departing from the spirit or scope of the present invention as defined by the following claims. You will understand.

100: 자료 수집 모듈
200: 색인 처리 모듈
300: 검색 처리 모듈
400: 부가 서비스 제공 모듈
500: 인메모리 검색 모듈
600: 랜섬웨어 차단 모듈
700: 심층 검색 처리 모듈
100: Data Acquisition Module
200: Index processing module
300: Search processing module
400: Additional service provision module
500: In-Memory Search Module
600: Ransomware blocking module
700: Deep search processing module

Claims (2)

자료 수집기를 이용하여 웹상의 데이터베이스로부터 검색 대상을 수집하거나, 첨부파일을 수집하는 자료 수집 모듈;
상기 자료 수집 모듈에서 수집된 자료를 한글 형태소 분석기를 이용하여 문서 필터링 및 데이터 색인 처리를 수행하는 색인 처리 모듈;
표준 Xml 기반의 검색 인터페이스로 구동되며, 사용자로부터 검색이 요청된 검색어를 연산자 처리한 후, 상기 색인 처리 모듈에서 색인 처리된 자료 중에서 검색어에 해당하는 자료를 검색하여 검색 결과를 처리하는 검색 처리 모듈;
스펠링 체크, 검색어 자동 완성, 검색어 추천, 최근 검색어 제공, 인기 검색어 제공, 개인화 기능 제공 및 개체 추출 기능을 포함하는 부가 서비스를 제공하는 부가 서비스 제공 모듈; 및
상기 자료 수집 모듈에서 수집된 자료의 타이틀, 작성자 및 상품명을 추출한 후 색인 하여 자신의 메모리 상에 저장해 두며, 사용자로부터 해당 저장된 자료에 대한 검색 요청이 있는 경우 상기 검색 처리 모듈에 우선하여 검색 결과를 처리하여 사용자에게 제공하는 인메모리 검색 모듈을 포함하되,
통합 검색 서비스에 로그인한 사용자가 통합 검색 서비스에 접속한 컴퓨팅 장치의 지피에스 모듈이 수집한 위치 정보에 기초하여 상기 사용자가 상기 통합 검색 서비스에 접속 시점 별 국가 정보를 추출하여 접속시점이 많은 순서대로 5개의 국가를 추출하고, 상기 사용자로부터 검색어가 입력되고 5초 이내에 검색 요청이 없으면 접속시점이 제일 많은 국가 언어로 된 검색 결과를 제공하고,
상기 접속시점이 제일 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 1분 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 두번째로 많은 국가 언어로 된 검색 결과를 제공하고,
상기 접속시점이 두번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 50초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 세번째로 많은 국가 언어로 된 검색 결과를 제공하고,
상기 접속시점이 세번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 40초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 네번째로 많은 국가 언어로 된 검색 결과를 제공하고,
상기 접속시점이 네번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 40초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 접속시점이 다섯번째로 많은 국가 언어로 된 검색 결과를 제공하고,
상기 접속시점이 다섯번째로 많은 국가 언어로 된 검색 결과를 제공한 시점으로부터 30초 이내에 사용자로부터 상기 검색 결과에 대한 선택이 없으면 국가 선택 탭을 제공하는 자동 언어 변환 검색 모듈을 더 포함하는,
통합 검색 서비스 제공 시스템.


A data collection module for collecting search objects or collecting attached files from a database on the web using a data collector;
An index processing module for performing document filtering and data indexing processing on data collected by the data collection module using a Korean morphological analyzer;
A search processing module driven by a search interface based on a standard Xml and processing an operator of a search word requested by a user and then processing data corresponding to a search term among the data processed by the index processing module and processing a search result;
An additional service providing module for providing an additional service including a spell check, an automatic completion of a search word, a search word recommendation, a recent search word provision, a popular search word provision, a personalization function, and an object extraction function; And
The title, the creator, and the product name of the collected data in the data collection module are extracted and stored in the memory of the user. If there is a request for retrieving the stored data from the user, the search result is preferentially processed And providing an in-memory search module to the user,
The user extracts the country information for each connection time point in the integrated search service based on the location information collected by the GPS module of the computing device connected to the integrated search service by the user logged into the integrated search service, If a search word is input from the user and there is no search request within 5 seconds, a search result in a country language having the highest connection point is provided,
If the search result is not selected from the user within one minute from the time of providing the search result in the country language in which the connection time is the largest, the connection point provides search results in the second largest number of national languages,
If the search result is not selected from the user within 50 seconds from the time when the connection time is provided in the second largest number of national languages, the connection time point provides search results in the third largest number of national languages,
If the search result is not selected from the user within 40 seconds from the time when the search result in the third largest number of national languages is provided, the connection point provides search results in the fourth largest number of national languages,
If the search result is not selected from the user within 40 seconds from the time when the connection time is provided in the fourth largest number of national languages,
Further comprising an automatic language translation search module for providing a country selection tab if there is no selection of the search result from the user within 30 seconds from the time when the connection time is provided in the fifth largest number of national languages.
Integrated search service delivery system.


삭제delete
KR1020180059329A 2018-05-25 2018-05-25 Integrated Search Service Providing System KR101910191B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180059329A KR101910191B1 (en) 2018-05-25 2018-05-25 Integrated Search Service Providing System

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180059329A KR101910191B1 (en) 2018-05-25 2018-05-25 Integrated Search Service Providing System

Publications (1)

Publication Number Publication Date
KR101910191B1 true KR101910191B1 (en) 2018-10-19

Family

ID=64102209

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180059329A KR101910191B1 (en) 2018-05-25 2018-05-25 Integrated Search Service Providing System

Country Status (1)

Country Link
KR (1) KR101910191B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210071500A (en) 2019-12-06 2021-06-16 주식회사 클리노믹스 Apparatus and method for providing search service based on artificial intelligence

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210071500A (en) 2019-12-06 2021-06-16 주식회사 클리노믹스 Apparatus and method for providing search service based on artificial intelligence

Similar Documents

Publication Publication Date Title
KR100462292B1 (en) A method for providing search results list based on importance information and a system thereof
JP5112324B2 (en) Search on structured data
US9934315B2 (en) Method and system for web searching
JP5608286B2 (en) Infinite browsing
US7899829B1 (en) Intelligent bookmarks and information management system based on same
US8533199B2 (en) Intelligent bookmarks and information management system based on the same
US7331517B2 (en) Article reader program, article management method and article reader
US8880559B2 (en) Location activity search engine computer system
US9619571B2 (en) Method for searching related entities through entity co-occurrence
US9043413B2 (en) System and method for extracting, collecting, enriching and ranking of email objects
JP2009512953A (en) Adding attributes and labels to structured data
US20080065632A1 (en) Server, method and system for providing information search service by using web page segmented into several inforamtion blocks
EP1716511A1 (en) Intelligent search and retrieval system and method
US20110072025A1 (en) Ranking entity relations using external corpus
US20140101122A1 (en) System and method for collaborative structuring of portions of entities over computer network
US20150206101A1 (en) System for determining infringement of copyright based on the text reference point and method thereof
EP2933734A1 (en) Method and system for the structural analysis of websites
US10417334B2 (en) Systems and methods for providing a microdocument framework for storage, retrieval, and aggregation
KR101556743B1 (en) Apparatus and method for generating poi information based on web collection
TWI682286B (en) System for document searching using results of text analysis and natural language input
JP2007193697A (en) Information collection apparatus, information collection method and program
KR101910191B1 (en) Integrated Search Service Providing System
JP4469432B2 (en) INTERNET INFORMATION PROCESSING DEVICE, INTERNET INFORMATION PROCESSING METHOD, AND COMPUTER-READABLE RECORDING MEDIUM CONTAINING PROGRAM FOR CAUSING COMPUTER TO EXECUTE THE METHOD
US8612431B2 (en) Multi-part record searches
KR101900727B1 (en) Virtual server managing apparatus

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant