KR101021022B1 - 맞춤형 검색서비스 제공장치 및 그 방법 - Google Patents

맞춤형 검색서비스 제공장치 및 그 방법 Download PDF

Info

Publication number
KR101021022B1
KR101021022B1 KR20080127443A KR20080127443A KR101021022B1 KR 101021022 B1 KR101021022 B1 KR 101021022B1 KR 20080127443 A KR20080127443 A KR 20080127443A KR 20080127443 A KR20080127443 A KR 20080127443A KR 101021022 B1 KR101021022 B1 KR 101021022B1
Authority
KR
South Korea
Prior art keywords
search
schema
data
field
client
Prior art date
Application number
KR20080127443A
Other languages
English (en)
Other versions
KR20100068925A (ko
Inventor
박경재
Original Assignee
주식회사 엔씨소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 엔씨소프트 filed Critical 주식회사 엔씨소프트
Priority to KR20080127443A priority Critical patent/KR101021022B1/ko
Publication of KR20100068925A publication Critical patent/KR20100068925A/ko
Application granted granted Critical
Publication of KR101021022B1 publication Critical patent/KR101021022B1/ko

Links

Images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Software Systems (AREA)

Abstract

본 발명은 맞춤형 검색서비스 제공장치 및 그 방법에 관한 것으로 클라이언트가 데이터 스키마를 정의하는 단계; 클라이언트가 상기 정의된 데이터 스키마의 각 필드를 대상으로 검색 스키마를 정의하는 단계; 클라이언트가 서버로 데이터 스키마에 대응하는 데이터를 전송하는 단계; 서버가 전송받은 데이터 및 상기 정의된 검색 스키마를 이용하여 역색인을 생성하는 단계; 및 서버가 역색인 및 정의된 검색 스키마를 이용하여 상기 전송받은 데이터에 대한 검색서비스를 제공하는 단계;로 이루어지는 것을 특징으로 한다.
데이터 스키마(Data Schema), 검색 스키마(Search Schema), 역색인(Inverted Index), 검색엔진(Search Engine)

Description

맞춤형 검색서비스 제공장치 및 그 방법{APPARATUS AND METHOD FOR PROVIDING CUSTOMIZED SEARCH ENGINE}
본 발명은 클라이언트마다의 맞춤형 검색엔진을 제공하기 위한 장치 및 그 방법에 관한 것이다.
검색 엔진은 광의로는 인터넷 상에서 정보를 수집하고 찾아주는 시스템을 말하는데, 요즘은 주로 인터넷 상의 웹 페이지들을 크롤링(Crawling)하여 특정 검색어(Query)를 입력받으면 해당 검색어와 관련된 웹 페이지들을 결과값으로 보여주는 시스템을 지칭한다.
한편, 구글(www.google.com)과 같이 최종 사용자(End User)를 위한 검색엔진이외에도 수많은 컨텐츠를 보유하는 웹 사이트들은 자신들을 위한 독자적인 검색엔진 또는 검색서비스가 필요하다.
물론, 게시판에 등록된 게시물을 대상으로 특정 검색어가 포함된 게시물들을 검색해주는 등의 기본적인 검색기능은 널리 이용되고 있으나, 데이터의 형태가 다양하고 양이 방대한 대형 웹 사이트들을 위주로 입력되는 검색어의 특징이나, 기대되는 검색결과에 특징에 맞춰 커스터마이징된 검색엔진을 구축할 필요성이 제기되 었다.
종래에는 전문가가 해당 웹 사이트를 분석하여 보유하고 있는 데이터가 어떠한 것인지를 정의한 다음 개별적으로 개발을 하는 것이 일반적이었으나, 모든 공정이 수작업으로 이루어지기 때문에 매우 비효율적이었을 뿐만 아니라, 케이스 바이 케이스로 매번 다른 접근방식으로 개발이 이루어지기 때문에 경제성 뿐만 아니라 검색엔진의 기술적 완성도의 측면에서도 편차가 극심하다는 문제가 있다.
본 발명은 상기와 같은 문제점을 해소하기 위하여 안출된 것으로, 서버에 접속하여 데이터 스키마 및 검색 스키마를 정의하고 데이터 스키마에 대응하는 데이터를 전송함으로써 맞춤형 검색엔진의 구축 및 검색서비스를 가능토록하는 장치 및 방법의 제공을 목적으로 한다.
상기와 같은 목적을 달성하기 위한 본 발명의 맞춤형 검색서비스 제공장치는 클라이언트로부터 인터넷 망을 통해 데이터 스키마 및 검색 스키마 정의를 입력받고, 데이터를 전송받는 인터페이스부;
클라이언트로부터 전송받은 데이터를 저장하는 데이터 저장부;
상기 검색 스키마를 이용하여 상기 전송받은 데이터로부터 역색인을 생성하 는 인덱스 생성부;
상기 검색 스키마를 이용하여 검색규칙을 생성하는 검색규칙 생성부; 및
상기 역색인과 상기 검색규칙을 이용하여 상기 전송받은 데이터에 대한 검색을 수행하는 검색부;를 구비하는 것을 특징으로 한다.
한편, 상기와 같은 목적을 달성하기 위한 본 발명의 검색서비스 제공방법은 클라이언트가 데이터 스키마를 정의하는 단계;
클라이언트가 상기 정의된 데이터 스키마의 각 필드를 대상으로 검색 스키마를 정의하는 단계;
클라이언트가 서버로 데이터 스키마에 대응하는 데이터를 전송하는 단계;
서버가 전송받은 데이터 및 상기 정의된 검색 스키마를 이용하여 역색인을 생성하는 단계; 및
서버가 역색인 및 정의된 검색 스키마를 이용하여 상기 전송받은 데이터에 대한 검색서비스를 제공하는 단계;로 이루어지는 것을 특징으로 한다.
한편, 상기와 같은 목적을 달성하기 위한 본 발명의 검색서비스 제공방법은 클라이언트로부터 다수의 필드 및 각 필드의 속성을 포함하는 데이터 스키마 정의 및 상기 데이터 스키마의 각 필드에 대한 검색 스키마를 입력받는 단계;
상기 클라이언트로부터 상기 데이터 스키마에 대응하는 데이터를 전송받아 상기 검색 스키마를 이용하여 역색인을 생성하는 단계; 및
상기 클라이언트로부터 검색어를 입력받으면 상기 전송받은 데이터에 대하여 상기 역색인 및 상기 검색 스키마를 이용하여 검색을 수행하고, 검색결과를 리턴하는 단계;로 이루어지는 것을 특징으로 한다.
한편, 상기와 같은 목적을 달성하기 위한 본 발명의 검색서비스 제공방법은 인터넷망을 통해 서버로 접속하는 단계;
데이터 스키마를 정의하는 단계;
정의된 데이터 스키마의 각 필드를 대상으로 검색 스키마를 정의하는 단계;
데이터 스키마에 대응하는 데이터를 전송하는 단계;
인터넷망을 통해 서버로 검색어를 입력하는 단계; 및
서버로부터 상기 검색어를 이용한 상기 데이터에 대한 검색결과를 수신하여 디스플레이하는 단계;로 이루어지는 것을 특징으로 한다.
상기와 같은 본 발명에 의하면 막대한 개발비용과 오랜 개발기간을 들이지 않고도 보유하고 있는 데이터의 특징과 얻고자 하는 검색결과의 특징에 대한 다소의 설정만으로 커스터마이징된 검색엔진을 얻을 수 있다는 뛰어난 효과가 있다.
한편, 보유하고 있는 데이터들 가운데 어떠한 항목에 대하여 검색을 할 것인가를 결정할 수 있어 다양한 상황과 요구에 대처할 수 있는 맞춤형 검색서비스의 제공이 가능하다는 뛰어난 효과가 있다.
이하에서는 첨부하는 도면을 참조하여 본 발명에 의한 맞춤형 검색서비스 제공장치의 구성을 상세히 살펴보기로 한다. 도 1은 맞춤형 검색서비스 제공장치를 설명하는 기능블록도이며, 도 2는 데이터 스키마 및 검색 스키마를 개념적으로 설명하는 참고도이다.
도 1에 의하면 본 발명에 의한 맞춤형 검색서비스 제공장치(100)는 인터페이스부(110), 데이터 저장부(120), 인덱스 생성부(130), 검색규칙 생성부(140) 및 검색부(150)를 구비하며, 인터넷 망을 통해 클라이언트(200)와 연결된다.
클라이언트(200)는 인터넷을 통해 맞춤형 검색서비스 제공장치(100)에 접속하여 데이터 스키마를 정의하고, 정의한 데이터 스키마에 대한 검색 스키마를 정의한다. 이후, 정의된 데이터 스키마에 대응하는 데이터를 맞춤형 검색서비스 제공장치(100)로 전송하는데, 인터페이스부(110)는 클라이언트(200)로 데이터 스키마 및 검색 스키마의 입력, 데이터의 전송을 위한 인터페이스를 제공한다. 예들들어, 인터페이스부(110)는 웹 사이트로 구현되어, 해당 웹 사이트에 접속한 클라이언트(200)에게 데이터 스키마 및 검색 스키마의 입력을 위한 화면을 제공하고, 이후 데이터를 전송하도록 할 수 있다.
이때, 데이터 스키마(Data Schema)란 도 2에 도시된 바와 같이 클라이언트(200)마다의 맞춤형 검색엔진(Customized Search-Engine)을 구축하기 위하여 클라이언트(200)가 정의하는 것으로, 다수의 필드와 각 필드의 속성을 포함한 다.
도 2에 예시적으로 도시된 데이터 스키마는 "URL", "ID", "작성일자", "제목", "내용"이라는 5개의 필드를 가지며, 이들 각각의 필드는 "텍스트" 또는 "데이트"라는 속성을 갖는다. 도 2의 예에서는 "URL", "내용", "제목"은 "가변길이 텍스트", "ID"는 "고정길이 텍스트"로 정의되어 있음을 확인할 수 있다.
한편, 검색 스키마(Search Schema)는 이렇게 정의된 데이터 스키마의 각 필드에 대하여 해당 필드값이 검색엔진을 통한 검색대상인가 여부, 해당 필드값을 기준으로 검색결과를 정렬할 것인가 여부, 해당 필드값을 기준으로 검색결과를 필터링할 것인가 여부 그리고, 해당 필드값을 검색결과로 클라이언트(200) 화면상에 디스플레이할 것인가 여부를 포함한다.
도 2의 예에 의하면, "제목"필드는 검색대상이나, 정렬대상은 아니며, 필터링 대상은 아니나 디스플레이 대상임을 알 수 있으며, "ID"필드는 검색대상이며 디스플레이 대상이나, 정렬대상도 필터링 대상도 아님을 알 수 있다.
이는 클라이언트(200)로부터 전송받은 데이터 가운데 "제목" 필드에 속하는 값들은 검색대상이므로 후술하는 바와 같이 역색인을 생성하며, 맞춤형 검색엔진의 구축 이후 클라이언트(200)가 검색어를 입력하면 이를 이용하여 검색을 수행하되 그 검색결과들을 대상으로 "ID" 필드값을 기준으로 정렬하지는 않으며, 특정 "ID"값을 가지거나 갖지 않는 결과값을 제외하는 등의 필터링은 수행하지 않으나, 클라이언트(200)의 화면상에 검색결과를 디스플레이할 때에는 "ID"필드값을 디스플레이한다는 의미이다.
한편, 이러한 검색 스키마는 검색대상 필드에 대한 분석방법을 더 포함할 수 있다. 도 2의 예에 의하면 검색대상 필드에 대한 분석방법은 필드값을 형태소 분석기를 이용한 "형태소 분석", 필드값을 두음절로 쪼개는 "바이그램 분석", 또는 필드값을 그대로 검색대상으로 하는 "분석안함"의 3가지가 있다.
형태소 분석기를 사용할 것인가 또는 바이그램 분석을 할 것인가의 여부는 검색엔진의 업데이트 속도와 품질에 큰 영향을 줄 뿐만 아니라, 특정 검색어에 대해 어떠한 검색결과를 되돌려 줄 것인가를 결정짓는데 관여하므로 검색엔진의 커스터마이징이라는 관점에서 매우 중요하다.
데이터 스키마와 검색 스키마의 정의가 끝나면, 클라이언트(200)는 기정의한 데이터 스키마에 따르는 데이터를 전송하는데, 데이터 저장부(120)는 상기 클라이언트(200)로부터 전송받은 데이터를 저장한다. 후술하는 바와 같이 상기 데이터는 클라이언트(200)를 위한 맞춤형 검색엔진의 검색대상이 되는 로 데이터(Raw Data)이다.
한편, 인덱스 생성부(130)는 상기 데이터 저장부(120)에 저장된 데이터를 분석하여 역색인을 생성한다. 역색인(Inverted Index)이란 특정한 색인어가 어느 위치에 존재하는가를 저장하는 정보로 검색엔진은 이러한 역색인을 이용하여 검색어(Query)가 입력되었을때 검색대상 데이터 가운데 해당 색인어를 포함하는 결과값들만을 신속하게 추출하여 검색결과로 리턴할 수 있다.
이러한 인덱스 생성부(130)는 상기 데이터 저장부(120)에 저장된 데이터의 각 필드들 가운데서 검색 스키마를 참조하여 검색대상인 필드에 대하여 역색인을 생성한다.
도 2의 예에서, 클라이언트(200)가 정의한 검색 스키마에 의하면 "URL", "ID", "제목", "내용" 필드는 검색대상에 해당하므로, 인덱스 생성부(130)는 데이터 저장부(120)에 저장된 데이터에 대해 이들 필드값을 분석하여 역색인을 생성한다. 도 2의 예에 의하면, 이때 각 필드값을 분석하는 방법은 검색 스키마에 의해 정의된 바에 따라 "제목"과 "내용"에 대해서는 형태소 분석을 거치되, "URL"과 "ID"에 대해서는 필드값을 그대로 검색대상으로 삼는다.
한편, 검색규칙 생성부(140)는 데이터 스키마의 각 필드에 대해 정의된 검색 스키마를 이용하여 검색규칙을 생성한다. 이때, 검색규칙은 검색결과에 대하여 특정 필드값을 기준으로 정렬할 것인가 여부, 필터링을 할 것인가 여부, 클라이언트(200)의 검색결과 화면상에 디스플레이할 것인가 여부를 포함한다.
검색을 위한 데이터의 저장, 데이터 스키마와 검색 스키마의 정의, 역색인과 검색규칙의 생성이 완료되면 클라이언트(200)를 위한 맞춤형 검색엔진의 구축이 완료되는데, 검색부(150)는 클라이언트(200)로부터 검색어를 입력받아, 해당 검색어를 이용하여 데이터 저장부(120)에 저장된 데이터로부터 역색인을 이용 검색을 수행하고, 검색결과를 상기 검색규칙을 이용하여 정렬하거나, 필터링하고 디스플레이 여부를 결정하여 클라이언트(200)로 리턴한다.
이러한 검색부(150)를 통해 클라이언트(200)는 자신만의 맞춤형 검색서비스를 제공받을 수 있게 된다.
이하에서는, 도 3을 참조하여 본 발명에 의한 맞춤형 검색서비스 제공방법의 일측면을 설명하기로 한다. 단, 상기에서 설명한 바와 중복되는 사항은 생략한다.
우선, 클라이언트(200)가 인터넷 망을 통해 맞춤형 검색서비스 제공장치 서버(100)로 접속하여 데이터 스키마를 정의한다(S110). 데이터 스키마의 정의란 도 2에 도시된 와 같이 다수의 필드를 정의하고, 정의된 각 필드의 속성을 정의함으로써 이루어진다.
이후, 클라이언트(200)가 정의된 데이터 스키마의 각 필드를 대상으로 검색 스키마를 정의한다(S120). 도 2의 예에서 살펴본 바와 같이 데이터 스키마의 각 필드에 대해 정렬대상인가 여부, 검색대상인가의 여부, 필터링 여부, 디스플레이 여부를 각각 정의함으로써 이루어진다.
나아가, 검색대상 필드에 대해서는 그 분석방법을 더 정의할 수 있으며, 바람직하게는 형태소 분석, 바이그램 분석, 분선안함의 세가지 가운데 어느 하나를 선택함으로써 정의할 수 있다.
이렇게 클라이언트(200)의 독자적인 데이터 스키마와 검색 스키마가 정의되면 서버(100)로 데이터 스키마에 대응하는 데이터를 전송한다(S130). 데이터 스키마에 대응하는 데이터란, 데이터 스키마에 의해 정의되는 각 필드로 이루어지되 각 필드는 데이터 스키마에 의해 정의된 속성을 갖는 데이터를 의미한다. 도 2의 예를 들자면, 클라이언트(200)가 서버(100)로 전송하는 데이터는 "URL", "ID", "작성일자", "제목", "내용"이라는 필드를 가지며, 각 필드들은 도 2에 도시된 바와 같은 속성을 갖는 것을 의미한다. 즉, 서버(100)가 해당 데이터를 데이터 스키마에 의해 인식할 수 있는 것이어야 한다는 것이다.
이후, 서버(100)가 S130 단계에서 전송받은 데이터 및 S120 단계에서 정의된 검색 스키마를 이용하여 역색인을 생성한다(S140). 이에 의해 클라이언트(200)를 위한 맞춤형 검색엔진의 구축이 이루어진다.
이후, 클라이언트(200)로부터 검색어(Query)를 입력받으면 상기 생성된 역색인과 검색 스키마를 이용하여 S130 단계에서 전송받은 데이터를 대상으로 검색을 수행하고, 그 결과를 리턴한다(S150).
이하에서는, 도 4를 참조하여 본 발명에 의한 맞춤형 검색서비스 제공방법의 일측면을 서버(100)의 관점에서 설명하기로 한다.
우선, 맞춤형 검색서비스 제공장치 서버(100)가 클라이언트(200)로부터 다수의 필드 및 각 필드의 속성을 포함하는 데이터 스키마 정의 및 상기 데이터 스키마의 각 필드에 대한 검색 스키마를 입력받는다(S210).
검색 스키마는 상기 데이터 스키마 각 필드에 대한 정렬대상 여부, 검색대상 여부, 필터링 여부, 디스플레이 여부를 포함한다. 필요에 따라서는 검색대상 필드에 대한 분석방법을 더 포함할 수도 있다.
이후, 클라이언트로(200)부터 데이터 스키마에 대응하는 데이터를 전송받아, S210 단계에서 입력받은 검색 스키마를 이용하여 역색인을 생성한다(S220).
역색인의 생성은 검색 스키마에 의할 때 검색대상인 필드의 필드값에 대하여 특정한 색인어가 발생한 위치를 저장함으로써 이루어진다. 한편, 검색 스키마에 의해 형태소 분석 또는 바이그램 분석이 행해지는 것으로 정의되는 필드의 경우, 해당 필드값에 대한 분석결과 및 형태소 분석기를 이용하지 않는 검색대상 필드의 필드값들을 그대로 이용하여 색인어의 위치를 저장함으로써 역색인을 생성한다.
그런 다음, 클라이언트로부터 검색어를 입력받으면 역색인 및 검색 스키마를 이용하여 상기 데이터에 대한 검색을 수행하고, 검색결과를 리턴한다(S230).
그 과정을 자세히 살펴보면, 먼저 상기 S220 단계에서 전송받은 데이터에 대하여 상기 생성된 역색인을 이용하여 검색을 수행하되, 각 필드에 대한 필터링 여부에 따라 필터링(예를들어, "작성일자" 필드값이 20080101 이전인 것을 제외)하고, 그 검색결과에 대하여 정렬대상 여부에 따라 정렬(예를들어, "ID"순으로 정렬)하며, 디스플레이 여부(예를들어, 검색결과 가운데 "작성일자"는 디스플레이하지 않음)에 따라 클라이언트(200)의 화면상에 디스플레이할 것인가 여부를 결정함으로써 검색결과를 재구성한 다음 이를 클라이언트(200)로 리턴한다.
이하에서는, 도 5를 참조하여 본 발명에 의한 맞춤형 검색서비스 제공방법의 일측면을 클라이언트(200)의 관점에서 설명하기로 한다.
우선, 인터넷망을 통해 서버(100)로 접속한다(S310).
이후, 클라이언트(200)는 데이터 스키마를 정의(S320)하고, 정의된 데이터 스키마의 각 필드를 대상으로 검색 스키마를 정의(S330)하는데, 예를들어 설명하자면 이 과정은 서버(100)의 웹 사이트에 접속하여 해당 웹 사이트를 통해 제공되는 인터페이스 화면을 통해 다수의 필드와 해당 필드의 속성을 정의함으로써 데이터 스키마를 정의하고, 이후 각각의 필드들이 검색대상인가, 정렬대상인가, 필터링대상인가 그리고 디스플레이 대상인가 여부를 설정함으로써 이루어질 수 있다.
이후, 클라이언트(200)는 데이터 스키마에 대응하는 데이터를 서버(100)로 전송(S340)한다. 서버(100)에서 상기 클라이언트(200)를 위한 맞춤형 검색엔진의 구축이 완료되면 다음과 같은 과정을 거쳐 검색 서비스를 이용할 수 있다.
우선, 클라이언트(200)가 인터넷망을 통해 서버(100)로 검색어를 입력(S350)한 다음, 서버(100)가 상기 검색어를 이용하여 S340 단계에서 전송한 데이터에 대한 검색결과를 리턴하면 이를 수신하여 화면상에 디스플레이(S360)한다.
이에 의하여 클라이언트(200)는 자신이 보유한 데이터에 따라 데이터 스키마를 정의하고, 더 나아가 검색을 위한 검색 스키마를 설정한 다음 데이터를 서버(200)로 전송하는 것만으로 자신을 위한 맞춤형 검색엔진을 가질 수 있게 된다. 이때, 맞춤형(Customized)이라는 것은 검색대상 데이터가 클라이언트(200)의 고유한 것이며, 해당 데이터를 위한 데이터 스키마를 클라이언트(200)가 독자적으로 정의할 수 있다는 것에서 더 나아가, 데이터 스키마에 포함되는 각 필드들에 대해 클라이언트(200)가 검색 스키마를 결정함으로써 클라이언트(200)가 원하는 방식 에 의해 검색엔진의 검색결과가 나오도록 유도할 수 있다는 의미이다.
이상 몇가지의 실시예를 들어 본 발명을 상세히 살펴보았으나 본 발명은 이러한 실시예에 국한되지 아니하며, 특허청구범위에 기재된 기술적 사상의 범위내에서 자유롭게 변형 실시될 수 있고 해석될 수 있다.
도 1은 본 발명에 의한 맞춤형 검색서비스 제공장치를 설명하는 기능블록도이며,
도 2는 데이터 스키마 및 검색 스키마를 개념적으로 설명하는 참고도이며,
도 3은 본 발명의 맞춤형 검색서비스 제공방법의 일측면을 시계열적으로 도시하는 플로우차트이며,
도 4는 본 발명의 맞춤형 검색서비스 제공방법의 일측면을 서버의 입장에서 설명하는 플로우차트이며,
도 5는 본 발명의 맞춤형 검색서비스 제공방법의 일측면을 클라이언트의 입장에서 설명하는 플로우차트이다.
<도면의 주요 부분에 대한 부호의 설명>
110 : 인터페이스부 120 : 데이터 저장부
130 : 인덱스 생성부 140 : 검색규칙 생성부
150 : 검색부

Claims (17)

  1. 클라이언트가 데이터 스키마를 정의하는 단계;
    클라이언트가 상기 정의된 데이터 스키마의 각 필드를 대상으로 검색 스키마를 정의하는 단계;
    클라이언트가 서버로 데이터 스키마에 대응하는 데이터를 전송하는 단계;
    서버가 전송받은 데이터 및 상기 정의된 검색 스키마를 이용하여 역색인을 생성하는 단계; 및
    서버가 역색인 및 정의된 검색 스키마를 이용하여 상기 전송받은 데이터에 대한 검색서비스를 제공하는 단계;로 이루어지는 것을 특징으로 하는 맞춤형 검색서비스 제공방법.
  2. 제 1항에 있어서,
    상기 데이터 스키마를 정의하는 단계는 다수의 필드를 정의하는 단계; 및
    각 필드의 속성을 정의하는 단계;로 이루어지는 것을 특징으로 하는 맞춤형 검색서비스 제공방법.
  3. 제 1항에 있어서,
    상기 검색 스키마를 정의하는 단계는 각 필드에 대하여 정렬대상 여부, 검색대상 여부, 필터링 여부, 디스플레이 여부를 결정하는 것임을 특징으로 하는 맞춤형 검색서비스 제공방법.
  4. 제 3 항에 있어서,
    검색대상으로 선택된 필드에 대하여 분석방법을 결정하는 단계;를 더 구비하는 것을 특징으로 하는 맞춤형 검색서비스 제공방법.
  5. 제 4항에 있어서,
    분석방법의 결정은 검색대상으로 선택된 필드에 대하여 형태소 분석, 바이그램 분석, 분석안함 가운데 어느 하나를 선택함으로써 이루어지는 것을 특징으로 하는 맞춤형 검색서비스 제공방법.
  6. 클라이언트로부터 다수의 필드 및 각 필드의 속성을 포함하는 데이터 스키마 정의 및 상기 데이터 스키마의 각 필드에 대한 검색 스키마를 입력받는 단계;
    상기 클라이언트로부터 상기 데이터 스키마에 대응하는 데이터를 전송받아 상기 검색 스키마를 이용하여 역색인을 생성하는 단계; 및
    상기 클라이언트로부터 검색어를 입력받으면 상기 전송받은 데이터에 대하여 상기 역색인 및 상기 검색 스키마를 이용하여 검색을 수행하고, 검색결과를 리턴하는 단계;로 이루어지는 것을 특징으로 하는 맞춤형 검색서비스 제공방법.
  7. 제 6항에 있어서,
    상기 데이터 스키마의 각 필드에 대한 검색 스키마는 각 필드에 대한 정렬대상 여부, 검색대상 여부, 필터링 여부, 디스플레이 여부를 포함하는 것임을 특징으로 하는 맞춤형 검색서비스 제공방법.
  8. 제 7항에 있어서,
    상기 역색인을 생성하는 단계에서, 상기 전송받은 데이터 가운데 검색대상 필드를 대상으로 색인어가 발생한 위치를 저장하는 것을 특징으로 하는 맞춤형 검색서비스 제공방법.
  9. 제 7항에 있어서,
    상기 클라이언트로부터 검색대상으로 선택된 필드에 대해 형태소 분석 또는 바이그램 분석을 할 것인가 여부를 입력받는 단계;를 더 구비하되,
    상기 역색인을 생성하는 단계에서 상기 전송받은 데이터 가운데 형태소 분석 또는 바이그램 분석을 하는 검색대상 필드에 대하여 형태소 분석 또는 바이그램 분석을 수행하고 그 분석결과 및 분석을 하지 않는 검색대상 필드의 각 값을 이용하여 역색인을 생성하는 것을 특징으로 하는 맞춤형 검색서비스 제공방법.
  10. 제 7항에 있어서,
    상기 클라이언트로부터 검색어를 입력받으면 상기 전송받은 데이터에 대하여 상기 생성된 역색인을 이용하여 검색을 수행하되, 각 필드에 대한 필터링 여부에 따라 필터링하고, 상기 검색결과에 대하여 정렬대상 여부에 따라 정렬하며, 디스플레이 여부에 따라 상기 검색결과를 재구성하여 상기 클라이언트로 리턴하는 것을 특징으로 하는 맞춤형 검색서비스 제공방법.
  11. 인터넷망을 통해 서버로 접속하는 단계;
    데이터 스키마를 정의하는 단계;
    정의된 데이터 스키마의 각 필드를 대상으로 검색 스키마를 정의하는 단계; 및
    데이터 스키마에 대응하는 데이터를 전송하는 단계;로 이루어지는 것을 특징으로 하는 맞춤형 검색서비스 제공방법.
  12. 제 11항에 있어서,
    인터넷망을 통해 서버로 검색어를 입력하는 단계; 및
    서버로부터 상기 검색어를 이용한 상기 데이터에 대한 검색결과를 수신하여 디스플레이하는 단계;를 더 포함하는 것을 특징으로 하는 맞춤형 검색서비스 제공방법.
  13. 클라이언트로부터 인터넷 망을 통해 데이터 스키마 및 검색 스키마 정의를 입력받고, 데이터를 전송받는 인터페이스부;
    클라이언트로부터 전송받은 데이터를 저장하는 데이터 저장부;
    상기 검색 스키마를 이용하여 상기 전송받은 데이터로부터 역색인을 생성하는 인덱스 생성부;
    상기 검색 스키마를 이용하여 검색규칙을 생성하는 검색규칙 생성부; 및
    상기 역색인과 상기 검색규칙을 이용하여 상기 전송받은 데이터에 대한 검색을 수행하는 검색부;를 구비하는 것을 특징으로 하는 맞춤형 검색서비스 제공장치.
  14. 제 13항에 있어서,
    상기 데이터 스키마는 다수의 필드 및 각 필드의 속성을 포함하는 것을 특징으로 하는 맞춤형 검색서비스 제공장치.
  15. 제 14항에 있어서,
    상기 검색 스키마는 상기 데이터 스키마의 각 필드에 대한 정렬대상 여부, 검색대상 여부, 필터링 여부, 디스플레이 여부값을 포함하되,
    상기 인덱스 생성부는 상기 전송받은 데이터 가운데 검색대상 필드에 대하여 역색인을 생성하며, 상기 검색규칙 생성부는 각 필드의 정렬대상 여부, 필터링 여부, 디스플레이 여부를 이용하여 검색규칙을 생성하는 것을 특징으로 하는 맞춤형 검색서비스 제공장치.
  16. 제 15항에 있어서,
    상기 검색 스키마는 검색대상 필드에 대한 분석방법을 더 포함하는 것을 특징으로 하는 맞춤형 검색서비스 제공장치.
  17. 제 16항에 있어서,
    상기 검색대상 필드에 대한 분석방법은 형태소 분석, 바이그램 분석, 분석안 함 가운데 어느 하나의 값을 갖는 것을 특징으로 하는 맞춤형 검색서비스 제공장치.
KR20080127443A 2008-12-15 2008-12-15 맞춤형 검색서비스 제공장치 및 그 방법 KR101021022B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20080127443A KR101021022B1 (ko) 2008-12-15 2008-12-15 맞춤형 검색서비스 제공장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20080127443A KR101021022B1 (ko) 2008-12-15 2008-12-15 맞춤형 검색서비스 제공장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20100068925A KR20100068925A (ko) 2010-06-24
KR101021022B1 true KR101021022B1 (ko) 2011-03-09

Family

ID=42367109

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20080127443A KR101021022B1 (ko) 2008-12-15 2008-12-15 맞춤형 검색서비스 제공장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR101021022B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100584514B1 (ko) * 1998-02-21 2006-05-29 아. 몬포르츠 텍스틸마쉬넨 게엠베하 운트 콤파니 카게 건조 및 고정장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070096094A (ko) * 2005-12-16 2007-10-02 주식회사 온더아이티 검색엔진에서 사용하는 색인어 정보를 검색속도를유지하면서 데이터베이스에 저장하는 저장구조 및 저장기법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070096094A (ko) * 2005-12-16 2007-10-02 주식회사 온더아이티 검색엔진에서 사용하는 색인어 정보를 검색속도를유지하면서 데이터베이스에 저장하는 저장구조 및 저장기법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100584514B1 (ko) * 1998-02-21 2006-05-29 아. 몬포르츠 텍스틸마쉬넨 게엠베하 운트 콤파니 카게 건조 및 고정장치

Also Published As

Publication number Publication date
KR20100068925A (ko) 2010-06-24

Similar Documents

Publication Publication Date Title
US9348934B2 (en) Systems and methods for facilitating open source intelligence gathering
CN102822815B (zh) 用于利用浏览器历史进行动作建议的方法和系统
US10235421B2 (en) Systems and methods for facilitating the gathering of open source intelligence
CN101320373B (zh) 网站支撑数据库安全搜索引擎系统
CN102622417B (zh) 对信息记录进行排序的方法和装置
JP6758454B2 (ja) ソーシャルネットワークの検索結果提示方法及び装置、並びに記憶媒体
CN103823907B (zh) 一种整合在线视频资源地址的方法、装置及引擎
CN103116635A (zh) 面向领域的暗网资源采集方法和系统
CN101894109A (zh) 一种数据库建立方法和装置
CN106874502A (zh) 一种视频搜索的方法、装置及终端
US20150347423A1 (en) Methods for completing a user search
KR101122737B1 (ko) 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법
CN103106234A (zh) 一种网页内容搜索方法和装置
JP4769822B2 (ja) ページグループを用いた情報検索サービス提供サーバー、方法及びシステム
CN108280102A (zh) 上网行为记录方法、装置及用户终端
CN116226494B (zh) 一种用于信息搜索的爬虫系统及方法
CN105045835A (zh) 信息搜索方法和装置
KR101021022B1 (ko) 맞춤형 검색서비스 제공장치 및 그 방법
CN103312584A (zh) 一种在网络社区中发布信息的方法与设备
CN103324640B (zh) 一种确定搜索结果文档的方法、装置和设备
CN104050203A (zh) 一种获取网页和用户个性化特征的方法
CN106326353A (zh) 一种用于提供呈现信息的方法与设备
Maratea et al. An heuristic approach to page recommendation in web usage mining
KR101059032B1 (ko) 검색 스키마 설정장치 및 그 방법
CN102957721A (zh) 一种用于基于标识信息对用户进行分类的设备和方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140228

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150225

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160225

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170227

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190219

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20200206

Year of fee payment: 10