KR20100132376A - 스니펫 제공 장치 및 방법 - Google Patents

스니펫 제공 장치 및 방법 Download PDF

Info

Publication number
KR20100132376A
KR20100132376A KR1020090051168A KR20090051168A KR20100132376A KR 20100132376 A KR20100132376 A KR 20100132376A KR 1020090051168 A KR1020090051168 A KR 1020090051168A KR 20090051168 A KR20090051168 A KR 20090051168A KR 20100132376 A KR20100132376 A KR 20100132376A
Authority
KR
South Korea
Prior art keywords
snippet
query
score
frequency
issue
Prior art date
Application number
KR1020090051168A
Other languages
English (en)
Other versions
KR101011726B1 (ko
Inventor
김재광
이지형
장재형
Original Assignee
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성균관대학교산학협력단 filed Critical 성균관대학교산학협력단
Priority to KR1020090051168A priority Critical patent/KR101011726B1/ko
Publication of KR20100132376A publication Critical patent/KR20100132376A/ko
Application granted granted Critical
Publication of KR101011726B1 publication Critical patent/KR101011726B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods

Abstract

스니펫 제공 장치는 사용자 단말로부터 수신한 쿼리(Query)를 분석하는 쿼리 분석부, 웹 페이지들로부터 쿼리에 포함된 키워드를 갖는 후보 스니펫들을 추출하는 스니펫 추출부, 웹 페이지들로부터 이슈 태그를 수집하는 이슈 태그 수집부, 후보 스니펫들에 포함된 키워드의 빈도 수 및 이슈 태그의 포함 여부에 따라 추출된 후보 스니펫들의 랭킹을 결정하는 스니펫 선택부 및 상기 결정된 랭킹에 따라 미리 설정된 개수의 스니펫들을 사용자 단말로 전송하는 검색 결과 전송부를 포함하며, 상기 이슈 태그 수집부는 사회적 이슈와 트렌드를 반영하도록 웹사이트들의 최근의 인기 태그들을 수집하고, 이슈 태그는 수집된 인기 태그들 중에서 선택된다.
스니펫, 블로그, 웹 페이지, 이슈 태그, 제목

Description

스니펫 제공 장치 및 방법 {APPARATUS AND METHOD FOR PROVIDING SNIPPET}
본 발명은 이슈 태그를 이용한 스니펫 제공 장치 및 방법에 관한 것이다.
인터넷의 수많은 정보 중에서 사용자가 원하는 정보를 찾는 것은 예전부터 아주 중요한 문제로 다루어지고 있다. 통상적으로, 사용자가 원하는 정보를 찾기 위해서 사용자는 검색 엔진을 사용하는데, 이러한 검색 엔진은 각각의 알고리즘으로 사용자가 원하리라고 추정하는 정보를 사용자에게 추천해준다.
이때, 사용자는 추천받은 정보가 자신에게 유용한지 아닌지를 판단하기 위하여 검색 엔진의 추천 순서나 페이지의 문서 요약 글을 확인한다. 여기서, 페이지를 요약하여 보여주는 페이지의 문서 요약 글을 스니펫(Snippet)이라 하며, 이러한 스니펫은 사용자의 페이지 방문 여부에 큰 영향을 준다.
도 1a 및 도 1b는 각각 일반적인 웹 페이지 및 블로그 페이지의 스니펫을 예시하는 도면으로서, 포털 사이트인 네이버(Naver)의 검색창에 "기미가요"를 입력하여 검색된 결과를 예시하는 도면이다.
도 1a에 도시된 바와 같이, 검색 엔진을 통해서 검색되는 일반적인 웹 페이지는, 제목(10), 스니펫(20) 및 웹사이트 주소(30) 등을 제공하거나, 또는 일반적 인 블로그 페이지는, 도 1b에 도시된 바와 같이, 제목(10), 스니펫(20), 블로그 주소(40) 및 블로그 명(50) 등을 제공한다.
다시 말하면, 스니펫이란 검색 엔진이 사용자에게 보여주는 웹 페이지의 간단한 대표 글을 의미한다. 이러한 스니펫은 사용자의 페이지 방문 여부에 큰 영향을 끼치는 요소이기 때문에, 이를 추출하는 것은 중요 사항으로 떠오르고 있다. 하지만, 종래 기술에 따른 스니펫 추출 기술들은 최근 사회적 이슈나 트렌드를 반영하지 못하는 한계를 가지고 있다. 특히, 블로그(Blog)의 경우, 일인 미디어적 성격을 가지기 때문에 이슈나 트렌드에 더 민감함에도 불구하고 이를 반영하지 못하고 있다.
이러한 블로그는 특정 분야에 관심이 많은 블로거가 보다 잘 정리된 정보나 자신의 의견을 게시하는 공간으로 사용되기 때문에, 정보 검색에 있어 큰 축을 이루고 있다. 이러한 블로그가 가지는 특성중의 하나로 각각의 포스트마다 제목을 갖고 있다. 이때, 제목은 일반적으로 본문의 내용을 가장 잘 반영하기 때문에 반드시 고려되어야 한다.
따라서 블로그 내의 블로그 페이지는 일반적인 웹 페이지(Web page)보다 더 사회적 이슈(Issue)나 트렌드(Trend)에 민감하게 반응하지만, 종래의 기술들은 주로 쿼리(Query) 중심의 빈도만을 고려하고 있다.
또한, 보다 발전된 종래 기술로서, 텍스트 세그먼트에 기반한 언어 모델을 활용하는 방안도 있지만, 이러한 종래 기술도 최근 사회적 이슈나 트렌드를 반영하지 못하는 한계를 가지고 있다.
본 발명의 일 실시예는, 사회적 이슈나 트렌드를 충분히 반영할 수 있도록 이슈 태그를 이용하여 웹 페이지로부터 스니펫을 추출함으로써 지속적이고 가치 있는 정보를 얻을 수 있는, 웹 페이지용 스니펫 제공 장치 및 방법을 제공한다.
또한, 본 발명의 일 실시예는, 사회적 이슈나 트렌드에 매우 민감한 블로그 페이지로부터 스니펫을 추출하여 제공할 수 있는 블로그 페이지용 스니펫 제공 장치 및 방법을 제공한다.
상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 제1 측면은, 스니펫 제공 장치에 있어서, 사용자 단말로부터 수신한 쿼리(Query)를 분석하는 쿼리 분석부, 웹 페이지들로부터 상기 쿼리에 포함된 키워드를 갖는 후보 스니펫들을 추출하는 스니펫 추출부, 웹 페이지들로부터 이슈 태그(Issue Tag)를 수집하는 이슈 태그 수집부, 상기 후보 스니펫들에 포함된 상기 키워드의 빈도 수 및 상기 이슈 태그의 포함 여부에 따라 상기 추출된 후보 스니펫들의 랭킹을 결정하는 스니펫 선택부 및 상기 결정된 랭킹에 따라 미리 설정된 개수의 스니펫들을 상기 사용자 단말로 전송하는 검색 결과 전송부를 포함하며, 상기 이슈 태그 수집부는 사회적 이슈와 트렌드를 반영하도록 웹 사이트들의 인기 태그들을 수집하고, 상기 이슈 태그는 수집된 인기 태그들 중에서 선택되는 스니펫 제공 장치를 제공한다.
또한, 본 발명의 제2 측면은 사용자 단말로부터 수신된 쿼리(Query)를 분석하여 결과 페이지를 출력하는 검색 엔진, 블로그 페이지들로부터 상기 쿼리에 대응하는 제목 및 본문을 추출하는 제목 및 본문 추출기(Title and Body Extractor) 모듈, 상기 추출된 본문으로부터 후보 스니펫들을 추출하는 스니펫 추출기(Snippet Extractor) 모듈, 상기 블로그 페이지들로부터 최신 인기 태그를 수집하고, 상기 수집된 인기 태그들의 빈도와 날짜에 따라 이슈 태그를 선정하는 이슈 태그 수집기(Issue Tag Crawler) 모듈, 상기 제목과 이슈 태그를 이용하여 후보 스니펫별 점수를 산출하고, 상기 산출된 점수에 따라 스니펫을 선택하는 스니펫 선택기(Snippet Selector) 모듈 및 상기 선택된 스니펫을 상기 사용자 단말로 전송하는 검색 결과 전송 모듈을 포함하는 스니펫 제공 장치를 제공한다.
또한, 본 발명의 제3 측면은 검색 엔진이 사용자 단말로부터 수신한 쿼리를 분석하고 결과 페이지를 출력하는 단계, 웹 페이지 데이터베이스 내에 기저장된 웹 페이지들로부터 해당 쿼리에 대응하는 제목 및 본문을 추출하는 단계, 상기 추출된 본문으로부터 스니펫을 추출하는 단계, 상기 웹 페이지들로부터 최신 인기 태그를 수집하는 단계, 상기 수집된 인기 태그들의 빈도와 날짜에 따라 이슈 태그를 선정하는 단계, 상기 제목과 상기 선정된 이슈 태그를 이용하여 스니펫별 점수를 산출하는 단계, 상기 산출된 스니펫별 점수에 따라 스니펫을 선택하는 단계 및 상기 선택된 스니펫을 사용자 단말로 전송하는 단계를 포함하는 스니펫 제공 방법을 제공한다.
전술한 본 발명의 과제 해결 수단 중 하나에 의하면, 사회적 이슈나 트렌드를 반영할 수 있도록 이슈 태그를 이용하여 웹 페이지 또는 블로그 페이지로부터 스니펫을 추출하여 제공함으로써 지속적이고 가치 있는 정보를 얻을 수 있다.
아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. 또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
이하, 도면을 참고하여 본 발명의 실시예를 상세히 설명하기로 한다.
도 2는 본 발명의 일실시예에 따른 이슈 태그를 이용한 웹 페이지의 스니펫 제공 장치의 구성도이다.
도 2를 참조하면, 스니펫 제공 장치는, 쿼리 분석부(121), 스니펫 추출부(122), 이슈 태그 수집부(123), 스니펫 선택부(124) 및 검색결과 전송부(125)를 포함하며, 사용자 단말(110)로부터 수신한 쿼리를 분석하여 웹 페이지 데이터베이스(130)로부터 스니펫을 추출하여 상기 사용자 단말(110)에게 추출된 스니펫을 제공한다.
쿼리 분석부(121)는 사용자 단말로부터 수신한 쿼리(Query)를 분석한다. 여기서, 쿼리 분석부(121)는 예를 들면, 통상적인 검색 엔진일 수 있다.
스니펫 추출부(122)는 웹 페이지들로부터 상기 쿼리에 포함된 키워드를 갖는 후보 스니펫들을 추출한다. 즉, 스니펫 추출부(122)는 웹 페이지 데이터베이스(130)에 저장된 웹 페이지들로부터 상기 쿼리에 포함된 키워드를 갖는 후보 스니펫들을 추출한다.
이슈 태그 수집부(123)는 웹 페이지들로부터 이슈 태그(Issue Tag)를 수집하게 되며, 사회적 이슈와 트렌드를 반영하도록 웹사이트들의 최근의 인기 태그들을 수집하고, 이때, 상기 이슈 태그는 수집된 인기 태그들의 빈도와 날짜에 근거하여 선정하게 된다. 즉, 상기 이슈 태그 수집부(123)는 상기 웹 페이지들에 설정된 태그들의 날짜 또는 상기 태그가 설정된 웹 페이지의 개수에 따라 이슈 태그를 수집한다.
한편, 스니펫 추출부(122)와 이슈 태그 수집부(123)가 추출 또는 수집 대상으로 하는 웹 페이지는 블로그 페이지 등을 포함한다. 블로그 페이지가 가 사회적 이슈에 민감하게 반응한다는 것을 고려하면, 블로그 페이지로부터 스니펫을 추출할 때, 훨씬 효과적인 검색 결과를 보여줄 수 있다.
스니펫 선택부(124)는 상기 스니펫에 포함된 상기 키워드의 빈도 수 및 상기 이슈 태그의 포함 여부에 따라 상기 추출된 스니펫들의 랭킹을 결정한다. 이때, 상기 스니펫 선택부(124)는 상기 스니펫을 포함하는 웹 페이지의 제목과 상기 키워드의 연관성을 추가적으로 고려할 수 있다.
또한, 스니펫 선택을 위하여 다음과 같은 수학식을 이용할 수 있다.
스니펫 별 점수 점수인
Figure 112009034918626-PAT00001
는 다음의 수학식 1과 같이 기본적으로 쿼리에 따른 쿼리 점수(
Figure 112009034918626-PAT00002
)와 제목과 이슈를 고려한 가중치 점수(
Figure 112009034918626-PAT00003
)의 합으로 계산된다.
Figure 112009034918626-PAT00004
이때, 페이지 전체에 자주 나타난 단어는 추출된 스니펫의 특성을 반영하기 힘들기 때문에 전체에 많이 나타난 단어일수록 단어가 가지는 비중이 낮아지고, 추출된 스니펫에 많이 나올수록 그 스니펫을 잘 나타내는 단어이므로 비중이 높아진다.
또한, 쿼리에 따른 쿼리 점수인
Figure 112009034918626-PAT00005
는, 다음의 수학식 2와 같이, 대상 페이지 전체에서의
Figure 112009034918626-PAT00006
번째 쿼리 빈도인
Figure 112009034918626-PAT00007
와 해당 스니펫 후보의
Figure 112009034918626-PAT00008
번째 쿼리 빈도인
Figure 112009034918626-PAT00009
의 합계에 의해 결정된다.
Figure 112009034918626-PAT00010
이때, 후보 스니펫은 반드시 1개 이상의 쿼리를 가지고 있고,
Figure 112009034918626-PAT00011
이므로
Figure 112009034918626-PAT00012
이 된다.
또한, 제목과 이슈를 고려한 가중치 점수인
Figure 112009034918626-PAT00013
는, 다음의 수학식 3과 같이, 대상 페이지 전체에서 쓰인 제목의
Figure 112009034918626-PAT00014
번째 단어 빈도인
Figure 112009034918626-PAT00015
와 페이지 전체에서 쓰인
Figure 112009034918626-PAT00016
번째 이슈 태그 빈도인
Figure 112009034918626-PAT00017
, 해당 스니펫 후보에서 쓰인 제목의
Figure 112009034918626-PAT00018
번째 단어 빈도인
Figure 112009034918626-PAT00019
, 및 해당 스니펫 후보에서
Figure 112009034918626-PAT00020
번째 이슈 태그 빈도
Figure 112009034918626-PAT00021
에 의해 결정된다.
Figure 112009034918626-PAT00022
Figure 112009034918626-PAT00023
따라서 이슈 태그와 제목이 많이 들어간 스니펫일수록 선택될 가능성이 높고, 만약 모든 스니펫 후보가 이를 갖지 않는다면 쿼리 빈도가 가장 높은 스니펫이 선택된다.
검색결과 전송부(125)는 상기 랭킹에 따라 미리 설정된 개수의 스니펫을 상 기 사용자 단말(110)로 전송한다. 이에 따라 사용자 단말(110)에는 이슈 태그를 이용하여 추출된 스니펫을 포함하는 웹 페이지 화면이 출력된다.
따라서 본 발명의 일실시예에 이슈 태그를 이용한 웹 페이지의 스니펫 제공 장치는, 이슈 태그를 이용하여 웹 페이지로부터 스니펫을 추출하여 제공함으로써 사회적 이슈나 트렌드를 반영할 수 있고, 이에 따라 사용자는 지속적이고 가치 있는 정보를 얻을 수 있다.
도 3은 본 발명의 일실시예에 따른 이슈 태그를 이용한 웹 페이지의 스니펫 추출 방법의 동작흐름도이다.
도 2 및 도 3을 참조하면, 본 발명의 일실시예에 따른 이슈 태그를 이용한 웹 페이지의 스니펫 추출 방법은, 먼저 쿼리 분석부(121)가 사용자 단말(110)로부터 쿼리를 수신하여 분석한다(S110).
다음으로, 스니펫 추출부(122)는 상기 웹 페이지 데이터베이스(130) 내에 기저장된 웹 페이지들로부터 해당 쿼리에 포함된 키워드를 갖는 후보 스니펫들을 추출한다(S120). 이때, 추출되는 후보 스니펫들의 수는 임의로 설정될 수 있다.
다음으로, 이슈 태그 수집부(123)는 상기 웹 페이지 데이터베이스(130) 내에 기저장된 웹 페이지들로부터 이슈 태그를 수집한다(S130). 이때, 상기 이슈 태그 수집부(123)는 상기 웹 페이지들에 설정된 태그들의 날짜 또는 상기 태그가 설정된 웹 페이지의 개수에 따라 이슈 태그를 수집할 수 있다.
다음으로, 스니펫 선택부(124)는 스니펫에 포함된 키워드 빈도 수 및 이슈 태그 포함 여부에 따라 랭킹을 결정하고(S140), 또한, 상기 스니펫 선택부(124)는 상기 결정된 랭킹에 따라 스니펫을 선택한다(S150). 또한, 앞서 설명한 수학식에 따라 점수를 산출하여 랭킹을 결정할 수 있다.
다음으로, 검색결과 전송부(125)는 기설정된 개수의 스니펫들을 사용자 단말로 전송한다(S160).
한편, 블로그가 사회적 이슈에 민감하게 반응한다는 것을 고려하면, 블로그 페이지로부터 스니펫을 추출할 때, 사회적 이슈나 트렌드가 반영되는 것이 합리적이라고 할 수 있다. 이러한 사회적 이슈나 트렌드를 알기 위해서 본 발명의 실시예에서는 이슈 태그를 사용하며, 이러한 이슈 태그는 정보 생산자가 생산하기 때문에 보다 지속적이고 가치 있는 정보를 얻을 수 있다는 장점이 있다.
최근 이슈가 고려된 스니펫의 유용성을 알아보기 위해서, 기본적인 스니펫 추출 방법에 추가적으로 이슈를 고려하는 스니펫 제공 방법을 결합한다. 이에 따라 본 발명의 실시예에 따른 스니펫 제공 장치를 통하여 추출된 스니펫을 이용하여 사용자의 만족도를 알아보고, 그 결과는 도 7에 예시된다.
최근의 이슈를 파악하기 위하여 이슈 태그를 추출하는 방법을 사용하였다. 이슈를 파악하기 위해 인기 검색어의 활용을 고려할 수 있지만, 인기 검색어는 그 지속성이 너무 짧고, 단발적 이슈에 그치기 때문에 가치 있는 정보를 얻기 힘들다. 반면에 이슈 태그의 경우, 정보 생산자인 블로거에 의하여 만들어 지기 때문에, 지속성이 길고 보다 가치 있는 정보를 얻을 수 있다.
이를 얻기 위하여 본 발명의 실시예에서는 유명 블로그 포털에서 제공하는 이슈 태그들을 수집하고, 그 중에서 특정 기간 동안 사용 빈도가 높았던 상위 태그 를 활용하여 이를 이슈 태그로 선택한다.
먼저, 기존의 방식으로 쿼리에 대응하여 주어진 후보 스니펫들을 추출하고 이중에서 본 발명의 실시예에 따른 스니펫 제공 방법으로 이슈가 반영된 최종 스니펫을 돌려준다. 이때, 스니펫 후보를 추출할 때는 일반적인 방법으로 사용되고 있는 쿼리가 포함된 문장들을 추출하는 방법을 사용한다.
다음으로, 대상 블로그 페이지의 제목과 최근 이슈가 되는 태그를 바탕으로 후보들을 평가하고, 이중에서 가장 높은 점수를 가지는 스니펫을 사용자에게 제공한다. 만약, 이슈와 제목이 모두 반영되기 힘든 스니펫만이 추출된다면, 일반적인 방법에 따라 쿼리 빈도를 고려하여 스니펫을 추출하여 돌려줄 수 있다.
도 4는 본 발명의 일실시예에 따른 제목과 이슈 태그를 이용한 블로그 페이지의 스니펫 제공 장치의 구성도로서, 전술한 도 2와 비교하면, 각각의 구성요소가 모듈(Module)로 구현될 수 있는 것을 예시한다.
도 4를 참조하면, 발명의 일실시예에 따른 제목과 이슈 태그를 이용한 블로그 페이지의 스니펫 제공 장치는, 검색 엔진(구글 API 모듈: 221), 제목 및 본문 추출기 모듈(222), 스니펫 추출기 모듈(223), 이슈 태그 수집기 모듈(224), 스니펫 선택기 모듈(225) 및 검색결과 전송 모듈(226)을 포함하며, 사용자 단말(210)로부터 수신한 쿼리를 분석하여 블로그 페이지 데이터베이스(230)로부터 스니펫을 추출하여 추출된 스니펫을 상기 사용자 단말(210)에게 제공한다.
검색 엔진(221)은 사용자 단말로부터 수신된 쿼리(Query)를 분석하여 결과 페이지를 출력하며, 예를 들면, 구글(Google) API(Application Program Interface) 일 수 있다. 일반적으로 우수한 검색 엔진을 구축하기 위해서는 높은 비용이 필요하지만, 스니펫의 질 향상을 위해서, 검색에 관한 모듈은 Google API를 통해 구현될 수 있으며, 이러한 Google API는 우수한 검색 결과를 다양한 형태로 받아볼 수 있다는 장점이 있다.
제목 및 본문 추출기 모듈(222)은 블로그 페이지들로부터 상기 쿼리에 대응하는 제목 및 본문을 추출하며, 검색 결과를 바탕으로 해당 웹 페이지의 제목과 본문을 추출하여 상기 스니펫 추출기 모듈(223)과 스니펫 선택기 모듈(225)에 전달한다. 이때, 제목은 조사와 관사 등을 제외한 명사만을 추출하여 전달한다.
스니펫 추출기 모듈(223)은 상기 추출된 본문으로부터 후보 스니펫들을 추출하며, 스니펫 후보들을 추출하기 위하여 주어진 블로그 페이지의 본문을 받아 온다. 종래 방식의 경우, 주어진 쿼리를 중심으로 100개의 글자를 포함하는 크기를 가지는 슬라이딩 윈도우를 바탕으로 본문에서 스니펫들을 추출한다. 이것은 사용자가 입력한 쿼리가 어떠한 부분에서 보이는지 사용자에게 제시할 수 있고, 문장 단위 추출보다 핵심 스니펫을 추출할 확률을 높여주는 장점이 있다. 따라서 본 발명의 실시예에서도 이러한 장점을 취하기 위하여 슬라이딩 윈도우를 사용하여 후보 스니펫들을 추출하며, 도 5를 참조하여 후술하기로 한다.
이슈 태그 수집기 모듈(224)은 상기 블로그 페이지들로부터 최신 인기 태그를 수집하고, 상기 수집된 태그들의 빈도와 날짜에 따라 이슈 태그를 선정한다. 이때, 이슈를 파악하기 위해서 유명 블로그 사이트로부터 최근 인기 태그를 크롤링(Crawling)하고, 수집된 태그들의 빈도와 날짜를 바탕으로 이슈 태그를 선정한 다.
통상적으로, 크롤링을 수하기 위한 크롤러(Crawler)는 웹상의 다양한 정보를 자동으로 검색하고 색인하기 위해 검색 엔진을 운영하는 사이트에서 사용하는 소프트웨어를 말한다. 예를 들면, 스파이더(spider), 봇(bot), 지능 에이전트라고도 한다. 사람들이 일일이 해당 사이트의 정보를 검색하는 것이 아니라 컴퓨터 프로그램의 미리 입력된 방식에 따라 끊임없이 새로운 웹 페이지를 찾아 종합하고, 찾은 결과를 이용해 또 새로운 정보를 찾아 색인을 추가하는 작업을 반복 수행한다. 이때, 방대한 자료를 검색하는 특징은 있으나, 로봇의 검색 기능을 역이용하여 순위를 조작하거나 검색을 피할 수 있는 단점도 있다.
스니펫 선택기 모듈(225)은 상기 제목과 이슈 태그를 이용하여 후보 스니펫별 점수를 산출하고, 상기 산출된 점수에 따라 스니펫을 선택한다. 구체적으로, 스니펫 추출기 모듈(224)에서 추출된 후보 스니펫들 중에서 가장 알맞은 스니펫을 선택하는 과정이 필요하며, 이를 위하여 스니펫별 점수 산출은 앞서 설명한 수학식 1 내지 3과 같이 구해진다.
후속적으로, 검색결과 전송 모듈(226)은 상기 선택된 스니펫을 상기 사용자 단말로 전송하게 된다.
도 5는 도 4에 도시된 슬라이딩 방식의 스니펫 추출을 설명하기 위한 동작흐름도로서, 이러한 슬라이딩 방식의 스니펫 추출 방법은, 미합중국 특허등록번호 제6615209호에 "Detecting query-specific duplicate document,"라는 명칭의 발명으로 개시되어 있는데, 본 발명의 실시예에 따른 스니펫 제공 방법의 이해를 돕기 위 해 다음과 같이 구체적으로 설명한다.
도 5를 참조하면, 도 4에 도시된 슬라이딩 방식의 쿼리 관련정보(예를 들면, 스니펫) 추출 방법은, 먼저, 쿼리 키워드 및 비압축된 문서를 사용자 단말로부터 수신한다(S201). 이때, 압축된 문서인 경우 압축을 해제한다.
다음으로, 확장된 문서로부터 포맷 코드 및/또는 함수를 제거하고(S202), 이후, 기설정된 글자수(예를 들면, 100)로 윈도우를 정의하며(S203), 윈도우 지수를 초기화한다(S204).
다음으로, 스페이스가 없고 단어를 분리하지 않는 확장된 문서의 글자를 확인하고(S205), 상기 윈도우 지수를 1 증가시킨다(S206).
이후, 문서의 나머지가 윈도우 크기보다 작은지 판단하여(S207), 만약 문서의 나머지가 윈도우 크기보다 큰 경우, 현재 윈도우(예를 들면, 현재 세그먼트)로 덮인 문서 부분의 키워드 수를 카운트한다(S208). 이후, 카운트 값이 저장된다(S209).
이후, 스페이스가 없고 단어를 분리하지 않는 상기 확장된 문서의 다음 글자를 확인하며(S210), 전술한 S206 단계로 되돌아간다.
이후, S207 단계에서 문서의 나머지가 윈도우 크기보다 작은 경우, 히트수만큼 세그먼트를 분류하고(S211), 이후 최고 랭킹의 세그먼트 중에서 기설정된 값을 획득하게 되며(S212), 이에 따라 스니펫이 추출된다.
이와 같이 주어진 쿼리를 중심으로 예를 들면, 100개의 글자를 포함하는 크기를 가지는 슬라이딩 윈도우를 바탕으로 본문에서 스니펫들을 추출할 수 있는데, 이것은 사용자가 입력한 쿼리가 어떠한 부분에서 보이는지 사용자에게 제시할 수 있고, 문장 단위 추출보다 핵심 스니펫을 추출할 확률을 높여주게 된다.
도 6은 본 발명의 일실시예에 따른 제목과 이슈 태그를 이용한 블로그 페이지의 스니펫 추출 방법의 동작흐름도이다.
도 6을 참조하면, 본 발명의 일실시예에 따른 제목과 이슈 태그를 이용한 블로그 페이지의 스니펫 추출 방법은, 먼저, 검색 엔진, 예를 들면, 구글 API 모듈은 사용자 단말로부터 수신한 쿼리를 분석하고 결과 페이지를 출력한다(S310).
다음으로, 기저장된 블로그 페이지들로부터 해당 쿼리에 대응하는 제목 및 본문을 추출한다(S320).
다음으로, 추출된 본문으로부터 스니펫을 추출한다(S330).
다음으로, 블로그 페이지들로부터 최신 인기 태그를 수집하고(S340), 수집된 태그들의 빈도와 날짜에 따라 이슈 태그를 선정한다(S350).
다음으로, 전술한 수학식 1 내지 수학식 3을 참조하면, 제목과 이슈 태그를 이용하여 스니펫별 점수를 산출하고(S360), 산출된 점수에 따라 스니펫을 선택한다(S370).
다음으로, 선택된 스니펫을 사용자 단말로 전송한다(S380).
도 7은 본 발명의 일실시예에 따른 스니펫 추출 방식과 기존의 다른 방식을 비교한 테이블을 나타내는 도면이다.
도 7을 참조하면, 본 발명의 일실시예에 따른 스니펫 추출 방식에서 이슈를 반영한 스니펫의 유용성을 알아보기 위한 설문을 하였다. 예를 들면, 2009년 4월 5일 기준 네이버 일간 종합 검색어 1위이고 사회적으로 이슈가 된 ' 기미가요 '를 쿼리로 하여 블로그 검색을 실시하였다. 이때, 실험을 위해 크롤링(Crawling)된 이슈 태그는 ' 케이온, 아이폰 , 맨유 , 뮤직비디오, 조혜련, 북한, 이명박… '등 24개지만, 이에 국한되는 것은 아니다.
이러한 블로그 검색 및 이슈 태그 수집에 의해 나타난 결과 중에서,
Figure 112009034918626-PAT00024
라는 블로그 페이지를 본 발명의 실시예에 따른 방식으로 분석하여 스니펫을 추출했다. 이와 같이 추출한 스니펫의 검증을 위하여 유명 검색 사이트인 구글과 네이버의 스니펫과 함께 비교하였다.
설문자에게 블로그 페이지와 함께 각각의 스니펫을 보이고 제시된 스니펫들 중에서 가장 본문의 내용을 잘 나타내는 순서대로 표시하도록 하였다. 또한, 이슈를 잘 반영하는지 확인하기 위해서 동일한 방법으로 동일한 설문자에게 이슈 태그를 고려하여 평가하도록 하였다. 즉, 순서대로 나열된 스니펫들을 각각 2점, 1점, 0점이라 하고, 설문 결과 얻어진 점수를 합하였다. 즉, 점수가 높을수록 사용자가 판단하기에 좋은 스니펫이라고 할 수 있다. 그 결과는 도 7에 도시된 바와 같다.
도 7로부터 얻어지는 결과를 분석해보면, 구글의 경우, 가장 점수가 낮게 나온다. 이는 구글이 블로그의 제목과 가장 유사한 스니펫을 추출했는데, 실험에 사용된 블로그 포스트의 경우 제목은 "기미가요가 도대체 무엇이길래…" 라고 되어 있기 때문에 표면적으로는 기미가요의 뜻을 나타내는 블로그라 할 수 있으나, 사실상 '기미가요'로 인한 사회적 이슈를 다루는 내용이기 때문에 구글의 스니펫이 적절하지 못하게 선택된 것을 알 수 있다.
반면에 본 발명의 실시예에 따른 스니펫 제공 방식의 경우, 특히 당시 사회의 이슈를 고려한 스니펫이 추출됨으로써 보다 사용자 만족도가 높게 나타난 것을 알 수 있다.
즉, 본 발명의 실시예에 따른 스니펫 제공 방식을 통하여 제목과 이슈를 고려하여 추출되는 블로그 내의 스니펫이 사용자의 만족도를 더 높일 수 있음을 알 수 있다. 아울러, 이슈가 스니펫의 사용자 만족도에 긍정적인 영향을 제공하는 것으로 알 수 있지만, 부가적으로 이슈가 생산되는 미디어 매체에 대한 고려하고, 스니펫에 점수를 줄 때, 추출된 단어의 의미상의 동일성을 고려함으로써 사용자 만족도를 더욱 향상시킬 수 있다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
도 1a 및 도 1b는 각각 일반적인 웹 페이지 및 블로그 페이지의 스니펫을 예시하는 도면이다.
도 2는 본 발명의 일실시예에 이슈 태그를 이용한 웹 페이지의 스니펫 제공 장치의 구성도이다.
도 3은 본 발명의 일실시예에 따른 이슈 태그를 이용한 웹 페이지의 스니펫 추출 방법의 동작흐름도이다.
도 4는 본 발명의 일실시예에 따른 제목과 이슈 태그를 이용한 블로그 페이지의 스니펫 제공 장치의 구성도이다.
도 5는 도 4에 도시된 슬라이딩 방식의 스니펫 추출을 설명하기 위한 동작흐름도이다.
도 6은 본 발명의 일실시예에 따른 제목과 이슈 태그를 이용한 블로그 페이지의 스니펫 추출 방법의 동작흐름도이다.
도 7은 본 발명의 일실시예에 따른 스니펫 추출 방식과 기존의 다른 방식을 비교한 테이블을 나타내는 도면이다.
< 도면의 주요 부분에 대한 설명 >
110: 사용자 단말 120: 스니펫 제공 장치
130: 웹 페이지 데이터베이스 121: 쿼리 분석부
122: 스니펫 추출부 123: 이슈 태그 수집부
124: 스니펫 선택부 125: 검색결과 전송부
210: 사용자 단말 220: 스니펫 제공 장치
230: 블로그 페이지 데이터베이스 221: 검색 엔진(구글 API 모듈)
222: 제목 및 본문 추출기 모듈 223: 스니펫 추출기 모듈
224: 이슈 태그 수집기 모듈 225: 스니펫 선택기 모듈
226: 검색결과 전송 모듈

Claims (13)

  1. 스니펫 제공 장치에 있어서,
    사용자 단말로부터 수신한 쿼리(Query)를 분석하는 쿼리 분석부,
    웹 페이지들로부터 상기 쿼리에 포함된 키워드를 갖는 후보 스니펫들을 추출하는 스니펫 추출부,
    웹 페이지들로부터 이슈 태그(Issue Tag)를 수집하는 이슈 태그 수집부,
    상기 후보 스니펫들에 포함된 상기 키워드의 빈도 수 및 상기 이슈 태그의 포함 여부에 따라 상기 추출된 후보 스니펫들의 랭킹을 결정하는 스니펫 선택부 및
    상기 결정된 랭킹에 따라 미리 설정된 개수의 스니펫들을 상기 사용자 단말로 전송하는 검색 결과 전송부
    를 포함하며,
    상기 이슈 태그 수집부는 사회적 이슈와 트렌드를 반영하도록 웹 사이트들의 인기 태그들을 수집하고, 상기 이슈 태그는 수집된 인기 태그들 중에서 선택되는 스니펫 제공 장치.
  2. 제1항에 있어서,
    상기 이슈 태그 수집부는 상기 태그가 설정된 웹 페이지의 빈도 수 또는 상기 웹 페이지들에 설정된 태그들의 날짜에 근거하여 상기 이슈 태그를 수집하는 스 니펫 제공 장치.
  3. 제1항에 있어서,
    상기 스니펫 선택부는 쿼리에 따른 쿼리 점수 및 상기 이슈 태그를 고려한 가중치 점수의 합계에 근거하여 스니펫을 선택하되,
    상기 스니펫을 포함하는 웹 페이지가 상기 쿼리를 많이 포함할수록 상기 쿼리 점수가 상승하고,
    상기 스니펫을 포함하는 웹 페이지가 상기 이슈 태그를 많이 포함할수록 상기 가중치 점수가 상승하는 스니펫 제공 장치.
  4. 제1항에 있어서,
    상기 스니펫 선택부는 상기 스니펫을 포함하는 웹 페이지의 제목과 상기 키워드의 연관성을 추가적으로 고려하여 상기 랭킹을 결정하는 스니펫 제공 장치.
  5. 제4항에 있어서,
    상기 스니펫 선택부는 쿼리에 따른 쿼리 점수(
    Figure 112009034918626-PAT00025
    ) 및
    상기 웹 페이지의 제목과 상기 이슈 태그를 고려한 가중치 점 수(
    Figure 112009034918626-PAT00026
    )의 합계에 근거하여 스니펫을 선택하되,
    상기 쿼리 점수는 대상 페이지 전체에서의
    Figure 112009034918626-PAT00027
    번째 쿼리 빈도(
    Figure 112009034918626-PAT00028
    ) 및 해당 스니펫 후보의
    Figure 112009034918626-PAT00029
    번째 쿼리 빈도(
    Figure 112009034918626-PAT00030
    )에 근거하여,
    Figure 112009034918626-PAT00031
    와 같이 결정되며,
    상기 가중치 점수는 대상 페이지 전체에서 쓰인 제목의
    Figure 112009034918626-PAT00032
    번째 단어 빈도(
    Figure 112009034918626-PAT00033
    ), 페이지 전체에서 쓰인
    Figure 112009034918626-PAT00034
    번째 이슈 태그 빈도(
    Figure 112009034918626-PAT00035
    ), 해당 스니펫 후보에서 쓰인 제목의
    Figure 112009034918626-PAT00036
    번째 단어 빈도(
    Figure 112009034918626-PAT00037
    ) 및 해당 스니펫 후보에서
    Figure 112009034918626-PAT00038
    번째 이슈 태그 빈도(
    Figure 112009034918626-PAT00039
    )에 의해,
    Figure 112009034918626-PAT00040
    와 같이 결정되는
    스니펫 제공 장치.
  6. 스니펫 제공 장치에 있어서,
    사용자 단말로부터 수신된 쿼리(Query)를 분석하여 결과 페이지를 출력하는 검색 엔진,
    블로그 페이지들로부터 상기 쿼리에 대응하는 제목 및 본문을 추출하는 제목 및 본문 추출기(Title and Body Extractor) 모듈,
    상기 추출된 본문으로부터 후보 스니펫들을 추출하는 스니펫 추출기(Snippet Extractor) 모듈,
    상기 블로그 페이지들로부터 최신 인기 태그를 수집하고, 상기 수집된 인기 태그들의 빈도와 날짜에 따라 이슈 태그를 선정하는 이슈 태그 수집기(Issue Tag Crawler) 모듈,
    상기 제목과 이슈 태그를 이용하여 후보 스니펫별 점수를 산출하고, 상기 산출된 점수에 따라 스니펫을 선택하는 스니펫 선택기(Snippet Selector) 모듈 및
    상기 선택된 스니펫을 상기 사용자 단말로 전송하는 검색 결과 전송 모듈
    을 포함하는 스니펫 제공 장치.
  7. 제6항에 있어서,
    상기 이슈 태그 수집기 모듈은 상기 태그가 설정된 블로그 페이지의 빈도 수 또는 상기 블로그 페이지들에 설정된 태그들의 날짜에 근거하여 이슈 태그를 수집하는 스니펫 제공 장치.
  8. 제6항에 있어서,
    상기 스니펫 선택부는 쿼리에 따른 쿼리 점수 및 상기 이슈 태그를 고려한 가중치 점수의 합계에 근거하여 스니펫을 선택하되,
    상기 스니펫을 포함하는 웹 페이지가 상기 쿼리를 많이 포함할수록 상기 쿼리 점수가 상승하고,
    상기 스니펫을 포함하는 웹 페이지가 상기 이슈 태그를 많이 포함할수록 상기 가중치 점수가 상승하는 스니펫 제공 장치.
  9. 제6항에 있어서,
    상기 스니펫 선택기 모듈은 상기 스니펫 추출기 모듈에서 추출된 후보 스니펫들 중에서, 쿼리에 따른 쿼리 점수(
    Figure 112009034918626-PAT00041
    )와 제목과 이슈를 고려한 가중치 점수(
    Figure 112009034918626-PAT00042
    )의 합계에 근거하여 스니펫을 선택하되,
    상기 쿼리 점수는, 대상 페이지 전체에서의
    Figure 112009034918626-PAT00043
    번째 쿼리 빈도(
    Figure 112009034918626-PAT00044
    ) 및 해당 스니펫 후보의
    Figure 112009034918626-PAT00045
    번째 쿼리 빈도(
    Figure 112009034918626-PAT00046
    )에 근거하여,
    Figure 112009034918626-PAT00047
    와 같이 결정되고,
    상기 가중치 점수는 대상 페이지 전체에서 쓰인 제목의
    Figure 112009034918626-PAT00048
    번째 단어 빈도(
    Figure 112009034918626-PAT00049
    ), 페이지 전체에서 쓰인
    Figure 112009034918626-PAT00050
    번째 이슈 태그 빈도(
    Figure 112009034918626-PAT00051
    ), 해당 스니펫 후보에서 쓰인 제목의
    Figure 112009034918626-PAT00052
    번째 단어 빈도(
    Figure 112009034918626-PAT00053
    ) 및 해당 스니펫 후보에서
    Figure 112009034918626-PAT00054
    번째 이슈 태그 빈도(
    Figure 112009034918626-PAT00055
    )에 의해,
    Figure 112009034918626-PAT00056
    와 같이 결정되는
    스니펫 제공 장치.
  10. 스니펫 제공 방법에 있어서,
    검색 엔진이 사용자 단말로부터 수신한 쿼리를 분석하고 결과 페이지를 출력하는 단계,
    웹 페이지 데이터베이스 내에 기저장된 웹 페이지들로부터 해당 쿼리에 대응하는 제목 및 본문을 추출하는 단계,
    상기 추출된 본문으로부터 스니펫을 추출하는 단계,
    상기 웹 페이지들로부터 최신 인기 태그를 수집하는 단계,
    상기 수집된 인기 태그들의 빈도와 날짜에 따라 이슈 태그를 선정하는 단계,
    상기 제목과 상기 선정된 이슈 태그를 이용하여 스니펫별 점수를 산출하는 단계,
    상기 산출된 스니펫별 점수에 따라 스니펫을 선택하는 단계 및
    상기 선택된 스니펫을 사용자 단말로 전송하는 단계
    를 포함하는 스니펫 제공 방법.
  11. 제10항에 있어서,
    상기 이슈 태그를 선정하는 단계는 상기 태그가 설정된 웹 페이지의 빈도 수 또는 상기 웹 페이지들에 설정된 태그들의 날짜에 근거하여 상기 이슈 태그를 선정하는 스니펫 제공 방법.
  12. 제10항에 있어서,
    상기 스니펫을 선택하는 단계는
    쿼리에 따른 쿼리 점수 및 상기 이슈 태그를 고려한 가중치 점수에 근거하여 스니펫을 선택하되,
    상기 스니펫을 포함하는 웹 페이지가 상기 쿼리를 많이 포함할수록 상기 쿼리 점수가 상승하고,
    상기 스니펫을 포함하는 웹 페이지가 상기 이슈 태그를 많이 포함할수록 상기 가중치 점수가 상승하는 스니펫 제공 방법.
  13. 제10항에 있어서,
    상기 스니펫을 선택하는 단계는
    쿼리에 따른 쿼리 점수(
    Figure 112009034918626-PAT00057
    )와 제목과 이슈를 고려한 가중치 점수(
    Figure 112009034918626-PAT00058
    )의 합계에 근거하여 스니펫을 선택하되,
    상기 쿼리 점수는, 대상 페이지 전체에서의
    Figure 112009034918626-PAT00059
    번째 쿼리 빈도(
    Figure 112009034918626-PAT00060
    ) 및 해당 스니펫 후보의
    Figure 112009034918626-PAT00061
    번째 쿼리 빈도(
    Figure 112009034918626-PAT00062
    )에 근거하여,
    Figure 112009034918626-PAT00063
    와 같이 결정되고,
    상기 가중치 점수는 대상 페이지 전체에서 쓰인 제목의
    Figure 112009034918626-PAT00064
    번째 단어 빈도(
    Figure 112009034918626-PAT00065
    ), 페이지 전체에서 쓰인
    Figure 112009034918626-PAT00066
    번째 이슈 태그 빈도(
    Figure 112009034918626-PAT00067
    ), 해당 스니펫 후보에서 쓰인 제목의
    Figure 112009034918626-PAT00068
    번째 단어 빈도(
    Figure 112009034918626-PAT00069
    ) 및 해당 스니펫 후보에서
    Figure 112009034918626-PAT00070
    번째 이슈 태그 빈도(
    Figure 112009034918626-PAT00071
    )에 의해,
    Figure 112009034918626-PAT00072
    와 같이 결정되는
    스니펫 제공 방법.
KR1020090051168A 2009-06-09 2009-06-09 스니펫 제공 장치 및 방법 KR101011726B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090051168A KR101011726B1 (ko) 2009-06-09 2009-06-09 스니펫 제공 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090051168A KR101011726B1 (ko) 2009-06-09 2009-06-09 스니펫 제공 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20100132376A true KR20100132376A (ko) 2010-12-17
KR101011726B1 KR101011726B1 (ko) 2011-01-28

Family

ID=43508065

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090051168A KR101011726B1 (ko) 2009-06-09 2009-06-09 스니펫 제공 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101011726B1 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150050140A (ko) * 2013-10-31 2015-05-08 한국전자통신연구원 코퍼스 자동 구축 방법 및 이를 이용한 개체명 인식 방법과 장치
KR20160091756A (ko) * 2015-01-26 2016-08-03 (주)해나소프트 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치
KR101667918B1 (ko) * 2015-08-19 2016-10-21 네이버 주식회사 질의 반응형 스마트 검색 서비스 제공 방법 및 이를 구현하기 위한 검색 서비스 장치
KR101698280B1 (ko) * 2015-12-07 2017-01-19 숭실대학교산학협력단 태그에 대한 웹 페이지 검색 장치 및 방법
KR20190086741A (ko) * 2016-11-23 2019-07-23 구글 엘엘씨 검색 결과에 대한 애니메이션 스니핏
US11019382B2 (en) 2014-04-22 2021-05-25 Google Llc Systems and methods that match search queries to television subtitles

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103198057B (zh) 2012-01-05 2017-11-07 深圳市世纪光速信息技术有限公司 一种自动给文档添加标签的方法和装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040017008A (ko) * 2002-08-20 2004-02-26 주식회사 케이랩 검색엔진을 활용한 정보 제공 시스템 및 그 방법
US7836009B2 (en) * 2004-08-19 2010-11-16 Claria Corporation Method and apparatus for responding to end-user request for information-ranking
US8073830B2 (en) * 2006-03-31 2011-12-06 Google Inc. Expanded text excerpts

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150050140A (ko) * 2013-10-31 2015-05-08 한국전자통신연구원 코퍼스 자동 구축 방법 및 이를 이용한 개체명 인식 방법과 장치
US11019382B2 (en) 2014-04-22 2021-05-25 Google Llc Systems and methods that match search queries to television subtitles
US11743522B2 (en) 2014-04-22 2023-08-29 Google Llc Systems and methods that match search queries to television subtitles
KR20160091756A (ko) * 2015-01-26 2016-08-03 (주)해나소프트 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치
KR101667918B1 (ko) * 2015-08-19 2016-10-21 네이버 주식회사 질의 반응형 스마트 검색 서비스 제공 방법 및 이를 구현하기 위한 검색 서비스 장치
KR101698280B1 (ko) * 2015-12-07 2017-01-19 숭실대학교산학협력단 태그에 대한 웹 페이지 검색 장치 및 방법
KR20190086741A (ko) * 2016-11-23 2019-07-23 구글 엘엘씨 검색 결과에 대한 애니메이션 스니핏

Also Published As

Publication number Publication date
KR101011726B1 (ko) 2011-01-28

Similar Documents

Publication Publication Date Title
JP4936401B2 (ja) ナビゲーションパス情報に基づく主題関連ウェブページのフィルタリング方法およびシステム
JP5431727B2 (ja) 関連性判定方法、情報収集方法、オブジェクト組織化方法及び検索システム
US8051080B2 (en) Contextual ranking of keywords using click data
CN105488196B (zh) 一种基于互联语料的热门话题自动挖掘系统
KR101078864B1 (ko) 질의/문서 주제 범주 변화 분석 시스템 및 그 방법과 이를 이용한 질의 확장 기반 정보 검색 시스템 및 그 방법
US9928296B2 (en) Search lexicon expansion
KR101011726B1 (ko) 스니펫 제공 장치 및 방법
JP5084858B2 (ja) サマリ作成装置、サマリ作成方法及びプログラム
CN103064956A (zh) 用于搜索电子内容的方法、计算系统和计算机可读介质
CN101454748A (zh) 在诸如网站的网页的相关网页中传播有用信息
JP2009048441A (ja) 情報検索システム及び方法及びプログラム並びに情報検索サービス提供方法
CN103838732A (zh) 一种生活服务领域垂直搜索引擎
KR20090006464A (ko) 사용자 맞춤형 컨텐츠 제공 장치, 그 방법 및 기록매체
KR101429397B1 (ko) 소셜 네트워크 서비스의 메시지 분석을 이용한 핵심사건 추출 방법 및 시스템
JP4569380B2 (ja) ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体
JP5313295B2 (ja) 文書探索サービス提供方法及びシステム
KR100913733B1 (ko) 템플릿을 이용한 검색결과 제공방법
CN103955480A (zh) 一种用于确定用户所对应的目标对象信息的方法与设备
KR100455439B1 (ko) 인터넷 자원의 도메인화와 확장 사이트맵을 이용한정보검색 및 브라우징방법
KR20110050823A (ko) 지식노드 연결구조를 생성하기 위한 검색 데이터베이스 구축 장치 및 방법
KR101178208B1 (ko) 키워드 추출 장치 및 방법
JP4759600B2 (ja) 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
JP2010123036A (ja) 文書検索装置、文書検索方法、および文書検索プログラム
KR101132431B1 (ko) 관심 정보 제공 시스템 및 방법
KR101440385B1 (ko) 인디케이터를 이용한 정보 관리 장치

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140106

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150115

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee