KR101122394B1 - 엔트로피 점수를 이용한 검색결과 제공 방법 및 장치 - Google Patents

엔트로피 점수를 이용한 검색결과 제공 방법 및 장치 Download PDF

Info

Publication number
KR101122394B1
KR101122394B1 KR1020090039997A KR20090039997A KR101122394B1 KR 101122394 B1 KR101122394 B1 KR 101122394B1 KR 1020090039997 A KR1020090039997 A KR 1020090039997A KR 20090039997 A KR20090039997 A KR 20090039997A KR 101122394 B1 KR101122394 B1 KR 101122394B1
Authority
KR
South Korea
Prior art keywords
category
document
documents
entropy score
query
Prior art date
Application number
KR1020090039997A
Other languages
English (en)
Other versions
KR20100121044A (ko
Inventor
이우주
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020090039997A priority Critical patent/KR101122394B1/ko
Publication of KR20100121044A publication Critical patent/KR20100121044A/ko
Application granted granted Critical
Publication of KR101122394B1 publication Critical patent/KR101122394B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

사용자에 의해 입력된 쿼리에 대한 검색 결과를 해당 쿼리와 관련되는 카테고리 별로 분류하여 사용자에게 제공할 수 있는 본 발명의 일 측면에 따른 엔트로피 점수를 이용한 검색결과 제공 방법은 사용자로부터 쿼리가 입력되면 상기 쿼리와 연관된 카테고리를 결정하는 단계; 상기 결정된 카테고리의 문서들 중 상기 쿼리가 포함되어 있는 문서들을 추출하는 단계; 상기 추출된 문서 내에 상기 카테고리와 연관된 정보가 포함되어 있는 정도를 나타내는 문서의 엔트로피 점수(Entropy Score)를 이용하여 상기 카테고리 내에서 상기 추출된 문서들의 랭킹을 결정하는 단계; 및 상기 결정된 랭킹에 따라 상기 카테고리 내에서 상기 추출된 문서들을 정렬하여 상기 사용자에게 제공하는 단계를 포함한다.
검색, 엔트로피, 카테고리, 분류

Description

엔트로피 점수를 이용한 검색결과 제공 방법 및 장치{Method and Apparatus for Providing Search Result Using Entropy Score}
본 발명은 인터넷을 이용한 서비스 제공에 관한 것으로서 보다 구체적으로 인터넷을 이용한 검색 서비스 제공에 관한 것이다.
인터넷의 발달 및 보급의 증가로 인해 인터넷을 이용한 다양한 서비스가 제공되고 있는데, 그 중 대표적인 예가 검색 서비스라 할 수 있다. 검색 서비스란 사용자로부터 입력되는 쿼리에 대해 검색을 수행한 후 입력된 쿼리에 상응하는 검색 결과 문서(예컨대, 사용자로부터 입력된 검색 쿼리를 포함하는 웹 사이트, 기사, 또는 해당 검색 쿼리를 포함하는 파일명을 갖는 이미지 등)를 사용자에게 제공하는 서비스를 의미한다.
이러한 검색 서비스를 제공함에 있어서 종래에는, 사용자들이 자신이 입력한 쿼리에 대한 검색 결과들을 보다 쉽게 열람할 수 있도록 하기 위하여 사용자에 의해 입력된 쿼리에 대한 검색 결과를 "뉴스", "이미지", "카페", "블로그" 등과 같이 미리 정해진 카테고리 별로 분류하여 사용자에게 제공하였다.
구체적으로, 종래 기술에 따른 검색 서비스의 경우, 사용자로부터 쿼리가 입 력되면, 입력된 쿼리에 대한 검색 결과들을 미리 정해진 카테고리 별로 분류하고, 각 카테고리 내에서는 사용자로부터 입력된 쿼리와 각 검색결과 문서들간의 유사도를 계산하여, 그 유사도가 높은 검색 결과문서가 해당 카테고리 내에서 상단에 노출되도록 각 검색 결과 문서들을 정렬하여 사용자에게 제공하였다.
그러나, 상술한 바와 같은 검색 서비스의 경우, 검색 결과 문서 내에 사용자로부터 입력된 쿼리가 많이 포함되어 있어 그 유사도는 높지만 실제로 검색 결과 문서 내에 해당 쿼리 또는 해당 카테고리에 관련된 정보들은 많이 포함되어 있지 않은 검색 결과 문서들이 해당 카테고리 내에서 상단에 제공될 수 있어, 검색 서비스의 신뢰도가 저하될 수 있다는 문제점이 있었다.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 사용자에 의해 입력된 쿼리에 대한 검색 결과를 해당 쿼리와 관련되는 카테고리 별로 분류하여 사용자에게 제공할 수 있는 엔트로피 점수를 이용한 검색결과 제공 방법 및 장치를 제공하는 것을 기술적 과제로 한다.
또한, 본 발명은 사용자에 의해 입력된 쿼리에 대한 검색결과를 해당 쿼리와의 연관도가 높은 카테고리 순서대로 정렬하여 제공할 수 있는 엔트로피 점수를 이용한 검색결과 제공 방법 및 장치를 제공하는 것을 다른 기술적 과제로 한다.
또한, 본 발명은 각 문서 내에 해당 문서가 포함된 카테고리와 관련된 정보가 포함된 정도를 점수화하고, 그 점수에 따라 각 카테고리 내에서 문서들의 랭킹을 결정할 수 있는 엔트로피 점수를 이용한 검색결과 제공 방법 및 장치를 제공하는 것을 또 다른 기술적 과제로 한다.
상술한 목적을 달성하기 위한 본 발명의 일 측면에 따른 엔트로피 점수를 이용한 검색결과 제공 방법은 사용자로부터 쿼리가 입력되면 상기 쿼리와 연관된 카테고리를 결정하는 단계; 상기 결정된 카테고리의 문서들 중 상기 쿼리가 포함되어 있는 문서들을 추출하는 단계; 상기 추출된 문서 내에 상기 카테고리와 연관된 정보가 포함되어 있는 정도를 나타내는 문서의 엔트로피 점수(Entropy Score)를 이용하여 상기 카테고리 내에서 상기 추출된 문서들의 랭킹을 결정하는 단계; 및 상기 결정된 랭킹에 따라 상기 카테고리 내에서 상기 추출된 문서들을 정렬하여 상기 사용자에게 제공하는 단계를 포함한다.
일 실시예에 있어서, 상기 카테고리 결정 단계 이전에, 상기 각 문서들을 통계학적인 학습 알고리즘을 이용하여 미리 정해진 카테고리 별로 분류하는 단계; 상기 각 문서의 엔트로피 점수를 산출하는 단계; 및 상기 각 문서와 상기 각 문서의 엔트로피 점수를 매칭시켜 상기 카테고리 별로 저장하는 단계를 더 포함할 수 있다.
이때, 상기 엔트로피 점수 산출 단계에서, 상기 문서의 엔트로피 점수는 상기 문서에 포함된 각 단어의 엔트로피 점수의 합산 결과값과 상기 문서의 길이의 비율을 이용하여 산출되는 것을 특징으로 하며, 상기 문서의 길이는 상기 문서에 포함된 모든 단어의 개수인 것을 특징으로 한다.
또한, 상기 단어의 엔트로피 점수는, 특정 카테고리의 모든 문서에 포함된 상기 단어의 개수와 상기 카테고리의 모든 문서에 포함된 총 단어의 개수의 비율인 제1 확률값과, 각 카테고리 별로 산출된 상기 제1 확률값의 합인 제2 확률값을 이용하여 결정되는 것을 특징으로 한다.
구체적으로, 각 단어의 엔트로피 점수는, 각 카테고리 별로 상기 제1 확률값 및 상기 제2 확률값의 비율인 제3 확률값과 상기 제3 확률값의 로그값의 곱을 산출하여 모두 합산한 결과값으로 정의되는 것을 특징으로 한다.
한편, 상기 랭킹 결정 단계에서, 상기 각 카테고리 내에서, 상기 문서의 엔트로피 점수가 높은 순서대로 상기 추출된 문서들의 랭킹을 결정하거나, 상기 각 카테고리 내에서, 상기 문서의 엔트로피 점수가 낮은 순서대로 상기 추출된 문서들의 랭킹을 결정하는 것을 특징으로 한다.
또한, 상기 카테고리 결정 단계에서, 상기 쿼리와 연관된 카테고리는 정보 이론(Information Theory)에서 정의된 정보 이득(Information Gain) 기법을 이용하여 결정하는 것을 특징으로 하고, 상기 제공 단계에서, 상기 쿼리와 연관된 카테고리가 복수개인 경우, 상기 정보 이득에 따른 연관도가 높은 카테고리 순서대로 상기 카테고리들을 정렬하여 상기 사용자에게 제공하는 것을 특징으로 한다.
한편, 상기 문서는 블로그 또는 카페를 포함하는 인터넷 커뮤니티의 포스트인 것을 특징으로 한다.
상술한 목적을 달성하기 위한 본 발명의 다른 측면에 따른 엔트로피 점수를 이용한 검색결과 제공 장치는, 사용자로부터 쿼리가 입력되면 상기 쿼리와 연관된 카테고리를 결정하는 카테고리 결정부; 상기 결정된 카테고리의 문서들 중 상기 쿼리가 포함되어 있는 문서들을 추출하고, 상기 추출된 문서 내에 상기 카테고리와 연관된 정보가 포함되어 있는 정도를 나타내는 문서의 엔트로피 점수를 이용하여 상기 카테고리 내에서 상기 추출된 문서들의 랭킹을 결정하며, 결정된 랭킹에 따라 상기 추출된 문서들을 정렬하는 문서 랭킹 결정부; 및 상기 사용자로부터 상기 쿼리를 수신하고, 상기 문서 랭킹 결정부에 상기 카테고리 내에서 정렬된 상기 추출된 문서들을 상기 사용자에게 제공하는 사용자 인터페이스부를 포함한다.
상술한 바와 같이 본 발명에 따르면, 사용자에 의해 입력된 쿼리에 대한 검 색 결과를 해당 쿼리와 관련되는 카테고리 별로 분류하여 사용자에게 제공함으로써 해당 쿼리에 대한 검색결과를 보다 효율적으로 사용자에게 제공할 수 있다는 효과가 있다.
또한, 본 발명은 사용자에 의해 입력된 쿼리에 대한 검색 결과를 해당 쿼리와의 연관도가 높은 카테고리 순서대로 정렬하여 제공하기 때문에 사용자가 검색결과를 열람하는 경우 해당 쿼리와 가장 연관도가 높은 카테고리에 포함된 문서들을 먼저 열람할 수 있고, 따라서 사용자에게 사용자가 원하는 검색결과를 보다 빨리 제공할 수 있다는 효과가 있다.
또한, 본 발명은 각 검색 결과 문서 내에 해당 문서가 포함된 카테고리와 관련된 정보가 포함된 정도를 점수화하고, 그 점수에 따라 각 카테고리 내에서 문서들의 랭킹을 결정함으로써, 해당 문서가 속하는 카테고리와 관련된 정보를 많이 포함하고 있는 문서들을 사용자들이 먼저 열람할 수 있어 검색 만족도를 향상시킬 수 있다는 효과가 있다.
이하 첨부된 도면을 참조하여 본 발명의 실시예에 대해 상세히 설명한다.
도 1은 본 발명의 일 실시예에 따른 엔트로피 점수를 이용한 검색결과 제공 장치(이하, '검색결과 제공 장치'라 함)의 개략적인 블럭도이다. 도시된 바와 같이 검색결과 제공 장치(100)는 문서 분류부(110), 엔트로피 점수 산출부(120), 데이터베이스(130), 사용자 인터페이스부(140), 카테고리 결정부(150), 문서 랭킹 결정부(160)를 포함한다.
문서 분류부(110)는 인터넷 상에서의 문서들을 통계학적인 학습 알고리즘을 이용하여 미리 정해진 카테고리 별로 분류한다. 일 실시예에 있어서, 문서 분류부(110)는 나이브 베이지안과 같은 통계학적인 학습 알고리즘을 이용하여 인터넷 상에서의 문서들을 분류할 수 있다. 이때, 분류 대상이 되는 인터넷 상에서의 문서들은 블로그나 카페와 같은 인터넷 커뮤니티의 포스트일 수 있다.
상술한 실시예에 있어서, 문서 분류부(110)는 학습 알고리즘을 이용하여 인터넷 상에서의 문서들을 미리 정해진 카테고리 별로 분류하는 것으로 기재하였지만, 변형된 실시예에 있어서 해당 문서를 작성한 문서 작성자들이 해당 문서 작성시, 해당 문서가 속하는 카테고리를 직접 입력한 경우, 해당 문서는 문서 작성자에 의해 입력된 카테고리로 분류될 수 있다.
즉, 문서 분류부(110)는 도 2에 도시된 바와 같이, 각 문서들을 영화, 음악, 또는 스포츠와 같이 미리 정해진 카테고리 별로 자동으로 분류하는 기능을 수행한다.
다음으로, 엔트로피 점수 산출부(120)는, 각 문서의 엔트로피 점수를 산출하고, 산출된 각 문서의 엔트로피 점수를 각 문서와 매칭시켜 해당 문서가 속하는 카테고리 별로 저장한다.
여기서, 문서의 엔트로피 점수란 각 문서가 해당 문서가 속하는 카테고리와 연관된 정보를 얼마나 많이 포함하고 있는지를 점수화한 것을 의미하는 것으로, 일 실시예에 있어서, 엔트로피 점수 산출부(120)는, 아래의 수학식 1에 기재된 바와 같이, 문서에 포함된 각 단어의 엔트로피 점수의 합산 결과값과 각 문서의 길이의 비율을 이용하여 각 문서의 엔트로피 점수를 산출할 수 있다.
Figure 112009027581961-pat00001
수학식 1에서, Text Entropy는 각 문서의 엔트로피 점수를 의미하고, Word-t의 entropy는 단어 t의 엔트로피 점수를 의미하며, text len은 해당 문서의 길이를 의미하는 것으로서, 도시된 바와 같이, 문서에 n개의 단어가 포함되어 있는 경우 해당 문서에 포함된 n개의 단어의 엔트로피 점수를 모두 합산한 후 그 결과값을 해당 문서의 길이로 나눔으로써 해당 문서의 엔트로피 점수를 산출하게 된다.
일 실시예에 있어서, 문서의 길이는 각 문서에 포함된 모든 단어의 개수로 정의될 수 있다.
한편, 엔트로피 점수 산출부(120)는 특정 단어의 엔트로피 점수를 특정 단어가 특정 카테고리에 포함된 문서 내에서의 출현할 확률을 이용하여 산출할 수 있다.
구체적으로, 엔트로피 점수 산출부(120)는 특정 카테고리의 모든 문서에 포함된 특정 단어의 개수와 상기 카테고리의 모든 문서에 포함된 총 단어의 개수의 비율을 산출함으로써 특정 단어가 특정 카테고리의 문서 내에서 출현할 제1 확률값을 계산한다. 이를 수학식으로 표현하면 아래의 수학식 2와 같다.
Figure 112009027581961-pat00002
수학식 2에서,
Figure 112009027581961-pat00003
은 특정 단어 W가 카테고리n의 문서 내에서 출현할 제1 확률값을 의미한다.
이후, 엔트로피 점수 산출부(120)는 제1 확률값을 정규화(Normalize)한다. 일 실시예에 있어서 엔트로피 점수 산출부(120)는 각 카테고리 별로 제1 확률값을 산출한 후 산출된 결과값을 모두 합산함으로써 제2 확률값을 산출하고, 특정 카테고리에서의 제1 확률값을 제2 확률값으로 나눔으로써 특정 카테고리에서의 제1 확률값을 정규화할 수 있다. 이를 수학식으로 표현하면 아래의 수학식 3과 같다.
Figure 112009027581961-pat00004
수학식 3에서
Figure 112009027581961-pat00005
는 제1 확률값의 정규화된 값을 의미하고,
Figure 112009027581961-pat00006
는 제2 확률값을 의미한다.
본 발명에서 제1 확률값을 정규화하는 이유는, 제1 확률값의 크기에 관계없이 평탄도를 기준으로 각 단어의 엔트로피 점수를 일관성 있게 조정하기 위해서 이며, 이를 위해 각각의 제1 확률값을 모든 카테고리에 대해 산출된 제1 확률값들의 합으로 나눔으로써 정규화하는 것이다.
만약, 이와 같이 정규화 과정을 거치지 않는다면 특정 카테고리의 문서 내에서 높은 빈도로 출현하는 단어는 평탄도에 관계없이 엔트로피 점수가 높게 나오고, 특정 카테고리의 문서 내에서 낮은 빈도로 출현하는 단어는 그 반대로 평탄도에 관계없이 엔트로피 점수나 낮게 나올 수 있게 되므로, 이러한 정규화 과정을 통해 제1 확률값을 정규화하는 것이 바람직하다.
이후, 엔트로피 점수 산출부(120)는 각 카테고리 별로 정규화된 제1 확률값과 정규화된 제1 확률값에 로그를 취한 값을 곱한 값을 산출하고, 그 결과값을 모두 합산함으로써 특정 단어에 대한 엔트로피 점수를 산출할 수 있다. 이를 수학식으로 표현하면 아래의 수학식 4와 같다.
Figure 112009027581961-pat00007
수학식 4에서 Word Entropy는 특정 단어 W의 엔트로피 점수를 의미한다.
상술한 엔트로피 점수 산출부(120)에 의해 산출된 특정 단어들의 엔트로피 점수의 예가 도 3에 도시되어 있다. 도 3을 참조하면, 특정 단어 W1의 엔트로피 점수(310)는 제1 카테고리에서 높고 나머지 제2 내지 제4 카테고리에서는 낮음을 알 수 있고, 특정 단어 W2의 엔트로피 점수(320)는 모든 카테고리 내에서 균일하게 높음을 알 수 있으며, 특정 단어 W3의 엔트로피 점수(330)는 제2 카테고리에서는 높고 나머지 제1, 제3, 및 제4 카테고리에서는 낮음을 알 수 있고, 특정 단어 W4의 엔트로피 점수(340)는 모든 카테고리 내에서 균일하게 낮음을 알 수 있다.
상술한 바와 같이, 엔트로피 점수 산출부(120)는 특정 문서에 포함된 모든 단어의 엔트로피 점수를 산출한 후 그 결과값들을 합산하고, 합산 결과값을 해당 문서의 길이로 나눔으로써 해당 문서의 엔트로피 점수를 산출하게 된다.
이후, 엔트로피 점수 산출부(120)는 각 문서의 엔트로피 점수를 각 문서와 매칭시켜 각 문서가 포함되는 카테고리 별로 분류하여 데이터베이스(130)에 저장한다.
다시 도 1을 참조하면, 데이터베이스(130)에는 각 문서들이 각 문서의 엔트로피 점수와 함께 각 문서가 속하는 카테고리 별로 분류되어 저장된다.
다음으로, 사용자 인터페이스부(140)는 사용자에 의해 입력되는 쿼리를 수신하고, 수신된 쿼리와 연관된 카테고리 내에서 후술할 문서 랭킹 결정부(130)에 의해 결정된 각 문서의 랭킹에 따라 정렬된 각 문서들을 사용자에게 제공한다.
즉, 사용자 인터페이스부(140)는 사용자로부터 검색을 위한 쿼리를 입력받고, 입력된 쿼리에 상응하는 검색결과를 제공하는 것으로서, 본 발명에서 사용자 인터페이스부(140)는 쿼리에 상응하는 검색결과(문서)를 제공할 때, 쿼리에 대한 문서들은 해당 쿼리와 연관되는 카테고리 별로 분류되어 제공되며, 각 카테고리에 포함된 문서들은 문서 랭킹 결정부(160)에 의해 결정된 랭킹에 따라 정렬된다.
다음으로, 카테고리 결정부(150)는 사용자 인터페이스부(140)를 통해 수신된 쿼리와 연관된 카테고리를 결정한다. 일 실시예에 있어서, 카테고리 결정부(150)는 정보 이론에서 정의된 정보 이득 기법을 이용하여 수신된 쿼리와 연관된 카테고 리를 결정할 수 있다.
수신된 쿼리와 연관된 카테고리를 결정함에 있어서, 카테고리 결정부(150)는 수신된 쿼리와 연관된 카테고리를 복수개 결정할 수도 있다. 예컨대, 수신된 쿼리가 "이효리"인 경우, 수신된 쿼리와 연관된 카테고리로 "연예" 카테고리 및 "사회" 카레고리를 결정할 수 있다.
문서 랭킹 결정부(160)는 데이터베이스(130)로부터 카테고리 결정부(150)에 의해 결정된 카테고리의 문서들 중 수신된 쿼리가 포함되어 있는 문서들을 추출하고, 추출된 문서의 엔트로피 점수를 이용하여 해당 카테고리 내에서 추출된 문서들의 랭킹을 결정하며, 결정된 문서들의 랭킹에 따라 해당 카테고리 내에서 추출된 문서들을 정렬한다.
일 실시예에 있어서, 문서 랭킹 결정부(160)는 추출된 문서의 엔트로피 점수가 높은 순서대로 추출된 문서들의 랭킹을 결정하거나, 추출된 문서의 엔트로피 점수가 낮은 순서대로 추출된 문서들의 랭킹을 결정할 수 있다.
이때, 해당 카테고리 내에서 추출된 문서들의 엔트로피 점수가 낮은 순서대로 문서들의 랭킹을 결정하는 경우 해당 카테고리에 관련된 내용이 많이 포함되는 문서들이 해당 카테고리 내에서 상단에 배치되고, 해당 카테고리 내에서 추출된 문서들의 엔트로피 점수가 높은 순서대로 문서들의 랭킹을 결정하는 경우 해당 카테고리에 관련된 내용이 많이 포함되어 있지 않은 문서들이 해당 카테고리 내에서 상단에 배치된다.
일 실시예에 있어서, 문서 랭킹 결정부(160)는 특정 카테고리 내에서 각 문 서들을 결정된 문서 랭킹에 따라 정렬하는 것뿐만 아니라, 수신된 쿼리와 연관된 카테고리가 복수개일 경우 해당 쿼리와의 연관도가 높은 순서 또는 낮은 순서대로 각 카테고리를 정렬할 수도 있다.
이때, 수신된 쿼리와 카테고리간의 연관도는 정보 이론(Information Theory)에서 정의된 정보 이득(Information Gain) 기법을 이용하여 산출할 수 있다. 정보 이득 기법은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자라면 그 의미를 쉽게 이해할 수 있는 것이고, 정보 이득 기법은 본 발명의 핵심적인 특징과는 크게 관련이 없는 것이므로 구체적인 설명은 생략하기로 한다.
이와 같이, 본 발명의 일 실시예에 따른 검색결과 제공 장치(100)는 미리 각 문서를 소정 카테고리 별로 분류하여 저장하되, 각 문서마다 해당 카테고리와 연관된 정보를 포함하고 있는 정도를 점수화한 엔트로피 점수를 산출하여 함께 저장하고, 사용자로부터 입력된 쿼리에 대한 검색결과를 해당 쿼리와 연관된 카테고리 별로 분류하여 제공하되 각 카테고리 내에서는 각 카테고리에 포함된 문서들을 해당 문서들의 엔트로피 점수대로 정렬하여 제공하게 된다. 이에 따라, 사용자는 해당 카테고리와 관련된 정보가 포함되어 있는 정도에 따라서 정렬된 문서들을 제공받을 수 있게 된다.
이러한 검색결과 제공 장치(100)를 이용하여 제공되는 검색결과의 예가 도 4에 도시되어 있다. 도시된 바와 같이, 사용자로부터 "독일"이라는 쿼리가 수신되면, 검색결과 제공 장치(100)는 "독일"이라는 쿼리와 연관된 카테고리로 "영화", "세계여행", "자동차"등을 결정하고, 각 카테고리 내에서는 각 카테고리에 포함된 문서들의 엔트로피 점수가 높은 순서대로 각 문서들을 정렬하여 사용자에게 제공함을 알 수 있다.
예컨대, 도 4에서, "영화"라는 카테고리 내에서는 "독일배우 톰 쉴링 Tom Schiling"라는 문서의 엔트로피 점수가 가장 높아 "영화"카테고리 내에서 가장 상단에 배치됨을 알 수 있고, "세계여행"이라는 카테고리 내에서는 "백 80일간의 세계일주 9 (벨기에, 네덜란드, 독일)"이라는 문서의 엔트로피 점수가 가장 높아 "세계여행"카테고리 내에서 가장 상단에 배치됨을 알 수 있다.
또한, "자동차"라는 카테고리 내에서는 "독일차도 못 따라오는 성능의 차 만들었다"라는 문서가 엔트로피 점수가 가장 높아 "자동차" 카테고리 내에서 가장 상단에 배치됨을 알 수 있다.
이하에서는 도 5 및 도 6을 참조하여 본 발명에 따른 엔트로피 점수를 이용한 검색결과 제공 방법에 대해 설명하기로 한다.
도 5는 본 발명의 일 실시예에 따른 문서의 엔트로피 점수 산출 방법을 보여주는 플로우차트이다. 도시된 바와 같이, 각 문서들을 통계학적인 학습 알고리즘을 이용하여 미리 정해진 카테고리 별로 분류한다(S500). 일 실시예에 있어서, 문서들의 분류는 나이브 베이지안과 같은 통계학적인 학습 알고리즘을 이용하여 수행될 수 있고, 분류 대상이 되는 문서들은 블로그나 카페와 같은 인터넷 커뮤니티의 포스트일 수 있다.
한편, 문서 작성시 해당 문서를 작성한 문서 작성자들에 의해 해당 문서가 속하는 카테고리가 미리 결정되어 있는 경우에는, 해당 문서를 문서 작성자에 의해 입력된 카테고리를 이용하여 분류할 수 있다.
다음으로, 특정 단어가 특정 카테고리의 문서 내에서 출현활 제1 확률값을 계산한다(S510). 일 실시예에 있어서 제1 확률값은 상술한 수학식 2에 기재된 바와 같이, 특정 카테고리의 모든 문서에 포함된 특정 단어의 개수와 상기 카테고리의 모든 문서에 포함된 총 단어의 개수의 비율로 정의될 수 있다.
이후, S510에서 특정 카테고리에 대해 산출된 제1 확률값을 정규화한다(S520). 일 실시예에 있어서, 특정 카테고리에 대한 제1 확률값의 정규화는 모든 카테고리들에 대해 제1 확률값을 산출한 후 산출된 제1 확률값들을 합산함으로써 제2 확률값을 산출하고, 특정 카테고리에 대한 제1 확률값을 제2 확률값으로 나눔으로써 수행될 수 있다.
본 발명에서 제1 확률값을 정규화하는 이유는, 제1 확률값의 크기에 관계없이 평탄도를 기준으로 각 단어의 엔트로피 점수를 일관성 있게 조정하기 위해서이며, 이를 위해 특정 카테고리에 대한 제1 확률값을 모든 카테고리에 대해 산출된 제1 확률값들의 합으로 나눔으로써 정규화하는 것이다.
만약, 이와 같이 정규화 과정을 거치지 않는다면 특정 카테고리의 문서 내에서 높은 빈도로 출현하는 단어는 평탄도에 관계없이 엔트로피 점수가 높게 나오고, 특정 카테고리의 문서 내에서 낮은 빈도로 출현하는 단어는 그 반대로 평탄도에 관계없이 엔트로피 점수나 낮게 나올 수 있게 되므로, 이러한 정규화 과정을 통해 제1 확률값을 정규화하는 것이 바람직하다.
다음으로, 각 카테고리 별로 정규화된 제1 확률값과 정규화된 제1 확률값에 로그를 취한 값의 곱을 산출하고 그 결과값을 모두 합산함으로써 특정 단어에 대한 엔트로피 점수를 산출한다(S530).
이후, 특정 문서에 포함된 모든 단어에 대한 상술한 S510 내지 S530을 반복함으로써 모든 단어들의 엔트로피 점수를 산출하고(S540), 각 단어들의 엔트로피 점수들을 이용하여 해당 단어들이 포함되어 있는 문서의 엔트로피 점수를 산출한다(S550). 일 실시예에 있어서, 문서의 엔트로피 점수는, 해당 문서에 포함된 각 단어의 엔트로피 점수들을 합산하고, 합산 결과값을 해당 문서의 길이, 즉 해당 문서에 포함된 총 단어의 개수로 나눔으로써 산출된다.
여기서, 문서의 엔트로피 점수란 각 문서가 해당 문서가 속하는 카테고리와 연관된 정보를 얼마나 많이 포함하고 있는지를 점수화한 것을 의미한다.
이후, 각 문서의 엔트로피 점수를 각 문서와 매칭시켜 각 문서가 포함되는 카테고리 별로 분류하여 데이터베이스에 저장한다(S560).
도 6은 본 발명의 일 실시예에 따른 엔트로피 점수를 이용한 검색결과 제공 방법을 보여주는 플로우차트이다.
도시된 바와 같이, 먼저 사용자에 의해 입력된 쿼리를 사용자로부터 수신한다(S600). 이후, 사용자로부터 수신된 쿼리와 연관된 카테고리를 결정한다(S610). 일 실시예에 있어서, 사용자로부터 수신된 쿼리와 연관된 카테고리는 정보 이론에서 정의된 정보 이득 기법을 이용하여 결정할 수 있는데, 이러한 쿼리와 연관되는 카테고리는 복수개로 결정될 수도 있다.
다음으로, 데이터베이스로부터, 결정된 카테고리에 포함된 문서들 중 수신된 쿼리가 포함되어 있는 문서들을 추출한다(S620). 이후, 추출된 문서들을 추출된 문서들의 엔트로피 점수를 이용하여 각 카테고리 내에서 정렬한다(S630).
일 실시예에 있어서, 문서의 엔트로피 점수가 낮은 순서대로 각 문서들의 랭킹을 결정함으로써 카테고리 내에서 엔트로피 점수가 낮은 순서대로 해당 문서들을 정렬할 수 있다. 다른 실시예에 있어서는 문서의 엔트로피 점수가 높은 순서대로 각 문서들의 랭킹을 결정함으로써 카테고리 내에서 엔트로피 점수가 높은 순서대로 해당 문서들을 정렬할 수 있다.
이후, 카테고리 내에서 정렬된 문서들을 수신된 쿼리에 대한 검색결과로써 사용자에게 제공한다(S640). 일 실시예에 있어서, 검색결과 제공시, 수신된 쿼리에 대한 카테고리가 복수개인 경우, 각 카테고리들은 수신된 쿼리와 연관도가 높은 순서 또는 낮은 순서대로 정렬하여 사용자에게 제공할 수 있다.
상술한 엔트로피 점수를 이용한 검색결과 제공 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터로 판독 가능한 기록 매체에 기록될 수 있다. 이때, 컴퓨터로 판독 가능한 기록매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 한편, 기록매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터로 판독 가능한 기록매체에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM, DVD와 같은 광기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 한편, 이러한 기록매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다.
또한, 프로그램 명령에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
한편, 본 발명이 속하는 기술분야의 당업자는 상술한 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다.
예컨대, 상술한 실시예에 있어서는 미리 모든 문서 마다 엔트로피 점수를 산출하여 데이터베이스에 저장하여 두고, 쿼리가 수신되면 수신된 쿼리가 포함되어 있는 문서들을 추출한 후, 추출된 문서들의 엔트로피 점수를 이용하여 추출된 문서들을 정렬하는 것으로 기재하였지만, 변형된 실시예에 있어서는 쿼리가 수신되면, 쿼리가 포함되어 있는 문서들을 추출하고, 추출된 문서들의 엔트로피 점수를 산출하여 추출된 문서들을 정렬할 수도 있을 것이다.
그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
도 1은 본 발명의 일 실시예에 따른 검색결과 제공 장치의 개략적인 블럭도.
도 2는 문서 분류의 예를 보여주는 도면.
도 3은 단어의 엔트로피 점수의 예를 그래프 형태로 보여주는 도면.
도 4는 본 발명의 일 실시예에 따른 검색결과 제공 장치에 의해 제공되는 검색결과의 예를 보여주는 도면.
도 5는 본 발명의 일 실시예에 따라 문서의 엔트로피를 산출하는 방법을 보여주는 도면.
도 6은 본 발명의 일 실시예에 따른 엔트로피 점수를 이용한 검색결과 제공 방법을 보여주는 플로우차트.
<도면의 주요 부분에 대한 부호의 설명>
100: 검색결과 제공 장치 110: 문서 분류부
120: 엔트로피 점수 산출부 130: 데이터베이스
140: 사용자 인터페이스부 150: 카테고리 결정부
160: 문서 랭킹 결정부

Claims (21)

  1. 문서 분류부, 엔트로피 점수 산출부, 카테고리 결정부, 문서 랭킹 결정부를 포함하는 엔트로피 점수를 이용한 검색결과 제공 장치가 수행하는 검색결과 제공 방법에 있어서,
    상기 문서 분류부가 문서들을 미리 정해진 카테고리 별로 분류하는 단계;
    상기 엔트로피 점수 산출부가 상기 문서들 각각의 엔트로피 점수를 산출하는 단계;
    상기 엔트로피 점수 산출부가 상기 문서들과 상기 문서의 엔트로피 점수를 매칭시켜 상기 카테고리 별로 저장하는 단계;
    상기 카테고리 결정부가 사용자로부터 쿼리가 입력되면 상기 쿼리와 연관된 적어도 하나의 카테고리를 결정하는 단계;
    상기 문서 랭킹 결정부가 상기 결정된 카테고리의 문서들 중 상기 쿼리가 포함되어 있는 문서들을 추출하는 단계; 및
    상기 문서 랭킹 결정부가 상기 추출된 문서 내에 상기 카테고리와 연관된 정보가 포함되어 있는 정도를 나타내는 문서의 엔트로피 점수(Entropy Score)를 이용하여 상기 카테고리 내에서 상기 추출된 문서들의 랭킹을 결정하는 단계
    를 포함하고,
    상기 랭킹 결정 단계는,
    상기 쿼리와 연관된 카테고리가 복수인 경우, 상기 카테고리들을 상기 쿼리와 연관도가 높은 카테고리 순서로 정렬하고, 상기 쿼리와의 연관도에 따라 정렬된 카테고리들별로 엔트로피 점수에 기초하여 카테고리와 연관된 문서들을 정렬하는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 방법.
  2. 삭제
  3. 제1항에 있어서, 상기 엔트로피 점수 산출 단계에서,
    상기 문서의 엔트로피 점수는 상기 문서에 포함된 각 단어의 엔트로피 점수의 합산 결과값과 상기 문서의 길이의 비율을 이용하여 산출되는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 방법.
  4. 제3항에 있어서,
    상기 문서의 길이는 상기 문서에 포함된 모든 단어의 개수인 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 방법.
  5. 제3항에 있어서,
    상기 단어의 엔트로피 점수는, 특정 카테고리의 모든 문서에 포함된 상기 단어의 개수와 상기 카테고리의 모든 문서에 포함된 총 단어의 개수의 비율인 제1 확률값과, 각 카테고리 별로 산출된 상기 제1 확률값의 합인 제2 확률값을 이용하여 결정되는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 방법.
  6. 제5항에 있어서,
    상기 단어의 엔트로피 점수는, 각 카테고리 별로 상기 제1 확률값 및 상기 제2 확률값의 비율인 제3 확률값과 상기 제3 확률값의 로그값의 곱을 산출하여 모두 합산한 결과값으로 정의되는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 방법.
  7. 제1항에 있어서, 상기 랭킹 결정 단계에서,
    상기 각 카테고리 내에서, 상기 문서의 엔트로피 점수가 높은 순서대로 상기 추출된 문서들의 랭킹을 결정하거나, 상기 문서의 엔트로피 점수가 낮은 순서대로 상기 추출된 문서들의 랭킹을 결정하는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 방법.
  8. 제1항에 있어서, 상기 카테고리 결정 단계에서,
    상기 쿼리와 연관된 카테고리는 정보 이론(Information Theory)에서 정의된 정보 이득(Information Gain) 기법을 이용하여 결정하는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 방법.
  9. 제1항에 있어서,
    상기 검색 결과 제공 장치는 사용자 인터페이스부를 더 포함하고,
    상기 사용자 인터페이스부는 상기 결정된 랭킹에 따라 상기 카테고리 내에서 상기 추출된 문서들을 정렬하여 상기 사용자에게 제공하는 단계
    를 더 포함하는 검색결과 제공 방법.
  10. 제1항에 있어서,
    상기 문서는 블로그 또는 카페를 포함하는 인터넷 커뮤니티의 포스트인 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 방법.
  11. 제1항, 제3항 내지 제10항 중 어느 하나의 항에 기재된 방법을 수행하기 위한 프로그램이 기록된 컴퓨터로 판독 가능한 기록매체.
  12. 문서들을 미리 정해진 카테고리 별로 분류하는 문서 분류부;
    상기 문서들 각각의 엔트로피 점수를 산출하고, 산출된 문서의 엔트로피 점수를 문서와 매칭시켜 상기 카테고리 별로 저장하는 엔트로피 점수 산출부;
    사용자로부터 쿼리가 입력되면 상기 쿼리와 연관된 적어도 하나의 카테고리를 결정하는 카테고리 결정부; 및
    상기 결정된 카테고리의 문서들 중 상기 쿼리가 포함되어 있는 문서들을 추출하고, 상기 추출된 문서 내에 상기 카테고리와 연관된 정보가 포함되어 있는 정도를 나타내는 문서의 엔트로피 점수를 이용하여 상기 카테고리 내에서 상기 추출된 문서들의 랭킹을 결정하며, 결정된 랭킹에 따라 상기 추출된 문서들을 정렬하는 문서 랭킹 결정부
    를 포함하고,
    상기 문서 랭킹 결정부는,
    상기 쿼리와 연관된 카테고리가 복수인 경우, 상기 카테고리들을 상기 쿼리와 연관도가 높은 카테고리 순서로 정렬하고, 상기 쿼리와의 연관도에 따라 정렬된 카테고리들별로 엔트로피 점수에 기초하여 카테고리와 연관된 문서들의 랭킹을 정렬하는 것을 특징으로 하는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 장치.
  13. 제12항에 있어서,
    상기 각 문서들이 상기 각 문서의 엔트로피 점수와 함께 상기 각 문서가 속하는 카테고리 별로 분류되어 저장되어 있는 데이터베이스를 더 포함하는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 장치.
  14. 삭제
  15. 제12항에 있어서,
    상기 엔트로피 점수 산출부는, 상기 문서에 포함된 각 단어의 엔트로피 점수의 합산 결과값과 상기 문서에 포함된 단어 개수의 비율을 이용하여 상기 문서의 엔트로피 점수를 산출하는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 장치.
  16. 제15항에 있어서,
    상기 엔트로피 점수 산출부는, 상기 카테고리의 모든 문서에 포함된 특정 단어의 개수와 상기 카테고리의 모든 문서에 포함된 총 단어의 개수의 비율인 제1 확률값 및 상기 각 카테고리 별로 산출된 상기 제1 확률값의 합인 제2 확률값을 이용하여 상기 각 단어의 엔트로피 점수를 산출하는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 장치.
  17. 제16항에 있어서,
    상기 엔트로피 점수 산출부는, 상기 각 카테고리 별로, 상기 제1 확률값 및 상기 제2 확률값의 비율인 제3 확률값과 상기 제3 확률값의 로그값의 곱을 모두 합산함으로써 상기 각 단어의 엔트로피 점수를 산출하는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 장치.
  18. 제12항에 있어서,
    상기 문서 랭킹 결정부는, 상기 각 카테고리 내에서 상기 문서의 엔트로피 점수가 높은 순서대로 상기 추출된 문서들의 랭킹을 결정하거나, 상기 문서의 엔트로피 점수가 낮은 순서대로 상기 추출된 문서들의 랭킹을 결정하는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 장치.
  19. 제12항에 있어서,
    상기 카테고리 결정부는, 정보 이론에서 정의된 정보 이득 기법을 이용하여 상기 쿼리와 연관된 카테고리를 결정하는 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 장치.
  20. 제12항에 있어서,
    상기 사용자로부터 상기 쿼리를 수신하고, 상기 문서 랭킹 결정부에 상기 카테고리 내에서 정렬된 상기 추출된 문서들을 상기 사용자에게 제공하는 사용자 인터페이스부
    를 더 포함하는 검색결과 제공 장치.
  21. 제12항에 있어서,
    상기 문서는 블로그 또는 카페를 포함하는 인터넷 커뮤니티의 포스트인 것을 특징으로 하는 엔트로피 점수를 이용한 검색결과 제공 장치.
KR1020090039997A 2009-05-08 2009-05-08 엔트로피 점수를 이용한 검색결과 제공 방법 및 장치 KR101122394B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090039997A KR101122394B1 (ko) 2009-05-08 2009-05-08 엔트로피 점수를 이용한 검색결과 제공 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090039997A KR101122394B1 (ko) 2009-05-08 2009-05-08 엔트로피 점수를 이용한 검색결과 제공 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020110112149A Division KR101454677B1 (ko) 2011-10-31 2011-10-31 엔트로피 점수를 이용한 검색결과 제공 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20100121044A KR20100121044A (ko) 2010-11-17
KR101122394B1 true KR101122394B1 (ko) 2012-03-23

Family

ID=43406450

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090039997A KR101122394B1 (ko) 2009-05-08 2009-05-08 엔트로피 점수를 이용한 검색결과 제공 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101122394B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117763116B (zh) * 2023-12-26 2024-07-30 中数通信息有限公司 一种面向用户问答的知识文本抽取方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040063822A (ko) * 2003-01-06 2004-07-14 마이크로소프트 코포레이션 구조화 문서 검색
KR100785928B1 (ko) * 2006-07-04 2007-12-17 삼성전자주식회사 멀티모달 정보를 이용한 사진 검색 방법 및 사진 검색시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040063822A (ko) * 2003-01-06 2004-07-14 마이크로소프트 코포레이션 구조화 문서 검색
KR100785928B1 (ko) * 2006-07-04 2007-12-17 삼성전자주식회사 멀티모달 정보를 이용한 사진 검색 방법 및 사진 검색시스템

Also Published As

Publication number Publication date
KR20100121044A (ko) 2010-11-17

Similar Documents

Publication Publication Date Title
CN107832414B (zh) 用于推送信息的方法和装置
US20210056571A1 (en) Determining of summary of user-generated content and recommendation of user-generated content
US9122680B2 (en) Information processing apparatus, information processing method, and program
CN107657048B (zh) 用户识别方法及装置
CN102982153B (zh) 一种信息检索方法及其装置
US9436768B2 (en) System and method for pushing and distributing promotion content
US9483557B2 (en) Keyword generation for media content
US8738635B2 (en) Detection of junk in search result ranking
US20150213361A1 (en) Predicting interesting things and concepts in content
US20110231347A1 (en) Named Entity Recognition in Query
US20120246100A1 (en) Methods and systems for extracting keyphrases from natural text for search engine indexing
CN103544186B (zh) 挖掘图片中的主题关键词的方法和设备
CN109451147B (zh) 一种信息展示方法及装置
JP2005302042A (ja) マルチセンスクエリについての関連語提案
CN110287314B (zh) 基于无监督聚类的长文本可信度评估方法及系统
CN103577452A (zh) 用于丰富网站内容的方法和装置、网站服务器
US11816135B2 (en) Method, system, and computer program product for retrieving relevant documents
CN101477563A (zh) 一种短文本聚类的方法、系统及其数据处理装置
US20120117043A1 (en) Measuring Duplication in Search Results
US9164981B2 (en) Information processing apparatus, information processing method, and program
CN114021577A (zh) 内容标签的生成方法、装置、电子设备及存储介质
KR20100023630A (ko) 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체
KR101178208B1 (ko) 키워드 추출 장치 및 방법
CN111414471A (zh) 用于输出信息的方法和装置
JP6025487B2 (ja) フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
A107 Divisional application of patent
AMND Amendment
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20151223

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170117

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190102

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20200102

Year of fee payment: 9