KR101135126B1 - 메타데이터 기반 색인 및 검색 장치와 그 방법 - Google Patents

메타데이터 기반 색인 및 검색 장치와 그 방법 Download PDF

Info

Publication number
KR101135126B1
KR101135126B1 KR1020080116977A KR20080116977A KR101135126B1 KR 101135126 B1 KR101135126 B1 KR 101135126B1 KR 1020080116977 A KR1020080116977 A KR 1020080116977A KR 20080116977 A KR20080116977 A KR 20080116977A KR 101135126 B1 KR101135126 B1 KR 101135126B1
Authority
KR
South Korea
Prior art keywords
metadata
query
search
unit
index data
Prior art date
Application number
KR1020080116977A
Other languages
English (en)
Other versions
KR20090063092A (ko
Inventor
임수종
김현기
허정
서희철
윤여찬
최미란
장명길
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Publication of KR20090063092A publication Critical patent/KR20090063092A/ko
Application granted granted Critical
Publication of KR101135126B1 publication Critical patent/KR101135126B1/ko

Links

Images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)

Abstract

개인 휴대 단말기에 저장된 개인 정보 및 미디어 파일의 메타데이터 기반 색인 및 검색 장치와 그 방법이 개시된다. 휴대 단말기는 메타데이터 추출부로 수신된 개인 정보 또는 미디어 파일을 입력받아 메타데이터를 추출한다. 이렇게 추출된 메타데이터는 메타데이터 색인부로 입력되고, 형태소 분석 또는 n-gram 분석을 통해 개별 메타데이터별 색인 데이터를 생성하여 저장한다. 사용자가 검색하고자 하는 개인 정보 또는 미디어 파일에 관련된 사용자 질의를 질의 분석부로 입력하면, 이를 분석하여 메타데이터 검색부로 입력한다. 메타데이터 검색부는 메타데이별 색인 데이터 및 통합 메타데이터 색인 데이터를 찾아 그 검색 결과를 출력한다. 이에 따라, 휴대 단말기에서 생성된 모든 개인 정보 및 미디어 파일에 대하여 통합 또는 개별 메타데이터를 지정하여 검색 결과를 제공한다.

Description

메타데이터 기반 색인 및 검색 장치와 그 방법{METADATA BASED INDEXING AND RETRIEVING APPARATUS AND METHOD}
본 발명은 데이터 파일의 저장과 검색에 관한 것으로서, 특히 휴대 단말기에서의 데이터 파일의 저장과 검색에 관한 것이다.
본 발명은 정보통신부 및 정보통신연구진흥원의 IT 성장동력기술개발사업의 일환으로 수행한 연구로부터 도출된 것이다[과제관리번호: 2005-S-117-03, 과제명:유비쿼터스 지향 지능형 개인용 미디어 관리 기술개발(Development of Intelligent Personal Media Managing Technology for Ubiquitous Environment)].
휴대폰과 같은 휴대단말기에서의 데이터 검색은 전화번호나 주소록에 주로 국한되어 있었다. 그러나 휴대단말기 용량의 증가로 인하여 메모, 일정, 문자 메시지 등의 개인 정보와 이미지, 음성, 동영상 등의 미디어 파일도 휴대단말기에 저장, 관리되면서 다양한 검색 수요가 나타나게 되었다.
현재, 휴대 단말기의 검색은 서버-클라이언트 구조를 이용한 웹 검색에 치중되어 있고 휴대 기기 자체 내에 내장(embedded)되어 모바일 기기의 데이터를 검색 하기 위해 간단한 DB 시스템을 사용하거나 트리(tree) 형태의 간단한 색인 구조를 이용하고 있다. 그러나 휴대 단말기의 검색은 이러한 간단한 구조를 갖고 있기 때문에 복잡하거나 많은 양의 데이터를 색인/검색하지 못한다.
이와 같이 휴대 단말기의 저장 공간은 증가하는 반면, 거기에 저장되는 데이터 파일들에 대한 검색 능력에는 한계가 존재해왔다. 즉 종래에는 휴대 단말기에서 전화번호나 파일명과 같은 단순한 검색 대상에 대한 검색만을 제공했기 때문에, 휴대 단말기에서 개인 정보나 미디어 파일에 대한 사용자의 접근이 불편했다.
본 발명의 목적은, 휴대 단말기에 저장되는 방대한 양의 데이터를 기존과 같이 단순하게 저장하고 검색하는 것이 아니라, 해당 데이터에 의미가 있는 메타데이터 단위로 해당 데이터를 색인하여 저장함으로써, 휴대 단말기라는 제한된 환경에서도 효율적인 데이터 검색이 가능한 메타데이터 기반 색인 및 검색 장치와 그 방법을 제공하는 것이다.
상기 목적을 달성하기 위하여 본 발명의 메타데이터 기반 색인 및 검색 장치는, 휴대 단말기에 입력되는 입력 데이터로부터 메타데이터를 추출하는 메타데이터 추출부와, 상기 입력 데이터에 대한 검색 시의 검색 대상이 될 색인 데이터를 상기 추출된 메타데이터로부터 생성하는 메타데이터 색인부와, 상기 생성된 색인 데이터를 메타데이터별로 저장하는 메타데이터별 색인 데이터 저장부와, 사용자로부터 입력된 질의로부터 메타데이터 검색용 질의를 생성하는 질의 분석부와, 상기 생성된 메타데이터 검색용 질의에 대응하는 색인 데이터를 상기 메타데이터별 색인 데이터 저장부에서 검색하여 그 검색 결과를 제공하는 메타데이터 검색부를 포함한다.
상기 입력 데이터는 개인 정보 및 미디어 파일을 포함할 수 있다. 또한, 상기 메타데이터 추출부는, 상기 개인 정보와 관련된 메타데이터를 추출하기 위한 개인 정보 메타데이터 추출기와, 상기 미디어 파일과 관련된 메타데이터를 추출하기 위한 미디어 파일 메타데이터 추출기를 포함할 수 있다. 이때, 상기 개인 정보는 일정을 포함하고, 상기 일정에 관한 메타데이터는 제목, 분류, 일정에 대한 설명, 최종 수정 날짜 시각 정보 중 하나 이상을 포함할 수 있다. 또한, 상기 미디어 파일은 오디오 파일을 포함하고, 오디오 파일의 메타데이터는 가수, 앨범명, 쟝르, 재생시간, 재생 빈도, 앨범 제작년도, 가사, 저작권, 포맷 중 하나 이상의 정보를 포함할 수 있다.
상기 메타데이터는 입력되는 데이터들에 공통인 공통 메타데이터와, 입력되는 데이터마다 고유한 고유 메타데이터를 포함할 수 있다.
상기 메타데이터 색인부는, 형태소 분석 또는 n-gram 분석에 의해 상기 메타데이터로부터 상기 색인 데이터를 생성할 수 있다.
상기 메타데이터별 색인 데이터 저장부는, 메타데이터의 지정없이 입력 데이터를 검색할 수 있도록, 상기 메타데이터별 색인 데이터들을 한 곳에 저장할 수 있다.
상기 질의 분석부는, 상기 입력된 질의의 형태에 따라 서로 다른 메타데이터 검색용 질의를 생성할 수 있다. 이때, 상기 입력된 질의의 형태는, 전체 메타데이터를 대상으로 한 검색에 이용될 키워드를 포함하는 통합 키워드 질의 및 특정 메타데이터를 대상으로 한 검색에 이용될 키워드를 포함하는 메타데이터 지정 질의를 포함할 수 있으며, 선택적으로 자연어 질의를 더 포함할 수 있다. 상기 자연어 질의는 상기 통합 키워드 질의 또는 메타데이터 지정 질의 중 어느 하나로 변환되는 것이 바람직하다.
상기 메타데이터 검색부는, 상기 메타데이터 검색용 질의의 형태에 따라 서로 다른 검색 방법에 의해 상기 메타데이터별 색인 데이터 저장부를 검색할 수 있다. 즉 상기 메타데이터 검색용 질의가 전체 메타데이터를 대상으로 한 질의인 경우에, 상기 메타데이터 검색부는 전체 메타데이터의 색인 데이터를 대상으로 검색을 수행하고, 상기 메타데이터 검색용 질의가 특정 메타데이터를 대상으로 한 질의인 경우에, 상기 메타데이터 검색부는 당해 특정 메타데이터의 색인 데이터를 대상으로 검색을 수행한다. 또한, 상기 특정 메타데이터는 하나 또는 복수의 메타데이터일 수 있다.
또한, 상기 목적을 달성하기 위하여 본 발명의 메타데이터 기반 색인 및 검색 방법은, 휴대 단말기에 저장되는 개인 정보 및 미디어 파일의 메타데이터 기반 색인 및 검색 방법으로서, 메타데이터 추출부에 의해, 상기 개인 정보 및 미디어 파일을 입력받아 메타데이터를 추출하는 단계와, 메타데이터 색인부에 의해, 상기 개인 정보 및 미디어 파일에 대한 검색 시의 검색 대상이 될 색인 데이터를 상기 추출된 메타데이터로부터 생성하는 단계와, 메타데이터별 색인 데이터 저장부에 의해, 상기 생성된 색인 데이터를 메타데이터별로 저장하는 단계와, 질의 분석부에 의해, 사용자로부터 입력된 질의로부터 메타데이터 검색용 질의를 생성하는 단계와, 메타데이터 검색부에 의해, 상기 생성된 메타데이터 검색용 질의에 대응하는 색인 데이터를 상기 메타데이터별 색인 데이터 저장부에서 검색하여 그 검색 결과를 제공하는 단계를 포함한다.
본 발명에 따르면, 휴대 단말기에 저장된 개인 정보와 미디어 파일을 각각 메타데이터에 의해 색인하여 저장하고, 입력되는 사용자 질의로부터 메타데이터 검색용 질의를 생성하여 그것을 바탕으로 검색을 수행함으로써, 방대한 양의 휴대 단말기의 데이터에 대한 신속하고 효율적인 검색이 가능하다.
또한, 본 발명에 따르면, 추출가능한 많은 메타데이터를 이용하여 색인 및 검색을 수행함으로써 검색 속도와 검색 성능을 향상시킬 수 있다.
이하, 본 발명의 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 실시예에 따른 메타데이터 기반 색인 및 검색 장치의 구성도이다. 본 실시예의 장치는 개인 휴대 단말기에 저장된 개인 정보 및 미디어 파일을 메타데이터를 기반으로 색인하고 검색한다. 이하에서는 개인 정보나 미디어 파일에 대해 본 실시예를 설명하지만, 휴대 단말기에 입력되어 저장되는 입력 데이터라면 모두 본 실시예의 대상이 될 수 있다.
본 실시예의 장치는, 메타데이터 추출부(10), 메타데이터 색인부(20), 메타데이터별 색인 데이터 저장부(30), 질의 분석부(40), 및 메타데이터 검색부(50)를 포함한다.
메타데이터 추출부(10)는 개인 휴대 단말기에서 개인 정보 또는 미디어 파일 에 공통인 공통 메타데이터를 추출하고, 개인 정보 또는 미디어 파일에 고유한 고유 메타데이터를 추출한다. 또한, 메타데이터 추출부(10)는 개인 정보와 관련된 메타데이터를 추출하기 위한 개인 정보 메타데이터 추출기, 및 미디어 파일과 관련된 메타데이터를 추출하기 위한 미디어 파일 메타데이터 추출기를 포함한다.
메타데이터 색인부(20)는, 메타데이터 추출부(10)로부터 추출된 개인 정보 또는 미디어 파일의 개별 메타데이터를 형태소 분석 또는 n-gram 분석 방법에 의해 분석하고, 독립된 저장 구조를 이용하여 색인한다. 또한, 통합 검색을 위해, 개인 정보 또는 미디어 파일과 관련된 메타데이터별 색인 데이터는 모두 메타데이터별 색인 데이터 저장부(30)에 저장된다.
메타데이터별 색인 데이터 저장부(30)는 메타데이터 색인부(20)로부터 제공된 개인 정보 또는 미디어 파일과 관련된 메타데이터별 색인 데이터를 트리(tree) 형태의 일정한 저장 구조에 저장한다.
질의 분석부(40)는 사용자가 입력하는 질의(41)의 형태에 따라 메타데이터 검색용 질의를 생성한다. 사용자가 입력하는 질의(41)는 통합 키워드 질의, 메타데이터 지정 질의 및 자연어 질의를 포함한다. 통합 키워드 질의는 특정 메타데이터에 대한 정보없이 일반적인 검색에서 사용되는 키워드로 구성된 질의를 말한다. 메타데이터 지정 질의는, 특정 메타데이터와 키워드를 매칭시킨 형태의 질의를 말한다. 자연어 질의는 명사 단위의 키워드가 아닌 구문 형태의 자연어로 구성된 질의를 말한다. 자연어 질의는 형태소 분석 과정을 거쳐 통합 키워드 질의 또는 메타데이터 지정 질의의 형태가 된다. 결과적으로, 메타데이터 검색용 질의는, 통합 키워 드 질의 또는 메타데이터 지정 질의의 형태 중 어느 하나의 형태로 생성된다.
메타데이터 검색부(50)는 질의 분석부(40)로부터 생성된 메타데이터 검색용 질의를 받아 메타데이터별 색인 데이터 저장부(30)를 검색하여, 해당하는 메타데이터별 색인 데이터를 찾아 그 검색 결과(51)를 사용자에게 제공한다.
메타데이터 검색부(50)는 질의 분석부(40)로부터 수신받은 메타데이터 검색용 질의를, 사용자의 의도에 맞게 통합 질의, 1개의 메타데이터 지정 질의, 2개 이상의 메타데이터 지정 질의로 구분하여 효율적으로 메타데이터 기반 검색을 수행한다.
도 2는 휴대 단말기에 저장된 개인 정보 및 미디어 파일의 메타데이터를 색인하여 저장하고, 사용자 질의를 수신받아 메타데이터 검색용 질의로 검색하는 본 발명의 메타데이터 기반 색인 및 검색방법을 도시한 흐름도이다.
휴대 단말기에서 생성된 개인 정보 또는 미디어 파일이 메타데이터 추출부(10)로 입력되면, 메타데이터 추출부(10)는 개인 정보 및 미디어 파일의 특성에 관련된 개별 메타데이터를 추출한다(S100).
메타데이터 추출부(10)로부터 추출된 개인 정보 및 미디어 파일과 관련된 개별 메타데이터가 메타데이터 색인부(20)로 입력되면, 메타데이터 색인부(20)는 형태소 분석 또는 n-gram 분석을 통해 메타데이터별로 구분하여 개인 정보 및 미디어 파일을 색인하고, 메타데이터별 색인 데이터를 메타데이터별 색인 데이터 저장부(30)에 저장한다(S200).
휴대 단말기에서 사용자가 검색하고자 하는 개인 정보나 미디어 파일에 대한 사용자 질의(41)를 질의 분석부(40)로 입력받으면, 질의 분석부(40)는 사용자의 질의(41)를 분석하여 메타데이터 검색용 질의를 메타데이터 검색부(50)로 전송한다(S300).
메타데이터 검색부(50)는 질의 분석부(40)로부터 메타데이터 검색용 질의를 수신받아, 메타데이터별 색인 데이터 저장부(30)를 검색하여, 메타데이터별 색인 데이터를 찾아 그 검색 결과(51)를 사용자에게 출력한다(S400).
본 발명의 특징은 메터데이터 색인부(20)에 의해 개인 정보 또는 미디어 파일과 관련된 메타데이터별 색인 데이터를 저장부(30)로 저장하고, 메터데이터 검색부(50)에 의해 사용자가 원하는 개인 정보 및 미디어 파일을 검색하여 사용자에게 그 검색 결과를 제공하는 것이다.
도 3은 메타데이터 추출부에서 메타데이터를 추출하는 방법을 도시한 흐름도이다.
메타데이터 추출부(10)는 추출 대상이 되는 개인 정보 또는 미디어 파일을 입력받아(S101), 먼저 휴대 단말기의 정보중에 공통적으로 추출할 수 있는 공통 메타데이터를 추출한다(S102).
공통 메타데이터의 예는 다음 표 1에 도시하였으며, 이러한 메타데이터를 검색의 필요에 따라 추가 및 삭제가 가능하다.
메타데이터명 설명
MediaType 미디어 타입
File 파일명
Ext 파일 확장자
Path 파일의 절대 경로
Time 파일의 생성 또는 수정 시간
keyword 파일의 키워드(파일에 입력됐을 경우)
descrip 파일 상세 설명(파일에 입력됐을 겨우)
Title 파일 제목(파일에 입력됐을 경우)
creator 파일을 생성한 사용자
공통 메타데이터는 미디어 타입, 파일명, 파일의 확장자, 파일의 절대 경로, 및 파일의 생성 또는 수정 시간 등을 포함하며, 파일의 키워드, 파일 상세 설명, 파일 제목, 및 파일을 생성한 사용자 정보 등이 파일에 입력되어 있을 경우에는 그러한 정보들도 포함한다.
공통 메타데이터를 추출한 후, 메타데이터 추출 분배기는 개인 정보 또는 미디어 파일별로 고유한 고유 메타데이터를 추출하기 위해 파일의 특성을 이용하여 어떤 메타데이터를 추출할 것인지를 결정한다(S103).
메타데이터 추출 분배기는 입력된 데이터에 맞는 추출기를 선택하게 된다.
추출 대상이 개인정보인 경우, 개인 정보 메타데이터 추출기는 개인 정보에 관련된 메타데이터를 추출한다(S104).
추출 대상이 미디어 파일인 경우, 미디어 파일 메타데이터 추출기는 미디어 파일에 관련된 메타데이터를 추출한다(S105).
개인 정보는 일정(schedule), 할 일(To do), 메모(memo), 연락처 전화번호(contact), 및 문자 메시지 등을 포함하고, 필요에 따라 추가 및 삭제가 가능하다. 미디어 파일은 텍스트, 이미지, 음성, 및 동영상 데이터 중 하나 이상의 정보를 포함한다.
일정에 대한 메타데이터의 예는 다음 표2에 도시하였고, 제목, 분류, 일정에 대한 설명, 최종 수정 날짜 시각을 포함한다.
메타데이터명 설명
Title 제목
Category 분류
Note 일정에 대한 설명
ModifiedDate 최종 수정 날짜 시각
미디어 파일은 텍스트, 이미지, 오디오, 비디오를 포함하고, 각각 미디어의 특성에 맞는 메타데이터를 정의할 수 있다.
다음 표 3은 오디오 미디어 파일에 대한 메타데이터의 예이다.
필드명 설명
artist 가수,아티스트
album 앨범명
genre 쟝르
ptime 재생시간, Playing time
freq 재생 빈도
pyear 앨범 제작년도
lyric 가사
rights 저작권
format 포맷
오디오 미디어 파일의 메타데이터는 가수, 앨범명, 쟝르, 재생시간, 재생 빈도, 앨범 제작년도, 가사, 저작권, 포맷 중 하나 이상의 정보를 포함한다.
도 4는 메타데이터 색인부에서 메타데이터별로 색인하는 방법을 도시한 흐름도이다.
메타데이터 색인부(20)는 개인 정보 또는 미디어 파일로부터 추출된 메타데이터를 입력받아(S201) 형태소 분석 또는 n-gram 분석에 의해 메타데이터를 분석하여 색인 단위를 추출한다(S202).
본 발명에서 색인 단위 추출은 형태소 분석 또는 n-gram 분석의 두가지 방법을 사용하였다.
첫번째 형태소 분석을 이용하는 경우, 단어의 어근을 알 수 있으므로 한글의 경우 조사 부착, 영어의 경우 복수나 시제의 변화 등의 단어의 변종이 발생하더라도 어근을 이용하여 찾을 수 있도록 한다.
둘째 n-gram 분석 방법은 형태소 분석이 여의치 않을 경우, 휴대 단말기의 cpu 점유율 등을 낮추기 위해 효과적인 방법이다.
메타데이터 색인부(20)에서 이렇게 분석된 (메타데이터, 색인 단위)는 각각의 개별 메타데이터 별로 색인되고(S203), 이렇게 생성된 메타데이터별 색인 데이터를 메타데이터별 색인 데이터 저장부(30)로 저장한다(S204).
색인 데이터의 저장은, 각각의 개별 메타데이터 별로 색인하여 메타데이터 수만큼의 색인이 생성되도록 행해진다. 또한, 메타데이터를 지정하지 않고 통합 검색이 가능하도록, 색인(indexing)된 모든 메타데이터가 한 곳에 저장된다.
형태소 분석이란 언어의 의미 있는 단위로 분석을 하는 것으로 한국어의 경우 형식 형태소와 실질 형태소 등으로 구분된다. 검색을 위한 색인 단위 추출은 보통 명사만을 대상으로 한다.
다음은 한국어 형태소 분석과 추출되는 색인 단위의 예이다.
문장 : 충청도에 출장을 가서 찍은 사진
형태소 분석 결과:
[충청도에] 충청도/NR+에/JO
[출장] 출장/NN+을/JO
[가서] 가/VV+어서/EM
[찍은] 찍/VV+은/EM
[사진] 사진/NN
(NN:명사, NR;고유명사, JO:조사, VV:동사, EM:어미)
색인 단위:
[충청도에] 충청도
[출장을] 출장
[가서]
[찍은]
[사진] 사진
형태소 분석에 의해 제시된 문장은 '충청도','출장','사진'만 색인 단위로 분석되어 색인된다.
n-gram 분석은 n개의 연속된 음절을 이용하여 색인 단위를 추출하는 방법으로 형태소 분석 등을 사용하기 힘든 경우에 사용하게 된다. n-gram 분석은 비용이 많이 드는 형태소 분석기를 개발할 수 없을 경우 간단한 알고리즘으로 처리되는 장점은 있으나 쓸모없는 데이터까지 색인 단위로 추출되어 색인 데이터의 양이 늘어나 검색 속도가 떨어지고 검색의 정확도가 떨어지게 된다.
다음은 2개의 연속된 음절을 이용하는 bi-gram의 예이다.
문장 : 충청도에 출장 가서 찍은 사진
Bi-gram 분석 결과 색인 단위:
[충청도에] 충청, 청도, 도에
[출장을] 출장, 장을
[가서] 가서
[찍은] 찍은
[사진] 사진
가장 널리 사용되는 bi-gram은, '충청','청도','도에','출장','장을','가서','찍은','사진'이 색인 단위로 추출이 되지만, 밑줄을 그은 색인 단위 이외에는 색인할 필요가 없거나 오히려 색인해서는 안 되는 데이터가 색인 단위로 추출되는 단점이 있다.
도 5는 질의 분석부에서 사용자의 질의에 따라 질의를 분석하는 방법을 도시한 흐름도이다.
질의 분석부(40)는 사용자가 찾고자 하는 대상을 표현한 질의를 입력하면(S301), 입력된 질의에 대해 형태소 분석 과정을 거쳐(S302) 실제로 검색을 하게 되는 메타데이터 검색용 질의를 생성한다(S303).
사용자의 질의는 통합 키워드 질의, 메타데이터 지정 질의, 자연어 질의 등의 3가지 형태가 가능하며, 각각의 최종적인 질의는 다음과 같다.
(1) 통합 키워드 질의: 사용자가 전체 메타데이터를 대상으로 검색을 하고자 할 때 사용하며 일반적인 검색에서 사용하는 키워드로 구성된다.
예) 휴대폰
(2) 메타데이터 지정 질의: 사용자가 특정 메타데이터에서만 찾도록 지정을 하는 경우, '메타데이터명:키워드'와 같은 형태로 질의한다.
예) artist:아이비
(3) 자연어 질의: 사용자가 명사 단위의 키워드가 아닌 자연언어로 질의하는 형태로 형태소 분석 과정과 질의 규칙을 이용하여 통합 키워드 질의 또는 메타데이터 지정 질의 형태가 된다.
예) 확장자가 mp3인 파일 -> Ext:mp3
도 6은 메타데이터 검색부에서 메타데이터를 검색하고 검색 결과를 제공하는 방법을 도시한 흐름도이다.
메타데이터 검색부(50)는 질의 분석부(40)로부터 생성된 메타데이터 검색용 질의를 이용하여 실제로 검색하여(S401), 메타데이터별 색인 데이터 저장부(30)를 조회한다(S402).
메타데이터 검색용 질의를 이용한 검색(S401)은 아래의 3가지 종류로 질의를 분류하여 메타데이터별로 색인된 데이터 중에서 어떤 색인 데이터(30)에서 검색할 것인지를 결정하게 된다.
* 통합 질의 : 통합 색인 데이터를 대상으로 검색
* 1개의 메타데이터 지정 질의 : 지정된 메타데이터의 색인 데이터를 대상으로 검색
* 2개 이상의 메타데이터 지정 질의 : 지정된 2개 이상의 메타데이터 색인 데이터 만을 대상으로 통합하여 검색
위와 같은 방식으로 메타데이터 검색부(50)는 지정된 색인 데이터만을 대상으로 검색하여 그 검색 결과(51)를 휴대 단말기의 사용자에게 제공한다(S403).
개인 정보 및 미디어 파일 메타데이터 기반 색인 및 검색 장치는 이상의 과정을 거쳐 휴대 단말에 저장된 개인 정보 및 미디어 파일에 대하여 각각 검색에 필요한 기 정의된 메타데이터를 추출하고, 형태소 분석 및 n-gram 분석에 의해 개별 메타데이터별로 색인하여 저장하고, 입력된 사용자의 질의를 분석하여 메타데이터를 검색하여 최종적으로 휴대 단말기의 사용자에게 원하는 검색 결과를 제공한다.
이상에서 설명한 바와 같이, 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진자가 하기의 특허청구범위에 기재된 본 발명의 기술적 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 또는 변형하여 실시할 수 있다.
도 1은 본 발명의 실시예에 따른 개인 휴대 단말에 저장된 개인 정보 및 미디어 파일의 메타데이터 기반 색인 및 검색 장치의 구성도.
도 2는 본 발명에 따른 휴대 단말기에 저장된 개인 정보 및 미디어 파일의 메타데이터를 색인하여 저장하고, 사용자 질의를 수신받아 메타데이터 검색용 질의로 검색하는 방법을 도시한 흐름도.
도 3은 메타데이터 추출부에서 메타데이터를 추출하는 방법을 도시한 흐름도.
도 4는 메타데이터 색인부에서 메타데이터별로 색인하는 방법을 도시한 흐름도.
도 5는 질의 분석부에서 사용자의 질의에 따라 질의를 분석하는 방법을 도시한 흐름도.
도 6은 메타데이터 검색부에서 메타데이터를 검색하고 검색 결과를 제공하는 방법을 도시한 흐름도.

Claims (10)

  1. 휴대 단말기에 입력되는 입력 데이터로부터 개인 정보 또는 미디어 파일에 해당하는 메타데이터를 추출하는 메타데이터 추출부와,
    추출된 메타데이터를 형태소 분석 또는 n-gram 분석방법을 통해 분석하고, 검색 대상이 될 색인 데이터를 메타데이터 별로 각각 생성하는 메타데이터 색인부와,
    상기 생성된 색인 데이터를 메타데이터별로 저장하는 메타데이터별 색인 데이터 저장부와,
    사용자로부터 입력된 질의의 형태-전체 메타데이터를 대상으로 한 검색에 이용될 키워드를 포함하는 통합 키워드 질의 및 특정 메타데이터를 대상으로 한 검색에 이용될 키워드를 포함하는 메타데이터 지정 질의를 포함함-에 따라 서로 다른 메타데이터 검색용 질의를 생성하는 질의 분석부와,
    상기 생성된 메타데이터 검색용 질의에 대응하는 색인 데이터를 상기 메타데이터별 색인 데이터 저장부에서 검색하여 그 검색 결과를 제공하는 메타데이터 검색부를 포함하는 메타데이터 기반 색인 및 검색 장치.
  2. 청구항 1에 있어서,
    상기 입력 데이터는 개인 정보 및 미디어 파일을 포함하며, 상기 메타데이터 추출부는, 상기 개인 정보와 관련된 메타데이터를 추출하기 위한 개인 정보 메타데이터 추출기와, 상기 미디어 파일과 관련된 메타데이터를 추출하기 위한 미디어 파일 메타데이터 추출기를 포함하는, 메타데이터 기반 색인 및 검색 장치.
  3. 청구항 1에 있어서,
    상기 메타데이터는 입력되는 데이터들에 공통인 공통 메타데이터와, 입력되는 데이터마다 고유한 고유 메타데이터를 포함하는, 메타데이터 기반 색인 및 검색 장치.
  4. 삭제
  5. 청구항 1에 있어서,
    상기 메타데이터별 색인 데이터 저장부는, 메타데이터의 지정없이 입력 데이터를 검색할 수 있도록, 상기 메타데이터별 색인 데이터들을 한 곳에 저장하는, 메타데이터 기반 색인 및 검색 장치.
  6. 삭제
  7. 청구항 1에 있어서,
    상기 입력된 질의의 형태는 자연어 질의를 더 포함하며, 상기 질의 분석부는, 상기 자연어 질의를 상기 통합 키워드 질의 또는 메타데이터 지정 질의 중 어느 하나로 변환하는, 메타데이터 기반 색인 및 검색 장치.
  8. 청구항 1에 있어서,
    상기 메타데이터 검색부는, 상기 메타데이터 검색용 질의의 형태에 따라 서로 다른 검색 방법에 의해 상기 메타데이터별 색인 데이터 저장부를 검색하는, 메타데이터 기반 색인 및 검색 장치.
  9. 청구항 8에 있어서,
    상기 메타데이터 검색용 질의가 전체 메타데이터를 대상으로 한 질의인 경우에, 상기 메타데이터 검색부는 전체 메타데이터의 색인 데이터를 대상으로 검색을 수행하고, 상기 메타데이터 검색용 질의가 특정 메타데이터를 대상으로 한 질의인 경우에, 상기 메타데이터 검색부는 당해 특정 메타데이터의 색인 데이터를 대상으로 검색을 수행하는, 메타데이터 기반 색인 및 검색 장치.
  10. 삭제
KR1020080116977A 2007-12-12 2008-11-24 메타데이터 기반 색인 및 검색 장치와 그 방법 KR101135126B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070128931 2007-12-12
KR20070128931 2007-12-12

Publications (2)

Publication Number Publication Date
KR20090063092A KR20090063092A (ko) 2009-06-17
KR101135126B1 true KR101135126B1 (ko) 2012-04-16

Family

ID=40992234

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080116977A KR101135126B1 (ko) 2007-12-12 2008-11-24 메타데이터 기반 색인 및 검색 장치와 그 방법

Country Status (1)

Country Link
KR (1) KR101135126B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101667232B1 (ko) 2010-04-12 2016-10-19 삼성전자주식회사 의미기반 검색 장치 및 그 방법과, 의미기반 메타데이터 제공 서버 및 그 동작 방법
KR101463558B1 (ko) * 2013-03-06 2014-11-20 (주)인크루넷 파일 통합 검색 시스템
US10783178B2 (en) * 2016-05-17 2020-09-22 Google Llc Generating a personal database entry for a user based on natural language user interface input of the user and generating output based on the entry in response to further natural language user interface input of the user
KR102113680B1 (ko) * 2018-03-09 2020-05-20 (주)이지서티 빅 데이터 비식별화 처리 시스템 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007234010A (ja) 2006-02-27 2007-09-13 Nhn Corp ローカル端末機検索システム、それに用いられるフィルタリング方法及びこの方法を実行するためのプログラムを記憶した記録媒体

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007234010A (ja) 2006-02-27 2007-09-13 Nhn Corp ローカル端末機検索システム、それに用いられるフィルタリング方法及びこの方法を実行するためのプログラムを記憶した記録媒体

Also Published As

Publication number Publication date
KR20090063092A (ko) 2009-06-17

Similar Documents

Publication Publication Date Title
US11853334B2 (en) Systems and methods for generating and using aggregated search indices and non-aggregated value storage
US7788262B1 (en) Method and system for creating context based summary
CN105045852A (zh) 一种教学资源的全文搜索引擎系统
CN109857898A (zh) 一种海量数字音频指纹存储与检索的方法及系统
CN107844493B (zh) 一种文件关联方法及系统
KR101174057B1 (ko) 인덱스 분석장치와 인덱스 검색장치 및 그 방법
WO2019009995A1 (en) SYSTEM AND METHOD FOR RESEARCHING MUSIC IN NATURAL LANGUAGE
WO2020248378A1 (zh) 业务查询方法、装置及存储介质、计算机设备
KR101135126B1 (ko) 메타데이터 기반 색인 및 검색 장치와 그 방법
CN110633375A (zh) 一种基于政务工作的媒体信息整合利用的系统
JPH0628403A (ja) 文書検索装置
US20140214852A1 (en) Method for producing and using a recursive index of search engines
KR101008877B1 (ko) 디지털 포렌식에서의 검색 및 검색 결과를 제시하는 방법, 그리고 그 장치
Goenka et al. Mobile web search personalization using ontological user profile
CN108733687A (zh) 一种基于文字识别的信息检索方法和系统
Aksan et al. The Turkish National Corpus (TNC): comparing the architectures of v1 and v2
JP7428035B2 (ja) データ検索装置、データ検索方法およびプログラム
US9323753B2 (en) Method and device for representing digital documents for search applications
JP2000339342A (ja) 文書検索方法および文書検索装置
KR20070112681A (ko) 이동통신 단말기의 멀티미디어 파일 검색 장치 및 방법
KR101466403B1 (ko) 플레이리스트 정보를 이용한 키워드 생성장치 및 그 방법
Schedl Web-based and community-based music information extraction
JP2000132439A (ja) パーソナルコンピュータのハードディスクに記憶されたファイルを検索する検索システム
JP2005234635A (ja) 文書要約装置および方法
Singh et al. Bilingual keyword indexing and searching framework

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160318

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170403

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee