KR101856146B1 - 질의자 정보에 기반하여 해쉬를 생성 또는 정합하는 장치 및 방법 - Google Patents

질의자 정보에 기반하여 해쉬를 생성 또는 정합하는 장치 및 방법 Download PDF

Info

Publication number
KR101856146B1
KR101856146B1 KR1020160019574A KR20160019574A KR101856146B1 KR 101856146 B1 KR101856146 B1 KR 101856146B1 KR 1020160019574 A KR1020160019574 A KR 1020160019574A KR 20160019574 A KR20160019574 A KR 20160019574A KR 101856146 B1 KR101856146 B1 KR 101856146B1
Authority
KR
South Korea
Prior art keywords
hash
information
feature value
generating
inquirer
Prior art date
Application number
KR1020160019574A
Other languages
English (en)
Other versions
KR20170097908A (ko
Inventor
서진수
Original Assignee
강릉원주대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 강릉원주대학교산학협력단 filed Critical 강릉원주대학교산학협력단
Priority to KR1020160019574A priority Critical patent/KR101856146B1/ko
Publication of KR20170097908A publication Critical patent/KR20170097908A/ko
Application granted granted Critical
Publication of KR101856146B1 publication Critical patent/KR101856146B1/ko

Links

Images

Classifications

    • G06F17/30628
    • G06F17/30029
    • G06F17/30035

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 질의자 정보에 기반하여 해쉬를 생성 또는 정합하는 장치 및 방법에 관한 것으로서, 보다 상세하게는 대상 컨텐츠의 특징값을 추출하는 특징값 추출부; 질의자 정보를 수집하는 질의자 정보 수집부; 및 질의자 정보를 반영하여 특징값으로부터 해쉬를 생성하는 해쉬 생성부;를 포함한다.

Description

질의자 정보에 기반하여 해쉬를 생성 또는 정합하는 장치 및 방법{APPARATUS AND METHOD FOR GENERATING OR MATCHING HASH BASED ON USER INFORMATION}
본 발명은 질의자 정보에 기반하여 해쉬를 생성 또는 정합하는 장치 및 방법에 관한 것으로, 보다 자세하게는 예제 기반 컨텐츠 검색을 위한 질의 컨텐츠의 해쉬 생성 시에 질의자의 정보를 활용하여, 컨텐츠로부터 추출한 특징값이나 해쉬 생성 파라미터를 변형함으로써 질의자의 정보를 반영한 해쉬를 생성하고, 생성된 해쉬를 기반으로 질의자가 의도한 컨텐츠에 보다 부합하는 정보를 정합하는 방법에 관한 것이다.
본 발명은 2015년도 문화체육관광부 및 한국저작권위원회의 2015년도 저작권기술개발사업의 연구로부터 도출된 것이다[과제관리번호: 2015-related-9500, 과제명: 연관 저작물 검색과 저작권 침해 예방을 위한 예측 탐지 기술 개발 (Design of the hash-extraction function for a content-identification system)].
예제 기반 멀티미디어 컨텐츠(음악, 영상, 비디오 등) 검색 시스템은 질의자가 제시한 예제 멀티미디어 컨텐츠(이하 컨텐츠라고 지칭)와 유사한 컨텐츠를 검색 결과로 제공해주는 서비스이다. 예를 들어, 유사도 비교 대상인 복수의 컨텐츠들로부터 특징을 추출하고 해쉬를 구하여 데이터베이스에 저장해 두면, 질의자의 예제 컨텐츠로부터 위와 같은 방법으로 해쉬를 추출하고 데이터베이스를 검색하여 데이터베이스 상에서 해쉬 비교를 통해 유사한 컨텐츠를 찾게 되는 것이다.
종래에는 컨텐츠 검색을 위한 예제 컨텐츠의 해쉬 생성 시에 질의자의 정보를 고려하지 않았다. 이에 관해 보다 구체적으로 살펴보기 위하여 도 1을 참조하면, 종래에는 해쉬의 생성에 있어 복수의 컨텐츠(1)로부터 특징값 추출부(2)를 이용하여 특징값을 추출하고 해쉬 생성부(3)를 이용하여 이러한 특징값으로부터 곧바로 해쉬를 생성하여 해쉬 데이터베이스(4)에 저장하였다. 아울러, 해쉬의 정합에 있어서도 마찬가지로 질의자의 예제 컨텐츠(5)로부터 특징값 추출부(6)를 이용하여 특징값을 추출하고 해쉬 생성부(7)를 이용하여 이러한 특징값으로부터 곧바로 해쉬를 생성한 뒤, 생성된 해쉬와 해쉬 데이터베이스(4)에 저장된 해쉬 간의 거리 비교를 통해서 그 거리가 가까운 순서로 검색 결과를 출력하였다.
즉, 종래에는 해쉬 생성에 있어서 질의자가 제시한 예제 컨텐츠 정보만 활용하고 그 질의자의 특성(취향 및 기존 컨텐츠 활용 이력)을 고려하지 않았다.
그런데, 예제 컨텐츠가 질의자의 의도를 완벽히 대변해 주지 못하므로 예제 컨텐로부터 얻은 해쉬를 이용하여 데이터베이스 검색 결과를 구할 경우, 질의자가 의도치 않았던 검색 결과가 출력될 수 있다. 예를 들어 음악 검색에서 질의자의 기존 음악 취향 정보가 같이 활용된다면 예제 컨텐츠만을 이용하는 것에 비해서 질의자에게 만족도가 높은 검색 결과를 제공해 줄 수 있다.
이러한 점을 멀티미디어 검색에 반영하기 위해서는, 예제 컨텐츠의 해쉬의 생성에 있어 질의자의 정보를 같이 활용하는 것이 필요하다. 그러나, 종래의 해쉬 생성에 있어서 질의자의 정보를 고려하는 기술은 존재하지 않았다.
본 발명은 이러한 기술적 배경을 바탕으로 발명되었으며, 이상에서 살핀 기술적 요구를 충족시킴은 물론, 본 기술분야에서 통상의 지식을 가진 자가 용이하게 발명할 수 없는 추가적인 기술요소들을 제공하기 위해 발명되었다.
한국 공개특허공보 제10-2015-0122254호: 짧은 용어 해쉬
본 발명의 실시예는 전술한 문제점을 해결하기 위하여 안출된 것으로, 예제 컨텐츠의 해쉬 생성 시에 질의자 정보를 고려하는 것을 목적으로 한다.
또한 질의자 정보에 기반하여 생성된 해쉬로 질의자가 의도한 컨텐츠에 보다 부합하는 정보를 정합하는 것을 목적으로 한다.
한편, 본 발명의 실시예가 이루고자 하는 기술적 과제는 이상에서 언급한 기술적 과제로 제한되지 않으며, 이하에서 설명할 내용으로부터 통상의 기술자에게 자명한 범위 내에서 다양한 기술적 과제가 도출될 수 있다.
전술한 목적을 달성하기 위해 질의자 정보 기반 해쉬 생성 장치는, 대상 컨텐츠의 특징값을 추출하는 특징값 추출부; 질의자 정보를 수집하는 질의자 정보 수집부; 및 상기 질의자 정보를 반영하여 상기 특징값으로부터 해쉬를 생성하는 해쉬 생성부;를 포함할 수 있다.
이때 상기 질의자 정보는, 질의자의 기존 질의 또는 재생했었던 컨텐츠 정보일 수 있다.
또한 상기 해쉬 생성부는, 상기 질의자 정보를 반영하여 상기 특징값을 변형한 후, 상기 변형된 특징값으로부터 해쉬를 생성할 수 있다. 특히 상기 해쉬 생성부는, 상기 질의자 정보가 최신의 정보일수록, 상기 특징값을 변형하는 가중치가 높을 수 있다.
더불어 상기 해쉬 생성부는, 상기 질의자 정보를 반영하여 해쉬를 생성하는 함수의 파라미터를 변형한 후, 상기 해쉬를 생성하는 함수에 상기 특징값을 대입하여 해쉬를 생성할 수 있다.
질의자 정보 기반 해쉬 생성 장치는, 유사한 취향의 질의자 정보를 기준으로 그룹을 나누어, 상기 그룹별로 취향에 기반한 해쉬 생성 파라미터를 저장한 파라미터 저장부; 대상 컨텐츠의 특징값을 추출하는 특징값 추출부; 질의자 정보를 수집하여, 상기 파라미터 저장부로부터 상기 질의자 정보의 그룹에 대응되는 해쉬 생성 파라미터를 추출하는 질의자 정보 수집부; 및 상기 추출된 해쉬 생성 파라미터를 이용하여 상기 특징값으로부터 해쉬를 생성하는 해쉬 생성부;를 포함할 수 있다.
질의자 정보 기반 해쉬 정합 장치는, 복수의 컨텐츠 각각의 특징을 나타내는 해쉬를 저장하는 해쉬 데이터베이스; 정합 대상이 되는 대상 컨텐츠의 특징을 나타내는 특징값을 추출하는 특징값 추출부; 질의자 정보를 수집하는 질의자 정보 수집부; 상기 질의자 정보를 반영하여, 상기 특징값으로부터 해쉬를 생성하는 해쉬 생성부; 및 상기 생성된 해쉬를 상기 복수의 컨텐츠 각각에 대하여 기 저장된 해쉬와 비교하여 검색 결과를 출력하는 정합부;를 포함할 수 있다.
질의자 정보 기반 해쉬 생성 방법은, 대상 컨텐츠의 특징값을 추출하는 단계; 질의자 정보를 수집하는 단계; 및 상기 질의자 정보를 반영하여 상기 특징값으로부터 해쉬를 생성하는 단계;를 포함할 수 있다.
이때 상기 질의자 정보는, 질의자의 기존 질의 또는 재생했었던 컨텐츠 정보일 수 있다.
또한 상기 해쉬를 생성하는 단계는, 상기 질의자 정보를 반영하여 상기 특징값을 변형한 후, 상기 변형된 특징값으로부터 해쉬를 생성할 수 있다. 특히 상기 해쉬를 생성하는 단계는, 상기 질의자 정보가 최신의 정보일수록, 상기 특징값을 변형하는 가중치가 높을 수 있다.
더불어 상기 해쉬를 생성하는 단계는, 상기 질의자 정보를 반영하여 해쉬를 생성하는 함수의 파라미터를 변형한 후, 상기 해쉬를 생성하는 함수에 상기 특징값을 대입하여 해쉬를 생성할 수 있다.
질의자 정보 기반 해쉬 생성 방법은, 유사한 취향의 질의자 정보를 기준으로 그룹을 나누어, 상기 그룹별로 취향에 기반한 해쉬 생성 파라미터를 저장하는 단계; 대상 컨텐츠의 특징값을 추출하는 단계; 질의자 정보를 수집하여, 상기 질의자 정보의 그룹에 대응되는 해쉬 생성 파라미터를 추출하는 단계; 및 상기 추출된 해쉬 생성 파라미터를 이용하여 상기 특징값으로부터 해쉬를 생성하는 단계;를 포함할 수 있다.
질의자 정보 기반 해쉬 정합 방법은, 복수의 컨텐츠 각각의 특징을 나타내는 해쉬를 저장하는 단계; 정합 대상이 되는 대상 컨텐츠의 특징을 나타내는 특징값을 추출하는 단계; 질의자 정보를 수집하는 단계; 상기 질의자 정보를 반영하여 상기 특징값으로부터 해쉬를 생성하는 단계; 및 상기 생성된 해쉬를 상기 복수의 후보 컨텐츠 각각에 대하여 기 저장된 해쉬와 비교하여 검색 결과를 출력하는 단계;를 포함할 수 있다.
본 발명의 실시예를 수행하도록 하는 매체에 저장된 컴퓨터 프로그램은, 대상 컨텐츠의 특징값을 추출하는 단계; 질의자 정보를 수집하는 단계; 및 상기 질의자 정보를 반영하여 상기 특징값으로부터 해쉬를 생성하는 단계;를 수행할 수 있다.
본 발명의 실시예를 수행하도록 하는 프로그램이 기록되고, 전자 장치에서 판독 가능한 기록매체는, 대상 컨텐츠의 특징값을 추출하는 단계; 질의자 정보를 수집하는 단계; 및 상기 질의자 정보를 반영하여 상기 특징값으로부터 해쉬를 생성하는 단계;를 수행하도록 하는 프로그램이 기록될 수 있다.
본 발명의 실시예는 질의자의 정보(취향 및 기존 컨텐츠 활용 이력 등)를 활용한 질의 컨텐츠의 해쉬를 이용하여 질의자의 의도에 부합하는 컨텐츠를 보다 정확하게 검색할 수 있다.
본 발명의 효과는 이상에서 언급한 효과들로 제한되지 않으며, 이하에서 설명할 내용으로부터 통상의 기술자에게 자명한 범위 내에서 다양한 효과들이 포함될 수 있다.
도 1은 종래의 해쉬 생성 및 해쉬 정합에 대한 개념을 예시적으로 도시한 도면이다.
도 2는 본 발명의 일 실시예에 따른 질의자 정보에 기반하여 해쉬를 생성하는 장치의 기능 블록을 나타낸 도면이다
도 3은 본 발명의 일 실시예에 따른 질의자 정보에 기반하여 해쉬를 생성하는 장치에 따라 해쉬가 생성되는 과정을 도시한 도면이다.
도 4는 본 발명의 다른 실시예에 따른 질의자 정보에 기반하여 해쉬를 생성하는 장치에 따라 해쉬가 생성되는 과정을 도시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 질의자 정보에 기반하여 해쉬를 정합하는 장치에 따라 해쉬가 정합되는 과정을 도시한 도면이다.
도 6은 본 발명의 일 실시예에 따른 질의자 정보에 기반하여 해쉬를 생성하는 방법의 순서를 나타낸 도면이다.
도 7은 본 발명의 다른 실시예에 따른 질의자 정보에 기반하여 해쉬를 생성하는 방법의 순서를 나타낸 도면이다.
도 8은 본 발명의 일 실시예에 따른 질의자 정보에 기반하여 해쉬를 정합하는 방법의 순서를 나타낸 도면이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 발명의 실시예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 2는 본 발명의 일 실시예에 따른 질의자 정보에 기반하여 해쉬를 생성하는 장치(100)의 기능 블록을 나타낸 도면이고, 도 3은 본 발명의 일 실시예에 따른 질의자 정보에 기반하여 해쉬를 생성하는 장치(100)에 따라 해쉬가 생성되는 과정을 도시한 도면이다.
여기서 해쉬(hash)란 특정 데이터를 기 설정된 알고리즘을 이용하여 변환한 값일 수 있으며, 이때 알고리즘을 예를 들면, 해쉬 함수(hash function)라고 한다.
보다 구체적으로 해쉬 함수는 임의의 길이의 데이터를 고정된 길이의 데이터로 매핑하는 알고리즘을 포함할 수 있다. 해쉬 함수에 의해 얻어지는 값은 해쉬 값, 해쉬 코드, 체크섬 또는 해쉬 등으로 불리나, 이후 본 발명에서는 해쉬라고 통일하여 지칭한다. 특히 본 발명에서 컨텐츠의 해쉬는 입력값의 차이가 작으면 출력값의 해쉬 차이도 작도록 설계하는 LSH(locality-sensitive hashing), SH(spectral hashing) 등의 해쉬 함수를 사용하여 해쉬를 생성할 수 있다. 더하여 상기 입력값의 차이가 소정의 범위 이내이면 출력값의 해쉬가 같도록 설계할 수도 있다.
한편 본 발명에서는 질의자의 예제 컨텐츠로부터 위와 같은 방법으로 해쉬를 추출하고, 복수의 컨텐츠(1)로부터 추출된 해쉬가 기 저장된 데이터베이스를 검색하여 유사한 컨텐츠를 도출하는데, 질의자의 예제 컨텐츠의 특징에 질의자 정보(10)를 더하거나, 또는 질의자 정보(10)에 따라 해쉬 함수의 파라미터를 변경함으로써 해쉬 생성에 질의자의 정보를 반영하고자 한다.
여기서 예제 컨텐츠란, 질의자가 원하는 컨텐츠 검색을 위해 대비본으로 제시한 컨텐츠 일 수 있다.
도 2 및 도 3을 참조하면, 질의자 정보 기반 해쉬 생성 장치(100)는 특징값 추출부(110), 질의자 정보 수집부(120), 및 해쉬 생성부(130)를 포함할 수 있다.
특징값 추출부(110)는 대상 컨텐츠(5)의 특징값을 추출한다. 이를 위해, 특징값 추출부는 예를 들면 대상 컨텐츠(5)를 복수의 단위(예를 들면 N개)로 분할하여 벡터로 표현하고, 이러한 벡터를 구성하는 요소에 대한 평균값을 특징값으로 산출할 수 있으며, 이와 달리 Haar Wavelet 방식이나 Polar Fourier transform 방식을 이용하여 대상 컨텐츠(5)에 대한 특징값을 추출할 수도 있고 여기서 언급하지 않은 다른 방법에 의해서도 특징값을 추출할 수 있다. 다만, 이하에서는 대상 컨텐츠(5)를 분할(예를 들면 N개)하여 벡터로 표현하고 이러한 벡터를 구성하는 요소에 대한 평균값을 특징값으로 추출하는 방식을 전제로 설명하기로 한다.
대상 컨텐츠(5)를 A라고 하면, A는 다음의 [수학식 1]과 같이 대상 컨텐츠(5)를 N개의 단위로 분할하였을 때, 각 단위에 대응되는 원소
Figure 112016016580944-pat00001
내지
Figure 112016016580944-pat00002
을 포함하는 벡터로 표현될 수 있다.
Figure 112016016580944-pat00003
여기서, 원소
Figure 112016016580944-pat00004
내지
Figure 112016016580944-pat00005
각각은 n개의 원소를 가질 수 있고, 이에 따라
Figure 112016016580944-pat00006
Figure 112016016580944-pat00007
내지
Figure 112016016580944-pat00008
을 각각 단위 원소로 포함할 수 있다. 아울러, A는 예를 들면 실수(real-valued) 벡터일 수 있다.
질의자 정보 수집부(120)는 질의자의 정보를 수집할 수 있다. 이때 질의자 정보(10)는 질의자의 기존 질의 또는 재생했었던 컨텐츠 정보일 수 있으며, 이외에도 질의자의 의도에 부합하는 해쉬를 만들기 위해 반영할 수 있는 정보, 예를 들면 질의자의 주거 지역, 질의자 나이, 및 질의자의 방문 사이트 내역 등을 포함할 수 있다.
해쉬 생성부(130)는 질의자 정보(10)를 반영하여 해쉬 생성 함수를 통해 특징값으로부터 해쉬를 생성할 수 있다. 구체적으로 해쉬 생성부(130)는 컨텐츠의 특징 벡터 A를 미리 정해둔 해쉬 생성 함수를 구성하는 파라미터 벡터들인
Figure 112016016580944-pat00009
,
Figure 112016016580944-pat00010
, ...,
Figure 112016016580944-pat00011
를 이용하여 변환하여 얻어지며, 보통 문턱값과 비교를 통해서 이진화를 하게 된다. 본 실시예에서는 표현의 편의를 위해서 해쉬 생성 파라미터에 이미 문턱값이 포함되어 있다고 보고 아래 [수학식 2]와 같이 부호를 취하여 이진화된 해쉬 (해쉬 길이: M 비트)를 얻어진다고 하자.
Figure 112016016580944-pat00012
위 [수학식 2]에서 i-번째 해쉬 비트 생성 함수
Figure 112016016580944-pat00013
는 특징 벡터 A에 대한 선형과 비선형 함수들을 포함하며, 이때 함수의 파라미터가
Figure 112016016580944-pat00014
이다.
이때 해쉬 생성부(130)는, 질의자 정보(10)를 반영하여 특징값을 변형한 후, 변형된 특징값을 해쉬 생성 함수에 대입하여 해쉬를 생성할 수 있다. 질의자의 특성을 알 수 있는 질의자의 기존 질의 또는 재생했었던 J개의 컨텐츠들로부터 얻은 특징 벡터들을 각각
Figure 112016016580944-pat00015
,
Figure 112016016580944-pat00016
, ...,
Figure 112016016580944-pat00017
라고 하자. 그렇다면 다음 [수학식 3]과 같이 질의 컨텐츠로부터 얻은 특징 벡터 A를 질의자의 특성을 반영하여 다음과 같이 변형을 하여
Figure 112016016580944-pat00018
를 만들 수 있다.
Figure 112016016580944-pat00019
위 [수학식 3]에서 가중치
Figure 112016016580944-pat00020
는 고정된 값이거나, 질의자의 기존 j번째 컨텐츠의 특성에 따라서 가변적으로 정해지게 할 수도 있다. 예를 들어 질의자가 최근에 재생한 컨텐츠에 가중치를 높게 하고, 오래 전에 재생한 경우 가중치를 낮게하는 것이다. 또한 질의자가 j번째 컨텐츠를 질의 또는 재생한 날의 날씨, 계절, 또는 시간대를 함수로 하여 현재 날씨, 계절, 시간대와 일치도를 바탕으로
Figure 112016016580944-pat00021
값이 정해지도록 정할 수도 있다.
이렇게 [수학식 3]을 통해 얻은 벡터
Figure 112016016580944-pat00022
를 [수학식 2]의 A 대신 대입하여 질의 컨텐츠의 해쉬를 얻고 미리 만들어둔 해쉬 데이터베이스를 검색하여 유사도 순서로 검색 결과를 출력할 수 있게 된다.
한편 해쉬 생성부(130)는 다른 실시예로서, 질의자 정보(10)를 반영하여 해쉬를 생성하는 함수의 파라미터를 변형한 후, 해쉬를 생성하는 함수에 특징값을 대입하여 해쉬를 생성할 수 있다.
Figure 112016016580944-pat00023
위 [수학식 4]에서 * 는 벡터 성분끼리 곱을 표기하는 기호이다. 벡터
Figure 112016016580944-pat00024
는 i번째 해쉬 비트에 대해서 질의자의 정보에 따라 해쉬 생성 파라미터 벡터
Figure 112016016580944-pat00025
의 성분들 중 일부는 크게 하고 일부는 줄여줄 수 있다. 본 실시예에서는 [수학식 4]와 같은 곱의 형태 외에도 가산적인 형태 및 선형, 비선형 함수 등 다양한 형태의 해쉬 생성 파라미터인
Figure 112016016580944-pat00026
를 가변해주는 방법들을 포함한다. 이렇게 [수학식 4]를 통해서 얻은 해쉬 생성 파라미터를 [수학식 2]의
Figure 112016016580944-pat00027
대신 대입하여 질의 컨텐츠의 해쉬를 생성하고 미리 만들어둔 해쉬 데이터베이스를 검색하여 유사도 순서로 검색 결과를 출력할 수 있게 된다.
한편 앞서 설명한 [수학식 3]의 특징값(특징 벡터)을 변환하는 특징과, [수학식 4]의 해쉬 생성 파라미터를 변환하는 특징을 동시에 사용하여, [수학식 5]와 같은 해쉬 함수를 사용해 해쉬를 생성할 수도 있다.
Figure 112016016580944-pat00028
도 4는 본 발명의 다른 실시예에 따른 질의자 정보에 기반하여 해쉬를 생성하는 장치(100)에 따라 해쉬가 생성되는 과정을 도시한 도면이다.
도 4를 참조하면, 질의자 정보(10) 기반 해쉬 생성 장치는, 파라미터 저장부(140), 특징값 추출부(110), 질의자 정보 수집부(120), 및 해쉬 생성부(130)를 포함할 수 있다.
본 실시예의 특징값 추출부(110) 및 해쉬 생성부(130)는 앞서 도 3과 함께 설명한 실시예에서의 구성과 역할이 같으므로 이에 관한 자세한 설명은 생략한다.
파라미터 저장부(140)는 유사한 취향의 질의자 정보(10)를 기준으로 그룹을 나누어, 그룹별로 취향에 기반한 해쉬 생성 파라미터를 저장하고, 질의자 정보 수집부(120)는 질의자 정보(10)를 수집하여, 파라미터 저장부(140)로부터 질의자 정보(10)의 그룹에 대응되는 해쉬 생성 파라미터를 추출할 수 있다.
예를 들어 파라미터 저장부(140)는 비슷한 취향의 질의자들을 모아서 크기 K인 군집을 미리 만들어 두고, 각 군집별로 학습을 통해서 해쉬 생성 파라미터인
Figure 112016016580944-pat00029
를 학습한다. 질의자의 취향은 질의자에게 어떠한 장르, 분위기의 컨텐츠를 선호하는지 간단한 질문들을 하거나, 기존 질의 또는 재생 컨텐츠들을 활용하여 구할 수 있다. 이후 질의자 정보 수집부(120)는 미리 만들어둔 군집들 중 현재 질의자가 어느 곳에 속하는 지 알게 되면, 질의자가 속하는 군집의 해쉬 생성 파라미터를 추출하여, 해쉬 생성부(130)가 추출한 해쉬 생성 파라미터를 [수학식 2]의
Figure 112016016580944-pat00030
대신 대입하고, 질의 컨텐츠의 해쉬를 생성하고 미리 만들어둔 해쉬 데이터베이스를 검색하여 유사도 순서로 검색 결과를 출력할 수 있게 된다.
도 5는 본 발명의 일 실시예에 따른 질의자 정보에 기반하여 해쉬를 정합하는 장치(200)에 따라 해쉬가 정합되는 과정을 도시한 도면이다.
도 5를 참조하면, 질의자 정보 기반 해쉬 정합 장치(200)는, 해쉬 데이터베이스(205), 특징값 추출부(210), 질의자 정보 수집부(220), 해쉬 생성부(230), 및 정합부(240)를 포함할 수 있다.
본 실시예의 특징값 추출부(210), 질의자 정보 수집부(220) 및 해쉬 생성부(230)는 앞서 도 3과 함께 설명한 실시예에서의 구성과 역할이 같으므로 생략한다.
해쉬 데이터베이스(205)는 복수의 컨텐츠로부터 추출된 각각의 특징값을 통해 생성된 복수의 해쉬를 저장한다. 이렇게 저장된 해쉬는 질의자가 제시한 컨텐츠로부터 생성된 해쉬와 정합 대상이 된다.
정합부(240)는 특징값으로부터 해쉬를 생성하는 과정해서 질의자 정보를 반영하여 생성된 해쉬와, 복수의 후보 컨텐츠 각각에 대하여 해쉬 데이터베이스에 기 저장된 해쉬 간의 거리를 비교하여 검색 결과를 출력할 수 있다.
이때 질의자 정보 수집부(220)는 질의자 정보를 반영해 특징값을 변형하거나, 또는 해쉬 생성 파라미터를 변형하여 해쉬를 생성할 수 있다.
한편 생성된 해쉬와 복수의 후보 컨텐츠 각각에 대하여 해쉬 데이터베이스(205)에 기 저장된 해쉬 간의 거리는, 해쉬 간의 정합 정도를 판단하는 공지된 기술을 사용하여 구할 수 있다.
한편 상술한 실시예들이 포함하는 특징값 추출부(110, 210), 질의자 정보 수집부(120, 220), 해쉬 생성부(130, 230), 이 들을 포함하는 질의자 정보 기반 해쉬 생성 장치(100) 및 질의자 정보 기반 해쉬 정합 장치(200)는 이 들의 기능을 수행하도록 프로그램된 명령어를 포함하는 메모리, 및 상기 명령을 수행하는 마이크로프로세서를 포함하는 연산 장치에 의해 구현될 수 있다.
이하에서는 방법의 관점에서 본 발명의 질의자 정보 기반 해쉬 생성 또는 정합 방법을 설명하며, 장치의 관점에서 이미 설명되었던 구성적 측면의 설명은 생략한다.
도 6은 본 발명의 일 실시예에 따른 질의자 정보에 기반하여 해쉬를 생성하는 방법의 순서를 나타낸 도면이며, 방법의 각 단계는 질의자 정보 기반 해쉬 생성 장치(100)에 의해 구현될 수 있다.
도 6을 참조하면, 본 발명의 일 실시예에 따른 질의자 정보 기반 해쉬 생성 방법은 대상 컨텐츠의 특징값을 추출하는 단계(S610); 질의자 정보를 수집하는 단계(S620); 및 질의자 정보를 반영하여 특징값으로부터 해쉬를 생성하는 단계(S630);를 포함한다.
이때 질의자 정보는, 질의자의 기존 질의 또는 재생했었던 컨텐츠 정보일 수 있다.
또한 해쉬를 생성하는 단계는, 질의자 정보를 반영하여 특징값을 변형한 후, 변형된 특징값으로부터 해쉬를 생성할 수 있다. 이때 해쉬를 생성하는 단계는, 질의자 정보가 최신의 정보일수록, 상기 특징값을 변형하는 가중치가 높은 것을 특징으로 할 수 있다.
아울러 해쉬를 생성하는 단계는, 질의자 정보를 반영하여 해쉬를 생성하는 함수에 특징값을 대입하여 해쉬를 생성할 수 있다.
도 7은 본 발명의 다른 실시예에 따른 질의자 정보에 기반하여 해쉬를 생성하는 방법의 순서를 나타낸 도면이며, 방법의 각 단계는 질의자 정보 기반 해쉬 생성 장치(100)에 의해 구현될 수 있다.
도 7을 참조하면, 본 발명의 다른 실시예에 따른 질의자 정보 기반 해쉬 생성 방법은, 유사한 취향의 질의자 정보를 기준으로 그룹을 나누어, 그룹별로 취향에 기반한 해쉬 생성 파라미터를 저장하는 단계(S710); 대상 컨텐츠의 특징값을 추출하는 단계(S720); 질의자 정보를 수집하여, 질의자 정보의 그룹에 대응되는 해쉬 생성 파라미터를 추출하는 단계(S730); 및 추출된 해쉬 생성 파라미터를 이용하여 특징값으로부터 해쉬를 생성하는 단계(S740);를 포함한다.
도 8은 본 발명의 일 실시예에 따른 질의자 정보에 기반하여 해쉬를 정합하는 방법의 순서를 나타낸 도면이며, 방법의 각 단계는 질의자 정보 기반 해쉬 정합 장치(200)에 의해 구현될 수 있다.
도 8을 참조하면, 본 발명의 일 실시예에 따른 질의자 정보 기반 해쉬 정합 방법은, 복수의 컨텐츠 각각의 특징을 나타내는 해쉬를 저장하는 단계(S810); 정합 대상이 되는 대상 컨텐츠의 특징을 나타내는 특징값을 추출하는 단계(S820); 질의자 정보를 수집하는 단계; 질의자 정보를 반영하여 특징값으로부터 해쉬를 생성하는 단계(S830); 및 생성된 해쉬를 복수의 후보 컨텐츠 각각에 대하여 기 저장된 해쉬와 비교하여 검색 결과를 출력하는 단계(S840);를 포함한다.
따라서 이와 같이 상술한 본 발명의 실시예들을 통해 질의자의 정보(취향 및 기존 컨텐츠 활용 이력 등)를 활용한 질의 컨텐츠의 해쉬를 이용하여 질의자의 의도에 부합하는 컨텐츠를 보다 정확하게 검색할 수 있다.
아울러 본 발명의 상술한 실시예에 따른 방법은 매체에 저장된 컴퓨터 프로그램으로 구현될 수 있고, 상술한 실시예에 따른 방법을 수행하도록 하는 전자 장치에서 판독 가능한 기록매체에 기록될 수 있다.
본 발명에 첨부된 블록도의 각 블록과 흐름도의 각 단계의 조합들은 컴퓨터 프로그램 인스트럭션들에 의해 수행될 수도 있다. 이들 컴퓨터 프로그램 인스트럭션들은 범용 컴퓨터, 특수용 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서에 탑재될 수 있으므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비의 프로세서를 통해 수행되는 그 인스트럭션들이 블록도의 각 블록 또는 흐름도의 각 단계에서 설명된 기능들을 수행하는 수단을 생성하게 된다. 이들 컴퓨터 프로그램 인스트럭션들은 특정 방식으로 기능을 구현하기 위해 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 지향할 수 있는 컴퓨터 이용 가능 또는 컴퓨터 판독 가능 메모리에 저장되는 것도 가능하므로, 그 컴퓨터 이용가능 또는 컴퓨터 판독 가능 메모리에 저장된 인스트럭션들은 블록도의 각 블록 또는 흐름도 각 단계에서 설명된 기능을 수행하는 인스트럭션 수단을 내포하는 제조 품목을 생산하는 것도 가능하다. 컴퓨터 프로그램 인스트럭션들은 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에 탑재되는 것도 가능하므로, 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비 상에서 일련의 동작 단계들이 수행되어 컴퓨터로 실행되는 프로세스를 생성해서 컴퓨터 또는 기타 프로그램 가능한 데이터 프로세싱 장비를 수행하는 인스트럭션들은 블록도의 각 블록 및 흐름도의 각 단계에서 설명된 기능들을 실행하기 위한 단계들을 제공하는 것도 가능하다.
또한 각 블록 또는 각 단계는 특정된 논리적 기능(들)을 실행하기 위한 하나 이상의 실행 가능한 인스트럭션들을 포함하는 모듈, 세그먼트 또는 코드의 일부를 나타낼 수 있다. 또, 몇 가지 대체 실시예들에서는 블록들 또는 단계들에서 언급된 기능들이 순서를 벗어나서 발생하는 것도 가능함을 주목해야 한다. 예컨대, 잇달아 도시되어 있는 두 개의 블록들 또는 단계들은 사실 실질적으로 동시에 수행되는 것도 가능하고 또는 그 블록들 또는 단계들이 때때로 해당하는 기능에 따라 역순으로 수행되는 것도 가능하다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
1: 복수의 컨텐츠
2: 특징값 추출부
3: 해쉬 생성부
4: 해쉬 데이터베이스
5: 정합 대상 컨텐츠
6: 특징값 추출부
7: 해쉬 생성부
8: 정합부
10: 질의자 정보
100: 질의자 정보 기반 해쉬 생성 장치
110: 특징값 추출부
120: 질의자 정보 수집부
130: 해쉬 생성부
140: 파라미터 저장부
200: 질의자 정보 기반 해쉬 정합 장치
205: 해쉬 데이터베이스
210: 특징값 추출부
220: 질의자 정보 수집부
230: 해쉬 생성부
240: 정합부

Claims (16)

  1. 대상 컨텐츠의 특징값을 추출하는 특징값 추출부와,
    질의자 정보를 수집하는 질의자 정보 수집부와,
    상기 질의자 정보를 반영하여 상기 특징값으로부터 해쉬를 생성하는 해쉬 생성부를 포함하고,
    상기 해쉬 생성부는,
    상기 질의자 정보를 반영하여 상기 특징값을 변형한 후, 상기 변형된 특징값으로부터 해쉬를 생성하는 질의자 정보 기반 해쉬 생성 장치.
  2. 제1항에 있어서,
    상기 질의자 정보는,
    질의자의 기존 질의 또는 재생했었던 컨텐츠 정보인 질의자 정보 기반 해쉬 생성 장치.
  3. 삭제
  4. 제1항에 있어서,
    상기 해쉬 생성부는,
    상기 질의자 정보가 최신의 정보일수록, 상기 특징값을 변형하는 가중치가 높도록 설정하는 질의자 정보 기반 해쉬 생성 장치.
  5. 제1항에 있어서,
    상기 해쉬 생성부는,
    상기 질의자 정보를 반영하여 해쉬를 생성하는 함수의 파라미터를 변형한 후, 상기 해쉬를 생성하는 함수에 상기 특징값을 대입하여 해쉬를 생성하는 질의자 정보 기반 해쉬 생성 장치.
  6. 제1항에 있어서,
    유사한 취향의 기존 질의자 정보를 기준으로 그룹을 나누고, 상기 그룹 별로 상기 유사한 취향에 기반한 해쉬 생성 파라미터를 저장하는 파라미터 저장부를 더 포함하고,
    상기 질의자 정보 수집부는,
    상기 파라미터 저장부로부터 상기 수집한 질의자 정보가 나타내는 취향에 대응하는 그룹의 해쉬 생성 파라미터를 추출하고,
    상기 해쉬 생성부는,
    상기 추출된 해쉬 생성 파라미터를 이용하여 상기 특징값으로부터 해쉬를 생성하는
    질의자 정보 기반 해쉬 생성 장치.
  7. 복수의 컨텐츠 각각의 특징을 나타내는 해쉬를 저장하는 해쉬 데이터베이스와,
    정합 대상이 되는 대상 컨텐츠의 특징을 나타내는 특징값을 추출하는 특징값 추출부와,
    질의자 정보를 수집하는 질의자 정보 수집부와,
    상기 질의자 정보를 반영하여, 상기 특징값으로부터 해쉬를 생성하는 해쉬 생성부와,
    상기 생성된 해쉬를 상기 복수의 컨텐츠 각각에 대하여 기 저장된 해쉬와 비교하여 검색 결과를 출력하는 정합부를 포함하고,
    상기 해쉬 생성부는,
    상기 질의자 정보를 반영하여 상기 특징값을 변형한 후, 상기 변형된 특징값으로부터 해쉬를 생성하는 질의자 정보 기반 해쉬 정합 장치.
  8. 해쉬 생성 장치에 의해 수행되는 질의자 정보 기반 해쉬 생성 방법에 있어서,
    대상 컨텐츠의 특징값을 추출하는 단계와,
    질의자 정보를 수집하는 단계와,
    상기 질의자 정보를 반영하여 상기 특징값으로부터 해쉬를 생성하는 단계를 포함하고,
    상기 해쉬를 생성하는 단계는,
    상기 질의자 정보를 반영하여 상기 특징값을 변형한 후, 상기 변형된 특징값으로부터 해쉬를 생성하는 질의자 정보 기반 해쉬 생성 방법.
  9. 제8항에 있어서,
    상기 질의자 정보는,
    질의자의 기존 질의 또는 재생했었던 컨텐츠 정보인 질의자 정보 기반 해쉬 생성 방법.
  10. 삭제
  11. 제8항에 있어서,
    상기 해쉬를 생성하는 단계는,
    상기 질의자 정보가 최신의 정보일수록, 상기 특징값을 변형하는 가중치가 높도록 설정하는 질의자 정보 기반 해쉬 생성 방법.
  12. 제8항에 있어서,
    상기 해쉬를 생성하는 단계는,
    상기 질의자 정보를 반영하여 해쉬를 생성하는 함수의 파라미터를 변형한 후, 상기 해쉬를 생성하는 함수에 상기 특징값을 대입하여 해쉬를 생성하는 질의자 정보 기반 해쉬 생성 방법.
  13. 제8항에 있어서,
    유사한 취향의 기존 질의자 정보를 기준으로 그룹을 나누고, 상기 그룹 별로 상기 유사한 취향에 기반한 해쉬 생성 파라미터를 저장하는 단계를 더 포함하고,
    상기 질의자 정보를 수집하는 단계는,
    상기 수집한 질의자 정보가 나타내는 취향에 대응하는 그룹의 해쉬 생성 파라미터를 추출하는 단계를 포함하고,
    상기 해쉬를 생성하는 단계는,
    상기 추출된 해쉬 생성 파라미터를 이용하여 상기 특징값으로부터 해쉬를 생성하는 단계를 포함하는
    질의자 정보 기반 해쉬 생성 방법.
  14. 해쉬 정합 장치에 의해 수행되는 질의자 정보 기반 해쉬 정합 방법에 있어서,
    복수의 컨텐츠 각각의 특징을 나타내는 해쉬를 저장하는 단계와,
    정합 대상이 되는 대상 컨텐츠의 특징을 나타내는 특징값을 추출하는 단계와,
    질의자 정보를 수집하는 단계와,
    상기 질의자 정보를 반영하여 상기 특징값으로부터 해쉬를 생성하는 단계와,
    상기 생성된 해쉬를 상기 복수의 컨텐츠 각각에 대하여 기 저장된 해쉬와 비교하여 검색 결과를 출력하는 단계를 포함하고,
    상기 해쉬를 생성하는 단계는,
    상기 질의자 정보를 반영하여 상기 특징값을 변형한 후, 상기 변형된 특징값으로부터 해쉬를 생성하는 질의자 정보 기반 해쉬 정합 방법.
  15. 제8항, 제9항, 제11항 내지 제14항 중 어느 한 항의 방법을 프로세서가 수행하도록 하는 컴퓨터 판독 가능 기록매체에 저장된 프로그램.
  16. 제8항, 제9항, 제11항 내지 제14항 중 어느 한 항의 방법을 프로세서가 수행하게 하는 명령어를 포함하는 프로그램이 기록된 컴퓨터 판독 가능 기록매체.
KR1020160019574A 2016-02-19 2016-02-19 질의자 정보에 기반하여 해쉬를 생성 또는 정합하는 장치 및 방법 KR101856146B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160019574A KR101856146B1 (ko) 2016-02-19 2016-02-19 질의자 정보에 기반하여 해쉬를 생성 또는 정합하는 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160019574A KR101856146B1 (ko) 2016-02-19 2016-02-19 질의자 정보에 기반하여 해쉬를 생성 또는 정합하는 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20170097908A KR20170097908A (ko) 2017-08-29
KR101856146B1 true KR101856146B1 (ko) 2018-05-10

Family

ID=59760010

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160019574A KR101856146B1 (ko) 2016-02-19 2016-02-19 질의자 정보에 기반하여 해쉬를 생성 또는 정합하는 장치 및 방법

Country Status (1)

Country Link
KR (1) KR101856146B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113126888B (zh) * 2020-01-15 2024-04-19 伊姆西Ip控股有限责任公司 用于存储管理的方法、设备和计算机程序产品
WO2022040621A1 (en) 2020-08-21 2022-02-24 Cyborg Inc. System and method for encrypted search using hash vectorization models

Also Published As

Publication number Publication date
KR20170097908A (ko) 2017-08-29

Similar Documents

Publication Publication Date Title
US20220035827A1 (en) Tag selection and recommendation to a user of a content hosting service
US10515133B1 (en) Systems and methods for automatically suggesting metadata for media content
CN102549603B (zh) 基于相关性的图像选择
US20140201180A1 (en) Intelligent Supplemental Search Engine Optimization
Liu et al. Coherent bag-of audio words model for efficient large-scale video copy detection
CN104462199B (zh) 一种网络环境下的近似重复图像搜索方法
WO2017070656A1 (en) Video content retrieval system
JP2011520175A (ja) 複数の保存されたディジタル画像を検索するための方法及び装置
EP2382782A1 (en) Video content analysis for automatic demographics recognition of users and videos
US9229958B2 (en) Retrieving visual media
JP5596648B2 (ja) ハッシュ関数生成方法、ハッシュ関数生成装置、ハッシュ関数生成プログラム
KR101856146B1 (ko) 질의자 정보에 기반하여 해쉬를 생성 또는 정합하는 장치 및 방법
JP5366212B2 (ja) 多数の参照用映像の中から検索キー用映像を用いて検索する映像検索装置、プログラム及び方法
US11410706B2 (en) Content pushing method for display device, pushing device and display device
Li et al. Efficient video copy detection using multi-modality and dynamic path search
JP2009151390A (ja) 情報分析装置、及び情報分析プログラム
Kordopatis-Zilos et al. Finding near-duplicate videos in large-scale collections
Aljundi et al. Who’s that Actor? Automatic Labelling of Actors in TV series starting from IMDB Images
US20210342393A1 (en) Artificial intelligence for content discovery
Nagavi et al. Content based audio retrieval with MFCC feature extraction, clustering and sort-merge techniques
Di Buccio et al. A scalable cover identification engine
Stein et al. From raw data to semantically enriched hyperlinking: Recent advances in the LinkedTV analysis workflow
Araujo et al. Real-time query-by-image video search system
Özkan et al. Visual group binary signature for video copy detection
JP6632564B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法、及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant