KR101203931B1 - 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 및 순위 결정 방법 - Google Patents

동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 및 순위 결정 방법 Download PDF

Info

Publication number
KR101203931B1
KR101203931B1 KR1020100138937A KR20100138937A KR101203931B1 KR 101203931 B1 KR101203931 B1 KR 101203931B1 KR 1020100138937 A KR1020100138937 A KR 1020100138937A KR 20100138937 A KR20100138937 A KR 20100138937A KR 101203931 B1 KR101203931 B1 KR 101203931B1
Authority
KR
South Korea
Prior art keywords
video
frame
search
person
character
Prior art date
Application number
KR1020100138937A
Other languages
English (en)
Other versions
KR20120077104A (ko
Inventor
이영구
김진승
심재균
Original Assignee
대한민국(국가기록원)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국(국가기록원) filed Critical 대한민국(국가기록원)
Priority to KR1020100138937A priority Critical patent/KR101203931B1/ko
Publication of KR20120077104A publication Critical patent/KR20120077104A/ko
Application granted granted Critical
Publication of KR101203931B1 publication Critical patent/KR101203931B1/ko

Links

Images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Television Signal Processing For Recording (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)

Abstract

동영상 내 등장인물의 효율적인 검색을 위한 포스팅 리스트 압축 및 순위 결정 방법이 제공된다. 본 발명은 등장인물이 나타나는 각각의 프레임들의 리스트를 유지하는 대신, 비슷한 유사도를 갖는 연속적인 프레임들을 프레임 구간으로 표시함으로써 정보 손실을 최소화하는 효율적인 압축 기법을 제공한다. 그리고 검색 인물과 관련된 동영상의 순위를 결정하기 위하여 각 동영상들에 대하여 프레임별 검색 인물과 등장인물의 정확도, 동영상에서 검색 인물이 등장하는 시간, 동영상에서 검색 인물이 등장하는 시간의 비율을 이용한다. 본 발명에 의하면 포스팅 리스트의 크기를 줄임으로써 인물 검색을 위한 색인 저장공간의 낭비를 방지할 수 있으며 질의 처리 시간을 향상시킬 수 있다. 또한 등장인물과 관련된 동영상의 순위를 정확하게 측정함으로써, 등장인물과 관련된 동영상의 검색 성능을 향상시키는 효과가 있다.

Description

동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 및 순위 결정 방법{POSTING LIST COMPRESSION AND RANKING METHOD FOR EFFICIENT SEARCHING A PERSON ON VIDEOS}
본 발명은 동영상 검색 시스템에서 등장인물을 검색하는 기술에 관한 것으로, 더욱 상세하게는 동영상에서 프레임 기반으로 등장인물의 검색을 위한 색인 구성 시 포스팅 리스트의 크기를 줄이고, 검색 인물과 관련된 동영상의 순위를 정확하게 측정하는데 적당하도록 한 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 및 순위 결정 방법에 관한 것이다.
종래의 동영상 검색 시스템에서는 동영상 파일의 등장인물 검색을 위하여 인물 또는 인물과 관련된 정보들을 사람이 직접 수동으로 태깅을 하고, 키워드 기반의 질의를 수행하는 방식을 주로 사용하였다. 그런데, 이와 같은 방법은 동영상이 대량 및 대용량화가 됨에 따라 많은 시간이 소요되기 때문에 비효율적이다.
최근 들어, 영상 처리 기술이 발달함에 따라 동영상 내에서 얼굴 인식 기술을 이용하여 동영상을 자동 색인하는 연구가 활발히 이루어지고 있다. 자동 색인은 도 1과 같이 동영상의 각 프레임에 대해 얼굴 영역들을 검출하고, 각 얼굴에 대해 인물 데이터베이스를 이용해 인물을 식별하여 자동 태깅한 후 색인에 삽입하는 기술이다. 이 기술은 인물 검색 시스템, 방송 영상편집 시스템, 기록물 관리 시스템 등 다양한 응용 분야에서 활용이 가능하다.
종래의 얼굴 인식 기술을 활용한 자동 색인 기술은 사람이 수동으로 태깅을 수행하는 비효율성은 해결하지만, 등장인물을 100% 정확하게 검출하지 못하는 것을 감안하여 검출된 인물에 대하여 인식 정확도(proximity)를 함께 표현한다. 따라서, 등장인물 검색을 위한 색인 구성 시, 색인 정보에는 정확도를 포함하는 동영상 파일 ID, 프레임 번호, 등장인물, 정확도와 같은 구조정보를 포함해야 한다. 예를 들어 "V1, 345, 홍길동, 80%"는 동영상 V1의 345번째 프레임에 홍길동과 80% 유사한 인물이 등장함을 의미한다. 이와 같은 정보는 또한 기존 문서 기반의 키워드 색인 방법과 유사하게 "동영상 ID-문서 ID", "프레임 번호-단어의 문서 내 위치", "등장인물의 출현빈도-특정 단어의 출현 빈도(term frequency)"와 같이 매핑되어 역색인(inverted index)을 구성함으로써 등장인물이 나타나는 프레임 위치까지를 검색할 수 있는 프레임 기반 검색(frame based search)을 가능하게 한다.
그러나, 종래 기술에 의한 동영상 검색 시스템에 있어서는, 문서 검색을 위한 포스팅 리스트에 포함되는 색인 정보와 그 구성이 다르기 때문에 영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 저장기술이 요구된다.
따라서, 본 발명의 목적은 동영상에서 등장인물 자동 색인 정보를 포스팅 리스트에 효율적으로 표현하여 그 정보량을 최소화 하는데 있다.
본 발명의 또 다른 목적은 각 동영상들에 대하여 프레임별 검색 인물과 등장인물의 정확도, 동영상에서 검색 인물이 등장하는 시간, 동영상에서 검색 인물이 등장하는 시간의 비율과 같은 프레임 수준의 색인 정보를 이용하여 검색 인물과 관련된 동영상의 순위를 정확하게 측정하는데 있다.
본 발명의 목적들은 앞에서 언급한 목적으로 제한되지 않는다. 본 발명의 다른 목적 및 장점들은 아래 설명에 의해 더욱 분명하게 이해될 것이다.
상기와 같은 목적을 달성하기 위한 본 발명은, a) 등장인물이 나타나는 프레임과 등장인물의 인식 유사도를 이용한 프레임 기반 등장인물 검색을 위한 색인을 구성할 때, 등장인물이 나타나는 각각의 프레임에 대하여 연속적인 프레임을 하나의 구간으로 표현하되, 포스팅 리스트의 차이를 이용하여 구간의 시작 프레임 번호와 구간의 크기로 표현하여 포스팅 리스트의 크기를 줄이는 단계; b) 등장인물이 나타나는 연속적인 프레임들을 하나의 구간으로 압축할 때, 연속적이지 않은 두 프레임 구간들을 병합하는 단계;를 포함하여 이루어진다.
상기와 같은 목적을 달성하기 위한 또 다른 본 발명은, 검색 인물과 관련된 동영상 검색 시, 동영상 내 검색 인물이 등장하는 프레임 리스트들의 유사도 평균값, 전체 동영상 길이의 평균값과 동영상에서 검색 인물이 등장하는 프레임 길이의 비율 및, 동영상의 길이와 동영상에서 검색 인물이 나타나는 구간의 비율을 고려하여 검색 인물과 관련된 동영상의 순위를 결정한다.
본 발명을 이용하여 프레임 기반의 등장인물 색인 구성시 등장인물에 색인 정보를 포스팅 리스트에 효율적으로 표현할 수 있으며, 또한 포스팅 리스트의 크기를 줄일 수 있는 효과가 있다.
또한, 본 발명은 프레임 수준의 등장인물 색인 정보를 활용하여 검색 인물과 환경된 동영상을 검색함으로써, 단순히 동영상에 부여한 태깅 정보에 의존하는 키워드 기반 검색보다 더욱 정확한 검색을 효율적으로 수행할 수 있는 이점이 있다.
도 1은 종래 기술에 의한 얼굴 인식 기술을 활용한 자동 색인 과정을 나타낸 설명도이다.
도 2는 본 발명의 자동 색인을 위한 포스팅 리스트의 포맷 예시도이다.
도 3은 본 발명의 자동 색인을 위한 포스팅 리스트 정보의 예시도이다.
도 4는 본 발명의 일실시예에 따른 포스팅 리스트 압축 및 순위 결정 방법이 적용되는 시스템의 개략도이다.
도 5는 본 발명의 일실시예에 의한 포스팅 리스트 압축 방법의 신호 흐름도이다.
도 6은 본 발명의 일실시예에 의한 병합 오차율 한도의 예시 그래프이다.
도 7은 본 발명의 일실시예에 의한 압축된 포스팅 리스트에 대한 인물별 순위 점수 측정 예시도이다.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하면 다음과 같다.
도 5는 본 발명에 의한 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 방법의 신호 흐름도이다.
도 5를 참조하면, 등장 인물이 나타나는 프레임과 등장인물의 인식 유사도(proximity)를 이용하여 프레임 기반의 등장인물 검색을 위한 색인을 구성할 때 연속적인 프레임들을 하나의 구간으로 표현하는데, 이때 프스팅 리스트의 차이를 이용하여 구간의 시작프레임 번호와 구간의 크기로 표현하여 포스팅 리스트의 크기를 줄이게 된다(S1-S3).
상기와 같은 포스팅 리스트 처리과정을 통해 포스팅 리스트의 크기를 줄이는 것에 대하여 좀 더 상세히 설명하면 다음과 같다.
인물 인식 기반을 이용한 자동 색인 기술은 등장인물에 대한 인식률이 100%가 아니기 때문에 포스팅 리스트에 정확도라는 새로운 요소가 포함되어야 한다. 이를 위해 도 2에서와 같이 등장인물 ID, 인식 정확도, 등장인물의 시작 프레임 번호 및 끝 프레임 번호를 포함하는 자동 색인을 위한 포스팅 리스트를 저장한다. 그리고, 상기와 같은 포스팅 리스트를 바탕으로 전체의 프레임 구간을 정확도별 프레임 구간으로 구분하여 관리한다.
그런데, 등장인물이 나타나는 프레임 위치 수준까지 검색할 수 있는 프레임 기반 검색을 위한 색인 구성 시 대량의 색인 정보가 생성되는 문제가 발생한다. 예를 들어, 29.97 fps( frames per second)의 프레임 율을 갖는 1시간 분량의 동영상은 107,892개의 프레임들로 구성되기 때문에 하나의 동영상에서 10만개 이상의 색인 정보가 생성될 수도 있다. 이와 같은 색인 정보의 증가는 색인 저장 공간의 낭비와 함께 질의 처리 시간이 길어지는 원인이 되기 때문에 새로운 포스팅 리스트 압축 방법이 요구된다.
동영상 내 등장인물에 대한 프레임 수준의 색인을 구성하기 위해 동영상의 집합(Video Collection)은
Figure 112010087640381-pat00001
으로 표현한다. 그리고, 상기
Figure 112010087640381-pat00002
로부터 색인을 위해 각 동영상
Figure 112010087640381-pat00003
는 다음의 [수학식1]과 같은 등장인물 리스트를 갖는다.
Figure 112010087640381-pat00004
각 동영상의 인물 리스트는 등장인물, 인식된 인물의 유사도, 인물의 등장이 시작되는 프레임 번호 및 끝나는 프레임번호를 포함하며, 다음의 [수학식2]와 같이 표현된다.
Figure 112010087640381-pat00005
상기와 같은 동영상의 인물 리스트 구조는 문서기반의 포스팅 리스트에서 차이 기법을 이용하여
Figure 112010087640381-pat00006
Figure 112010087640381-pat00007
로 표현하고, 다음의 [수학식3]과 같은 구조로 변경된다.
Figure 112010087640381-pat00008
예를 들면,
Figure 112010087640381-pat00009
은 0.70의 정확도로 인식된 홍길동이라는 인물이 프레임번호 1000~1200, 1500~2000, 2200~2550 구간에서 나타난다는 것을 의미하며 이것은 다음의 [수학식4]와 같이 표현될 수 있다.
Figure 112010087640381-pat00010
상기 포스팅 리스트 압축을 위한 비연속적인 두 프레임 구간의 병합에 대하여 설명하면 다음과 같다.
동영상에서의 등장인물에 대한 색인 구성 시 연속적인 프레임들에 대해서만 구간으로 표현하면 너무 많은 수의 프레임 구간이 생성되어 포스팅 리스트의 크기가 커지는 현상이 발생한다. 실제 동영상에서 10 프레임의 차이는 0.3초 정도에 해당하는 매우 짧은 시간이기 때문에 서로 분리된 프레임 구간으로 취급할 필요가 없다. 따라서, 구간 사이의 거리가 임계 조건을 만족할 때 두 구간을 병합하여 하나의 구간으로 간주함으로써, 포스팅리스트의 크기를 줄일 수 있게 된다. 예를 들어, 프레임 구간으로 구성된 포스팅 리스트 {홍길동, 80%, (345, 560)}과 {홍길동, 80%, (570, 650)}을 {홍길동, 80%, (345, 650)}으로 병합한다.
이러한 리스트는 각 동영상에 대해서 인물별 정확도로 작성된다. 하나의 동영상에서 색인 대상의 프레임 구간들은 인물 및 인식 정확도별로 다양하게 나타난다. 정확도와 작성된 동영상들은 도 3과 같이 하나의 인물에 대해 여러 가지 정확도를 가지게 된다. 따라서, 도 3에서와 같이 프레임 구간을 병합 시, 각 프레임 구간들 간의 거리뿐만 아니라 정확도까지 고려해야 한다. 서로 다른 프레임 구간의 병합 시, 해당 구간들의 길이(
Figure 112010087640381-pat00011
)와 정확도(
Figure 112010087640381-pat00012
)를 이용하여 다음의 [수학식5]와 같이 정확도와 길이의 가중 평균을 계산한다(S4).
Figure 112010087640381-pat00013
만약 b와 d의 병합, d와 g의 병합과 같이 구간과 구간간의 거리가 큰 경우에는 다음의 [수학식6]과 같은 가중 평균 식을 사용한다.
Figure 112010087640381-pat00014
여기서,
Figure 112010087640381-pat00015
은 구간
Figure 112010087640381-pat00016
Figure 112010087640381-pat00017
사이의 빈 구간의 거리이고,
Figure 112010087640381-pat00018
는 얼굴인식 모듈에서 출력 여부를 결정할 때 사용하는 파라메터로 최소 정확도를 나타낸다. 따라서, 빈 구간의 정확도는 0부터
Figure 112010087640381-pat00019
구간 사이에 존재한다. 빈 구간의 정확도는 중간값인
Figure 112010087640381-pat00020
를 사용하기로 한다.
병합 수행 여부를 평가 시 두 구간에 대하여 계산된 가중 평균값과 병합 이전의 각 구간의 가중 평균값을 비교하여 주어지는 병합 오차율 한도(임계값)
Figure 112010087640381-pat00021
보다 작으면 병합을 수행하여 각 구간은 새로운 하나의 프레임 구간으로 대체한다(S5-S7). 이때, 병합 대상 구간의 가중평균(A)은 다음의 [수학식7]로, 병합후의 가중평균(C)은 다음의 [수학식8]로 표현된다.
Figure 112010087640381-pat00022
Figure 112010087640381-pat00023
여기서, 병합 수행조건
Figure 112010087640381-pat00024
이고,
Figure 112010087640381-pat00025
이다.
이러한 프레임 구간의 병합을 통하여 프레임 리스트의 수를 줄임으로써, 색인의 크기와 질의 처리 속도를 향상시킬 수 있다. 아래의 표는 동영상 인물 색인의 표스팅 리스트를 압축하는 의사코드를 나타낸 것이다.
Figure 112010087640381-pat00026
Figure 112010087640381-pat00027
등장인물과 관련된 질의에 대하여
Figure 112010087640381-pat00028
로부터 해당 인물을 포함한 동영상을 결과로 반환한다. 단순한 태깅 기반의 인물 색인 방법을 사용할 경우에는 해당 인물 태그가 포함된 모든 동영상을 같은 결과로 반환할 것이다. 그러나, 작동 색인 방법으로 등장인물 색인이 구성되면 각 프레임별 등장인물 인식의 정확도와 등장 인물을 나타내는 프레임 위치 정보를 알 수 있다. 이와 같은 정보를 이용하여 등장인물이 나타나는 프레임 위치 정보를 알 수 있다. 이와 같은 정보를 이용하여 등장인물이 나타나는 유사한 동영상에 대하여 등장인물과 더욱 관련이 있는 순위를 부여함으로써 더 정확한 질의 결과를 만들 수 있다.
각 동영상 및 프레임 별 등장인물 정확도와 동영상 내에서 등장인물이 나타나는 유사한 동영상들에 대하여 등장인물과 더욱 관련이 있는 순위를 부여함으로써 더 정확한 질의 결과를 만들 수 있다.
각 동영상 및 프레임 별 등장인물 정확도와 동영상 내에서 등장인물이 나타나는 프레임의 시간을 반영할 수 있는 새로운 인물별 동영상 순위 측정 방법을 제안한다. 등장인물에 대한 동영상의 순위를 결정하기 위하여 다음의 3가지 요소를 고려한다.
첫째, 동영상 내 검색 인물이 등장하는 프레임 리스트들의 유사도 평균값을 고려한다. 상기 유사도 평균값은 동영상에 등장하는 인물과 검색 인물과의 유사도를 반영하는 요소이며, 각 가중평균에 대한 평균값을 취하며 0.0에서 1.0 사이의 값을 갖는 것으로 이는 다음의 [수학식 9]와 같이 표현된다.
Figure 112010087640381-pat00029
둘째, 전체 동영상 길이의 평균값과 동영상에서 검색 인물이 등장하는 프레임 길이의 비율을 고려한다. 상기 프레임 길이의 비율은 해당 동영상이 검색 인물이 나타나는 프레임을 얼마나 가지고 있는지에 대한 절대 길이 요소이며,해당 값은 1.0 이상이면 1.0이라고 가정한다. 등장인물의 등장 구간이 전체 동영상의 평균 길이보다 길면 1.0 이상의 값을 갖게 되며, 이는 평균적인 동영상의 길이만큼 해당 인물이 등장한다 것을 의미하는 것으로, 다음의 [수학식 10]과 같이 표현된다.
Figure 112010087640381-pat00030
셋째, 동영상의 길이와 동영상에서 검색 인물이 나타나는 구간의 비율을 고려한다. 상기 검색 인물이 나타나는 구간의 비율은 동영상에서 검색 인물이 나타나는 프레임을 얼마나 가지고 있는지에 대한 상대 길이 요소로서 0.0~1.0 사이의 값을 가지며, 다음의 [수학식 11]로 표현된다.
Figure 112010087640381-pat00031
그리고, 각각의 요소와 요소별 가중치
Figure 112010087640381-pat00032
를 이용하여 검색 인물에 대해 순위점수를 다음의 [수학식 12]와 같이 측정한다.
Figure 112010087640381-pat00033
그리고, 계산된 유사도의 순위에 따라 검색 인물과 관련된 동영상의 순위가 정해진다. 이와 같은 프레임 수준의 등장인물 색인 정보를 이용한 순위 결정 방법은 단순히 동영상에 부여한 태깅 정보에 의존하는 키워드 기반 검색보다 더욱 정확한 검색을 효율적으로 수행할 수 있다.
한편, 본 발명의 실시예의 동영상 포스팅 리스트의 압축 방법에 대한 저장 공간 사용량 비교와 동영상 문서들에 대한 순위 측정 성능 평가는 다음과 같이 나타났다.
먼저, 동영상 포스팅 리스트의 압축 성능과 동영상 문서들에 대한 순위를 측정하기 위한 환경은 다음의 표와 같다.
Figure 112010087640381-pat00034
성능평가를 위한 테스트 데이터는 10편의 역대 대통령 영상으로부터 추출된 대통령이 등장하는 프레임들이다. 테스트 데이터는 7명의 역대 대통령과 10개의 영상, 각 영상으로부터 추출된 243개의 프레임 정보들이다.
동영상 포스팅 리스트의 압축 성능 평가에 대해 살펴보면, 도 6은 프레임 구간 간의 병합을 평가하는 데 있어서 병합 오차율 한도
Figure 112010087640381-pat00035
를 1%. 5%, 10%, 15%, 20%로 부여했을 때, 그에 따른 원본 대비 저장 공간의 사용률을 나타낸 것이다. 상기
Figure 112010087640381-pat00036
가 0%이면 프레임 구간 사이에 병합이 일어나기 전과 후의 가중 평균값의 변화가 없어야 함을 의미하고, 20%는 병합 전과 병합 후의 가중 평균값의 차이가 20% 이내에 존재하여야 병합된다는 것을 의미한다. 상기 도 6에서
Figure 112010087640381-pat00037
이 1%인 경우는 압축을 하지 않았을 때와 저장 공간 사용율이 거의 유사하며, 20%에 가까워질수록 프레임 구간 간의 많은 병합이 발생하여 포스팅 리스트의 압축률이 높아진다. 도 6에서 "김영삼"이 "이승만"에 해당하는 동영상은 압축이 거의 일어나지 않았는데, 해당 동영상에서 "김영삼"이 "이승만"에 해당하는 프레임 구간이 매우 적고 각 구간이 멀리 떨어져 있어 병합이 발생하지 않았기 때문이다. 도 6의 결과에서 포스팅 리스트의 압축률이 높아질수록 저장 공간 사용량은 줄어들지만, 병합되는 프레임구간 사이의 거리가 멀어지므로 병합된 프레임 구간에서 찾고자 하는 인물이 드물게 나타나게 되는 것을 예상할 수 있다.
동영상의 순위 측정 성능 평가에 대해 살펴보면, 본 발명에 따른 동영상의 순위를 측정하는 방법에는 유사도의 평균값과 길이의 비율, 구간의 비율에 대한 각각의 가중치를 부여하여 동영상의 순위를 측정한다. 실험을 위해, 각각의 가중치를 α=0.3, β=0.3, γ=0.4로 실험을 한다. 또한, 각 가중치를 실험하기 위해 다음과 같은 가중치를 부여하여 실험을 하였다. [α=1.0, β=0.0, γ=0.0],[α=0.0, β=1.0, γ=0.0],[α=0.0, β=0.0, γ=1.0]
다음의 표는 질의어 "김대중"에 해당하는 테스터 데이터이다. 이어지는 표는 테스트 데이터를 이용하여 각 문서에 순위 점수를 측정한 결과(가중치별 질의에 대한 동영상 검색 순위)를 나타낸 것이다. 각 결과에서 각 평가요소에 가중치를 조절함으로써, 각 가중치별 유효성을 확인하였고, 순위가 가중치별 의미에 맞게 나타나는 것을 이어지는 표의 결과를 통해 확인할 수 있다. 예를 들어, α=1.0, β=0.0, γ=0.0로 가중치를 부여하였을 경우, α를 제외한 나머지 두 요소는 무시되고, α=0.0, β=1.0, γ=0.0로 가중치를 부여하였을 경우, β를 제외한 나머지 두 요소가 무시됨으로써, 각 가중치별 의미에 따라 동영상의 순위가 나타나게 된다. 동영상 ID가 1인 동영상은 처음부터 끝까지 "김대중" 대통령에 관련된 동영상이며, 그 정확도도 0.72~0.74인 관련 영상이다. 동영상 ID가 2번, 8번인 동영상의 경우 정확도와 해당 동영상에서 "김대중" 대통령이 등장하는 구간의 비율에 따라 이어지는 표에서의 순위가 부여됨을 알 수 있다. 예를 들어, 동영상 ID가 1번인 동영상은 아래의 표의 테스트 데이터에서 볼 수 있듯이 정확도가 다른 동영상에 비해서 높으며, 처음부터 끝까지 "김대중" 대통령이 등장하는 동영상이고, 평균 동영상의 길이보다 긴 동영상이다. 따라서, 이어지는 표의 결과에서 제안된 측정기법에 따라 순위 점수로 측정되었음을 알 수 있다.
Figure 112010087640381-pat00038
Figure 112010087640381-pat00039
압축된 포스팅 리스트에 대한 인물별 순위 측정 성능 평가에 대해 살펴보면, 본 실험은 포스팅 리스트의 병합으로 인한 압축이 인물 검색 시 동영상의 순위에 미치는 영향을 평가한다. 병합 오차율 한도
Figure 112010087640381-pat00040
에 따라 압축된 포스팅 리스트는 동영상의 순위 측정 시에 순위에 영향을 주지 않아야 압축에 따른 포스팅 리스트의 정보가 손실되지 않음을 의미한다. 도 7은 상기
Figure 112010087640381-pat00041
에 따라 압축된 포스팅 리스트들에 대하여 대통령 별로 동영상의 순위를 평가한 것을 나타낸 것이다. 여기서, 가로축은 포스팅 리스트가 특정
Figure 112010087640381-pat00042
으로 압축된 것을 나타내고, 세로축은 이에 따른 해당 동영상이 갖는 순위 점수이다.
Figure 112010087640381-pat00043
이 0일 때의 결과는 포스팅 리스트를 압축하지 않았을 경우이다. 실험결과, 상기 도 7에서 각 인물별로
Figure 112010087640381-pat00044
값이 변화할 때, "노무현"과 "전두환"에 해당하는 동영상의 순위에 변동이 약간 있으나 그 외의 동영상의 검색 순위가 압축 전과 비교하여 전혀 변하지 않았다. 이 실험 결과로부터 본 발명에 따른 포스팅 압축 방법은 검색 순위에 거의 영향을 미지지 않아 정보 손실이 아주 작음을 알 수 있다. 도 7에서 "노무현"과 "전두환"에 해당하는 동영상의 순위변동은 0.05에서 0.10 사이에서 검색 순위가 달라지고 있어서 정보의 손실이 발생한다. 이처럼 압축 전후의 검색 순위와의 변화를 비교하여, 정보의 손실을 최소화하는
Figure 112010087640381-pat00045
로 포스팅 리스트의 압축을 위한 병합 오차율에 대한 드레쉬홀드 값으로 이용할 수 있다.
결론적으로, 본 발명에서는 포스팅 리스트의 프레임 구간에 대하여 해당 구간에서 해당 인물의 정확도와 프레임 구간 간의 거리를 고려하여 프레임 구간을 병합하는 방법을사용하였다. 프레임 구간의 병합을 통하여, 프레임 구간에 대한 정보를 줄임으로써, 저장 공간의 크기를 줄였고, 실험을 통하여 병합을 통한 프레임 구간의 압축이 효과적임을 확인할 수 있었다. 또한, 검색시에 동영상의 순위를 측정함에 있어서, 유사도의 평균값과 전체 동영상과 해당 동영상의 길이의 비율, 해당 동영상에서의 질의 인물에 대한 등장 프레임 구간의 비율을 통하여, 순위를 측정하는 방법이 유효함을 확인할 수 있었다. 또한, 등장인물의 자동 색인지에 색인의 크기를 효과적으로 개선하고, 검색이에 적절한 검색 결과를 반환함으로써, 본 발명을 사용하여 동영상 검색에 대해 효과적인 지원이 가능하게 되는 것을 확인할 수 있었다.
이상에서 본 발명의 바람직한 실시예에 대하여 상세히 설명하였지만, 본 발명의 권리범위가 이에 한정되는 것이 아니라 다음의 청구범위에서 정의하는 본 발명의 기본 개념을 바탕으로 보다 다양한 실시예로 구현될 수 있으며, 이러한 실시예들 또한 본 발명의 권리범위에 속하는 것이다.
41 : 동영상 데이터베이스 42 : 색인정보 입력모듈
43 : 색인정보용 포스팅 리스트 병합모듈 44 : 색인정보기반 동영상 측정모듈

Claims (9)

  1. a) 등장인물이 나타나는 프레임과 등장인물의 인식 유사도를 이용한 프레임 기반 등장인물 검색을 위한 색인을 구성할 때, 등장인물이 나타나는 각각의 프레임에 대하여 연속적인 프레임을 하나의 구간으로 표현하되, 포스팅 리스트의 차이를 이용하여 구간의 시작 프레임 번호와 구간의 크기로 표현하여 포스팅 리스트의 크기를 줄이는 단계;
    b) 상기 프레임 구간의 시작 번호를 기준으로 색인정보를 정렬하는 단계;
    c) 등장인물이 나타나는 연속적인 프레임들을 하나의 구간으로 압축할 때, 연속적이지 않은 두 프레임 구간들을 병합하는 단계;를 포함하여 이루어지는 것을 특징으로 하는 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 방법.
  2. 삭제
  3. 제1항에 있어서, a) 단계는 등장인물 ID, 인식 정확도, 등장인물의 시작 프레임 번호 및 끝 프레임 번호를 포함하는 자동 색인을 위한 포스팅 리스트를 저장하고, 이를 바탕으로 전체의 프레임 구간을 정확도별 프레임 구간으로 구분하여 관리하는 단계를 더 포함하여 이루어지는 것을 특징으로 하는 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 방법.
  4. 제1항에 있어서, b) 단계는 연속적이지 않은 두 프레임 구간들을 병합할 때, 두 구간에 대하여 계산된 가중 평균값과 병합 이전의 각 구간의 가중 평균값을 비교하여 기 설정된 병합 오차율 한도보다 작으면 병합을 수행하여 각 구간을 새로운 하나의 프레임 구간으로 대체하는 것을 특징으로 하는 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 방법.
  5. 제1항에 있어서, b) 단계는 프레임 구간을 병합할 때, 각 프레임 구간들 간의 거리뿐만 아니라 해당 인물에 대한 여러 가지의 정확도를 반영하는 것을 특징으로 하는 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 방법.
  6. 검색 인물과 관련된 동영상 검색 시, 동영상 내 검색 인물이 등장하는 프레임 리스트들의 유사도 평균값, 전체 동영상 길이의 평균값과 동영상에서 검색 인물이 등장하는 프레임 길이의 비율 및, 동영상의 길이와 동영상에서 검색 인물이 나타나는 구간의 비율을 고려하여 검색 대상 동영상들 중에, 검색 인물과 관련된 동영상들에 대한 순위를 결정하는 것을 특징으로 하는 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 순위 결정 방법.
  7. 제6항에 있어서, 상기 유사도 평균값은 동영상에 등장하는 인물과 검색 인물과의 유사도를 반영하는 요소로서 각 가중평균에 대한 평균값을 취하여 획득되는 것을 특징으로 하는 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 순위 결정 방법.
  8. 제6항에 있어서, 상기 프레임 길이의 비율은 해당 동영상이 검색 인물이 나타나는 프레임을 얼마나 가지고 있는지에 대한 절대 길이 요소인 것을 특징으로 하는 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 순위 결정 방법.
  9. 제6항에 있어서, 상기 검색 인물이 나타나는 구간의 비율은 동영상에서 검색 인물이 나타나는 프레임을 얼마나 가지고 있는지에 대한 상대 길이 요소인 것을 특징으로 하는 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 순위 결정 방법.
KR1020100138937A 2010-12-30 2010-12-30 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 및 순위 결정 방법 KR101203931B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100138937A KR101203931B1 (ko) 2010-12-30 2010-12-30 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 및 순위 결정 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100138937A KR101203931B1 (ko) 2010-12-30 2010-12-30 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 및 순위 결정 방법

Publications (2)

Publication Number Publication Date
KR20120077104A KR20120077104A (ko) 2012-07-10
KR101203931B1 true KR101203931B1 (ko) 2012-11-27

Family

ID=46710651

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100138937A KR101203931B1 (ko) 2010-12-30 2010-12-30 동영상 내 등장인물의 효율적 검색을 위한 포스팅 리스트 압축 및 순위 결정 방법

Country Status (1)

Country Link
KR (1) KR101203931B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240025993A (ko) * 2022-08-19 2024-02-27 삼성전자주식회사 영상 정보를 제공하는 디스플레이 장치 및 그 제어 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100636910B1 (ko) 1998-07-28 2007-01-31 엘지전자 주식회사 동영상검색시스템
KR100827846B1 (ko) * 2007-10-18 2008-05-07 (주)올라웍스 동영상에 포함된 특정 인물을 검색하여 원하는 시점부터재생하기 위한 방법 및 시스템
KR100892406B1 (ko) 2007-05-16 2009-04-10 엔에이치엔(주) 정보 검색 방법 및 그 시스템
KR100908890B1 (ko) 2007-07-18 2009-07-23 (주)엔써즈 동영상 데이터 클러스터를 이용한 동영상 데이터 검색서비스 제공 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100636910B1 (ko) 1998-07-28 2007-01-31 엘지전자 주식회사 동영상검색시스템
KR100892406B1 (ko) 2007-05-16 2009-04-10 엔에이치엔(주) 정보 검색 방법 및 그 시스템
KR100908890B1 (ko) 2007-07-18 2009-07-23 (주)엔써즈 동영상 데이터 클러스터를 이용한 동영상 데이터 검색서비스 제공 방법 및 장치
KR100827846B1 (ko) * 2007-10-18 2008-05-07 (주)올라웍스 동영상에 포함된 특정 인물을 검색하여 원하는 시점부터재생하기 위한 방법 및 시스템

Also Published As

Publication number Publication date
KR20120077104A (ko) 2012-07-10

Similar Documents

Publication Publication Date Title
JP5857124B2 (ja) 画像解析装置、画像解析システム、画像解析方法
CN104503958B (zh) 文档摘要的生成方法及装置
CN106557545B (zh) 视频检索方法和装置
US10152479B1 (en) Selecting representative media items based on match information
US11157550B2 (en) Image search based on feature values
KR100898456B1 (ko) 검색 결과를 제공하는 방법 및 상기 방법을 수행하는시스템
CN110377558B (zh) 文档查询方法、装置、计算机设备和存储介质
WO2017092337A1 (zh) 评论标签提取方法和装置
JP5708107B2 (ja) 重複ファイル検出装置
CN109918555B (zh) 用于提供搜索建议的方法、装置、设备和介质
CN111310011B (zh) 一种信息推送方法、装置、电子设备及存储介质
CN105183897A (zh) 一种视频搜索排序的方法和系统
KR20150036117A (ko) 쿼리 확장
US20190266406A1 (en) Automatically detecting contents expressing emotions from a video and enriching an image index
KR20130119246A (ko) 감성 기반 콘텐츠 추천 장치 및 방법
CN103425777A (zh) 一种基于改进贝叶斯分类的短信智能分类及搜索方法
KR20130092310A (ko) 상품 추천 시스템
KR101700820B1 (ko) 사용자 코멘트 기반 개인화 컨텐츠 검색 장치 및 방법
CN104537341A (zh) 人脸图片信息获取方法和装置
KR101577376B1 (ko) 텍스트 기준점 기반의 저작권 침해 판단 시스템 및 그 방법
WO2017173801A1 (zh) 一种个性化多媒体推荐方法和装置
CN108228612B (zh) 一种提取网络事件关键词以及情绪倾向的方法及装置
CN111125417B (zh) 一种数据搜索方法、装置、电子设备及存储介质
CN111782686A (zh) 用户数据的查询方法、装置、电子设备及存储介质
CN106598997B (zh) 一种计算文本主题归属度的方法及装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant