KR20040065523A - 복수의 이미지 프레임을 갖는 비디오 시퀀스 검색을 위한비선형 양자화 및 유사도 매칭 방법 - Google Patents
복수의 이미지 프레임을 갖는 비디오 시퀀스 검색을 위한비선형 양자화 및 유사도 매칭 방법 Download PDFInfo
- Publication number
- KR20040065523A KR20040065523A KR1020030095247A KR20030095247A KR20040065523A KR 20040065523 A KR20040065523 A KR 20040065523A KR 1020030095247 A KR1020030095247 A KR 1020030095247A KR 20030095247 A KR20030095247 A KR 20030095247A KR 20040065523 A KR20040065523 A KR 20040065523A
- Authority
- KR
- South Korea
- Prior art keywords
- edge
- image
- video sequence
- edges
- edge histogram
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 108
- 238000013139 quantization Methods 0.000 title claims abstract description 55
- 238000013507 mapping Methods 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 32
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 230000004044 response Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000000605 extraction Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/71—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/231—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
- H04N21/23109—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion by placing content in organized collections, e.g. EPG data repository
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/84—Generation or processing of descriptive data, e.g. content descriptors
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
Description
에지 히스토그램 빈 | 의미 |
BinCounts[0] | 부영상(0,0)에서 수직 에지 |
BinCounts[1] | 부영상(0,0)에서 수평 에지 |
BinCounts[2] | 부영상(0,0)에서 45° 에지 |
BinCounts[3] | 부영상(0,0)에서 135° 에지 |
BinCounts[4] | 부영상(0,0)에서 무방향성 에지 |
BinCounts[5] | 부영상(0,1)에서 수직 에지 |
... | ... |
BinCounts[74] | 부영상(3,2)에서 무방향성 에지 |
BinCounts[75] | 부영상(3,3)에서 수직 에지 |
BinCounts[76] | 부영상(3,3)에서 수평 에지 |
BinCounts[77] | 부영상(3,3)에서 45° 에지 |
BinCounts[78] | 부영상(3,3)에서 135° 에지 |
BinCounts[79] | 부영상(3,3)에서 무방향성 에지 |
인덱스 (3비트/빈) | 범위 | 대표값 |
0 | 0.0000000 ~ 0.0343910 | 0.010867 |
1 | 0.0343910 ~ 0.0787205 | 0.057915 |
2 | 0.0787205 ~ 0.1221875 | 0.099526 |
3 | 0.1221875 ~ 0.1702110 | 0.144849 |
4 | 0.1702110 ~ 0.2280385 | 0.195573 |
5 | 0.2280385 ~ 0.3092675 | 0.260504 |
6 | 0.3092675 ~ 0.4440795 | 0.358031 |
7 | 0.4440795 ~ 1.0000000 | 0.530128 |
인덱스 (3비트/빈) | 범위 | 대표값 |
0 | 0.0000000 ~ 0.0411000 | 0.012266 |
1 | 0.0411000 ~ 0.0979065 | 0.069934 |
2 | 0.0979065 ~ 0.1540930 | 0.125879 |
3 | 0.1540930 ~ 0.2128515 | 0.182307 |
4 | 0.2128515 ~ 0.2789795 | 0.243396 |
5 | 0.2789795 ~ 0.3631455 | 0.314563 |
6 | 0.3631455 ~ 0.4880235 | 0.411728 |
7 | 0.4880235 ~ 1.0000000 | 0.564319 |
인덱스 (3비트/빈) | 범위 | 대표값 |
0 | 0.0000000 ~ 0.0150225 | 0.004193 |
1 | 0.0150255 ~ 0.0363560 | 0.025852 |
2 | 0.0363560 ~ 0.0576895 | 0.046860 |
3 | 0.0576895 ~ 0.0809025 | 0.068519 |
4 | 0.0809025 ~ 0.1083880 | 0.093286 |
5 | 0.1083880 ~ 0.1424975 | 0.123490 |
6 | 0.1424975 ~ 0.1952325 | 0.161505 |
7 | 0.1952325 ~ 1.0000000 | 0.228960 |
인덱스 (3비트/빈) | 범위 | 대표값 |
0 | 0.0000000 ~ 0.0150490 | 0.004174 |
1 | 0.0150490 ~ 0.0360780 | 0.025924 |
2 | 0.0360780 ~ 0.0566975 | 0.046232 |
3 | 0.0566975 ~ 0.0784090 | 0.067163 |
4 | 0.0784090 ~ 0.1025230 | 0.089655 |
5 | 0.1025230 ~ 0.1336475 | 0.115391 |
6 | 0.1336475 ~ 0.1848245 | 0.151904 |
7 | 0.1848245 ~ 1.0000000 | 0.217745 |
인덱스 (3비트/빈) | 범위 | 대표값 |
0 | 0.0000000 ~ 0.0292225 | 0.006778 |
1 | 0.0292225 ~ 0.0801585 | 0.051667 |
2 | 0.0801585 ~ 0.1374535 | 0.108650 |
3 | 0.1374535 ~ 0.1952415 | 0.166257 |
4 | 0.1952415 ~ 0.2549585 | 0.224226 |
5 | 0.2549585 ~ 0.3210330 | 0.285691 |
6 | 0.3210330 ~ 0.4036735 | 0.356375 |
7 | 0.4036735 ~ 1.0000000 | 0.450972 |
Claims (41)
- 복수의 비디오 시퀀스를 표현하는 디지털 비디오 데이터 정보 - 상기 복수의 비디오 시퀀스 각각은 상기 디지털 비디오 데이터의 이미지 프레임 셋을 포함함 - 를 갖는 데이터베이스 구축 방법에 있어서,상기 각 비디오 시퀀스의 상기 각 이미지 프레임을 L개(L은 양의 정수)의 부영상(sub-image) - 상기 각 부영상은 S x T개(S 및 T는 각각 양의 정수)의 이미지 블럭(image-block)으로 더욱 분할됨 - 으로 분할하는 제1단계;상기 각 이미지 블럭에 대해 5개의 기준 에지(reference edge) - 상기 기준 에지는 4개의 방향성(directional) 에지 및 1개의 무방향성(non-directional) 에지를 포함함 - 중 어느 하나를 할당하여 상기 각 이미지 프레임에 대해 L개의 에지 히스토그램(edge histogram) - 상기 에지 히스토그램은 M개의 에지 히스토그램 빈(edge histogram bin)을 포함함 - 을 생성하는 제2단계;상기 각 에지 히스토그램에 포함된 상기 에지 히스토그램 빈을 S x T로 정규화하여 상기 각 이미지 프레임에 대해 M개의 정규화된 에지 히스토그램 빈을 생성하는 제3단계;상기 각 이미지 프레임의 정규화된 에지 히스토그램 빈에 기초하여 상기 각 비디오 시퀀스에 대한 L개의 대표(representative) 에지 히스토그램을 생성하기 위해 상기 각 비디오 시퀀스에 대해 M개의 대표 에지 히스토그램 빈을 계산하는 제4단계; 및상기 데이터베이스에 저장되는 상기 각 대표 에지 히스토그램에 대한 제2이미지 기술자로서 M개의 양자화 인덱스값을 생성하기 위해 상기 대표 에지 히스토그램 빈을 비선형적으로 양자화하는 제5단계를 포함하는 방법.
- 제1항에 있어서,상기 방향성 에지는수직(vertical) 에지, 수평(horizontal) 에지, 45°에지 및 135°에지를 포함하고,상기 무방향성 에지는상기 4가지 방향성 에지를 제외한, 정해진 방향이 없는 에지를 나타내는방법.
- 제2항에 있어서,상기 수직 에지, 수평 에지, 45°에지, 135°에지 및 무방향성 에지는각각 다음과 같이 표현되는방법.
- 제3항에 있어서,상기 제1단계는,상기 각 이미지 프레임을 N x N개(N은 양의 정수)의 겹치지 않는(non-overlapping) 부영상으로 분할하여 L개의 직사각형 모양의 부영상을 생성하는 제11단계; 및상기 부영상을 S x T개의 겹치지 않는 블럭으로 분할하여 S x T개의 정사각형 모양의 이미지 블럭을 생성하는 제12단계를 포함하는 방법.
- 제4항에 있어서,상기 제2단계는,상기 각 이미지 블럭에 상기 기준 에지 중 어느 하나를 할당하는 제21단계; 및상기 각 이미지 프레임에 대해 L개의 에지 히스토그램을 생성하기 위해 상기각 부영상에 포함된 각 기준 에지의 개수를 카운트하는 제22단계를 포함하는 방법.
- 제5항에 있어서,상기 제21단계는각 이미지 블럭을 2 x 2개의 부블럭으로 분할하는 제211단계;대응 필터계수를 상기 각 부블럭에 할당하는 제212단계;상기 필터계수를 이용하여 상기 각 이미지 블럭에 대한 5개 에지에 대응하는 5개 에지 크기 셋을 계산하는 제213단계; 및상기 계산된 에지 크기를 서로 비교하여 상기 이미지 블럭을 최대 에지 크기를 갖는 에지로 표현하는 제214단계를 포함하는 방법.
- 제6항에 있어서,상기 5개 에지 크기는 다음 5개의 수학식에 의해 산출되는방법.[수학식1][수학식2][수학식3][수학식4][수학식5](단, mv(i, j), mh(i, j), md-45(i, j), md-135(i, j) 및 mnd(i, j) 각각은 (i, j)번째 이미지 블럭에 대한 수직 에지, 수평 에지, 45°에지, 135°에지 및 무방향성 에지 크기,ak(i, j)는 (i, j)번째 이미지 블럭에서 k로 할당된 부블럭에 대한 평균 그레이 레벨(grey level),fv(k), fh(k), fd-45(k), fd-135(k) 및 fnd(k)는 각각 k로 할당된 부블럭에서 수직 에지, 수평 에지, 45°에지, 135°에지 및 무방향성 에지에 대한 필터 계수를 의미함)
- 제6항에 있어서,상기 최대 에지 크기가 소정의 임계값보다 작을 경우 상기 이미지 블럭은 에지를 하나도 포함하지 않는 것으로 취급하는방법.
- 제1항에 있어서,상기 대표 에지 히스토그램 빈은상기 비디오 시퀀스의 이미지 프레임의 대응하는 에지 히스토그램 빈의 평균값에 기초하여 계산되는방법.
- 제1항에 있어서,상기 제5단계는상기 각 기준 에지에 대응하는 5개의 비선형 양자화 테이블 중에서 대응하는 비선형 양자화 테이블을 이용하여 상기 각 대표 에지 히스토그램 빈을 비선형적으로 양자화하는 제51단계를 포함하는 방법.
- 제10항에 있어서,상기 제51단계는,상기 각 대표 에지 히스토그램 빈을 상기 각 대응 기준 에지 양자화 테이블에 포함된 대표값으로 맵핑하는 제521단계; 및상기 각 대표 에지 히스토그램 빈에 대한 대표값을 나타내는 양자화 인덱스값 3 비트를 생성하여 상기 비디오 시퀀스에 대한 제2이미지 기술자로서 L x 5개의 양자화 인덱스값을 생성하는 제522단계를 포함하는 방법.
- 제10항에 있어서,상기 정규화 에지 히스토그램 빈은로이드-맥스(Lloyd-Max) 알고리즘을 기반으로 하는 비선형 양자화기에 의해 비선형적으로 양자화 되는방법.
- 제5항에 있어서,상기 N은 4인방법.
- 제12항에 있어서,상기 양자화 테이블은하기 표1과 같이 상기 부영상에서 수직 에지의 개수를 나타내는 수직 에지 히스토그램 빈에 대한 테이블을 포함하는방법.[표1]
인덱스 범위 대표값 0 0.0000000 ~ 0.0343910 0.010867 1 0.0343910 ~ 0.0787205 0.057915 2 0.0787205 ~ 0.1221875 0.099526 3 0.1221875 ~ 0.1702110 0.144849 4 0.1702110 ~ 0.2280385 0.195573 5 0.2280385 ~ 0.3092675 0.260504 6 0.3092675 ~ 0.4440795 0.358031 7 0.4440795 ~ 1.0000000 0.530128 - 제12항에 있어서,상기 양자화 테이블은하기 표2와 같이 상기 부영상에서 수평 에지의 개수를 나타내는 수평 에지 히스토그램 빈에 대한 테이블을 더 포함하는방법.[표2]
인덱스 범위 대표값 0 0.0000000 ~ 0.0411000 0.012266 1 0.0411000 ~ 0.0979065 0.069934 2 0.0979065 ~ 0.1540930 0.125879 3 0.1540930 ~ 0.2128515 0.182307 4 0.2128515 ~ 0.2789795 0.243396 5 0.2789795 ~ 0.3631455 0.314563 6 0.3631455 ~ 0.4880235 0.411728 7 0.4880235 ~ 1.0000000 0.564319 - 제12항에 있어서,상기 양자화 테이블은하기 표3과 같이 상기 부영상에서 45°에지의 개수를 나타내는 45°에지 히스토그램 빈에 대한 테이블을 더 포함하는방법.[표3]
인덱스 범위 대표값 0 0.0000000 ~ 0.0150225 0.004193 1 0.0150255 ~ 0.0363560 0.025852 2 0.0363560 ~ 0.0576895 0.046860 3 0.0576895 ~ 0.0809025 0.068519 4 0.0809025 ~ 0.1083880 0.093286 5 0.1083880 ~ 0.1424975 0.123490 6 0.1424975 ~ 0.1952325 0.161505 7 0.1952325 ~ 1.0000000 0.228960 - 제12항에 있어서,상기 양자화 테이블은하기 표4와 같이 상기 부영상에서 135°에지의 개수를 나타내는 135°에지 히스토그램 빈에 대한 테이블을 더 포함하는방법.[표4]
인덱스 범위 대표값 0 0.0000000 ~ 0.0150490 0.004174 1 0.0150490 ~ 0.0360780 0.025924 2 0.0360780 ~ 0.0566975 0.046232 3 0.0566975 ~ 0.0784090 0.067163 4 0.0784090 ~ 0.1025230 0.089655 5 0.1025230 ~ 0.1336475 0.115391 6 0.1336475 ~ 0.1848245 0.151904 7 0.1848245 ~ 1.0000000 0.217745 - 제12항에 있어서,상기 양자화 테이블은하기 표5와 같이 상기 부영상에서 무방향성 에지의 개수를 나타내는 무방향성 에지 히스토그램 빈에 대한 테이블을 더 포함하는방법.[표5]
인덱스 범위 대표값 0 0.0000000 ~ 0.0292225 0.006778 1 0.0292225 ~ 0.0801585 0.051667 2 0.0801585 ~ 0.1374535 0.108650 3 0.1374535 ~ 0.1952415 0.166257 4 0.1952415 ~ 0.2549585 0.224226 5 0.2549585 ~ 0.3210330 0.285691 6 0.3210330 ~ 0.4036735 0.356375 7 0.4036735 ~ 1.0000000 0.450972 - 제7항에 있어서,상기 각 에지 히스토그램 빈의 빈 번호(BinCount)는 다음의 표6과 같이 정의되는방법.[표6]
에지 히스토그램 빈 의미 BinCounts[0] 부영상(0,0)에서 수직 에지 BinCounts[1] 부영상(0,0)에서 수평 에지 BinCounts[2] 부영상(0,0)에서 45° 에지 BinCounts[3] 부영상(0,0)에서 135° 에지 BinCounts[4] 부영상(0,0)에서 무방향성 에지 BinCounts[5] 부영상(0,1)에서 수직 에지 ... ... BinCounts[74] 부영상(3,2)에서 무방향성 에지 BinCounts[75] 부영상(3,3)에서 수직 에지 BinCounts[76] 부영상(3,3)에서 수평 에지 BinCounts[77] 부영상(3,3)에서 45° 에지 BinCounts[78] 부영상(3,3)에서 135° 에지 BinCounts[79] 부영상(3,3)에서 무방향성 에지 - 제1항에 있어서,상기 비디오 시퀀스의 변화도 값(variation value) - 상기 변화도 값은 상기 각 이미지 프레임의 상기 에지 히스토그램의 분산(variance)을 포함함 - 을 계산하고 상기 변화도 값을 상기 데이터베이스에 저장하는 제6단계를 더 포함하는 방법.
- 데이터베이스를 기반으로 질의 비디오 시퀀스에 대한 디지털 비디오 데이터의 이미지 프레임 셋을 갖는 대응하는 비디오 시퀀스를 검색하는 방법에 있어서,상기 질의 비디오 시퀀스에 대한 이미지 기술자로서 상기 질의 비디오 시퀀스의 L개(L은 양의 정수) 대표 에지 히스토그램 - 상기 각 대표 에지 히스토그램은 상기 질의 비디오 시퀀스에 포함된 이미지 프레임의 부영상에 포함된 5개 기준 에지의 대표 공간 분포를 나타내며, 상기 기준 에지는 4개의 방향성 에지와 1개의 무방향성 에지를 포함함 - 을 계산하는 제1단계;디지털 비디오 데이터 정보에 기초하여 상기 데이터베이스로부터 비디오 시퀀스에 대한 복수의 이미지 기술자 - 상기 각 비디오 시퀀스에 대한 각 이미지 기술자는 상기 각 비디오 시퀀스에 대한 L개의 대표 에지 히스토그램 빈을 포함함 - 를 추출하는 제2단계;상기 질의 비디오 시퀀스에 대한 이미지 기술자를 상기 각 비디오 시퀀스에 대한 상기 각 이미지 기술자와 비교하여 비교 결과를 생성하는 제3단계; 및상기 비교 결과에 따라 상기 질의 비디오 시퀀스와 유사한 적어도 하나의 비디오 시퀀스를 검색하는 제4단계를 포함하는 방법.
- 제21항에 있어서,상기 각 에지 히스토그램은기준 에지에 대응하는 5개의 에지 히스토그램 빈을 갖는방법.
- 제21항에 있어서,상기 방향성 에지는수직(vertical) 에지, 수평(horizontal) 에지, 45°에지 및 135°에지를 포함하고,상기 무방향성 에지는상기 4가지 방향성 에지를 제외한, 정해진 방향이 없는 에지를 나타내는방법.
- 제21항에 있어서,상기 제1단계는상기 각 질의 비디오 시퀀스의 상기 각 이미지 프레임을 L개(L은 양의 정수)의 부영상(sub-image) - 상기 각 부영상은 S x T개(S 및 T는 각각 양의 정수)의 이미지 블럭(image-block)으로 더욱 분할됨 - 으로 분할하는 제11단계;상기 각 이미지 블럭에 대해 5개의 기준 에지(reference edge) - 상기 기준 에지는 4개의 방향성(directional) 에지 및 1개의 무방향성(non-directional) 에지를 포함함 - 중 어느 하나를 할당하여 상기 각 이미지 프레임에 대해 L개의 에지히스토그램(edge histogram) - 상기 에지 히스토그램은 M개의 에지 히스토그램 빈(edge histogram bin)을 포함함 - 을 생성하는 제12단계;상기 각 에지 히스토그램에 포함된 상기 에지 히스토그램 빈을 S x T로 정규화하여 상기 각 이미지 프레임에 대해 M개의 정규화된 에지 히스토그램 빈을 생성하는 제13단계; 및상기 각 이미지 프레임의 정규화된 에지 히스토그램 빈에 기초하여 상기 각 비디오 시퀀스에 대한 L개의 대표(representative) 에지 히스토그램을 생성하기 위해 상기 질의 비디오 시퀀스에 대해 M개의 대표 에지 히스토그램 빈을 계산하는 제4단계를 포함하는 방법.
- 제23항에 있어서,상기 제22단계는상기 각 이미지 블럭에 상기 기준 에지 중 어느 하나를 할당하는 제221단계; 및상기 각 이미지 프레임에 대해 L개의 에지 히스토그램을 생성하기 위해 상기 각 부영상에 포함된 각 기준 에지의 개수를 카운트하는 제222단계를 포함하는 방법.
- 제25항에 있어서,상기 제221단계는각 이미지 블럭을 2 x 2개의 부블럭으로 분할하는 제2211단계;대응 필터계수를 상기 각 부블럭에 할당하는 제2212단계;상기 필터계수를 이용하여 상기 각 이미지 블럭에 대한 5개 에지에 대응하는 5개 에지 크기 셋을 계산하는 제2213단계; 및상기 계산된 에지 크기를 서로 비교하여 상기 이미지 블럭을 최대 에지 크기를 갖는 에지로 표현하는 제2214단계를 포함하는 방법.
- 제26항에 있어서,상기 5개 에지 크기는 다음 5개의 수학식에 의해 산출되는방법.[수학식6][수학식7][수학식8][수학식9][수학식10](단, mv(i, j), mh(i, j), md-45(i, j), md-135(i, j) 및 mnd(i, j) 각각은 (i, j)번째 이미지 블럭에 대한 수직 에지, 수평 에지, 45°에지, 135°에지 및 무방향성 에지 크기,ak(i, j)는 (i, j)번째 이미지 블럭에서 k로 할당된 부블럭에 대한 평균 그레이 레벨(grey level),fv(k), fh(k), fd-45(k), fd-135(k) 및 fnd(k)는 각각 k로 할당된 부블럭에서 수직 에지, 수평 에지, 45°에지, 135°에지 및 무방향성 에지에 대한 필터 계수를의미함)
- 제26항에 있어서,상기 최대 에지 크기가 소정의 임계값보다 작을 경우 상기 이미지 블럭은 에지를 하나도 포함하지 않는 것으로 취급하는방법.
- 제21항에 있어서,상기 질의 비디오 시퀀스 및 대상 비디오 시퀀스에 대한 이미지 기술자는각각 L x 5개의 대표 에지 히스토그램 빈에 기초한 전역(global) 에지 히스토그램 및 R개(R은 양의 정수)의 반-전역(semi-global) 히스토그램을 포함하는방법.
- 제29항에 있어서,상기 전역 에지 히스토그램은상기 질의 비디오 시퀀스 및 대상 비디오 시퀀스의 전체 공간에서의 에지 분포를 나타내고,상기 각 반-전역 에지 히스토그램은상기 질의 비디오 시퀀스 및 대상 비디오 시퀀스의 대응하는 부영상 셋에서의 에지 분포를 나타내는방법.
- 제29항에 있어서,상기 N과 R은 각각 4와 13인방법.
- 제31항에 있어서,상기 13개의 반-전역 에지 히스토그램 각각이 4개 부영상의 13개 셋 각각에 대해 생성되되,상기 13개 셋은상기 이미지의 수직 방향으로 첫 번째 행 내지 네 번째 행 각각의 4개 부영상을 각 셋이 포함하는 4개 부영상의 4개 셋;상기 이미지의 수평 방향으로 첫 번째 열 내지 네 번째 열 각각의 4개 부영상을 각 셋이 포함하는 4개 부영상의 4개 셋;1개의 대응 부영상 - 상기 대응 부영상은 각각 좌측상단, 우측상단, 좌측하단 및 우측하단에 위치함 - 및 상기 대응 부영상에 인접한 3개의 부영상을 각 셋이 포함하는 4개 부영상의 4개 셋; 및상기 이미지 중심을 둘러싼 4개 부영상을 포함하는 1개 셋을 포함하는 방법.
- 제21항에 있어서,상기 제2단계는상기 각 대상 비디오 시퀀스에 대한 L x 5개의 양자화 인덱스값을 검색하는 제21단계;5개 비선형 역양자화 테이블을 사용하여 상기 L x 5개의 양자화 인덱스값 각각을 상기 각 대상 비디오 시퀀스에 대한 L x 5개의 대표 에지 히스토그램 빈으로 변환시키는 제22단계; 및상기 L x 5개 정규화 에지 히스토그램 빈에 따라 L개의 대표 에지 히스토그램을 생성하는 제23단계를 포함하는 방법.
- 제33항에 있어서,상기 제2단계는,상기 L x 5개의 대표 에지 히스토그램 빈에 따라 상기 각 대상 비디오 시퀀스에 대한 전역 에지 히스토그램 및 R개의 반-전역 히스토그램을 생성하는 제24단계를 더 포함하는 방법.
- 제21항에 있어서,상기 제2단계는상기 각 대상 비디오 시퀀스에 대한 L x 5개의 양자화 인덱스값을 검색하는 제21단계;상기 L x 5개의 양자화 인덱스값을 정규화하여 상기 L x 5개의 양자화 인덱스값 각각을 상기 각 대상 비디오 시퀀스에 대한 L x 5개의 대표 에지 히스토그램 빈으로 변환시키는 제22단계; 및상기 L x 5개 대표 에지 히스토그램 빈에 따라 L개의 대표 에지 히스토그램을 생성하는 제23단계를 포함하는 방법.
- 제35항에 있어서,상기 제2단계는상기 L x 5개의 정규화된 에지 히스토그램 빈에 따라 상기 각 대상 이미지에 대한 전역 에지 히스토그램 및 R개의 반-전역 히스토그램을 생성하는 제24단계를 더 포함하는 방법.
- 제34항에 있어서,상기 제3단계는다음의 수학식에 따라 상기 질의 비디오 시퀀스와 상기 각 대상 비디오 시퀀스 사이의 거리를 측정하는 단계를 포함하는 방법.[수학식11](단, Local_A[i] 와 Local_B[i]는 각각 상기 질의 비디오 시퀀스 A 및 대상 비디오 시퀀스 B의 BinCount[i]의 에지 히스토그램 빈,Global_A[] 및 Global_B[]는 각각 상기 질의 이미지 A 및 대상 이미지 B의 전역 에지 히스토그램에 대한 에지 히스토그램 빈,Semi_Global_A[] 및 Semi_Global_B[]는 각각 상기 질의 비디오 시퀀스 A 및 대상 비디오 시퀀스 B의 반-전역 에지 히스토그램 빈에 대한 히스토그램 빈 값을 의미함)
- 제36항에 있어서,상기 제3단계는다음의 수학식에 따라 상기 질의 비디오 시퀀스와 상기 각 대상 비디오 시퀀스 사이의 거리를 측정하는 단계를 포함하는 방법.[수학식12](단, Local_A[i] 와 Local_B[i]는 각각 상기 질의 비디오 시퀀스 A 및 대상 비디오 시퀀스 B의 BinCount[i]의 에지 히스토그램 빈,Global_A[] 및 Global_B[]는 각각 상기 질의 비디오 시퀀스 A 및 대상 비디오 시퀀스 B의 전역 에지 히스토그램에 대한 에지 히스토그램 빈,Semi_Global_A[] 및 Semi_Global_B[]는 각각 상기 질의 비디오 시퀀스 A 및 대상 비디오 시퀀스 B의 반-전역 에지 히스토그램 빈에 대한 히스토그램 빈 값을 의미함)
- 각각이 복수의 디지털 비디오 데이터 이미지 프레임을 갖는 비디오 시퀀스에 대한 이미지 기술자를 추출하는 방법에 있어서,대상 이미지 프레임으로서 이미지 프레임 중 어느 하나를 선택하는 제1단계;상기 대상 이미지의 L개 에지 히스토그램 - 상기 에지 히스토그램 각각은 5개의 정규화된 에지 히스토그램 빈을 갖고, 부영상에서 5개 기준 에지의 공간 분포를 나타내며, 상기 기준 에지는 4개의 방향성(directional) 에지 및 1개의 무방향성(non-directional) 에지를 포함함 - 을 생성하기 위해 L x 5개(L은 양의 정수)의 정규화된 에지 히스토그램 빈을 계산하는 제2단계;대상 이미지로서 다음 이미지 프레임을 선택하는 제3단계;모든 이미지 프레임의 L개 에지 히스토그램이 계산될 때까지 상기 제2단계 및 제3단계를 반복하는 제4단계;상기 각 이미지 프레임의 L개 에지 히스토그램에 기초하여 상기 비디오 시퀀스에 대한 L x 5개의 정규화된 에지 히스토그램 빈을 갖는 대표 에지 히스토그램을 계산하는 제5단계;상기 비디오 시퀀스에 대한 이미지 기술자로서 L x 5개의 양자화 인덱스값을생성하기 위해 상기 대표 에지 히스토그램의 L x 5개의 정규화된 에지 히스토그램 빈을 비선형적으로 양자화하는 제6단계; 및상기 L x 5개의 양자화 인덱스값을 상기 데이터베이스에 저장하는 제7단계를 포함하는 방법.
- 제39항에 있어서,상기 각 양자화 인덱스값은 3비트로 표현되는방법.
- 제39항에 있어서,상기 방향성 에지는수직(vertical) 에지, 수평(horizontal) 에지, 45°에지 및 135°에지를 포함하고,상기 무방향성 에지는상기 4가지 방향성 에지를 제외한, 정해진 방향이 없는 에지를 나타내는방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20030002074 | 2003-01-13 | ||
KR1020030002074 | 2003-01-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20040065523A true KR20040065523A (ko) | 2004-07-22 |
KR100959053B1 KR100959053B1 (ko) | 2010-05-20 |
Family
ID=37355684
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020030095247A KR100959053B1 (ko) | 2003-01-13 | 2003-12-23 | 복수의 이미지 프레임을 갖는 비디오 시퀀스 검색을 위한비선형 양자화 및 유사도 매칭 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100959053B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100827229B1 (ko) * | 2006-05-17 | 2008-05-07 | 삼성전자주식회사 | 비디오 검색 장치 및 방법 |
WO2014007562A1 (ko) * | 2012-07-06 | 2014-01-09 | 인텔렉추얼 디스커버리 주식회사 | 영상 검색방법 및 장치 |
KR20150031333A (ko) * | 2012-07-09 | 2015-03-23 | 시스벨 테크놀로지 에스.알.엘. | 그라디언트 히스토그램에 기초하여 이미지 기술자를 변환하기 위한 방법 및 관련된 이미지 프로세싱 장치 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100369370B1 (ko) * | 1999-10-11 | 2003-01-24 | 한국전자통신연구원 | 블록기반 영상 히스토그램 생성 방법 |
KR100430273B1 (ko) * | 2000-07-21 | 2004-05-04 | 엘지전자 주식회사 | 비정규적인 빈값 양자화된 칼라 히스토그램을 이용한멀티미디어 검색방법 |
KR20020031015A (ko) | 2000-10-21 | 2002-04-26 | 오길록 | 에지 히스토그램 빈의 비선형 양자화 및 유사도 계산 |
-
2003
- 2003-12-23 KR KR1020030095247A patent/KR100959053B1/ko not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100827229B1 (ko) * | 2006-05-17 | 2008-05-07 | 삼성전자주식회사 | 비디오 검색 장치 및 방법 |
WO2014007562A1 (ko) * | 2012-07-06 | 2014-01-09 | 인텔렉추얼 디스커버리 주식회사 | 영상 검색방법 및 장치 |
KR20150031333A (ko) * | 2012-07-09 | 2015-03-23 | 시스벨 테크놀로지 에스.알.엘. | 그라디언트 히스토그램에 기초하여 이미지 기술자를 변환하기 위한 방법 및 관련된 이미지 프로세싱 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR100959053B1 (ko) | 2010-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7702152B2 (en) | Non-linear quantization and similarity matching methods for retrieving video sequence having a set of image frames | |
KR100556832B1 (ko) | 영상정보 검색을 위한 비선형 양자화 및 유사도 매칭 방법 | |
KR100452064B1 (ko) | 디지털 영상 처리 장치 | |
EP1233374A2 (en) | Apparatus and method for extracting objects based on feature matching between segmented regions in images | |
JP5097280B2 (ja) | 画像及び画像群を表現、比較及び検索する方法及び装置、プログラム、コンピュータ読み取り可能な記憶媒体 | |
US8340412B2 (en) | Image processing | |
GB2431793A (en) | Image comparison | |
JP4907938B2 (ja) | 少なくとも1つの画像及び画像群を表現する方法、画像又は画像群の表現、画像及び/又は画像群を比較する方法、画像又は画像群を符号化する方法、画像又は画像シーケンスを復号する方法、符号化されたデータの使用、画像又は画像群を表現する装置、画像及び/又は画像群を比較する装置、コンピュータプログラム、システム、及びコンピュータ読み取り可能な記憶媒体 | |
US7840081B2 (en) | Methods of representing and analysing images | |
KR100959053B1 (ko) | 복수의 이미지 프레임을 갖는 비디오 시퀀스 검색을 위한비선형 양자화 및 유사도 매칭 방법 | |
KR100361939B1 (ko) | 객체 움직임을 이용한 mpeg 비디오 시퀀스의 데이터 베이스 구축 및 검색 방법과 그 기록 매체 | |
KR100464224B1 (ko) | 화상처리방법 및 그 장치, 기억매체 | |
EP2372640A1 (en) | Methods of representing and analysing images | |
KR100324255B1 (ko) | 내용 기반 동영상 검색 방법 | |
KR100452063B1 (ko) | 디지털 영상 처리 방법 및 그 장치 | |
CN100446569C (zh) | 用于检索具有图像帧组视频序列的非线性量化和相似性匹配方法 | |
Monclús et al. | Efficient selection of representative views and navigation paths for volume data exploration | |
Izquierdo | A low access latency video portal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20031223 |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20081208 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20031223 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20100225 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20100430 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20100513 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20100514 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20130424 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20130424 Start annual number: 4 End annual number: 4 |
|
FPAY | Annual fee payment |
Payment date: 20140430 Year of fee payment: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20140430 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20150427 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20150427 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20160427 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20160427 Start annual number: 7 End annual number: 7 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20190224 |