KR20100082683A - 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법 - Google Patents
자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법 Download PDFInfo
- Publication number
- KR20100082683A KR20100082683A KR1020090002092A KR20090002092A KR20100082683A KR 20100082683 A KR20100082683 A KR 20100082683A KR 1020090002092 A KR1020090002092 A KR 1020090002092A KR 20090002092 A KR20090002092 A KR 20090002092A KR 20100082683 A KR20100082683 A KR 20100082683A
- Authority
- KR
- South Korea
- Prior art keywords
- digital image
- information
- unit
- image information
- database
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 36
- 238000000605 extraction Methods 0.000 claims abstract description 32
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000011496 digital image analysis Methods 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000010276 construction Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 239000000284 extract Substances 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 230000004069 differentiation Effects 0.000 claims description 2
- 238000002474 experimental method Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 claims 1
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000009897 systematic effect Effects 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/60—Rotation of whole images or parts thereof
- G06T3/604—Rotation of whole images or parts thereof using coordinate rotation digital computer [CORDIC] devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/168—Segmentation; Edge detection involving transform domain methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/40—Analysis of texture
- G06T7/41—Analysis of texture based on statistical description of texture
- G06T7/44—Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Abstract
본 발명은 디지털 컨텐츠 중에서도 디지털이미지에 관한 것으로 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법에 대한 것이다.
종래에는 단순히 디지털이미지 정보를 수동적으로 구축하거나 고유키 또는 사용자키, 워터마크 삽입 등을 통한 디지털이미지 데이터베이스를 구축하고 이를 토대로 검색 및 저작권 관리 등의 업무를 수행하여 왔으나, 본 발명에서는 디지털이미지 정보 구축에 필요한 인적, 물적 자원의 활용을 최소화하고 체계적인 디지털이미지 정보 구축을 가능하게 함으로서, 디지털이미디이지로부터 파생되는 관련 업무를 효과적으로 처리할 수 있도록 한 자가 학습형 디지털이미지 분석 엔진 및 디지털이미지 데이터베이스 구축 방법을 제공하는데 목적이 있다.
디지털이미지수집부, 디지털이미지저장부, 디지털이미지변환부, 디지털이미지정보추출부, 디지털이미지데이터베이스, 디지털이미지비교검색처리부, 수동태그삽입부, 디지털이미지정보등록부
Description
본 발명은 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법에 대한 것으로서, 보다 상세하게는 자가 학습형 디지털이미지 분석 엔진을 통해 디지털이미지를 수집, 변환, 분석하여 추출한 디지털이미지 정보를 데이터베이스로 구축하는 방법에 대한 것이다.
종래에는 디지털이미지의 정보 구축 즉 데이터베이스화하기 위한 방법으로 디지털이미지를 사람의 시각으로 판단하여 정보를 삽입하거나 고유키 또는 사용자키, 워터마크 삽입 등을 통하여 식별하는 등 다양한 수동적 방법이 이용되어져 왔다.
이러한 디지털이미지의 데이터베이스 구축 방법은 체계적인 정보 구축이 어렵고 수동적인 처리로 인한 인적, 물적 자원의 낭비를 초래하였고 사람이 수동으로 입력할 수 있는 정보의 한계 등으로 디지털이미지로부터 파생되는 관련 업무를 처리하기에 많은 어려움이 있었다.
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 디지털이미지를 수집, 변환, 분석하여 정보를 추출하는 자가 학습형 디지털이미지 분석 엔진을 제공함으로써 사람이 수동으로 입력하는 정보의 한계 및 오류를 극복하고 자동화된 체계적 디지털이미지 정보 추출을 가능하게 한다. 또한 해당 정보를 데이터베이스로 구축하기 위한 방법을 제공함으로서, 디지털이미지로부터 파생되는 각종 업무를 원활히 할 수 있도록 하는 것이다.
따라서 본 발명의 목적은 상기와 같은 문제점을 해결하기 위하여 디지털이미지 정보 즉 디지털이미지 데이터베이스 구축을 위하여 자가 학습형 디지털이미지 분석 엔진 및 디지털이미지 데이터베이스 구축 방법을 제공한다.
상기와 같은 목적을 달성하기 위하여 본 발명은 자가 학습이 가능한 디지털이미지분석엔진은 디지털이미지수집부(M01), 디지털이미지저장부(M02), 디지털이미지변환부(M03), 디지털이미지정보추출부(M04), 디지털이미지데이터베이스(M05), 디지털이미지비교검색처리부(M06), 수동태그삽입부(M07), 디지털이미지정보등록부(M08)로 구성된 시스템을 특징으로 한다.
특히 본 발명에 따른 디지털이미지변환부(M03)의 디지털이미지 변환 방법은 디지털이미지수집부(M01)를 통하여 수집한 디지털이미지데이터를 C1(오리지널 디지털이미지)과 C2(오리지널 디지털이미지의 수평 반전), C3(C1의 컬러 반전), C4(C2 의 컬러 반전)로 변환하는 것을 특징으로 한다.
또한, 특히 본 발명에 따른 디지털이미지정보추출부(M04)의 디지털이미지 정보 추출 방법은 색상 분포 정보 추출, 윤곽선 정보 추출, 주파수 공간 처리를 통한 정보 추출, 디지털이미지 특징 정보 추출로 이루어진 것을 특징으로 한다.
또한, 특히 본 발명에 따른 디지털이미지이미지비교검색처리부(M06)는 디지털이미지정보추출부(M04)를 통해 추출된 디지털이미지 정보를 디지털이미지데이터베이스(M05)와 비교 검색하는 것을 특징으로 한다.
또한, 특히 본 발명에 따른 수동태그삽입부(M07)는 디지털이미지정보추출부(M04)를 통해 추출된 디지털이미지 정보에 태그 정보가 없고, 디지털이미지정보추출부(M04)를 통해 추출된 디지털이미지 정보를 디지털이미지데이터베이스(M05)와 비교 검색한 경우에도 결과가 없는 경우 수동으로 태그 정보를 삽입하는 것을 특징으로 한다.
상기에서와 같이 본 발명에 의하여 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법에 따른 효과는 아래와 같다.
본 발명에 따른 디지털이미지 분석 엔진을 이용한 디지털이미지 데이터베이스를 구축하면 종래와 같이 사람의 시각에 따른 디지털이미지 정보 입력 또는 고유키 또는 사용자키, 워터마크 삽입 등과 같은 인위적인 데이터 삽입이 요구되지 않는다. 즉 수동적인 업무를 필요로 하지 않거나 최소화 할 수 있으며, 디지털이미지 데이터베이스 구축에 소요되는 인적, 물적 자원을 획기적으로 줄일 수 있다.
또한 디지털이미지에서 추출하는 각종 정보를 이용한 사실적 데이터베이스 구축으로 정보의 오류를 최소화 할 수 있다.
디지털이미지 분석 엔진을 통해 구축된 디지털이미지 데이터베이스는 디지털이미지로부터 파생되는 관련 서비스 또는 업무 예를 들어 디지털이미지검색, 저작권관리, 디지털이미지 태그 생성의 자동화 등 다양한 방면으로 활용할 수 있다.
이하에서는 첨부된 도면을 참조하여 본 발명의 바람직한 일 실시예를 상세하게 설명하기로 한다.
도1은 본 발명에 따른 디지털이미지분석엔진 구성의 일 실시 예를 도시한 블록도이다.
도 1에서의 디지털이미지분석엔진은 온라인상의 디지털이미지 데이터를 수집하기 위한 크롤러 및 오프라인 인쇄물을 수집하여 디지털이미지로 변환할 스캐너를 포함한 디지털이미지수집부(M01), 디지털이미지수집부를 통해 수집된 디지털이미지 데이터를 저장하기 위한 디지털이미지저장부(M02), 디지털이미지 수집부를 통해 전송된 데이터의 정보를 변환하는 디지털이미지변환부(M03), 변환된 디지털이미지의 분석하여 정보를 추출하는 디지털이미지정보추출부(M04), 디지털이미지정보추출부를 통해 추출된 디지털이미지정보를 저장하는 디지털이미지데이터베이스(M05), 디지털이미지추출부를 통해 추출된 디지털이미지 정보를 선 등록된 디지털이미지 정보 즉 디지털이미지데이터베이스에 저장된 디지털이미지 정보와 비교 검색하여 그 결과를 보고하는 디지털이미지비교검색처리부(M06), 디지털이미지정보저장부에 최 종 저장될 디지털이미지 정보에 태그 정보가 포함되지 않은 경우 해당 디지털이미지 정보에 태그를 삽입하는 수동태그삽입부(M07), 디지털이미지 정보를 최종 등록하는 디지털이미지정보등록부(M08)를 포함한다.
상기와 같은 구성을 가지는 자가 학습형 디지털이미지 분석 엔진의 디지털이미지 데이터베이스 구축 방법을 도 3을 참조하여 살펴보면 아래와 같다.
먼저 디지털이미지수집부(M01)를 통해 수집된 즉 크롤러 및 스캐너를 통해 수집한 디지털이미지 데이터를 디지털이미지변환부(M03)로 전송한다.(S01단계)
전송된 디지털이미지는 디지털이미지변환부(M03)를 통해 디지털이미지 정보를 추출할 4가지의 샘플 데이터를 생성한다.(S02단계)
4가지의 샘플 데이터는 디지털이미지수집부(M01)를 통해 수집된 디지털이미지 즉 원본의 픽셀 정보를 변환한 것으로써 도2의 C1, C2, C3, C4와 같이 변환하는 것을 특징으로 한다.
이때 디지털이미지의 변환 방법은 아래와 같다.
디지털이미지의 변환은 디지털이미지 픽셀 정보를 변환하는 것으로 C1(오리지널 디지털이미지)과 C2(오리지널 디지털이미지의 수평 반전), C3(C1의 컬러 반전), C4(C2의 컬러 반전)로 이루어진 4가지의 변환된 디지털이미지로 구성된다.
변환 방법을 더 상세히 하면 아래의 수학식을 이용한 픽셀 정보의 변환이 이루어진다.
X = 오리지널 디지털이미지의 가로 길이
Y = 오리지널 디지털이미지의 세로 길이
(Xn,Yn) = 수평 반전된 픽셀의 위치
X1 = 수평 반전할 오리지널 디지털이미지 픽셀의 가로 위치
Y1 = 수평 반전할 오리지널 디지털이미지 픽셀의 세로 위치
( Xn , Yn ) = ( ABS ( X - X1 )+ 1 , Y1 )
( R , G , B ) = 오리지널 디지털이미지의 픽셀 컬러 코드 값
( Rn , Gn , Bn ) = 컬러 반전된 디지털이미지의 픽셀 컬러 코드 값
( Rn , Gn , Bn ) = ( 255 - R , 255 - G , 255 - B )
디지털이미지변환부(M03)를 통해 변환된 디지털이미지는 디지털이미지정보추출부(M04)를 통해 분석되어 디지털이미지 정보를 추출한다.(S03단계)
이때 디지털이미지의 정보 추출 방법은 아래와 같이 크게 5가지로 나눌 수 있다.
1. 색상분포를 이용한 디지털이미지 정보 추출
표현할 수 있는 컬러를 일정한 범위로 나눠서 테이블을 구성하고, 이미지의 모든 픽셀들을 조사해서 해당 픽셀의 색상에 따라 적절한 테이블에 저장해서 이미지의 색상분포표를 추출한다.
2. 윤곽선 검출을 이용한 디지털이미지 정보 추출
영상의 밝기가 낮은 값에서 높은 값으로, 또는 이와 반대로 변하는, 즉 주변 픽셀들과의 변화가 심한 픽셀을 찾아서 영상의 윤곽선을 검출할 수 있다. Edge는 영상의 변화도(gradient)의 크기를 구해서 추출할 수 있는데 1차 미분법 또는 2차 미분법을 사용하여 추출한다.
3. 주파수 공간 처리를 이용한 디지털이미지 정보 추출
이산 퓨리에 변환(Discrete Fourier Transform), 고속 퓨리에 변환(Fast Fourier Transform), 이산 코사인 변환(Discrete Cosine Transform), 웨이블릿 변환(Wavelet Transform) 등을 통해서 영상을 주파수 영역으로 변환해서 영상의 정보를 추출한다
4. 디지털이미지 특징점을 이용한 디지털이미지 정보 추출
다양한 레벨의 가우시안블러(Gaussian-blur)가 적용된 영상(이하 A)들을 만들고, 각각의 영상을 사용해서 다양한 크기의 추가영상을 만든다. 그리고 같은 크기의 A 영상들을 비교해서 가우시안 차이값(Difference of Gaussians)을 구한 영상(이하 B)을 만든다. 마지막으로 서로 다른 크기의 B 영상들을 비교하는 과정에서 인접한 픽셀들보다 더 밝거나 어두운 픽셀을 찾아서 키 포인트로 사용한다.
검출한 키 포인트에는 영상의 왜곡이 발생하는 경우 검출되지 않을 가능성이 높은 것들이 다수 포함되어 있다. 따라서 아래의 과정을 통해서 영상의 왜곡이 발생하더라도 계속적으로 검출이 될 수 있는 키 포인트만을 추출한다.
1) 보간법을 사용해서 키 포인트의 위치를 파악
2) 주변 픽셀들과 비교했을 때 저대비(Low contrast)를 가지는 키 포인트 제거
3) Edge 상에 위치한 키 포인트 제거
각각의 키 포인트에 영상의 변화도(gradient)의 방향에 따라 방위를 설정한다. 이 과정은 추후 영상이 회전되는 왜곡에 강인할 수 있도록 한다.
키 포인트마다 각각 8개의 방향으로 방위 설정된 블록을 가로, 세로 각각 4개씩 만들어서 총 128 차원의 벡터를 만든다. 그리고 색상 왜곡에 강인하도록 정규화 과정을 거친다.
생성된 128 차원의 벡터는 데이터베이스로 관리하기에 상당히 큰 차원의 수를 가지고 있다. 이는 차원의 저주(Curse of dimensionality)를 유발하게 되고, 이로 인해서 데이터베이스의 성능이 상당히 저하된다. 따라서 정보를 압축해서 차원의 수를 줄임으로서 데이터베이스의 성능을 개선할 수 있도록 한다.
정보를 압축하는 과정은 아래의 사실에 기인한다.
어떤 벡터 공간의 원소들을 보다 낮은 차원의 부분공간으로 사상해도 원소들의 특징은 보존된다.
부분공간으로 사상하는 과정은 원래 정보를 행렬로 구성한 후 무작위로 만들어진 행렬과 곱을 해서 처리한다. 여기서 무작위로 만들어지는 행렬의 원소는 실험을 통해 가장 좋은 성능을 내는 값을 선택한다.
위 과정을 통해서 128 차원의 정보를 32 차원으로 줄여서 최종 디지털이미지
정보를 반환한다.
5. 태그 및 데이터 속성 추출
상기 4단계의 디지털이미지 정보 추출 과정과 별도로 디지털이미지 데이터 속성으로부터 태그 및 데이터 속성 정보(해상도 및 파일 포맷 등 데이터 속성이 가지는 정보)를 추출한다.
계속해서 디지털이미지 정보를 추출하는 과정에 있어 태그 정보 추출 여부에 따라 다음 과정을 수행한다.(S04단계)
태그 정보가 추출된 경우 디지털이미지정보등록부(M08)를 통해 디지털이미지정보추출부(M04)에서 추출한 디지털이미지 정보와 함께 디지털이미지수집부(M01)에서 수집한 원본 디지털이미지를 각각 디지털이미지데이터베이스(M05)와 디지털이미지저장부(M02)에 저장한다.(S05단계)
태그 정보가 추출되지 않은 경우 디지털이미지정보추출부(M04)를 통해 추출된 디지털이미지 정보인 태그를 제외한 나머지 정보를 디지털이미지지비교검색처리부(M06)를 통해 선 등록된 디지털이미지 정보 즉 디지털이미지데이터베이스(M05)에 저장된 정보와 비교하여 유사한 디지털이미지를 검색한다.(S06단계)
이때 디지털이미지를 비교 검색하는 과정에 있어 검색 여부에 따라 다음 과정을 수행한다.(S07단계)
유사한 디지털이미지가 검색된 경우 검색된 디지털이미지가 포함하고 있는 태그 정보를 태그 정보가 없는 원본 디지털이미지에 삽입하고 디지털이미지정보등록부(M08)를 통해 디지털이미지정보추출부(M04)에서 추출한 디지털이미지 정보와 함께 디지털이미지수집부(M01)에서 수집한 원본 디지털이미지를 각각 디지털이미지데이터베이스(M05)와 디지털이미지저장부(M02)에 저장한다.(S05단계)
유사한 디지털이미지가 검색되지 않은 경우 태그 정보가 없는 원본 디지털이미지에 수동태그삽입부(M07)를 통해 태그 정보를 수동 삽입한다.(S08단계)
태그 정보가 없는 원본 디지털이미지에 태그 정보를 수동으로 삽입한 후 디지털이미지정보등록부(M08)를 통해 디지털이미지정보추출부(M04)에서 추출한 디지털이미지 정보와 함께 디지털이미지수집부(M01)에서 수집한 원본 디지털이미지를 각각 디지털이미지데이터베이스(M05)와 디지털이미지저장부(M02)에 저장한다. (S05단계)
도1은 본 발명에 따른 디지털이미지분석엔진의 일 실시 예를 도시한 블록도.
도2는 본 발명에 따른 디지털이미지의 변환한 예.
도3은 본 발명에 따른 자가 학습형 디지털이미지 분석 엔진을 이용한 디지털이미지 데이터베이스 구축 방법의 일 실시 예를 도시한 순서도.
Claims (8)
- 자가 학습형 디지털이미지 분석 엔진 구현 방법에 있어서,온라인상의 디지털이미지 데이터를 수집하기 위한 크롤러 및 오프라인 인쇄물을 수집하여 디지털이미지로 변환할 스캐너를 포함한 디지털이미지수집부(M01), 디지털이미지수집부를 통해 수집된 디지털이미지 데이터를 저장하기 위한 디지털이미지저장부(M02), 디지털이미지 수집부를 통해 전송된 데이터의 정보를 변환하는 디지털이미지변환부(M03), 변환된 디지털이미지의 분석하여 정보를 추출하는 디지털이미지정보추출부(M04), 디지털이미지정보추출부를 통해 추출된 디지털이미지정보를 저장하는 디지털이미지데이터베이스(M05), 디지털이미지추출부를 통해 추출된 디지털이미지 정보를 선 등록된 디지털이미지 정보 즉 디지털이미지데이터베이스에 저장된 디지털이미지 정보와 비교 검색하여 그 결과를 보고하는 디지털이미지비교검색처리부(M06), 디지털이미지정보저장부에 최종 저장될 디지털이미지 정보에 태그 정보가 포함되지 않은 경우 해당 디지털이미지 정보에 태그를 삽입하는 수동태그삽입부(M07), 디지털이미지 정보를 최종 등록하는 디지털이미지정보등록부(M08)를 포함하는 것을 특징으로 하는 자가 학습형 디지털이미지 분석 엔진의 시스템 구성.
- 자가 학습형 디지털이미지 분석 엔진을 이용한 디지털이미지 데이터베이스 구축 방법에 있어서,(a) 디지털이미지수집부를 통해 수집된 디지털이미지 데이터를 디지털이미지변환부로 전송하는 단계,(b) 디지털이미지변환부로 전송된 디지털이미지 데이터를 변환하여 4가지 샘플을 생성하는 단계,(c) 디지털이미지정보추출부를 통해 변환한 4가지 샘플의 디지털이미지 정보를 추출하는 단계,(d)디지털이미지정보등록부를 통해 상기 (a), (b), (c)단계를 거쳐 수집, 추출한 원본 디지털이미지와 디지털이미지 정보를 각각 디지털이미지저장부와 디지털이미지데이터베이스에 저장, 등록하는 단계로 이루어진 디지털이미지 데이터베이스 구축 방법.
- 제 2항에 있어서,(b)단계의 디지털이미지 데이터 변환은 아래 식을 이용하여 C1(오리지널 디지털이미지)과 C2(오리지널 디지털이미지의 수평 반전), C3(C1의 컬러 반전), C4(C2의 컬러 반전)로 변환하는 방법.수학식1. 디지털이미지의 수평 반전X = 오리지널 디지털이미지의 가로 길이Y = 오리지널 디지털이미지의 세로 길이(Xn,Yn) = 수평 반전된 픽셀의 위치X1 = 수평 반전할 오리지널 디지털이미지 픽셀의 가로 위치Y1 = 수평 반전할 오리지널 디지털이미지 픽셀의 세로 위치( Xn , Yn ) = ( ABS ( X - X1 )+ 1 , Y1 )수학식2. 디지털이미지의 컬러 반전( R , G , B ) = 오리지널 디지털이미지의 픽셀 컬러 코드 값( Rn , Gn , Bn ) = 컬러 반전된 디지털이미지의 픽셀 컬러 코드 값( Rn , Gn , Bn ) = ( 255 - R , 255 - G , 255 - B )
- 제 2항에 있어서,(c)단계의 디지털이미지 정보 추출에 있어 아래 색상 분포를 이용한 디지털이미지 정보 추출 방법.표현할 수 있는 컬러를 일정한 범위로 나눠서 테이블을 구성하고, 이미지의 모든 픽셀들을 조사해서 해당 픽셀의 색상에 따라 적절한 테이블에 저장해서 이미지의 색상분포표를 추출한다.
- 제 2항에 있어서,(c)단계의 디지털이미지 정보 추출에 있어 아래 윤곽선 검출을 이용한 디지털이미지 정보 추출 방법.영상의 밝기가 낮은 값에서 높은 값으로, 또는 이와 반대로 변하는, 즉 주변 픽셀들과의 변화가 심한 픽셀을 찾아서 영상의 윤곽선을 검출할 수 있다. Edge는 영상의 변화도(gradient)의 크기를 구해서 추출할 수 있는데 1차 미분법 또는 2차 미분법을 사용하여 추출한다.
- 제 2항에 있어서,(c)단계의 디지털이미지 정보 추출에 있어 아래 주파수 공간처리를 이용한 디지털이미지 정보 추출 방법.이산 퓨리에 변환(Discrete Fourier Transform), 고속 퓨리에 변환(Fast Fourier Transform), 이산 코사인 변환(Discrete Cosine Transform), 웨이블릿 변환(Wavelet Transform) 등을 통해서 영상을 주파수 영역으로 변환해서 영상의 정보를 추출한다.
- 제 2항에 있어서,(c)단계의 디지털이미지 특징점 정보 추출에 있어 아래 디지털이미지 특징점 이용한 디지털이미지 정보 추출 방법.다양한 레벨의 가우시안블러(Gaussian-blur)가 적용된 영상(이하 A)들을 만들고, 각각의 영상을 사용해서 다양한 크기의 추가영상을 만든다. 그리고 같은 크기의 A 영상들을 비교해서 가우시안 차이값(Difference of Gaussians)을 구한 영상(이하 B)을 만든다. 마지막으로 서로 다른 크기의 B 영상들을 비교하는 과정에서 인접한 픽셀들보다 더 밝거나 어두운 픽셀을 찾아서 키 포인트로 사용한다.검출한 키 포인트에는 영상의 왜곡이 발생하는 경우 검출되지 않을 가능성이 높은 것들이 다수 포함되어 있다. 따라서 아래의 과정을 통해서 영상의 왜곡이 발 생하더라도 계속적으로 검출이 될 수 있는 키 포인트만을 추출한다.1) 보간법을 사용해서 키 포인트의 위치를 파악2) 주변 픽셀들과 비교했을 때 저대비(Low contrast)를 가지는 키 포인트 제거3) Edge 상에 위치한 키 포인트 제거각각의 키 포인트에 영상의 변화도(gradient)의 방향에 따라 방위를 설정한다. 이 과정은 추후 영상이 회전되는 왜곡에 강인할 수 있도록 한다.키 포인트마다 각각 8개의 방향으로 방위 설정된 블록을 가로, 세로 각각 4개씩 만들어서 총 128 차원의 벡터를 만든다. 그리고 색상 왜곡에 강인하도록 정규화 과정을 거친다. 생성된 128 차원의 벡터는 데이터베이스로 관리하기에 상당히 큰 차원의 수를 가지고 있다. 이는 차원의 저주(Curse of dimensionality)를 유발하게 되고, 이로 인해서 데이터베이스의 성능이 상당히 저하된다. 따라서 정보를 압축해서 차원의 수를 줄임으로서 데이터베이스의 성능을 개선할 수 있도록 한다.정보를 압축하는 과정은 아래의 사실에 기인한다.어떤 벡터 공간의 원소들을 보다 낮은 차원의 부분공간으로 사상해도 원소들의 특징은 보존된다. 부분공간으로 사상하는 과정은 원래 정보를 행렬로 구성한 후 무작위로 만들어진 행렬과 곱을 해서 처리한다. 여기서 무작위로 만들어지는 행렬의 원소는 실험을 통해 가장 좋은 성능을 내는 값을 선택한다.위 과정을 통해서 128 차원의 정보를 32 차원으로 줄여서 최종 디지털이미지 정보를 반환한다.
- 제 2항에 있어서,(c)단계의 디지털이미지 데이터 속성을 이용한 태그 및 기타 정보 추출에 있어 태그 정보가 없는 디지털이미지의 경우 디지털이미지비교검색처리부를 통해 선 등록된 디지털이미지 정보 즉 디지털이미지데이터베이스에 저장된 정보와 비교하여 유사한 디지털이미지를 검색하고 유사한 디지털이미지가 검색된 경우 검색된 디지털이미지가 포함하고 있는 정보를 태그 정보가 없는 디지털이미지에 삽입하고 이를 추출하게 하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090002092A KR20100082683A (ko) | 2009-01-09 | 2009-01-09 | 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090002092A KR20100082683A (ko) | 2009-01-09 | 2009-01-09 | 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20100082683A true KR20100082683A (ko) | 2010-07-19 |
Family
ID=42642713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090002092A KR20100082683A (ko) | 2009-01-09 | 2009-01-09 | 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20100082683A (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013009422A3 (en) * | 2011-07-13 | 2013-05-16 | Google Inc. | Systems and methods for matching visual object components |
KR20190125781A (ko) * | 2018-04-30 | 2019-11-07 | 연세대학교 산학협력단 | 객체 인식을 위한 자가 학습 장치 및 방법 |
KR20190131366A (ko) * | 2018-05-16 | 2019-11-26 | 세종대학교산학협력단 | 영상 처리에서의 데이터 확장 방법 및 그 장치 |
-
2009
- 2009-01-09 KR KR1020090002092A patent/KR20100082683A/ko not_active Application Discontinuation
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013009422A3 (en) * | 2011-07-13 | 2013-05-16 | Google Inc. | Systems and methods for matching visual object components |
US8625887B2 (en) | 2011-07-13 | 2014-01-07 | Google Inc. | Systems and methods for matching visual object components |
US9117146B2 (en) | 2011-07-13 | 2015-08-25 | Google Inc. | Systems and methods for matching visual object components |
KR20190125781A (ko) * | 2018-04-30 | 2019-11-07 | 연세대학교 산학협력단 | 객체 인식을 위한 자가 학습 장치 및 방법 |
KR20190131366A (ko) * | 2018-05-16 | 2019-11-26 | 세종대학교산학협력단 | 영상 처리에서의 데이터 확장 방법 및 그 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8467614B2 (en) | Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images | |
CN106126585B (zh) | 基于质量分级与感知哈希特征组合的无人机图像检索方法 | |
CN110598019B (zh) | 重复图像识别方法及装置 | |
CN110704662A (zh) | 一种图像分类方法及系统 | |
CN106778714A (zh) | 基于非线性特征和模型合并的lda人脸识别方法 | |
Nirmala et al. | A modern approach for image forgery detection using BRICH clustering based on normalised mean and standard deviation | |
Al_azrak et al. | Copy-move forgery detection based on discrete and SURF transforms | |
Tsai et al. | Generalized traffic sign detection model for developing a sign inventory | |
KR20100082683A (ko) | 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법 | |
Rajab et al. | Stamps extraction using local adaptive k-means and ISODATA algorithms | |
Soumya et al. | License plate detection and character recognition using contour analysis | |
CN112560925A (zh) | 一种复杂场景目标检测数据集构建方法及系统 | |
CN109902690A (zh) | 图像识别技术 | |
Díaz et al. | Automatic clump splitting for cell quantification in microscopical images | |
Dixit et al. | Copy–move image forgery detection using gray-tones with texture description | |
Zhang et al. | Extraction of karyocytes and their components from microscopic bone marrow images based on regional color features | |
Shahbaz et al. | A data mining approach to recognize objects in satellite images to predict natural resources | |
CN113158745A (zh) | 一种基于多特征算子的乱码文档图片识别方法及系统 | |
Mosorov | A main stem concept for image matching | |
Jindal et al. | Script identification for printed document images at text-line level using DCT and PCA | |
Pareti et al. | On defining signatures for the retrieval and the classification of graphical drop caps | |
Alby et al. | Automatic identification of archaeological artifacts on the excavation site | |
Sulaiman et al. | Image tampering detection using extreme learning machine | |
Dunker et al. | Medieval Coins of Three Different Types and of Various States of Preservation | |
CN118155213A (zh) | 卡函关键地址信息识别方法、特征提取方法、计算机装置及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |