KR20100082683A - 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법 - Google Patents

자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법 Download PDF

Info

Publication number
KR20100082683A
KR20100082683A KR1020090002092A KR20090002092A KR20100082683A KR 20100082683 A KR20100082683 A KR 20100082683A KR 1020090002092 A KR1020090002092 A KR 1020090002092A KR 20090002092 A KR20090002092 A KR 20090002092A KR 20100082683 A KR20100082683 A KR 20100082683A
Authority
KR
South Korea
Prior art keywords
digital image
information
unit
image information
database
Prior art date
Application number
KR1020090002092A
Other languages
English (en)
Inventor
임동현
김기태
Original Assignee
삼정데이타서비스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼정데이타서비스 주식회사 filed Critical 삼정데이타서비스 주식회사
Priority to KR1020090002092A priority Critical patent/KR20100082683A/ko
Publication of KR20100082683A publication Critical patent/KR20100082683A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/60Rotation of whole images or parts thereof
    • G06T3/604Rotation of whole images or parts thereof using coordinate rotation digital computer [CORDIC] devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/168Segmentation; Edge detection involving transform domain methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • G06T7/41Analysis of texture based on statistical description of texture
    • G06T7/44Analysis of texture based on statistical description of texture using image operators, e.g. filters, edge density metrics or local histograms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

본 발명은 디지털 컨텐츠 중에서도 디지털이미지에 관한 것으로 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법에 대한 것이다.
종래에는 단순히 디지털이미지 정보를 수동적으로 구축하거나 고유키 또는 사용자키, 워터마크 삽입 등을 통한 디지털이미지 데이터베이스를 구축하고 이를 토대로 검색 및 저작권 관리 등의 업무를 수행하여 왔으나, 본 발명에서는 디지털이미지 정보 구축에 필요한 인적, 물적 자원의 활용을 최소화하고 체계적인 디지털이미지 정보 구축을 가능하게 함으로서, 디지털이미디이지로부터 파생되는 관련 업무를 효과적으로 처리할 수 있도록 한 자가 학습형 디지털이미지 분석 엔진 및 디지털이미지 데이터베이스 구축 방법을 제공하는데 목적이 있다.
디지털이미지수집부, 디지털이미지저장부, 디지털이미지변환부, 디지털이미지정보추출부, 디지털이미지데이터베이스, 디지털이미지비교검색처리부, 수동태그삽입부, 디지털이미지정보등록부

Description

자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법{methods for designing self-educated digital image analyzing engine and database}
본 발명은 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법에 대한 것으로서, 보다 상세하게는 자가 학습형 디지털이미지 분석 엔진을 통해 디지털이미지를 수집, 변환, 분석하여 추출한 디지털이미지 정보를 데이터베이스로 구축하는 방법에 대한 것이다.
종래에는 디지털이미지의 정보 구축 즉 데이터베이스화하기 위한 방법으로 디지털이미지를 사람의 시각으로 판단하여 정보를 삽입하거나 고유키 또는 사용자키, 워터마크 삽입 등을 통하여 식별하는 등 다양한 수동적 방법이 이용되어져 왔다.
이러한 디지털이미지의 데이터베이스 구축 방법은 체계적인 정보 구축이 어렵고 수동적인 처리로 인한 인적, 물적 자원의 낭비를 초래하였고 사람이 수동으로 입력할 수 있는 정보의 한계 등으로 디지털이미지로부터 파생되는 관련 업무를 처리하기에 많은 어려움이 있었다.
본 발명은 상기와 같은 문제점을 해결하기 위한 것으로서, 디지털이미지를 수집, 변환, 분석하여 정보를 추출하는 자가 학습형 디지털이미지 분석 엔진을 제공함으로써 사람이 수동으로 입력하는 정보의 한계 및 오류를 극복하고 자동화된 체계적 디지털이미지 정보 추출을 가능하게 한다. 또한 해당 정보를 데이터베이스로 구축하기 위한 방법을 제공함으로서, 디지털이미지로부터 파생되는 각종 업무를 원활히 할 수 있도록 하는 것이다.
따라서 본 발명의 목적은 상기와 같은 문제점을 해결하기 위하여 디지털이미지 정보 즉 디지털이미지 데이터베이스 구축을 위하여 자가 학습형 디지털이미지 분석 엔진 및 디지털이미지 데이터베이스 구축 방법을 제공한다.
상기와 같은 목적을 달성하기 위하여 본 발명은 자가 학습이 가능한 디지털이미지분석엔진은 디지털이미지수집부(M01), 디지털이미지저장부(M02), 디지털이미지변환부(M03), 디지털이미지정보추출부(M04), 디지털이미지데이터베이스(M05), 디지털이미지비교검색처리부(M06), 수동태그삽입부(M07), 디지털이미지정보등록부(M08)로 구성된 시스템을 특징으로 한다.
특히 본 발명에 따른 디지털이미지변환부(M03)의 디지털이미지 변환 방법은 디지털이미지수집부(M01)를 통하여 수집한 디지털이미지데이터를 C1(오리지널 디지털이미지)과 C2(오리지널 디지털이미지의 수평 반전), C3(C1의 컬러 반전), C4(C2 의 컬러 반전)로 변환하는 것을 특징으로 한다.
또한, 특히 본 발명에 따른 디지털이미지정보추출부(M04)의 디지털이미지 정보 추출 방법은 색상 분포 정보 추출, 윤곽선 정보 추출, 주파수 공간 처리를 통한 정보 추출, 디지털이미지 특징 정보 추출로 이루어진 것을 특징으로 한다.
또한, 특히 본 발명에 따른 디지털이미지이미지비교검색처리부(M06)는 디지털이미지정보추출부(M04)를 통해 추출된 디지털이미지 정보를 디지털이미지데이터베이스(M05)와 비교 검색하는 것을 특징으로 한다.
또한, 특히 본 발명에 따른 수동태그삽입부(M07)는 디지털이미지정보추출부(M04)를 통해 추출된 디지털이미지 정보에 태그 정보가 없고, 디지털이미지정보추출부(M04)를 통해 추출된 디지털이미지 정보를 디지털이미지데이터베이스(M05)와 비교 검색한 경우에도 결과가 없는 경우 수동으로 태그 정보를 삽입하는 것을 특징으로 한다.
상기에서와 같이 본 발명에 의하여 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법에 따른 효과는 아래와 같다.
본 발명에 따른 디지털이미지 분석 엔진을 이용한 디지털이미지 데이터베이스를 구축하면 종래와 같이 사람의 시각에 따른 디지털이미지 정보 입력 또는 고유키 또는 사용자키, 워터마크 삽입 등과 같은 인위적인 데이터 삽입이 요구되지 않는다. 즉 수동적인 업무를 필요로 하지 않거나 최소화 할 수 있으며, 디지털이미지 데이터베이스 구축에 소요되는 인적, 물적 자원을 획기적으로 줄일 수 있다.
또한 디지털이미지에서 추출하는 각종 정보를 이용한 사실적 데이터베이스 구축으로 정보의 오류를 최소화 할 수 있다.
디지털이미지 분석 엔진을 통해 구축된 디지털이미지 데이터베이스는 디지털이미지로부터 파생되는 관련 서비스 또는 업무 예를 들어 디지털이미지검색, 저작권관리, 디지털이미지 태그 생성의 자동화 등 다양한 방면으로 활용할 수 있다.
이하에서는 첨부된 도면을 참조하여 본 발명의 바람직한 일 실시예를 상세하게 설명하기로 한다.
도1은 본 발명에 따른 디지털이미지분석엔진 구성의 일 실시 예를 도시한 블록도이다.
도 1에서의 디지털이미지분석엔진은 온라인상의 디지털이미지 데이터를 수집하기 위한 크롤러 및 오프라인 인쇄물을 수집하여 디지털이미지로 변환할 스캐너를 포함한 디지털이미지수집부(M01), 디지털이미지수집부를 통해 수집된 디지털이미지 데이터를 저장하기 위한 디지털이미지저장부(M02), 디지털이미지 수집부를 통해 전송된 데이터의 정보를 변환하는 디지털이미지변환부(M03), 변환된 디지털이미지의 분석하여 정보를 추출하는 디지털이미지정보추출부(M04), 디지털이미지정보추출부를 통해 추출된 디지털이미지정보를 저장하는 디지털이미지데이터베이스(M05), 디지털이미지추출부를 통해 추출된 디지털이미지 정보를 선 등록된 디지털이미지 정보 즉 디지털이미지데이터베이스에 저장된 디지털이미지 정보와 비교 검색하여 그 결과를 보고하는 디지털이미지비교검색처리부(M06), 디지털이미지정보저장부에 최 종 저장될 디지털이미지 정보에 태그 정보가 포함되지 않은 경우 해당 디지털이미지 정보에 태그를 삽입하는 수동태그삽입부(M07), 디지털이미지 정보를 최종 등록하는 디지털이미지정보등록부(M08)를 포함한다.
상기와 같은 구성을 가지는 자가 학습형 디지털이미지 분석 엔진의 디지털이미지 데이터베이스 구축 방법을 도 3을 참조하여 살펴보면 아래와 같다.
먼저 디지털이미지수집부(M01)를 통해 수집된 즉 크롤러 및 스캐너를 통해 수집한 디지털이미지 데이터를 디지털이미지변환부(M03)로 전송한다.(S01단계)
전송된 디지털이미지는 디지털이미지변환부(M03)를 통해 디지털이미지 정보를 추출할 4가지의 샘플 데이터를 생성한다.(S02단계)
4가지의 샘플 데이터는 디지털이미지수집부(M01)를 통해 수집된 디지털이미지 즉 원본의 픽셀 정보를 변환한 것으로써 도2의 C1, C2, C3, C4와 같이 변환하는 것을 특징으로 한다.
이때 디지털이미지의 변환 방법은 아래와 같다.
디지털이미지의 변환은 디지털이미지 픽셀 정보를 변환하는 것으로 C1(오리지널 디지털이미지)과 C2(오리지널 디지털이미지의 수평 반전), C3(C1의 컬러 반전), C4(C2의 컬러 반전)로 이루어진 4가지의 변환된 디지털이미지로 구성된다.
변환 방법을 더 상세히 하면 아래의 수학식을 이용한 픽셀 정보의 변환이 이루어진다.
디지털이미지의 수평 반전 수학식은 아래와 같다.
X = 오리지널 디지털이미지의 가로 길이
Y = 오리지널 디지털이미지의 세로 길이
(Xn,Yn) = 수평 반전된 픽셀의 위치
X1 = 수평 반전할 오리지널 디지털이미지 픽셀의 가로 위치
Y1 = 수평 반전할 오리지널 디지털이미지 픽셀의 세로 위치
( Xn , Yn ) = ( ABS ( X - X1 )+ 1 , Y1 )
디지털이미지의 컬러 반전 수학식은 아래와 같다.
( R , G , B ) = 오리지널 디지털이미지의 픽셀 컬러 코드 값
( Rn , Gn , Bn ) = 컬러 반전된 디지털이미지의 픽셀 컬러 코드 값
( Rn , Gn , Bn ) = ( 255 - R , 255 - G , 255 - B )
디지털이미지변환부(M03)를 통해 변환된 디지털이미지는 디지털이미지정보추출부(M04)를 통해 분석되어 디지털이미지 정보를 추출한다.(S03단계)
이때 디지털이미지의 정보 추출 방법은 아래와 같이 크게 5가지로 나눌 수 있다.
1. 색상분포를 이용한 디지털이미지 정보 추출
표현할 수 있는 컬러를 일정한 범위로 나눠서 테이블을 구성하고, 이미지의 모든 픽셀들을 조사해서 해당 픽셀의 색상에 따라 적절한 테이블에 저장해서 이미지의 색상분포표를 추출한다.
2. 윤곽선 검출을 이용한 디지털이미지 정보 추출
영상의 밝기가 낮은 값에서 높은 값으로, 또는 이와 반대로 변하는, 즉 주변 픽셀들과의 변화가 심한 픽셀을 찾아서 영상의 윤곽선을 검출할 수 있다. Edge는 영상의 변화도(gradient)의 크기를 구해서 추출할 수 있는데 1차 미분법 또는 2차 미분법을 사용하여 추출한다.
3. 주파수 공간 처리를 이용한 디지털이미지 정보 추출
이산 퓨리에 변환(Discrete Fourier Transform), 고속 퓨리에 변환(Fast Fourier Transform), 이산 코사인 변환(Discrete Cosine Transform), 웨이블릿 변환(Wavelet Transform) 등을 통해서 영상을 주파수 영역으로 변환해서 영상의 정보를 추출한다
4. 디지털이미지 특징점을 이용한 디지털이미지 정보 추출
다양한 레벨의 가우시안블러(Gaussian-blur)가 적용된 영상(이하 A)들을 만들고, 각각의 영상을 사용해서 다양한 크기의 추가영상을 만든다. 그리고 같은 크기의 A 영상들을 비교해서 가우시안 차이값(Difference of Gaussians)을 구한 영상(이하 B)을 만든다. 마지막으로 서로 다른 크기의 B 영상들을 비교하는 과정에서 인접한 픽셀들보다 더 밝거나 어두운 픽셀을 찾아서 키 포인트로 사용한다.
검출한 키 포인트에는 영상의 왜곡이 발생하는 경우 검출되지 않을 가능성이 높은 것들이 다수 포함되어 있다. 따라서 아래의 과정을 통해서 영상의 왜곡이 발생하더라도 계속적으로 검출이 될 수 있는 키 포인트만을 추출한다.
1) 보간법을 사용해서 키 포인트의 위치를 파악
2) 주변 픽셀들과 비교했을 때 저대비(Low contrast)를 가지는 키 포인트 제거
3) Edge 상에 위치한 키 포인트 제거
각각의 키 포인트에 영상의 변화도(gradient)의 방향에 따라 방위를 설정한다. 이 과정은 추후 영상이 회전되는 왜곡에 강인할 수 있도록 한다.
키 포인트마다 각각 8개의 방향으로 방위 설정된 블록을 가로, 세로 각각 4개씩 만들어서 총 128 차원의 벡터를 만든다. 그리고 색상 왜곡에 강인하도록 정규화 과정을 거친다.
생성된 128 차원의 벡터는 데이터베이스로 관리하기에 상당히 큰 차원의 수를 가지고 있다. 이는 차원의 저주(Curse of dimensionality)를 유발하게 되고, 이로 인해서 데이터베이스의 성능이 상당히 저하된다. 따라서 정보를 압축해서 차원의 수를 줄임으로서 데이터베이스의 성능을 개선할 수 있도록 한다.
정보를 압축하는 과정은 아래의 사실에 기인한다.
어떤 벡터 공간의 원소들을 보다 낮은 차원의 부분공간으로 사상해도 원소들의 특징은 보존된다.
부분공간으로 사상하는 과정은 원래 정보를 행렬로 구성한 후 무작위로 만들어진 행렬과 곱을 해서 처리한다. 여기서 무작위로 만들어지는 행렬의 원소는 실험을 통해 가장 좋은 성능을 내는 값을 선택한다.
위 과정을 통해서 128 차원의 정보를 32 차원으로 줄여서 최종 디지털이미지
정보를 반환한다.
5. 태그 및 데이터 속성 추출
상기 4단계의 디지털이미지 정보 추출 과정과 별도로 디지털이미지 데이터 속성으로부터 태그 및 데이터 속성 정보(해상도 및 파일 포맷 등 데이터 속성이 가지는 정보)를 추출한다.
계속해서 디지털이미지 정보를 추출하는 과정에 있어 태그 정보 추출 여부에 따라 다음 과정을 수행한다.(S04단계)
태그 정보가 추출된 경우 디지털이미지정보등록부(M08)를 통해 디지털이미지정보추출부(M04)에서 추출한 디지털이미지 정보와 함께 디지털이미지수집부(M01)에서 수집한 원본 디지털이미지를 각각 디지털이미지데이터베이스(M05)와 디지털이미지저장부(M02)에 저장한다.(S05단계)
태그 정보가 추출되지 않은 경우 디지털이미지정보추출부(M04)를 통해 추출된 디지털이미지 정보인 태그를 제외한 나머지 정보를 디지털이미지지비교검색처리부(M06)를 통해 선 등록된 디지털이미지 정보 즉 디지털이미지데이터베이스(M05)에 저장된 정보와 비교하여 유사한 디지털이미지를 검색한다.(S06단계)
이때 디지털이미지를 비교 검색하는 과정에 있어 검색 여부에 따라 다음 과정을 수행한다.(S07단계)
유사한 디지털이미지가 검색된 경우 검색된 디지털이미지가 포함하고 있는 태그 정보를 태그 정보가 없는 원본 디지털이미지에 삽입하고 디지털이미지정보등록부(M08)를 통해 디지털이미지정보추출부(M04)에서 추출한 디지털이미지 정보와 함께 디지털이미지수집부(M01)에서 수집한 원본 디지털이미지를 각각 디지털이미지데이터베이스(M05)와 디지털이미지저장부(M02)에 저장한다.(S05단계)
유사한 디지털이미지가 검색되지 않은 경우 태그 정보가 없는 원본 디지털이미지에 수동태그삽입부(M07)를 통해 태그 정보를 수동 삽입한다.(S08단계)
태그 정보가 없는 원본 디지털이미지에 태그 정보를 수동으로 삽입한 후 디지털이미지정보등록부(M08)를 통해 디지털이미지정보추출부(M04)에서 추출한 디지털이미지 정보와 함께 디지털이미지수집부(M01)에서 수집한 원본 디지털이미지를 각각 디지털이미지데이터베이스(M05)와 디지털이미지저장부(M02)에 저장한다. (S05단계)
도1은 본 발명에 따른 디지털이미지분석엔진의 일 실시 예를 도시한 블록도.
도2는 본 발명에 따른 디지털이미지의 변환한 예.
도3은 본 발명에 따른 자가 학습형 디지털이미지 분석 엔진을 이용한 디지털이미지 데이터베이스 구축 방법의 일 실시 예를 도시한 순서도.

Claims (8)

  1. 자가 학습형 디지털이미지 분석 엔진 구현 방법에 있어서,
    온라인상의 디지털이미지 데이터를 수집하기 위한 크롤러 및 오프라인 인쇄물을 수집하여 디지털이미지로 변환할 스캐너를 포함한 디지털이미지수집부(M01), 디지털이미지수집부를 통해 수집된 디지털이미지 데이터를 저장하기 위한 디지털이미지저장부(M02), 디지털이미지 수집부를 통해 전송된 데이터의 정보를 변환하는 디지털이미지변환부(M03), 변환된 디지털이미지의 분석하여 정보를 추출하는 디지털이미지정보추출부(M04), 디지털이미지정보추출부를 통해 추출된 디지털이미지정보를 저장하는 디지털이미지데이터베이스(M05), 디지털이미지추출부를 통해 추출된 디지털이미지 정보를 선 등록된 디지털이미지 정보 즉 디지털이미지데이터베이스에 저장된 디지털이미지 정보와 비교 검색하여 그 결과를 보고하는 디지털이미지비교검색처리부(M06), 디지털이미지정보저장부에 최종 저장될 디지털이미지 정보에 태그 정보가 포함되지 않은 경우 해당 디지털이미지 정보에 태그를 삽입하는 수동태그삽입부(M07), 디지털이미지 정보를 최종 등록하는 디지털이미지정보등록부(M08)를 포함하는 것을 특징으로 하는 자가 학습형 디지털이미지 분석 엔진의 시스템 구성.
  2. 자가 학습형 디지털이미지 분석 엔진을 이용한 디지털이미지 데이터베이스 구축 방법에 있어서,
    (a) 디지털이미지수집부를 통해 수집된 디지털이미지 데이터를 디지털이미지변환부로 전송하는 단계,
    (b) 디지털이미지변환부로 전송된 디지털이미지 데이터를 변환하여 4가지 샘플을 생성하는 단계,
    (c) 디지털이미지정보추출부를 통해 변환한 4가지 샘플의 디지털이미지 정보를 추출하는 단계,
    (d)디지털이미지정보등록부를 통해 상기 (a), (b), (c)단계를 거쳐 수집, 추출한 원본 디지털이미지와 디지털이미지 정보를 각각 디지털이미지저장부와 디지털이미지데이터베이스에 저장, 등록하는 단계로 이루어진 디지털이미지 데이터베이스 구축 방법.
  3. 제 2항에 있어서,
    (b)단계의 디지털이미지 데이터 변환은 아래 식을 이용하여 C1(오리지널 디지털이미지)과 C2(오리지널 디지털이미지의 수평 반전), C3(C1의 컬러 반전), C4(C2의 컬러 반전)로 변환하는 방법.
    수학식1. 디지털이미지의 수평 반전
    X = 오리지널 디지털이미지의 가로 길이
    Y = 오리지널 디지털이미지의 세로 길이
    (Xn,Yn) = 수평 반전된 픽셀의 위치
    X1 = 수평 반전할 오리지널 디지털이미지 픽셀의 가로 위치
    Y1 = 수평 반전할 오리지널 디지털이미지 픽셀의 세로 위치
    ( Xn , Yn ) = ( ABS ( X - X1 )+ 1 , Y1 )
    수학식2. 디지털이미지의 컬러 반전
    ( R , G , B ) = 오리지널 디지털이미지의 픽셀 컬러 코드 값
    ( Rn , Gn , Bn ) = 컬러 반전된 디지털이미지의 픽셀 컬러 코드 값
    ( Rn , Gn , Bn ) = ( 255 - R , 255 - G , 255 - B )
  4. 제 2항에 있어서,
    (c)단계의 디지털이미지 정보 추출에 있어 아래 색상 분포를 이용한 디지털이미지 정보 추출 방법.
    표현할 수 있는 컬러를 일정한 범위로 나눠서 테이블을 구성하고, 이미지의 모든 픽셀들을 조사해서 해당 픽셀의 색상에 따라 적절한 테이블에 저장해서 이미지의 색상분포표를 추출한다.
  5. 제 2항에 있어서,
    (c)단계의 디지털이미지 정보 추출에 있어 아래 윤곽선 검출을 이용한 디지털이미지 정보 추출 방법.
    영상의 밝기가 낮은 값에서 높은 값으로, 또는 이와 반대로 변하는, 즉 주변 픽셀들과의 변화가 심한 픽셀을 찾아서 영상의 윤곽선을 검출할 수 있다. Edge는 영상의 변화도(gradient)의 크기를 구해서 추출할 수 있는데 1차 미분법 또는 2차 미분법을 사용하여 추출한다.
  6. 제 2항에 있어서,
    (c)단계의 디지털이미지 정보 추출에 있어 아래 주파수 공간처리를 이용한 디지털이미지 정보 추출 방법.
    이산 퓨리에 변환(Discrete Fourier Transform), 고속 퓨리에 변환(Fast Fourier Transform), 이산 코사인 변환(Discrete Cosine Transform), 웨이블릿 변환(Wavelet Transform) 등을 통해서 영상을 주파수 영역으로 변환해서 영상의 정보를 추출한다.
  7. 제 2항에 있어서,
    (c)단계의 디지털이미지 특징점 정보 추출에 있어 아래 디지털이미지 특징점 이용한 디지털이미지 정보 추출 방법.
    다양한 레벨의 가우시안블러(Gaussian-blur)가 적용된 영상(이하 A)들을 만들고, 각각의 영상을 사용해서 다양한 크기의 추가영상을 만든다. 그리고 같은 크기의 A 영상들을 비교해서 가우시안 차이값(Difference of Gaussians)을 구한 영상(이하 B)을 만든다. 마지막으로 서로 다른 크기의 B 영상들을 비교하는 과정에서 인접한 픽셀들보다 더 밝거나 어두운 픽셀을 찾아서 키 포인트로 사용한다.
    검출한 키 포인트에는 영상의 왜곡이 발생하는 경우 검출되지 않을 가능성이 높은 것들이 다수 포함되어 있다. 따라서 아래의 과정을 통해서 영상의 왜곡이 발 생하더라도 계속적으로 검출이 될 수 있는 키 포인트만을 추출한다.
    1) 보간법을 사용해서 키 포인트의 위치를 파악
    2) 주변 픽셀들과 비교했을 때 저대비(Low contrast)를 가지는 키 포인트 제거
    3) Edge 상에 위치한 키 포인트 제거
    각각의 키 포인트에 영상의 변화도(gradient)의 방향에 따라 방위를 설정한다. 이 과정은 추후 영상이 회전되는 왜곡에 강인할 수 있도록 한다.
    키 포인트마다 각각 8개의 방향으로 방위 설정된 블록을 가로, 세로 각각 4개씩 만들어서 총 128 차원의 벡터를 만든다. 그리고 색상 왜곡에 강인하도록 정규화 과정을 거친다. 생성된 128 차원의 벡터는 데이터베이스로 관리하기에 상당히 큰 차원의 수를 가지고 있다. 이는 차원의 저주(Curse of dimensionality)를 유발하게 되고, 이로 인해서 데이터베이스의 성능이 상당히 저하된다. 따라서 정보를 압축해서 차원의 수를 줄임으로서 데이터베이스의 성능을 개선할 수 있도록 한다.
    정보를 압축하는 과정은 아래의 사실에 기인한다.
    어떤 벡터 공간의 원소들을 보다 낮은 차원의 부분공간으로 사상해도 원소들의 특징은 보존된다. 부분공간으로 사상하는 과정은 원래 정보를 행렬로 구성한 후 무작위로 만들어진 행렬과 곱을 해서 처리한다. 여기서 무작위로 만들어지는 행렬의 원소는 실험을 통해 가장 좋은 성능을 내는 값을 선택한다.
    위 과정을 통해서 128 차원의 정보를 32 차원으로 줄여서 최종 디지털이미지 정보를 반환한다.
  8. 제 2항에 있어서,
    (c)단계의 디지털이미지 데이터 속성을 이용한 태그 및 기타 정보 추출에 있어 태그 정보가 없는 디지털이미지의 경우 디지털이미지비교검색처리부를 통해 선 등록된 디지털이미지 정보 즉 디지털이미지데이터베이스에 저장된 정보와 비교하여 유사한 디지털이미지를 검색하고 유사한 디지털이미지가 검색된 경우 검색된 디지털이미지가 포함하고 있는 정보를 태그 정보가 없는 디지털이미지에 삽입하고 이를 추출하게 하는 방법.
KR1020090002092A 2009-01-09 2009-01-09 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법 KR20100082683A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090002092A KR20100082683A (ko) 2009-01-09 2009-01-09 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090002092A KR20100082683A (ko) 2009-01-09 2009-01-09 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법

Publications (1)

Publication Number Publication Date
KR20100082683A true KR20100082683A (ko) 2010-07-19

Family

ID=42642713

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090002092A KR20100082683A (ko) 2009-01-09 2009-01-09 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법

Country Status (1)

Country Link
KR (1) KR20100082683A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013009422A3 (en) * 2011-07-13 2013-05-16 Google Inc. Systems and methods for matching visual object components
KR20190125781A (ko) * 2018-04-30 2019-11-07 연세대학교 산학협력단 객체 인식을 위한 자가 학습 장치 및 방법
KR20190131366A (ko) * 2018-05-16 2019-11-26 세종대학교산학협력단 영상 처리에서의 데이터 확장 방법 및 그 장치

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013009422A3 (en) * 2011-07-13 2013-05-16 Google Inc. Systems and methods for matching visual object components
US8625887B2 (en) 2011-07-13 2014-01-07 Google Inc. Systems and methods for matching visual object components
US9117146B2 (en) 2011-07-13 2015-08-25 Google Inc. Systems and methods for matching visual object components
KR20190125781A (ko) * 2018-04-30 2019-11-07 연세대학교 산학협력단 객체 인식을 위한 자가 학습 장치 및 방법
KR20190131366A (ko) * 2018-05-16 2019-11-26 세종대학교산학협력단 영상 처리에서의 데이터 확장 방법 및 그 장치

Similar Documents

Publication Publication Date Title
US8467614B2 (en) Method for processing optical character recognition (OCR) data, wherein the output comprises visually impaired character images
CN106126585B (zh) 基于质量分级与感知哈希特征组合的无人机图像检索方法
CN110598019B (zh) 重复图像识别方法及装置
CN110704662A (zh) 一种图像分类方法及系统
CN106778714A (zh) 基于非线性特征和模型合并的lda人脸识别方法
Nirmala et al. A modern approach for image forgery detection using BRICH clustering based on normalised mean and standard deviation
Al_azrak et al. Copy-move forgery detection based on discrete and SURF transforms
Tsai et al. Generalized traffic sign detection model for developing a sign inventory
KR20100082683A (ko) 자가 학습형 디지털이미지 분석 엔진 구현 방법 및 디지털이미지 데이터베이스 구축 방법
Rajab et al. Stamps extraction using local adaptive k-means and ISODATA algorithms
Soumya et al. License plate detection and character recognition using contour analysis
CN112560925A (zh) 一种复杂场景目标检测数据集构建方法及系统
CN109902690A (zh) 图像识别技术
Díaz et al. Automatic clump splitting for cell quantification in microscopical images
Dixit et al. Copy–move image forgery detection using gray-tones with texture description
Zhang et al. Extraction of karyocytes and their components from microscopic bone marrow images based on regional color features
Shahbaz et al. A data mining approach to recognize objects in satellite images to predict natural resources
CN113158745A (zh) 一种基于多特征算子的乱码文档图片识别方法及系统
Mosorov A main stem concept for image matching
Jindal et al. Script identification for printed document images at text-line level using DCT and PCA
Pareti et al. On defining signatures for the retrieval and the classification of graphical drop caps
Alby et al. Automatic identification of archaeological artifacts on the excavation site
Sulaiman et al. Image tampering detection using extreme learning machine
Dunker et al. Medieval Coins of Three Different Types and of Various States of Preservation
CN118155213A (zh) 卡函关键地址信息识别方法、特征提取方法、计算机装置及计算机可读存储介质

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application