KR20070048570A - 이미지 분별 장치 및 그 방법 - Google Patents

이미지 분별 장치 및 그 방법 Download PDF

Info

Publication number
KR20070048570A
KR20070048570A KR1020060024755A KR20060024755A KR20070048570A KR 20070048570 A KR20070048570 A KR 20070048570A KR 1020060024755 A KR1020060024755 A KR 1020060024755A KR 20060024755 A KR20060024755 A KR 20060024755A KR 20070048570 A KR20070048570 A KR 20070048570A
Authority
KR
South Korea
Prior art keywords
image
analysis target
target image
feature
type
Prior art date
Application number
KR1020060024755A
Other languages
English (en)
Other versions
KR100726473B1 (ko
Inventor
정철호
이상용
김재윤
Original Assignee
주식회사 칼라짚미디어
주식회사 칼라짚테크널로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 칼라짚미디어, 주식회사 칼라짚테크널로지 filed Critical 주식회사 칼라짚미디어
Priority to PCT/KR2006/004517 priority Critical patent/WO2007052957A1/en
Publication of KR20070048570A publication Critical patent/KR20070048570A/ko
Application granted granted Critical
Publication of KR100726473B1 publication Critical patent/KR100726473B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Electromagnetism (AREA)
  • General Health & Medical Sciences (AREA)
  • Toxicology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

이미지 종류 분류 장치 및 그 방법이 개시된다. 입력 이미지의 외부 특징과 다양한 종류의 기준 이미지들의 외부 특징과의 유사도를 기초로 입력 이미지의 종류를 1차 판별하고, 입력 이미지의 내부 특징이 1차 판별 결과의 이미지 종류의 내부 특징과 유사한지 2차 판별하여 파악된 입력 이미지의 종류가 자체에서 디코딩 가능한 종류인지 파악한다. 이로써, 입력 이미지가 자체에서 디코딩 가능한 종류의 이미지인지 파악함으로써 불필요한 디코딩을 방지할 수 있다.

Description

이미지 분별 장치 및 그 방법{Apparatus for classifying an image and method therefor}
도 1a 내지 도 1f는 이미지 코드의 일 예를 도시한 도면,
도 2는 본 발명에 따른 이미지 분별 장치의 일 실시예의 구성을 도시한 도면,
도 3은 본 발명에 따른 이미지 분별 장치의 영상 입력부의 상세 구성을 도시한 도면,
도 4a는 본 발명에 따른 이미지 분별 장치의 외부특징 파악부의 상세 구성을 도시한 도면,
도 4b는 본 발명에 따른 이미지 분별 장치의 내부특징 파악부의 상세 구성을 도시한 도면,
도 5는 본 발명에 따른 이미지 코드 분별 방법의 일 실시예의 흐름을 도시한 흐름도, 그리고,
도 6은 본 발명에 따른 이미지 분별 방법의 일 실시예의 흐름을 도시한 흐름도이다.
본 발명은 이미지 분별 장치 및 그 방법에 관한 것으로, 보다 상세하게는 이미지의 종류가 이미지 코드, 로고, 사진 등 어디에 해당하는지 분류하고, 분류된 종류에 따른 디코딩을 자체에서 또는 외부 서버를 통해 수행하는 장치 및 그 방법에 관한 것이다.
모바일 컴퓨팅 환경의 대두에 따라 카메라를 통해 영상을 인식하고 분석하여 추출한 정보를 통해 컴퓨터나 네트워크상의 서버에 접속하고 소정의 서비스를 받는 인터페이스 기술에 대한 관심이 높아지고 있다. 영상 인식과 관련된 기술로는 얼굴, 지문, 손등 정맥, 홍채, 제스처 등을 인식하는 생체인식 기술, 영상에 특정한 패턴을 숨기고 이를 추출하는 워터마크 기술, 그리고 주변 사물의 로고, 문자 등을 인식하는 기술 등이 있다.
모바일 컴퓨터, 휴대 전화, PDA 등과 같은 개인 휴대 단말기의 성능이 점차 향상됨에 따라 많은 양의 정보를 단말기 자체에서 처리할 수 있게 되었지만, 영상 인식은 매우 복잡하고 연산량이 많기 때문에 아직까지 모든 과정을 단말기에서 처리할 수는 없다. 따라서 컬러코드나 바코드와 같은 몇 가지 이미지 코드와 간단한 얼굴인식 등은 단말기에서 처리할 수 있으나, 복잡한 이미지 코드들과 생체정보, 로고 등은 단말기가 아니라 외부 서버로 이미지를 전송하여 정보 해석을 한다.
외부 서버로 이미지를 전송하는 경우 단말기의 상대적으로 느린 네트워크 속도를 감내해야 하고, 서버에서 디코딩된 결과를 다시 받아야 한다. 이 때문에 사용자들이 촬영한 영상을 서버로 전송하고, 그 영상의 처리 결과를 서버로부터 받기 위해서는 수초에서 수 분간이 소요되며, 영상의 품질이 좋지 않거나 디코딩이 실패한 경우에는 영상을 재촬영하여 전송하여야 하며, 서버와 데이터를 주고받기 위한 단말기의 통신 사용료가 발생하는 단점이 있다.
종래 영상인식 분야 서비스는 특정한 종류의 이미지만을 인식하여 서비스를 제공하는 것이 일반적이다. 예를 들어, 생체 인식 분야는 해당 생체 영상만을 인식하고, 이미지 코드 분야는 이미지 코드 영상만을 인식한다. 물론 이미지 코드 서비스는 1차원 바코드, 2차원 코드 등을 모두 인식하지만, 생체인식과 코드 인식, 그리고 로그 인식 등을 하나의 단말기에서 인식하는 경우는 존재하지 않는다. 왜냐하면 하나의 단말기에서 입력받은 영상이 이미지 코드인지 생체 영상인지, 로고나 글자인지 구별할 수 없기 때문이다.
본 발명이 이루고자 하는 기술적 과제는, 소정의 영상입력 장치를 통해 입력되는 이미지가 자체에서 디코딩 가능한 이미지인지 아닌지 그 종류를 파악하고, 자체에서 디코딩이 불가능한 경우 이미지의 특징 정보만을 외부로 전송하는 이미지 분별 장치 및 그 방법을 제공하는 데 있다.
본 발명이 이루고자 하는 다른 기술적 과제는, 상기의 이미지 분별 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 데 있다.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 이미지 분별 장치의 일 실시예는, 분석 대상 이미지를 입력받는 영상 입력부; 상기 분석 대상 이미지의 외부 특징과 다양한 종류의 기준 이미지들의 외부 특징과의 유사도를 기초로 상기 분석 대상 이미지의 종류를 1차 판별하는 외부특징 파악부; 상기 분석 대상 이미지의 내부 특징이 상기 1차 판별 결과의 이미지 종류의 내부 특징과 유사한지 2차 판별하는 내부특징 파악부; 및 상기 1차 판별 및 2차 판별 결과를 기초로 파악된 상기 분석 대상 이미지의 종류가 자체에서 디코딩 가능한 종류인지 파악하는 이미지 판별부;를 포함한다.
상기의 기술적 과제를 달성하기 위한, 본 발명에 따른 이미지 분별 방법의 일 실시예는, 분석 대상 이미지를 입력받는 단계; 상기 분석 대상 이미지의 외부 특징과 다양한 종류의 기준 이미지들의 외부 특징과의 유사도를 기초로 상기 분석 대상 이미지의 종류를 1차 판별하는 단계; 상기 분석 대상 이미지의 내부 특징이 상기 1차 판별 결과의 이미지 종류의 내부 특징과 유사한지 2차 판별하는 단계; 및 상기 1차 판별 및 2차 판별 결과를 기초로 파악된 상기 분석 대상 이미지의 종류가 자체에서 디코딩 가능한 종류인지 파악하는 단계;를 포함한다.
이로써, 입력 이미지가 자체에서 디코딩 가능한 종류의 이미지인지 파악하여 불필요한 디코딩을 방지할 수 있다.
이하에서, 첨부된 도면들을 참조하여 본 발명에 따른 이미지 분별 장치 및 그 방법에 대해 상세히 설명한다.
도 1a 내지 도 1f는 이미지 코드의 일 예를 도시한 도면이다.
도 1a는 데이터 매트릭스, 도 1b는 QR 코드, 도 1c는 PDF-417 코드, 도 1d는 컬러코드 및 그레이코드, 도 1e는 컬러코드와 QR 코드를 중첩하여 생성한 혼합코드, 도 1f는 컬러코드와 소정의 이미지를 중첩하여 생성한 혼합코드의 일 실시예이다.
본 발명에서는 일 실시예로 도 1a 내지 도 1f에 도시된 이미지 코드의 분별에 대해 개시하나, 이 외에 다른 이미지 코드를 정의하여 분별할 수 있으며, 로고나 사진의 경우도 분별할 수 있다. 다만 본 발명에서는 설명의 편의를 위해 주로 이미지 코드를 분별하는 방법에 대해 설명한다.
도 2는 본 발명에 따른 이미지 분별 장치의 일 실시예의 구성을 도시한 도면이다.
도 2를 참조하면, 이미지 분별 장치는 영상 입력부(200), 외부특징 파악부(210), 내부특징 파악부(220), 이미지 판별부(230), 디코딩부(240) 및 특징정보 추출부(250)로 구성된다.
영상 입력부(200)는 분석 대상 이미지를 소정의 영상 입력 장치를 통해 입력받는다. 영상 입력 장치는 개인휴대단말기에 내장 또는 외장되는 카메라이거나, 분석 대상 이미지를 전자문서의 형태로 유/무선 통신망을 통해 수신하는 장치이다. 영상 입력부의 상세 구성에 대해서는 도 3을 참조하여 상세히 설명한다.
외부특징 파악부(210)는 분석 대상 이미지의 외곽선 모양 및 패턴을 기초로 분석 대상 이미지의 종류를 1차 판별한다. 외부특징 파악부(210)는 미리 분석되어 저장된 여러 종류의 이미지들의 외부 특징 및 패턴에 대한 정보와 분석 대상 이미지의 외부 특징을 비교하여 종류를 1차 판별한다. 이하에서, 미리 분석되어 저장되 는 여러 종류의 이미지들을 '기준 이미지'라고 한다. 예를 들어, 바코드는 여러 개의 흑색 바로 구성되고, 이차원 이미지는 정사각형, 직사각형 등의 일정한 도형으로 구성되므로, 외부특징 파악부(210)는 분석 대상 이미지의 외곽 모양이 일정한 도형인 경우, 그 종류를 1차적으로 이차원 이미지로 파악한다. 외부특징 파악부(210)의 상세 구성에 대해서는 도 4a를 참조하여 상세히 설명한다.
내부특징 파악부(220)는 분석 대상 이미지의 내부 패턴 및 색상을 기초로 분석 대상 이미지의 종류를 2차 판별한다. 외부특징 파악부(210)에 의해 1차적으로 분석 대상 이미지의 종류가 일정 범위로 좁혀졌으므로, 그 범위 내에 있는 기준 이미지들의 내부 패턴 및 색상과 분석 대상 이미지의 내부 패턴 및 색상을 비교하여 분석 대상 이미지의 종류를 파악한다.
예를 들어, 바코드의 경우는 흑색 바의 내부에 또 다른 패턴이나 색상을 포함하지 아니하므로 별도의 내부특징 파악은 필요없지만, 2차원 이미지 코드의 경우 외곽선 모양만으로 분석 대상 이미지가 2차원 이미지 코드인지를 구별할 수 없다. 따라서, 1차적으로 외곽선의 모양이나 패턴이 이미지 코드의 모양이라고 하더라도, 그 내부 패턴이 2차원 이미지 코드의 특징을 포함하는지 파악하는 것이 필요하다. 내부특징 파악부(220)의 상세구성에 대해서는 도 4b를 참조하여 상세히 설명한다.
이미지 판별부(230)는 1차 판별 결과 및 2차 판별 결과를 기초로 분석 대상 이미지의 종류를 판단하고, 자체에서 디코딩 가능한 종류인지 파악한다. 그러나 1차 판별 결과 분석 대상 이미지의 종류가 이차원 이미지 코드로 판별되고, 2차 판별 결과 분석 대상 이미지의 종류가 이차원 이미지 코드 중 컬러코드로 판별된 경 우라도, 컬러코드에서 사용된 색이 일정 수 이하이면 정상적인 컬러코드가 아니다. 따라서 이미지 판별부(230)는 1차 및 2차 판별 결과를 통해 파악된 분석 대상 이미지의 종류가 디코딩 가능한지 파악한다.
예를 들어, 컬러코드의 경우 4가지 혹은 8가지 등의 색상이나 3가지 이상의 명암 정보를 사용하는 셀들로 구성되어 있는데, 단일 색으로만 이루어지는 경우라면 정상적인 컬러코드라고 할 수 없으므로, 이미지 판별부(230)는 1차 및 2차 판별 결과에도 불구하고 판단 불가능으로 분류한다. 마찬가지로 2D 코드의 경우, 코드 이미지 중의 상당 부분이 빛의 반사나 잉크로 인한 손상을 입은 경우 유사도가 낮아지게 되므로 판단 불가능으로 분류한다. 이런 경우들은 이미지가 심하게 손상을 입은 경우이므로 다시 이진화를 하거나 영상을 다시 입력받아야 한다. 부정형인 경우에도 유사도에 의해 판단할 수가 있다.
디코딩부(240)는 이미지 판별부(230)에 의해 분석 대상 이미지가 자체에서 디코딩 가능한 이미지 종류로 판별된 경우, 파악된 종류에 해당하는 디코딩 방법으로 분석 대상 이미지를 디코딩한다. 디코딩부(240)는 문자와 숫자의 경우에는 특징정보들을 통해 패턴 정합기법을 사용하여 문자와 숫자 정보를 판별한다. 2D 이미지 코드와 컬러코드의 경우에도 디코딩부(240)는 특징 정보를 이용하여 셀들의 위치를 판별하고 정규화함으로써 디코딩을 수행할 수 있다. 디코딩부(240)는 부정형의 경우에도 정합기법을 통해 가장 유사한 이미지를 데이터베이스에서 추출한 후 이를 통해 연결된 해당 서비스를 제공한다. 특징 정보의 추출에 대해서는 도 4a 및 도 4b를 참조하여 상세히 설명한다.
분석 대상 이미지의 종류가 저용량을 가진 컬러코드나 2차원 코드, 바코드 등으로 판단되면 이는 단말기의 성능을 고려할 때 디코딩이 일반적으로 가능하므로 디코딩부(240)는 자체적으로 분석 대상 이미지를 디코딩한다. 그러나 고용량 이미지 코드들의 경우에는 휴대용 단말기의 정보처리 능력이 한계로 인해 자체에서 처리가 불가능한 경우가 있다.
특징정보 전송부(250)는 분석 대상 이미지가 자체에서 처리 불가능한 이미지인 경우, 고성능의 외부 서버로 전송하여 분석 대상 이미지가 디코딩되도록 하며, 그 결과를 수신한다. 자체 처리가 불가능한 이미지의 경우로는 부정형의 로고 중 일부, 복잡한 그림 이미지, 그리고 많은 문자와 숫자들의 경우도 해당한다. 그러나 이러한 이미지들도 본 발명에 따른 이미지 분별 장치가 구비된 단말기의 성능이 향상됨에 따라 자체에서 디코딩될 수 있으므로, 자체 처리가 불가능한 이미지 종류는 단말기의 성능에 따라 유동적으로 설정된다.
특징정보 전송부(250)는 외부 서버와의 통신속도를 고려하여 분석 대상 이미지 자체를 외부 서버로 전송하는 것이 아니라, 분석 대상 이미지의 특징을 분석하고 그 분석된 특징 정보만을 외부 서버로 전송하는 것이 바람직하다. 전송을 위한 특징정보의 추출은 도 4a 및 도 4b를 참조하여 상세히 설명한다.
도 3은 본 발명에 따른 도 2의 이미지 분별 장치의 영상 입력부의 상세 구성을 도시한 도면이다.
도 3을 참조하면, 영상 입력부(200)는 이미지 정규화부(300), 이진화부(310) 및 이미지 추출부(320)로 구성된다. 영상 입력부(200)는 카메라 등을 통해 입력된 이미지에서 소정의 정보를 표시하는 부분(즉, 이미지 코드, 로고, 글자 등)을 배경과 분리하여 분석 대상 이미지를 생성한다.
이미지 정규화부(300)는 먼저 카메라를 통해 입력된 이미지를 디코딩하기 쉬운 영상 포맷으로 변환한다. 예를 들어, 이미지 정규화부(300)는 YUV24, RGB24 등의 포맷으로 입력된 이미지를 RGB24 포맷으로 변환한다. 그리고 이미지 정규화부(300)는 이미지의 색상, 명암 등을 보정하고 이미지의 방향 및 크기를 정렬하여 정규화 이미지를 생성한다.
카메라 등을 통해 입력되는 이미지의 색상 및 명암은 조명의 종류, 촬영 시기(밤 또는 낮), 이미지가 인쇄된 인쇄매체 및 카메라 센서 성능 등에 의해 많은 영향을 받는다. 따라서 이미지 정규화부(300)는 입력된 이미지의 색상의 변이, 명암의 변이 및 이들의 분포 특성 등을 측정하여 이미지의 색상 및 명암 등을 보정한다.
보정 과정에 대해 구체적으로 살펴보면, 이미지 정규화부(300)는 먼저 이미지를 일정한 블록 단위로 나누고 각 블록의 명암 및 조명 특성값을 구한다. 이미지 정규화부(300)는 각 블록에 대해 구한 값들을 상호 비교하고 인터폴레이션시켜 이미지 전체의 명암 정보를 구한다. 이런 방법은 일반적으로 그라데이션 명암 정보를 처리하기 위한 것이며, 이러한 명암의 변화 비율을 이용하여 보정이 가능하다.
명암 정보는 같은 종류의 색상끼리 비교할 때 더욱 정확해진다. 따라서 이미지 정규화부(300)는 소정의 정해진 표준조명 환경에서 소정의 이미지를 촬영하여 명암 등의 분포를 미리 분석해 둔다. 이미지 정규화부(300)는 미리 분석해둔 명암 등의 분포와 입력된 이미지의 명암 분포를 상호 비교함으로써 보다 쉽고 정확하게 이미지의 명암을 보정할 수 있다.
즉 이미지 정규화부(300)는 표준 조명하에서 특정한 색들의 R,G,B 각 채널의 분포 비율, 최대값, 최소값 및 명암의 최대, 최소, 중간값, 분포 비율을 미리 분석해 둔다. 그리고 이미지 정규화부(300)는 일반 조명 환경에서 입력된 이미지의 R,G,B 채널 분포 비율 등을 분석하여 미리 분석해둔 표준 조명하에서의 값과 비교하여 입력된 이미지의 색상 및 명암을 보정한다.
이미지 정규화부(300)는 명암 및 색상이 보정된 정규화 이미지를 생성하기 위하여 Gray World Assumption 방법, Retinex 알고리즘, 또는 Gamut mapping 알고리즘 등과 같은 색상 보정(color correction)알고리즘을 사용할 수 있다.
이진화부(310)는 색상 및 명암이 보정된 정규화 이미지를 두 가지 색상 또는 두 가지 명암으로 표현되는 이진화 이미지로 변환한다. 본 실시예에서는 흑과 백으로 구성된 이진화 이미지로의 변환에 대해서 기술한다.
이진화부(310)는 먼저 정규화 이미지를 색상 및 명암별로 분할한다. 예를 들어, 이진화부(310)는 인접 픽셀간의 색상과 명암의 차이가 일정 오차 이내이면 동일한 색상과 명암으로 판단함으로써, 이미지를 동일한 색상과 명암을 가진 여러 영역들로 분할한다.
색상 및 명암을 이용한 영역 분할이 완료되면, 이진화부(310)는 밝기 및 R,G,B 각 채널에 대한 히스토그램을 통해 이진화 값을 구한다. 이진화부(310)는 인접 픽셀들을 몇 개 단위로 묶어서 가중치를 두어 평균을 구한 후 그 평균을 해당 밝기의 빈도수로 설정할 수 있다. 만약 정규화 이미지의 밝기값이나 색상값이 두 그룹으로 명확하게 구별될 수 있다면, 이진화부(310)는 두 그룹 사이의 가장 빈도수가 적은 밝기값이나 색상의 강도값을 이진화 값으로 택한다. 그룹이 여러 개로 나뉜다면, 이진화부(310)는 그 그룹간의 빈도수가 가장 적은 밝기값들과 색상값들을 미리 이진환 환경 변수로서 기억해 둔 후 그 중 하나를 택하여 이진화값으로 설정한다.
이진화부(310)는 설정된 이진화값을 이용하여 이미지를 흑과 백으로 이진화한 후 잡영을 제거한다. 예를 들어, 이진화부(310)는 이미지 픽셀의 밝기가 이진화 값 이상인 경우 그 픽셀을 흰색으로 변환하고, 이진화 값 미만이면 그 픽셀을 흑색으로 변환한다.
그리고, 이진화부(310)는 흑과 백으로 변환된 이미지에서 흑색 물체의 크기가 소정 이하면 이를 잡영으로 판단하여 제거한다. 다만, 2D 흑백 이미지 코드는 작은 흑색 물체들의 집합으로 이루어지므로 일률적으로 없앨 수는 없다. 따라서 이진화부(310)는 이미지의 가장 바깥쪽의 흑색 픽셀들, 즉 바깥 틀에 연결된 잡영 이미지들을 먼저 없앰으로써 이미지 가운데나 근처에 위치할 것으로 예상되는 코드 이미지를 보호할 수 있다. 이진화부(310)는 이미지가 고르지 못한 경우에는 가우시안 필터링 등을 통해 이미지의 끊어진 점들을 복원한다.
이미지 추출부(320)는 이진화 이미지로부터 분석 대상 이미지 영역을 검출한다. 먼저 이미지 추출부(320)는 이진화 이미지에서 흑색으로 나타난 영역의 외곽선을 찾아냄으로써 물체들이 존재하는 후보 영역을 검출한다. 입력 이미지가 문자나 숫자의 경우에는 선으로 이루어지거나 비교적 얇은 두께를 가진 무정형의 도형이 후보 영역으로 검출되고, 컬러코드나 로고의 경우에는 비교적 정해진 모양의 영역이 후보 영역으로 검출된다. 또한 QR 코드나 데이터 매트릭스 등의 경우에는 픽셀들과 선들의 집합으로 이루어진 후보 영역이 검출된다.
이미지 추출부(320)에 의해 검출된 후보 영역은 하나의 영역이거나, 여러 영역으로 이루질 수 있다. 따라서, 이미지 추출부(320)는 서로 분리되어 있는 후보 영역이라 하더라도 이를 하나의 분석 대상 이미지 영역으로 처리한다. 예를 들어, QR 코드 등의 이미지 코드는 여러 픽셀의 집합이므로, 픽셀간 거리를 계산하여 소정의 거리 이하인 픽셀들을 하나의 집합으로 처리하는 것이 바람직하다. 특히 이미지의 중심에 위치한 물체를 기반으로 인접 픽셀과의 거리를 연산하여 범위를 확장하는 것이 보다 유용한 방법이다. 이는 관심있는 물체가 대부분의 경우 이미지의 중심에 위치하기 때문이다.
도 4a는 본 발명에 따른 이미지 분별 장치의 외부 특징 파악부의 상세 구성을 도시한 도면이다. 도 4a를 참조하면, 외부 특징 파악부(210)는 외부 특징 추출부(410) 및 제1패턴 유사도 계산부(420)로 구성된다.
외부 특징 추출부(410)는 분석 대상 이미지의 외곽선, 방향성의 변화, 좌표의 최대, 최소점, 단일 방향 선분의 길이를 감지하여 특징 정보들을 추출하여 표준화된 패턴 정보를 생성한다. 특징 정보들로는 특징점의 좌표, 특징점간 체인 코드(chain code)와 길이 등이 있다. 구체적으로 특징정보들로는 이미지를 구성하는 외곽선이나 특징 패턴을 구성하는 선분들의 각도 변화 정보, 특징점들의 좌표 및 상 대 위치에 의한 패턴, 이미지 외부 특징점들의 최대, 최소점 그리고 패턴 길이 등이 있다.
특징점은 이미지상의 선분, 도형 등의 물체에 있어서 물체의 특징을 나타내는 픽셀들을 의미하며, 특징점을 찾는 방법으로는 에지 검출 알고리즘, 문자 인식때의 문자의 말단, 겹침 검출 방법 등 다양한 알고리즘이 병합되어 사용된다. 일반적으로 사용되는 특징점은 물체의 선분을 구성하는 각 픽셀들 중 주요 정보, 예를 들어 말단, 코너, 선분 방향이 한계 각도 이상으로 바뀌는 픽셀, 2D 코드셀들의 중심점 등이다. 이런 특징점을 찾는 방법에 대하여는 다음과 같은 참조 문헌이 있다.
"오호근, 바코드 기술 및 응용, 성안당, 1997", "이성환, 문자인식-이론과 실제, 홍릉과학출판사, 1994", "Earl Gose, Richard Johnsonbaugh, Steve Jost, Pattern Recognition and Image Analysis, Prentice Hall, 1996", "ISO/IEC 18004:2000 Information techonolgy - Automatic identification and data capture technique - Bar code symbology specifications - PDF417", "ISO/ISE 16022:2000 Information technology - International symbology specification - Data Matrix", "ISO/IEC 16032:2000 Information technology - International symbology specification - MaxiCode" 등이 있다.
외부 특징 추출부(410)는 표준화된 패턴 정보를 생성하기 위해 필요에 따라 골격화, 훅 처리, 평활화, 정규화를 수행한다. 각 과정에 대해 차례대로 설명한다.
(1) 골격화
골격화는 선분이나 글자의 특징점들을 추출하기 위하여, 선분이나 글자를 두 께가 픽셀 1개로 이루어진 선분으로 바꾸는 것을 말한다. 골격화는 일정 두께 이하인 물체에 대하여 수행되지만 필요에 따라 두꺼운 물체에 대해서도 수행될 수 있다. 두꺼운 물체에 대해 골격화를 수행하는 경우, 골격화를 통해 얻어지는 선분은 해당 물체의 중앙축의 정보를 포함하므로 해당 물체의 모양이나 특징을 잘 표현한다. 예를 들어, 정사각형의 경우, 골격화를 통해 상대 꼭지점을 대각선으로 연결한 X자 모양의 골격화 선분을 얻어낼 수 있다. 이러한 골격화 과정은 세선화 알고리즘에 의해 수행된다.
(2) 훅 처리
훅 처리는 특징점의 삐침 부분을 제거하는 것이다. 예를 들어, 글자의 경우 글자의 시작 부분에 일종의 잡영으로 볼 수 있는 삐침이 있는데, 이런 부분은 제거되는 것이 바람직하다. 삐침 부분은 특징점간 거리가 짧고, 방향 전환이 급격하므로, 이러한 특징을 기초로 제거된다.
(3) 평활화
평활화는 선분의 왜곡 등으로 인한 삐뚤삐뚤함을 제거하는 것이다. 즉 방향 전환이 어느 정도는 있으나 전체적으로 하나의 선분을 이루는 곡선들 집합의 경우, 특징점들은 오밀조밀하면서 방향전환이 있으므로 이들을 하나의 직선 또는 곡선으로 수렵하도록 처리하는 것이 평활화이다.
예를 들어, 글씨나 그림을 그렸을 대 선분들이 삐뚤삐뚤한 경우 이를 평탄하게 만들어주는 Ellozy가 제안한 방법(수학식 1)과 국소적으로 직선인 부분의 점들을 전체적으로 직선화하는 Plamo가 제안한 방법(수학식 2) 등이 있다.
Figure 112006018808869-PAT00001
Figure 112006018808869-PAT00002
여기서, x는 좌표를 나타내는 벡터이다.
(4) 정규화
정규화는 카메라를 통해 입력되는 이미지의 크기와 방향이 카메라 특성에 따라 달라질 수 있으므로, 소정의 기준에 따라 그 크기 및 방향을 재조정하는 것을 말하며, 크기 정규화 및 방향 정규화가 있다.
먼저, 크기 정규화를 위해서 물체의 구성 요소 중 가장 짧은 선분의 길이 또는 그 선분을 n등분한 것을 단위길이로 설정하고, 다른 선분의 길이들을 단위길이의 배수로 파악한다. 이로써, 각 선분의 길이 비율을 알 수 있다. 선분의 길이 비율을 이용하여 물체의 외곽선을 구성하는 선분들의 길이를 동일 비율로 확대 또는 축소함으로써 이미지의 크기를 표준화할 수 있다. 즉, 외곽선을 구성하는 선분들의 길이의 합을 단위 길이로 나누면 단위 길이 수를 알 수 있으므로, 동일한 단위 길이 수를 가지도록 이미지의 크기를 표준화할 수 있다.
다음으로, 방향 정규화를 위해서 소정의 특징점 간의 방향성 정보, 즉 체인코드(chain code) 정보를 구성한다. 예를 들어, 기준 특징점에서 연결된 한 특징점 A까지의 방향성 정보를 구하고, A에 연결된 다른 특징점 B까지의 방향성 정보를 구 한다. 이런 식으로 외곽선을 구성하는 모든 선분의 방향 정보를 구하면 연속된 체인 코드가 만들어진다. 만약 물체가 선분이 아니 도형 형태이면, 시작 특징점이 종료 특징점이 될 것이고, 그렇지 아니면 시작 특징점과 종료 특징점이 달라질 것이다. 체인 코드가 형성되면, 이 체인 코드를 이루는 방향수의 차를 이용하여 형태수를 구한다(자세한 내용은, "Digital Image Processing, by Rafael C. Gonzalez and Richard E. Woods, Addison-Wesley, 2002" 참조).
형태수를 구하는 경우에는 회전이 되지 않은 물체를 이용하는 것이 바람직하며, 회전이 된 경우에는 8방향 부호 기법을 이용하여 가장 차수가 적은 것을 기준으로 하여 시계 방향으로 차수를 구한다. 구한 차수를 이미지 패턴 형태수라고 한다.
제1 패턴 유사도 계산부(420)는 분석 대상 이미지로부터 추출한 특징 정보들의 패턴과 소정의 기준 패턴들을 비교하여 가장 유사한 기준 패턴을 찾는다. 여기서 기준 패턴들은 본 발명에 따른 이미지 분별 장치가 설치된 개인 휴대 단말기 등에서 자체적으로 처리 가능한 다양한 종류의 이미지 코드 또는 로고 등의 기준 이미지를 미리 분석하여 파악한 패턴(또는 패턴 형태수)이다. 따라서, 제1 패턴 유사도 계산부(420)는 분석 대상 이미지의 특징 정보로부터 생성한 패턴(또는 패턴 형태수)과 기준 패턴(또는 패턴 형태수)를 비교하여 분석 대상 이미지의 종류를 1차 판별할 수 있다.
구체적으로, 제1 패턴 유사도 계산부(420)는 위에서 살핀 정규화 과정에서의 단위 길이수, 즉 형태수 집합의 원소 개수를 이용하여 같은 원소를 가지는 기준 패 턴들 집합을 구한 후, 이미지 패턴 형태수와 기준 패턴의 형태수의 원소 순서를 서로 비교하여 유사한 기준 패턴을 찾는다. 이때, 최소 차수, 즉 0으로 정규화되어 있더라도 다른 최소 차수인 0으로 시작되는 이미지 패턴 형태수가 존재할 수 있으므로 이를 고려하여 비교하여야 한다. 예를 들어, "03313303"이라는 이미지 패턴 형태수가 있을 때, 기준 패턴의 형태수가 "03033133"일 경우 양자는 동일한 이미지 패턴이다.
분석 대상 이미지가 안이 채워진 하나의 도형일 경우 하나의 외곽 모양에 대한 특징이 추출되므로, 제1 패턴 유사도 계산부(420)는 분석 대상 이미지의 패턴과 기준 이미지 패턴과의 패턴 유사도를 한 번만 계산하면 되지만, 분석 대상 이미지가 여러 외곽선을 가진 작은 물체들의 집합인 경우에는 하나의 물체에 해당하는 패턴 유사도의 집합을 구하여야 한다.
2D 이미지 코드의 경우에는 데이터를 구성하는 패턴들의 유사도가 발생하고, 코드를 찾기 위한 Finder Pattern이나 외곽선들에 대한 유사도들이 발생한다. QR 코드의 경우에는 코드의 세 꼭짓점을 포함하는 3개의 Finder pattern들이 있고, 그 외의 부분에는 다양한 형태의 픽셀들에 의한 패턴들의 집합이 형성된다.
예를 들어, 2D 이미지 코드 중 QR 코드는 코드 우하단을 제외한 나머지 부분에 파인더 패턴이 존재하며, 맥시코드(maxicode)는 가운데에 Bull's eye라고 부로는 동심원형 파인더 패턴이 존재한다. 바코드의 경우에는 코드의 좌변과 우변에 가이드 바라는 특징 패턴이 존재한다. 또한 이런 파인터 패턴, 가이드 바 이외에 해당 코드를 특징 지울 수 있는 다른 패턴들, 예를 들어 타이밍 패턴, 정렬 패턴 등 이 소정의 위치에 존재한다. 이런 경우에 하나의 코드는 분산된 패턴들의 집합, 즉 외곽선이나 점들의 집합으로 이루어지므로 각각의 분산 패턴들의 유사도들을 계산하여야 해당 코드의 유사도를 종합적으로 측정 가능하다. 로고의 경우에는 분산된 패턴으로 이루어질 수 있으므로, 이런 분산된 패턴들의 유사도를 계산하고, 이런 분산 패턴들의 집합을 이용하여 하나의 로고로서 종합적으로 유사도를 계산할 필요가 잇다. 분산 패턴들이 하나의 이미지에 속하는지는 분산 패턴들간의 상대 거리를 고려하는 방법이 가장 일반적이며, 이를 보통 Spiral Search라고 한다.
도 4a에서는 정규화된 특징 패턴 형태수를 생성하여 기준 패턴 형태수와 비교하는 방법에 대해 기술하였으나, 본 발명은 이에 한정되는 것이 아니며, 분석 대상 이미지의 외부 특징과 기준 이미지의 외부 특징을 상호 비교하여, 분석 대상 이미지의 종류를 1차적으로 판별하는 것에 특징이 있는바, 이러한 목적을 달성하기 위해 외부 특징 비교를 위한 여러 가지 다른 방법들이 사용될 수 있음은 물론이다.
이하에서는, 외부 특징 추출부(410)에 의해 추출된 분석 대상 이미지의 특징과 기준 이미지(컬러코드, 바코드 등) 특징의 유사도를 비교하여 이미지의 종류를 1차 판별하는 구체적 예를 설명한다.
(1) 컬러 코드의 분류
영역이 채워진 컬러코드의 경우에는 정사각형이나 직사각형이 물체의 외곽선 형태이므로 이러한 특징을 기초로 분류 가능인지 판별한다.
(2) 바코드 이미지 코드의 분류
바코드의 경우는 소정의 가이드 패턴(Guide pattern) 및 흰색/검은색 바의 집합으로 이루어져 있으므로, 이러한 패턴들의 집합을 기초로 분류 가능인지 판별한다.
(3) 2D 이미지 코드의 분류
2D 이미지 코드는 크게 매트릭스형과 계층형으로 나뉘지만, 대부분 파이더 패턴(Finder Pattern)들과 데이터 영역의 픽셀들로 구성된다. Finder Pattern은 코드의 꼭짓점이나 외곽선 부분에 존재하는 것이 일반적이며, 특정 코드들은 중앙에 존재하기도 한다. Finder Pattern은 정사각형, 특정한 흑백 막대 패턴 혹은 동심원들, 동심의 정사각형들, 외곽선 형태 등이다. 따라서 분석 대상 이미지의 소정 위치에 이러한 Finder Pattern 모양이 있다면 분류 가능으로 판별한다. 파인더 패턴 외의 나머지 부분들은 부정형의 픽셀들 패턴으로 이루어지므로 하나하나를 살필 필요는 없으며, 다만, 물체의 전체적인 모양이 정사각형, 직사각형, 소정의 도형 등으로 이루어져 있는지 살펴본다.
(4) 기타 도형과 선분들
위의 코드 모양에 해당하지 않더라도 물체의 이미지 모양이 전체적으로 특정한 도형의 형상(정사각형, 직사각형, 팔각형, 육각형 등)을 이루고 있을 경우, 혹은 이미 등록된 기준 패턴들과 유사한 경우에는 분류 가능으로 판별한다. 대체적으로 이러한 형태의 모양은 모양이 정해져 있는 이미지 코드나 회사 로고 등의 경우에 해당하기 때문이다. 패턴의 모양이 비교적 짧은 형태의 직선과 곡선 형태의 선분들의 집합인 경우에는 문자와 숫자에 해당하는 기준 패턴들의 집합과 비교하여 유사도를 측정한다. 부정형인 경우에는 부정형에 해당하는 기준 패턴들의 집합과 비교하여 유사도를 측정한다. 유사도가 소정의 유사도 이상이면 분류 가능으로 판별한다.
(5) 기타
분석 대상 이미지의 특징 패턴이 기준 패턴들의 집합과 비교하였을 때 소정의 유사도 미만이면 분류 불가능으로 판별하고, 기 계산하였던 이진화값과 특징점들의 특성 정보를 분석하여 이진화 계산시 참고 자료로 사용한다. 즉, 이진화 이후 물체의 영역 크기가 작고, 단절된 선분들이 많았다면, 이는 이진화값이 너무 낮아서 검은 색으로 처리할 부분이 흰색으로 처리되어 물체의 주요 정보들이 제거된 것으로 판단할 수 있다. 반대인 경우라면 이진화값을 높여줄 필요가 있으므로 이 경우 미리 정해두었던 후보 이진화값 중 조건에 적당한 값을 선택할 필요가 있다.
도 4b는 본 발명에 따른 이미지 분별 장치의 내부특징 파악부의 상세 구성을 도시한 도면이다. 도 4b를 참조하면, 내부특징 파악부(220)는 내부특징 추출부(430) 및 제2패턴 유사도 계산부(440)로 구성된다.
내부특징 추출부(430)는 이미지의 외부 모양을 통해 1차적으로 이미지 분류가 가능한 것으로 판단한 분석 대상 이미지의 내부에 있는 특징점과 색상 정보를 검출한다. 내부 특징의 추출은 외부 특징 추출부(410)에 의해 사용된 여러 가지 방법들이 사용될 수 있다. 바코드의 경우에는 외곽선이 바로 물체를 이루는 패턴들의 외곽선이기 때문에 굳이 별도로 구할 필요가 없다. 그러나 2차원 코드의 경우에는 Finder Pattern의 내부에 다른 패턴이 존재한다.
예를 들어 맥시코드의 Finder Pattern의 경우 찾아낸 외곽선 안에 다른 동심 원들이 존재하므로, 내부특징 추출부(430)는 그 동심원들의 특징점을 찾아낸다. 마찬가지로 QR 코드의 경우에는 Finder Pattern 내에 흑색 정사각형이 존재하므로, 내부특징 추출부(430)는 흑색 정사각형의 내부 특징을 검출한다. 컬러코드의 경우에는 해당 외곽선 안에 다양한 형태의 도형이 존재하므로, 내부특징 추출부(430)는 다양한 형태의 도형에 대한 특징점뿐만 아니라 컬러 코드 내의 색상 정보를 내부 특징으로 검출한다. 로고 이미지의 경우에는 도형 안에 문자와 숫자가 포함되어 있는 경우가 종종 있으므로, 내부특징 추출부(430)는 문자나 숫자 대한 특징점을 판별하고, 각 영역의 색상을 판단한다.
제2패턴 유사도 계산부(440)는 내부 특징점 분포와 기준 패턴들과의 유사도를 계산한다. 즉 제2패턴 유사도 계산부(440)는 내부 특징 추출부(430)에 찾아낸 물체 내부의 패턴들에 의한 특징점 및 특징정보와 기준 패턴들과의 유사도를 측정한다. 분석 대상 이미지는 제1패턴 유사도 계산부(420)에 의해 외부 특징을 기초로 무슨 종류의 이미지에 해당하는지, 즉 어느 후보군에 속하는지 1차 분류되었으므로, 제2패턴 유사도 계산부(440)는 1차 분류가 정확한지 다시 판단하는 역할을 수행한다. 따라서 제2패턴 유사도 계산부(440)는 분석 대상 이미지의 내부 특징점과 특징 정보들이 해당 후보군에 속하는 기준 특징 정보들이라면 유사도를 매우 높게 판단하고, 그렇지 않다면 낮게 판단한다.
도 5는 본 발명에 따른 이미지 코드 분별 방법의 일 실시예의 흐름을 도시한 흐름도이다.
도 5를 참조하면, 먼저 분석 대상 이미지를 입력받는다(S500). 분석 대상 이 미지의 외부 특징이 이미지 코드의 외부 특징과 유사한지 1차 판별한다(S505). 분석 대상 이미지의 외부 특징이 이미지 코드와 유사한 외부 특징이 있는 것으로 1차 판별되면(S510), 분석 대상 이미지의 내부 특징이 이미지 코드의 내부 특징과 유사한지 2차 판별한다(S515). 분석 대상 이미지와 이미지 코드의 내부 및 외부 특징의 비교는 도 4a 및 도 4b에서 사용한 방법과 동일한 방법을 사용한다.
분석 대상 이미지의 내부 특징이 이미지 코드의 내부 특징과 유사한 것으로 판별되면(S520), 해당하는 이미지 코드의 디코딩 방법을 이용하여 분석 대상 이미지를 디코딩한다(S525). 분석 대상 이미지가 자체에서 처리할 수 없는 종류의 이미지인 경우(즉 로고나 문자 등)에는 분석 대상 이미지를 외부 서버로 전송한 후 그 디코딩 결과를 수신한다(S530). 디코딩 결과를 기초로 해당하는 서비스를 제공한다(S535).
도 6은 본 발명에 따른 이미지 분별 방법의 일 실시예의 흐름을 도시한 흐름도이다.
도 6을 참조하면, 영상 입력 장치를 통해 소정의 인쇄매체에 인쇄된 이미지를 입력받는다(S600). 이미지 입력 당시의 주위 환경에 의한 색상 및 명암의 왜곡을 보정한 정규화 이미지를 생성한다(S605). 정규화 이미지를 흑과 백의 두 색으로 이루어진 이진화 이미지로 변환하고(S610), 이진화 이미지로부터 분석 대상 이미지를 추출한다(S615).
분석 대상 이미지의 외곽선의 모양 및 특징점들을 분석하여 특징 패턴을 추출하고(S620), 기준 이미지들의 특징 패턴(즉, 기준 패턴)과의 패턴 유사도를 계산 한다(S625). 패턴 유사도가 일정 임계치 이상이면 분석 대상 이미지가 소정 기준 이미지의 종류와 동일한 이미지 종류인 것으로 1차 판단하고(S630), 분석 대상 이미지의 내부 특징을 검출한다(S635). 분석 대상 이미지의 내부 특징과 1차 판단 결과에 의해 파악된 이미지 종류의 내부 특징이 유사한지 2차 판단한다(S640). 1차 및 2차 판단결과 이미지 종류가 자체에서 디코딩 가능한 이미지 종류이면(S650), 분석 대상 이미지의 이미지 종류에 해당하는 디코딩 방법을 선택하여 디코딩을 수행한다(S655). 1차 판단결과 및 2차 판단결과 파악되는 분석 대상 이미지의 종류가 자체에서 디코딩이 불가능한 이미지의 종류인 경우 외부 서버에 분석 대상 이미지를 전송하고 디코딩된 결과를 외부서버로부터 수신한다(S660). 디코딩 후 해당 서비스를 제공한다(S665).
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본 질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.
본 발명에 따르면, 입력된 이미지에 대한 영상 처리를 통해 입력된 이미지의 종류가 이미지 코드, 로고, 그림 등 어느 것에 해당하는지 분류할 수 있고, 각각의 종류에 맞는 디코딩을 수행할 수 있다. 따라서 이미지를 자체에서 처리할 수 있는지 여부를 빠르게 판단할 수 있으므로 불필요한 디코딩을 막을 수 있고, 기본적인 특징 정보를 미리 추출함으로써 단말기나 서버에서 디코딩시 영상 인식을 보다 빠르게 처리할 수 있다.
또한, 복잡한 이미지나 많은 연산이 필요한 이미지 인식시에도 단말기에서 디코딩할지, 아니면 서버에서 디코딩할지 미리 판단이 가능하므로 속도와 정확성이 향상된다. 또한 서버에서 디코딩할 경우, 종래에는 이미지가 단말기에서 디코딩될지 안 될지 판단하지 않고 전송하기 때문에 불필요한 시간 낭비가 발생하지만, 본 발명에 따르면 서버에서 디코딩이 가능한 이미지만 전송하므로 효과적인 정보처리가 가능하다.

Claims (13)

  1. 분석 대상 이미지를 입력받는 영상 입력부;
    상기 분석 대상 이미지의 외부 특징과 다양한 종류의 기준 이미지들의 외부 특징과의 유사도를 기초로 상기 분석 대상 이미지의 종류를 1차 판별하는 외부특징 파악부;
    상기 분석 대상 이미지의 내부 특징이 상기 1차 판별 결과의 이미지 종류의 내부 특징과 유사한지 2차 판별하는 내부특징 파악부; 및
    상기 1차 판별 및 2차 판별 결과를 기초로 파악된 상기 분석 대상 이미지의 종류가 자체에서 디코딩 가능한 종류인지 파악하는 이미지 판별부;를 포함하는 것을 특징으로 하는 이미지 분별 장치.
  2. 제 1항에 있어서,
    상기 이미지 판별부에 의해 판별된 이미지 종류가 자체에서 디코딩 가능한 이미지 종류에 해당하면, 상기 이미지 종류에 해당하는 디코딩 방법으로 상기 분석 대상 이미지를 디코딩하는 디코딩부; 및
    상기 이미지 판별부에 의해 판별된 이미지 종류가 자체에서 디코딩 불가능한 이미지 종류에 해당하면, 상기 분석 대상 이미지를 외부 서버로 전송하여 디코딩되도록 하는 특징정보 전송부;를 더 포함하는 것을 특징으로 하는 이미지 분별 장치.
  3. 제 2항에 있어서,
    상기 내부특징 파악부는 상기 분석 대상 이미지에 대한 골격화, 훅 처리, 평활화, 및 정규화를 수행하여 상기 분석 대상 이미지의 외곽선을 구성하는 특징점들의 정보를 포함하는 외부특징 정보를 생성하고,
    상기 외부특징 파악부는 상기 분석 대상 이미지의 내부 특징점들의 정보 및 색상 정보를 포함하는 내부특징 정보를 생성하고,
    상기 특징정보 전송부는 상기 외부특징 정보 및 내부특징 정보를 상기 외부 서버로 전송하는 것을 특징으로 하는 이미지 분별 장치.
  4. 제 1항에 있어서, 상기 영상 입력부는,
    영상 입력 장치를 통해 영상을 입력받을 때, 조명, 인쇄매체의 종류를 포함하는 영상 입력 환경에 따른 색상 및 명암의 변이를 보정하여 정규화 이미지를 생성하는 이미지 정규화부;
    소정 밝기를 임계값으로 설정하고, 상기 정규화 이미지에서 상기 임계값보다 밝은 픽셀은 흑색으로, 상기 임계값보다 어두운 픽셀은 백색으로 변경하여 이진화 이미지로 생성하는 이진화부; 및
    상기 흑색으로 구성된 영역을 추출하여 상기 분석 대상 이미지를 생성하는 이미지 추출부;를 포함하는 것을 특징으로 하는 이미지 분별 장치.
  5. 제 1항에 있어서, 상기 외부특징 파악부는,
    상기 분석 대상 이미지의 크기 및 방향을 정규화하고, 상기 분석 대상 이미지의 외곽선을 구성하는 특징점들을 연결하는 선분의 방향 정보로 구성되는 체인 코드를 구성한 후, 상기 체인 코드를 이루는 방향수의 차를 이용하여 패턴 형태수를 구하는 외부특징 추출부; 및
    상기 분석 대상 이미지의 패턴 형태수와 상기 기준 이미지들의 패턴 형태수의 유사도를 비교하여 상기 분석 대상 이미지의 종류를 1차 판별하는 제1패턴 유사도 계산부;를 포함하는 것을 특징으로 하는 이미지 분별 장치.
  6. 제 5항에 있어서,
    외부특징 추출부는 상기 분석 대상 이미지에 대해 골격화, 훅 처리, 평활화 중 적어도 하나를 수행하는 것을 특징으로 하는 이미지 분별 장치.
  7. 제 1항에 있어서, 상기 내부특징 파악부는,
    상기 분석 대상 이미지의 내부 모양에 대한 특징점 및 색상 정보를 추출하는 내부특징 추출부; 및
    상기 특징점들이 나타내는 내부 패턴이 상기 1차 판별 결과의 이미지 종류의 내부 패턴과 유사한지 2차 판별하는 제2패턴 유사도 계산부;를 포함하는 것을 특징으로 하는 이미지 분별 장치.
  8. 분석 대상 이미지를 입력받는 단계;
    상기 분석 대상 이미지의 외부 특징과 다양한 종류의 기준 이미지들의 외부 특징과의 유사도를 기초로 상기 분석 대상 이미지의 종류를 1차 판별하는 단계;
    상기 분석 대상 이미지의 내부 특징이 상기 1차 판별 결과의 이미지 종류의 내부 특징과 유사한지 2차 판별하는 단계; 및
    상기 1차 판별 및 2차 판별 결과를 기초로 파악된 상기 분석 대상 이미지의 종류가 자체에서 디코딩 가능한 종류인지 파악하는 단계;를 포함하는 것을 특징으로 하는 이미지 분별 방법.
  9. 제 8항에 있어서,
    상기 분석 대상 이미지의 종류가 자체에서 디코딩 가능한 이미지 종류에 해당하면, 상기 이미지 종류에 해당하는 디코딩 방법으로 상기 분석 대상 이미지를 디코딩하는 단계; 및
    상기 분석 대상 이미지의 종류가 자체에서 디코딩 불가능한 이미지 종류에 해당하면, 상기 분석 대상 이미지를 외부 서버로 전송하는 단계;를 더 포함하는 것을 특징으로 하는 이미지 분별 방법.
  10. 제 8항에 있어서,
    상기 1차 판별 단계는, 상기 분석 대상 이미지에 대한 골격화, 훅 처리, 평활화, 및 정규화를 수행하여 상기 분석 대상 이미지의 외곽선을 구성하는 특징점들의 정보를 포함하는 외부특징 정보를 생성하는 단계를 포함하고,
    상기 2차 판별단계는, 상기 분석 대상 이미지의 내부 특징점들의 정보 및 색상 정보를 포함하는 내부특징 정보를 생성하는 단계를 포함하고,
    상기 분석 대상 이미지의 외부 전송 단계는, 상기 분별 대상 종류가 자체에서 디코딩 불가능한 이미지 종류에 해당하면, 상기 외부특징 정보 및 내부특징 정보를 상기 외부 서버로 전송하는 단계;를 포함하는 것을 특징으로 하는 이미지 분별 장치.
  11. 제 8항에 있어서, 1차 판별 단계는,
    상기 분석 대상 이미지의 크기 및 방향을 정규화하고, 상기 분석 대상 이미지의 외곽선을 구성하는 특징점들을 연결하는 선분의 방향 정보로 구성되는 체인 코드를 구성한 후, 상기 체인 코드를 이루는 방향수의 차를 이용하여 패턴 형태수를 구하는 단계; 및
    상기 분석 대상 이미지의 패턴 형태수와 상기 기준 이미지들의 패턴 형태수의 유사도를 비교하여 상기 분석 대상 이미지의 종류를 1차 판별하는 단계;를 포함하는 것을 특징으로 하는 이미지 분별 방법.
  12. 제 8항에 있어서, 상기 2차 판별 단계는,
    상기 분석 대상 이미지의 내부 모양에 대한 특징점 및 색상 정보를 추출하는 단계; 및
    상기 특징점들이 나타내는 내부 패턴이 상기 1차 판별 결과의 이미지 종류의 내부 패턴과 유사한지 2차 판별하는 단계;를 포함하는 것을 특징으로 하는 이미지 분별 방법.
  13. 제 8항 내지 제 12항 중 어느 한 항에 기재된 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020060024755A 2005-11-05 2006-03-17 이미지 분별 장치 및 그 방법 KR100726473B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/KR2006/004517 WO2007052957A1 (en) 2005-11-05 2006-11-01 Device and method of classifying an image

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20050105746 2005-11-05
KR1020050105746 2005-11-05

Publications (2)

Publication Number Publication Date
KR20070048570A true KR20070048570A (ko) 2007-05-09
KR100726473B1 KR100726473B1 (ko) 2007-06-19

Family

ID=38272987

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060024755A KR100726473B1 (ko) 2005-11-05 2006-03-17 이미지 분별 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR100726473B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100855020B1 (ko) * 2007-06-18 2008-08-28 성균관대학교산학협력단 체인 코드 생성 장치 및 방법
CN108399349A (zh) * 2018-03-22 2018-08-14 腾讯科技(深圳)有限公司 图像识别方法及装置
KR102243554B1 (ko) * 2021-01-18 2021-04-22 위셀글로벌 주식회사 오픈 마켓 판매상품에 대한 가격 변동 자동 모니터링 시스템

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101907414B1 (ko) * 2011-12-13 2018-10-15 삼성전자주식회사 촬영 이미지 기반의 문자 인식 장치 및 방법
KR101995763B1 (ko) * 2017-08-25 2019-07-03 (주)뉴옵틱스 혈구 감별 장치 및 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08315144A (ja) * 1995-05-16 1996-11-29 Hitachi Ltd パターン分類装置及びそのパターン分類方法
JP2000270334A (ja) 1999-03-15 2000-09-29 Fuji Xerox Co Ltd 符号化装置、復号化装置、画像処理装置、符号化方法、復号化方法及び画像処理方法
JP3640573B2 (ja) * 1999-07-27 2005-04-20 日立コンピュータ機器株式会社 バーコード読取り方法及びバーコード読取りシステム
KR100414559B1 (ko) * 2000-08-26 2004-01-07 주식회사 제일컴테크 바코드 판독기
JP2004064700A (ja) 2002-07-31 2004-02-26 Sony Corp 画像分類装置、画像分類方法、プログラム、及び記録媒体、並びに画像分類システム
JP2005092436A (ja) 2003-09-16 2005-04-07 Casio Comput Co Ltd 符号情報読み出し装置、そのプログラム、及びそれを利用したペン型データ入力装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100855020B1 (ko) * 2007-06-18 2008-08-28 성균관대학교산학협력단 체인 코드 생성 장치 및 방법
US8340446B2 (en) 2007-06-18 2012-12-25 Sungkyunkwan University Foundation For Corporate Collaboration Apparatus and method for generating chain code
CN108399349A (zh) * 2018-03-22 2018-08-14 腾讯科技(深圳)有限公司 图像识别方法及装置
CN108399349B (zh) * 2018-03-22 2020-11-10 腾讯科技(深圳)有限公司 图像识别方法及装置
KR102243554B1 (ko) * 2021-01-18 2021-04-22 위셀글로벌 주식회사 오픈 마켓 판매상품에 대한 가격 변동 자동 모니터링 시스템

Also Published As

Publication number Publication date
KR100726473B1 (ko) 2007-06-19

Similar Documents

Publication Publication Date Title
US7110581B2 (en) Wavelet-enhanced automated fingerprint identification system
US8818099B2 (en) Document image binarization and segmentation using image phase congruency
CN108388822B (zh) 一种检测二维码图像的方法和装置
KR100339691B1 (ko) 코드인식을 위한 장치 및 그 방법
US8503797B2 (en) Automatic document classification using lexical and physical features
US7174044B2 (en) Method for character recognition based on gabor filters
EP1271403B1 (en) Method and device for character location in images from digital camera
US20150339526A1 (en) Systems and methods for classifying objects in digital images captured using mobile devices
US20050207614A1 (en) Iris-based biometric identification
US11341739B2 (en) Image processing device, image processing method, and program recording medium
KR100726473B1 (ko) 이미지 분별 장치 및 그 방법
US20040218790A1 (en) Print segmentation system and method
US20120020535A1 (en) Unique, repeatable, and compact biometric identifier
KR101601187B1 (ko) 손금 기반 사용자 인식 정보를 이용한 기기 컨트롤 장치 및 그 방법
CN110210467B (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
Wu et al. A printer forensics method using halftone dot arrangement model
KR102102403B1 (ko) 위조 영상 인쇄물 감식을 통한 코드인증방법과 그 응용 시스템
JP5630689B2 (ja) 文字認識方法及び文字認識装置
US8200016B2 (en) Method and apparatus for character string recognition
CN116469090A (zh) 喷码图案的检测方法、装置、电子设备和存储介质
CN115527212A (zh) 一种基于特征训练的字符识别处理系统
WO2007052957A1 (en) Device and method of classifying an image
CN112784830A (zh) 一种字符识别方法及装置
CN115995080B (zh) 基于ocr识别的档案智能管理系统
Visilter et al. Development of OCR system for portable passport and visa reader

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130613

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140612

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150914

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee