KR101573051B1 - 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치 - Google Patents

밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치 Download PDF

Info

Publication number
KR101573051B1
KR101573051B1 KR1020090007015A KR20090007015A KR101573051B1 KR 101573051 B1 KR101573051 B1 KR 101573051B1 KR 1020090007015 A KR1020090007015 A KR 1020090007015A KR 20090007015 A KR20090007015 A KR 20090007015A KR 101573051 B1 KR101573051 B1 KR 101573051B1
Authority
KR
South Korea
Prior art keywords
brightness
contrast
character recognition
parameter sets
character
Prior art date
Application number
KR1020090007015A
Other languages
English (en)
Other versions
KR20100087939A (ko
Inventor
박진만
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to KR1020090007015A priority Critical patent/KR101573051B1/ko
Publication of KR20100087939A publication Critical patent/KR20100087939A/ko
Application granted granted Critical
Publication of KR101573051B1 publication Critical patent/KR101573051B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 기술을 제시한다. 이 기술은 카메라에 의해 촬영된 컬러 이미지를 그레이(Gray) 컬러 이미지로 변환하여 생성된 소스 이미지에 대해 밝기 및 명암 파라미터 셋들을 선정하여, 각 밝기 및 명암 파라미터 셋별로 문자 인식을 수행하도록 처리함으로써 문자 인식 성능을 향상시킬 수 있다.
카메라. 영상, 밝기, 명암, 문자 인식

Description

밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치{Evolved character detection apparatus used Brightness/Contrast parameter set}
본 발명은 문자 인식 기술에 관련한 기술로, 특히 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 기술에 관한 것이다.
최근 카메라폰 등 카메라가 장착된 휴대용 장치들이 널리 사용되고 있다. 이러한 휴대용 장치에 탑재된 카메라를 이용해 실시간 또는 비실시간 촬영되는 정지영상이나 동영상으로부터 문자를 인식할 수 있다면 통역이나 번역 등에 유용하게 활용될 수 있을 것이다.
그런데, 흰 종이위에 표시된 검은색 문자를 인식하는 기존의 OCR(Optical Character Reader) 기술과는 달리, 일상에서 카메라에 의해 촬영되는 정지영상이나 동영상의 경우 촬영한 장소나 시간, 날씨, 대상 등의 촬영 환경에 따라 밝기(Brightness)와 명암(Contrast)의 편차가 다양하다.
따라서, 카메라에 의해 촬영되는 정지영상이나 동영상으로부터 문자를 인식하기 위해서는 다양한 범위의 밝기(Brightness)와 명암(Contrast)을 가지는 영상을 변환하여 일정한 수준으로 조정해야만 한다.
이러한 필요성에 따라 본 발명자는 카메라에 의해 촬영되는 정지영상이나 동영상으로부터 문자를 빠르고 정확하게 인식할 수 있는 기술에 대한 연구를 하게 되었다.
카메라에 의해 촬영되는 정지영상이나 동영상으로부터 문자를 빠르고 정확하게 인식할 수 있는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 기술을 제공한다.
나아가, 병렬처리 가능한 스레드(Thread)의 개수에 따라 밝기 및 명암 파라미터 셋들을 동적으로 선정하고, 선정된 밝기 및 명암 파라미터 셋들을 이용해 문자 인식을 병렬 처리함으로써 문자 인식 속도를 향상시킬 수 있는 문자 인식 기술을 제공한다.
문자 영역 검출 결과에 따라 평가를 수행하고, 평가치를 피드백함으로써 밝기 및 명암 파라미터 셋 선정을 최적화하여 문자 인식률을 향상시킬 수 있는 문자 인식 기술을 제공한다.
본 발명의 일 양상에 따르면, 카메라에 의해 촬영된 컬러 이미지를 그레이(Gray) 컬러 이미지로 변환하여 생성된 소스 이미지에 대해 밝기 및 명암 파라미터 셋들을 선정하여, 각 밝기 및 명암 파라미터 셋별로 문자 인식을 수행하도록 처리한다.
부가적인 양상에 따르면, 병렬처리 가능한 스레드(Thread)의 개수에 따라 밝기 및 명암 파라미터 셋들을 동적으로 선정하고, 선정된 밝기 및 명암 파라미터 셋들을 이용해 문자 인식을 병렬 처리한다.
부가적인 양상에 따르면, 각 레벨의 서브 밝기 및 명암 파라미터 셋들을 적용하여 소스 이미지로부터 문자 영역을 검출하되, 검출된 문자 박스의 빈도수에 따라 각 레벨별로 평가를 수행하고, 각 레벨별 평가치를 갱신한다.
밝기 및 명암 파라미터 셋을 선정하고, 선정된 밝기 및 명암 파라미터 셋들을 이용해 카메라에 의해 촬영되는 정지영상이나 동영상으로부터 문자를 검출하여 최적의 밝기 및 명암 파라미터 셋들을 결정함으로써 문자 인식 성능을 향상시킬 수 있다.
병렬처리 가능한 스레드(Thread)의 개수에 따라 밝기 및 명암 파라미터 셋들을 동적으로 선정하고, 선정된 밝기 및 명암 파라미터 셋들을 이용해 문자 인식을 병렬 처리함으로써 문자 인식 속도를 향상시킬 수 있다.
문자 영역 검출 결과에 따라 평가를 수행하고, 평가치를 피드백함으로써 밝기 및 명암 파라미터 셋 선정을 최적화하여 문자 인식률을 향상시킬 수 있다.
이하, 첨부된 도면을 참조하여 기술되는 바람직한 실시예를 통하여 본 발명을 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 기술하기로 한다.
본 발명 실시예들을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명 실시예들의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
본 발명 실시예들을 설명하기에 앞서, 명세서 전반에 걸쳐 사용되는 용어들 을 정의한다. 이 용어들은 본 발명 실시예에서의 기능을 고려하여 정의된 용어들로서, 사용자 또는 운용자의 의도, 관례 등에 따라 충분히 변형될 수 있는 사항이므로, 이 용어들의 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
도 1 은 본 발명에 따른 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치의 일 실시예에 따른 블럭도이다. 도면에 도시한 바와 같이, 이 실시예에 따른 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치(100)는 이미지 처리부(110)와, 파라미터 셋 선정부(120)와, 문자 인식 수행부(130)를 포함한다.
상기 이미지 처리부(110)는 카메라에 의해 촬영된 컬러 이미지를 그레이(Gray) 컬러 이미지로 변환하여 소스 이미지를 생성한다. 카메라에 의해 촬영되는 정지영상 또는 동영상은 촬영한 장소나 시간, 날씨, 대상 등의 촬영 환경에 따라 밝기(Brightness)와 명암(Contrast)의 편차가 다양하므로, 문자 인식 성능을 향상시키기 위해서는 다양한 범위의 밝기(Brightness)와 명암(Contrast)을 가지는 영상을 변환하여 일정한 수준으로 조정해야 한다.
이 실시예에 따른 문자 인식 장치(100)는 상기 이미지 처리부(110)를 통해 카메라에 의해 촬영된 컬러 이미지를 그레이(Gray) 컬러 이미지로 변환함으로써 다양한 범위의 밝기(Brightness)와 명암(Contrast)을 가지는 영상을 일정한 수준으로 조정한다.
이 때, 상기 이미지 처리부(110)가 상기 그레이(Gray) 컬러 이미지를 특정 크기로 축소하여 소스 이미지를 생성하도록 구현할 수 있다. 이미지 크기를 축소시키는 이유는 이미지 크기가 크면 클 수록 연산 속도가 느려지기 때문에 문자 인식 대상이 되는 이미지를 적정한 크기로 축소하여 연산 속도를 향상시키기 위함이다.
한편, 상기 이미지 처리부(110)가 상기 그레이(Gray) 컬러 이미지의 외곽을 특정 크기만큼 절단(Crop)하여 소스 이미지를 생성하도록 구현할 수도 있다. 이미지의 외곽을 특정 크기만큼 절단(Crop)하는 이유는 문자 인식을 위해 촬영되는 이미지의 중앙 부위에 인식하기 원하는 문자가 위치할 경우가 대부분일 것이므로, 이미지의 중요부분만 포커싱(Focusing)하고, 중요하지 않은 부분은 제외시켜 연산 속도를 향상시키기 위함이다.
한편, 상기 이미지 처리부(110)가 상기 그레이(Gray) 컬러 이미지의 그레이 컬러를 반전시켜 소스 이미지를 생성하도록 구현할 수도 있다. 이미지를 반전시키는 이유는 예를들어 배경이 검은색이고 인식할 문자가 흰색일 경우 등 필요에 따라 이미지를 반전시킬 경우가 존재하기 때문이다.
상기 이미지 축소 또는 이미지 외곽 절단 또는 이미지 반전은 사용자의 수동 조작에 대응하여 상기 이미지 처리부(110)가 처리하도록 구현할 수도 있고, 사용자의 수동조작 없이 상기 이미지 처리부(110)가 자동으로 처리하도록 구현할 수도 있다.
부가적인 양상에 따르면, 상기 이미지 처리부(110)가 상기 생성된 소스 이미지의 각 픽셀의 휘도(Luminance)를 인접 픽셀의 휘도와 비교하여 휘도 보정하는 것을 더 포함할 수도 있다. 이 휘도 보정을 통해 소스 이미지에 포함된 문자를 강조 하여 문자 인식시 문자 인식률을 향상시킬 수 있다.
예컨대, 상기 이미지 처리부(110)가 그레이 모폴로지 필터(Gray Morphology Filter)를 이용해 문자에 대한 배경을 확장시키고 문자의 크기를 축소시켜 문자와 배경 사이의 잡음을 제거하는 침식(Erosion) 연산과, 문자의 크기는 확장시키고 배경을 축소시켜 문자내의 빈공간을 메우거나 끊어진 영역을 연결시키는 팽창(Dilation) 연산을 수행하여 휘도를 보정함으로써 소스 이미지로부터 문자를 강조시킬 수 있다.
상기 파라미터 셋 선정부(120)는 밝기(Brightness) 및 명암(Contrast) 파라미터 셋(Parameter Set)들을 선정한다. 이 상기 파라미터 셋 선정부(120)는 밝기 및 명암 파라미터 셋들을 샘플링(Sampling)하고, 샘플링되는 밝기 및 명암 파라미터 셋들로부터 촬영환경에 적응적인 최적의 밝기 및 명암 파라미터 셋들을 결정하기 위해서 적정한 밝기 및 명암 파라미터 셋들을 선정하기 위한 구성 요소이다.
만약, 샘플링되는 밝기 및 명암 파라미터 셋이 증가할 경우 문자의 인식률은 증가하나, 증가된 밝기 및 명암 파라미터 셋의 수에 따른 이미지 처리에 소요되는 연산 역시 증가되므로 인식 속도가 느려지게 되고, 불필요한 문자의 인식 가능성도 증가하게 된다.
반면에, 샘플링되는 밝기 및 명암 파라미터 셋이 너무 적을 경우 이미지 처리에 소요되는 연산이 적어져 인식 속도는 빨라지나, 문자의 인식 가능성은 작아지게 된다. 따라서, 빠르고 정확하게 문자를 인식하기 위해서는 밝기 및 명암 파라미터 셋들을 적정한 수준에서 선정해야 한다.
예컨대, 상기 파라미터 셋 선정부(120)가 밝기 구간 및 명암 구간에서 각각 특정의 간격을 가지고 선택된 밝기 파라미터와 명암 파라미터들을 서로 매칭시켜 형성한 밝기 및 명암 파라미터 셋들을 엔트리(Entry)로 하는 참조 파라미터 테이블로부터 다수의 임시 파라미터 테이블들을 생성하고, 생성된 임시 파라미터 테이블 중 어느 하나의 임시 파라미터 테이블로부터 밝기 및 명암 파라미터 셋들을 선정하도록 구현할 수 있다.
도 2 는 참조 파라미터 테이블의 일 예를 도시한 도면으로, 밝기 및 명암 0에서 100 사이 구간에서 각각 100*1/K 및 100*1/K' 간격을 가지고 선택된 밝기 파라미터와 명암 파라미터들을 서로 매칭시켜 형성한 밝기 및 명암 파라미터 셋들 (0,0)에서 (100,100)까지를 엔트리(Entry)로 함을 볼 수 있다.
한편, 상기 파라미터 셋 선정부(120)가 임시 파라미터 테이블 생성시, 참조 파라미터 테이블에 포함되는 밝기 및 명암 파라미터 셋들 중 밝기 파라미터와 명암 파라미터 각각이 특정의 간격을 가지는 밝기 및 명암 파라미터 셋들을 엔트리로 하여 임시 파라미터 테이블을 생성하도록 구현할 수 있다.
도 3 내지 도 5 는 각각 임시 파라미터 테이블들을 예시한 도면이다. 도면에서 검은색 사각형으로 칠해진 부분이 임시 파라미터 테이블 엔트리이다. 도 3 은 도 2 에 도시한 참조 파라미터 테이블의 엔트리들인 밝기 및 명암 파라미터 셋들 중 밝기 파라미터와 명암 파라미터 각각이 0부터 시작해서 100*2/K 및 100*2/K' 간격을 가지는 밝기 및 명암 파라미터 셋들을 엔트리로 하는 임시 파라미터 테이블을 도시한 것이다.
도 4 은 도 2 에 도시한 참조 파라미터 테이블의 엔트리들인 밝기 및 명암 파라미터 셋들 중 밝기 파라미터는 100*1/K, 명암 파라미터는 0부터 시작해서 밝기 파라미터와 명암 파라미터 각각이 100*2/K 및 100*2/K' 간격을 가지는 밝기 및 명암 파라미터 셋들을 엔트리로 하는 임시 파라미터 테이블을 도시한 것이다.
도 5 는 도 2 에 도시한 참조 파라미터 테이블의 엔트리들인 밝기 및 명암 파라미터 셋들 중 밝기 파라미터는 0, 명암 파라미터는 100*1/K'부터 시작해서 밝기 파라미터와 명암 파라미터 각각이 100*2/K 및 100*2/K' 간격을 가지는 밝기 및 명암 파라미터 셋들을 엔트리로 하는 임시 파라미터 테이블을 도시한 것이다.
한편, 상기 파라미터 셋 선정부(120)가 임시 파라미터 테이블로부터 밝기 및 명암 파라미터 셋들을 선정시, 해당 임시 파라미터 테이블에 포함되는 모든 밝기 및 명암 파라미터 셋들을 성기게(Sparse) 커버할 수 있도록 레벨화된 서브 밝기 및 명암 파라미터 셋들을 선정하도록 구현할 수 있다.
도 6 은 레벨화된 서브 밝기 및 명암 파라미터 셋들의 일 예를 도시한 도면이다. 총 11개의 엔트리를 가지는 임시 파라미터 테이블에 포함되는 밝기 및 명암 파라미터 셋들 중 레벨1 서브 밝기 및 명암 파라미터 셋은 첫번째, 여섯번째, 열한번째 밝기 및 명암 파라미터 셋을 엔트리로 가지고 있음을 볼 수 있다.
레벨2 서브 밝기 및 명암 파라미터 셋은 네번째, 아홉번째 밝기 및 명암 파라미터 셋을 엔트리로, 레벨3 서브 밝기 및 명암 파라미터 셋은 세번째, 여덟번째 밝기 및 명암 파라미터 셋을 엔트리로, 레벨4 서브 밝기 및 명암 파라미터 셋은 다섯번째, 열번째 밝기 및 명암 파라미터 셋을 엔트리로, 레벨5 서브 밝기 및 명암 파라미터 셋은 두번째, 일곱번째 밝기 및 명암 파라미터 셋을 엔트리로 가지고 있음을 볼 수 있다.
즉, 각 레벨의 서브 밝기 및 명암 파라미터 셋은 임시 파라미터 테이블에 포함되는 전체 엔트리들이 중복되지 않게 포함하고 있어 즉, 임시 파라미터 테이블에 포함되는 모든 밝기 및 명암 파라미터 셋들을 성기게(Sparse) 커버할 수 있게 된다.
상기 문자 인식 수행부(130)는 상기 이미지 처리부에 의해 생성된 소스 이미지에 대해 상기 파라미터 셋 선정부에 의해 선정된 밝기 및 명암 파라미터 셋들을 적용하여, 각 밝기 및 명암 파라미터 셋별로 문자 인식을 수행한다.
이 때, 상기 문자 인식 수행부(130)가 선정된 밝기 및 명암 파라미터 셋들을 적용하여 소스 이미지로부터 문자 영역을 검출하고, 검출된 문자 영역에 대한 문자 인식을 수행한다.
상기 문자 영역은 선정된 밝기 및 명암 파라미터 셋에 포함된 밝기와 명암 값으로 세팅한 상태에서 하나의 문자가 포함되는 영역인 문자 박스수와, 각 문자 박스들이 연속해서 배열되는 라인수를 검출함에 의해 검출될 수 있다.
상기 밝기 및 명암 파라미터 셋을 변경시키면서 하나의 문자가 포함되는 영역인 문자 박스수와, 각 문자 박스들의 시리얼한 배열에 의해 형성되는 라인수를 검출하면, 최적으로 문자 영역이 검출되는 밝기 및 명암 파라미터 셋을 얻을 수 있다.
연속된 영상내의 문자들은 거의 비슷한 밝기 및 명암을 가진 촬영 조건하에 촬영되었을 가능성이 매우 크므로, 최적으로 문자 영역이 검출되는 밝기 및 명암 파라미터 셋을 얻어 연속된 영상들의 문자 인식에 사용할 경우 비슷한 인식률을 보이게 된다.
따라서, 이 실시예에 따른 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치는 밝기 및 명암 파라미터 셋을 선정하고, 선정된 밝기 및 명암 파라미터 셋들을 이용해 카메라에 의해 촬영되는 정지영상이나 동영상으로부터 문자를 검출하여 최적의 밝기 및 명암 파라미터 셋들을 결정함으로써 문자 인식 성능을 향상시킬 수 있게 된다.
한편, 부가적인 양상에 따르면, 상기 파라미터 셋 선정부(120)가 병렬처리 가능한 스레드(Thread)의 개수에 따라 밝기 및 명암 파라미터 셋들을 동적으로 선정하도록 구현할 수 있다.
이 때, 상기 문자 인식 수행부(130)를 병렬처리 가능한 스레드의 개수에 따라 동적 선정된 밝기 및 명암 파라미터 셋 각각에 대한 문자 인식을 다수의 코어(Core)에 분산하여 병렬 처리하도록 구현할 경우, 문자 인식에 소요되는 연산 처리를 다수의 코어에 분산하여 수행할 수 있으므로, 문자 인식 속도를 향상시킬 수 있다.
한편, 부가적인 양상에 따르면, 상기 문자 인식 수행부(130)가 각 레벨의 서브 밝기 및 명암 파라미터 셋들을 적용하여 소스 이미지로부터 문자 영역을 검출하 되, 검출된 문자 박스의 빈도수에 따라 각 레벨별로 평가를 수행하고, 각 레벨별 평가치를 갱신하도록 구현할 수도 있다.
이 때, 상기 문자 인식 수행부(130)가 평가치가 우수한 레벨의 서브 밝기 및 명암 파라미터 셋들을 이용해 문자 인식을 수행하도록 구현한다면, 유사한 촬영환경에서 촬영된 연속된 영상에 대해 빠르고 정확하게 문자 인식이 가능하다.
즉, 이 실시예는 각 레벨의 서브 밝기 및 명암 파라미터 셋들을 적용한 문자 영역 검출 결과에 따라 평가를 수행하고, 평가치를 피드백하여 연속된 영상에 대한 문자 인식시 평가치가 우수한 레벨의 서브 밝기 및 명암 파라미터 셋들을 적용하여 문자 인식을 수행할 경우 문자 인식률을 향상시킬 수 있으므로, 밝기 및 명암 파라미터 셋 선정을 최적화하여 문자 인식 성능을 향상할 수 있도록 한 실시예이다.
한편, 부가적인 양상에 따르면, 상기 문자 인식 수행부(130)가 특정 시간 동안 문자 박스 빈도수가 임계치 이하로 검출된 경우, 해당 레벨의 문자 인식 절차를 중단하도록 구현할 수도 있다.
즉, 이 실시예는 각 레벨의 서브 밝기 및 명암 파라미터 셋들을 적용하여 소스 이미지로부터 문자 영역을 검출시, 타이머를 구동하여 특정 시간 동안 문자 박스 빈도수를 검출 즉, 각 레벨의 서브 밝기 및 명암 파라미터 셋내의 모든 엔트리에 대해 문자 인식을 수행하지 않고, 일부 엔트리에 대해서만 문자 박스 빈도수를 검출하도록 한 실시예이다.
만약, 검출된 박스 빈도수가 임계치 이하일 경우 해당 레벨의 문자 인식 절 차를 중단함으로써 문자 인식 가능성이 없는 레벨의 서브 밝기 및 명암 파라미터 셋들에 대한 문자 인식 처리를 조기에 중단하도록 하여 문자 인식 속도를 향상시킬 수 있게 된다.
한편, 부가적인 양상에 따르면, 상기 문자 인식 수행부(130)가 평가치가 우수한 레벨들의 평가치가 이전 평가치에 비해 편차가 심할 경우, 촬영 환경이 변화되었다 판단하도록 구현할 수도 있다.
즉, 촬영 환경이 비슷한 연속된 영상의 경우, 동일 레벨의 서브 밝기 및 명암 파라미터 셋들에 대한 문자 인식에 대한 현재 평가치와 이전 평가치는 거의 비슷하다. 그러나, 촬영 환경이 변화되었다면, 동일 레벨의 서브 밝기 및 명암 파라미터 셋들에 대한 문자 인식에 대한 현재 평가치와 이전 평가치는 편차가 심하다.
이 실시예는 이러한 점에 착안하여 평가치가 우수한 레벨들의 평가치가 이전 평가치에 비해 편차가 심할 경우, 촬영 환경이 변화되었다 판단하고, 새로운 밝기 및 명암 파라미터 셋을 선정하여 변환된 촬영환경에 최적화된 밝기 및 명암 파라미터 셋을 얻어 이후 문자 인식에 반영하도록 한 실시예이다.
이렇게 함으로써 촬영환경이 변화되더라도 빠르게 밝기 및 명암 파라미터 셋을 재선정하고, 재선정된 밝기 및 명암 파라미터 셋들을 이용해 카메라에 의해 촬영되는 정지영상이나 동영상으로부터 문자를 검출하여 최적의 밝기 및 명암 파라미터 셋들을 결정함으로써 문자 인식 성능을 향상시킬 수 있게 된다.
도 7 을 참조하여 상기한 구성을 갖는 본 발명에 따른 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치의 문자 인식 동작을 간략하게 알아본다. 도 7 은 본 발명에 따른 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치의 문자 인식 동작의 일 실시예에 따른 흐름도이다.
휴대폰 등의 휴대용 장치에 탑재된 카메라에 의해 정지영상 또는 동영상이 촬영되면, 문자 인식 장치(100)가 이미지 처리단계(S110)에서 카메라에 의해 촬영된 컬러 이미지를 그레이(Gray) 컬러 이미지로 변환하여 소스 이미지를 생성한다.
상기 이미지 처리단계(S110)에 의해 소스 이미지를 생성되면, 문자 인식 장치(100)가 파라미터 셋 선정단계(S120)에서 밝기(Brightness) 및 명암(Contrast) 파라미터 셋(Parameter Set)들을 선정한다.
상기 파라미터 셋 선정단계(S120)에 의해 밝기 및 명암 파라미터 셋들이 선정되면, 문자 인식 장치(100)가 문자 인식 수행단계(S130)에서 선정된 밝기 및 명암 파라미터 셋들을 적용하여, 각 밝기 및 명암 파라미터 셋별로 문자 인식을 수행한다.
이렇게 함에 의해, 밝기 및 명암 파라미터 셋을 선정하고, 선정된 밝기 및 명암 파라미터 셋들을 이용해 카메라에 의해 촬영되는 정지영상이나 동영상으로부터 문자를 검출하여 최적의 밝기 및 명암 파라미터 셋들을 결정함으로써 문자 인식 성능을 향상시킬 수 있게 된다.
이 때, 상기 파라미터 셋 선정단계(S120)에서 병렬처리 가능한 스레드(Thread)의 개수에 따라 밝기 및 명암 파라미터 셋들을 동적으로 선정하고, 상기 문자 인식 수행단계(S130)에서 선정된 밝기 및 명암 파라미터 셋들을 이용해 문자 인식을 병렬 처리할 경우, 문자 인식에 소요되는 연산 처리를 분산할 수 있어 문자 인식 속도를 향상시킬 수 있게 된다.
또한, 상기 문자 인식 수행단계(S130)에서 선정된 밝기 및 명암 파라미터 셋들에 대한 문자 영역 검출 결과에 따라 평가를 수행하고, 평가치를 피드백하여 밝기 및 명암 파라미터 셋 선정을 최적화할 경우 문자 인식률을 더욱 향상시킬 수 있게 되므로, 상기에서 제시한 본 발명의 목적을 달성할 수 있게 된다.
본 발명은 첨부된 도면에 의해 참조되는 바람직한 실시예를 중심으로 기술되었지만, 이러한 기재로부터 후술하는 특허청구범위에 의해 포괄되는 범위 내에서 본 발명의 범주를 벗어남이 없이 다양한 변형이 가능하다는 것은 명백하다.
도 1 은 본 발명에 따른 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치의 일 실시예에 따른 블럭도
도 2 는 참조 파라미터 테이블의 일 예를 도시한 도면
도 3 내지 도 5 는 각각 임시 파라미터 테이블들을 예시한 도면
도 6 은 레벨화된 서브 밝기 및 명암 파라미터 셋들의 일 예를 도시한 도면
도 7 은 본 발명에 따른 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치의 문자 인식 동작의 일 실시에에 따른 흐름도
<도면의 주요 부분에 대한 부호의 설명>
100 : 문자 인식 장치 110 : 이미지 처리부
120 : 파라미터 셋 선정부 130 : 문자 인식 수행부

Claims (16)

  1. 카메라에 의해 촬영된 컬러 이미지를 그레이(Gray) 컬러 이미지로 변환하여 소스 이미지를 생성하는 이미지 처리부와;
    밝기(Brightness) 및 명암(Contrast) 파라미터 셋(Parameter Set)들을 선정하는 파라미터 셋 선정부와;
    상기 이미지 처리부에 의해 생성된 소스 이미지에 대해 상기 파라미터 셋 선정부에 의해 선정된 밝기 및 명암 파라미터 셋들을 적용하여, 각 밝기 및 명암 파라미터 셋별로 문자 인식을 수행하는 문자 인식 수행부를;
    포함하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  2. 제 1 항에 있어서,
    상기 파라미터 셋 선정부가:
    밝기 구간 및 명암 구간에서 각각 특정의 간격을 가지고 선택된 밝기 파라미터와 명암 파라미터들을 서로 매칭시켜 형성한 밝기 및 명암 파라미터 셋들을 엔트리(Entry)로하는 참조 파라미터 테이블로부터 다수의 임시 파라미터 테이블들을 생성하고, 생성된 임시 파라미터 테이블 중 어느 하나의 임시 파라미터 테이블로부터 밝기 및 명암 파라미터 셋들을 선정하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  3. 제 2 항에 있어서,
    상기 파라미터 셋 선정부가:
    임시 파라미터 테이블 생성시, 참조 파라미터 테이블에 포함되는 밝기 및 명암 파라미터 셋들 중 밝기 파라미터와 명암 파라미터 각각이 특정의 간격을 가지는 밝기 및 명암 파라미터 셋들을 엔트리로 하여 임시 파라미터 테이블을 생성하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  4. 제 3 항에 있어서,
    상기 파라미터 셋 선정부가:
    임시 파라미터 테이블로부터 밝기 및 명암 파라미터 셋들을 선정시, 해당 임시 파라미터 테이블에 포함되는 모든 밝기 및 명암 파라미터 셋들을 성기게(Sparse) 커버할 수 있도록 레벨화된 서브 밝기 및 명암 파라미터 셋들을 선정하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  5. 제 1 항 내지 제 4 항 중의 어느 한 항에 있어서,
    상기 파라미터 셋 선정부가:
    병렬처리 가능한 스레드(Thread)의 개수에 따라 밝기 및 명암 파라미터 셋들을 동적으로 선정하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  6. 제 5 항에 있어서,
    상기 문자 인식 수행부가:
    병렬처리 가능한 스레드의 개수에 따라 동적 선정된 밝기 및 명암 파라미터 셋 각각에 대한 문자 인식을 다수의 코어에 분산하여 병렬 처리하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  7. 제 1 항에 있어서,
    상기 이미지 처리부가:
    상기 생성된 소스 이미지의 각 픽셀의 휘도(Luminance)를 인접 픽셀의 휘도와 비교하여 휘도 보정하는 것을 더 포함하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  8. 제 7 항에 있어서,
    상기 이미지 처리부가:
    문자에 대한 배경을 확장시키고 문자의 크기를 축소시켜 문자와 배경 사이의 잡음을 제거하는 침식(Erosion) 연산과, 문자의 크기는 확장시키고 배경을 축소시켜 문자내의 빈공간을 메우거나 끊어진 영역을 연결시키는 팽창(Dilation) 연산을 수행하여 휘도를 보정하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  9. 제 1 항에 있어서,
    상기 이미지 처리부가:
    상기 그레이(Gray) 컬러 이미지를 특정 크기로 축소하여 소스 이미지를 생성하는 것을 더 포함하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  10. 제 1 항에 있어서,
    상기 이미지 처리부가:
    상기 그레이(Gray) 컬러 이미지의 외곽을 특정 크기만큼 절단하여 소스 이미지를 생성하는 것을 더 포함하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  11. 제 1 항에 있어서,
    상기 이미지 처리부가:
    상기 그레이(Gray) 컬러 이미지의 그레이 컬러를 반전시켜 소스 이미지를 생성하는 것을 더 포함하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  12. 제 1 항에 있어서,
    상기 문자 인식 수행부가:
    선정된 밝기 및 명암 파라미터 셋들을 적용하여 소스 이미지로부터 문자 영 역을 검출하고, 검출된 문자 영역에 대한 문자 인식을 수행하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  13. 제 4 항에 있어서,
    상기 문자 인식 수행부가:
    각 레벨의 서브 밝기 및 명암 파라미터 셋들을 적용하여 소스 이미지로부터 문자 영역을 검출하되, 검출된 문자 박스의 빈도수에 따라 각 레벨별로 평가를 수행하고, 각 레벨별 평가치를 갱신하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  14. 제 13 항에 있어서,
    상기 문자 인식 수행부가:
    특정 시간 동안 문자 박스 빈도수가 임계치 이하로 검출된 경우, 해당 레벨의 문자 인식 절차를 중단하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  15. 제 13 항에 있어서,
    상기 문자 인식 수행부가:
    평가치가 임계치 이상인 레벨의 서브 밝기 및 명암 파라미터 셋들을 이용해 문자 인식을 수행하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
  16. 제 15 항에 있어서,
    상기 문자 인식 수행부가:
    평가치가 임계치 이상인 레벨들의 평가치가 이전 평가치에 비해 편차가 심할 경우, 촬영 환경이 변화되었다 판단하는 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치.
KR1020090007015A 2009-01-29 2009-01-29 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치 KR101573051B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090007015A KR101573051B1 (ko) 2009-01-29 2009-01-29 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090007015A KR101573051B1 (ko) 2009-01-29 2009-01-29 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치

Publications (2)

Publication Number Publication Date
KR20100087939A KR20100087939A (ko) 2010-08-06
KR101573051B1 true KR101573051B1 (ko) 2015-12-01

Family

ID=42754284

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090007015A KR101573051B1 (ko) 2009-01-29 2009-01-29 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치

Country Status (1)

Country Link
KR (1) KR101573051B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11176387B2 (en) 2017-03-30 2021-11-16 Samsung Electronics Co., Ltd Device and method for recognizing object included in input image

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101149355B1 (ko) * 2010-09-07 2012-05-29 서울대학교산학협력단 영상 변환 장치 및 영상 변환 방법
WO2024085460A1 (ko) * 2022-10-19 2024-04-25 삼성전자주식회사 이미지 내에 포함된 글자들을 식별하기 위한 전자 장치 및 그 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001189863A (ja) * 1999-12-28 2001-07-10 Canon Inc 画像処理方法および画像処理装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001189863A (ja) * 1999-12-28 2001-07-10 Canon Inc 画像処理方法および画像処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11176387B2 (en) 2017-03-30 2021-11-16 Samsung Electronics Co., Ltd Device and method for recognizing object included in input image

Also Published As

Publication number Publication date
KR20100087939A (ko) 2010-08-06

Similar Documents

Publication Publication Date Title
CN108391035B (zh) 一种拍摄方法、装置与设备
US10313605B2 (en) Image processing apparatus and control method thereof for generating high dynamic range image data
WO2022179335A1 (zh) 视频处理方法、装置、电子设备以及存储介质
US9818332B2 (en) Image display method and electronic device
CN110839129A (zh) 图像处理方法、装置以及移动终端
CN110766621B (zh) 图像处理方法、装置、存储介质及电子设备
US9002061B2 (en) Image processing device, image processing method and computer-readable medium
US20180061029A1 (en) Image processing apparatus, imaging apparatus, image processing method, and storage medium storing image processing program of image processing apparatus
CN112950499B (zh) 图像处理方法、装置、电子设备及存储介质
KR20100010712A (ko) 연기검출을 이용한 화재감지 시스템
JP2009118051A (ja) 信号処理装置及び信号処理プログラム
JP4595569B2 (ja) 撮像装置
CN112001853A (zh) 图像处理设备、图像处理方法、摄像设备和存储介质
JP2016126750A (ja) 画像処理システム、画像処理装置、撮像装置、画像処理方法、プログラムおよび記録媒体
KR101573051B1 (ko) 밝기 및 명암 파라미터 셋을 이용한 향상된 문자 인식 장치
KR20100028315A (ko) 카메라 모듈을 구비한 이동통신 단말기에서의 촬영방법 및 촬영장치
US9013605B2 (en) Apparatus and method for processing intensity of image in digital camera
KR20070085795A (ko) 화상 보정 장치 및 화상 보정 방법
US10896344B2 (en) Information processing apparatus, information processing method, and computer program
JP5441669B2 (ja) 画像処理装置及びその制御方法
EP1551170A2 (en) Image processing apparatus and method
US9104937B2 (en) Apparatus and method for recognizing image with increased image recognition rate
EP1903794A2 (en) Method and apparatus for displaying moving images using contrast tones in mobile communication terminal
US8564698B2 (en) Correcting image generated by an image generating apparatus
WO2017180353A1 (en) Adaptive output correction for digital image capture processing

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee