KR20130086493A - 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법 - Google Patents

카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법 Download PDF

Info

Publication number
KR20130086493A
KR20130086493A KR1020120007388A KR20120007388A KR20130086493A KR 20130086493 A KR20130086493 A KR 20130086493A KR 1020120007388 A KR1020120007388 A KR 1020120007388A KR 20120007388 A KR20120007388 A KR 20120007388A KR 20130086493 A KR20130086493 A KR 20130086493A
Authority
KR
South Korea
Prior art keywords
character
character string
image
lens
string
Prior art date
Application number
KR1020120007388A
Other languages
English (en)
Other versions
KR101329492B1 (ko
Inventor
김진형
석재현
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020120007388A priority Critical patent/KR101329492B1/ko
Publication of KR20130086493A publication Critical patent/KR20130086493A/ko
Application granted granted Critical
Publication of KR101329492B1 publication Critical patent/KR101329492B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Character Input (AREA)
  • Studio Devices (AREA)

Abstract

카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법이 개시된다. 문자 인식 장치는 카메라에서 촬영되는 제1 영상으로부터 문자열을 탐지하는 탐지부; 문자열의 위치 또는 크기 중 적어도 하나에 따라 카메라의 렌즈를 조정하는 제어부; 및 렌즈가 조정된 이후 문자열이 재촬영된 제2 영상으로부터 문자열에 해당되는 문자 데이터를 인식하는 인식부를 포함할 수 있다.

Description

카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법{APPARATUS AND METHOD FOR CONTROLLING CAMERA FOR LOCATING SCENE TEXT TO PROPER POSITION AND SIZE}
본 발명의 실시예들은 카메라를 이용하여 촬영된 자연 영상에 존재하는 문자열을 인식하기 위해 카메라의 렌즈를 자동으로 조절하여 인식하고자 하는 문자를 영상 중앙부위에 인식 가능한 크기로 위치시키는 방법에 관한 것이다.
카메라를 이용한 문자 입력이란 카메라를 통해 촬영된 영상에서 나타난 글자를 추출하고 인식한 결과를 장치에 입력하는 것이다. 카메라를 이용한 문자 입력은 키보드로 대표되는 입력 장치를 이용하지 않고 자동으로 입력한다는 점과 몇몇 작동을 통해 입력이 가능하여 단순하며, 특히 외국어의 입력에 대해 문자 입력 방법이 원활하지 않은 사람들도 손쉽게 문자를 입력 가능하다는 장점을 가지고 있다.
기존의 문자 인식 방법은 영상으로부터 문자열의 색상 정보 및 외곽선 정보를 추출하고 문자열 색상과 비슷한 화소들을 찾거나 배경과 문자열을 분리해내는 외곽선을 찾아냄으로써 문자열을 영상으로부터 추출 및 인식할 수 있다. 또한, 한국등록특허 제10-0874747호 "화소 이동 문서 영상 조합 인식 방법을 이용한 카메라 문자인식 장치 및 방법"에는 카메라 문서 영상에 대해 화소가 이동된 부-문서 영상(sub-document images)을 획득하여 영상 개선 알고리즘을 적용하고 부-문서 영상에 대해 국소 이진화를 행한 다음 문자 추출, 문자 특징 추출 및 이종 인식기를 결합하여 문자를 인식하는 방법이 개시되어 있다.
하지만 기존의 문자 인식 방법들은 이미 촬영된 영상으로부터 문자열을 추출하고 인식하므로, 인식하고자 하는 문자열이 작게 촬영된 경우에는 문자열의 저해상도(low resolution) 영상 정보만을 획득할 수 있고 이 정보 만으로는 문자열의 정확한 추출 및 인식에 어려움이 있다.
따라서, 인식하고자 하는 문자열이 저해상도로 촬영되는 문제점을 해결하기 위한 방법이 절실하다.
문자열의 정확한 추출과 인식을 위하여 문자열이 인식 가능한 크기로 영상의 중앙 부분에 위치할 수 있도록 카메라 렌즈를 자동 조절하여 문자를 인식하는 문자 인식 장치 및 방법을 제공한다.
본 실시예에 따른 문자 인식 장치는 카메라에서 촬영되는 제1 영상으로부터 문자열을 탐지하는 탐지부; 문자열의 위치 또는 크기 중 적어도 하나에 따라 카메라의 렌즈를 조정하는 제어부; 및 렌즈가 조정된 이후 문자열이 재촬영된 제2 영상으로부터 문자열에 해당되는 문자 데이터를 인식하는 인식부를 포함할 수 있다.
일 측면에 따르면, 탐지부는 제1 영상의 각 화소를 문자 영역 또는 비문자 영역으로 분류하는 방식을 통해 문자열을 탐지할 수 있다.
다른 측면에 따르면, 문자 인식 장치는 문자열을 표시하여 사용자로부터 문자열에 대한 선택 명령을 입력 받는 인터페이스부를 더 포함할 수 있다. 이때, 제어부는 사용자에 의해 선택된 문자열에 대하여 카메라의 렌즈를 조정할 수 있다.
또 다른 측면에 따르면, 제어부는 렌즈에 대하여 문자열의 위치에 따른 방향(pan) 조정 값, 또는 문자열의 크기에 따른 줌(zoom) 조정 값 중 적어도 하나를 결정할 수 있다.
또 다른 측면에 따르면, 제어부는 문자열의 중점과 제1 영상의 중점 간의 거리 차를 이용하여 방향 조정 값을 결정할 수 있다.
또 다른 측면에 따르면, 제어부는 문자열의 크기와 일정 크기 간의 크기 차를 이용하여 줌 조정 값을 결정할 수 있다.
또 다른 측면에 따르면, 문자 인식 장치는 방향 조정 값 또는 줌 조정 값 중 적어도 하나에 따라 렌즈를 구동하는 구동부를 더 포함할 수 있다.
또 다른 측면에 따르면, 인식부는 문자열을 일정 크기로 조정하여 중앙에 위치시킨 제2 영상을 이진화 하여 이진화 된 영상 데이터를 문자 데이터로 변환할 수 있다.
카메라 영상에서 문자를 인식하는 방법은 카메라에서 촬영되는 제1 영상으로부터 문자열을 탐지하는 단계; 문자열의 위치 또는 크기 중 적어도 하나에 따라 카메라의 렌즈를 조정하는 단계; 및 렌즈가 조정된 이후 문자열이 재촬영된 제2 영상으로부터 문자열에 해당되는 문자 데이터를 인식하는 단계를 포함할 수 있다.
인식하고자 하는 문자열 영역의 크기와 위치에 따라 문자열이 인식 가능한 적정 크기로 영상의 중앙 부분에 위치할 수 있도록 카메라 렌즈를 자동 조절함으로써 문자열이 저해상도로 촬영되는 문제점을 보안할 수 있으며, 보다 정확한 문자열 인식을 통해 인식 성능을 향상시킬 수 있다.
최근 카메라 문자 인식은 책읽는 로봇과 같은 로봇 비전에 활용되거나 휴대폰과 같은 모바일 기기에 카메라 기능 및 인식 기능을 내장시켜 정보 획득의 수단으로 활용되고 있는 상황에서, 현실 세계에서 보다 안정적인 카메라 문자 인식 성능을 보장하면서 그 인식 결과를 다른 응용 서비스와 결합할 경우에 사용자에게 편리함을 제공할 수 있다.
도 1은 본 발명의 일실시예에 있어서, 카메라 렌즈를 자동 조절하여 높은 해상도로 촬영된 영상에서 문자열을 인식하는 문자 인식 장치의 내부 구성을 도시한 블록도이다.
도 2 내지 도 5는 문자열 영역의 크기와 위치에 따라 카메라 렌즈를 조정하여 높은 해상도의 영상을 얻는 과정을 설명하기 위한 예시 도면이다.
도 6은 높은 해상도의 영상을 통해 문자열을 추출 및 인식하는 과정을 설명하기 위한 예시 도면이다.
도 7은 본 발명의 일실시예에 있어서, 카메라 렌즈를 자동 조절하여 높은 해상도로 촬영된 영상에서 문자열을 인식하는 문자 인식 방법을 도시한 흐름도이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
본 실시예들은 카메라 렌즈를 자동 조정하여 인식하고자 하는 문자열을 영상 중앙 부근에 적절한 크기로 위치시킨 후, 이후 얻은 영상 내에서 문자를 인식하는 장치 및 방법에 관한 것이다.
도 1은 본 발명의 일실시예에 있어서, 문자 인식 장치의 내부 구성을 도시한 블록도이다.
도 1에 도시한 바와 같이, 일실시예에 따른 문자 인식 장치(100)은 카메라 영상에서 문자를 인식하기 위한 것으로, 줌-인(zoom-in), 줌-아웃(zoom-out), 그리고 상하좌우 회전(panning) 등이 가능한 카메라(110)를 이용한다.
문자 인식 기술을 이용하면 카메라 영상으로부터 유용한 문자 정보를 추출할 수 있다. 그러나, 영상 내에 인식하고자 하는 문자가 너무 작게 포착된 경우에는 정확한 인식이 어려우므로, 카메라의 렌즈를 조정하여 문자를 인식하기 좋은 크기로 영상 중앙에 위치시키는 것이 중요하다. 즉, 본 실시예는 카메라 영상으로부터 문자열을 자동 인식하여 장치에 입력하고자 할 때 인식할 문자열에 대한 고해상도 영상을 획득하여 더 나은 인식 결과를 얻고자 함에 그 목적이 있다.
이를 위하여, 일실시예에 따른 문자 인식 장치(100)은 도 1에 도시한 바와 같이 탐지부(120), 인터페이스(130), 제어부(140), 구동부(150), 인식부(160)를 포함하여 구성될 수 있다.
탐지부(120)는 사용자의 문자 인식 요구에 대하여 카메라(110)에서 촬영되는 초기 영상(이하, '제1 영상'이라 칭함)을 입력 받은 후, 제1 영상의 전체 영역에서 문자열이 존재하는 영역을 탐지한다. 도 2에 도시한 바와 같이, 카메라 영상인 제1 영상(210)에는 'WINE SHOP & BAR', 'wine', 'cheese' 등의 문자열들이 존재할 수 있다. 제1 영상(210)에서 문자열 영역을 탐지하는 것은 영상의 각 화소(pixel)를 문자 영역(text region) 또는 비문자 영역(non-text region)으로 분류하는 작업이다. 이를 위해, 탐지부(120)는 문자 영역의 특성을 나타낼 수 있는 다양한 특징(feature)들을 사용하여 분류기를 학습하는 기계학습(machine learning) 방법을 사용하거나, 문자 영역을 비문자 영역과 구분할 수 있는 규칙들을 정의해 놓은 전문가 시스템을 사용할 수 있다. 일 예로, 문자 영역은 비 문자 영역에 비해 화소 강도(intensity) 변화가 급격하며 외곽선의 분포가 조밀하고 규칙적이므로, 분류하려는 화소 주변의 지역적 영상에서 나타나는 화소 강도들의 평균 차이 값(mean difference feature), 표준편자(standard deviation), 혹은 방향 별 외곽선의 히스토그램(Histogram of oriented gradients) 등의 특징을 이용하여 문자 영역과 비문자 영역을 분류할 수 있다. 화소 별 문자/비문자 분류 이후에는 문자로 분류된 화소들 중 인접한 화소들을 하나로 묶어 문자열에 해당되는 최종 영역을 얻을 수 있다. 이후, 탐지부(120)는 제1 영상에서 문자열 영역이 최종으로 탐지되면 탐지된 문자열 영역 각각에 대하여 문자열 영역의 크기와 위치를 탐지할 수 있다. 다시 말해, 탐지부(120)는 문자열 영역 내 화소의 위치 값들을 이용하여 해당 영역의 크기와 중점의 위치를 확인할 수 있다.
인터페이스부(130)는 사용자와의 인터페이스 역할을 하는 수단으로, 디스플레이 수단과 입력 수단으로 구성될 수 있다. 이때, 인터페이스부(130)는 문자 인식 기능에 대한 사용자의 요구를 입력 받을 수 있으며, 카메라(110)에서 입력되는 영상을 출력하고, 영상에 여러 문자열이 포함된 경우에는 문자열 탐지 결과를 사용자에게 보여주어 인식하고자 하는 문자열을 사용자가 선택할 수 있도록 인터페이스를 제공할 수 있다. 인터페이스부(130)는 사용자로부터 문자열에 대한 선택 명령을 입력 받기 위하여 탐지부(120)의 탐지 결과를 입력 받아 도 3에 도시한 바와 같이 제1 영상 내에서 탐지된 문자열 영역(301)을 모두 표시해줄 수 있다. 이에, 사용자는 영상 내 문자열(301) 중에서 인식하고자 하는 문자열(예컨대, 'wine')을 선택할 수 있다.
제어부(140)는 탐지부(120)의 탐지 결과와 문자열에 대한 사용자의 선택 명령을 입력 받아 해당 문자열의 위치 또는 크기 중 적어도 하나를 기준으로 카메라(110)의 렌즈를 조정하는 역할을 한다. 상세하게, 제어부(140)는 인식하려는 문자열의 중심 위치로부터 제1 영상의 중심 위치까지의 상대적 거리 차와, 인식하려는 문자열의 크기와 인식에 적합하도록 사전에 정해진 일정 크기 간의 상대적 크기 차를 측정한다. 도 4를 참조하면, 제어부(140)는 인식하려는 문자열(401)을 카메라 영상의 중앙에 위치시키기 위해 문자열(401)과 영상 중심 간의 거리 차를 이용하여 렌즈의 방향 조정 값을 결정할 수 있다. 아울러, 제어부(140)는 인식하려는 문자열(401)의 해상도를 높이기 위해 문자열(401)과 일정 크기와의 크기 차를 이용하여 렌즈의 줌 조정 값을 결정할 수 있다. 그리고, 제어부(140)는 렌즈의 방향 조정 값과 줌 조정 값에 대응되는 구동 제어 신호를 출력하게 된다.
구동부(150)는 제어부(140)의 제어 하에 카메라의 렌즈를 조정하는 구동 역할을 수행한다. 다시 말해, 구동부(150)는 제어부(140)에서 출력된 구동 제어 신호에 따라 제어부(150)에서 계산된 방향 조정 값과 줌 조정 값만큼 렌즈의 방향과 줌을 조정할 수 있다. 따라서, 구동부(150)는 제어부(140)로부터 렌즈의 방향과 줌 조절을 위한 구동 제어 신호를 받아서 카메라(110)의 렌즈를 구동함으로써 도 5에 도시한 바와 같이 인식하려는 문자열(501)을 카메라 영상의 중앙에, 그리고 인식하기 적합한 크기로 위치시킬 수 있다.
인식부(160)는 인식하려는 문자열의 위치 및/또는 크기에 따라 카메라(110)의 렌즈가 조정된 이후 재 촬영된 조정 영상(이하, '제2 영상'이라 칭함)으로부터 문자열에 해당되는 문자 데이터를 인식할 수 있다. 도 6을 참조하면, 인식부(160)는 문자열(601)이 일정 크기로 중앙에 위치하는 제2 영상(610)으로부터 인식하고자 하는 문자열(601)을 추출하여 추출된 문자열(601)에 대한 이진 영상(binary image)(602)을 만들어 내고, 이를 인식함으로써 영상 데이터를 문자 데이터로 변환하는 역할을 한다. 일 예로, 인식부(160)는 제2 영상(610)의 색상 정보, 외곽선 정보 등을 이용하여 제2 영상(610) 내에 존재하는 문자를 추출하고, 이를 문자 인식기(Optical Character Recognizer, OCR)에 입력으로 하여 결과 문자열을 얻을 수 있다. 이때, 인식된 문자열은 장치의 화면에 출력되거나, 추가적인 서비스가 가능하도록 다른 응용 시스템(예컨대, 번역, 검색, 로봇 비전 등)의 입력으로 전달될 수 있다.
따라서, 상기한 구성의 문자 인식 장치는 초기 영상에서 문자열의 위치와 크기를 탐지하고, 탐지 결과를 기준으로 카메라 렌즈의 방향과 줌을 조정하여 문자열을 영상 중앙에 인식 가능한 크기로 위치시킨 후 문자를 인식함으로써 정확한 인식이 가능하다.
도 7은 본 발명의 일실시예에 있어서, 카메라 렌즈를 자동 조절하여 높은 해상도로 촬영된 영상에서 문자열을 인식하는 문자 인식 방법을 도시한 흐름도이다. 일실시예에 따른 문자 인식 방법은 도 1을 통해 설명한 문자 인식 장치에 의해 각각의 단계가 수행될 수 있다.
단계(701)에서 문자 인식 장치는 사용자의 문자 인식 요구에 대하여 제1 영상에서 문자열 영역을 탐지한다. 이때, 문자 인식 장치는 제1 영상의 각 화소를 문자 영역 또는 비문자 영역으로 분류하는 방식을 통해 문자가 존재하는 문자열 영역을 탐지할 수 있다.
단계(702)와 단계(703)에서 문자 인식 장치는 제1 영상에 문자열 영역이 존재하면 문자열 영역 내 화소의 위치 값들을 이용하여 해당 영역의 크기와 중점 위치를 측정할 수 있다. 이때, 문자 인식 장치는 제1 영상에 여러 문자열이 포함된 경우 인식하려는 문자열을 사용자로부터 직접 선택 받아 선택된 문자열에 대한 크기와 위치를 탐지할 수 있다.
단계(704)와 단계(705)에서 문자 인식 장치는 인식하려는 문자열이 영상 중앙에 위치하는지 여부를 판단하여 문자열이 영상 중앙에 위치하지 않는 경우 인식하려는 문자열의 중점과 제1 영상의 중점 간의 거리 차를 이용하여 카메라 렌즈의 방향 조정 값을 결정한 후 결정된 조정 값에 따라 렌즈 방향을 조정한다. 이때, 문자 인식 장치는 단계(704)에서 인식하려는 문자열이 영상 중앙에 위치하는 경우 단계(705)를 수행하지 않고 단계(706)로 이동한다.
단계(706)와 단계(707)에서 문자 인식 장치는 인식하려는 문자열의 크기가 사전에 정해진 일정 크기 이상인지 여부를 판단하여 문자열이 일정 크기 보다 작은 경우 인식하려는 문자열의 영역 크기와 일정 크기 간의 크기 차를 이용하여 카메라 렌즈의 줌 조정 값을 결정한 후 결정된 조정 값에 따라 렌즈 줌을 조정한다. 이때, 문자 인식 장치는 단계(706)에서 인식하려는 문자열의 영역 크기가 일정 크기 이상인 경우 단계(707)를 수행하지 않고 단계(708)로 이동한다.
단계(708)와 단계(709)에서 문자 인식 장치는 인식하려는 문자열의 위치 및/또는 크기에 따라 카메라의 렌즈가 조정된 이후 재 촬영되는 제2 영상으로부터 문자열을 추출 및 인식한 후, 인식된 문자열을 장치에 입력할 수 있다. 일 예로, 문자 인식 장치는 문자열이 일정 크기로 중앙에 위치하는 제2 영상을 이진화 하여 이진화 된 영상 데이터를 문자 데이터로 변환함으로써 결과 문자열을 얻을 수 있다.
단계(710)에서 문자 인식 장치는 문자열에 대한 인식 및 입력이 완료되면 카메라 렌즈의 방향과 줌을 초기화 한다.
도 7과 관련하여 앞서 설명한 문자를 인식하는 방법은 보다 단축된 동작들 또는 추가 동작들을 포함할 수 있다. 또한, 둘 이상의 동작이 조합될 수 있고, 동작들의 순서가 변경될 수 있다.
이와 같이, 본 발명의 실시예에 따르면, 인식하고자 하는 문자열 영역의 크기와 위치에 따라 문자열이 인식 가능한 적정 크기로 영상의 중앙 부분에 위치할 수 있도록 카메라 렌즈를 자동 조절함으로써 문자열이 저해상도로 촬영되는 문제점을 보안할 수 있으며, 보다 정확한 문자열 인식을 통해 인식 성능을 향상시킬 수 있다.
본 발명의 실시예에 따른 문자 인식 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 특히, 본 실시예들은 모바일 단말 전용 어플리케이션(예를 들어, 스마트폰 어플리케이션, 피쳐폰 VM(virtual machine) 등의 형태)으로 구성될 수 있다. 이는, 스마트 기기에서 구동되는 적어도 하나의 프로세서에 의해 실행되도록 구성될 수 있다.
상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 또한, 상술한 파일 시스템은 컴퓨터 판독이 가능한 기록 매체에 기록될 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
100: 문자 인식 장치
110: 카메라
120: 탐지부
130: 인터페이스부
140: 제어부
150: 구동부
160: 인식부

Claims (10)

  1. 카메라에서 촬영되는 제1 영상으로부터 문자열을 탐지하는 탐지부;
    상기 문자열의 위치 또는 크기 중 적어도 하나에 따라 상기 카메라의 렌즈를 조정하는 제어부; 및
    상기 렌즈가 조정된 이후 상기 문자열이 재촬영된 제2 영상으로부터 상기 문자열에 해당되는 문자 데이터를 인식하는 인식부
    를 포함하는 문자 인식 장치.
  2. 제1항에 있어서,
    상기 탐지부는,
    상기 제1 영상의 각 화소를 문자 영역 또는 비문자 영역으로 분류하는 방식을 통해 상기 문자열을 탐지하는 것
    을 특징으로 하는 문자 인식 장치.
  3. 제1항에 있어서,
    상기 문자열을 표시하여 사용자로부터 상기 문자열에 대한 선택 명령을 입력 받는 인터페이스부
    를 더 포함하고,
    상기 제어부는,
    상기 사용자에 의해 선택된 상기 문자열에 대하여 상기 카메라의 렌즈를 조정하는 것
    을 특징으로 하는 문자 인식 장치.
  4. 제1항에 있어서,
    상기 제어부는,
    상기 렌즈에 대하여 상기 문자열의 위치에 따른 방향(pan) 조정 값, 또는 상기 문자열의 크기에 따른 줌(zoom) 조정 값 중 적어도 하나를 결정하는 것
    을 특징으로 하는 문자 인식 장치.
  5. 제4항에 있어서,
    상기 제어부는,
    상기 문자열의 중점과 상기 제1 영상의 중점 간의 거리 차를 이용하여 상기 방향 조정 값을 결정하는 것
    을 특징으로 하는 문자 인식 장치.
  6. 제4항에 있어서,
    상기 제어부는,
    상기 문자열의 크기와 일정 크기 간의 크기 차를 이용하여 상기 줌 조정 값을 결정하는 것
    을 특징으로 하는 문자 인식 장치.
  7. 제4항에 있어서,
    상기 방향 조정 값 또는 상기 줌 조정 값 중 적어도 하나에 따라 상기 렌즈를 구동하는 구동부
    를 더 포함하는 문자 인식 장치.
  8. 제4항에 있어서,
    상기 제2 영상은 상기 문자열을 일정 크기로 조정하여 중앙에 위치시킨 영상이며,
    상기 인식부는,
    상기 제2 영상을 이진화 하여 상기 이진화 된 영상 데이터를 상기 문자 데이터로 변환하는 것
    을 특징으로 하는 문자 인식 장치.
  9. 카메라 영상에서 문자를 인식하는 방법에 있어서,
    카메라에서 촬영되는 제1 영상으로부터 문자열을 탐지하는 단계;
    상기 문자열의 위치 또는 크기 중 적어도 하나에 따라 상기 카메라의 렌즈를 조정하는 단계; 및
    상기 렌즈가 조정된 이후 상기 문자열이 재촬영된 제2 영상으로부터 상기 문자열에 해당되는 문자 데이터를 인식하는 단계
    를 포함하는 문자 인식 방법.
  10. 문자 인식 장치에서 문자열을 인식하는 방법에 있어서,
    카메라에서 촬영되는 제1 영상으로부터 문자열을 탐지하는 단계;
    상기 문자열의 위치 또는 크기 중 적어도 하나에 따라 상기 카메라의 렌즈를 조정하는 단계; 및
    상기 렌즈가 조정된 이후 상기 문자열이 재촬영된 제2 영상으로부터 상기 문자열에 해당되는 문자 데이터를 인식하는 단계
    를 포함하고,
    상기 카메라의 렌즈를 조정하는 단계는,
    상기 문자열의 중점과 상기 제1 영상의 중점 간의 거리 차를 이용하여 상기 렌즈의 방향(pan) 조정 값을 결정하는 단계, 또는 상기 문자열의 크기와 일정 크기 간의 크기 차를 이용하여 상기 렌즈의 줌(zoom) 조정 값을 결정하는 단계 중 적어도 하나의 단계와,
    상기 회전 조정 값 또는 상기 줌 조정 값 중 적어도 하나에 따라 상기 렌즈를 조정하는 단계
    를 포함하는 문자 인식 방법.
KR1020120007388A 2012-01-25 2012-01-25 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법 KR101329492B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120007388A KR101329492B1 (ko) 2012-01-25 2012-01-25 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120007388A KR101329492B1 (ko) 2012-01-25 2012-01-25 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법

Publications (2)

Publication Number Publication Date
KR20130086493A true KR20130086493A (ko) 2013-08-02
KR101329492B1 KR101329492B1 (ko) 2013-11-13

Family

ID=49213727

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120007388A KR101329492B1 (ko) 2012-01-25 2012-01-25 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법

Country Status (1)

Country Link
KR (1) KR101329492B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150115403A (ko) * 2014-04-04 2015-10-14 삼성전자주식회사 인식 영역에 기반하여 콘텐트를 검출하는 전자 장치 및 방법
KR102555707B1 (ko) * 2022-04-19 2023-07-14 호서대학교 산학협력단 문자 인식을 통한 격자무늬 추적 로봇의 자율주행의 제어 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08106510A (ja) * 1994-10-05 1996-04-23 Casio Comput Co Ltd 文字読取り装置及び文字認識装置
JP3563911B2 (ja) * 1997-03-04 2004-09-08 シャープ株式会社 文字認識装置
JP4093790B2 (ja) * 2002-04-16 2008-06-04 富士通株式会社 撮像装置
KR101588890B1 (ko) * 2008-07-10 2016-01-27 삼성전자주식회사 카메라 기반 영상의 문자 인식 및 번역 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150115403A (ko) * 2014-04-04 2015-10-14 삼성전자주식회사 인식 영역에 기반하여 콘텐트를 검출하는 전자 장치 및 방법
KR102555707B1 (ko) * 2022-04-19 2023-07-14 호서대학교 산학협력단 문자 인식을 통한 격자무늬 추적 로봇의 자율주행의 제어 방법

Also Published As

Publication number Publication date
KR101329492B1 (ko) 2013-11-13

Similar Documents

Publication Publication Date Title
JP6395759B2 (ja) レーン検出
EP3152706B1 (en) Image capturing parameter adjustment in preview mode
US8831381B2 (en) Detecting and correcting skew in regions of text in natural images
KR101617681B1 (ko) 히스토그램들을 갖는 다중 층 연결 요소들을 사용하는 텍스트 검출
US8175380B2 (en) Apparatus and method for improving text recognition capability
EP2164027B1 (en) Object detecting device, imaging apparatus, object detecting method, and program
CN105303156B (zh) 字符检测装置、方法及程序
KR101645994B1 (ko) 문자 인식 영역 검출 장치 및 문자 인식 방법
EP2506218B1 (en) Method, terminal, and computer-readable recording medium for trimming a piece of image content
KR20140010164A (ko) 객체에서 텍스트 정보를 인식하기 위한 시스템 및 방법
KR101279712B1 (ko) 실시간 차선 검출 장치 및 방법과 이에 관한 기록매체
KR20130066819A (ko) 촬영 이미지 기반의 문자 인식 장치 및 방법
US20160057331A1 (en) Activating flash for capturing images with text
WO2014184372A1 (en) Image capture using client device
CN111539269A (zh) 文本区域的识别方法、装置、电子设备和存储介质
CN112507767B (zh) 脸部辨识方法及其相关电脑系统
KR100969603B1 (ko) 숫자의 기하학적 관계를 이용한 차량 번호판 인식 방법
KR101329492B1 (ko) 카메라 렌즈를 조절하여 인식할 문자열을 영상의 중앙에 인식 가능한 크기로 위치시키는 장치 및 그 방법
JP2016053763A (ja) 画像処理装置、画像処理方法及びプログラム
US20200167583A1 (en) Apparatus and method for registering face pose for face recognition
JP2014182637A (ja) 画像処理装置、画像処理方法および画像処理プログラム
JP2018072884A (ja) 情報処理装置、情報処理方法およびプログラム
JP6688091B2 (ja) 車両距離導出装置および車両距離導出方法
KR20190143525A (ko) 에이다부스트 학습을 이용한 문자 데이터 검출 방법
JP6833324B2 (ja) 情報処理装置、プログラム及び情報処理方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161026

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee