KR101169140B1 - 문자 영역 추출을 위한 영상 생성 장치 및 방법 - Google Patents

문자 영역 추출을 위한 영상 생성 장치 및 방법 Download PDF

Info

Publication number
KR101169140B1
KR101169140B1 KR1020100014269A KR20100014269A KR101169140B1 KR 101169140 B1 KR101169140 B1 KR 101169140B1 KR 1020100014269 A KR1020100014269 A KR 1020100014269A KR 20100014269 A KR20100014269 A KR 20100014269A KR 101169140 B1 KR101169140 B1 KR 101169140B1
Authority
KR
South Korea
Prior art keywords
image
binarization
pixel
value
rgb
Prior art date
Application number
KR1020100014269A
Other languages
English (en)
Other versions
KR20110094709A (ko
Inventor
오상욱
설상훈
윤준식
이훈재
정순홍
Original Assignee
고려대학교 산학협력단
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단, 삼성전자주식회사 filed Critical 고려대학교 산학협력단
Priority to KR1020100014269A priority Critical patent/KR101169140B1/ko
Priority to US13/015,194 priority patent/US8355571B2/en
Publication of KR20110094709A publication Critical patent/KR20110094709A/ko
Application granted granted Critical
Publication of KR101169140B1 publication Critical patent/KR101169140B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

본 발명은 문자 영역 추출을 위한 영상 생성 장치 및 방법에 관한 것이다.
이를 위해 본 발명은 원본 영상이 입력되면 원본 영상에서 문자 후보 영상을 생성하여 생성된 문자 후보 영상으로부터 유사 색상별로 복수의 이진화 맵을 생성하고, 생성된 복수의 이진화 맵 중에서 배경 영역을 포함하는 이진화 맵을 선택한 후 선택한 이진화 맵의 배경 영역을 확장하여 반전한 후 문자 영역을 포함하는 영상을 생성함으로써 문자 영역을 추출할 시 문자의 경계 부분을 소실없이 정확하게 추출할 수 있는 영상을 생성할 수 있다.

Description

문자 영역 추출을 위한 영상 생성 장치 및 방법{APPARATUS AND METHOD FOR GENERATING IMAGE FOR TEXT REGION EXTRACTION}
본 발명은 문자 영역 추출을 위한 영상 생성 장치 및 방법에 관한 것으로, 특히 영상 내 문자 검출하기 위해 문자 후보 영역에서 배경 영상을 추출하고, 추출된 배경 영상을 반전한 영상을 이용하여 정확한 문자 영역을 추출하기 위한 영상을 생성하는 장치 및 방법을 제공한다.
일반적으로 문자 추출 방법은 영상에 포함되는 문자를 인지하고, 인지된 문자 영역을 추출하는 방법이다.
이러한 영상에 포함된 문자는 중요한 내용 정보를 제공하고 있기 때문에, 이러한 문자의 의미를 파악하기 위해서 휴대폰 동영상, 명함 이미지, 간판 등의 영상에 포함된 문자 인식에 대한 중요성이 증대하고 있다.
영상에 포함된 문자 검출을 위한 배경과 문자 분리방법으로 다양한 방법이 제시되었다.
첫째로, 배경과 문자를 분리하는 방법으로 이진화가 있다. 이진화에는 크게 이미지 전체에 대해 이진화를 수행하는 전역 이진화 방법이 있고, 부분적으로 이진화를 수행하는 지역 이진화 방법이 있다. 이러한 방법들은 문자와 배경이 단일할 경우 간단한 방법으로 배경과 문자를 분리할 수 있는 장점이 있다.
둘째로, 배경과 문자를 하나의 맵으로 분리하는 것이 아니라 RGB 색상에 따라서 분리하여 비슷한 색상을 가진 픽셀끼리 묶어서 각 색상별로 맵(map)을 만드는 색 군집화(color clustering) 방법이 있다. 이 방법은 글자의 색이 다양하게 존재하더라도 글자와 배경을 분리할 수 있는 장점이 있다.
상기와 같이 종래에는 전역 이진화, 지역 이진화, 색 병합 방법을 이용하여 영상 내의 문자를 추출하였다.
하지만 이진화 방법은 영상이 복잡하거나 문자의 색이 다양하게 존재할 때에 정상적으로 배경과 문자를 구분하지 못하는 문제점이 있다.
또한, 색 군집화 방법은 빛과 같은 외부 효과에 대해 색이 나눠질 경우, 문자가 여러 개의 영역으로 나누어져 정상적으로 문자와 배경을 분리하기가 힘들다. 게다가, 도 1과 같이 아날로그 정보를 디지털화할 때, 참조번호 100과 같이 영상의 경계부분에 생기는 앨리어싱(aliasing) 때문에, 문자와 배경 사이의 경계가 따로 분리되어 문자 획 너비(stroke width)가 원본 영상에 비해 좁게 나타나는 현상이 발생한다. 그로 인해 추후에 문자를 인식 할 때 문자 획 너비의 감소로 인해 문자 영역의 일부가 누락되는 문제점이 있다.
따라서, 본 발명은 명확한 문자 영역을 추출하기 위한 영상을 생성하는 장치 및 방법을 제공한다.
상술한 바를 달성하기 위한 본 발명은 영상 생성 장치에 있어서, 원본 영상이 입력되면 상기 원본 영상에서 문자 후보 영상을 생성하고, 상기 생성된 문자 후보 영상으로부터 유사 색상별로 복수의 이진화 맵을 생성하는 이진화 맵 생성부와, 상기 생성된 복수의 이진화 맵 중에서 배경 영역을 포함하는 이진화 맵을 선택하는 배경 영역 판단부와, 상기 선택한 이진화 맵의 배경 영역을 확장하여 반전한 후 문자 영역을 포함하는 영상을 생성하는 문자 영역 추출부를 포함하는 것을 특징으로 한다.
또한, 본 발명은 영상 생성 방법에 있어서, 원본 영상이 입력되면 상기 원본 영상에서 문자 후보 영상을 생성하는 과정과, 상기 생성된 문자 후보 영상으로부터 유사 색상별로 복수의 이진화 맵을 생성하는 과정과, 상기 생성된 복수의 이진화 맵 중에서 배경 영역을 포함하는 이진화 맵을 선택하는 과정과, 상기 선택한 이진화 맵의 배경 영역을 확장하여 반전한 후 문자 영역을 포함하는 영상을 생성하는 과정을 포함함을 특징으로 한다.
본 발명은 문자 추출을 위한 이진화 맵에서 문자의 배경을 선택하여 이를 반전함으로써 문자 영역을 추출할 시 문자의 경계 부분을 소실없이 정확하게 추출할 수 있는 영상을 생성할 수 있다는 이점이 있다.
도 1은 종래의 영상 추출 과정을 설명하기 위한 예시도들,
도 2는 본 발명의 실시 예에 따른 영상 생성 장치의 블록도,
도 3은 본 발명의 실시 예에 따른 이진화 맵 생성부에서 문자 후보 영상을 생성하기 위한 과정을 설명하기 위한 예시도들,
도 4는 본 발명의 실시 예에 따른 이진화 맵 생성부에서 유사 색상별 복수의 이진화 맵을 출력하는 과정을 설명하기 위한 예시도들,
도 5는 본 발명의 실시 예에 따른 배경 영역 판단부에서 스캔 라인에 따라 배경 영역을 포함하는 영상을 선택하기 위한 과정을 설명하기 위한 예시도들,
도 6은 본 발명의 실시 예에 따른 문자 영역 추출부에서 문자 영역을 포함하는 영상을 생성하기 위한 과정을 설명하기 위한 예시도들,
도 7은 본 발명의 실시 예에 따른 영상 생성 장치에서 경계가 개선된 문자 영역을 포함하는 영상을 생성하는 과정을 나타내는 흐름도,
도 8은 본 발명의 실시 예에 따른 이진화 맵 생성부에서 유사 색상별 복수의 이진화 맵을 생성하는 과정을 나타내는 흐름도,
도 9는 본 발명의 실시 예에 따른 배경 영역 판단부에서 스캔 라인에 따라 배경 영역을 포함하는 영상을 선택하기 위한 과정을 나타내는 흐름도,
도 10은 본 발명의 실시 예에 따른 문자 영역 추출부에서 문자 영역을 포함하는 영상을 생성하기 위한 과정을 나타내는 흐름도.
이하 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 하기 설명 및 첨부 도면에서 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.
도 2는 본 발명의 실시 예에서 문자 추출을 위한 장치의 블록도를 나타내는 도면이다.
본 발명의 실시 예에 따른 문자 추출 장치는 이진화맵 생성부(200), 배경 영역 판단부(210), 문자 영역 추출부(220)를 포함한다.
이진화맵 생성부(200)는 원본 영상을 미리 설정된 크기의 블록으로 분할하고, 각 블록에 대한 RGB 색상 분산값을 산출하고, 산출된 RGB 색상 분산값을 이용하여 문자 후보 영상을 생성한다.
구체적으로, 이진화맵 생성부(200)는 원본 영상이 입력되면 원본 영상을 미리 설정된 크기의 블록단위로 분할하고, 분할된 블록단위로 RGB 색상에 대한 픽셀값 분산을 산출한다. 만약 블록마다 산출된 각 RGB 색상에 대한 분산값 중 어느 하나의 분산값이 미리 설정된 분산 임계값보다 크면 해당 블록을 원본 영상에서 제외시킨 문자 후보 영상을 생성한다. 이를 통해서 이진화맵 생성부(200)는 도 3의 (a), (c)와 같은 원본 영상이 입력되면 도 3의 (b), (d)와 같은 영상을 출력하게 된다.
이후 이진화맵 생성부(200)는 문자 후보 영상의 모든 픽셀에 대한 색상값의 차이를 산출하여 유사한 색상을 가지는 색상 영역별로 이진화 맵을 생성한다.
구체적으로, 이진화맵 생성부(200)는 복수의 시드점(seed point) 각각에 대응하는 색상 및 그 색상이 가지는 RGB 값을 맵핑하여 색상 테이블을 생성한다.
예를 들어, 검은색, 흰색, 붉은색, 초록색, 파란색, 노란색, 분홍색, 하늘색과 같이 8가지 색상과, 그 색상에 해당하는 RGB 값에 1-8의 시드점 각각을 맵핑시킨 <표 1>과 같은 색상 테이블을 생성한다고 가정한다.
시드점(Seed Point) R G B 색상
1 0 0 0 검은색
2 255 255 255 흰색
3 255 0 0 붉은색
4 0 255 0 초록색
5 0 0 255 파란색
6 255 255 0 노란색
7 255 0 255 분홍색
8 0 255 255 하늘색
이진화맵 생성부(200)는 문자 후보 영상에 포함된 각 픽셀들에 대한 RGB 값과 색상 테이블에 포함된 각 시드점에 대응되는 RGB 값의 차이값을 산출하여 산출된 차이값 중 가장 적은 차이값을 가지는 시드점에 해당 픽셀들을 포함시킨다.
이진화맵 생성부(200)는 모든 픽셀에 대한 픽셀 분류가 완료되면 각 시드점에 포함된 픽셀의 개수를 확인하여 확인된 픽셀의 개수가 전체 픽셀의 개수 중 임계값 이하의 개수를 가지는 시드점과, 그에 대응되는 목록들을 테이블 내에서 삭제한다. 그리고 이진화맵 생성부(200)는 삭제된 시드점이 가지고 있었던 픽셀들 각각을 RGB 값의 차이가 그 다음으로 적은 RGB 값에 해당하는 각 시드점에 포함시킨다.
이후 이진화맵 생성부(200)는 각 시드점에 포함되어 있는 픽셀들에 대한 평균 RGB값을 산출하고, 산출된 평균 RGB값과 각 시드점에 대응된 RGB 값의 차이값이 가장 적은 RGB 값에 해당하는 시드점에 해당 픽셀들을 포함시킨다.
이진화맵 생성부(200)는 더 이상 시드점에 대한 업데이트가 일어나지 않을 때까지 상기의 동작을 반복하여 수행한다.
시드점에 대한 업데이트가 완료되면 이진화맵 생성부(200)는 문자 후보 영상 내에서 유사한 색상을 가지는 픽셀들의 집합으로 구성된 복수의 이진화 맵을 출력하는데, 출력된 이진화 맵들은 도 4의 와 같이 도시될 수 있다. 이때, 도 4의 (a)는 원본 영상이고, (b)와 (c)는 문자 영역을, (d)는 문자와 배경의 경계에 생기는 앨리어싱 영역을, (e)와 (f)는 분리된 배경 영역을 나타내는 맵들이다.
배경 영역 판단부(210)는 원본 영상에서 문자를 제외한 배경 영역으로 판단되는 이진화 맵을 선택한다.
구체적으로, 배경 영역 판단부(210)는 색상별로 생성된 이진화 맵을 미리 설정된 스캔 라인의 방향으로 스캔 라인에 따라 스캔하면서 스캔 라인에 대응되어 색상이 연속적으로 존재하는 픽셀들의 개수를 확인한다.
이후 확인된 픽셀들의 개수가 임계값보다 크거나 같으면 배경 영역 판단부(210)는 색상이 연속적으로 존재하는 픽셀들을 하나의 픽셀 그룹으로 설정한다. 여기서, 스캔 라인은 도 5의 (a)와 같은 형태로 구성될 수 있다.
배경 영역 판단부(210)는 복수의 이진화 맵 각각에 대해서 상기와 같은 스캔 라인에 따라 설정된 픽셀 그룹의 개수를 확인하여 확인된 픽셀 그룹의 개수 중 가장 많은 픽셀 그룹의 개수를 가지는 이진화 맵을 배경 영역을 포함하는 이진화 맵으로 판단한다.
예를 들어, 도 5의 (a)와 같이 4개의 스캔 라인의 형태로 특정 이진화 맵을 스캔하는 경우 배경 영역 판단부(210)는 도 5의 (b)와 같이 스캔 라인에 대응하여 복수의 픽셀 그룹을 판단하고, 판단된 픽셀 그룹의 개수를 확인하는 것이다.
이후 문자 영역 추출부(220)는 배경 영역으로 판단된 이진화 맵에서 원본 영상을 이용하여 배경 영역을 확장하고, 배경 영역을 반전하여 문자 영역을 추출한다.
구체적으로, 문자 영역 추출부(220)는 도 6의 (a)와 같은 이진화 맵에서 참조부호 600과 같이 미리 설정된 크기의 m×n 블록 단위로 이진화 맵을 스캔하면서 블록 내에 이진화 픽셀이 존재하면 해당 블록을 참조부호 610과 같은 M×N 블록으로 확장한다. 이때, m, n과 M, N는 자연수이며, M, N이 m, n보다 큰 값을 가진다. 예를 들어, 도 6의 (a)와 같이 8×8 블록 단위로 스캔하면서 16×16 블록으로 확장할 수 있다.
문자 영역 추출부(220)는 확장된 블록 내에서 이진화 픽셀 영역에 대응하는 원본 영상의 픽셀 영역에 대한 RGB 평균값을 산출한다.
이후 문자 영역 추출부(220)는 추출된 RGB 평균값과 m×n 블록 내에서 이진화 픽셀을 제외한 나머지 각 픽셀간의 RGB 값의 차이값을 산출하여 산출된 차이값이 임계값 이하이면 임계값 이하의 차이값을 가지는 픽셀을 이진화 픽셀로 변환하여 배경 영역을 확장한다.
마지막 픽셀까지 이진화 픽셀 변환을 위한 동작을 수행하면 문자 영역 추출부(220)는 결과 영상을 반전하여 문자 영역 추출을 위한 영상을 생성한다.
즉, 본 발명은 도 6의 (b)와 같은 이진화 맵의 배경 영역을 (c)와 같이 확장하고, 이를 반전하여 (d)와 같은 문자 영역 추출을 위한 영상을 생성할 수 있다.
이와 같이 본 발명은 문자 추출을 위한 이진화 맵에서 문자의 배경을 선택하여 이를 반전함으로써 좀 더 명확한 문자 영역을 추출할 수 있는 영상을 생성하게 된다.
도 7은 본 발명의 실시 예에 따라 영상 생성 장치가 문자 영역 추출을 위한 영상을 생성하기 위한 과정을 나타내는 흐름도이다.
700단계에서 원본 영상이 입력되면 710단계에서 이진화 맵 생성부(200)는 원본 영상을 블록 단위로 분할하여 각 블록에 대한 RGB 색상 분산값을 산출한 후 문자 후보 영상을 생성한다. 여기서 문자 후보 영상은 문자를 포함하는 문자 후보 영역을 가지고, 배경으로 추측되는 영역을 제외한 영역을 의미한다.
720단계에서 이진화 맵 생성부(200)는 문자 후보 영상의 모든 픽셀에 대한 색상값의 차이값을 산출하여 유사 색상별로 이진화 맵을 생성한다. 이에 대해서 구체적으로 도 8을 참조하여 살펴보면 다음과 같다.
도 8은 본 발명의 실시 예에 따라 이진화 맵 생성부가 색상별 이진화 맵을 생성하는 과정을 나타내는 흐름도이다.
810단계에서 이진화 맵 생성부(200)는 복수의 시드점 각각에 대응하는 색상 및 그 색상이 가지는 RGB 값을 맵핑한 색상 테이블을 생성한다. 이때, 생성된 색상 테이블은 상기에서 설명한 <표 1>과 같이 생성될 수 있다.
820단계에서 이진화 맵 생성부(200)는 문자 후보 영상의 각 픽셀에 대한 RGB 값과 색상 테이블에서의 시드점에 대응하는 RGB값간의 차이값을 산출한다.
830단계에서 이진화 맵 생성부(200)는 산출된 차이값 중 가장 작은 차이값을 가지는 시드점에 가장 작은 차이값을 산출하는데 이용된 RGB 값을 가지는 픽셀을 포함시켜 업데이트한다.
840단계에서 이진화 맵 생성부(200)는 최종 픽셀까지 시드점 업데이트가 완료되었는지 여부를 판단하여 완료되면 850단계로 진행하고, 그렇지 않으면 820단계로 진행하여 최종 픽셀까지 시드점 업데이트가 되도록 RGB 값의 차이값을 산출하고, 810단계와 840단계를 계속적으로 진행한다.
840단계에서 850단계로 진행한 이진화 맵 생성부(200)는 유사한 색상을 가지는 픽셀들의 집합으로 구성되는 복수의 이진화 맵을 생성한다. 예를 들어, 이진화 맵 생성부(200)는 <표 1>과 같이 8개의 색상에 해당하는 이진화 맵을 생성할 수 있다.
이후 도 7의 730단계로 돌아와서, 배경 영역 판단부(210)는 생성된 복수의 이진화 맵 중에서 배경영역으로 판단되는 이진화 맵을 선택한다. 이에 대해서 구체적으로 도 9를 참조하여 하기에서 설명하도록 한다.
도 9는 본 발명의 실시 예에 따라 배경 영역 판단부가 배경 영역으로 판단되는 이진화 맵을 선택하는 과정을 나타내는 흐름도이다.
900단계에서 배경 영역 판단부(210)는 이진화 맵 각각을 미리 설정된 스캔라인에 따라 스캔한다. 이는 상기에서 설명한 바와 같이 도 5의 (a)와 같은 스캔라인을 이용하여 스캔할 수있다.
910단계에서 배경 영역 판단부(210)는 스캔라인에 대응하여 색상이 연속적으로 존재하는 픽셀의 개수를 확인한다. 예를 들어, 도 5의 (b)와 같이 스캔라인에 따라 연속적인 픽셀들이 존재하면 그 연속하는 픽셀들의 개수를 확인한다.
920단계에서 배경 영역 판단부(210)는 확인된 픽셀의 개수가 임계값보다 크거나 같은지 판단하여 크거가 같으면 930단계로 진행하고, 그렇지 않으면 910단계로 진행하여 계속적으로 연속적인 픽셀의 개수를 확인한다.
930단계에서 배경 영역 판단부(210)는 연속적인 픽셀의 개수가 임계값보다 크거나 같은 픽셀들을 하나의 픽셀 그룹으로 설정한다.
940단계에서 배경 영역 판단부(210)는 이진화 맵들 중 스캔 라인에 따라 설정된 픽셀 그룹의 개수가 가장 많은 이진화 맵을 배경 영역을 가지는 이진화 맵으로 선택한다.
이후 도 7의 740단계로 돌아와서, 문자 영역 추출부(220)는 선택한 이진화 맵의 배경 영역을 확장한 후 반전하여 문자 영역을 포함하는 영상을 생성한다. 이에 대해서 구체적으로 도 10을 참조하여 설명하면 다음과 같다.
도 10은 본 발명의 실시 예에 따라 문자 영역 추출부가 문자 영역을 포함하는 영상을 생성하는 과정을 나타내는 흐름도이다.
1000단계에서 문자 영역 추출부(220)는 선택된 이진화 맵을 미리 설정된 m*n 블록 단위로 스캔한다. 이때, m, n은 자연수이다.
1010단계에서 문자 영역 추출부(220)는 블록 내에 이진화 픽셀이 존재하는지 여부를 판단하여 이진화 픽셀이 존재하면 1020단계를 진행하고, 그렇지 않으면 1000단계로 진행하여 계속적으로 블록 단위 스캔을 수행한다.
1020단계에서 문자 영역 추출부(220)는 이진화 픽셀이 존재하는 m×n 블록 크기의 블록을 미리 설정된 M×N 블록 크기로 확장한다. 이때, M, N은 자연수이고, m, n보다 큰 값을 가진다.
1030단계에서 문자 영역 추출부(220)는 확장된 블록 내에서 이진화 픽셀 영역에 대응하는 원본 영상의 RGB 평균값을 산출한다. 이때, 문자 영역 추출부(220)는 원본 영상의 R 평균값, G 평균값, B 평균값을 각각 산출하거나 RGB 전체에 대한 평균값을 산출할 수도 있다.
1040단계에서 문자 영역 추출부(220)는 산출된 RGB 평균값과 m×n 블록 내에서 이진화 픽셀을 제외한 나머지 픽셀들 각각을 비교하여 산출된 RGB 평균값과 각 픽셀에 대한 RGB 값의 차이값을 산출한다.
1050단계에서 문자 영역 추출부(220)는 산출된 차이값이 미리 설정된 임계값보다 작거나 같은지 여부를 판단하여 임계값보다 작거나 같으면 1060단계로 진행하고, 그렇지 않으면 1040단계로 진행하여 계속적으로 산출된 RGB 평균값과 나머지 픽셀들에 대한 RGB 값의 차이값을 산출한다.
1060단계에서 문자 영역 추출부(220)는 임계값 이하의 차이값을 가지는 픽셀을 이진화 픽셀로 변환한다.
1070단계에서 문자 영역 추출부(220)는 m*n 블록내의 마지막 픽셀까지 이진화 픽셀 변환 동작을 완료했는지 확인하여 완료되면 1080단계로 진행하고, 그렇지 않으면 1040단계로 진행하여 계속적으로 산출된 RGB 평균값과 나머지 픽셀들에 대한 RGB 값의 차이값을 산출한 후 1050 단계, 1060 단계, 1070단계를 진행한다.
1080단계에서 문자 영역 추출부(220)는 이진화 픽셀 변환이 완료된 이진화 영상을 반전하여 문자 영역을 포함하는 영상을 생성한 후 영상 생성 동작을 완료한다.
이와 같이 본 발명은 문자 추출을 위한 이진화 맵에서 문자의 배경을 선택하여 이를 반전함으로써 좀 더 명확한 문자 영역을 추출할 수 있는 영상을 생성하게 된다.

Claims (12)

  1. 영상 생성 장치에 있어서,
    원본 영상이 입력되면 상기 원본 영상에서 문자 후보 영상을 생성하고, 상기 생성된 문자 후보 영상의 모든 픽셀에 대한 색상값의 차이를 산출한 후 상기 산출된 차이를 이용하여 상기 모든 픽셀에 대한 유사 색상별 픽셀 분류를 수행하고, 상기 문자 후보 영상 내에서 유사한 색상을 가지는 픽셀들의 집합으로 구성된 복수의 이진화 맵을 생성하는 이진화 맵 생성부와,
    상기 생성된 복수의 이진화 맵 중에서 배경 영역을 포함하는 이진화 맵을 선택하는 배경 영역 판단부와,
    상기 선택한 이진화 맵의 배경 영역을 확장하여 반전한 후 문자 영역을 포함하는 영상을 생성하는 문자 영역 추출부를 포함하는 것을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 장치.
  2. 제1항에 있어서, 상기 이진화 맵 생성부는,
    상기 원본 영상을 블록 단위로 분할하여 각 블록에 대한 RGB 색상 분산값을 산출하고, 상기 산출된 RGB 색상 분산값 중 적어도 하나의 RGB 색상 분산값이 미리 설정된 분산 임계값보다 크거나 같으면 상기 RGB 색상 분산값을 가지는 블록을 상기 원본 영상에서 제외시킨 상기 문자 후보 영상을 생성하는 것을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 장치.
  3. 제2항에 있어서, 상기 이진화 맵 생성부는,
    복수의 시드점 각각에 대응하는 색상과, 상기 색상이 가지는 RGB 값을 맵핑한 색상 테이블을 미리 생성하는 것을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 장치.
  4. 제3항에 있어서, 상기 이진화 맵 생성부는,
    상기 문자 후보 영상의 각 픽셀에 대한 RGB 값과 상기 복수의 시드점 각각에 대응하는 RGB 값의 차이값을 산출하고, 상기 산출된 차이값 중 산출된 차이값 중 가장 작은 차이값을 가지는 시드점에 상기 가장 작은 차이값을 산출하는데 이용된 RGB 값을 가지는 픽셀을 포함시켜 업데이트하는 것을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 장치.
  5. 제4항에 있어서, 상기 배경 영역 판단부는,
    상기 복수의 이진화 맵 각각을 미리 설정된 스캔 라인에 따라 스캔하고, 상기 스캔 라인에 대응하여 색상이 연속적으로 존재하는 픽셀의 개수를 확인하여 상기 확인된 픽셀의 개수가 임계값 이상이면 상기 연속적으로 존재하는 픽셀을 하나의 픽셀 그룹으로 설정한 후 상기 스캔 라인에 따라 설정된 픽셀 그룹의 개수가 가장 많은 이진화 맵을 상기 배경 영역을 포함하는 이진화 맵으로 선택하는 것을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 장치.
  6. 제5항에 있어서, 상기 문자 영역 추출부는,
    상기 선택된 이진화 맵을 미리 설정된 제1 크기의 블록 단위로 스캔하여 상기 스캔한 블록 내에 이진화 픽셀이 존재하면 상기 제1 크기의 블록을 미리 설정된 제2 크기로 확장하는 것을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 장치.
  7. 제6항에 있어서, 상기 문자 영역 추출부는,
    상기 확장된 제2 크기의 블록 내에서 이진화 픽셀 영역에 대응하는 상기 원본 영상의 RGB 평균값을 산출한 후 상기 산출된 RGB 평균값과 상기 제1 크기의 블록 내에서 이진화 픽셀을 제외한 나머지 각 픽셀에 대한 RGB 값의 차이값을 산출하여 상기 산출된 차이값이 임계값 이하면 상기 나머지 각 픽셀을 이진화 픽셀로 변환한 후 변환이 완료되면 상기 변환된 이진화 픽셀을 포함하는 이진화 픽셀 영역을 반전하는 것을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 장치.
  8. 영상 생성 방법에 있어서,
    원본 영상이 입력되면 상기 원본 영상에서 문자 후보 영상을 생성하는 과정과,
    상기 생성된 문자 후보 영상의 모든 픽셀에 대한 색상값의 차이를 산출하는 과정과,
    상기 산출된 차이를 이용하여 상기 모든 픽셀에 대한 유사 색상별 픽셀 분류를 수행하고, 상기 문자 후보 영상 내에서 유사한 색상을 가지는 픽셀들의 집합으로 구성된 복수의 이진화 맵을 생성하는 과정과,
    상기 생성된 복수의 이진화 맵 중에서 배경 영역을 포함하는 이진화 맵을 선택하는 과정과,
    상기 선택한 이진화 맵의 배경 영역을 확장하여 반전한 후 문자 영역을 포함하는 영상을 생성하는 과정을 포함함을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 방법.
  9. 제8항에 있어서, 상기 문자 후보 영상을 생성하는 과정은,
    상기 원본 영상을 블록 단위로 분할하여 각 블록에 대한 RGB 색상 분산값을 산출하는 과정과,
    상기 산출된 RGB 색상 분산값 중 적어도 하나의 RGB 색상 분산값이 미리 설정된 분산 임계값보다 크거나 같으면 상기 RGB 색상 분산값을 가지는 블록을 상기 원본 영상에서 제외시키는 과정을 포함함을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 방법.
  10. 제9항에 있어서, 복수의 이진화 맵을 생성하는 과정은,
    복수의 시드점 각각에 대응하는 색상과, 상기 색상이 가지는 RGB 값을 맵핑한 색상 테이블을 생성하는 과정과,
    상기 문자 후보 영상의 각 픽셀에 대한 RGB 값과 상기 복수의 시드점 각각에 대응하는 RGB 값의 차이값을 산출하는 과정과,
    상기 산출된 차이값 중 산출된 차이값 중 가장 작은 차이값을 가지는 시드점에 상기 가장 작은 차이값을 산출하는데 이용된 RGB 값을 가지는 픽셀을 포함시켜 업데이트하는 과정을 포함함을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 방법.
  11. 제10항에 있어서, 상기 배경 영역을 포함하는 이진화 맵을 선택하는 과정은,
    상기 복수의 이진화 맵 각각을 미리 설정된 스캔 라인에 따라 스캔하는 과정과,
    상기 스캔 라인에 대응하여 색상이 연속적으로 존재하는 픽셀의 개수를 확인하는 과정과,
    확인 결과, 상기 확인된 픽셀의 개수가 임계값 이상이면 상기 연속적으로 존재하는 픽셀을 하나의 픽셀 그룹으로 설정하는 과정과,
    상기 스캔 라인에 따라 설정된 픽셀 그룹의 개수가 가장 많은 이진화 맵을 상기 배경 영역을 포함하는 이진화 맵으로 선택하는 과정을 포함함을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 방법.
  12. 제11항에 있어서, 상기 문자 영역을 포함하는 영상을 생성하는 과정은,
    상기 선택된 이진화 맵을 미리 설정된 제1 크기의 블록 단위로 스캔하는 과정과,
    상기 스캔한 블록 내에 이진화 픽셀이 존재하면 상기 제1 크기의 블록을 미리 설정된 제2 크기로 확장하는 과정과,
    상기 확장된 제2 크기의 블록 내에서 이진화 픽셀 영역에 대응하는 상기 원본 영상의 RGB 평균값을 산출하는 과정과,
    상기 산출된 RGB 평균값과 상기 제1 크기의 블록 내에서 이진화 픽셀을 제외한 나머지 각 픽셀에 대한 RGB 값의 차이값을 산출하는 과정과,
    상기 산출된 차이값이 임계값 이하면 상기 나머지 각 픽셀을 이진화 픽셀로 변환하는 과정과,
    변환이 완료되면 상기 변환된 이진화 픽셀을 포함하는 이진화 픽셀 영역을 반전하는 과정을 포함함을 특징으로 하는 문자 영역을 추출하기 위한 영상을 생성하는 방법.
KR1020100014269A 2010-02-17 2010-02-17 문자 영역 추출을 위한 영상 생성 장치 및 방법 KR101169140B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020100014269A KR101169140B1 (ko) 2010-02-17 2010-02-17 문자 영역 추출을 위한 영상 생성 장치 및 방법
US13/015,194 US8355571B2 (en) 2010-02-17 2011-01-27 Apparatus and method for generating image for character region extraction

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100014269A KR101169140B1 (ko) 2010-02-17 2010-02-17 문자 영역 추출을 위한 영상 생성 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20110094709A KR20110094709A (ko) 2011-08-24
KR101169140B1 true KR101169140B1 (ko) 2012-07-30

Family

ID=44369685

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100014269A KR101169140B1 (ko) 2010-02-17 2010-02-17 문자 영역 추출을 위한 영상 생성 장치 및 방법

Country Status (2)

Country Link
US (1) US8355571B2 (ko)
KR (1) KR101169140B1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100974900B1 (ko) * 2008-11-04 2010-08-09 한국전자통신연구원 동적 임계값을 이용한 마커 인식 장치 및 방법
KR101169140B1 (ko) * 2010-02-17 2012-07-30 고려대학교 산학협력단 문자 영역 추출을 위한 영상 생성 장치 및 방법
KR20140043225A (ko) 2012-09-27 2014-04-08 한국전자통신연구원 기호 정보 제공 방법 및 장치
KR101992153B1 (ko) * 2012-11-13 2019-06-25 삼성전자주식회사 문서 영상 인식 방법, 장치 및 이를 이용한 사진 촬영 방법
US20150186341A1 (en) * 2013-12-26 2015-07-02 Joao Redol Automated unobtrusive scene sensitive information dynamic insertion into web-page image
EP3161727A4 (en) 2014-06-24 2018-02-14 Pic2go Ltd. Photo tagging system and method
ES2808054T3 (es) * 2014-11-21 2021-02-25 Rakuten Inc Dispositivo de procesamiento de información, método de procesamiento de información, y programa de procesamiento de información
CN107145883A (zh) * 2016-03-01 2017-09-08 夏普株式会社 文本检测方法和设备
EP3261018A1 (en) 2016-06-23 2017-12-27 Conti Temic microelectronic GmbH Device and method for object recognition of an input image for a vehicle
US10239763B1 (en) 2017-12-05 2019-03-26 Saudi Arabian Oil Company System for tail gas treatment of sulfur recovery units
CN108491847A (zh) * 2018-02-02 2018-09-04 口碑(上海)信息技术有限公司 用于扩充图像的方法以及装置
CN109740607B (zh) * 2018-12-26 2023-07-21 南京互连智能科技有限公司 字符图像的残缺区域检测和残缺字符图像恢复方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5617224A (en) * 1989-05-08 1997-04-01 Canon Kabushiki Kaisha Imae processing apparatus having mosaic processing feature that decreases image resolution without changing image size or the number of pixels
US5113252A (en) * 1989-05-10 1992-05-12 Canon Kabushiki Kaisha Image processing apparatus including means for performing electrical thinning and fattening processing
JP3062382B2 (ja) * 1993-12-09 2000-07-10 キヤノン株式会社 画像処理装置及び方法
JP3029533B2 (ja) * 1994-04-12 2000-04-04 シャープ株式会社 画像形成装置
KR100339691B1 (ko) 2001-11-03 2002-06-07 한탁돈 코드인식을 위한 장치 및 그 방법
KR100816794B1 (ko) 2003-12-26 2008-03-26 재단법인 포항산업과학연구원 컬러 영상 처리를 이용한 차량 번호판 인식 장치
KR101169140B1 (ko) * 2010-02-17 2012-07-30 고려대학교 산학협력단 문자 영역 추출을 위한 영상 생성 장치 및 방법

Also Published As

Publication number Publication date
US8355571B2 (en) 2013-01-15
KR20110094709A (ko) 2011-08-24
US20110200250A1 (en) 2011-08-18

Similar Documents

Publication Publication Date Title
KR101169140B1 (ko) 문자 영역 추출을 위한 영상 생성 장치 및 방법
CN107093172B (zh) 文字检测方法及系统
US7359568B2 (en) Image processing apparatus and image processing method
US7170647B2 (en) Document processing apparatus and method
KR101659091B1 (ko) 문자 콜라주 메시지 생성 장치 및 방법
JP2005228340A (ja) 画像解析装置、画像解析方法、及びブロブ識別装置
KR101549495B1 (ko) 문자 추출 장치 및 그 방법
CN103914509A (zh) 对打印文件进行认证的方法
US20130259383A1 (en) Image processing device that separates image into plural regions
WO2015002719A1 (en) Method of improving contrast for text extraction and recognition applications
JP2011248702A (ja) 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体
JP2013042413A (ja) 画像処理装置、画像処理方法及びコンピュータプログラム
CN104021385B (zh) 基于模板匹配及曲线拟合的视频字幕细化方法
KR101571681B1 (ko) 동질 영역을 이용한 문서 구조의 분석 방법
JP6294524B1 (ja) 画像処理方法、及びコンピュータプログラム
US20150288853A1 (en) Image processing apparatus, image processing method, and storage medium
US9153057B2 (en) Image processing apparatus that detects an ordinary character and a density reversed character
RU2013104245A (ru) Способ и система преобразования моментального снимка экрана в метафайл
JP4182891B2 (ja) 画像処理装置
JP6091400B2 (ja) 画像処理装置
JP6055952B1 (ja) 画像検査装置、画像検査方法、およびプログラム
JP2013178732A (ja) 画像処理装置及び画像処理方法
JP7138503B2 (ja) オブジェクト検出システム
JP2005175641A (ja) 画像処理装置
JP4631371B2 (ja) 画像処理装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150629

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170629

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190627

Year of fee payment: 8