KR100812347B1 - 스트록 필터를 이용한 문자 추출 방법 및 그 장치 - Google Patents

스트록 필터를 이용한 문자 추출 방법 및 그 장치 Download PDF

Info

Publication number
KR100812347B1
KR100812347B1 KR1020060055606A KR20060055606A KR100812347B1 KR 100812347 B1 KR100812347 B1 KR 100812347B1 KR 1020060055606 A KR1020060055606 A KR 1020060055606A KR 20060055606 A KR20060055606 A KR 20060055606A KR 100812347 B1 KR100812347 B1 KR 100812347B1
Authority
KR
South Korea
Prior art keywords
character
stroke
filter
dark
stroke filter
Prior art date
Application number
KR1020060055606A
Other languages
English (en)
Other versions
KR20070120830A (ko
Inventor
정철곤
리우치펑
김지연
문영수
김상균
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060055606A priority Critical patent/KR100812347B1/ko
Priority to US11/652,044 priority patent/US20070292027A1/en
Publication of KR20070120830A publication Critical patent/KR20070120830A/ko
Application granted granted Critical
Publication of KR100812347B1 publication Critical patent/KR100812347B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/40Analysis of texture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

본 발명은 스트록(stroke) 필터를 이용하여 영상에 포함된 자막을 추출하는 스트록 필터를 이용한 문자 추출 방법 및 그 장치에 관한 것이다. 본 발명의 일 실시예에 따른 문자 추출 방법은, 스트록 필터를 이용한 필터링 단계, 상기 스트록 필터 응답치을 이용한 문자의 컬러 극성 결정 단계, 상기 스트록 필터의 응답치에 대한 이진화 단계, 및 상기 이진화에 의한 이진화 영역을 이용한 국소영역 확장 단계를 포함하는 것을 특징으로 한다. 따라서, 스트록의 응답치를 이용하여 문자의 컬러 특성을 결정하므로 컬러 극성 결정에 대한 정확도를 높일 수 있을 뿐만 아니라, 문자의 스트록 특징을 이용해 문자영역을 추출함으로서 추출성능을 높이는 효과가 있다.
스트록, 스트록 필터, 문자 추출, 영상, 이진화

Description

스트록 필터를 이용한 문자 추출 방법 및 그 장치{METHOD FOR DETECTING TEXT USING STROKE FILTER AND APPARATUS USING THE SAME}
도 1은 본 발명에서 사용된 스트록 필터에 대한 일 실시예를 나타낸 도이다.
도 2는 본 발명 문자 추출 방법에 대한 일 실시예를 보인 흐름도이다.
도 3은 도 2에 도시한 S220 단계를 설명하기 위한 일 예시도이다.
도 4는 도 2에 도시한 S240 단계에 대한 상세 흐름도이다.
도 5는 도 4를 설명하기 위한 일 예시도이다.
도 6은 문자 배경과 문자 컬러 극성이 유사한 경우의 원영상(a), 종래 방법(b), 본 발명(c)에 대한 문자 추출 결과에 대한 일 예시도이다.
도 7은 문자 배경에 문자 컬러 극성과 유사한 부분이 포함된 경우의 원영상(a), 종래 방법(b), 본 발명(c)에 대한 문자 추출 결과에 대한 일 예시도이다.
도 8은 본 발명에 대한 문자 추출 결과에 대한 또 다른 일 예시도이다.
도 9는 본 발명 문자 추출 장치에 대한 일 실시예를 보인 블록도이다.
도 10은 도 9에 도시한 국소 영역 확장부에 대한 상세 블록도이다.
<도면의 주요 부분에 대한 부호의 설명>
910: 스트록 필터부 920: 문자 컬러 극성 결정부
930: 이진화 수행부 940: 국소영역 확장부
1010: 확률 밀도 계산부 1020: 윈도우 선택부
1030: 문자영역 확장부 1040: 영역 확장 종료 판단부
본 발명은 문자 추출 방법 및 그 장치에 관한 것으로, 더욱 상세하게는 스트록(stroke) 필터를 이용하여 영상에 포함된 자막을 추출하는 스트록 필터를 이용한 문자 추출 방법 및 그 장치에 관한 것이다.
동영상에서 비디오 자막문자는 의미수준의 중요 내용 정보를 제공하기 때문에 동영상 요약 및 검색 서비스를 구현하기 위한 중요한 영상 정보이다. 이런 동영상에 포함된 자막문자는 예를 들어, 뉴스 기사에서 일정 테마의 기사나 야구와 같은 스포츠 경기에서 주요 장면을 쉽고 빠르게 재생, 편집할 수 있도록 하기 위하여 이용할 수 있다. 또한, 동영상에서 검출한 자막을 이용하여 PVR(Personal Video Recorder)이나 와이브로(WiBro) 단말, DMB 폰 등에서 맞춤형 방송 서비스가 실현될 수 있다.
동영상에서 중요한 영상 정보인 자막문자를 제공하기 위해서는 영상의 배경으로부터 자막문자를 추출해야 하는데, 종래 영상에서 문자를 배경으로부터 추출하는 방법은 임계값에 의한 방법, 클러스터 기반 방법, OCR(광학 문자 판독기: Optical Character Reader) 인식에 의한 방법으로 분류된다.
임계값에 의한 방법은 대표적인 방법은 1979년, otsu에 의해 제안된 방 법(Otsu79)으로, 이 방법은 배경과 문자영역의 밝기 값 분포에 대한 분산치를 최대화 시키는 값을 임계값으로 선택하는 방법이다.
임계값에 의한 방법은 문자영역과 배경영역의 밝기 차이가 현저한 경우에 이상적인 반면, 문자영역이 위치한 영역에 있는 배경영역의 밝기가 문자영역의 밝기와 비슷한 경우 문자를 추출하기 어려운 단점이 있다.
클러스터링 방법은 1996년, Lienhart에 의해 제안된 방법(Lienhart96)으로, 컬러 값의 개수를 줄여 후보영역을 생성한 후, 크기 등의 제한 조건에 의한 영역 필터링을 통해 문자영역을 추출하는 방법이다.
이때, 문자 영역은 유사한 컬러 값을 가진다는 가정에 의해 결정 된다. 따라서 임계값에 의한 방법과 마찬가지로 문자영역과 배경영역의 밝기 차이가 현저한 경우에 이상적인 반면, 배경에 문자영역과 유사한 컬러를 가지는 영역이 나타날 경우 문자를 추출하기 어려운 단점이 있다.
또한, Otsu79와 Lienhart96의 두 방법은 공통적으로 문자영역의 컬러에 대한 극성을 고려하지 않으므로 극성을 결정해 주는 과정이 포함되어야 한다.
광학문자판독기 인식에 의한 방법은 D. Chen에 의해 제안된 방법(Chen04)으로, 여러 개의 임계값을 설정하여 문자영역을 추출한 후 광학문자판독기를 이용한 각 영역에 대해 인식을 수행하여 인식결과 값이 가장 높은 경우를 문자영역 추출결과로 결정하는 방법이다.
광학문자판독기 인식에 의한 방법은 문자영역의 컬러 극성을 함께 얻어낼 수 있는 장점이 있는 반면, 다양한 경우에 대하여 문자인식을 수행하기 때문에 처리시 간이 많이 걸리는 단점이 있다.
본 발명은 상술한 바와 같은 종래기술의 문제점을 해결하기 위해 안출된 것으로서, 스트록 필터를 이용하여 비디오에서 검출된 자막 문자 영역을 더 정확하고 빠르게 추출할 수 있는 문자 추출 방법 및 그 장치를 제공하는 것을 목적으로 한다.
또한, 본 발명은 문자를 이루는 특징인 스트록의 응답치를 이용하여 문자의 컬러 극성을 결정함으로써 문자 컬러 극성에 대한 정확도를 높이는 것을 목적으로 한다.
또한, 본 발명은 스트록 필터를 이용하여 비 스트록 성 배경 영역을 제거함으로써 문자 영역의 추출 성능을 높이는 것을 목적으로 한다.
또한, 본 발명은 문자 검출 시 사용된 스트록 필터의 응답치를 사용함으로써 처리시간을 단축시키는 것을 목적으로 한다.
상기의 목적을 달성하고 종래기술의 문제점을 해결하기 위하여, 본 발명의 문자 추출 방법은, 스트록 필터를 이용한 문자 영역의 필터링 단계, 상기 스트록 필터 응답치를 이용한 문자의 컬러 극성 결정 단계, 상기 스트록 필터의 응답치에 대한 이진화 단계, 및 상기 이진화에 의한 이진화 영역을 이용한 국소영역 확장 단계를 포함하는 것을 특징으로 한다.
이때, 상기 문자 추출 방법은 상기 영역이 확장된 이진화 결과를 광학 문자 판독기에 입력하는 단계 및 상기 광학 문자 판독기에 의한 인식값이 기 결정된 값보다 낮은 경우 상기 이진화 단계로 피드백하는 단계를 더 포함할 수 있다.
이때, 상기 이진화 단계로 피드백하는 단계는 상기 문자 판독기에 의한 인식값이 기 결정된 값보다 낮은 경우 상기 결정된 극성의 반대 극성으로 전환한 후 상기 이진화 단계로 피드백할 수 있다.
이때, 상기 필터링은 밝은(bright) 스트록 필터링과 어두운(dark) 스트록 필터링 모두 수행될 수 있다.
이때, 상기 문자의 컬러 극성은 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율에 의해 결정될 수 있다.
이때, 상기 밝은 스트록 필터와 어두운 스트록 필터 응답치는 아래의 수학식 1, 2로 각각 표현될 수 있다.
[수학식 1]
Figure 112006043345111-pat00001
[수학식 2]
Figure 112006043345111-pat00002
(RB, RD는 밝은 스트록 필터와 어두운 스트록 필터의 응답치, α는 스트록 필터의 기울어진 각도, d는 제1필터의 세로폭, m1, m2, m3는 제1 필터, 제2 필터, 제3 필터 각각에 포함된 픽셀들의 픽셀값에 대한 평균)
이때, 상기 문자의 컬러 극성은 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율 및 이진화한 영상에서 밝은 교차점들과 어두운 교차점들의 개수 비율에 의해 결정될 수 있다.
이때, 상기 국소영역 확장 단계는 상기 문자 영역 농도의 확률 밀도 함수를 계산하는 단계, 상기 문자로 판별된 기 결정된 개수의 픽셀을 갖는 윈도우를 선택하는 단계, 상기 윈도우 내의 비문자 영역으로 판별된 각 픽셀의 확률이 기 결정된 값 T1보다 크고, 이웃 픽셀과의 농도 차이가 기 결정된 값 T2보다 작은 경우 영역 확장을 수행하는 단계, 및 상기 픽셀의 라벨 변화가 없을 때까지 상기 윈도우를 선택하는 단계로 피드백하는 단계를 더 포함할 수 있다.
또한, 본 발명의 일 실시예에 따른 문자 추출 장치는 스트록 필터를 이용하여 문자 영역을 필터링하는 스트록 필터부, 상기 스트록 필터부의 응답치를 이용하여 문자의 컬러 극성을 결정하는 문자 컬러 극성 결정부, 상기 스트록 필터부의 응답치에 대한 이진화를 수행하는 이진화 수행부, 및 상기 이진화 수행부의 이진화에 의한 이진화 영역을 이용하여 국소영역을 확장하고, 그 결과를 광학 문자 판독기로 출력하는 국소영역 확장부를 포함한 것을 특징으로 한다.
이때, 상기 스트록 필터부는 밝은(bright) 스트록 필터링과 어두운(dark) 스트록 필터링 모두 수행할 수 있다.
이때, 상기 문자 컬러 극성 결정부는 상기 스트록 필터부에서 수행된 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율을 이용하여 결정할 수 있다.
이때, 상기 문자 컬러 극성 결정부는 상기 스트록 필터부에서 수행된 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율 및 이진화한 영상에서 밝은 교차점들과 어두운 교차점들의 개수 비율을 이용하여 결정할 수 있다.
이때, 상기 국소영역 확장부는 상기 문자 영역 농도의 확률 밀도 함수를 계산하는 확률 밀도 계산부, 상기 문자로 판별된 기 결정된 개수의 픽셀을 갖는 윈도우를 선택하는 윈도우 선택부, 상기 윈도우 내의 비문자 영역으로 판별된 각 픽셀의 확률이 기 결정된 값 T1보다 크고, 이웃 픽셀과의 농도 차이가 기 결정된 값 T2보다 작은 경우 영역 확장을 수행하는 문자 영역 확장부, 및 상기 픽셀의 라벨 변화를 판단하여 상기 픽셀의 라벨 변화가 없을 때까지 상기 윈도우 선택부로 피드백하고, 상기 픽셀의 라벨 변화가 없는 경우 국소 영역이 확장된 상기 문자 영역을 상기 문자 판독기로 출력하는 영역 확장 종료 판단부를 더 포함할 수 있다.
비디오에서 자막을 검출하는 과정은 비디오 영상으로부터 문자 영역의 위치를 추출하는 과정(Localization), 추출된 문자 영역의 위치에서 배경을 제거하는 과정(Binarization), 배경이 제거된 문자를 인식하는 과정(Recognition)으로 이루어진다.
본 발명은 상기 과정 중 추출된 문자 영역의 위치에서 배경을 제거하는 과정(Binarization)에 대한 것으로, 스트록 필터에 의한 스트록 필터 응답치를 이용하여 문자 영역 위치에서 배경을 정확하게 제거하여 문자 인식률을 높이고, 처리 시간을 줄이는 것을 그 요지로 한다. 따라서, 상기 자막 검출 과정 중 영상으로부터 문자 영역의 위치를 추출하는 과정(Localization)과 배경이 제거된 문자를 인식하는 과정(Recognition)은 본 발명의 요지를 흩트릴 수 있기 때문에 설명하지 않는 다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
먼저, 본 발명에서 사용된 스트록 필터는 본 발명에 대한 동일 발명자가 2005년에 출원한 출원번호 제2005-111432호에 자세하게 기술되어 있다. 따라서, 본 발명에서는 스트록 필터에 대해 간략히 설명한다.
도 1은 본 발명에 사용된 스트록 필터에 대한 일 예를 나타낸 도이다.
도 1을 참조하면, 스트록 필터는 직사각형 모양을 갖는 제1 필터(①), 제2 필터(②) 및 제3 필터(③)로 구성된 것으로, 제1 필터, 제2 필터 및 제3 필터를 이용하여 문자의 획(stroke)을 검출한다.
제1 필터(①)의 세로폭을 d라 할 때, 제2 필터(②) 및 제3 필터(③)의 세로폭(d1)은 제1 필터(①)의 세로폭의 1/2에 해당한다. 또한, 제1 필터(①)와 제2 필터(②)의 이격된 거리(d2)도 제1 필터(①)의 세로폭의 1/2에 해당하고, 제1 필터(①)와 제3 필터(③)의 이격된 거리도 제1 필터(①)의 세로폭의 1/2에 해당한다. 다만, 이러한 조건은 일 예에 지나지 않는 것으로 다양한 크기의 필터가 구성될 수 있다.
스트록 필터는 필터의 각도(α)를 변화시키면서 문자 스트록들을 검출하는데, 예를 들어, 스트록 필터의 각도를 0[도], 45[도], 90[도] 및 135[도]로 각각 회전시키면서 그 때마다 스트록 필터에 포함되는 픽셀들의 픽셀값들로부터 스트록들을 검출한다.
도 2는 도 1에 도시한 스트록 필터를 이용한 본 발명에 따른 문자 추출 방법에 대한 일 실시예 흐름도를 보인 것이다.
도 2를 참조하면, 문자 영역의 영상을 밝고(bright), 어두운(dark) 스트록 필터를 이용하여 필터링하는 단계(S210), 영상의 문자 컬러 극성을 결정하는 단계(S220), 스트록 필터의 응답치에 대한 이진화 단계(S230), 국소 영역 확장 단계(S240), 및 OCR에 의한 인식을 통한 결과 출력 단계(S250, S260)로 이루어지고, 상기 OCR에 의한 인식 시 인식 스코어가 기 결정된 값보다 낮은 경우 반대 극성의 문자 컬러로 전환하여 상기 이진화 단계로 피드백하는 단계(S270)를 더 포함한다.
여기서, Bright 스트록 필터링과 dark 스트록 필터링을 수행하는 문자 영역의 영상은 Localization 과정에 의해 추출된 영상의 문자 영역이다.
상기 단계들을 포함하는 본 발명에 따른 문자 추출 방법에 대한 동작을 설명하면 다음과 같다.
먼저, S210 단계는 Localization 과정에 의해 추출된 문자 영역의 영상을 입력받아 bright 스트록 필터링 및 dark 스트록 필터링을 수행하여 각 필터링에 의한 응답치를 얻는다.
이때, bright 스트록 필터링 및 dark 스트록 필터링에 의한 응답치는 수학식 1과 수학식 2로 각각 표현된다.
Figure 112006043345111-pat00003
Figure 112006043345111-pat00004
여기서, RB, RD는 bright 스트록 필터와 dark 스트록 필터의 응답치를 의미하고, α는 스트록 필터의 기울어진 각도를 의미하고, d는 제1필터의 세로폭을 의미하고, m1, m2, m3는 도1에 도시한 제1 필터, 제2 필터, 제3 필터 각각에 포함된 픽셀들의 픽셀값에 대한 평균을 의미한다.
그 다음, 영상의 문자 컬러 극성을 결정하는 S220 단계는 문자가 bright 또는 dark한 컬러 극성을 가지는데, 이런 문자의 컬러 극성을 결정하는 단계로서, 문자의 배경과 문자의 극성에 따라 두 가지 방법에 의해 결정될 수 있다.
(1) 문자 배경과 문자의 극성이 서로 다른 경우에 적용할 수 있는 방법으로, bright 스트록 필터의 응답치(RB)와 dark 스트록 필터의 응답치(RD)의 비율(FR)로 문자의 컬러 극성을 결정하는 방법이다. 따라서, 비율(FR)은 수학식 3으로 표현된다.
Figure 112006043345111-pat00005
수학식 3에서 알 수 있듯이, 문자의 극성이 밝은 경우 RB가 RD에 비해 많이 크기 때문에 "FR≫1"이고, 문자의 극성이 어두운 경우 RB가 RD에 비해 많이 작기 때 문에 "FR≪1"게 된다. 따라서, 배경과 문자의 컬러 극성이 다른 경우일 때는 FR 값만을 이용하여 문자의 컬러 극성을 결정할 수 있다.
(2) 문자 배경과 문자의 극성이 유사한 경우에 적용할 수 있는 방법으로, 문자의 배경과 문자의 극성이 유사한 경우에는 FR 값이 문자의 극성이 밝거나 또는 어두운 경우 두 가지 경우 모두에 대해 "1"에 가까운 값으로 나타나기 때문에 FR 값뿐 아니라 이진화한 영상에서의 교차점들의 개수 비율을 이용하는 방법이다.
여기서, 이진화한 영상에서의 밝은 교차점들의 개수(NB)와 어두운 교차점들의 개수(ND) 비율(FE)은 수학식 4로 표현된다.
Figure 112006043345111-pat00006
수학식 4에서 알 수 있듯이, 문자 배경과 문자의 극성이 밝은 경우 NB가 ND에 비해 작기 때문에 "FE<1"이고, 문자 배경과 문자의 극성이 어두운 경우 NB가 ND에 비해 많이 크기 때문에 "FE>1"게 된다. 따라서, 배경과 문자의 컬러 극성이 유사한 경우일 때는 FR 값과 FE 값 둘 다 이용하여 문자의 컬러 극성을 결정할 수 있다. 즉, FR 값이 "1"에 가까운 경우 FE 값이 1보다 작으면 문자의 컬러 극성이 밝고, FE 값이 1보다 크면 문자의 컬러 극성이 어두운 것으로 결정할 수 있는데, 도 3 을 예로 설명하면 다음과 같다.
도 3은 문자 영역에 대한 원 영상(a)과 어두운 스트록 필터에 의해 필터링된 응답 영상(b)과 밝은 스트록 필터에 의해 필터링된 응답 영상(c)을 나타낸 도면이다.
도 3a의 원 영상을 통해 Localization 과정에서 추출된 문자 영역의 영상은 배경과 문자가 모두 밝은 극성을 갖는 것을 알 수 있고, 도 3b와 도 3c의 영상을 통해 이진화한 영상에서 문자 영역의 세로 1/3과 2/3 부분에서 교차점들의 개수를 확인할 수 있다. 즉, 도 3b와 도 3c에 의해 어두운 스트록 필터에 의해 필터링된 영상에서의 교차점들의 개수인 ND가 밝은 스트록 필터에 의해 필터링된 영상에서의 교차점들의 개수인 NB보다 많고, 따라서, FE가 1보다 작게 되어 원 영상의 문자 극성이 밝다는 것을 알 수 있다.
상기 컬러 극성을 결정하기 위한 두 가지 방법의 문자 배경과 문자의 컬러 극성에 따른 측정값을 표 1에 도시한다.
Figure 112006043345111-pat00007
여기서, BonD는 어두운 배경에서 밝은 문자가 존재하는 영상이고, DonB는 밝은 배경에서 어두운 문자가 존재하는 영상이고, BonB는 밝은 배경에서 밝은 문자가 존재하는 영상이고, DonD는 어두운 배경에서 어두운 문자가 존재하는 영상이다.
표 1을 통해 본 발명에서 문자의 컬러 극성을 결정하는 일 예를 네 가지로 표현할 수 있다.
첫째, FR이 1.1보다 크면(FR>1.1) 문자의 컬러 극성은 밝다.
둘째, FR이 0.9보다 작으면(FR<0.9) 문자의 컬러 극성은 어둡다.
셋째, FR이 0.9보다 크거나 같고 1.1보다 작거나 같으며(0.9≤FR≤1.1), FE가 1보다 작거나 같으면(FE≤1) 문자의 컬러 극성은 밝다.
넷째, FR이 0.9보다 크거나 같고 1.1보다 작거나 같으며(0.9≤FR≤1.1), FE가 1보다 크면(FE>1) 문자의 컬러 극성은 어둡다.
이때, 문자의 컬러 극성을 결정하는데 사용된 값들(0.9, 1.1)은 고정된 값이 아니며 상황에 따라 바뀔 수 있다는 것은 자명하다.
S220 단계에서 문자 컬러 극성이 결정되면, 그 다음 S230 단계에서 스트록 필터의 응답치에 대한 이진화 과정을 임계값을 이용하여 수행하고, 이 단계에 의한 이진화 영역은 그 다음 단계인 국소 확장 영역 단계를 수행하기 위한 초기 씨드(seed) 영역으로 사용된다. 이때, 상기 임계값은 설계자에 의해 결정될 수 있다는 것은 자명하다.
그 다음, S240 단계에서 이진화 단계에 의한 이진화 영역을 이용하여 국소 영역을 확장한다.
S240 단계인 국소 영역 확장 단계를 도 4를 통해 상세히 설명한다.
도 4는 도 2에 도시한 국소 영역 확장 단계인 S240 단계에 대한 상세 흐름도를 나타낸 도면이다.
도 4를 참조하면, 국소 영역 확장 단계는 이진화된 스트록 영상과 원 영상을 이용하여 문자 영역 농도의 확률 밀도 함수(PDF)를 계산하는 단계(S410), 문자로 판별된 픽셀의 개수가 4~8개인 윈도우를 선택하여 윈도우 내 비문자 영역의 픽셀들의 영역 확장 여부를 판단하는 단계(S420~S440), 영역 확장 조건에 맞는 경우 윈도우 내의 해당 픽셀을 문자 영역으로 확장하는 단계(S460), 픽셀의 라벨(label) 변화가 없을 때까지 단계 S430~S470을 반복 수행하는 단계(S470), 및 픽셀의 라벨 변화가 없는 경우 국소영역이 확장된 문자 영역을 광학문자판독기로 출력하는 단계(S480)로 이루어진다.
이때, 윈도우 내의 비문자 영역으로 판별된 픽셀들의 영역 확장 조건은 각 픽셀의 확률 Pr(s)가 기 결정된 값 T1보다 크고, 이웃 문자 픽셀과의 농도(intensity) 차이가 기 결정된 값 T2보다 작은 경우로서, T1과 T2는 각각 0.75와 15이고, 상황에 따라 T1과 T2값이 변할 수 있는 것은 자명하다. 해당 픽셀의 확률 Pr (s)는 [수학식 5]와 같이 계산된 확률 밀도 함수 PDF (s)를 이용하여 알 수 있다. 여기서 s는 픽셀의 농도(intensity) 이다.
Pr (s)= PDF (s)
도 4에 도시한 국소 영역 확장 단계를 도 5에 도시한 일 실시예를 참조하여 상세히 설명한다.
S410 단계에서 도 5a에 도시한 문자 영역의 이진화된 스트록 영상과 원 영상을 입력받아 문자 영역 농도의 확률 밀도 함수를 계산한다.
그 다음, S420 단계에서 기 결정된 개수(여기서, 9개)의 픽셀을 갖는 윈도우를 선택하고, S430 단계에서 해당 윈도우에서 문자로 판별된 픽셀의 개수가 4~8개인지 판단한다.
그 다음, S430 단계의 판단 결과, 윈도우에 문자로 판별된 픽셀의 개수가 4~8개인 경우 S440 단계부터 S470 단계를 수행하고, 그렇지 않은 경우 S470 단계를 수행한다.
윈도우에 문자로 판별된 픽셀의 개수가 4~8개인 경우, 예를 들어 도 5b에 도시한 일 예와 같이 문자로 판별된 픽셀의 개수가 5개인 경우 S440 단계에서 비문자 영역으로 판별된 픽셀들에 대한 영역 확장 여부를 판단한다. 예를 들어, 도 5b에 도시한 윈도우의 6번째 픽셀에 대하여 문자 영역으로의 확장 여부를 판단하는데, S450 단계에서 해당 픽셀에 대한 확률 Pr(s)가 T1값보다 크고, 이웃 문자 픽셀(5번째 픽셀)과의 농도 차이가 T2값보다 작은 경우 도 5c에 도시한 것과 같이 6번째 픽셀을 문자 영역으로 확장한다.
영역 확장하는 과정이 문자 영역의 모든 윈도우에 대해 수행되고, S470 단계에서 픽셀의 라벨 변화가 더 이상 발생하지 않으면 S480 단계인 국소 영역이 모두 확장된 문자 영역(도 5d)을 광학문자판독기로 출력한다.
이런 일련의 과정을 통해 S240 단계인 국소 영역 확장 과정이 이루어지면, S250 단계에서 국소 영역이 확장된 문자 영역을 광학문자판독기로 출력하여 인식 과정을 수행한다.
그 다음, S260 단계에서 광학문자판독기 인식에 의한 문자 영역의 스코어가 충분히 높은 경우에는 해당 결과를 출력하고, 인식 스코어가 낮은 경우에는 S270 단계를 수행한다. 여기서, 인식 스코어의 높고 낮음은 기 결정된 소정의 값을 기준으로 비교한다.
S260 단계의 판단 결과, 인식 스코어가 낮은 경우 S270 단계인 문자 컬러를 반대 극성으로 전환하고, S230 단계로 피드백한다. 즉, S220 단계에서 결정된 문자 컬러 극성과 반대되는 컬러 극성으로 전환한 후 S230 단계부터 S260 단계까지 반복 수행한다.
상기 과정을 통해 본 발명은 실험 결과 97.4[%]의 높은 컬러 극성 결정 정확도와 우수한 문자 추출 결과를 갖는다.
도 6과 도 7은 본 발명을 이용한 문자추출 결과에 대한 일 예들을 보인 것으로, 컬러 극성 결정이 어려운 영상(도 6)과 문자 영역의 컬러 극성과 유사한 배경 영역이 포함된 영상(도 7)을 보인 것이다. 이때, 각 도는 원영상(a), 종래 방법인 임계값 또는 클러스터링 방법에 의한 문자 추출 결과(b), 및 본 발명에 따른 문자 추출 결과(c)를 나타낸다.
도 6에서 알 수 있듯이, 원 영상(a)이 문자 배경과 문자의 컬러 극성이 유사하여 컬러 극성 결정이 어려운 경우 종래 방법을 이용한 문자 추출 결과(b)는 문자를 추출하지 못한 반면, 본 발명에 따른 문자 추출 결과(c)는 원 영상의 문자인 " 매장지역"을 추출한 것을 알 수 있다.
또한, 도 7에서 알 수 있듯이, 원영상(a)에 문자 영역의 컬러 극성과 유사한 배경 영역이 존재하는 경우 종래 방법을 이용한 문자 추출 결과(b)는 배경의 일부 영역(A)을 문자와 함께 추출하여 잘못된 추출 결과를 얻는 반면, 본 발명에 따른 문자 추출 결과(c)는 문자 영역의 컬러 극성과 유사한 배경 영역까지 제거되어 원하는 문자 영역만을 정확하게 추출하는 것을 알 수 있다.
도 8 또한 본 발명에 따른 문자 추출 결과에 대한 일 예를 보인 것으로, 영상 화면에 포함된 문자가 정확하게 추출된 것을 알 수 있다.
즉, Localization 과정에 의해 검출된 문자 영역을 본 발명에 따른 문자 추출 과정인 스트록 필터를 이용한 응답치를 이용하여 문자 컬러 극성을 결정하고, 원영상을 이진화 영상으로 전환한 후 국소 확장 함으로써, 원영상으로부터 정확한 문자 영역이 추출된다.
도 9는 본 발명에 따른 문자 추출 장치에 대한 일 실시예를 나타낸 블록도이다.
도 9를 참조하면, 문자 추출 장치는 스트록 필터부(910), 문자 컬러 극성 결정부(920), 이진화 수행부(930), 국소 영역 확장부(940)로 구성된다.
스트록 필터부(910)는 입력된 문자 영역의 원영상을 스트록 필터를 이용하여 필터링한다. 이때, 스트록 필터부는 밝고, 어두운 스트록 필터링을 모두 수행하고 이에 대한 응답치를 출력한다.
문자 컬러 극성 결정부(920)는 스트록 필터부(910)의 응답치를 이용하여 문 자의 컬러 극성을 결정한다. 이때, 문자 컬러 극성은 스트록 필터부(910)에서 수행된 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율을 이용하여 결정하는데, 그 비율이 1보다 크면 문자의 컬러 극성을 밝은 것으로 결정하고, 1보다 작으면 문자의 컬러 극성을 어두운 것으로 결정한다.
이때, 문자 컬러 극성은 스트록 필터부(910)에서 수행된 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율 및 이진화한 영상에서 밝은 교차점들과 어두운 교차점들의 개수 비율을 이용하여 결정하는데, 응답치의 비율이 0.9와 1.1 사이인 경우 개수 비율이 1보다 작거나 같으면 문자의 컬러 극성을 밝은 것으로 결정하고, 개수 비율이 1보다 크면 문자의 컬러 극성을 어두운 것으로 결정한다.
이진화 수행부(930)는 스트록 필터부(910)의 응답치에 대한 문자 영역의 이진화를 수행한다. 이때, 이진화는 단순 임계값을 기준으로 수행된다.
국소영역 확장부(940)는 이진화 수행부의 이진화에 의한 이진화 영역을 이용하여 국소영역을 확장하고, 그 결과를 광학문자판독기로 출력하여 광학문자판독기에서 추출된 문자 영역의 인식 과정을 수행한다.
도 10은 도 9에 도시한 국소영역 확장부의 상세 구성을 보인 블록도이다.
도 10을 참조하면, 국소영역 확장부(940)는 확률밀도 계산부(1010), 윈도우 선택부(1020), 문자영역 확장부(1030), 영역 확장 종료 판단부(1040)로 구성된다.
확률밀도 계산부(1010)는 이진화된 스트록 영상과 원영상을 이용하여 문자 영역 농도의 확률 밀도 함수(PDF)를 계산한다.
윈도우 선택부(1020)는 문자로 판별된 기 결정된 개수(예를 들어, 9개)의 픽 셀을 갖는 윈도우를 선택한다.
문자영역 확장부(1030)는 윈도우 선택부(1020)에서 선택된 윈도우 내의 비문자 영역으로 판별된 각 픽셀의 확률 P(s)가 기 결정된 값 T1(예를 들어, 0.75)보다 크고, 이웃 픽셀과의 농도 차이가 기 결정된 값 T2(예를 들어, 15)보다 작은 경우 영역 확장을 수행한다.
영역 확장 종료 판단부(1040)는 이진화된 스트록 영상의 픽셀 라벨 변화를 판단하여 픽셀의 라벨 변화가 있는 경우 윈도우 선택부(1040)로 피드백하고, 픽셀의 라벨 변화가 없는 경우 국소 영역이 확장된 문자 영역을 광학문자판독기로 출력한다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
본 발명의 스트록 필터를 이용한 문자 추출 방법 및 그 장치는, 스트록의 응답치를 이용하여 문자의 컬러 특성을 결정하므로 컬러 극성 결정에 대한 정확도를 높일 수 있는 효과가 있다.
또한, 본 발명은 스트록 필터에 의한 비 스트록성 배경 영역이 제거됨으로 써, 문자 영역의 추출 성능을 향상시킬 수 있는 효과가 있다.
또한, 본 발명은 문자 검출 시 사용되었던 스트록 필터의 응답치를 사용하기 때문에 계산량을 줄여 문자 추출 시간에 걸리는 처리 시간을 줄일 수 있는 효과가 있다.
또한, 본 발명은 스트록에 의해 문자 추출을 수행하기 때문에 문자 배경의 컬러 극성이 문자의 컬러 극성과 유사한 경우에도 강건한 특성을 갖는 효과가 있다.

Claims (23)

  1. 스트록 필터를 이용한 문자 영역의 필터링 단계;
    상기 스트록 필터 응답치를 이용한 문자의 컬러 극성 결정 단계;
    상기 스트록 필터의 응답치에 대한 이진화 단계; 및
    상기 이진화에 의한 이진화 영역을 이용한 국소영역 확장 단계
    를 포함하는 것을 특징으로 하는 문자 추출 방법.
  2. 제1항에 있어서,
    상기 문자 추출 방법은
    상기 영역이 확장된 이진화 결과를 문자 판독기에 입력하는 단계; 및
    상기 광학 문자 판독기에 의한 인식값이 기 결정된 값보다 낮은 경우 상기 이진화 단계로 피드백하는 단계
    를 더 포함하는 것을 특징으로 하는 문자 추출 방법.
  3. 제2항에 있어서,
    상기 이진화 단계로 피드백하는 단계는
    상기 광학 문자 판독기에 의한 인식값이 기 결정된 값보다 낮은 경우 상기 결정된 극성의 반대 극성으로 전환한 후 상기 이진화 단계로 피드백하는 것을 특징으로 하는 문자 추출 방법.
  4. 제1항에 있어서,
    상기 필터링은
    밝은(bright) 스트록 필터링과 어두운(dark) 스트록 필터링 모두 수행되는 것을 특징으로 하는 문자 추출 방법.
  5. 제1항에 있어서,
    상기 문자의 컬러 극성은
    밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율에 의해 결정되는 것을 특징으로 하는 문자 추출 방법.
  6. 제5항에 있어서,
    상기 밝은 스트록 필터와 어두운 스트록 필터 응답치는
    아래의 수학식 1, 2로 각각 표현되는 것을 특징으로 하는 문자 추출 방법.
    [수학식 1]
    Figure 112006043345111-pat00008
    [수학식 2]
    Figure 112006043345111-pat00009
    (RB, RD는 밝은 스트록 필터와 어두운 스트록 필터의 응답치, α는 스트록 필터의 기울어진 각도, d는 제1필터의 세로폭, m1, m2, m3는 제1필터, 제2필터, 제3필터 각각에 포함된 픽셀들의 픽셀값에 대한 평균)
  7. 제5항에 있어서,
    상기 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율이 1보다 크면 상기 문자의 컬러 극성이 밝고, 1보다 작으면 상기 문자의 컬러 극성이 어두운 것을 특징으로 하는 문자 추출 방법.
  8. 제1항에 있어서,
    상기 문자의 컬러 극성은
    밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율 및 이진화한 영상에서 밝은 교차점들과 어두운 교차점들의 개수 비율에 의해 결정되는 것을 특징으로 하는 문자 추출 방법.
  9. 제8항에 있어서,
    상기 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율이 기 설정된 값들 사이인 경우 상기 개수 비율이 1보다 작거나 같으면 상기 문자의 컬러 극성이 밝고, 상기 개수 비율이 1보다 크면 상기 문자의 컬러 극성이 어두운 것을 특징으로 하는 문자 추출 방법.
  10. 제9항에 있어서,
    상기 기 설정된 값들은
    0.9와 1.1인 것을 특징으로 하는 문자 추출 방법.
  11. 제1항에 있어서,
    상기 국소영역 확장 단계는
    상기 문자 영역 농도의 확률 밀도 함수를 계산하는 단계;
    상기 문자로 판별된 기 결정된 개수의 픽셀을 갖는 윈도우를 선택하는 단계;
    상기 윈도우 내의 비문자 영역으로 판별된 각 픽셀의 확률이 기 결정된 값 T1보다 크고, 이웃 픽셀과의 농도 차이가 기 결정된 값 T2보다 작은 경우 영역 확장을 수행하는 단계; 및
    상기 픽셀의 라벨 변화가 없을 때까지 상기 윈도우를 선택하는 단계로 피드백하는 단계
    를 더 포함하는 것을 특징으로 하는 문자 추출 방법.
  12. 제11항에 있어서,
    상기 확률 밀도 함수는
    이진화된 스트록 영상과 원 영상의 문자 영역을 이용하여 계산되는 것을 특징으로 하는 문자 추출 방법.
  13. 제11항에 있어서,
    상기 문자로 판별된 픽셀의 개수는 4~8개인 것을 특징으로 하는 문자 추출 방법.
  14. 제11항에 있어서,
    상기 T1과 T2는 각각 0.75와 15인 것을 특징으로 하는 문자 추출 방법.
  15. 스트록 필터를 이용하여 문자 영역을 필터링하는 스트록 필터부;
    상기 스트록 필터부의 응답치를 이용하여 문자의 컬러 극성을 결정하는 문자 컬러 극성 결정부;
    상기 스트록 필터부의 응답치에 대한 이진화를 수행하는 이진화 수행부; 및
    상기 이진화 수행부의 이진화에 의한 이진화 영역을 이용하여 국소영역을 확장하고, 그 결과를 광학 문자 판독기로 출력하는 국소영역 확장부
    를 포함한 것을 특징으로 하는 문자 추출 장치.
  16. 제15항에 있어서,
    상기 스트록 필터부는
    밝은(bright) 스트록 필터링과 어두운(dark) 스트록 필터링 모두 수행하는 것을 특징으로 하는 문자 추출 장치.
  17. 제15항에 있어서,
    상기 문자 컬러 극성 결정부는
    상기 스트록 필터부에서 수행된 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율을 이용하여 결정하는 것을 특징으로 하는 문자 추출 장치.
  18. 제17항에 있어서,
    상기 문자 컬러 극성 결정부는
    상기 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율이 1보다 크면 상기 문자의 컬러 극성을 밝은 것으로 결정하고, 1보다 작으면 상기 문자의 컬러 극성을 어두운 것으로 결정하는 것을 특징으로 하는 문자 추출 장치.
  19. 제15항에 있어서,
    상기 문자 컬러 극성 결정부는
    상기 스트록 필터부에서 수행된 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율 및 이진화한 영상에서 밝은 교차점들과 어두운 교차점들의 개수 비율을 이용하여 결정하는 것을 특징으로 하는 문자 추출 장치.
  20. 제19항에 있어서,
    상기 문자 컬러 극성 결정부는
    상기 밝은 스트록 필터와 어두운 스트록 필터 응답치의 비율이 0.9와 1.1 사이인 경우 상기 개수 비율이 1보다 작거나 같으면 상기 문자의 컬러 극성을 밝은 것으로 결정하고, 상기 개수 비율이 1보다 크면 상기 문자의 컬러 극성을 어두운 것으로 결정하는 것을 특징으로 하는 문자 추출 장치.
  21. 제15항에 있어서,
    상기 국소영역 확장부는
    상기 문자 영역 농도의 확률 밀도 함수를 계산하는 확률 밀도 계산부;
    상기 문자로 판별된 기 결정된 개수의 픽셀을 갖는 윈도우를 선택하는 윈도우선택부;
    상기 윈도우 내의 비문자 영역으로 판별된 각 픽셀의 확률이 기 결정된 값 T1보다 크고, 이웃 픽셀과의 농도 차이가 기 결정된 값 T2보다 작은 경우 영역 확장을 수행하는 문자 영역 확장부; 및
    상기 픽셀의 라벨 변화를 판단하여 상기 픽셀의 라벨 변화가 없을 때까지 상기 윈도우 선택부로 피드백하고, 상기 픽셀의 라벨 변화가 없는 경우 국소 영역이 확장된 상기 문자 영역을 상기 광학 문자 판독기로 출력하는 영역 확장 종료 판단부
    를 더 포함하는 것을 특징으로 하는 문자 추출 장치.
  22. 제21항에 있어서,
    상기 확률 밀도 계산부는
    이진화된 스트록 영상과 원 영상의 문자 영역을 이용하여 계산하는 것을 특징으로 하는 문자 추출 장치.
  23. 제21항에 있어서,
    상기 T1과 T2는 각각 0.75와 15인 것을 특징으로 하는 문자 추출 장치.
KR1020060055606A 2006-06-20 2006-06-20 스트록 필터를 이용한 문자 추출 방법 및 그 장치 KR100812347B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020060055606A KR100812347B1 (ko) 2006-06-20 2006-06-20 스트록 필터를 이용한 문자 추출 방법 및 그 장치
US11/652,044 US20070292027A1 (en) 2006-06-20 2007-01-11 Method, medium, and system extracting text using stroke filters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060055606A KR100812347B1 (ko) 2006-06-20 2006-06-20 스트록 필터를 이용한 문자 추출 방법 및 그 장치

Publications (2)

Publication Number Publication Date
KR20070120830A KR20070120830A (ko) 2007-12-26
KR100812347B1 true KR100812347B1 (ko) 2008-03-11

Family

ID=38861617

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060055606A KR100812347B1 (ko) 2006-06-20 2006-06-20 스트록 필터를 이용한 문자 추출 방법 및 그 장치

Country Status (2)

Country Link
US (1) US20070292027A1 (ko)
KR (1) KR100812347B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI420403B (zh) * 2009-11-13 2013-12-21 Primax Electronics Ltd 影像處理方法及影像處理裝置
US8989491B2 (en) 2009-12-31 2015-03-24 Tata Consultancy Services Limited Method and system for preprocessing the region of video containing text
US8989499B2 (en) 2010-10-20 2015-03-24 Comcast Cable Communications, Llc Detection of transitions between text and non-text frames in a video stream
KR102112226B1 (ko) * 2013-03-26 2020-05-19 삼성전자주식회사 디스플레이 장치 및 그 제어 방법

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990047501A (ko) * 1997-12-04 1999-07-05 정선종 뉴스 비디오 자막 추출 및 인식 방법
KR100304763B1 (ko) 1999-03-18 2001-09-26 이준환 압축된 뉴스 영상에서의 문자영역 추출 및 문자 인식방법과, 이러한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
KR20050121823A (ko) * 2004-06-23 2005-12-28 김재협 비디오 자막 자동 추출 및 인식 기법
KR20070053544A (ko) * 2005-11-21 2007-05-25 삼성전자주식회사 영상의 문자 영역 검출장치 및 방법

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6404919B1 (en) * 1997-08-14 2002-06-11 Minolta Co., Ltd. Image processor for encoding image data
US6044178A (en) * 1998-03-10 2000-03-28 Seiko Epson Corporation LCD projector resolution translation
JP4250483B2 (ja) * 2003-08-25 2009-04-08 キヤノン株式会社 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
US7519200B2 (en) * 2005-05-09 2009-04-14 Like.Com System and method for enabling the use of captured images through recognition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990047501A (ko) * 1997-12-04 1999-07-05 정선종 뉴스 비디오 자막 추출 및 인식 방법
KR100304763B1 (ko) 1999-03-18 2001-09-26 이준환 압축된 뉴스 영상에서의 문자영역 추출 및 문자 인식방법과, 이러한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
KR20050121823A (ko) * 2004-06-23 2005-12-28 김재협 비디오 자막 자동 추출 및 인식 기법
KR20070053544A (ko) * 2005-11-21 2007-05-25 삼성전자주식회사 영상의 문자 영역 검출장치 및 방법

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
논문

Also Published As

Publication number Publication date
KR20070120830A (ko) 2007-12-26
US20070292027A1 (en) 2007-12-20

Similar Documents

Publication Publication Date Title
CN101102419B (zh) 一种定位视频字幕区域的方法
Tang et al. A spatial-temporal approach for video caption detection and recognition
KR101452562B1 (ko) 비디오 이미지에서 텍스트를 검출하는 방법
CN101453575B (zh) 一种视频字幕信息提取方法
CN100562074C (zh) 一种视频字幕提取的方法
KR100647284B1 (ko) 영상의 문자 추출 장치 및 방법
CN102332096B (zh) 一种视频字幕文本提取和识别的方法
CN102915438A (zh) 一种视频字幕的提取方法及装置
CN101593276B (zh) 一种视频ocr图文分离方法及系统
Shivakumara et al. An efficient edge based technique for text detection in video frames
Moradi et al. Farsi/Arabic text extraction from video images by corner detection
CN101615252A (zh) 一种自适应图像文本信息提取方法
CN100593792C (zh) 一种视频中的文本跟踪和多帧增强方法
CN104463134A (zh) 一种车牌检测方法和系统
KR100812347B1 (ko) 스트록 필터를 이용한 문자 추출 방법 및 그 장치
CN105701490B (zh) 一种基于图像熵的集装箱箱号自适应定位方法
KR101793184B1 (ko) 촬영된 음악 악보 영상의 자동연주를 위한 가사 영역 추출장치 및 방법
Hori A video text extraction method for character recognition
KR100633443B1 (ko) 적응적 지역 이진화를 이용한 자동차 번호판 인식 시스템및 그 방법
Song et al. A robust statistic method for classifying color polarity of video text
CN101887520B (zh) 一种图像中的文字定位方法和装置
Al-Asadi et al. Arabic-text extraction from video images
Jianyong et al. An edge-based approach for video text extraction
Chen et al. Video-text extraction and recognition
Li et al. A hybrid text segmentation approach

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130227

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140227

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150226

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20160226

Year of fee payment: 9