KR100764175B1 - 맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는장치 및 방법 - Google Patents

맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는장치 및 방법 Download PDF

Info

Publication number
KR100764175B1
KR100764175B1 KR1020060018691A KR20060018691A KR100764175B1 KR 100764175 B1 KR100764175 B1 KR 100764175B1 KR 1020060018691 A KR1020060018691 A KR 1020060018691A KR 20060018691 A KR20060018691 A KR 20060018691A KR 100764175 B1 KR100764175 B1 KR 100764175B1
Authority
KR
South Korea
Prior art keywords
caption
target
areas
subtitle
video
Prior art date
Application number
KR1020060018691A
Other languages
English (en)
Other versions
KR20070088890A (ko
Inventor
정철곤
문영수
정진국
김지연
리우치펑
김상균
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060018691A priority Critical patent/KR100764175B1/ko
Priority to US11/488,757 priority patent/US20070201764A1/en
Publication of KR20070088890A publication Critical patent/KR20070088890A/ko
Application granted granted Critical
Publication of KR100764175B1 publication Critical patent/KR100764175B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/635Overlay text, e.g. embedded captions in a TV program
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/445Receiver circuitry for the reception of television signals according to analogue transmission standards for displaying additional information

Abstract

본 발명은 맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는 장치 및 방법에 관한 것으로서, 상기 자막 검출 장치에서는, 자막 영역 검출기가 입력 동영상으로부터 입력 장르 정보를 참조하여 앵커 샷, 피치 영상, 또는 원거리 영상 등과 같은 후보 프레임 셋을 선택하고 그 중 자막이 있을 가능성이 있는 기대 자막 영역들을 결정하면, 목표 자막 검출기는 상기 검출된 기대 자막 영역들의 위치 또는 컬러 패턴의 반복성을 기반으로 목표 자막일 가능성이 있는 목표 자막 후보 영역들을 선택하고 그 중 문자 또는 숫자 영역의 변화율을 기초로 목표 자막 영역들을 결정하며, 이에 따라 중요 자막 검출기는 상기 결정된 목표 자막 영역들을 분석하여 중요 문자 또는 숫자 정보 영역을 검출한다.
후보 프레임, 자막 영역, 목표 자막 후보, 목표 자막, 중요 자막

Description

맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는 장치 및 방법{Apparatus and Method for Detecting Key Caption in Moving Picture for Customized Service}
도 1은 본 발명의 일실시예에 따른 중요 자막 검출 장치를 설명하기 위한 도면이다.
도 2는 뉴스 동영상에서 자막 검출 방법을 설명하기 위한 흐름도이다.
도 3은 자막 영역과 중요 자막 영역을 설명하기 위한 도면이다.
도 4는 야구/축구 동영상에서 자막 검출 방법을 설명하기 위한 흐름도이다.
도 5는 이중 이진화 방법을 설명하기 위한 도면이다.
도 6은 도 5의 이중 이진화 방법의 일례를 나타내는 도면이다.
도 7은 OCR 방법에 의한 숫자 영역 검출을 설명하기 위한 도면이다.
도 8은 영역별 인식된 숫자에서 야구 경기의 볼 카운트를 결정하는 방법을 설명하기 위한 도면이다.
도 9는 골프 동영상에서 자막 검출 방법을 설명하기 위한 흐름도이다.
도 10은 골프 동영상의 자막의 위치가 시간에 따라 변하는 모습을 설명하기 위한 도면이다.
도 11은 도 10의 목표 자막 패턴 모델링을 설명하기 위한 흐름도이다.
도 12는 목표 자막 영역 이진화에 의한 문자 영역과 중요 자막 영역의 결정을 설명하기 위한 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
110: 자막 영역 검출기
111: 후보 프레임 선택부
112: 자막 영역 결정부
120: 목표 자막 검출기
121: 목표 자막 후보 선택부
122: 목표 자막 결정부
130: 중요 자막 검출기
본 발명은 동영상에서 자막을 검출하는 장치 및 방법에 관한 것으로서, 더욱 상세하게는 맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는 장치 및 방법에 관한 것이다.
동영상에는 컨텐츠 제공자에 의해 의도적으로 삽입된 많은 종류의 자막(superimposed text)이 존재한다. 하지만 동영상의 요약이나 검색을 위해 사용되는 자막은 이 중에서 일부의 자막이다. 이러한 자막을 통칭하여 중요자막이라고 한다. 여기서, 중요자막은 동영상 컨텐츠의 중요 문자 정보를 담고있는 정형화된 자막인 목표 자막과 목표 자막 중에서 각각의 중요 정보를 담고 있는 로컬 자막 영역인 중요자막영역으로 구성된다. 동영상의 요약 및 하이라이트 생성, 검색 등을 위하여 동영상에서 이러한 중요자막을 검출할 필요가 있다. 예를 들어, 뉴스 기사에서 일정 테마의 기사나 야구와 같은 스포츠 경기에서 주요 장면을 쉽고 빠르게 재생, 편집할 수 있도록 하기 위하여 동영상에 포함된 중요자막을 이용할 수 있다. 또한, 동영상에서 검출한 자막을 이용하여 PVR(Personal Video Recorder)이나 와이브로(WiBro) 단말, DMB 폰 등에서 맞춤형 방송 서비스가 실현될 수 있다.
일반적인 동영상의 자막 검출 방법에서는, 일정 시간 동안 위치 중복성을 보이는 영역을 판단하고 해당 영역으로부터 자막 내용을 검출한다. 예를 들어, 30초 동안 발생하는 자막 중에서 위치 중복성이 도미넌트(dominant)한 영역을 판정하고, 다음 30초 동안에 대하여 같은 과정을 반복해 가며 일정 시간 동안 누적시킴으로써, 목표 자막을 선택한다.
그러나, 이와 같은 종래 방법에서는, 목표 자막의 위치 중복성을 로컬 시간 영역에서만 탐색하므로, 자막 검출의 신뢰성이 떨어지는 문제점이 있다. 예를 들어, 뉴스의 앵커 타이틀이나 스포츠의 경기 상황 자막과 같은 목표 자막이 검출되어야 하지만, 이와 유사한 형태의 자막, 예를 들어, 방송사 로고나 광고 등이 존재하는 경우에 이를 목표 자막으로 검출하는 오류가 발생할 수 있다. 이에 따라, 스포츠의 스코어나 볼카운트와 같은 중요 자막 내용이 검출되지 않아 서비스의 신뢰성을 떨어뜨릴 수 있다.
또한, 시간에 따라 목표 자막의 위치가 변하는 경우에는, 위와 같은 종래 방법으로는 해당 목표 자막을 검출할 수 없다는 문제점이 있다. 예를 들어, 골프 경기와 같은 동영상에서는 자막의 위치가 화면의 좌/우 또는 위/아래에 고정되지 않고 실시간 변하는 경우가 많으므로, 이때에는 자막의 시간적 위치 중복성 만으로는 목표 자막 검출에 실패할 확률이 높다.
본 발명은 상술한 바와 같은 종래기술의 문제점을 해결하기 위해 안출된 것으로서, 본 발명의 목적은 동영상에서 자막의 시간적 위치 중복성 또는 컬러 패턴 중복성을 기반으로 결정한 목표 자막으로부터 중요 자막 내용을 강건하게(robust) 검출할 수 있는 맞춤형 방송 서비스를 위한 자막 검출 장치를 제공하는 데 있다.
또한, 본 발명의 다른 목적은 동영상의 후보 프레임 세트에서 결정된 자막 영역에서 자막 패턴의 위치 또는 컬러 패턴의 중복성을 기반으로 목표 자막을 결정하고 해당 중요 자막 내용을 검출할 수 있는 맞춤형 방송 서비스를 위한 자막 검출 방법을 제공하는 데 있다.
상기와 같은 본 발명의 목적을 달성하고 상술한 종래 기술의 문제점을 해결하기 위한 본 발명의 일면에 따른 동영상의 자막 검출 장치는, 입력 동영상으로부터 입력 장르 정보를 참조하여 후보 프레임 셋을 선택하고, 상기 선택된 후보 프레임 셋으로부터 기대 자막 영역들을 결정하는 자막 영역 검출기; 상기 검출된 기대 자막 영역들의 위치 또는 컬러 패턴의 반복성을 기반으로 목표 자막 후보 영역들을 선택하고, 상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역의 변화 율을 기초로 목표 자막 영역들을 결정하는 목표 자막 검출기; 및 상기 결정된 목표 자막 영역들을 분석하여 중요 문자 또는 숫자 정보 영역을 검출하는 중요 자막 검출기를 포함한다.
상기 자막 영역 검출기는, 상기 입력 동영상으로부터 상기 입력 장르 정보가 나타내는 장르에 따른 해당 후보 프레임 셋을 선택하는 후보 프레임 선택부; 상기 선택된 후보 프레임 셋으로부터 자막이 있을 가능성이 있는 기대 자막 영역들을 결정하는 자막 영역 결정부를 포함한다.
상기 목표 자막 검출기는, 상기 검출된 기대 자막 영역들을 누적하여 상기 누적된 영역들의 위치 또는 컬러 패턴의 반복성이 임계값보다 큰 영역들을 상기 목표 자막 후보 영역들로 선택하는 목표 자막 후보 선택부; 및 상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역의 변화율을 분석하여 상기 목표 자막 영역들을 결정하는 목표 자막 결정부를 포함한다.
상기 중요 자막 검출기는, 상기 목표 자막 영역들에 포함된 숫자 정보를 이용하여 상기 숫자 정보 영역을 검출하고, 상기 목표 자막 영역들에 포함된 문자 정보와 소정 데이터베이스 또는 웹서버로부터의 상기 입력 동영상에 관한 일정 정보를 비교하여 상기 문자 정보 영역을 검출하는 것을 특징으로 한다.
상기와 같은 본 발명의 목적을 달성하기 위한 본 발명의 다른 일면에 따른 동영상의 자막 검출 장치는, 소정 컬러 식별 알고리즘을 이용하여 입력 동영상 패턴들의 대표 컬러값들을 획득하고, 상기 대표 컬러값들을 그룹화하는 클러스터링에 따른 패턴 모델링으로부터 소정 임계값보다 큰 대표 컬러값을 가지는 클러스터들에 해당하는 영역들을 목표 자막 후보 영역들로 선택하는 목표 자막 후보 선택부; 및 상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역의 변화율을 분석하여 목표 자막 영역들을 결정하는 목표 자막 결정부를 포함하고, 상기 결정된 목표 자막 영역들을 분석하여 중요 문자 또는 숫자 정보 영역을 검출하는 것을 특징으로 한다.
상기와 같은 본 발명의 다른 목적을 달성하기 위한 본 발명의 일면에 따른 동영상의 자막 검출 방법은, 입력 동영상으로부터 입력 장르 정보를 참조하여 후보 프레임 셋을 선택하는 단계; 상기 선택된 후보 프레임 셋으로부터 기대 자막 영역들을 결정하는 단계; 상기 검출된 기대 자막 영역들의 위치 또는 컬러 패턴의 반복성을 기반으로 목표 자막 후보 영역들을 선택하는 단계; 상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역의 변화율을 기초로 목표 자막 영역들을 결정하는 단계; 및 상기 결정된 목표 자막 영역들을 분석하여 중요 문자 또는 숫자 정보 영역을 검출하는 단계를 포함하는 것을 특징으로 한다.
상기와 같은 본 발명의 다른 목적을 달성하기 위한 본 발명의 다른 일면에 따른 동영상의 자막 검출 방법은, 소정 컬러 식별 알고리즘을 이용하여 입력 동영상 패턴들의 대표 컬러값들을 획득하는 단계; 상기 대표 컬러값들을 그룹화하는 클러스터링에 따라 패턴 모델링을 수행하는 단계; 상기 패턴 모델링 결과에 따라 소정 임계값보다 큰 대표 컬러값을 가지는 클러스터들에 해당하는 영역들을 목표 자막 후보 영역들로 선택하는 단계; 상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역의 변화율을 분석하여 목표 자막 영역들을 결정하는 단계; 및 상기 결정된 목표 자막 영역들을 분석하여 중요 문자 또는 숫자 정보 영역을 검출하는 단계를 포함하는 것을 특징으로 한다.
이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명하지만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
도 1은 본 발명의 일실시예에 따른 자막 검출 장치(100)를 설명하기 위한 도면이다. 도 1을 참조하면, 상기 자막 검출 장치(100)는 자막 영역 검출기(110), 목표 자막 검출기(120), 중요 자막 검출기(130), 및 상세 정보 데이터베이스(131)를 포함한다.
상기 자막 검출 장치(100)는 입력되는 동영상의 자막 패턴에 대하여 시간적 위치 중복성 및 컬러 패턴 중복성을 기반으로 목표 자막을 결정하므로, 강건하고 신뢰성 있는 중요 자막 영역으로부터 중요 숫자나 문자 정보를 검출할 수 있다. 이에 따라 상기 자막 검출 장치(100)가 PVR(Personal Video Recorder)이나 와이브로(WiBro) 단말, DMB 폰 또는 개인용 홈 서버 등에 적용될 때, 동영상에서 강건하고 정확하게 검출된 중요 자막 내용에 따라 동영상의 요약, 하이라이트 검색 등이 용이하게 이루어지도록 할 수 있고, 또는 사용자의 요구에 따른 해당 장면에 대한 맞춤형 방송 서비스도 안정적으로 실현 가능하게 한다.
여기서, 목표 자막은 전술한 바와 같이 동영상 컨텐츠의 중요 문자 정보를 담고있는 정형화된 자막으로서, 예를 들어, 뉴스의 앵커 타이틀 자막이나 스포츠의 경기 정보 자막 등일 수 있다. 또한, 중요 자막 영역은 목표 자막 중에서 각각의 중요 정보를 담고 있는 로컬 자막 영역으로서, 예를 들어, 뉴스의 앵커 타이틀 자막 영역, 야구에서 이닝(inning)/스코어(score)/볼 카운트 자막 영역, 축구에서 스코어 자막 영역, 또는 골프에서 선수명/스코어 자막 영역 등일 수 있다.
이를 위하여, 상기 자막 영역 검출기(110)는 동영상 데이터(이하 '동영상' 이라 약칭함)와 장르 정보를 받아 기대 자막 영역들을 검출한다. 즉, 상기 자막 영역 검출기(110)에 포함된 후보 프레임 선택부(111)는 상기 입력 동영상으로부터 상기 입력 장르 정보가 나타내는 장르, 즉, 뉴스, 스포츠 경기(축구/야구/골프) 등에 따른 해당 후보 프레임 셋을 선택하고, 상기 자막 영역 검출기(110)에 포함된 자막 영역 결정부(112)는 상기 선택된 후보 프레임 셋으로부터 자막이 있을 가능성이 있는 상기 기대 자막 영역들을 결정한다.
이에 따라, 상기 목표 자막 검출기(120)는 본 발명에 따라 상기 검출된 기대 자막 영역들의 위치 또는 컬러 패턴의 반복성을 기반으로 목표 자막 후보 영역들을 선택하고, 상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역의 변화율을 기초로 목표 자막 영역들을 검출한다. 즉, 상기 목표 자막 검출기(120)에 포함된 목표 자막 후보 선택부(121)는 상기 자막 영역 검출기(110)에서 검출된 기대 자막 영역들을 누적하여 상기 누적된 영역들의 위치 또는 컬러 패턴의 반복성이 임계값보다 큰 영역들을 상기 목표 자막 후보 영역들로 선택한다. 또한, 상기 목표 자막 검출기(120)에 포함된 목표 자막 결정부(122)는 상기 목표 자막 후보 선택부(121)에서 선택된 상기 목표 자막 후보 영역들로부터 문자 또는 숫자 영역의 변화 율을 분석하여 상기 목표 자막 영역들을 결정한다.
상기 목표 자막 검출기(120)가 상기 목표 자막 영역들을 검출하면, 상기 중요 자막 검출기(130)는 상기 검출된 목표 자막 영역들을 분석하여 문자 또는 숫자 정보 영역을 검출한다. 이때, 상기 중요 자막 검출기(130)는 상기 목표 자막 영역들에 포함된 숫자 정보를 이용하여 상기 숫자 정보 영역을 검출하고, 상기 목표 자막 영역들에 포함된 문자 정보와 상기 상세 정보 데이터베이스(131)로부터의 상기 입력 동영상에 관한 상세 정보를 비교하여 상기 문자 정보 영역을 검출할 수 있다. 상기 상세 정보 데이터베이스(131)에는 상기 입력 동영상에 관한 해당 장르의 상세 정보, 예를 들어, 스포츠 경기의 선수명이나 어느 팀간의 경기인지를 나타내는 경기 정보 등일 수 있다. 여기서, 상기 중요 자막 검출기(130)는 상기 상세 정보 데이터베이스(131)로부터의 상세 정보를 참조할 수도 있지만, 이에 한정되지 않고 PVR(Personal Video Recorder)이나 와이브로(WiBro) 단말, DMB 폰 또는 개인용 홈 서버와 연동되는 웹서버로부터 해당 장르의 상세 정보를 제공 받을 수도 있다.
이하, 각 장르별로 예시하여 상기 자막 검출 장치(100)의 구체적인 동작을 설명한다.
도 2는 뉴스 동영상에서 자막 검출 방법을 설명하기 위한 흐름도이다. 먼저, 도 1의 후보 프레임 선택부(111)가 뉴스 동영상을 수신한다(S210). 이때, 해당 장르 정보, 즉, 뉴스라는 정보가 사용자에 의하여 입력되거나 사용 단말에서 EPG(electronic program guide)에 따라 동영상으로부터 추출하여 사용될 수 있다. 상기 후보 프레임 선택부(111)는 뉴스 동영상을 수신하면, 해당 장르에 따라 앵커 샷(anchor shot)을 후보 프레임 셋으로 선택할 수 있다(S220). 즉, 동영상 요약 등을 위하여 중요 자막을 획득하기 좋은 앵커의 장면이 나오는 부분의 일정 프레임 셋이 후보 프레임 셋으로 선택될 수 있다. 입력 동영상으로부터 앵커 샷을 획득하기 위하여 템플릿(template)을 이용하는 방법, 클러스터링(clustering)을 이용하는 방법, 멀티 모달(multimodal)을 이용하는 방법, 및 선 특허 출원 번호 2004-0013778에 따른 방법 등이 이용될 수 있다. 이와 같은 앵커 샷 획득 방법은 본 발명의 요지를 벗어나므로 상세한 설명을 생략한다.
한편, 위와 같이 앵커 샷이 후보 프레임 셋으로 선택되면, 자막 영역 결정부(112)는 도 3과 같이 상기 선택된 앵커 샷으로부터 자막이 있을 가능성이 있는 상기 기대 자막 영역들(310, 320)을 결정한다(S230). 자막이 있을 가능성이 있는 영역들을 검출하는 방법들은 동영상 데이터의 압축 영역 또는 복원 영역에서 이루어지 방법이 있을 수 있고, 또는 선 특허 출원 번호 2004-0010600 등에도 개시되어 있다. 이와 같은 기대 자막 영역 결정 방법은 본 발명의 요지를 벗어나므로 상세한 설명을 생략한다.
이에 따라, 도 1의 목표 자막 후보 선택부(121)는 상기 자막 영역 검출기(110)에서 검출된 기대 자막 영역들을 누적하여 상기 누적된 영역들의 위치의 반복성이 임계값보다 큰 영역들을 상기 목표 자막 후보 영역들로 선택한다(S240). 예를 들어, 도 3에서 관련기사의 타이틀을 나타내는 부분인 310은 일시적인 장면 속의 문자 부분인 320보다 반복성이 클 것이므로, 상기 목표 자막 후보 선택부(121)는 310에 해당하는 부분을 목표 자막 후보 영역(330)으로 결정한다.
상기 목표 자막 후보 영역(330)이 결정되면, 목표 자막 결정부(122)가 상기 목표 자막 후보 영역(330)으로부터 문자 영역의 변화율을 분석하여 변화율이 큰 영역을 목표 자막 영역으로 결정한다. 여기서는, 상기 목표 자막 후보 영역(330)이 문자나 숫자의 구분 없이 중요 자막이므로, 중요 자막 검출기(130)는 상기 검출된 목표 자막 영역을 중요 자막 영역으로 간주하고, 해당 영역에서 문자 또는 숫자 정보를 추출할 수 있다(S250).
도 4는 야구/축구 동영상에서 자막 검출 방법을 설명하기 위한 흐름도이다. 먼저, 도 1의 후보 프레임 선택부(111)가 야구 또는 축구 동영상을 수신한다(S410). 이때, 해당 장르 정보, 즉, 야구/축구라는 정보가 사용자에 의하여 입력되거나 사용 단말에서 EPG에 따라 동영상으로부터 추출하여 사용될 수 있다. 상기 후보 프레임 선택부(111)는 야구/축구 동영상을 수신하면, 해당 장르에 따라 야구인 경우에 피치 영상(pitch view), 또는 축구인 경우에 원거리 영상(long view)을 후보 프레임 셋으로 선택할 수 있다(S420). 즉, 동영상 요약 등을 위하여 경기 팀명, 스코어, 스트라이크, 볼, 아웃 카운트 등 중요 경기 정보를 획득하기 좋은 야구 경기의 피치 영상이나 축구의 원거리 영상이 나오는 부분의 일정 프레임 셋이 후보 프레임 셋으로 선택될 수 있다. 입력 동영상으로부터 피치 영상(pitch view), 또는 원거리 영상(long view)을 획득하기 위하여 선 특허 출원 번호 2005-0088235, 2004-0095903 등에 개시된 방법이 이용될 수 있고, 이외에도 소정 알고리즘에 따른 다른 방법들이 이용될 수 있다. 이와 같은 피치 영상(pitch view), 또는 원거리 영상(long view)의 획득 방법은 본 발명의 요지를 벗어나므로 상세한 설명을 생략한 다.
한편, 위와 같이 피치 영상, 또는 원거리 영상이 후보 프레임 셋으로 선택되면, 자막 영역 결정부(112)는 도 6과 같이 상기 선택된 후보 프레임 셋으로부터 자막이 있을 가능성이 있는 상기 기대 자막 영역들(610, 620)을 결정한다(S430). 자막이 있을 가능성이 있는 영역들은 도 2에서 설명된 방법과 유사하게 검출될 수 있다.
이에 따라, 도 1의 목표 자막 후보 선택부(121)는 상기 자막 영역 검출기(110)에서 검출된 기대 자막 영역들을 누적하여 상기 누적된 영역들의 위치의 반복성이 임계값보다 큰 영역들을 상기 목표 자막 후보 영역들로 선택한다(S440). 예를 들어, 도 6에서 관련 경기의 중요 경기 정보를 나타내는 부분인 610은 일시적인 광고 부분인 620보다 반복성이 클 것이므로, 상기 목표 자막 후보 선택부(121)는 610에 해당하는 부분을 목표 자막 후보 영역(630)으로 결정한다.
상기 목표 자막 후보 영역(630)이 결정되면, 목표 자막 결정부(122)가 상기 목표 자막 후보 영역(630)으로부터 문자 또는 숫자 영역의 변화율을 분석하여 변화율이 큰 영역을 목표 자막 영역으로 결정한다(S450).
여기서, 목표 자막 결정부(122)는 이중 이진화(double binarization)을 이용하여 상기 선택된 목표 자막 후보 영역들(630)로부터 문자 또는 숫자 영역을 추출할 수 있다. 상기 이중 이진화는 상반된 그레이(gray)를 가지는 문자 또는 숫자 영역을 용이하게 검출하기 위한 방법으로서, 5와 같이 먼저, Otsu 방법 등에 의해 결정될 수 있는 두 개의 임계값, 예를 들어, 제1 임계값(TH1), 제2 입계값(TH2)에 따 라 상기 선택된 목표 자막 후보 영역들(630)에 대하여 이진화를 수행한다(510). 상기 선택된 목표 자막 후보 영역들(630)은 도 6의 641 및 642와 같이 두 개의 영상으로 이진화될 수 있다. 예를 들어, 상기 선택된 목표 자막 후보 영역들(630)에서, 각 화소(pixel)의 그레이가 상기 제1 임계값(TH1)보다 큰 경우에 그레이 0으로 변환시키고, 그렇지 않은 경우에 최고 그레이, 예를 들어, 8비트 데이터의 경우에 255로 변환시켜, 641 영상이 획득될 수 있다. 또한, 상기 선택된 목표 자막 후보 영역들(630)에서, 각 화소의 그레이가 상기 제2 임계값(TH2)보다 작은 경우에 그레이 0으로 변환시키고, 그렇지 않은 경우에 최고 그레이로 변환시켜, 642 영상이 획득될 수 있다.
위와 같이, 상기 선택된 목표 자막 후보 영역들(630)에 대하여 이진화가 수행된 후 일정 보간 방법이나 알고리즘에 따라 노이즈가 제거된다(520). 다음에, 상기 이진화된 영상들 641 및 642를 합성(645)하여, 650과 같은 영역이 결정된다(530). 이와 같이 결정된 영역에 대하여 적절한 크기로 영역 확장하여 원하는 문자 또는 숫자 영역(660)이 획득될 수 있다.
이와 같은 이중 이진화 방법에 따라 원하는 문자 또는 숫자 영역(660)이 결정되면, 상기 목표 자막 결정부(122)는 OCR(Optical Character Recognition) 기법 등을 이용하여 문자 영역(661)/숫자 영역(662)을 구분하고, 상기 구분된 문자 또는 숫자 영역의 변화율을 분석하여 숫자 영역을 결정한다. OCR에 의한 문자 인식 기법에 따라 상기 문자 영역(661)/숫자 영역(662)의 인식 결과가 도 7과 같이 나타날 때, 음의 값 부분은 문자 영역을(661)을 나타내고, 양의 값 부분은 숫자 영역(662) 이 될 수 있다. 이에 따라, 상기 목표 자막 결정부(122)는 상기 결정된 숫자 영역(662)의 밝기(intensity) 변화율에 따라 변화율이 큰 영역을 목표 자막 영역으로 결정한다(S450). 여기서는 도 6의 숫자 영역(662)의 검은 부분이 목표 자막 영역들로 결정된다고 가정한다.
이와 같이, 목표 자막 영역들이 검출되면, 상기 중요 자막 검출기(130)는 상기 검출된 목표 자막 영역들을 분석하여 숫자 정보를 검출한다(S460~S490). 상기 중요 자막 검출기(130)는, 먼저, 상기 문자 영역(661)에 목표 자막, 즉, 경기 정보를 알리는 자막이 존재하는 경우에(S460), 상기 목표 자막 영역들, 즉 숫자 정보 영역들(662)의 검은 부분에 대한 영역별 이중 이진화(S450 참조)를 다시 이용하여 숫자 영역을 추출하고, OCR(S450 참조)을 이용하여 상기 추출된 숫자 영역의 변화율을 정밀 분석하여 숫자를 인식한다(S470, S480). 이때, 상기 중요 자막 검출기(130)는 연속성을 이용해 상기 인식된 숫자를 보상할 수 있고, 상기 보상된 숫자를 이용하여 해당 중요 숫자 정보 영역에서 해당 중요 숫자를 검출할 수 있다 (S480). 예를 들어, 도 8과 같은 시간에 따른 OCR에 의한 문자 인식 결과에서, 두 숫자 사이에서 전혀 다른 값을 갖는 숫자가 나타나는 경우에 두 값의 중간값으로 처리하거나, 숫자가 없거나 문자로 처리되어 소실되어 나타나는 경우에 양 쪽 숫자의 연속성을 이용해 해당 부분이 보상될 수 있다. 예를 들어, '1'과 '1' 사이에 숫자가 없는 경우에 사이 숫자도 '1'로 할 수 있다.
이에 따라, 축구의 경우에, 상기 중요 자막 검출기(130)는 해당 중요 숫자 정보 영역인 스코어 영역을 결정하여 해당 스코어 정보를 추출할 수 있다. 또는, 야구의 경우에, 상기 중요 자막 검출기(130)는 해당 중요 숫자 정보 영역인 스코어 영역, 이닝 영역, 스트라이크 카운트 영역, 볼 카운트 영역, 아웃 카운트 영역을 결정하여 해당 경기 정보를 추출할 수 있다(S490). 여기서, 스트라이크 영역 및 볼 카운트 영역의 결정을 위하여 도 8에서 3이 많은 나타나는 해당 영역이 볼 카운트 영역이 될 수 있고, 그 옆(좌/우)이 스트라이크 영역이 될 수 있다. 또한, 스트라이크 영역 및 볼 카운트 영역의 좌/우인 세번째 영역이 아웃 카운트 영역일 수 있다. 또한, 스코어 영역은 크기가 유사한 두 영역으로서 위치적으로 수직 또는 수평 상에 있는 영역이 스코어 영역으로 결정될 수 있다. 또한, 아웃 카운트 영역이 시간적으로 변할 때, 숫자의 크기가 커지는 영역이 이닝 영역으로 결정될 수 있다.
도 9는 골프 동영상에서 자막 검출 방법을 설명하기 위한 흐름도이다. 먼저, 도 1의 후보 프레임 선택부(111)가 골프 동영상을 수신한다(S910). 이때, 해당 장르 정보, 즉, 골프라는 정보가 사용자에 의하여 입력되거나 사용 단말에서 EPG에 따라 동영상으로부터 추출하여 사용될 수 있다. 상기 후보 프레임 선택부(111)는 골프 동영상을 수신하면, 해당 장르에 따라 야구/축구에서와 같이 원거리 영상(long view)을 후보 프레임 셋으로 선택할 수 있다(S920).
한편, 위와 같이 원거리 영상이 후보 프레임 셋으로 선택되면, 자막 영역 결정부(112)는 도 10과 같이 상기 선택된 후보 프레임 셋으로부터 자막이 있을 가능성이 있는 상기 기대 자막 영역들(1010~1040)을 결정한다(S930). 자막이 있을 가능성이 있는 영역들은 도 2에서 설명된 방법과 유사하게 검출될 수 있다.
골프에서는 시간적으로 변하는 원거리 영상들에서 목표 자막의 위치가 달라 질 수 있기 때문에, 여기서는 시간적 위치의 반복성이 이용되지 않고, 컬러 패턴의 반복성을 이용하여 목표 자막 후보 영역들이 결정된다. 즉, 도 1의 목표 자막 후보 선택부(121)는 상기 자막 영역 검출기(110)에서 검출된 기대 자막 영역들을 누적하여 상기 누적된 영역들에서 컬러 패턴의 반복성이 임계값보다 큰 영역들을 상기 목표 자막 후보 영역들로 선택한다(S940~S950).
예를 들어, 먼저, 상기 목표 자막 후보 선택부(121)는 DCD(Dominant Color Descriptor)와 같은 컬러 식별을 위한 영상 기술자를 이용하여 상기 누적된 기대 자막 영역들의 대표 컬러값들을 획득할 수 있다(S940). 다음에, 상기 목표 자막 후보 선택부(121)는 도 11과 같은 패턴 모델링 과정에 따라 상기 대표 컬러값들을 그룹화하는 클러스터링을 수행하여 목표 자막 후보 영역들을 결정할 수 있다(S940).
도 11과 같은 패턴 모델링 과정에서는, 먼저, 초기화 시에 상기 획득된 최초의 대표 컬러값에 대하여 클러스터 번호(예를 들어, 1)가 부여되고, 이때 해당 클러스터의 중심점(좌표)과 소속된 클러스터에 그룹화된 패턴(컬러값)의 수 1이 함께 기억된다(S1110). 다음에, 다음 컬러 패턴이 입력되면(S1120), DCD 에 의하여 획득되는 해당 대표 컬러값에 대한 소속 클러스터가 있는지를 판단한다(S1130). 이때, 소속 클러스터에 해당하는 지 판단을 위하여 소속 클러스터의 전체 컬러 평균의 일정 범위 내인지가 비교될 수 있다. 예를 들어, 유클리드(Euclidean) 메트릭(metric) 알고리즘에 따라 컬러들 간의 일정 거리 정보가 상기 소속 클러스터에 해당하는 지의 판단에 이용될 수 있다.
S1130 단계에서, 상기 소속 클러스터에 해당하면 같은 그룹으로 클러스터링 하고 해당 중심점을 업데이트하며, 그룹화된 패턴의 수를 1 증가 시키고, 다음 인덱스에 대하여 같은 과정을 반복한다(S1140~S1160).
S1130 단계에서, 상기 소속 클러스터에 해당하지 않으면 다른 그룹으로 클러스터링하여 다른 클러스터 번호(예를 들어, 2)를 부여하고 해당 중심점을 계산하여 저장한다(S1170~S1180). 이와 같은 과정은 인덱스(i)가 N(최대 입력 패턴의 개수)와 같아질 때까지 반복된다(S1190).
도 11과 같은 과정에 따라, 상기 대표 컬러값들이 그룹화된 개수가 일정 이상인 클러스터들이 선택될 수 있고, 이에 따라 상기 선택된 클러스터들과 일정 임계값을 비교하여 목표 자막 후보 영역들이 결정될 수 있다(S950). 예를 들어, 상기 목표 자막 후보 선택부(121)는 위와 같은 패턴 모델링으로부터 일정 임계값보다 큰 대표 컬러값을 가지는 클러스터들에 해당하는 영역들을 상기 목표 자막 후보 영역들로 선택할 수 있다.
이와 같이 상기 목표 자막 후보 영역들이 결정되면, 목표 자막 결정부(122)가 상기 목표 자막 후보 영역들로부터 도 4에서와 같이 문자 또는 숫자 영역의 변화율을 분석하여 변화율이 큰 영역을 목표 자막 영역(예를 들어, 도 12의 1210)으로 결정한다(S960).
이와 같이, 목표 자막 영역들이 검출되면, 상기 중요 자막 검출기(130)는 상기 검출된 목표 자막 영역들을 분석하여 중요 자막 정보를 검출한다(S960~S980). 상기 중요 자막 검출기(130)는, 먼저, 도 12의 1220과 같이 상기 목표 자막 영역들에 대한 영역별 이중 이진화(S450 참조)를 이용하여 문자 또는 숫자 영역을 추출하 고, OCR(S450 참조)을 이용하여 상기 추출된 문자 또는 숫자 영역의 변화율을 정밀 분석하여 중요 문자 또는 숫자 영역을 결정한다.
이에 따라, 상기 중요 자막 검출기(130)는 해당 중요 숫자 영역인 스코어 영역에서 해당 스코어 정보를 추출할 수 있고, 해당 중요 문자 영역인 선수명/팀명 영역에서 해당 선수명/팀명 정보(1230 참조)를 추출할 수 있다. 여기서, 선수명/팀명 정보와 같은 경기 정보는, 위에서도 기술된 바와 같이, 상기 상세 정보 데이터베이스(131) 또는 소정 웹서버로부터의 상기 입력 동영상에 관한 상세 정보와 비교되어 매칭되는 경우에만, 선수명/팀명에 대한 중요 자막 영역임이 결정되도록 할 수 있다.
위에서 기술한 바와 같이, 본 발명의 일실시예에 따른 자막 검출 장치(100)에서는, 자막 영역 검출기(110)가 입력 동영상으로부터 입력 장르 정보를 참조하여 앵커 샷, 피치 영상, 또는 원거리 영상 등과 같은 후보 프레임 셋을 선택하고 그 중 자막이 있을 가능성이 있는 기대 자막 영역들을 결정하면, 목표 자막 검출기(120)는 상기 검출된 기대 자막 영역들의 위치 또는 컬러 패턴의 반복성을 기반으로 목표 자막일 가능성이 있는 목표 자막 후보 영역들을 선택하고 그 중 문자 또는 숫자 영역의 변화율을 기초로 목표 자막 영역들을 결정하며, 이에 따라 중요 자막 검출기(130)는 상기 결정된 목표 자막 영역들을 분석하여 중요 문자 또는 숫자 정보 영역을 검출한다.
본 명세서에서 개시된 방법 및 장치에서 사용되는 기능은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨 터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있으며 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
상술한 바와 같이 본 발명에 따른 자막 검출 장치 및 방법에서는, 동영상 자막 패턴의 시간적 위치 중복성 및 컬러 패턴 중복성을 기반으로 목표 자막을 결정하므로, 강건하고 신뢰성 있는 중요 자막 내용을 검출할 수 있다. 따라서, PVR(Personal Video Recorder)이나 와이브로(WiBro), DMB 폰 또는 개인용 홈 서버 등에서 동영상의 요약, 하이라이트 검색 등을 정확하게 제공할 수 있고, 또는 사용자의 요구에 따른 해당 장면에 대한 맞춤형 방송 서비스를 안정적으로 실현할 수 있다.

Claims (27)

  1. 입력 동영상으로부터 입력 장르 정보를 참조하여 후보 프레임 셋을 선택하고, 상기 선택된 후보 프레임 셋으로부터 기대 자막 영역들을 결정하는 자막 영역 검출기;
    상기 결정된 기대 자막 영역들을 누적하여 상기 누적된 영역들의 위치 또는 컬러 패턴의 반복성이 임계값보다 큰 영역들을 상기 목표 자막 후보 영역들로 선택하는 목표 자막 후보 선택부와, 상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역의 변화율을 분석하여 상기 목표 자막 영역들을 결정하는 목표 자막 결정부를 포함하는 목표 자막 검출기; 및
    상기 결정된 목표 자막 영역들을 분석하여 중요 문자 또는 숫자 정보 영역을 검출하는 중요 자막 검출기
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  2. 제1항에 있어서, 상기 자막 영역 검출기는,
    상기 입력 동영상으로부터 상기 입력 장르 정보가 나타내는 장르에 따른 해당 후보 프레임 셋을 선택하는 후보 프레임 선택부; 및
    상기 선택된 후보 프레임 셋으로부터 자막이 있을 가능성이 있는 기대 자막 영역들을 결정하는 자막 영역 결정부
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  3. 제2항에 있어서, 상기 후보 프레임 선택부는,
    뉴스의 앵커 샷, 야구의 피치 영상, 또는 축구나 골프의 원거리 영상 중 어느 하나를 상기 후보 프레임 셋으로 선택하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  4. 삭제
  5. 제1항에 있어서, 상기 목표 자막 후보 선택부는,
    소정 컬러 식별 알고리즘을 이용하여 상기 누적된 기대 자막 영역들의 대표 컬러값들을 획득하고, 상기 대표 컬러값들을 그룹화하는 클러스터링에 따른 패턴 모델링으로부터 상기 임계값보다 큰 대표 컬러값을 가지는 클러스터들에 해당하는 영역들을 상기 목표 자막 후보 영역들로 선택하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  6. 제5항에 있어서, 상기 패턴 모델링은,
    상기 대표 컬러값이 일정 범위 내인 소속 클러스터에 해당하는지를 판단하고, 상기 소속 클러스터에 해당하면 같은 그룹으로 클러스터링하고 해당 중심점을 업데이트하고, 상기 소속 클러스터에 해당하지 않으면 다른 그룹으로 클러스터링하고 해당 중심점을 계산하여 저장하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  7. 제5항에 있어서, 상기 대표 컬러값들이 그룹화된 개수를 기반으로 한 클러스터들을 선택하여 상기 선택된 클러스터들과 상기 임계값을 비교하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  8. 제1항에 있어서, 상기 목표 자막 결정부는,
    이중 이진화를 이용하여 상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역을 추출하고, 소정 문자 인식 알고리즘을 이용하여 상기 추출된 문자 또는 숫자 영역의 변화율을 분석하여 숫자 영역을 결정하며, 상기 결정된 숫자 영역의 밝기 변화율에 따라 상기 목표 자막 영역들을 결정하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  9. 제1항에 있어서, 상기 중요 자막 검출기는,
    상기 목표 자막 영역들에 포함된 숫자 정보를 이용하여 상기 숫자 정보 영 역을 검출하고, 상기 목표 자막 영역들에 포함된 문자 정보와 소정 데이터베이스 또는 웹서버로부터의 상기 입력 동영상에 관한 일정 정보를 비교하여 상기 문자 정보 영역을 검출하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  10. 제9항에 있어서, 상기 중요 자막 검출기는,
    상기 문자 정보 영역에 목표 자막이 존재하는 경우에, 상기 검출된 숫자 정보 영역들의 영역별 이중 이진화를 이용하여 숫자 영역을 추출하고, 소정 문자 인식 알고리즘을 이용하여 상기 추출된 숫자 영역의 변화율을 분석하여 숫자를 인식하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  11. 제10항에 있어서, 상기 중요 자막 검출기는,
    연속성을 이용해 상기 인식된 숫자를 보상하고, 상기 보상된 숫자를 이용하여 중요 숫자 정보 영역을 결정하여 해당 중요 숫자를 검출하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  12. 제10항에 있어서, 상기 이중 이진화는,
    소정 두 개의 임계값들 각각에 따라 서로 반대의 그레이로 이진화하여 입력 영상에 대한 이진화된 두 개의 영상들을 생성하고, 상기 이진화된 두 개의 영상들을 소정 알고리즘에 따라 노이즈를 제거하고 합성하여 소정 영역들을 결정하며, 상기 결정된 영역들에 대하여 소정 크기로 영역 확장하여 해당 정보 영역을 획득하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  13. 소정 컬러 식별 알고리즘을 이용하여 입력 동영상 패턴들의 대표 컬러값들을 획득하고, 상기 대표 컬러값들을 그룹화하는 클러스터링에 따른 패턴 모델링으로부터 소정 임계값보다 큰 대표 컬러값을 가지는 클러스터들에 해당하는 영역들을 목표 자막 후보 영역들로 선택하는 목표 자막 후보 선택부; 및
    상기 선택된 목표 자막 후보 영역들로부터 중요 문자 또는 숫자 영역의 변화율을 분석하여 목표 자막 영역들을 결정하는 목표 자막 결정부
    를 포함하고,
    상기 결정된 목표 자막 영역들을 분석하여 문자 또는 숫자 정보 영역을 검출하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  14. 제13항에 있어서, 상기 패턴 모델링은,
    상기 대표 컬러값이 일정 범위 내인 소속 클러스터에 해당하는지를 판단하고, 상기 소속 클러스터에 해당하면 같은 그룹으로 클러스터링하고 해당 중심점을 업데이트하고, 상기 소속 클러스터에 해당하지 않으면 다른 그룹으로 클러스터링하고 해당 중심점을 계산하여 저장하는 것을 특징으로 하는 동영상의 자막 검출 장치.
  15. 입력 동영상으로부터 입력 장르 정보를 참조하여 후보 프레임 셋을 선택하는 단계;
    상기 선택된 후보 프레임 셋으로부터 기대 자막 영역들을 결정하는 단계;
    상기 결정된 기대 자막 영역들을 누적하여 상기 누적된 영역들의 위치 또는 컬러 패턴의 반복성이 임계값보다 큰 영역들을 상기 목표 자막 후보 영역들로 선택하는 단계;
    상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역의 변화율을 기초로 목표 자막 영역들을 결정하는 단계; 및
    상기 결정된 목표 자막 영역들을 분석하여 중요 문자 또는 숫자 정보 영역을 검출하는 단계
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 방법.
  16. 제15항에 있어서, 상기 후보 프레임 셋은 뉴스의 앵커 샷, 야구의 피치 영상, 또는 축구나 골프의 원거리 영상 중 어느 하나인 것을 특징으로 하는 동영상의 자막 검출 방법.
  17. 삭제
  18. 제15항에 있어서,
    소정 컬러 식별 알고리즘을 이용하여 상기 누적된 기대 자막 영역들의 대표 컬러값들을 획득하는 단계; 및
    상기 대표 컬러값들을 그룹화하는 클러스터링에 따른 패턴 모델링을 수행하는 단계;
    상기 패턴 모델링 결과에 따라 상기 임계값보다 큰 대표 컬러값을 가지는 클러스터들에 해당하는 영역들을 상기 목표 자막 후보 영역들로 선택하는 단계
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 방법.
  19. 제18항에 있어서, 상기 패턴 모델링 수행 단계는,
    상기 대표 컬러값이 일정 범위 내인 소속 클러스터에 해당하는지를 판단하는 단계;
    상기 대표 컬러값이 상기 소속 클러스터에 해당하면 같은 그룹으로 클러스터링하고 해당 중심점을 업데이트하는 단계; 및
    상기 대표 컬러값이 상기 소속 클러스터에 해당하지 않으면 다른 그룹으로 클러스터링하고 해당 중심점을 계산하여 저장하는 단계
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 방법.
  20. 제18항에 있어서, 상기 대표 컬러값들이 그룹화된 개수를 기반으로 한 클러스터들을 선택하여 상기 선택된 클러스터들과 상기 임계값을 비교하는 것을 특징으로 하는 동영상의 자막 검출 방법.
  21. 제15항에 있어서,
    이중 이진화를 이용하여 상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역을 추출하는 단계;
    소정 문자 인식 알고리즘을 이용하여 상기 추출된 문자 또는 숫자 영역의 변화율을 분석하여 숫자 영역을 결정하는 단계;
    상기 결정된 숫자 영역의 밝기 변화율에 따라 상기 목표 자막 영역들을 결정하는 단계
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 방법.
  22. 제15항에 있어서,
    상기 목표 자막 영역들에 포함된 숫자 정보를 이용하여 상기 숫자 정보 영역을 검출하는 단계; 및
    상기 목표 자막 영역들에 포함된 문자 정보와 소정 데이터베이스 또는 웹서버로부터의 상기 입력 동영상에 관한 일정 정보를 비교하여 상기 문자 정보 영역을 검출하는 단계
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 방법.
  23. 제22항에 있어서,
    상기 문자 정보 영역에 목표 자막이 존재하는 경우에, 상기 검출된 숫자 정보 영역들의 영역별 이중 이진화를 수행하는 단계;
    상기 이중 이진화로부터 숫자 영역을 추출하는 단계; 및
    소정 문자 인식 알고리즘을 이용하여 상기 추출된 숫자 영역의 변화율을 분석하여 숫자를 인식하는 단계
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 방법.
  24. 제23항에 있어서,
    연속성을 이용해 상기 인식된 숫자를 보상하는 단계; 및
    상기 보상된 숫자를 이용하여 중요 숫자 정보 영역을 결정하여 해당 중요 숫자를 검출하는 단계
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 방법.
  25. 제23항에 있어서, 상기 이중 이진화는,
    소정 두 개의 임계값들 각각에 따라 서로 반대의 그레이로 이진화하여 입력 영상에 대한 이진화된 두 개의 영상들을 생성하는 단계;
    상기 이진화된 두 개의 영상들을 소정 알고리즘에 따라 노이즈를 제거하는 단계;
    상기 노이즈 제거된 두 영상들을 합성하여 소정 영역들을 결정하는 단계; 및
    상기 결정된 영역들에 대하여 소정 크기로 영역 확장하여 해당 정보 영역을 획득하는 단계
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 방법.
  26. 소정 컬러 식별 알고리즘을 이용하여 입력 동영상 패턴들의 대표 컬러값들을 획득하는 단계;
    상기 대표 컬러값들을 그룹화하는 클러스터링에 따라 패턴 모델링을 수행하는 단계;
    상기 패턴 모델링 결과에 따라 소정 임계값보다 큰 대표 컬러값을 가지는 클러스터들에 해당하는 영역들을 목표 자막 후보 영역들로 선택하는 단계;
    상기 선택된 목표 자막 후보 영역들로부터 문자 또는 숫자 영역의 변화율을 분석하여 목표 자막 영역들을 결정하는 단계; 및
    상기 결정된 목표 자막 영역들을 분석하여 중요 문자 또는 숫자 정보 영역을 검출하는 단계
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 방법.
  27. 제26항에 있어서, 상기 패턴 모델링 수행 단계는,
    상기 대표 컬러값이 일정 범위 내인 소속 클러스터에 해당하는지를 판단하는 단계;
    상기 소속 클러스터에 해당하면 같은 그룹으로 클러스터링하고 해당 중심점을 업데이트하는 단계; 및
    상기 소속 클러스터에 해당하지 않으면 다른 그룹으로 클러스터링하고 해당 중심점을 계산하여 저장하는 단계
    를 포함하는 것을 특징으로 하는 동영상의 자막 검출 방법.
KR1020060018691A 2006-02-27 2006-02-27 맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는장치 및 방법 KR100764175B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020060018691A KR100764175B1 (ko) 2006-02-27 2006-02-27 맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는장치 및 방법
US11/488,757 US20070201764A1 (en) 2006-02-27 2006-07-19 Apparatus and method for detecting key caption from moving picture to provide customized broadcast service

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060018691A KR100764175B1 (ko) 2006-02-27 2006-02-27 맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는장치 및 방법

Publications (2)

Publication Number Publication Date
KR20070088890A KR20070088890A (ko) 2007-08-30
KR100764175B1 true KR100764175B1 (ko) 2007-10-08

Family

ID=38444068

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060018691A KR100764175B1 (ko) 2006-02-27 2006-02-27 맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는장치 및 방법

Country Status (2)

Country Link
US (1) US20070201764A1 (ko)
KR (1) KR100764175B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8929656B2 (en) 2009-08-25 2015-01-06 Samsung Electronics Co., Ltd. Method and apparatus for detecting important information from moving picture

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100771244B1 (ko) * 2006-06-12 2007-10-29 삼성전자주식회사 동영상 데이터 처리 방법 및 장치
US8929461B2 (en) * 2007-04-17 2015-01-06 Intel Corporation Method and apparatus for caption detection
JP4398994B2 (ja) * 2007-04-27 2010-01-13 株式会社東芝 映像処理装置及び方法
US20090116757A1 (en) * 2007-11-06 2009-05-07 Copanion, Inc. Systems and methods for classifying electronic documents by extracting and recognizing text and image features indicative of document categories
JP5091806B2 (ja) * 2008-09-01 2012-12-05 株式会社東芝 映像処理装置及びその方法
KR101645994B1 (ko) * 2009-12-29 2016-08-05 삼성전자주식회사 문자 인식 영역 검출 장치 및 문자 인식 방법
JP6237071B2 (ja) * 2013-10-01 2017-11-29 富士ゼロックス株式会社 色評価結果画像生成装置、色評価結果画像生成プログラム、及び色評価結果表示装置
KR102217186B1 (ko) * 2014-04-11 2021-02-19 삼성전자주식회사 요약 컨텐츠 서비스를 위한 방송 수신 장치 및 방법
WO2015156452A1 (ko) * 2014-04-11 2015-10-15 삼선전자 주식회사 요약 컨텐츠 서비스를 위한 방송 수신 장치 및 방법
US11373404B2 (en) * 2018-05-18 2022-06-28 Stats Llc Machine learning for recognizing and interpreting embedded information card content
KR102646584B1 (ko) * 2022-12-26 2024-03-13 엘지전자 주식회사 디스플레이 장치

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990047501A (ko) * 1997-12-04 1999-07-05 정선종 뉴스 비디오 자막 추출 및 인식 방법
KR20040028064A (ko) * 2002-09-28 2004-04-03 주식회사 케이티 장르별 특성 정보를 활용한 퍼지 기반 영상 요약 장치 및그 방법
KR20040033767A (ko) * 2002-10-15 2004-04-28 케이투아이엠에스 한국어 이미지 문자인식기능을 통한 뉴스 동영상의뉴스제목 자동추출방법
KR20050121823A (ko) * 2004-06-23 2005-12-28 김재협 비디오 자막 자동 추출 및 인식 기법

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5589892A (en) * 1993-09-09 1996-12-31 Knee; Robert A. Electronic television program guide schedule system and method with data feed access
US6701526B1 (en) * 1999-07-01 2004-03-02 Koninklijke Philips Electronics N.V. Method and apparatus for capturing broadcast EPG data for program title display
US20020157116A1 (en) * 2000-07-28 2002-10-24 Koninklijke Philips Electronics N.V. Context and content based information processing for multimedia segmentation and indexing
KR100411340B1 (ko) * 2001-03-09 2003-12-18 엘지전자 주식회사 뉴스 비디오 콘텐트의 뉴스 기사 기반 요약 및 브라우징시스템
WO2003051031A2 (en) * 2001-12-06 2003-06-19 The Trustees Of Columbia University In The City Of New York Method and apparatus for planarization of a material by growing and removing a sacrificial film
US8261306B2 (en) * 2001-12-11 2012-09-04 Koninklijke Philips Electronics N.V. System for and method of shopping through television
US20050138560A1 (en) * 2003-12-18 2005-06-23 Kuo-Chun Lee Method and apparatus for broadcasting live personal performances over the internet

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990047501A (ko) * 1997-12-04 1999-07-05 정선종 뉴스 비디오 자막 추출 및 인식 방법
KR20040028064A (ko) * 2002-09-28 2004-04-03 주식회사 케이티 장르별 특성 정보를 활용한 퍼지 기반 영상 요약 장치 및그 방법
KR20040033767A (ko) * 2002-10-15 2004-04-28 케이투아이엠에스 한국어 이미지 문자인식기능을 통한 뉴스 동영상의뉴스제목 자동추출방법
KR20050121823A (ko) * 2004-06-23 2005-12-28 김재협 비디오 자막 자동 추출 및 인식 기법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8929656B2 (en) 2009-08-25 2015-01-06 Samsung Electronics Co., Ltd. Method and apparatus for detecting important information from moving picture

Also Published As

Publication number Publication date
KR20070088890A (ko) 2007-08-30
US20070201764A1 (en) 2007-08-30

Similar Documents

Publication Publication Date Title
KR100764175B1 (ko) 맞춤형 방송 서비스를 위한 동영상의 중요 자막을 검출하는장치 및 방법
CN110381366B (zh) 赛事自动化报道方法、系统、服务器及存储介质
KR100836197B1 (ko) 동영상 자막 검출 장치 및 그 방법
Xu et al. Live sports event detection based on broadcast video and web-casting text
US7474698B2 (en) Identification of replay segments
US7761491B2 (en) Method for detecting a commercial in a video data stream by evaluating descriptor information
JP5371083B2 (ja) 顔識別特徴量登録装置、顔識別特徴量登録方法、顔識別特徴量登録プログラム及び記録媒体
KR100636910B1 (ko) 동영상검색시스템
US8929656B2 (en) Method and apparatus for detecting important information from moving picture
US20030061612A1 (en) Key frame-based video summary system
US8214368B2 (en) Device, method, and computer-readable recording medium for notifying content scene appearance
KR20040070269A (ko) 광고방송 및 다른 비디오 콘텐츠의 검출을 위한 패밀리히스토그램 기반으로 한 기술들
Gibert et al. Sports video classification using HMMs
US20100259688A1 (en) method of determining a starting point of a semantic unit in an audiovisual signal
JP2004520756A (ja) マルチメディアの手掛かりを利用したテレビ番組をセグメント化及びインデクス化する方法
US10965965B2 (en) Detecting of graphical objects to identify video demarcations
Lu et al. An effective post-refinement method for shot boundary detection
US7398003B2 (en) Index data generation apparatus, index data generation method, index data generation program and recording medium on which the program is recorded
JP2010015588A (ja) 動画像データの分類装置
Su et al. Transition effect detection for extracting highlights in baseball videos
Ueda et al. Detecting soccer goal scenes from broadcast video using telop region
Halin et al. Automatic overlaid text detection, extraction and recognition for high level event/concept identification in soccer videos
JP4949307B2 (ja) 動画像シーン分割装置および動画像シーン分割方法
Waseemullah et al. Unsupervised Ads Detection in TV Transmissions
Khan et al. Unsupervised Ads Detection in TV Transmissions

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120830

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20130829

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140828

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150828

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160830

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170830

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee