KR20070082828A - 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호정보를 검출하는 장치 및 방법 - Google Patents

디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호정보를 검출하는 장치 및 방법 Download PDF

Info

Publication number
KR20070082828A
KR20070082828A KR1020060015954A KR20060015954A KR20070082828A KR 20070082828 A KR20070082828 A KR 20070082828A KR 1020060015954 A KR1020060015954 A KR 1020060015954A KR 20060015954 A KR20060015954 A KR 20060015954A KR 20070082828 A KR20070082828 A KR 20070082828A
Authority
KR
South Korea
Prior art keywords
area
region
telephone number
roi
character
Prior art date
Application number
KR1020060015954A
Other languages
English (en)
Other versions
KR100791517B1 (ko
Inventor
우상욱
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020060015954A priority Critical patent/KR100791517B1/ko
Priority to EP07102154A priority patent/EP1821240A3/en
Priority to CNA2007100791347A priority patent/CN101026645A/zh
Priority to US11/708,698 priority patent/US20070214486A1/en
Publication of KR20070082828A publication Critical patent/KR20070082828A/ko
Application granted granted Critical
Publication of KR100791517B1 publication Critical patent/KR100791517B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephonic Communication Services (AREA)
  • Television Systems (AREA)

Abstract

본 발명은 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치 및 방법을 제공한다. 이를 위해 본 발명은 디지털 방송 데이터가 수신되면 수신된 디지털 방송 데이터 중에서 I frame 데이터를 스캔하고, 스캔된 데이터로부터 ROI를 검출한다. 그리고 상기 ROI가 검출되면 검출된 ROI를 이진화 처리하고 이진화 처리된 ROI로부터 비 텍스트 영역의 제거 및 해당 ROI의 글자열 및 글자 분할 과정을 거쳐 해당 ROI로부터 숫자 영역을 추출한다. 그리고 추출된 숫자 영역으로부터 추출된 블롭들을 숫자로 인식하고, 인식된 숫자를 이용하여 전화번호를 조합하여 저장하고 이를 출력한다. 이에 따라 본 발명에서는 일반적인 디지털 방송 데이터 송수신 절차를 변경할 필요없이 사용자가 상기 디지털 방송에서 방송되는 전화번호를 제공받을 수 있으며 이에 따른 서비스를 제공받을 수 있다.
디지털 방송, 숫자 데이터 추출, 전화번호 조합

Description

디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치 및 방법{APPARATUS AND METHOD FOR DETECTING PHONE NUMBER INFORMATION FROM DIGITAL MULTIMEDIA BROADCASTING(DMB) OF DMB RECEIVING TERMINAL}
도 1은 본 발명의 실시 예에 따른 디지털 방송 수신 단말기의 블록 구성도,
도 2는 본 발명의 실시 예에 따라 디스플레이 영역에서 전화번호를 추출하는 전화번호 추출 동작의 흐름을 도시한 흐름도,
도 3은 본 발명의 전화번호 추출 동작 중 ROI 영역을 추출하는 ROI 영역 추출 동작 과정을 자세히 도시한 흐름도,
도 4는 본 발명의 전화번호 추출 동작 중 ROI 영역 추출 동작의 예시도,
도 5는 본 발명의 전화번호 추출 동작 중 비 텍스트 영역을 제거하는 비 텍스트 영역 제거 동작 과정을 자세히 도시한 흐름도,
도 6은 본 발명의 전화번호 추출 동작 중 비 텍스트 영역 제거 동작의 예시도,
도 7은 본 발명의 실시 예에 따라 추출된 ROI 영역으로부터 글자열 영역 및 글자 영역을 분할하는 글자열 영역 및 글자 영역 분할 동작 과정을 자세히 도시한 흐름도,
도 8은 본 발명의 글자열 영역 및 글자 영역 분할 동작 중 글자열 영역 분할 및 글자 영역 분할의 예를 보이는 예시도,
도 9a와 도 9b는 본 발명의 전화번호 추출 동작 중 숫자 영역을 추출하는 숫자 영역 추출 동작 과정을 자세히 도시한 흐름도,
도 10은 본 발명의 숫자 영역 추출 동작 중, 해당 숫자 영역에 포함된 블롭에 따라 해당 영역이 숫자 영역인지 여부를 판단하는 예를 보이는 예시도,
도 11은 본 발명의 전화번호 추출 동작 중, 상기 추출된 숫자 영역으로부터 인식된 숫자들을 이용하여 가능한 전화번호 조합을 생성하고 이를 저장하는 동작 과정을 도시한 흐름도.
본 발명은 디지털 방송(Digital Multimedia Broadcasting : DMB)에 관한 것으로, 특히 디지털 방송 수신 단말기에 관한 것이다.
일반적으로 디지털 방송이라는 것은 종래의 아날로그 방송을 대체하여 고화질과 고음질, 그리고 보다 높은 서비스를 사용자에게 제공하는 방송 서비스를 말하는 것이다. 더욱이 최근에는 디지털 방송 기술 및 이동통신 기술의 발달에 따라 이동 중에도 디지털 방송을 시청할 수 있도록 하기 위한 디지털 방송 서비스에 대한 관심이 높아지고 있다. 이에 따라 현재에는 이동통신 단말기에 무지향성 디지털 멀티미디어 방송 수신 안테나를 장착하여 이동통신 단말기를 통해 상기 디지털 멀티 미디어 방송을 수신할 수 있도록 한다.
이러한 통상적인 디지털 방송에서는 광고 방송 또는 구호 방송 등에서 시청자가 해당 방송에 관련된 단체, 즉 특정 물품을 판매하는 판매처나 구호 단체 등에 접속이 용이하게 할 수 있도록 함으로써 사용자 편의성을 증가시키기 위해 사용자에게 정보 전달, 상품 판매 등의 목적으로 전화번호를 방송에 삽입하여 방송할 수 있다.
그런데 이러한 경우 상기 통상적인 디지털 방송에서는 디지털 방송의 송신측에서 방송되는 TS(Transport Stream)에, 상기 전화번호 데이터 및, 상기 디지털 방송의 수신측이 상기 전화번호 데이터를 인식할 수 있도록 하기 위해 상기 수신측과 기 약정된 전화번호 플래그(flag)를 삽입하여야 했다. 그리고 수신측에서는, 사용자가 디지털 방송 중에 상기 전화번호를 선택하는 경우 상기 전화번호 플래그를 체크하여 상기 전화번호 데이터가 있으면, 그 전화번호 데이터에 따른 전화번호를 출력하고 이에 따른 서비스를 사용자에게 제공한다. 여기서 상기 서비스라는 것은 사용자가 상기 전화번호에 따라 메시지를 전송하거나, 전화 통화를 하는 서비스 및 상기 전화번호를 이용한 무선 접속 등과 같은 서비스를 말하는 것이다.
그런데 이러한 경우, 통신 사업자, 단말 제조사 등에서는 상기 전화번호 데이터 및 상기 전화번호 데이터 플래그를 사용하기 위해, 상술한 바와 같이 디지털 방송에서 방송되는 데이터의 구조를 변경하여야만 했다. 그리고 이뿐만 아니라 이처럼 디지털 방송에 전화번호 데이터가 포함되어 있는 수신측에서는 상기 전화번호 데이터를 확인하기 위한 전화번호 플래그들을, 각 수신되는 TS(Transport Stream) 을 일일이 확인하는 절차를 수행하여야만 했다.
따라서 이러한 통상적인 디지털 방송에서는, 상기한 전화번호 데이터들의 전송을 위해 전송 데이터의 구조를 변경하여야 했을 뿐만 아니라, 일반적인 디지털 방송에서 규정하고 있는 과정들 외에, 송신되는 TS 패킷 하나하나마다 전화번호 데이터를 체크하는 과정을 수행하였기 때문에 디지털 방송 데이터의 송수신에 있어 양측의 성능을 저하시킨다는 문제점이 있었다.
그러므로 본 발명의 목적은, 디지털 방송시 전송되는 데이터의 구조를 변경하지 않고서도 상기 디지털 방송에서 방송되는 전화번호를 인식하고 이를 전화번호 데이터로 저장할 수 있는 디지털 방송 수신 장치 및 방법을 제공함에 있다.
또한 본 발명의 다른 목적은, 디지털 방송을 송신 및 수신하는 과정에서 기 규정된 디지털 방송 송수신 절차 외의 과정 없이도 상기 디지털 방송에서 방송되는 전화번호를 인식하고 이를 전화번호 데이터로 저장할 수 있는 디지털 방송 수신 장치 및 방법을 제공함에 있다.
상술한 목적을 달성하기 위한 본 발명의 장치는, 디지털 방송을 수신하는 디지털 방송 수신부와, 상기 수신된 디지털 방송으로부터 수신되어 디코딩(Decoding)된 디지털 방송 데이터 중 I frame을 스캔(scan)하는 스캔부와, 상기 스캔된 I frame으로부터 상기 디지털 방송 수신 단말기의 디스플레이 영역 중 전화번호 정보가 포함된 영역으로 간주되는 영역인 ROI(Region Of Interest : 관심 영역)를 검출하고, 검출된 ROI를 이진화한 후, 이진화된 ROI로부터 비 텍스트 영역을 제거하며, 상기 ROI를, 숫자, 문자 또는 기호로 인식될 수 있는 적어도 하나의 블롭(Blob)을 포함하는 영역인 글자 영역 및 상기 글자 영역들로 이루어진 글자열 영역으로 분할하는 글자 추출부와, 상기 추출된 글자열 영역의 각 글자 영역들을 기 설정된 조건에 따라 분석하여 상기 글자열 영역이 숫자들만을 포함하는 숫자 영역인지 여부를 판단하고, 숫자열로 판단된 글자열 영역만을 추출하며, 추출된 글자열 영역에 포함된 블롭들을 기 설정된 가중치 방식을 통해 숫자 데이터로 인식하고, 인식된 숫자 데이터들을 이용하여 적어도 하나의 전화번호를 조합하는 전화번호 추출부와, 상기 디지털 방송 수신부로부터 수신된 I frame이 디코딩되면, 현재 방송중인 방송 화면의 I frame을 스캔하고, 상기 스캔된 I frame을 상기 글자 추출부에 인가하여 상기 글자열 영역을 추출하며, 상기 추출된 글자열 영역을 상기 전화번호 추출부에 인가하여 상기 글자열 영역에 따른 숫자 데이터를 추출한 후 이를 전화번호로 조합하여 출력하는 제어부를 포함한다.
또한 방법은, 상기 디지털 방송에 포함된 I frame를 디코딩(decoding)하고 스캔(scan)하는 I frame 스캔 단계와, 상기 스캔된 I frame으로부터 상기 디지털 방송 수신 단말기의 디스플레이 영역 중 전화번호 정보가 포함된 영역으로 간주되는 영역인 ROI(Region Of Interest)를 검출하는 ROI 검출 단계와, 상기 검출된 ROI를 이진화하는 이진화 단계와, 기 설정된 텍스트 임계값에 따라 비 텍스트 영역으 로 간주되는 영역을 제거하는 비 텍스트 제거 단계와, 상기 이진화된 ROI로부터, 숫자, 문자, 기호로 인식될 수 있는 적어도 하나의 블롭을 포함하는 글자 영역 및 상기 글자 영역들로 이루어진 글자열 영역을 각각 분할하는 글자열 영역 및 글자 영역 분할 단계와, 상기 추출된 글자열 영역의 각 글자 영역들을 기 설정된 조건에 따라 분석하여, 상기 글자열 영역들 중 숫자로 인식될 수 있는 블롭들만을 포함하는 숫자 영역만을 추출하는 숫자 영역 추출 단계와, 상기 추출된 숫자 영역의 블롭들을 숫자 데이터로 인식하는 숫자 데이터 인식 단계와, 상기 인식된 숫자 데이터들을 조합하여 전화번호를 생성하는 전화번호 생성 단계를 포함한다.
이하 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 도면들 중 동일한 구성 요소들은 가능한 한 어느 곳에서든지 동일한 부호들로 나타내고 있음에 유의하여야 한다. 하기 설명 및 첨부 도면에서 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.
먼저 본 발명의 완전한 이해를 돕기 위해, 본 발명의 기본 원리를 설명하면, 본 발명에서는, 디지털 방송 데이터가 수신되면 수신된 디지털 방송 데이터 중에서 I frame 데이터를 디코딩한다. 그리고 디코딩된 I frame을 스캔(scan)하고, 스캔된 데이터로부터 ROI(Region Of Interest : 관심 영역)를 검출한다. 여기서 ROI라는 것은 예를 들어 디스플레이 영역의 상단이나 하단, 또는 좌측이나 우측과 같이 일반적으로 디지털 방송 중에서 전화번호가 표시될 수 있는 대상 영역 중에서 기 설정된 조건에 따라 선택된 일부 디스플레이 영역을 말한다. 그리고 상기 ROI가 검출되면 검출된 ROI를 이진화 처리하고 이진화 처리된 ROI로부터 비 텍스트 영역의 제 거 및 해당 ROI의 글자열 및 글자 분할 과정을 거쳐 해당 ROI로부터 숫자 영역을 추출한다. 그리고 추출된 숫자 영역으로부터 추출된 블롭(Blob)들을 숫자로 인식하고, 인식된 숫자를 이용하여 전화번호를 조합한다. 그리고 이를 저장하고 사용자에게 출력한다. 이에 따라 본 발명에서는 일반적인 디지털 방송 데이터 송수신 절차를 변경할 필요없이 사용자가 상기 디지털 방송에서 방송되는 전화번호를 제공받고 이에 따라 접속을 할 수 있다.
도 1은 이러한 본 발명의 실시 예에 따른 디지털 방송 수신 단말기의 블록 구성을 보이고 있는 도면이다.
도 1을 참조하여 살펴보면, 본 발명의 실시 예에 따른 디지털 방송 수신 단말기는 메모리부(102), 키 입력부(104), 표시부(106), 그리고 증폭부(112), 디지털 방송 수신부(110), 스캔부(146) 및 글자 추출부(128)와 전화번호 추출부(138)가 제어부(100)에 연결된다. 여기서 제어부(100)는 사용자의 키 입력을 키 입력부(104)로부터 받아서 이에 따라 표시부(106)를 제어하여 사용자의 키 입력에 따른 화상 정보를 생성하여 제공될 수 있도록 한다. 그리고 상기 DMB 신호 수신부(116)로부터 디지털 방송 데이터에 포함된 비디오 데이터 및 오디오 데이터를 입력받아 이를 디코딩한다. 그리고 이를 표시부(106) 또는 증폭부(114) 중 적어도 어느 하나로 출력한다.
그리고 제어부(100)는 디지털 방송이 수신되는 경우, 글자 추출부(128)를 통해 상기 디지털 방송으로부터 I frame을 스캔하고, 스캔된 I frame으로부터 ROI를 검출한다. 여기서 ROI라는 것은 상술한 바와 같이 관심 영역을 의미하는 것으로 디 스플레이 영역 중 글자 열등이 포함된 영역을 말한다.
그런데 일반적인 경우, 전화번호 정보들은 통상적으로 디스플레이 화면의 상단이나 하단, 좌측이나 우측에 주로 표시된다. 따라서 본 발명에서는 이러한 영역을 기 설정된 순서에 따라 선택하여, 해당 영역에 상기 전화번호 정보가 포함되어 있을 가능성이 있는 영역을 ROI로 설정하고 이를 검출한다.
그리고 검출된 ROI가 있다면 상기 제어부(100)는 글자 추출부(128)를 통해 상기 검출된 ROI를 이진화시켜 이진화된 데이터로 변환한다. 그리고 상기 이진화된 ROI에서 일반적인 텍스트 크기에 맞지 않는 블롭(Blob)이 있는 경우, 이를 제거한다. 여기서 상기 블롭이라는 것은 디스플레이 영역상에 표시되는 하나의 연결된 덩어리를 말한다. 그리고 상기 비 텍스트 영역이 제거된 디스플레이 영역에 수평 프로젝션(Projection) 및 수직 프로젝션을 수행하여, 해당 ROI 영역에 글자들로 인식될 수 있는 블롭들을 포함하는 글자열 영역이 몇 개나 있는지, 그리고 각 글자열 영역에 상기 글자들로 인식될 수 있는 블롭들의 영역이 몇 개나 있는지를 추출하고 각각의 글자열 영역 및 글자 영역들을 분할한다. 여기서 상기 글자라는 것은, 문자와 숫자 그리고 일반적인 기호등으로 인식될 수 있는 적어도 하나의 블롭들을 의미하는 것이다.
그리고 제어부(100)는 상기 검출된 ROI에서 글자열 영역 및 글자 영역들이 분할되면, 이를 전화번호 추출부(138)를 통해 상기 분할된 글자 영역들을 기 설정된 조건에 따라 분석하여, 상기 글자 영역의 블롭이 문자인지 숫자인지 또는 기호인지를 판단한다. 그리고 상기 글자열 영역에 문자로 인식된 블롭들의 개수에 따라 상기 글자열 영역이 숫자들만을 포함하는 숫자 영역인지 여부를 판단한다. 그리고 상기 글자열 영역 중에서 숫자 및 기호로 인식되는 블롭들만을 포함하고 있는 영역인 숫자 영역만을 추출한다. 그리고 추출된 숫자 영역에 포함되어 있는 숫자로 인식 가능한 블롭들을 기 설정된 가중치 방식을 통해 숫자 데이터로 인식한다. 그리고 제어부(100)는 상기 인식된 숫자 데이터들을 이용하여 사용 가능한 전화번호 데이터로 조합하고 이를 사용자에게 제공한다. 따라서 본 발명에서는 디지털 방송시 전송되는 데이터의 구조를 변경하지 않고서도 상기 디지털 방송에서 방송되는 전화번호를 인식하고 이를 전화번호 데이터로 제공할 수 있다.
그리고 상기한 제어부(100)와 연결되는 메모리부(102)는, 상기 검출된 ROI에 대한 영역 정보를 저장하기 위한 저장 영역 및 상기 조합된 전화번호 데이터들을 저장하기 위한 저장 영역을 구비한다. 그리고 상기 숫자로 인식된 블롭들의 숫자 데이터 인식을 위해 사용되는 가중치 데이터들을 포함하여, 본 발명에서 사용되는 가중치 데이터들을 저장하기 위한 저장 영역을 구비한다. 이하 이러한 상기 메모리부(102)에 구비된 ROI에 대한 영역 정보가 저장되는 저장 영역을 ROI 영역 정보 저장부(120)라고 칭하고, 상기 조합된 전화번호 데이터들이 저장되는 영역을 전화번호 저장부(122)라 칭한다. 그리고 상기 가중치 데이터들이 저장되는 영역을 가중치 저장부(124)라고 칭하기로 한다.
이러한 메모리부(102)는 롬(ROM: Read Only Memory), 플래시 메모리(Flash memory), 램(RAM: Random Access Memory) 등으로 구성된다. 이 중에서 롬은 제어부(100)의 처리 및 제어를 위한 프로그램과 각종 참조 데이터를 저장한다. 그리고 램 은 제어부(100)의 워킹 메모리(working memory)를 제공하며, 플래시 메모리는 갱신 가능한 각종 보관용 데이터를 저장하기 위한 영역을 제공한다.
그리고 상기 글자 추출부(128)는 상술한 바와 같이, 상기 스캔된 I frame으로부터 ROI를 추출하기 위한 ROI 추출부(130)와, 상기 추출된 ROI를 이진화하기 위한 이진화부(132), 그리고 상기 이진화된 ROI로부터 비 텍스트 영역에 해당되는 블롭을 제거하기 위한 비 텍스트 영역 제거부(134) 및 상기 비 텍스트 영역이 제거된 ROI로부터 블롭들로 구성된 글자들 및 상기 글자들로 이루어진 글자열을 분할하기 위한 글자열 및 글자 분할부(136)를 포함한다.
상기 ROI 추출부(130)는 상기 제어부(100)의 제어에 따라 상기 스캔된 I frame으로부터 기 설정된 디스플레이 영역의 일부 영역들을, 우선순위에 따라 차례로 체크하여, 기 설정된 ROI 검출 조건에 따른 ROI가 포함되어 있는지를 체크한다. 여기서 상기 기 설정된 디스플레이 영역의 일부 영역이라는 것은, 상단, 하단의 경우 전체 디스플레이 영역 중 세로 길이의 일부에 해당되는 영역이거나 또는 좌측, 우측의 경우 전체 디스플레이 영역 중 가로 길이의 일부에 해당되는 영역을 말한다.
예를 들어 하단의 경우, 디스플레이 영역의 하한지점으로부터 위쪽 방향으로 전체 세로 길이의 1/5가 되는 디스플레이 영역이 될 수 있다. 그리고 상단의 경우 디스플레이 영역의 상단 지점으로부터 아래쪽 방향으로 전체 세로 길이의 1/5가 되는 디스플레이 영역이 될 수 있다. 그리고 좌측과 우측 역시 이와 마찬가지로, 좌측 또는 우측의 한계지점으로부터 우측 또는 좌측의 가로 길이의 일부에 해당되는 영역이 될 수 있다. 그리고 이처럼 설정된 디스플레이 영역들 중에서 기 설정된 ROI 검출 조건에 따라 해당 영역으로부터 ROI가 있는지를 검출한다.
여기서 상기 ROI 추출부(130)가 ROI를 검출하는 방법은 여러 가지가 있을 수 있다. 그중 한 예를 들어보면, 상기 디스플레이 일부 영역에 특정 색차 신호 레벨의 변화가 기 설정된 오차값 이하인 수평 주사선이 연속적으로 디스플레이되는 영역이 있는지를 체크함으로써 ROI 영역의 여부를 검출할 수 있다. 예를 들어 디지털 방송의 방송 화면의 경우, Y, Cb, Cr 색차 신호를 이용하여 방송 화면을 구성하고 이를 출력한다. 이러한 경우 상기 방송 화면은, 비디오 신호에 따라 서로 다른 레벨의 색차 신호들을 가진 수평 주사선의 출력을 통해 구성된다.
그런데 만약 전화번호가 출력되는 영역등은, 일정한 색차 신호의 레벨로 이루어진 바탕색으로 구분된 영역 안에 출력되는 경우가 많다. 이에 따라 이처럼 특정 바탕색으로 구분된 영역안의 경우, 색차 신호의 변화가 일정치 미만인 수평 주사선들로 구성된다. 그러나 예를 들어 동영상과 같은 방송 화면의 경우라면, 상기 수평 주사선들에 포함된 색차 신호의 변화는 매우 커져서 상기 일정치를 넘어서게 된다.
따라서 상기 색차 신호의 변화 정도가 상기 ROI 검출 조건이 될 수 있다. 즉, 이러한 경우 현재 선택된 디스플레이 영역 내에, 기준으로 설정된 특정 색차 신호의 변화가 일정치 미만인 수평 주사선이 기 설정된 개수 이상인 영역이 있는 경우, 상기 ROI 추출부(130)는 이 영역을 ROI라고 판단하고, 해당 영역으로부터 상하 좌우 좌표 및 폭과 높이에 대한 정보를 추출하여 이를 ROI의 영역 정보로 저장함으 로써 ROI를 검출할 수 있다.
그러면 이진화부(132)는 상기 검출된 ROI를 이진화한다. 여기서 상기 이진화부(132)는 상기 추출된 ROI를 이진화하기 위해, 히스토그램(histogram)을 이용한 Otsu's 이진화 방법을 사용할 수도 있다. 이러한 경우 상기 이진화부(132)는 검출된 ROI에 포함된 색차 신호들 중 Y(gray Level) 신호를 이용하여 상기 히스토그램의 최대 분산을 가지게 하는 임계값을 기준으로, 흰색 또는 흑색으로 상기 ROI에 포함된 색차 신호들을 이진화한다. 즉, 상기 이진화부(132)는 상기 ROI 내에서 색차 신호의 변화가 있는 부분을 흑색으로, 그 외의 부분은 흰색으로 분할한다. 그런데 이러한 경우 만약 상기 ROI가 반전이 되어 있는 상태라면, 즉, 상기 ROI의 바탕이 흰색이고, 그 ROI 내에서 색차 신호의 변화가 있는 부분이 흰색으로 이진화된 경우라면, 상기 이진화부(132)는 이를 반전하여 상기 색차 신호의 변화가 있는 부분을 흑색으로, 그 외의 부분을 흰색으로 분할되도록 한다.
그리고 상기 비 텍스트 영역 제거부(134)는, 상기 흑백으로 분할된 ROI에 블롭(blob)이, 비 텍스트 영역인지 텍스트 영역인지를 체크한다. 여기서 상기 블롭이라는 것은 덩어리를 의미하는 것으로서, 상기 흑색으로 표현된 영역들 중 서로 이어져 있는 하나의 덩어리들을 말하는 것이다.
상기 비 텍스트 영역 제거부(134)는 상기 블롭들의 각 상하 좌우 좌표 및 블롭들의 높이 및 너비를 구하고, 상기 블롭의 높이, 너비가 일반적으로 사용되는 텍스트의 임계값보다 큰 경우에는 이를 비 텍스트 영역으로 인식하고 제거한다. 일예를 들어 상기 ROI에 전화번호 정보와 상기 전화번호 정보를 둘러싸는 테두리가 포 함되어 있는 경우라면, 상기 테두리는 일반적인 텍스트 영역의 임계값의 너비보다 훨씬 큰 값을 가지므로 비 텍스트 영역 제거부(134)는 상기 테두리가 비 텍스트 영역임을 인지하고 이를 제거한다.
그리고 글자열 영역 및 글자 영역 분할부(136)는 상기 비 텍스트 영역이 제거된 블롭들을 분할하여 글자로 인식 가능한 블롭의 영역인 글자 영역 및 상기 글자 영역들로 이루어진 글자열 영역으로 상기 ROI를 분할한다. 여기서 상기 글자열 영역 및 글자 영역 분할부(136)는 수평 프로젝션(Projection)과 수직 프로젝션 방법을 이용할 수 있다. 즉 상기 이진화된 ROI에 수평 프로젝션 방법을 이용하여, 상기 ROI에 포함된 블롭들을 사영함으로써 해당 블롭들의 열영역을 분할하고, 분할된 블롭들의 열영역을 각각의 글자열 영역으로 인식한다. 여기서 만약 상기 글자열 영역의 높이가 기 설정된 조건에 부합되지 않는 경우 상기 글자열 영역 및 글자 영역 분할부(136)는 상기 블롭들의 열영역을 글자열 영역으로 인식하지 않는다. 그리고 글자열 영역으로 인식된 영역에 수직 프로젝션을 수행하여, 각 글자열 영역을 구성하고 있는 각 글자 영역들을 분할한다.
그리고 상기 전화번호 추출부(138)는 상술한 바와 같이, 상기 글자열 영역 및 글자 영역들로 분할된 영역들이 숫자로 인식 가능한 블롭들을 포함하고 있는지를 체크한다. 그리고 상기 분할된 적어도 하나의 글자열 영역들 중에서, 숫자로 인식 가능한 블롭들만을 포함하는 숫자 영역만을 추출하는 숫자 영역 추출부(140)와, 제어부(100)에 의해 상기 숫자로 인식 가능한 블롭들을 실제 숫자 데이터로 인식하는 숫자 인식부(142), 그리고 상기 인식된 숫자 데이터들을 이용하여 조합 가능한 전화번호를 생성하는 전화번호 조합부(144)를 포함한다.
여기서 상기 숫자 영역 추출부(140)는 상기 분할된 글자열 영역의 특징을 체크하여 기 설정된 숫자 판독 조건에 따라 상기 글자열 영역이 숫자로 인식 가능한 블롭들만을 포함하고 있는 숫자 영역인지 그렇지 않은지를 체크한다. 여기서 상기 숫자 판독 조건이라는 것은 상기 글자 영역을 이루고 있는 블롭들이 하나인가 또는 해당 글자로 인식된 적어도 하나의 블롭들의 간격과, 해당 글자열 영역으로부터 추출된 글자 영역의 간격 중앙값의 차이가 일정 수준 이상인가 또는, 상기 글자 영역에 포함된 블롭의 평균 높이가 상기 글자 영역의 높이 중앙값보다 일정 수준 이상 크거나 작지는 않은가와 같은 조건들을 말하는 것이다. 그리고 이러한 경우 상기 숫자 판독 조건에 해당되지 않는 블롭들은 문자로 인식된다.
그리고 인식된 문자들에 따라 상기 글자열 영역이 숫자 영역인지 그렇지 않은지를 판단한다. 그리고 상기 글자열 영역이 숫자 영역으로 검출된 경우라면 해당 글자열 영역을 숫자 영역으로 인식하고 이를 추출한다. 그리고 숫자 인식부(142)는 상기 숫자 영역으로 인식된 블롭들의 특징점을 분석하여 해당 블롭을 숫자 데이터로 인식한다. 여기서 상기 숫자 인식부(142)는 다양한 방법으로 상기 블롭을 숫자 데이터로 인식할 수 있다. 그중 하나의 예를 들면 상기 숫자 인식부(142)는, 신경망 네트워크를 이용하여, 얻고자 하는 숫자 데이터를 학습시켜 나온 가중치 데이터를 이용함으로써, 상기 숫자 영역의 각 블롭들이 어떤 숫자에 해당되는지를 인식할 수 있다. 그리고 상기 인식된 숫자들을 숫자 데이터로 저장한다.
그리고 상기 전화번호 조합부(144)는 상기 인식된 숫자 데이터들을 이용하여 가능한 전화번호 조합을 생성한다. 여기서 상기 전화번호 조합부(144)는 상기 숫자열에 포함된 공백 또는 ‘-’와 같은 특정 기호가 포함되어 있는 경우 상기 공백 또는 특정 기호로 인해 구분되는 각각의 영역에 따라 가능한 전화번호 조합을 생성한다. 그리고 생성된 전화번호 조합 결과를 저장한다.
그러면 제어부(100)는 상기 조합된 전화번호들을 표시부(106)를 통해 출력한다. 그러면 사용자는 상기 전화번호 조합 결과에 따른 전화번호들 중 어느 하나를 선택하여 이용할 수 있다. 즉, 상기 사용자는 상기 전화번호들 중 어느 하나를 선택하여 상기 전화번호에 따라 전화 또는 메시지를 비롯한 각종 서비스를 제공받을 수 있다. 따라서 본 발명에서는 디지털 방송 송신측과 수신측이 통상적인 디지털 방송의 데이터 전송 과정을 변경하지 않더라도 사용자에게 전화번호 정보를 제공할 수 있도록 한다.
그리고 디지털 방송 수신부(110)는 방송되는 디지털 방송 신호를 수신하여 이를 아날로그-디지털 변환한 후, 상기 제어부(100)에 인가한다. 그리고 스캔부(146)는 상기 제어부(100)의 제어에 따라 디코딩된 I frame을 스캔한다. 그리고 키 입력부(104)는 상기한 바와 같이 숫자키들을 포함한 각종 키들을 구비하며, 사용자로부터 입력되는 키 입력을 제어부(100)에 제공한다. 그리고 RF부(108)는 RF신호를 수신하는 역할을 한다. 그리고 수신된 신호를 IF(Intermediate Frequency)신호로 변환하여 디지털 방송 수신부(110)내에 구비된 베이스밴드 처리부로 출력한다. 여기서 상기 베이스밴드 처리부는 제어부(100)와 RF부(108)간의 인터페이스를 제공하는 BBA(Baseband Analog ASIC)로서, RF부(108)로부터 인가되는 아날로그 IF신호를 베이스밴드의 디지털 신호로 변환하여 디지털 방송 수신부(110)에 인가한다. 그리고 제어부(100)와 연결된 증폭부(112)는 스피커로 출력되는 오디오 신호를 증폭하는데, 스피커의 음량을 제어부(100)의 제어에 따라 조절한다.
도 2는 본 발명의 실시 예에 따라 디스플레이 영역에서 전화번호를 추출하는 전화번호 추출 동작의 흐름을 도시한 도면이다.
도 2를 참조하여 살펴보면, 본 발명의 실시 예에 따른 제어부(100)는 디지털 방송 데이터가 수신되는 경우 200단계로 진행하여 수신된 방송 데이터로부터 I frame를 디코딩하고 이를 스캔한다. 그리고 제어부(100)는 사용자의 선택이 있는 경우 본 발명의 실시 예에 따라 상기 스캔된 I frame으로부터 전화번호를 추출하기 위해 202단계로 진행하여 상기 글자 추출부(128)의 ROI 추출부(130)를 통해 ROI를 추출한다.
여기서 상기 제어부(100)는 기 설정된 순서에 따라 디스플레이 일부 영역들을 차례로 선택하여 상기 선택된 디스플레이 영역에 특정 색차 신호 레벨의 변화가 기 설정된 오차값 이하인 수평 주사선이 연속적으로 디스플레이되는 영역이 있는지를 체크함으로써 ROI 영역의 여부를 검출한다. 여기서 상기 색차 신호는 우선 Y 신호를 기준으로 색차 신호의 레벨 변화를 측정할 수 있으며, 상기 Y 신호를 기준으로 하였음에도 불구하고 ROI를 검출하지 못하면, Cb 신호를 기준으로, 그리고 Cb 신호를 기준으로 하였음에도 불구하고 ROI를 검출하지 못하면 Cr 신호를 기준으로 ROI를 검출할 수 있다. 이러한 경우 상기 Y 신호를 기준으로 하여 ROI가 검출된 경우에는 Cb, Cr 색차 신호를 이용한 검출은 수행하지 않을 수도 있음은 물론이다.
또한 상기 디스플레이 영역의 선택 순서는 일반적인 디지털 방송에서 전화번호가 표시되는 빈도가 가장 높은 영역의 순서대로 설정될 수 있다. 즉, 예를 들어 상기 전화번호가 표시되는 빈도가 높은 순서가 디스플레이 영역의 하단, 상단, 우측, 좌측의 순서라면, 제어부(100)는 기 설정된 하단의 디스플레이 영역에 ROI가 있는지를 검출하고, 다음 상단, 우측, 촤측의 차례로 ROI가 있는지를 검출한다. 그리고 ROI가 검출되면 검출된 ROI들의 영역 정보들을 저장한다. 이러한 상기 202단계의 ROI 추출 단계는 하기 도 3 및 도 4에서 자세히 예를 들어 살펴보기로 한다.
상기 202단계에서 ROI가 추출되면, 제어부(100)는 204단계로 진행하여 상기 검출된 ROI들 각각을 이진화 처리한다. 이 204단계에서는 상술한 바와 같이 상기 추출된 ROI를 이진화하기 위해 히스토그램(histogram)을 이용한 Otsu's 이진화 방법을 사용할 수도 있다. 그리고 상기 이진화부(132)는 ROI에 포함된 색차 신호들 중 Y 신호를 이용하여 해당 색차 신호의 값이 기 설정된 임계값 이상인 경우에는 흑색으로, 그리고 미만인 경우에는 흰색으로 이진화 할 수 있다. 그런데 여기서 만약 흑색으로 이진화된 ROI의 크기가 흰색보다 더 크다면, 상기 제어부(100)는 상기 ROI가 반전되어 있다고 판단하고, 이를 다시 반전하여 이진화 할 수도 있다.
그리고 상기 204단계에서 이진화가 완료되면, 제어부(100)는 206단계로 진행하여 상기 이진화된 ROI에서 비 텍스트 영역을 제거한다. 이 206단계에서 상기 제어부(100)는 상기 이진화된 ROI의 각 블롭들의 상하 좌우 좌표를 구하고, 각 블롭의 높이와 너비가 기 설정된 텍스트 임계값을 초과하는지 여부를 체크한다. 여기서 상기 블롭이라는 것은 서로 연결된 한 덩어리의 흑색으로 이진화된 영역을 말하는 것이다. 그리고 제어부(100)는 상기 블롭들 중 높이 또는 너비가 기 설정된 텍스트 임계값을 초과하는 블롭이 있는 경우 해당 블롭을 제거한다. 이에 따라 상기 206단계가 완료되면, 현재 해당 ROI에서는 높이와 너비가 텍스트 임계값 이하의 블롭들, 즉 글자들로 인식될 수 있는 블롭들만이 남게 된다. 이러한 상기 206단계의 과정을 하기 도 5를 참조하여 자세히 살펴보기로 한다.
그리고 상기 206단계가 완료되면, 제어부(100)는 상기 ROI 영역으로부터 글자열 영역 및 글자 영역을 분할하는 208단계로 진행한다. 여기서 상기 글자열 영역이라는 것은 글자 영역들로 인식될 수 있는 블롭들을 포함하는 영역을 말하는 것이다. 여기서 상기 제어부(100)는 우선 상기 ROI로부터 상기 글자열 영역을 분할하기 위한 수평 프로젝션을 수행하여 해당 ROI에 몇 개의 글자열 영역이 있는지를 체크하고, 체크된 글자열 영역들 중 기 설정된 조건에 따라, 전화번호 추출 대상으로 인식된 영역인지 여부를 체크한다. 그리고 상기 조건에 부합되는 글자열 영역들만을 추출한다. 여기서 제어부(100)는 상기 글자열 영역의 높이 중앙값을 구하고, 해당 글자열 영역의 높이가 기 설정된 사영 높이 하한치 미만이거나 기 설정된 사영 높이 상한치를 초과하는 경우 상기 글자열 영역을 전화번호 추출 대상 영역이 아니라고 판단할 수 있다. 여기서 상기 사영 높이 상한치와 사영 높이 하한치는 하기 도 7에서 설명하기로 한다.
그리고 제어부(100)는 상기 전화번호 추출 대상 영역에만 수직 프로젝션을 수행하여 해당 전화번호 추출 대상 영역을 구성하고 있는 글자 영역들을 분할한다. 그리고 각 분할된 글자 영역들의 좌표와 높이, 너비 등의 정보를 포함하는 영역 정 보와 상기 각 글자 영역들 사이 간격의 중앙값인 간격 중앙값을 구하여 이를 해당 전화번호 추출 대상 영역에 대한 정보로 저장한다. 이러한 과정을 하기 도 7과 도 8에서 자세히 살펴보기로 한다.
한편 상기 210단계에서 전화번호 추출 대상 영역 및 상기 전화번호 추출 대상 영역에 대한 영역 정보가 추출되면, 제어부(100)는 210단계로 진행한다. 여기서 상기 210단계는 상기 전화번호 추출 대상 영역에 포함된 각 글자 영역들을 체크하여 상기 전화번호 추출 대상 영역이 숫자로 인식될 수 있는 블롭들만을 포함하고 있는 숫자 영역인지를 판단하는 단계이다. 여기서 상기 210단계는 상기 전화번호 추출 대상 영역을 구성하는 각 글자 영역들에 대해, 해당 글자 영역이 다수의 블롭을 포함하고 있지는 않은지, 또는 해당 글자 영역에 포함된 블롭의 높이가 해당 전화번호 추출 대상 영역으로부터 추출된 글자 높이 중앙값보다 큰 오차로 차이가 있는지, 그리고 해당 선택된 글자 영역과 근접한 글자 영역들의 간격의 차가, 상기 간격 중앙값보다 일정 오차값 이상인지등을 체크하여 상기 전화번호 추출 대상 영역이 숫자로 인식 가능한 블롭들만을 포함하고 있는 영역인지 그렇지 않은지를 판단한다. 그리고 만약 상기 전화번호 추출 대상 영역이 숫자 영역이 아닌 경우 해당 영역에 포함된 각각의 글자 영역에 포함된 블롭들을 숫자로 인식 가능한 블롭들로 인식한다. 이러한 상기 210단계의 과정을 하기 도 9a, 9b 및 도 10에서 자세히 살펴보기로 한다.
그리고 제어부(100)는 212단계로 진행하여 상기 숫자로 인식가능한 블롭들의 특징점을 분석하여 각각의 블롭들을 숫자 데이터로 인식한다. 여기서 상기 212단계 는 신경망 네트워크를 이용하여, 얻고자 하는 숫자 데이터를 학습시켜 나온 가중치 데이터를 이용함으로써, 상기 숫자 영역의 각 블롭들이 어떤 숫자에 해당되는지를 인식하는 과정이 될 수 있다. 그리고 상기 인식된 숫자들을 숫자 데이터로 저장한다.
그리고 제어부(100)는 214단계로 진행하여 상기 저장된 숫자 데이터들을 이용하여 조합 가능한 전화번호를 생성한다. 여기서 상기 214단계는 상기 숫자열에 포함된 공백 또는 ‘-’와 같은 특정 기호가 포함되어 있는 경우 상기 공백 또는 특정 기호로 인해 구분되는 각각의 영역에 따라 가능한 전화번호 조합을 생성하는 과정이 될 수 있다. 이러한 상기 숫자 데이터를 이용하여 전화번호를 조합하는 과정을 하기 도 11을 참조하여 자세히 살펴보기로 한다.
그리고 제어부(100)는 216단계로 진행하여 상기 202단계에서 추출된 모든 ROI들이 상기 204단계에서 214단계에 이르는 전화번호 정보 검출 과정을 거쳤는지 체크한다. 그리고 상기 216단계의 체크 결과 만약 전화번호 검출 과정을 거치지 않은 ROI가 있다면, 제어부(100)는 218단계로 진행하여 해당 ROI를 선택한다. 그리고 상기 선택된 ROI에 대해 다시 204단계에서 214단계에 이르는 과정을 반복한다.
그러나 만약 상기 216단계에서 모든 ROI들이 전화번호 정보를 검출하는 단계를 거친 후라면 제어부(100)는 220단계로 진행하여 상기 현재까지 조합된 전화번호들을 출력한다. 그러면 사용자는 상기 전화번호들 중 어느 하나를 선택할 수 있고, 선택된 전화번호를 통해 전화를 하거나 메시지를 전송과 같은 서비스를 제공받을 수 있다. 따라서 본 발명에서는 디지털 방송 송신측과 수신측이 통상적인 디지털 방송의 데이터 전송 과정을 변경하지 않더라도 사용자에게 전화번호 정보를 제공할 수 있도록 한다.
도 3은 이러한 본 발명의 전화번호 추출 동작 중 ROI 영역을 추출하는 202단계의 ROI 영역 추출 동작 과정을 자세히 도시한 도면이다. 그리고 도 4는 본 발명의 전화번호 추출 동작 중 ROI 영역 추출 동작의 예를 보이고 있는 도면이다.
도 3을 참조하여 살펴보면, 상기 200단계에서, 제어부(100)가 수신된 디지털 방송 데이터로부터 디코딩된 I frame을 스캔하면, 제어부(100)는 300단계로 진행하여 기 설정된 첫 번째 순서에 따른 어느 하나의 디스플레이 영역을 선택한다. 여기서 상기 기 설정된 우선순위라는 것은 상술한 바와 같이 일반적인 디지털 방송에서 전화번호가 표시되는 빈도가 가장 높은 영역에 따른 우선순위를 말하는 것이다. 일반적으로 이러한 우선순위는 하단, 상단, 우측, 좌측의 순서로 설정될 수 있으나, 이는 경우에 따라 변경될 수 있음은 물론이다. 그리고 여기서 상기 디스플레이 영역이라는 것은 상술한 바와 같이 표시부(106)의 디스플레이 전체 영역을 말하는 것이 아니라 상기 전체의 디스플레이 영역 중 기 설정된 일정 부분을 말하는 것이다. 즉, 상단의 경우 전체 디스플레이 영역의 하한으로부터 기 설정된 간격만큼의 디스플레이 영역이 될 수 있고, 하단의 경우 전체 디스플레이 영역의 상한으로부터 기 설정된 간격만큼의 디스플레이 영역이 될 수 있다.
이러한 디스플레이 영역의 예를 도 4의 (a)를 참조하여 살펴보기로 한다. 도 4의 (a)에서는 상기 DMB 방송 시청중인 화면의 디스플레이 영역 중 하단 영역으로 설정된 디스플레이 영역의 예를 보이고 있는 도면이다. 이러한 경우 본 발명에서는 상기 도 4의 (a)에서 보이고 있는 바와 같이 전체 디스플레이 영역의 세로 길이인 전체 높이 중 일부에 해당하는 영역을 선택하여 ROI가 있는지를 검출한다.
그리고 300단계에서와 같이 기 설정된 우선순위에 따른 특정 디스플레이 영역이 선택되는 경우, 제어부(100)는 302단계로 진행하여 현재 선택된 디스플레이 영역에, 특정 색차 신호 레벨의 차가 기 설정된 색차 신호 임계값 이하인 수평 주사선의 개수가 일정 개수 이상으로 구성된 영역이 있는지를 체크한다.
이는 상술한 바와 같이 일반적으로 전화번호 정보가 디스플레이 화면에 표시되는 경우, 특정 바탕색을 가진 화면위에 전화번호 정보가 표시되는 경우가 많기 때문이며, 또한 전화번호 정보의 경우 일반적으로 각각의 번호들은 동일한 색으로 표시되기 때문이다. 이러한 경우 상기 전화번호가 표시된 영역은 유사한 컬러를 가지는 색차 신호가 동화상 정보가 표시되는 영역보다 많아지게 되는 것은 당연하므로, 상기 색차 신호의 차가 일정치 미만인 디스플레이 영역인 경우 상기 영역은 유사한 컬러로 표현된 영역이 일정 크기 이상이라는 의미가 된다.
따라서 제어부(100)는, 상기 유사한 컬러로 표현된 영역이 일정 크기 이상인 경우, 이러한 영역에 전화번호 정보가 포함될 가능성이 높은 영역이라고 판단한다. 이에 따라 제어부(100)는 상기 302단계의 체크 결과, 특정 신호 레벨의 차가 색차 신호 임계값 이하인 수평 주사선의 개수가 일정 개수 이상으로 구성된 영역이 있는 경우라면, 304단계로 진행하여 상기 유사한 컬러로 표현된 영역이 일정 크기 이상인 영역을 ROI, 즉 관심 영역으로 판단한다.
또한 여기서 상기 특정 색차 신호는 Y 신호, Cb 신호 또는 Cr 신호 중 어느 하나가 될 수 있다. 이러한 경우 상기 제어부(100)는 Y 신호, Cb 신호, Cr 신호의 레벨값을 기준으로 ROI를 검출할 수 있다. 즉, 상기 Y 신호의 레벨값을 기준으로 우선 색차 신호 레벨차가 임계값 이하인 수평 주사선의 개수가 일정 개수 이상인지를 체크함으로써 ROI가 해당 디스플레이 영역에 있는지를 검출할 수 있다. 그리고 Y 신호 레벨값을 이용하여 ROI를 검출하지 못할 경우 Cb 신호의 레벨값을, 그리고 Cb 신호의 레벨값을 이용하여 ROI를 검출하지 못할 경우에는 Cr 신호의 레벨값을 이용하여 ROI를 검출할 수 있다.
상기 도 4의 (b)를 참조하여 상기 ROI를 검출하는 예를 살펴보기로 한다. 도 4의 (b)를 참조하여 살펴보면, 도 4의 (b)에서는 '123-456-7890' 이라는 전화번호 정보가 표시된 영역의 예를 보이고 있는 도면이다. 이러한 경우 일반적으로 전화번호 정보는 특정 색의 바탕색 위에 표시되는 경우가 많다. 이러한 경우 제어부(100)는 상기 도 4의 (b)에서 보이고 있는 바와 같이 상기 ROI로 선택된 영역에서 특정 색차 신호 레벨의 차가 일정값 이하인 수평 주사선의 개수가 일정 개수 이상인 영역을 검출한다. 그리고 도 4의 (b)에서 보이고 있는 영역의 경우라면, 바탕색과 흑색의 전화번호 정보만으로 표시되어 있으므로, 이 영역은 특정 색차 신호 레벨의 차가 일정값 이하인 수평 주사선의 개수가 일정 개수 이하가 된다. 그러면 제어부(100)는 상기 도 4의 (b)에서 보이고 있는 영역을 304단계에서 ROI로 인식한다.
그리고 제어부(100)는 306단계로 진행하여 상기 ROI로 인식된 영역에 대한 영역 정보를 저장한다. 여기서 영역 정보라는 것은 상기 ROI로 인식된 영역의 상하 좌우 좌표에 대한 정보 및 상기 ROI로 인식된 영역의 너비와 높이에 대한 정보를 말하는 것이다. 상기 도 4의 (b)와 같은 경우에 ROI로 인식된 영역에 해당되는 영역 정보를 저장하는 예를 도 4의 (c)에서 보이고 있다. 도 4의 (c)를 참조하여 살펴보면, 제어부(100)는 상기 도 4의 (b)와 같은 ROI를 인식한 경우, 도 4의 (c)에서 보이고 있는 바와 같이 인식된 ROI의 상하 좌표를 통해 상기 ROI의 너비와 높이를 측정하여 이를 저장한다. 그리고 제어부(100)는 308단계로 진행한다.
그러나 한편 상기 302단계에서, 현재 선택된 디스플레이 영역에 특정 색차 신호 레벨의 차가 기 설정된 색차 신호 임계값 이하인 수평 주사선의 개수가, 일정 개수 미만인 경우라면 제어부(100)는 바로 308단계로 진행한다. 그리고 상기 302단계 또는 상기 306단계를 통해 308단계로 진행하면, 제어부(100)는 기 설정된 우선순위에 따른 모든 디스플레이 영역이 상기 ROI를 검출하는 과정을 거쳤는지를 체크한다. 그리고 상기 308단계의 체크 결과 기 설정된 우선순위에 따른 모든 디스플레이 영역의 ROI를 검출하는 과정을 거치지 않은 경우라면, 제어부(100)는 310단계로 진행하여 기 설정된 다음 우선순위에 따른 디스플레이 영역을 선택한다. 이러한 경우 제어부(100)는 다시 302단계로 진행하여 선택된 디스플레이 영역에 특정 색차 신호 레벨의 차가 임계값 이하인 수평 주사선의 개수가, 일정 개수 이상인지를 검출한다. 그리고 모든 디스플레이 영역이 ROI를 검출하는 과정을 거칠 때까지 302단계에서 308단계에 이르는 과정들을 반복한다.
그리고 만약 상기 308단계에서 모든 디스플레이 영역이 ROI를 검출하기 위한 과정을 거친 경우라면, 제어부(100)는 312단계로 진행하여 영역 정보가 저장된 ROI가 있는지, 즉 검출된 ROI가 있는지 여부를 체크한다. 그리고 만약 상기 디스플레 이 영역들 중 검출된 ROI가 있는 경우라면, 제어부(100)는 204단계로 진행하여 상기 추출된 ROI의 이진화 과정을 수행한다. 그러나 만약 상기 312단계의 체크 결과 검출된 ROI가 없는 경우라면, 제어부(100)는 디지털 방송 화면에서 전화번호를 추출하는 동작을 종료한다. 이러한 경우 사용자에게 추출된 전화번호가 없음을 알리는 메시지를 출력할 수도 있음은 물론이다.
도 5는 본 발명의 전화번호 추출 동작 중 비 텍스트 영역을 제거하는 상기 206단계의 비 텍스트 영역 제거 동작 과정을 자세히 도시한 도면이다. 그리고 도 6은 본 발명의 전화번호 추출 동작 중 비 텍스트 영역 제거 동작의 예를 보이고 있는 도면이다.
도 5를 참조하여 살펴보면, 본 발명의 실시 예에 따른 디지털 방송 수신 단말기의 제어부(100)는, 상기 204단계에서 ROI의 이진화 과정이 완료되면, 500단계로 진행하여 상기 이진화된 ROI 내의 각 블롭들의 영역을 측정한다. 여기서 상기 블롭이라는 것은 상술한 바와 같이 ‘덩어리’를 의미하는 것으로서, 상기 이진화 결과 흑색으로 표현된 영역들 중 서로 이어져 있는 하나의 덩어리를 말하는 것이다.
그리고 상기 500단계를 통해 상기 ROI 내의 각 블롭들의 영역을 측정한 제어부(100)는 502단계로 진행하여 상기 각 블롭들의 크기가 기 설정된 텍스트(txt) 임계값을 초과하는지 여부를 체크한다. 여기서 텍스트 임계값이라는 것은 텍스트에 해당되는 블롭들만을 추출하기 위해 기 설정된 값으로, 일반적으로 텍스트 글자에 해당되는 너비 임계값과 높이 임계값이 될 수 있다. 이러한 경우 상기 블롭의 너비 및 높이와, 상기 기 설정된 텍스트 임계값에 포함된 너비 임계값 및 높이 임계값의 차가, 일정 오차값의 범위를 벗어나면 상기 블롭은 텍스트 글자가 아니라고 판단될 수 있다. 즉, 예를 들어 상기 ROI 내의 테두리와 같은 경우 이러한 블롭은 하나의 블롭이지만 그 너비가 텍스트 글자보다 훨씬 넓다, 이러한 경우 상기 제어부(100)는 상기 블롭을 비 텍스트 영역이라고 판단하고 이를 제거한다.
이러한 예를 도 6을 참조하여 살펴보면, 도 6의 (a)에서는 텍스트 글자가 아닌 블롭들이 포함되어 있는 ROI를 보이고 있는 도면이다. 이러한 경우 제어부(100)는 상기 500단계에서 각 블롭의 영역을 측정한다. 이러한 경우 상기 도 6의 (a)에서 보이고 있는 ROI는 식별기호 600의 도형이나 식별기호 602의 테두리, 그리고 각각의 숫자들과 ‘-’ 기호로 블롭들이 구분되어 지고, 각각의 영역의 크기가 측정된다.
이러한 경우 제어부(100)는 502단계로 진행하여 상기 블롭들 중 측정된 영역의 크기가 기 설정된 텍스트 임계값을 일정 오차이상 초과하는 블롭이 있는지를 체크한다. 따라서 이 502단계에 의해 상기 도 6의 (a)에서 보이고 있는 ROI는 도 6의 (b)에서 보이고 있는 바와 같이 테두리(602)가 제거되고, 도 6의 (c)에서 보이고 있는 바와 같이 도형(600)이 제거된다. 그리고 결과적으로 도 6의 (c)에서 보이고 있는 바와 같이 텍스트 임계값 이하의 너비와 높이를 갖는 블롭들만이 최종적으로 남게 된다. 이러한 경우 상기 제어부(100)는 상기 남은 블롭들을 글자, 즉 숫자 또는 문자와 기호로 인식 가능한 블롭으로 인식한다. 그러면 제어부(100)는 208단계로 진행하여, 너비 또는 높이가 상기 텍스트 임계값을 일정 오차이상 초과하는 블 롭들이 제거된 ROI 영역으로부터, 상기 글자로 인식 가능한 블롭들의 열에 따른 영역인 글자열 영역 및 상기 글자열 영역에 포함된 블롭들을 각각 글자 영역으로 분할하는 동작을 수행한다.
도 7은 이러한 본 발명의 실시 예에 따라 추출된 ROI로부터 글자열 영역 및 글자 영역을 분할하는 글자열 영역 및 글자 영역 분할 동작 과정을 자세히 도시한 도면이다. 그리고 도 8은 이러한 206단계의 글자열 영역 분할 및 글자 영역 분할의 예를 보이는 도면이다.
도 7을 참조하여 살펴보면, 상기 204단계에서 너비 또는 높이가 기 설정된 텍스트 임계값을 일정 오차이상 초과하는 블롭들이 제거되면, 제어부(100)는 700단계로 진행하여 상기 ROI에 수평 프로젝션을 수행한다. 여기서 상기 수평 프로젝션이라는 것은 도 8의 (a)에서 보이고 있는 바와 같이, 상기 ROI에 상기 글자로 인식가능한 블롭들의 열(이하 글자열이라고 칭한다)의 영역이 몇 개나 있는지를 인식하기 위한 과정을 말한다. 즉, 상기 수평 프로젝션, 즉 사영(射影)을 수행하면 도 8의 (a)에서 보이고 있는 바와 같이 제어부(100)는 상기 ROI에 상기 글자열 영역이 몇 개나 있는지를 인식할 수 있다.
그러면 제어부(100)는 702단계로 진행하여, 상기 수평 프로젝션을 통해 인식된 적어도 하나의 글자열 영역들 중 어느 하나를 선택한다. 그리고 제어부(100)는 704단계로 진행하여 상기 선택된 글자열 영역의 영역 정보 및 상기 글자열 영역의 높이 중앙값을 추출한다. 여기서 상기 높이 중앙값이라는 것은 상기 글자열 영역으로 인식된 영역의 높이 중앙값을 말하는 것이다.
그리고 제어부(100)는 706단계로 진행하여, 기 설정된 조건에 부합되는지 여부를 체크하여 상기 글자열 영역이 본 발명의 실시 예에 따라 전화번호 정보를 포함하고 있는 전화번호 추출 대상 영역인지 아닌지를 판단할 수 있다. 이는 상기 선택된 글자열 영역이 일정한 높이를 가진 글자 영역들로 구성된 영역인지 여부를 판단하기 위한 것이다.
여기서 상기 706단계에서는 상기 글자열 영역이 전화번호 정보 추출 대상 영역인지 아닌지를 판단하는 기준으로 상기 글자열 영역의 사영된 높이를 이용할 수 있다. 즉 상기 글자열 영역의 사영된 높이가 기 설정된 사영 높이 상한치를 초과하거나, 또는 상기 사영된 높이가 기 설정된 사영 높이 하한치 미만이 아닌 경우에만 상기 글자열 영역을 전화번호 정보를 포함하고 있는 전화번호 추출 대상 영역으로 판단할 수 있다.
이러한 경우 상기 사영 높이 상한치 또는 사영 높이 하한치는 상기 글자열의 높이 중앙값에 의해 상대적으로 결정될 수 있다. 즉 상기 글자열 영역의 사영된 높이가 상기 글자열 영역의 높이 중앙값에 비해, 글자열 영역이라고 보기에는 너무 높거나 너무 낮지 않은 경우에만 상기 글자열 영역이 상기 전화번호 정보를 포함하고 있는 영역이라고 판단할 수 있다. 이러한 경우 상기 사영 높이 상한치와 사영 높이 하한치는 하기 수학식 1과 수학식 2를 통해 구해질 수 있다.
사영 높이 상한치 = 상한 가중치 X 해당 글자열 영역의 높이 중앙값
사영 높이 하한치 = 하한 가중치 X 해당 글자열 영역의 높이 중앙값
여기서 상기 상한 가중치와 하한 가중치는 실험 등을 통해 기 설정된 값이다. 이러한 경우 해당 글자열 영역의 높이에 따라 구해지는 높이 중앙값에 따라 상기 사영 높이 상한치 및 사영 높이 하한치가 구해질 수 있으므로, 상기 글자열 영역의 높이에 따라 상대적으로 상기 글자열 영역이 전화번호를 포함하고 있는 영역인지 그렇지 않은지를 판단할 수 있다.
여기서 상기 706단계에서, 상기 206단계에서 비 텍스트 영역을 제거했음에도 불구하고 상기 글자열 영역들을 다시 한번 필터링하는 이유는 전화번호 정보들을 포함하고 있는 글자열 영역들을 보다 정밀하게 추출하기 위해서이다. 즉, 예를 들어 206단계에서는 기 설정된 텍스트 임계값을 이용하여 텍스트가 아니라고 판단되는 블롭들을 제거한다. 그런데 이러한 경우 상기 텍스트 임계값을 너무 제한할 경우, 만약 전화번호 정보에 해당되는 블롭들의 크기가 크다면, 상기 전화번호 정보까지도 비 텍스트 영역으로 판단되어 제거될 우려가 있다. 이에 따라 상기 텍스트 임계값은 일반적으로 텍스트와 크게 차이가 나는 블롭들만을 제거할 수 있는 수준으로 설정되기 때문이다.
따라서 이러한 경우 상기 비 텍스트 영역 제거만을 수행한다면, 글자가 아닐지라도 상기 텍스트 영역으로 인식되어 남아있는 경우가 있을 수 있다. 이를 위해 상기 706단계에서는 상기 상한 가중치 및 하한 가중치를 이용하여 상기 글자열 영역의 높이 중앙값과 높이의 비를 이용하여 한 번 더 추출하는 것이다. 이에 따라 상기 글자열 영역이 글자로 인식 가능한 블롭들을 포함하고 있는 영역으로 판단하 기에는 비정상적으로 높이가 높거나 또는 비정상적으로 높이가 낮은 경우라면, 해당 글자열 영역은 글자로 인식 가능한 블롭 외에 다른 블롭이 있는 것으로 인식되어, 전화번호를 추출하기 위한 전화번호 추출 대상 영역으로 인식되지 않는다.
따라서 706단계에서, 현재 선택된 글자열 영역이 상기 기 설정된 조건(이하 글자열 조건)에 부합되는 경우라면, 제어부(100)는 708단계로 진행하여 해당 글자열 영역을 전화번호 추출 대상 영역으로 인식한다. 그리고 제어부(100)는 710단계로 진행하여 상기 전화번호 추출 대상 영역으로 인식된 영역에 수직 프로젝션을 수행한다. 여기서 상기 수직 프로젝션이라는 것은 상기 전화번호 추출 대상 영역으로 인식된 글자열 영역에 포함되어 있는 글자 영역들을 분할하기 위한 것이다.
도 8의 (b)는 이러한 수직 프로젝션의 예를 보이고 있는 도면이다. 이를 참조하여 살펴보면, 수직 프로젝션을 수행하면 해당 글자열 영역에 해당되는 글자 영역들의 위치 및 각 글자 영역들의 너비, 그리고 각 글자 영역들 사이의 간격에 대한 정보를 얻을 수 있다. 이에 따라 제어부(100)는 710단계의 수직 프로젝션이 완료되면, 712단계로 진행하여 상기 글자열 영역에 포함된 각 글자 영역들의 정보를 추출하고, 상기 각 글자 영역들 사이의 간격에 대한 정보를 통해 상기 각 글자 영역 사이 간격들의 중앙값인 간격 중앙값을 구한다. 그러면 제어부(100)는 현재 ROI의 수평 프로젝션을 통해 인식된 모든 글자열 영역들이 체크되었는지를 확인하는 714단계로 진행한다.
한편 만약 상기 706단계에서 현재 선택된 글자열 영역이 기 설정된 조건에 부합되지 않는 경우라면, 제어부(100)는 바로 상기 714단계로 진행한다. 이 714단 계에서 제어부(100)는 상기 수평 프로젝션을 통해 인식된 각 글자열 영역들이 상기 704단계에서 712단계에 이르는 과정을 거쳐 전화번호 추출 대상 영역인지를 체크하였는지를 체크한다. 그리고 만약 상기 인식된 글자열 영역들 중 아직 체크되지 않은 글자열 영역이 있는 경우라면 제어부(100)는 716단계로 진행하여 상기 체크되지 않은 어느 하나의 다른 글자열 영역을 선택하고 상기 704단계에서 712단계에 이르는 과정을 반복한다.
그러나 만약 상기 714단계에서, 상기 수평 프로젝션을 통해 인식된 모든 글자열 영역들이 상기 전화번호 추출 대상 영역인지를 체크하는 과정을 거쳤다면, 제어부(100)는 718단계로 진행하여 현재까지 전화번호 추출 대상 영역으로 인식된 글자열 영역이 있는지를 체크한다. 그리고 만약 상기 글자열 영역들 중 전화번호 추출 대상 영역으로 인식된 영역이 있는 경우라면, 제어부(100)는 210단계로 진행하여 현재까지 전화번호 추출 대상 영역으로 인식된 영역들 중에서 숫자로 인식 가능한 블롭들만을 포함하고 있는 숫자 영역만을 추출한다. 그러나 만약 상기 718단계에서 상기 전화번호 추출 대상 영역으로 인식된 영역이 없는 경우라면 제어부(100)는 216단계로 진행하여 상기 202단계에서 추출된 모든 ROI들이 상기 204단계에서 214단계에 이르는 전화번호 정보 검출 과정을 거쳤는지 체크한다.
도 9a와 도 9b는 본 발명의 전화번호 추출 동작 중 숫자 영역을 추출하는 210단계를 자세히 도시한 도면이다. 그리고 도 10은 본 발명의 숫자 영역 추출 동작 중, 해당 숫자 영역에 포함된 블롭에 따라 해당 영역이 숫자 영역인지 여부를 판단하는 예를 보이는 도면이다.
우선 도 9의 (a)를 참조하여 살펴보면 상기 208단계를 통해 ROI를 구성하는 각 글자열 영역 및 글자 영역들이 분할되고 그 중에서 전화번호 추출 대상 영역으로 인식된 글자열 영역이 있는 경우라면, 제어부(100)는 900단계로 진행하여 기 설정된 순서에 따른 어느 하나의 전화번호 추출 대상 영역을 선택한다. 그리고 제어부(100)는 902단계로 진행하여 상기 선택된 영역에서, 수직 프로젝션을 통해 분할된 글자 영역들 중 어느 하나를 선택한다.
그리고 제어부(100)는 904단계로 진행하여 상기 선택된 글자 영역에 포함된 블롭이 두개 이상인지 여부를 체크한다. 그리고 만약 상기 선택된 글자 영역이 두개 이상의 블롭을 포함하는 경우라면 상기 제어부(100)는 916단계로 진행하여 상기 글자 영역에 포함된 블롭들을 숫자가 아닌 문자로 인식 가능한 블롭들로 판단한다. 도 10의 (a)는 이러한 경우의 예를 보이고 있는 예이다.
즉 상기 도 10의 (a)에서 보이고 있는 바와 같이 ‘고’라는 문자는 ‘ㄱ’과 ‘ㅗ’의 두 개 블롭으로 이루어진다. 그러나 일반적으로 숫자는 1,2,3 등과 같이 단일 블롭이다. 따라서 두개 이상의 블롭을 포함하는 글자 영역의 경우, 해당 글자 영역의 블롭들은 숫자로 인식되지 않는다. 이러한 경우 제어부(100)는 916단계로 진행하여 상기 선택된 글자 영역의 블롭들을 문자로 인식하고, 918단계로 진행하여 현재 선택된 전화번호 추출 대상 영역의 모든 글자 영역들이 선택되었는지 여부를 체크한다.
그러나 만약 상기 904단계에서 상기 선택된 글자 영역이 1개의 블롭으로 구성되어 있는 경우라면, 제어부(100)는 906단계로 진행하여 상기 선택된 글자 영역 과 근접한 글자 영역의 간격에 따른 너비가, 현재 선택된 전화번호 추출 대상 영역으로부터 추출된 간격 중앙값에 따른 너비보다 일정 오차값 이하로 작은지를 체크한다. 그리고 현재 선택된 글자 영역과 근접한 글자 영역의 너비가 간격이 상기 간격 중앙값에 따른 너비보다 일정 오차값이상 작은 경우 916단계로 진행하여 해당 글자 영역을 문자로 인식 가능한 블롭들의 영역으로 인식한다. 여기서 상기 근접한 글자 영역이라는 것은 상기 선택된 글자 영역의 좌측 또는 우측에 위치한 글자 영역들 중 어느 하나의 영역을 말한다.
이는 예를 들어 ‘가’, 나’등과 같이, 모음이 자음의 좌측에 위치하는 문자들의 경우에 상기 모음과 자음이 수직 프로젝션의 결과 별개의 글자 영역으로 인식될 수 있는 가능성이 있기 때문이다. 따라서 이러한 경우 상기 자음과 모음이 각각의 글자 영역으로 인식된다면, 하나의 글자 영역에 포함된 블롭의 수는 한 개이지만, 상기 글자 영역 사이의 간격은 좁아지게 된다.
도 10의 (b)는 이러한 경우의 예를 보이고 있는 도면이다. 이를 참조하여 살펴보면, ‘다’라는 문자의 경우 자음과 모음이 별개의 글자 영역으로 인식되면, 상기 자음‘ㄷ'과 모음‘ㅏ’는, 도 10의 (b)에서 보이고 있는 바와 같이 간격이 일정 오차 이상 좁아지게 된다. 띠라서 이러한 경우라면, 상기 글자들의 간격은 해당 전화번호 추출 대상 영역의 글자 영역들로부터 추출된 간격 중앙값보다 작다. 따라서 이러한 경우 제어부(100)는 916단계로 진행하여 상기 선택된 글자 영역에 따른 블롭을 문자로 인식하고, 918단계로 진행하여 현재 선택된 전화번호 추출 대상 영역의 모든 글자 영역들이 선택되었는지 여부를 체크한다.
그리고 제어부(100)는 상기 906단계에서 현재 선택된 글자 영역과 근접한 글자 영역과의 간격이, 현재 선택된 전화번호 추출 대상 영역으로부터 추출된 간격 중앙값보다 큰 경우라면, 제어부(100)는 908단계로 진행하여 상기 선택된 글자가 ‘-’기호가 아닌지를 체크한다. 이는 기 저장된‘-’기호의 특성을 이용하여 판단할 수 있다.
도 10의 (d)는 이처럼 ‘-’ 기호의 특징으로 보이고 있는 도면이다. 즉, 예를 들어 도 10의 (d)에서 보이고 있는 것처럼 ‘-’기호의 경우 높이가 2 픽셀 또는 3 픽셀이하라고 가정할 수 있고, 또한 너비는 평균 글자 영역들의 너비에 근접한다고 가정할 수 있다. 즉 상기 ‘-’문자는 높이가 기 설정된 픽셀 이하이고, 너비가 상기 글자열 영역에 포함된 글자 영역들의 너비 평균값 또는 중앙값에 해당되는 경우 상기 선택된 글자 영역에 포함된 블롭을 ‘-’기호로 인식할 수 있다.
따라서 상기 908단계의 인식 결과 상기 선택된 글자 영역의 블롭이 ‘-’기호로 인식된 경우라면, 제어부(100)는 914단계로 진행하여 상기 선택된 글자 영역의 블롭을 ‘-’기호로 인식하고, 918단계로 진행하여 현재 선택된 전화번호 추출 대상 영역의 모든 글자 영역들이 선택되었는지 여부를 체크한다.
그리고 상기 908단계의 체크 결과, 상기 해당 글자 영역의 블롭이 ‘-’기호가 아닌 경우라면 제어부(100)는 910단계로 진행하여 해당 글자 영역에 포함된 블롭의 높이와 현재 선택된 전화번호 추출 대상 영역의 높이 중앙값과의 차이를 구하고, 구해진 차이가 기 설정된 크기를 초과하는지 또는 기 설정된 크기 미만인지를 체크한다. 이는 상기 글자 영역에 포함된 블롭이 숫자 또는 '-' 기호가 아닌 다른 기호 등인지를 구별하여 추출해내기 위한 것이다.
즉, 상기 수평 프로젝션의 경우에는 상기 글자열 영역 전체를 사영하여 전체 글자열 영역의 크기가 전화번호 정보를 포함하고 있는 영역인지 여부를 체크한다. 그러나 이러한 경우 만약 상기 글자열 영역 내에 각 글자 영역보다 낮은 높이의 블롭이 포함되어 있는 경우에는, 상기 수평 프로젝션으로는 상기 낮은 높이의 블롭을 추출할 수 없다. 이에 따라 제어부(100)는 상기 910단계를 통해 현재 선택된 글자 영역이 상기 전화번호 추출 대상 영역으로부터 추출된 높이 중앙값보다 보다 낮거나 높은 블롭을 포함하는 경우, 즉 ‘-’기호가 아니면서, 다른 글자 영역보다 낮은 높이를 가지거나 높은 높이를 가진 블롭을 포함하는 글자 영역인 경우라면 이를 916단계로 진행하여 해당 글자 영역에 포함된 블롭을 문자로 인식한다. 그리고 918단계로 진행하여 현재 선택된 전화번호 추출 대상 영역의 모든 글자 영역들을 체크하였는지 여부를 체크한다.
그러나 만약 상기 910단계에서 상기 현재 선택된 글자 영역에 포함된 블롭의 높이와, 해당 전화번호 추출 대상 영역으로부터 추출된 높이 중앙값과의 차이가 기 설정된 차이 미만인 경우라면, 제어부(100)는 912단계로 진행하여 현재 선택된 글자 영역이 숫자로 인식 가능한 블롭들만을 포함하는 숫자 영역으로 인식한다. 그리고 제어부(100)는 918단계로 진행하여 현재 선택된 전화번호 추출 대상 영역의 모든 글자 영역들이 선택되었는지 여부를 체크한다. 그리고 상기 918단계의 체크 결과 현재 선택된 전화번호 추출 대상 영역들에 포함된 모든 글자 영역들이 체크되지 않은 경우라면 920단계로 진행하여 현재까지 체크되지 않은 다른 글자 영역을 선택 한다. 그리고 904단계로 진행하여, 상기 904단계에서 918단계에 이르는, 상기 선택된 글자 영역에 포함된 블롭들이 문자인지 ‘-’기호인지, 아니면 숫자로 인식 가능한 블롭인지를 판단하는 과정을 반복한다. 그러나 만약 상기 918단계의 체크 결과 해당 전화번호 추출 대상 영역의 모든 글자 영역들이 체크된 경우라면 제어부(100)는 도 9의 (B)의 950단계로 진행하여 해당 라인이, ‘-’ 기호를 제외하고, 문자로 인식된 블롭들을 포함하는 글자 영역들이 가 2개 이상 연속되었는지 여부를 체크한다.
그리고 상기 950단계의 체크 결과, 만약 상기 해당 전화번호 추출 대상 영역이, ‘-’ 기호를 제외하고, 문자로 인식된 블롭들을 포함하는 글자 영역들이 2개 이상 연속되지 않은 경우라면, 상기 제어부(100)는 952단계로 진행하여 현재 선택된 전화번호 추출 대상 영역을 숫자로 인식 가능한 블롭들만을 포함하는 숫자 영역으로 인식한다. 그리고 제어부(100)는 954단계로 진행하여 전화번호 추출 대상 영역으로 인식된 다른 글자열 영역이 있는지를 체크한다.
그러나 만약 상기 해당 전화번호 추출 대상 영역이, 도 10의 ‘c'에서 보이고 있는 바와 같이‘-’기호를 제외하고, 문자로 인식된 블롭들을 포함하는 글자 영역이 둘 이상 연속된 경우라면, 제어부(100)는 현재 선택되어 있는 전화번호 추출 대상 영역을 상기 숫자 영역으로 인식하지 않는다. 따라서 이러한 경우 제어부(100)는 950단계에서 바로 954단계로 진행하여 전화번호 추출 대상 영역으로 인식된 다른 글자열 영역이 있는지를 체크한다.
그리고 상기 954단계의 체크 결과 상기 전화번호 추출 대상 영역으로 인식된 다른 글자열 영역이 있는 경우라면, 제어부(100)는 956단계로 진행하여 현재 전화번호 추출 대상 영역으로 인식된 다른 글자열 영역을 선택한다. 그리고 제어부(100)는 902단계로 진행하여, 상기 902단계에서 954단계에 이르는 과정을 반복한다. 그러나 만약 상기 954단계에서 전화번호 추출 대상 영역으로 인식된 다른 글자열 영역이 없는 경우라면, 제어부(100)는 958단계로 진행하여 현재까지 숫자 영역으로 인식된 전화번호 추출 대상 영역이 있는지를 체크한다. 그리고 만약 상기 숫자 영역으로 인식된 전화번호 추출 대상 영역이 없는 경우라면 제어부(100)는 216단계로 진행하여 상기 202단계에서 추출된 모든 ROI들이 상기 204단계에서 214단계에 이르는 전화번호 정보 검출 과정을 거쳤는지 체크한다. 그러나 만약 상기 958단계의 체크 결과 상기 숫자 영역으로 인식된 전화번호 추출 대상 영역이 있는 경우라면, 제어부(100)는 212단계로 진행하여 상기 숫자 영역으로 인식된 영역의 블롭들을 숫자 데이터로 인식한다.
도 11은 이러한 본 발명의 전화번호 추출 동작 중, 상기 추출된 숫자 영역으로부터 인식된 숫자들을 이용하여 가능한 전화번호 조합을 생성하고 이를 저장하는 214단계의 동작을 도시한 도면이다.
도 11을 참조하여 살펴보면, 상기 212단계에서 상기 숫자 영역의 블롭들이 숫자 데이터로 인식되면, 제어부(100)는 1100단계로 진행하여 상기 숫자 영역으로 인식된 영역들 중 어느 하나의 영역을 선택한다. 그리고 제어부(100)는 1102단계로 진행하여 해당 숫자 영역에 포함된 숫자 데이터의 개수가 7개 미만인지 여부를 체크한다. 그리고 상기 숫자 데이터의 개수 체크 결과 숫자 데이터의 개수가 7개 미 만인 경우라면 제어부(100)는 1116단계로 진행하여 다른 숫자 영역이 있는지를 체크한다.
여기서 상기 1102단계에서 상기 제어부(100)가 숫자 영역에 포함된 숫자의 개수가 7개 미만인지를 체크하는 이유는 전화번호 조합에 필요한 최소한의 숫자 데이터 개수가 7개이기 때문이다. 따라서 상기 숫자 영역에 포함된 숫자 데이터의 개수가 7개가 되지 않는 경우에는 해당 숫자 데이터들을 이용한 어떤 조합도 전화번호가 될 수 없다. 이에 따라 본 발명에서는 상기 선택된 숫자 영역에 포함된 숫자 데이터가 7개 미만인 경우, 상기 이를 전화번호가 아닌 것으로 인식하고 다른 숫자 영역이 있는지를 체크한다.
그러나 만약 상기 1102단계의 체크 결과 해당 숫자 영역에 포함된 숫자의 개수가 7개 이상인 경우라면, 제어부(100)는 1104단계로 진행하여 상기 숫자 영역에 공백 또는 ‘-’기호로 나누어진 구간의 수가 2개에서 5개 사이인지를 체크한다. 이는 예를 들어 전화번호의 경우 공백 또는 ‘-’기호로 나누어진 구간이 적어도 두개 이상이고, 일반적으로 최대 4개 또는 지역 번호를 포함하는 경우 5개의 구간으로 나누어진 형태로 이루어지기 때문이다. 따라서 만약 상기 공백 또는 ‘-’구간으로 나누어진 구간의 수가 1개이거나 5개를 초과하는 경우라면, 제어부(100)는 상기 숫자 영역에 포함된 숫자 데이터들이 전화번호가 아닌 것으로 판단하고 1116단계로 진행하여 다른 숫자 영역이 있는지를 체크한다.
그러나 만약 상기 1104단계에서 공백 또는 ‘-’기호로 나누어진 구간의 수가 2개 이상 5개 이하인 경우라면, 해당 숫자 데이터들을 이용한 전화번호의 조합 이 가능하다. 이에 따라 제어부(100)는 1106단계로 진행하여 상기 나누어진 구간의 수가 2개인지, 3개인지, 아니면 4개나 5개인지에 따라 각각의 구간에 따른 전화번호 조합을 생성한다. 따라서 만약 상기 구간의 수가 2개인 경우라면, 제어부(100)는 1106단계에서 1108단계로 진행하여 2개 구간에 따른 전화번호를 조합하고 이를 생성한다. 그리고 상기 구간의 수가 3개인 경우라면, 제어부(100)는 1106단계에서 1110단계로 진행하여 3개 구간에 따른 전화번호를 조합하고 이를 생성한다. 그리고 상기 구간의 수가 4개인 경우라면, 제어부(100)는 1106단계에서 1112단계로 진행하여 4개 구간에 따른 전화번호를 조합하고 이를 생성한다. 또한 상기 구간의 수가 5개인 경우라면, 제어부(100)는 1106단계에서 1114단계로 진행하여 5개 구간에 따른 전화번호를 조합하고 이를 생성한다.
여기서 상기 각각의 구간에 따른 전화번호 조합 과정은 상기 각 구간의 숫자 데이터들에 따라 다양하게 조합될 수 있다. 예를 들어 인식된 숫자 데이터들이 “1234-5678”인 경우 상기 나누어진 구간은 두개이므로 제어부(100)는 1106단계에서 1108단계로 진행한다. 이러한 경우 상기 제어부(100)는 상기 숫자 데이터들을 이용하여 다양한 전화번호 조합을 생성할 수 있는데, 상기 숫자 데이터들의 경우라면, “1234-5678” 뿐만 아니라 “123-5678”또는 “234-5678”의 전화번호 데이터가 생성될 수 있다. 이러한 경우 제어부(100)는 상기 “1234-5678”뿐 아니라 상기 “123-5678”과 “234-5678”의 전화번호까지 후보 전화번호로 설정하여 이를 사용자에게 출력할 수 있다.
또한 만약 인식된 숫자 데이터가 “123-45678”인 경우라면, 조합 가능한 전 화번호 데이터는 “123-4567” 또는 “123-5678”이 될 수 있다. 하기 표 1과 표 2는 이러한 경우 각각 구간인 두개인 경우와 세 개인 경우의 전화번호 조합 규칙의 예를 보이고 있는 도면이다.
Figure 112006012035584-PAT00001
Figure 112006012035584-PAT00002
상술한 바와 같이 표 1과 표 2는, 공백 또는 ‘-’기호에 의해 나누어진 구간에 따른 전화번호의 조합 규칙 중 구간이 2개인 경우와 3개인 경우에 따른 조합의 예를 보이고 있는 도면이다. 상기 표들에서 ‘가능’이라는 의미는 상기 인식된 숫자 데이터를 조합 없이 바로 전화번호로 인식가능하다는 것이고, ‘조합’이라는 것은 해당 구간에 따른 숫자 인식 데이터를 이용하여 상기 기재되어 있는 개수만큼 조합하여 후보 전화번호를 생성한다는 것이다. 따라서 만약 나누어진 구간이 2개인 경우이고 제1 구간에 포함된 숫자 데이터 수가 4개, 그리고 제2 구간에 포함된 숫자 데이터의 수가 4개인 경우라면, 본 발명에서는 상기 제1 구간의 숫자 데이터로부터 제1 구간의 전화번호가 3개인 전화번호 2개와 제1 구간의 전화번호가 4개인 전화번호 1개를 조합하고 이를 저장할 수 있다.
따라서 본 발명에서는 디지털 방송의 송신측과 수신측이 디지털 방송 데이터의 전송 과정에 있어 아무런 변경을 가하지 않더라도 송신측이 보내고자 하는 전화번호를 사용자에게 전달할 수 있다. 또한 이 뿐만 아니라 본 발명에서는 사용자의 선택에 의해 전화번호 추출이 시작되는 경우 상기 전화번호 정보를 추출하므로, 수신측에서도 매 수신되는 TS 패킷 마다 해당 패킷에 전화번호 데이터가 포함되어 있는지 여부를 검출할 필요가 없다는 효과가 있다.
그리고 이처럼 전화번호의 조합이 생성되면, 제어부(100)는 216단계로 진행하여 상기 202단계에서 추출된 모든 ROI들이 상기 204단계에서 214단계에 이르는 전화번호 정보 검출 과정을 거쳤는지 체크한다. 그리고 상기 216단계의 체크 결과 만약 전화번호 검출 과정을 거치지 않은 ROI가 있다면, 제어부(100)는 218단계로 진행하여 해당 ROI를 선택한다. 그리고 상기 선택된 ROI에 대해 다시 204단계에서 214단계에 이르는 과정을 반복한다. 그러나 만약 상기 216 단계에서 더 이상 전화번호 검출 과정을 거치지 않은 ROI가 없는 경우라면, 제어부(100)는 상기 저장된 전화번호들을 출력하여 사용자가 그 중에서 어느 하나를 선택할 수 있도록 한다. 여기서 만약 상기 각각의 ROI들로부터 추출된 전화번호들이 서로 동일한 것이 있는 경우라면, 그 중에서 어느 하나만을 사용자에게 표시함은 물론이다.
그리고 비록 상기 도 2에서는 도시되지 않았으나, 상기 전화번호들 중에서 어느 하나의 전화번호가 선택되면, 제어부(100)는 상기 사용자의 선택에 따라 상기 선택된 전화번호로 전화를 걸거나, 해당 전화번호에 따라 메시지를 전송하는 등의 동작을 수행할 수도 있음은 물론이다.
한편 상술한 본 발명의 설명에서는 구체적인 실시 예에 관해 설명하였으나, 여러 가지 변형이 본 발명의 범위에서 벗어나지 않고 실시될 수 있다. 특히 본 발명의 실시 예에서는 모든 검출된 ROI로부터 전화번호가 추출되어 저장되면, 이를 표시하고 사용자가 그 중에서 어느 하나를 선택하도록 하는 과정을 보이고 있으나, 상기 추출된 전화번호 중 사용자가 원하는 전화번호가 없을 경우에는 이를 다시 재수행할 수 있는 재인식 과정을 더 수행할 수도 있음은 물론이다. 이러한 경우 사용자에 의해 상기 재인식이 선택되면, 제어부(100)는 I frame을 다시 스캔하고 스캔된 I frame으로부터 숫자 데이터를 추출한 후 이를 전화번호로 조합하는 과정을 다시 수행한다. 따라서 발명의 범위는 설명된 실시 예에 의해 정할 것이 아니고, 특허청구범위와 특허청구범위의 균등한 것에 의해 정하여져야 한다.
따라서 본 발명은 디지털 방송시 전송되는 데이터의 구조를 변경하지 않고서도 상기 디지털 방송에서 방송되는 전화번호를 인식하고 이를 전화번호 데이터로 저장할 수 있다는 효과가 있다.

Claims (42)

  1. 디지털 방송 수신 단말기에 있어서,
    디지털 방송을 수신하는 디지털 방송 수신부와,
    상기 수신된 디지털 방송으로부터 수신되어 디코딩(Decoding)된 디지털 방송 데이터 중 I frame을 스캔(scan)하는 스캔부와,
    상기 스캔된 I frame으로부터 상기 디지털 방송 수신 단말기의 디스플레이 영역 중 전화번호 정보가 포함된 영역으로 간주되는 영역인 ROI(Region Of Interest : 관심 영역)를 검출하고, 검출된 ROI를 이진화한 후, 이진화된 ROI로부터 비 텍스트 영역을 제거하며, 상기 ROI를, 숫자, 문자 또는 기호로 인식될 수 있는 적어도 하나의 블롭(Blob)을 포함하는 영역인 글자 영역 및 상기 글자 영역들로 이루어진 글자열 영역으로 분할하는 글자 추출부와,
    상기 추출된 글자열 영역의 각 글자 영역들을 기 설정된 조건에 따라 분석하여 상기 글자열 영역이 숫자들만을 포함하는 숫자 영역인지 여부를 판단하고, 숫자열로 판단된 글자열 영역만을 추출하며, 추출된 글자열 영역에 포함된 블롭들을 기 설정된 가중치 방식을 통해 숫자 데이터로 인식하고, 인식된 숫자 데이터들을 이용하여 적어도 하나의 전화번호를 조합하는 전화번호 추출부와,
    상기 디지털 방송 수신부로부터 수신된 I frame이 디코딩되면, 현재 방송중인 방송 화면의 I frame을 스캔하고, 상기 스캔된 I frame을 상기 글자 추출부에 인가하여 상기 글자열 영역을 추출하며, 상기 추출된 글자열 영역을 상기 전화번호 추출부에 인가하여 상기 글자열 영역에 따른 숫자 데이터를 추출한 후 이를 전화번호로 조합하여 출력하는 제어부를 구비하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  2. 제1항에 있어서, 상기 글자 추출부는,
    상기 ROI를 검출하고, 검출된 ROI에 대한 영역 정보를 추출하기 위한 ROI 추출부와,
    상기 검출된 ROI에 대한 이진화를 수행하기 위한 이진화부와,
    상기 이진화된 ROI로부터 기 설정된 비 텍스트 영역 검출 조건에 따라 검출된 비 텍스트 영역을 제거하는 비 텍스트 영역 제거부와,
    상기 비 텍스트 영역이 제거된 ROI로부터 글자열 영역 및 상기 글자열 영역을 구성하는 글자 영역들을 분할하고, 이를 분할하기 위한 글자열 영역 및 글자 영역 분할부를 포함하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  3. 제2항에 있어서, 상기 ROI 추출부는,
    기 설정된 디스플레이 영역의 일부 영역들을 상기 전화번호 정보가 표시되는 빈도에 의해 설정된 우선순위에 따라 순차적으로 기 설정된 ROI 검출 조건에 따라 ROI가 포함되어 있는지를 체크하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  4. 제3항에 있어서,
    상기 우선 순위는, 상기 디스플레이 영역의 하한치로부터의 일정 영역인 하단 영역, 상기 디스플레이 영역의 상한치로부터의 일정 영역인 상단 영역, 그리고 상기 디스플레이 영역의 우측 한계치로부터의 일정 영역인 우측 영역, 그리고 상기 디스플레이 영역의 좌측 한계치로부터의 일정 영역인 좌측 영역의 순서임을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  5. 제3항에 있어서, 상기 ROI 검출부는,
    상기 우선 순위에 따라 선택된 상기 일부 디스플레이 영역에, 특정 색차 신호 레벨의 변화가 기 설정된 색차 신호 임계값 이하인 수평 주사선의 개수가 일정 개수 이상 반복되는 영역이 있는 경우, 상기 특정 색차 신호 레벨의 변화가 기 설정된 색차 신호 임계값 이하인 수평 주사선의 개수가 일정 개수 이상 반복되는 영역을 상기 ROI로 검출하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  6. 제5항에 있어서, 상기 특정 색차 신호는,
    상기 디지털 방송에서 화면 출력 신호로 사용되는 Y, Cb, Cr 신호 중 Y 신호임을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  7. 제6항에 있어서, 상기 ROI 검출부는,
    상기 Y 신호를 색차 신호로 설정하여 ROI를 검출한 결과 ROI가 검출되지 않으면 Cb, Cr 신호를 차례대로 상기 특정 색차 신호로 설정하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  8. 제2항에 있어서, 상기 이진화부는,
    히스토그램(histogram)을 이용한 Otsu's 이진화 방법을 사용하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  9. 제2항에 있어서, 상기 비 텍스트 영역 제거부는,
    상기 이진화된 ROI에 포함된 각 블롭들의 너비와 높이를, 기 설정된 텍스트 임계값에 포함된 너비 임계값 및 높이 임계값과 각각 비교하여, 상기 블롭들 중 너비와 높이가 상기 너비 임계값 및 높이 임계값을 초과하는 블롭이 있는 경우 이를 제거하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  10. 제2항에 있어서, 상기 글자열 영역 및 글자 영역 분할부는,
    수평 프로젝션(Projection)을 사용하여, 해당 ROI에 포함된 글자열 영역들을 분할하고, 해당 각 글자열 영역의 높이 중앙값을 구하여, 해당 글자열 영역의 높이가 기 설정된 사영 높이 하한치 미만이거나 기 설정된 사영 높이 상한치를 초과하지 않는 글자열 영역들만을 전화번호를 추출할 대상이 되는 전화번호 추출 대상 영역으로 추출하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  11. 제10항에 있어서,
    상기 사영 높이 상한치 및 사영 높이 하한치는 하기 수학식 3 및 수학식 4를 통해 구해지는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부 터 전화번호 정보를 검출하는 장치.
    사영 높이 상한치 = 상한 가중치 X 해당 글자열 영역의 높이 중앙값
    사영 높이 하한치 = 하한 가중치 X 해당 글자열 영역의 높이 중앙값
    여기서 상기 상한 가중치 및 하한 가중치는 기 설정된 가중치 값임을 특징으로 함.
  12. 제10항에 있어서, 상기 전화번호 추출부는,
    상기 전화번호 추출 대상 영역의 각 글자 영역들을 분석하여 해당 전화번호 추출 대상 영역들 중 숫자로 인식 가능한 블롭들만을 포함하고 있는 숫자 영역을 추출하는 숫자 영역 추출부와,
    상기 추출된 숫자 영역에 포함되어 있는, 숫자로 인식 가능한 블롭들을 숫자 데이터로 인식하는 숫자 인식부와,
    상기 숫자 인식부를 통해 인식된 숫자 데이터를 조합하여 전화번호 정보를 생성하는 전화번호 조합부를 구비하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  13. 제12항에 있어서, 상기 숫자 영역 추출부는,
    상기 전화번호 추출 대상 영역에 포함되어 있는 적어도 하나의 글자 영역들 중 어느 하나를 선택하고 기 설정된 숫자 판독 조건에 따라 해당 글자 영역에 포함된 적어도 하나의 블롭이 문자인지 여부를 판단하고, 상기 글자열에 포함된 글자 영역들 중 상기 문자로 판단된 블롭을 포함하는 글자 영역의 개수에 따라, 상기 글자열 영역이 숫자로 인식 가능한 블롭들만을 포함하는 숫자 영역인지 아닌지를 판단하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  14. 제13항에 있어서, 상기 숫자 판독 조건은,
    상기 글자 영역에 포함된 블롭들이 하나인 경우 또는 상기 글자 영역과 상기 글자 영역에 근접한 다른 글자 영역의 간격이, 상기 해당 글자로 인식된 적어도 하나의 블롭들의 간격이, 현재 선택된 전화번호 추출 대상 영역으로부터 추출된 글자 영역들의 중앙값인 간격 중앙값보다 일정 오차값 이하로 작은 경우 또는 해당 글자 영역의 높이가 상기 현재 선택된 전화번호 추출 대상 영역으로부터 추출된 높이 중앙값과 일정 수준이상 작거나 크지 않은 경우임을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  15. 제13항에 있어서, 상기 숫자 영역 추출부는,
    상기 글자열 영역이, 연속된 두개 이상의 상기 문자로 인식된 블롭을 포함하는 글자 영역들을 포함하고 있는 경우, 상기 글자열 영역을 상기 숫자 영역이 아닌 것으로 인식하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  16. 제12항에 있어서, 상기 숫자 인식부는,
    신경망 네트워크를 이용하여, 얻고자 하는 숫자 데이터를 학습시켜 나온 가중치 데이터를 이용함으로써, 상기 숫자 영역의 각 블롭이 어떤 숫자에 해당되는지를인식하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  17. 제12항에 있어서, 상기 전화번호 조합부는,
    상기 글자열 영역에 포함된 공백 또는 ‘-’기호로 인해 구분된 각 구간에 따라, 상기 구분된 각 구간에 따른 숫자 데이터를 조합하여 전화번호로 생성하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  18. 제17항에 있어서, 상기 전화번호 조합부는,
    상기 공백 또는 ‘-’기호로 구분된 구간이 2개인 경우 하기 표 3과 같은 조합 규칙에 따라 전화번호를 생성하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
    Figure 112006012035584-PAT00003
    상기 표 3에서 ‘가능’이라는 의미는 상기 인식된 숫자 데이터를 조합 없이 바로 전화번호로 인식가능하다는 것이며, ‘조합’이라는 것은 해당 구간에 따른 숫자 인식 데이터를 이용하여 상기 기재되어 있는 개수만큼 조합하여 후보 전화번호를 생성한다는 것임을 특징으로 함.
  19. 제17항에 있어서, 상기 전화번호 조합부는,
    상기 공백 또는 ‘-’기호로 구분된 구간이 3개인 경우 하기 표 3과 같은 조합 규칙에 따라 전화번호를 생성하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
    Figure 112006012035584-PAT00004
    상기 표에서 ‘가능’이라는 의미는 상기 인식된 숫자 데이터를 조합 없이 바로 전화번호로 인식가능하다는 것이며, ‘조합’이라는 것은 해당 구간에 따른 숫자 인식 데이터를 이용하여 상기 기재되어 있는 개수만큼 조합하여 후보 전화번호를 생성한다는 것임을 특징으로 함.
  20. 제1항에 있어서, 상기 제어부는,
    상기 사용자가 전화번호 재인식을 선택하는 경우, I frame을 다시 스캔하고 스캔된 I frame으로부터 숫자 데이터를 추출하는 과정을 반복하여 수행하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 장치.
  21. 디지털 방송 수신 단말기가 디지털 방송을 수신하여 전화번호 정보를 추출하는 방법에 있어서,
    상기 디지털 방송에 포함된 I frame를 디코딩(decoding)하고 스캔(scan)하는 I frame 스캔 단계와,
    상기 스캔된 I frame으로부터 상기 디지털 방송 수신 단말기의 디스플레이 영역 중 전화번호 정보가 포함된 영역으로 간주되는 영역인 ROI(Region Of Interest)를 검출하는 ROI 검출 단계와,
    상기 검출된 ROI를 이진화하는 이진화 단계와,
    기 설정된 텍스트 임계값에 따라 비 텍스트 영역으로 간주되는 영역을 제거하는 비 텍스트 제거 단계와,
    상기 이진화된 ROI로부터, 숫자, 문자, 기호로 인식될 수 있는 적어도 하나의 블롭을 포함하는 글자 영역 및 상기 글자 영역들로 이루어진 글자열 영역을 각각 분할하는 글자열 영역 및 글자 영역 분할 단계와,
    상기 추출된 글자열 영역의 각 글자 영역들을 기 설정된 조건에 따라 분석하여, 상기 글자열 영역들 중 숫자로 인식될 수 있는 블롭들만을 포함하는 숫자 영역 만을 추출하는 숫자 영역 추출 단계와,
    상기 추출된 숫자 영역의 블롭들을 숫자 데이터로 인식하는 숫자 데이터 인식 단계와,
    상기 인식된 숫자 데이터들을 조합하여 전화번호를 생성하는 전화번호 생성 단계를 포함하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  22. 제21항에 있어서, 상기 ROI 추출 단계는,
    기 설정된 순서에 따른 일부 디스플레이 영역을 선택하는 디스플레이 영역 선택 단계와,
    상기 선택된 디스플레이 영역에 특정 색차 신호 레벨의 변화가 기 설정된 색차 신호 임계값 이하인 수평 주사선의 개수가 일정 개수 이상 반복되는 영역이 있는지를 체크하는 ROI 조건 체크 단계와,
    상기 선택된 디스플레이 영역에 특정 색차 신호 레벨의 변화가 기 설정된 색차 신호 임계값 이하인 수평 주사선의 개수가 일정 개수 이상 반복되는 영역이 있는 경우 상기 수평 주사선의 개수가 일정 개수 이상 반복되는 영역을 ROI로 인식하는 ROI 인식 단계와,
    상기 인식된 ROI의 영역 정보를 추출하는 ROI 영역 정보 저장 단계를 포함하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  23. 제22항에 있어서, 상기 디스플레이 영역 선택 단계는,
    기 설정된 디스플레이 영역의 일부 영역들을 상기 전화번호 정보가 표시되는 빈도에 의해 설정된 우선순위에 따라 순차적으로 선택하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  24. 제23항에 있어서, 상기 디스플레이 영역 선택 단계는,
    상기 디스플레이 영역의 하한치로부터의 일정 영역인 하단 영역, 상기 디스플레이 영역의 상한치로부터의 일정 영역인 상단 영역, 그리고 상기 디스플레이 영역의 우측 한계치로부터의 일정 영역인 우측 영역, 그리고 상기 디스플레이 영역의 좌측 한계치로부터의 일정 영역인 좌측 영역의 순서에 따라 상기 디스플레이 영역의 일부 영역들을 선택하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  25. 제22항에 있어서, 상기 ROI 조건 체크 단계는,
    상기 디지털 방송에서 화면 출력 신호로 사용되는 Y, Cb, Cr 신호 중 Y 신호 를 상기 특정 색차 신호로 설정하여 사용하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  26. 제25항에 있어서, 상기 ROI 조건 체크 단계는,
    상기 Y 신호를 상기 특정 색차 신호로 설정하여 사용하여도 상기 ROI가 검출되지 않는 경우 Cb 신호를 상기 특정 색차 신호로 설정하여 사용하고, 상기 Cb 신호를 상기 특정 색차 신호로 설정하여 사용하여도, 상기 ROI가 검출되지 않는 경우 상기 Cr 신호를 상기 특정 색차 신호로 설정하여 사용하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  27. 제21항에 있어서, 상기 이진화 단계는,
    히스토그램(histogram)을 이용한 Otsu's 이진화 방법을 사용하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  28. 제21항에 있어서, 상기 비 텍스트 영역 제거 단계는,
    이진화된 상기 ROI 내의 각 블롭들의 영역을 측정하는 블롭 영역 측정 단계 와,
    상기 측정된 블롭들 중 너비와 높이가 기 설정된 텍스트 임계값에 포함된 너비 임계값과 높이 임계값 중 어느 하나라도 초과하는 블롭이 있는지를 체크하는 비 텍스트 블롭 체크 단계와,
    상기 측정된 블롭들 중 너비와 높이가 기 설정된 텍스트 임계값에 포함된 너비 임계값과 높이 임계값 중 어느 하나라도 초과하는 블롭이 있는 경우 해당 블롭을 비 텍스트 영역으로 간주하고 이를 제거하는 비 텍스트 블롭 제거 단계를 포함하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  29. 제28항에 있어서, 상기 글자열 영역 및 글자 영역 분할 단계는,
    수평 프로젝션(projection)을 수행하여 상기 비 텍스트 영역이 제거된 ROI로부터 상기 글자열 영역들을 분할하는 수평 프로젝션 단계와,
    상기 분할된 글자열 영역 들 중 어느 하나를 선택하고 선택된 글자열 영역의 영역 정보 및 상기 글자열 영역의 높이 중앙값을 추출하는 글자열 정보 추출 단계와,
    상기 추출된 높이 중앙값을 이용하여 상기 글자열 영역이 전화번호를 추출할 대상이 되는 전화번호 추출 대상 영역인지를 판단하는 전화번호 추출 대상 영역 추출 단계와,
    상기 글자열 영역이 전화번호 추출 대상 영역인 경우, 상기 전화번호 추출 대상 영역에 수직 프로젝션을 수행하여, 해당 글자열 영역을 구성하는 글자 영역들을 분할하고, 분할된 각 글자 영역들의 영역 정보 및 글자 영역 사이 간격들의 중앙값인 간격 중앙값을 추출하는 수직 프로젝션 수행 단계를 포함하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  30. 제29항에 있어서, 상기 전화번호 추출 대상 영역 추출 단계는,
    상기 선택된 글자열 영역의 높이가 기 설정된 사영 높이 하한치를 초과하지 않거나 또는 기 설정된 사영 높이 하한치 미만이 아닌 경우, 상기 선택된 글자열 영역을 상기 전화번호 추출 대상 영역으로 판단하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  31. 제30항에 있어서,
    상기 사영 높이 상한치 및 사영 높이 하한치는 하기 수학식 5 및 수학식 6을 통해 구해지는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
    사영 높이 상한치 = 상한 가중치 X 해당 글자열 영역의 높이 중앙값
    사영 높이 하한치 = 하한 가중치 X 해당 글자열 영역의 높이 중앙값
    여기서 상기 상한 가중치 및 하한 가중치는 기 설정된 가중치 값임을 특징으로 함.
  32. 제31항에 있어서, 상기 숫자 영역 추출 단계는,
    상기 전화번호 추출 대상 영역으로 인식된 글자열 영역 중 어느 하나를 선택하고, 선택된 글자열 영역을 구성하는 글자 영역 중 어느 하나를 선택하는 글자 영역 선택 단계와,
    상기 선택된 글자 영역에 포함된 블롭이 적어도 두개 이상 인지를 체크하고, 상기 선택된 글자 영역에 포함된 블롭의 수가 가 적어도 두개 이상인 경우 상기 선택된 글자 영역의 블롭을 문자로 인식하는 블롭 구성 체크 단계와,
    상기 선택된 글자 영역에 포함된 블롭이 하나인 경우, 상기 선택된 글자 영역과 근접한 글자 영역의 간격이, 상기 선택된 전화번호 추출 대상 영역이에 포함된 각 글자 영역들 사이의 간격들로부터 추출된 간격 중앙값에 따른 간격보다 일정 오차값 이하로 좁은지를 체크하는 간격 체크 단계와,
    상기 선택된 글자 영역과 근접한 글자 영역과의 간격이 상기 간격 중앙값에 따른 간격보다 일정 오차값 이하로 좁은 경우, 상기 선택된 글자 영역이 문자로 인 식되는 블롭을 포함하는 것으로 인식하고, 그렇지 않은 경우 상기 선택된 글자 영역의 높이가 상기 선택된 글자열 영역의 높이 중앙값과 기 설정된 오차 이상 차이가 나는지를 체크하는 높이 체크 단계와,
    상기 선택된 글자 영역에 포함된 블롭의 높이와 상기 선택된 글자열 영역의 높이 중앙값의 차가, 기 설정된 오차 미만인 경우 상기 글자 영역을 숫자로 인식가능한 블롭을 포함하고 있는 영역으로 인식하는 숫자 인식 단계와,
    상기 글자열 영역에 포함된 글자 영역들 중, 문자로 인식되는 블롭을 포함하는 글자 영역이 두개 이상 연속되어 있지 않은 경우 상기 글자열 영역을, 숫자로 인식 가능한 블롭들을 포함하는 숫자 영역으로 인식하는 숫자 영역 인식 단계를 포함하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  33. 제32항에 있어서, 상기 간격 차이 체크 단계는,
    상기 선택된 글자 영역이, 특정 기호로 인식 가능한 블롭을 포함하는지 여부를 체크하는 기호 체크 단계를 더 포함하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  34. 제33항에 있어서, 상기 특정 기호는,
    ‘-’ 기호임을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  35. 제34항에 있어서, 상기 기호 체크 단계는,
    상기 선택된 글자 영역에 포함된 블롭의 높이가 3 픽셀 이하이고, 너비가 상기 글자열에 포함된 글자 영역들의 너비 평균값 또는 중앙값에 해당되는 경우 상기 글자 영역에 포함된 블롭을 ‘-’기호로 인식하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  36. 제34항에 있어서, 상기 숫자 데이터 인식 단계는,
    신경망 네트워크를 이용하여, 얻고자 하는 숫자 데이터를 학습시켜 나온 가중치 데이터를 이용함으로써, 상기 숫자 영역의 각 블롭이 어떤 숫자에 해당되는지를인식하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  37. 제32항에 있어서, 상기 전화번호 생성 단계는,
    숫자 영역으로 인식된 전화번호 추출 대상 영역 중 어느 하나를 선택하고, 그 숫자 영역에 포함된 숫자로 인식 가능한 블롭들의 수가 일정 개수 미만인지를 체크하는 숫자 개수 체크 단계와,
    상기 숫자 영역에서 공백 또는 특정 기호로 구분되어진 구간에 따라 각각의 구간에 따른 전화번호를 조합하는 전화번호 조합 단계를 포함하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  38. 제36항에 있어서, 상기 숫자 개수 체크 단계는,
    상기 숫자로 인식 가능한 블롭들의 수가 7개 이상인 경우 상기 숫자 영역이 전화번호를 포함하고 있는 영역이라고 판단하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  39. 제37항에 있어서, 상기 특정 기호는,
    ‘-’ 기호임을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
  40. 제37항에 있어서, 상기 전화번호 조합 단계는,
    상기 공백 또는 특정 기호로 구분된 구간이 2개인 경우 하기 표 5와 같은 조합 규칙에 따라 전화번호를 생성하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
    Figure 112006012035584-PAT00005
    상기 표 3에서 ‘가능’이라는 의미는 상기 인식된 숫자 데이터를 조합 없이 바로 전화번호로 인식가능하다는 것이며, ‘조합’이라는 것은 해당 구간에 따른 숫자 인식 데이터를 이용하여 상기 기재되어 있는 개수만큼 조합하여 후보 전화번호를 생성한다는 것임을 특징으로 함.
  41. 제37항에 있어서, 상기 전화번호 조합 단계는,
    상기 공백 또는 특정 기호로 구분된 구간이 3개인 경우 하기 표 6과 같은 조합 규칙에 따라 전화번호를 생성하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
    Figure 112006012035584-PAT00006
    상기 표 3에서 ‘가능’이라는 의미는 상기 인식된 숫자 데이터를 조합 없이 바로 전화번호로 인식가능하다는 것이며, ‘조합’이라는 것은 해당 구간에 따른 숫자 인식 데이터를 이용하여 상기 기재되어 있는 개수만큼 조합하여 후보 전화번호를 생성한다는 것임을 특징으로 함.
  42. 제21항에 있어서,
    상기 사용자가 전화번호 재인식을 선택하는 경우, 상기 I frame 스캔 단계와, 상기 ROI 검출 단계와, 상기 이진화 단계와, 상기 비 텍스트 제거 단계와, 상기 글자열 및 글자 분할 단계와, 상기 숫자 영역 추출 단계와, 상기 숫자 데이터 인식 단계와, 상기 전화번호 생성 단계를 반복 수행하여 다시 전화번호를 추출하는 재인식 단계를 더 포함하는 것을 특징으로 하는 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호 정보를 검출하는 방법.
KR1020060015954A 2006-02-18 2006-02-18 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호정보를 검출하는 장치 및 방법 KR100791517B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020060015954A KR100791517B1 (ko) 2006-02-18 2006-02-18 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호정보를 검출하는 장치 및 방법
EP07102154A EP1821240A3 (en) 2006-02-18 2007-02-12 Device and method for detecting telephone number information from digital multimedia broadcasting in digital multimedia broadcasting receiving terminal
CNA2007100791347A CN101026645A (zh) 2006-02-18 2007-02-14 从数字多媒体广播检测电话号码信息的装置和方法
US11/708,698 US20070214486A1 (en) 2006-02-18 2007-02-19 Device and method for detecting telephone number information from digital multimedia broadcasting in digital multimedia broadcasting receiving terminal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060015954A KR100791517B1 (ko) 2006-02-18 2006-02-18 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호정보를 검출하는 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20070082828A true KR20070082828A (ko) 2007-08-22
KR100791517B1 KR100791517B1 (ko) 2008-01-03

Family

ID=38110002

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060015954A KR100791517B1 (ko) 2006-02-18 2006-02-18 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호정보를 검출하는 장치 및 방법

Country Status (4)

Country Link
US (1) US20070214486A1 (ko)
EP (1) EP1821240A3 (ko)
KR (1) KR100791517B1 (ko)
CN (1) CN101026645A (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102710842B (zh) * 2012-05-28 2015-02-18 青岛海信移动通信技术股份有限公司 一种Android平台移动终端来电处理方法及装置
RU2657181C1 (ru) * 2017-09-01 2018-06-08 Общество с ограниченной ответственностью "Аби Продакшн" Способ улучшения качества распознавания отдельного кадра

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60230281A (ja) * 1984-04-27 1985-11-15 Fuji Electric Co Ltd 文字識別装置
JPH01265950A (ja) * 1988-04-15 1989-10-24 Toshiba Corp スペクトロスコピックイメージング装置
US5262860A (en) * 1992-04-23 1993-11-16 International Business Machines Corporation Method and system communication establishment utilizing captured and processed visually perceptible data within a broadcast video signal
EP1105826A1 (en) * 1998-08-27 2001-06-13 Upshot Corporation A method and apparatus for network-based sales force management
KR100304763B1 (ko) * 1999-03-18 2001-09-26 이준환 압축된 뉴스 영상에서의 문자영역 추출 및 문자 인식방법과, 이러한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체
US20020065820A1 (en) * 2000-10-02 2002-05-30 Enns Neil Robin Newman Automatically identifying a telephone number in electronic text
JP4391704B2 (ja) * 2001-01-11 2009-12-24 富士通株式会社 多値画像から二値画像を生成する画像処理装置および方法
JP3953886B2 (ja) 2002-05-16 2007-08-08 セイコーエプソン株式会社 字幕抽出装置
ES2262035T3 (es) * 2003-01-08 2006-11-16 Glory Ltd. Dispositivo para la lectura de los numeros de serie de billetes de banco y metodo correspondiente.
US7162095B2 (en) * 2003-06-13 2007-01-09 National Chung Cheng University Method of automatically determining the region of interest from an image
WO2005057322A2 (en) * 2003-11-19 2005-06-23 Nielsen Media Research, Inc. Methods and apparatus for detecting a television channel change event
JP2005229492A (ja) 2004-02-16 2005-08-25 Matsushita Electric Ind Co Ltd テレビジョン受信機
KR20060016710A (ko) * 2004-08-18 2006-02-22 주식회사 팬택 문자메시지내 전화번호 추출 및 저장 또는 통화 기능을가지는 무선통신 단말기 및 그 방법
KR100710372B1 (ko) * 2005-02-01 2007-04-23 엘지전자 주식회사 이동형 방송 수신기에서의 통화 연동 방법
KR100810320B1 (ko) * 2005-06-16 2008-03-04 삼성전자주식회사 디지털 방송 재생기가 방송 중에 제공되는 전화번호를이용하여 발신하는 방법 및 그 디지털 방송 시스템

Also Published As

Publication number Publication date
KR100791517B1 (ko) 2008-01-03
EP1821240A3 (en) 2012-09-26
US20070214486A1 (en) 2007-09-13
CN101026645A (zh) 2007-08-29
EP1821240A2 (en) 2007-08-22

Similar Documents

Publication Publication Date Title
KR100746641B1 (ko) 동영상 이미지 코드와 동영상 이미지 코드 생성/디코딩장치 및 그 방법
Chen et al. PiCode: A new picture-embedding 2D barcode
US7978911B2 (en) Method of classifying colors of color based image code
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
US7889926B2 (en) Image dictionary creating apparatus, coding apparatus, image dictionary creating method
US7562820B2 (en) Barcode recognition apparatus
KR960013081A (ko) 영역 베이스의 화상 처리 방법, 화상 처리 장치 및 화상 통신 장치
CN108564079B (zh) 一种便携式字符识别装置及方法
EP1870858A2 (en) Method of classifying colors of color based image code
US8315460B2 (en) Method for recognizing text from image
WO2010055558A1 (ja) 文字領域抽出装置,文字領域抽出機能を備えた撮像装置,および文字領域抽出プログラム
JP5090330B2 (ja) 画像処理装置、画像処理方法およびプログラム
KR100791517B1 (ko) 디지털 방송 수신 단말기가 디지털 방송으로부터 전화번호정보를 검출하는 장치 및 방법
CN112906686A (zh) 文字识别方法、装置、电子设备及存储介质
US10769486B2 (en) Image processing apparatus, binary image production method, and image processing program
EP1469418A2 (en) Device and method for extending character region in image
KR20120066252A (ko) 결함 화소 처리 방법 및 장치
US20090056524A1 (en) Method for removing the staff lines from a music score image
CN111444904A (zh) 内容识别方法、装置以及电子设备
WO2020065980A1 (ja) 画像処理装置、制御方法及び制御プログラム
JP5125961B2 (ja) 二値化処理装置、情報処理装置、二値化処理方法および二値化処理プログラム
JP2006268180A (ja) 画像処理システム
JP2007156918A (ja) 文字認識装置、文字認識方法、文字認識プログラム、および記録媒体
CN111462035B (zh) 一种图片检测方法及装置
JPH0851540A (ja) 画像処理装置及び方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
G170 Re-publication after modification of scope of protection [patent]
FPAY Annual fee payment

Payment date: 20121129

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20131128

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20141127

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20151127

Year of fee payment: 9

LAPS Lapse due to unpaid annual fee