KR101552525B1 - 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법 - Google Patents

폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법 Download PDF

Info

Publication number
KR101552525B1
KR101552525B1 KR1020140012803A KR20140012803A KR101552525B1 KR 101552525 B1 KR101552525 B1 KR 101552525B1 KR 1020140012803 A KR1020140012803 A KR 1020140012803A KR 20140012803 A KR20140012803 A KR 20140012803A KR 101552525 B1 KR101552525 B1 KR 101552525B1
Authority
KR
South Korea
Prior art keywords
font
fonts
ocr
image
recognizing
Prior art date
Application number
KR1020140012803A
Other languages
English (en)
Other versions
KR20150091948A (ko
Inventor
정광태
이지민
Original Assignee
한국기술교육대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국기술교육대학교 산학협력단 filed Critical 한국기술교육대학교 산학협력단
Priority to KR1020140012803A priority Critical patent/KR101552525B1/ko
Publication of KR20150091948A publication Critical patent/KR20150091948A/ko
Application granted granted Critical
Publication of KR101552525B1 publication Critical patent/KR101552525B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K17/00Methods or arrangements for effecting co-operative working between equipments covered by two or more of main groups G06K1/00 - G06K15/00, e.g. automatic card files incorporating conveying and reading operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 한글 폰트 전용 인식 프로그램으로 다양한 한글 폰트를 인식할 수 있고, 폰트의 필수적인 정보인 저작권 관련 정보를 제공하여 폰트 사용시 불편함과 폰트 시장의 저작권 관련 문제를 감소시킬 수 있으며, 웹사이트 내의 폰트뿐만 아니라 이미지 내의 폰트도 인식할 수 있는 효과가 있다. 또한 다양한 종류의 폰트를 개성적인 표현과 우연성이 중시되는 캘리그라피로 표현하고, OCR을 사용하여 문자가 아닌 사진 촬영만으로도 저장 가능한 벡터화된 사진으로 폰트를 검색할 수 있으며, 나아가 클라우드 기능으로서 다양한 종류의 폰트와 캘리그라피를 데이터베이스화하여 저장함에 따라 별도의 로컬에 저장하지 않아도 폰트를 쉽게 검색하여 사용할 수 있는 효과가 있다.

Description

폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법{A SYSTEM FOR RECOGNIZING A FONT AND PROVIDING ITS INFORMATION AND THE METHOD THEREOF}
본 발명은 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법에 관한 것으로, 더욱 상세하게는 광학식 문자 판독기(OCR)를 이용하여 한글 또는 외국어를 포함한 이미지에 있는 문자의 폰트 정보를 추출하여 사용자에게 제공하는 것으로, 다양한 종류의 폰트와 캘리그라피를 데이터베이스화함으로써 보다 용이하게 폰트를 검색하여 폰트정보를 추출하고, 해당 폰트와 함께 폰트정보를 사용자 단말기의 앱을 통해서 제공하는 것에 관한 것이다.
최근 외국에서의 한류 열풍으로 의해 한글의 관심도가 급부상하면서 폰트에 대한 관심도 역시 증가하고 있으며, 새로운 문자 폰트가 많이 생성됨에 따라 이 폰트에 대한 정보도 함께 증가하고 있는 추세이다. 특히 여러 응용 분야에서 이미지로부터 문자를 자동으로 추출하는 것은 중요한 이슈이다. 그러나 문자를 이미지에서 분리하여 이진 데이터로 표현하는 이진화에 있어서, 문자를 포함한 이미지의 불균일화로 인해 표기된 문자를 추출하는데 여러 가지 어려움이 있는 실정이다.
폰트 디자이너들과 일반인들을 위한 캘리그라피 및 타이포그라피를 어플리케이션으로 하는 대부분의 제품은, 폰트를 인식한 후에 해당 폰트가 어떠한 폰트인지 표시하고 그 폰트를 가지고 여러 타이포그라피 레이어를 보여주고, 한 글자씩 입력하면서 원하는 형태로 변경시켜주고 최종적으로 하나의 타이포그라피를 완성시켜주는 어플리케이션이다.
대표적인 제품으로 “What the font”의 경우, 외국에서 지원하는 이미지 내 폰트 검색 시스템으로 해당 이미지나 이미지 URL을 첨부하여 실행을 하면, 해당 이미지의 텍스트이미지를 단어별로 뽑아내고 해당 문자가 무슨 문자인지 입력하게 된다. 그러면 유사한 폰트를 알려주며, 웹 앱으로 현재 안드로이드, iPhone을 모두 지원한다. 본 제품은 한글이 지원되지 않으며, 단지 유사한 폰트를 찾아주는 역할만 한다.
또한 Phoster라는 제품은, 타이포그라피를 이용한 포스터 제작 어플리케이션(또는 앱)으로, 미리 제작해 놓은 테블릿이나 사진에 미리 타이포그라피 디자인이 이미 되어 있어서, 일반 사용자들이 사용하기 매우 편하다. 그러나 정해진 위치에 정해진 폰트와 크기로 입력해야 하기 때문에 자율성이 많이 떨어진다.
선행문헌으로서 한국공개특허 제2012-0061084호(2012.06.12)에는 랜더링된 문서를 식별하기 위한 디바이스 및 방법이 제안되어 있다. 상기 선행문헌은 스캐닝된 이미지를 텍스트 데이터로 변환하도록 구성된 제1로직을 제공하는 것을 특징으로 한다.
또한 다른 선행문헌으로서 한국공개특허 제2010-0096468호(2010.09.02)에는 한글의 형태학적 특징과 의사 결정 트리를 이용한 크기에 무관한 연결 객체 기반의 한글 자막 추출 방법이 제안되어 있다. 상기 선행문헌은 자막이 존재하는 영역을 결정하고, 영역에 존재하는 자막 연결 객체들의 경계에 존재하는 에너지들의 명암도 밝기 값의 평균을 이용하여 자막과 배경을 이진화한 영상을 생성해서 광학식 문자 판독기(OCR : Optical Character Reader)의 입력으로 사용되는 자막과 배경이 이진화된 영상을 생성하는 자막 영역 이진화 단계를 갖추어 이루어진 것을 특징으로 한다.
또한 다른 선행문헌으로서 한국공개특허 제2003-0052126호(2003.06.26)에는 한글문자 인식 방법이 제안되어 있다. 상기 선행문헌은 스캐너 또는 카메라와 같은 영상 입력 장치로 획득한 문서 영상에 존재하는 한글문자를 인식하는 방법에 있어서, 상기 문서 영상에 존재하는 한글 문자영상을 한글 자소의 조합에 따라 분류된 여러 결합 유형 중 하나의 유형으로 분류하는 제1 단계와, 상기 분류된 유형에 따라 문자를 자소 또는 결합된 자소로 구성된 구성요소들로 분리하는 제2 단계와, 상기 분리된 각 구성요소들을 구성요소별로 인식하는 제3 단계를 포함하는 것을 특징으로 한다.
또 다른 선행문헌으로서 한국공개특허 제2006-0102614호(2006.09.28)에는 네트워크를 통하여 접속된 폰트 서버들을 이용한 다국어 번역 및 변환된 서체 이미지 데이터 제공 방법 및 시스템이 제안되어 있다. 상기 선행문헌은 하나 이상의 폰트 데이터를 저장하는 폰트 데이터베이스와 네트워크를 통하여 접속한 사용자 단말기로 상기 폰트 URL 데이터베이스로부터 추출된 하나 이상의 폰트들의 샘플 타입페이스 데이터를 전송하여 상기 사용자가 선택할 수 있도록 샘플 타입페이스 제공 모듈을 포함하는 것을 특징으로 한다.
그러나 상기 선행문헌들에는 다양한 종류의 폰트와 손으로 그린 그림문자 또는 아름다운 서체를 의미하는 캘리그라피(Calligraphy)를 데이터베이스화하여 저장하지 않아 로컬에서 폰트를 쉽게 검색하여 사용할 수 없는 문제점이 있다.
그러나 상기 선행문헌은 OCR을 이용하여 텍스트뿐만 아니라 이미지에 있는 글자의 폰트 정보를 추출하여 사용자에게 제공하는 시스템 및 방법이 제시되지 않았으며, 외국어 폰트뿐만 아니라 다양한 한글 폰트를 지원하는 시스템 및 방법이 제시되지 않아 다양한 폰트를 인식하고 다양한 종류의 폰트 정보를 제공할 수 없는 문제점이 있다.
따라서 OCR을 이용하여 텍스트뿐만 아니라 이미지에 있는 글자의 폰트를 인식하고, 외국어 폰트뿐만 아니라 다양한 한글 폰트를 인식하며, 이에 따른 상기 폰트의 폰트정보와 함께 해당 폰트로 편집이나 문서작업을 수행할 폰트를 제공하는 서비스가 제공될 필요성이 있다.
본 발명은 상기와 같은 문제점을 해결하기 위해 창작된 것으로서, OCR을 이용하여 텍스트뿐만 아니라 이미지에 있는 글자의 폰트정보를 추출하여 사용자에게 제공하는 시스템 및 방법을 제공하는 것을 목적으로 한다.
또한 본 발명의 또 다른 목적은 한글 및 외국어 폰트뿐만 아니라 다양한 문자 폰트를 지원하는 시스템 및 방법을 제공하는 것을 목적으로 한다.
더욱 구체적으로 본 발명의 또 다른 목적은 다양한 종류의 폰트와 캘리그라피를 데이터베이스화하여 저장함에 따라 별도의 로컬에 저장하지 않아도 폰트를 보다 용이하게 검색하여 사용할 수 있는 시스템 및 방법을 제공하는 것을 목적으로 한다.
본 발명의 일 실시예에 따른 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 시스템은, 사용자 단말을 이용하여 촬영한 폰트 이미지를 입력하여 폰트를 인식하는 OCR 패턴 인식부; 및 상기 OCR 패턴 인식부에서 추출된 폰트 이미지의 텍스트 정보와 복수의 폰트가 저장된 폰트 데이터베이스를 비교 또는 매칭하여 유사한 폰트를 검색하는 폰트 검색부;를 포함하며, OCR을 이용하여 텍스트뿐만 아니라 이미지에 있는 글자의 복수의 종류에 대한 폰트, 손으로 그린 그림문자, 캘리그라피(Calligraphy) 또는 이들의 조합을 데이터베이스화하여 상기 폰트를 로컬에 저장하지 않고도 검색하여 사용할 수 있는 것을 특징으로 한다.
또한 본 발명의 일 실시예에 따른 상기 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 시스템에서, 상기 OCR 패턴 인식부는, 문자가 아닌 사진 촬영 이미지만으로도 저장 가능한 벡터화된 사진에서도 폰트를 검색할 수 있는 것을 특징으로 한다.
또한 본 발명의 일 실시예에 따른 상기 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 시스템에서, 상기 폰트 검색부는, 이미지화 되어 있는 폰트 이미지를 텍스트로 추출하고, 데이터베이스에 저장해 놓은 복수의 폰트 데이터와 비교하여 유사한 폰트를 적어도 하나 이상 검색할 수 있는 것을 특징으로 한다.
또한 본 발명의 일 실시예에 따른 상기 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 시스템은, 상기 폰트 검색부에서 검색된 유사한 폰트의 명칭, 이미지, 제작자, 상업적 사용 가능 여부, 유료 혹은 무료 여부 또는 이들의 조합을 포함한 폰트에 대한 정보를 사용자 단말기로 전송하는 것을 특징으로 한다.
아울러 본 발명의 또 다른 일 실시예에 따른 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 방법은, 사용자 단말을 이용하여 촬영한 폰트 이미지를 입력하여 폰트를 인식하는 OCR 패턴 인식 단계; 및 상기 OCR 패턴 인식부에서 추출된 폰트 이미지의 텍스트 정보와 다양한 종류의 폰트가 저장된 폰트 데이터베이스를 비교 또는 매칭하여 유사한 폰트를 검색하는 검색 단계;를 포함하며, OCR을 이용하여 텍스트뿐만 아니라 이미지에 있는 글자의 복수의 종류에 대한 폰트, 손으로 그린 그림문자, 캘리그라피(Calligraphy) 또는 이들의 조합을 데이터베이스화하여 상기 폰트를 로컬에 저장하지 않고도 검색하여 사용할 수 있는 것을 특징으로 한다.
또한 본 발명의 일 실시예에 따른 상기 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 방법에서, 상기 OCR 패턴 인식 단계는 문자가 아닌 사진 촬영 이미지만으로도 저장 가능한 벡터화된 사진에서도 폰트를 검색할 수 있는 것을 특징으로 한다.
또한 본 발명의 일 실시예에 따른 상기 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 방법에서, 상기 검색 단계는 이미지화 되어 있는 폰트 이미지를 텍스트로 추출하고, 데이터베이스에 저장해 놓은 복수의 폰트 데이터와 비교하여 유사한 폰트를 적어도 하나 이상 검색할 수 있는 것을 특징으로 한다.
또한 본 발명의 일 실시예에 따른 상기 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 방법은, 상기 검색 단계에서 검색된 유사한 폰트의 명칭, 이미지, 제작자, 상업적 사용 가능 여부, 유료 혹은 무료 여부 또는 이들의 조합을 포함한 폰트에 대한 다양한 정보를 사용자 단말기로 전송하는 것을 특징으로 한다.
본 발명은 한글 폰트 전용 인식 프로그램으로 다양한 한글 폰트를 인식할 수 있고, 폰트의 필수적인 정보인 저작권 관련 정보를 제공하여 폰트 사용시 불편함과 폰트 시장의 저작권 관련 문제를 감소시킬 수 있으며, 웹사이트 내의 폰트뿐만 아니라 이미지 내의 폰트도 인식할 수 있는 효과가 있다. 또한 다양한 종류의 폰트를 개성적인 표현과 우연성이 중시되는 캘리그라피로 표현하고, OCR을 사용하여 문자가 아닌 사진 촬영만으로도 저장 가능한 벡터화된 사진으로 폰트를 검색할 수 있으며, 나아가 클라우드 기능으로서 다양한 종류의 폰트와 캘리그라피를 데이터베이스화하여 저장함에 따라 별도의 로컬에 저장하지 않아도 폰트를 쉽게 검색하여 사용할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템의 구성도.
도 2는 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템에서의 폰트인식 과정을 나타낸 블록도.
도 3은 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템에서의 특징벡터에 따른 분류와 분류 특징의 예를 설명하기 위한 예시도.
도 4는 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템에서의 입력받은 텍스트를 분리하는 과정에 대한 흐름도.
도 5는 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템에서의 비트맵으로 캐스팅해서 기존 이미지와 비교하는 매소드의 프로그램 예시도.
도 6은 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템에서 텍스트를 레이어 배치에 따라 설정한 예시도.
도 7은 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 방법의 흐름도.
도 8은 본 발명에 따른 폰트 인식 및 폰트정보 제공 어플리케이션의 UI에 대한 예시도.
이하, 첨부된 도면을 참조하여 본 발명에 따른 OCR을 이용하여 폰트를 인식하고 해당 폰트정보를 포함한 폰트를 제공하는 방법 및 그 장치의 일 실시예를 설명한다.
도 1은 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템(100)의 구성도로서, 상기 폰트 인식 및 폰트정보 제공 시스템(100)은 OCR(Optical Character Reader) 패턴 인식부(120), 폰트 검색부(130)를 포함한다.
먼저 사용자가 인터넷에 접속하거나 길을 걷다가 마음에 드는 폰트를 발견한다면 단말기(110)의 카메라를 이용하여 폰트 이미지를 촬영한다. 이때 폰트는 한글 및 외국어를 포함한 다양한 문자폰트를 포함하며, 이때 문자 폰트의 종류와 형태에는 전혀 제한이 없다. 또한 사용자의 단말기는 안드로이드 OS 및 iOS 기반의 스마트폰, PDA 또는 태블릿 PC를 포함한 클라이언트 단말의 일체를 모두 포함하며, 단말의 종류에도 제한은 없다. 본 발명에서 제시하는 단말기는 개념적으로, 안드로이드 이외의 타 운영체제 기반에서도 작동될 수 있으므로, 운영체제의 종류에 따라 동작 여부가 제한을 받는 것은 아니다. 즉, M씌5 기반의 웹 어플리케이션(앱)을 제공하여 사용자 단말의 기기아 OS에 의존적이지 않은 웹앱을 제공하여, 서비스를 하고자 한다.
다음으로 촬영된 폰트 이미지는 사용자의 단말기(110)에 설치된 웹 애플리케이션(앱)에 업로드되고 네트워크를 통해 OCR 패턴 인식부(120)로 전송함으로써, 폰트 이미지를 인식하게 된다. 여기서 OCR은 광학식 문자 판독기로, 컴퓨터 등에서 데이터의 입력 작업을 간편화하기 위한 장치를 말한다. 즉 손으로 쓴 문자나 인쇄된 문자를 직접 해독할 수 있다. 또한 OCR은 바코드(bar code)와는 달리 문자를 직접 입력할 수 있기 때문에 입력 작업을 더욱 간소화할 수 있다. OCR은 문자의 패턴을 가는 블록으로 분리해서 각 블록의 농담을 0과 1의 부호로 바꾸어 광학적으로 독해한다. 숫자나 알파벳 등을 독해하는 것에서부터 한자(중국어나 일본어 포함)의 독해에 이르기까지 실용화되어 있다. 이와 같은 OCR 패턴 인식부에 입력된 폰트 이미지는 OCR 패턴 인식 기술을 통해 이미지화되어 폰트 이미지를 텍스트 정보로 추출한다. 이때 추출된 텍스트 정보는 검색부(130)로 전송되어 다양한 종류의 폰트가 저장된 폰트 데이터베이스(140)에 접속하여 인식된 폰트와 가장 유사한 폰트를 검색한다. 이때 추출된 텍스트 정보는 텍스트의 특징점 토대로 폰트 데이터베이스의 폰트와 비교 또는 매칭하여 유사한 폰트를 검색한다. 또한 검색된 유사한 폰트는 1개 내지 3개를 검색할 수 있으며, 유사한 폰트 검색 수는 임의로 설정할 수 있으므로 특정수로 한정하지 않는다.
여기서 폰트 데이터베이스(140)는 본 발명의 폰트와 관련된 데이터들을 저장하는 저장부로서 통상적으로 내장형 메모리 또는 외장형 메모리를 비롯하여 네트워크에 있는 클라우드 컴퓨팅 네트워크의 가상화된 저장장치(간략하게 클라우드 저장장치라고 부름)를 더 포함할 수 있다. 예컨대 상기 클라우드 저장장치는 서비스 제공자가 제공하는 전용 클라우드 저장장치, 또는 포털 사이트(예 : 네이버, 다음 등)에서 제공하는 무료 클라우드 저장장치(또는 네트워크 HDD)를 더 포함할 수 있다. 즉, 상기 데이터베이스(140)는 전기 혹은 광학 케이블로, 클라우드 컴퓨팅을 포함한 네트워크로, 또는 이들의 조합을 통해서 본 발명의 폰트 인식 시스템과 연결된 데이터베이스이다.
이렇게 검색된 폰트 또는 유사한 폰트에 대해서, 각 폰트의 이미지, 명칭 또는 저작권 등을 포함한 다양한 폰트정보와 해당 폰트를 사용자의 단말기로 전송하며, 사용자는 전송된 폰트와 폰트정보를 이용하여 문서작업 또는 디자인작업 등을 포함한 다양한 작업을 수행할 수 있다.
도 2는 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템에서의 OCR 패턴 인식부에 대한 세부 블록도이다.
먼저 폰트 이미지 정보를 입력받기 위한 센서 및 카메라를 포함하여 마이크와 같은 오디오나 음성 정보를 입력받는 장치(210)도 필요하다. 다음으로 이미지에 포함된 잡음을 제거하고, 특징점을 추출하며, 보다 명확한 이진화를 위해서 정규화하는 전처리부(220)가 필요하며, 정규화된 이미지에 대해서 특징점을 선택하고 특징에 대한 사영(projection)을 수행하고, 이들을 분류, 회귀, 클러스터링을 통해 폰트를 인식하는 폰트 인식부(230)를 포함하여 구성할 수 있다. 마지막으로 폰트인식의 결과가 출력된다.
이와 같이 OCR 기술에 대한 적용 방법은 첫 번째로 이미지를 이진화 하는 것이다. 이 과정은 Otsu의 방법을 이용하여 코드화를 실시하고, 이후에 노이즈 제거와 라벨링을 실시하며, 패턴 인식 기술을 이용하여 텍스트를 출력하는 것이다. 두 번째로는 RGB(Red-Green-Blue) 즉 색 표시 방식과 HSV(Hue Saturation Value) 즉 색상(H), 채도(S) 및 명도(V)로 색을 지정 하는 방식을 통해서 이미지의 배경과 글자를 분리하여 글자를 텍스트화하는 과정이다. 세 번째로 물체 특징을 통해 인식 대상이 되는 객체 고유의 분별 가능한 조명, 양 또는 특성을 가지고 특징 벡터와 특징 공간으로 분산 그래프를 그려서 텍스트화하는 것이다. 이때 특징 벡터는 분포 유형에 따라 도 3에 도시된 바와 같이 (a) 선형 분리 가능한 유형, (b) 비선형 분리 가능한 유형, (c) 높은 상관을 가진 유형 및 (d) 멀티 모달 유형으로 분류할 수 있다. 이러한 유형에 대해서 좋은 특징의 예는 (e) 선형 혹은 비선형 분리가 명확하게 가능한 경우이고, 텍스트 영역과 배경이 명확하게 분류하기 힘든 경우는 도 3의 (f)와 같이 나쁜 특징을 가진 경우이다.
이러한 방식으로 텍스트화가 완료되었다면 텍스트 영역(text area)에서 인식한 텍스트가 표시되며, 이 텍스트를 한 글자씩 자간에 따라 또다시 분류할 수 있다. 이때 코딩을 통해 분류 알고리즘을 이용하여 글자를 분류하고 각 텍스트를 데이터베이스에 있는 폰트 데이터들과 비교 검색한다. 이와 같은 OCR 엔진의 동작 방식은 회색 이미지나 색상 이미지를 OCR 엔진의 입력에 입력하고 난 뒤, 임계값을 이용하여 입력 이미지를 이진화한다. 이진화한 이미지의 연결된 구성 요소를 분석하여 각 구성요소의 외곽선을 추출하고, 이를 이진 데이터의 집합으로 분류하고 블랍(BLOB : Binary Large Object) 형태로 저장한다. 이때 블랍은 int, vchar 또는 text 등과 같이 데이터베이스에 저장되는 파일 형식의 하나로서, 최고 2GB의 가변 길이를 가지며, 문자가 아닌 이진 데이터 덩어리로 데이터베이스에 저장되기 때문에 일반 데이터베이스처럼 내용물 검색이나 자료 관리는 불가능하고, 오직 그 크기와 위치만을 알 수 있는 것을 말한다. 이후 텍스트 라인을 분석하여 블랍을 체계화 한 뒤, 문자의 자간에 따라 단어 단위로 나눈다. 이때 단어 단위로 나뉜 블랍을 단어 단위와 페이지 단위로 인식한다.
도 4는 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템에서의 입력받은 텍스트를 분리하는 과정에 대한 흐름도로서, 텍스트 분리 단계가 시작되면, 텍스트를 입력받는 단계(S401), 입력받은 텍스트에서 텍스트 사이의 공간을 읽어서(S402), 공간의 존재 유무를 판단하고(S403), 공간이 존재하지 않으면 계속해서 텍스트를 입력받고(S401), 공간이 존재하면 공간별로 split함수를 이용해 공간을 기준으로 각각 서로 다른 배열로 할당하여 삽입한다(S404). 텍스트 분리가 완성되면 다음 단계로 진행한다. 이러한 처리 흐름은 프로그래밍 언어를 사용하여 간단하게 처리할 수 있다.
도 5는 도 5는 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템에서의 비트맵으로 캐스팅해서 기존 이미지와 비교하는 매소드의 프로그램 예시도이다. 예시된 바와 같이 텍스트 정보와 데이터베이스의 폰트 데이터의 비교는 각 텍스트마다 가지고 있는 고유한 id 값을 비교하거나 이미지를 비트맵형식으로 캐스팅(Casting)해서 비교할 수 있으며, 폰트 이미지의 특징점을 추출하여 비교할 수도 있다. 첫 번째는 각 텍스트의 고유 id를 가져오고 if(img_1.getId() == R.drawable.nextimg)와 같은 코딩을 통해 같은 id값을 가진 그림이 나올 때까지 비교하는 방법이 있으며, 두 번째는 강제로 비트맵으로 캐스팅하는 방법을 통해 해결할 수 도 있다. 이렇게 두 개의 텍스트 비교가 완료되고 해당 텍스트와 비슷한 폰트들이 나열이 되면 사용자는 사용하고 싶은 폰트를 선택함으로써 1차적인 행동이 마무리된다.
도 6은 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 시스템에서 텍스트를 레이어 배치에 따라 설정한 예시도이며, 위에서 각 텍스트 별로 분리하였기 때문에 타이포그라피 레이어에 사용자는 원하는 글자를 크기와 모양으로 도시된 바와 같이 재배열할 수 있다.
이와 같이 폰트 인식 및 폰트정보 제공 시스템은 기존 웹사이트 내의 폰트 인식 시스템과 달리 한글 및 외국어를 포함한 다양한 문자 폰트를 인식할 수 있으며, 폰트의 필수적인 정보인 저작권 관련 정보가 제공되어 사용시 불편함과 폰트 시장의 저작권 관련 문제를 감소시킬 수 있으며, 웹사이트 내의 폰트뿐만 아니라 이미지 내의 폰트도 인식할 수 있는 이점이 있다.
도 7은 본 발명의 일 실시예에 따른 OCR을 이용한 폰트 인식 및 폰트정보 제공 방법의 흐름도이다.
먼저 사용자 단말기로 촬영된 폰트 이미지를 OCR 패턴 인식부에 입력(S701)한다. OCR 패턴 인식부에서는 입력된 폰트 이미지의 특징점을 추출하여 폰트 이미지를 인식(S702)한다. 여기서 추출된 폰트 이미지의 특징점은 폰트 이미지 검색부로 전송하여, 폰트 데이터베이스에 저장된 수많은 폰트 중 매칭되는 폰트를 검색(S703)한다. 이때 폰트 데이터베이스에서 검색된 유사한 폰트와 추출된 폰트 이미지 간의 특징점을 매칭하여 유사한 폰트를 검색한다. 이렇게 검색된 유사한 폰트의 정보 즉 폰트의 명칭, 이미지, 제작자, 상업적 사용 가능 여부, 유료/무료 여부 또는 이들을 포함한 폰트에 대한 다양한 정보를 사용자 단말기로 전송(S704)한다. 이와 같은 과정을 통해 검색된 폰트는 문서작업 또는 디자인작업을 포함한 다양한 작업을 통해 활용(S705)될 수 있다.
본 발명은 OCR 베타를 사용하여 문자가 아닌 사진 촬영만으로도 저장 가능한 벡터화된 사진으로 폰트를 검색할 수 있으며, 나아가 클라우드 기능으로서 다양한 종류의 폰트와 캘리그라피를 데이터베이스화하여 저장함에 따라 별도의 로컬에 저장하지 않아도 폰트를 쉽게 검색하여 사용할 수 있는 이점이 있다.
도 8은 본 발명에 따른 폰트 인식 및 폰트정보 제공 어플리케이션의 UI에 대한 예시도로서, 도시된 바와 같이 (a)는 메인화면의 예시이며, (b)는 사진 촬영을 통한 인식의 예로 사용자 단말기의 화면에 가이드라인을 제시한 것이며, (c)는 카메라 앨범에서 불러온 경우를 예시한 것이며, (d)는 검색결과를 폰트명, 제작자(제작기업), 상업적 사용 가능 여부, 유료인지 무료인지 여부 등 폰트에 대한 정보를 제공하는 화면이며, (e)는 폰트그라피 화면을 예시한 것으로 감정을 표현하는 단어의 캘리그라피를 제공하여 페이스북 등 SNS에 공유하는 기능을 구현한 화면이며, 더불어 단어의 뜻을 영어로 제공하는 것도 가능하다. (f)는 느낌으로 폰트를 찾기 위한 화면을 예시한 것으로, 폰트의 속성별 카테고리화를 통해 폰트가 가지고 있는 느낌으로 글꼴을 검색하는 것이다. 다음으로 (g)는 폰트 클라우드의 예로 글꼴을 클라우드 서버를 통해 업로드하여 특정 데이터베이스에 저장하는 것을 예시한 것이다. 마지막으로 (h)는 폰트를 전송하는 화면을 예시한 것으로, 발신자, 수신자 및 제목을 기재하여 전송하는 것이 가능하다.
상기에서는 본 발명에 따른 바람직한 실시 예를 위주로 상술하였으나, 본 발명의 기술적 사상은 이에 한정되는 것은 아니며 본 발명의 각 구성요소는 동일한 목적 및 효과의 달성을 위하여 본 발명의 기술적 범위 내에서 변경 또는 수정될 수 있을 것이다.
100: 폰트인식 및 폰트정보 제공 시스템 110: 사용자 단말기
120: OCR 패턴 인식부 130: 폰트 검색부
140: 폰트 DB 200: 폰트 인식기
210: 입력장치 220: 전처리부
230: 폰트 인식부

Claims (12)

  1. 사용자 단말을 이용하여 입력한 텍스트뿐만 아니라 이미지를 입력하여 상기 텍스트뿐만 아니라 이미지에 포함된 문자의 폰트를 인식하는 OCR 패턴 인식부; 및
    상기 OCR 패턴 인식부에서 인식된 폰트와 복수의 폰트가 저장된 폰트 데이터베이스의 폰트를 비교 또는 매칭하여 유사한 폰트를 검색하는 폰트 검색부;를 포함하며,
    OCR을 이용하여 텍스트뿐만 아니라 이미지에 있는 글자의 복수의 종류에 대한 폰트, 손으로 그린 그림문자, 캘리그라피(Calligraphy) 또는 이들의 조합을 데이터베이스화하여 상기 폰트를 로컬에 저장하지 않고도 검색하여 사용할 수 있으며,
    상기 폰트 검색부에서 검색된 유사한 폰트의 명칭, 이미지, 제작자, 상업적 사용 가능 여부, 유료 혹은 무료 여부 또는 이들의 조합을 포함한 폰트에 대한 정보를 상기 사용자 단말로 출력하는 것을 특징으로 하는 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 시스템.
  2. 청구항 1에 있어서,
    상기 OCR 패턴 인식부는,
    상기 입력한 이미지에 포함된 잡음을 제거하고, 특징점을 추출하며, 보다 명확한 이진화를 위해서 정규화하고, 상기 정규화된 이미지에 대해서 특징점을 선택하고, 상기 특징점에 대한 사영을 수행하며, 상기 사영된 특징점을 분류, 회귀 및 클러스터링을 통해 폰트를 인식하고, 폰트인식의 결과를 출력하는 것을 포함하는 것을 특징으로 하는 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 시스템.
  3. 청구항 2에 있어서,
    문자가 아닌 사진 촬영 이미지만으로도 저장 가능한 벡터화된 사진에서도 폰트를 인식할 수 있으며, 상기 벡터화된 사진으로부터도 폰트를 검색할 수 있는 것을 특징으로 하는 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 시스템.
  4. 삭제
  5. 청구항 1에 있어서,
    상기 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 시스템은,
    상기 사용자 단말에 HTML5에 기반한 모바일 웹 앱을 지원하여, 상기 사용자 단말의 OS나 기기에 독립적으로 상기 웹 앱을 실행시킬 수 있는 것을 특징으로 하는 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 시스템.
  6. 청구항 1에 있어서,
    상기 데이터베이스는 클라우드 컴퓨팅 네트워크의 가상화된 저장장치이며, 상기 저장장치는 서비스 제공자가 제공하는 전용 클라우드 저장장치, 포털 사이트에서 제공하는 무료 클라우드 저장장치 또는 네트워크 HDD 또는 이들의 조합을 포함하는 것을 특징으로 하는 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 시스템.
  7. 사용자 단말을 이용하여 입력한 텍스트뿐만 아니라 이미지를 입력하여 상기 텍스트뿐만 아니라 이미지에 포함된 문자의 폰트를 인식하는 OCR 패턴 인식 단계; 및
    상기 OCR 패턴 인식 단계에서 인식된 폰트와 복수의 폰트가 저장된 폰트 데이터베이스의 폰트를 비교 또는 매칭하여 유사한 폰트를 검색하는 폰트 검색 단계;를 포함하며,
    OCR을 이용하여 텍스트뿐만 아니라 이미지에 있는 글자의 복수의 종류에 대한 폰트, 손으로 그린 그림문자, 캘리그라피(Calligraphy) 또는 이들의 조합을 데이터베이스화하여 상기 폰트를 로컬에 저장하지 않고도 검색하여 사용할 수 있으며,
    상기 폰트 검색 단계에서 검색한 유사한 폰트의 명칭, 이미지, 제작자, 상업적 사용 가능 여부, 유료 혹은 무료 여부 또는 이들의 조합을 포함한 폰트에 대한 정보를 상기 사용자 단말로 출력하는 것을 특징으로 하는 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 방법.
  8. 청구항 7에 있어서,
    상기 OCR 패턴 인식 단계는,
    상기 입력한 이미지에 포함된 잡음을 제거하고, 특징점을 추출하며, 보다 명확한 이진화를 위해서 정규화하고, 상기 정규화된 이미지에 대해서 특징점을 선택하고, 상기 특징점에 대한 사영을 수행하며, 상기 사영된 특징점을 분류, 회귀 및 클러스터링을 통해 폰트를 인식하고, 폰트인식의 결과를 출력하는 것을 포함하는 것을 특징으로 하는 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 방법.
  9. 청구항 8에 있어서,
    문자가 아닌 사진 촬영 이미지만으로도 저장 가능한 벡터화된 사진에서도 폰트를 인식할 수 있으며, 상기 벡터화된 사진으로부터도 폰트를 검색할 수 있는 것을 특징으로 하는 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 방법.
  10. 삭제
  11. 청구항 7에 있어서,
    상기 사용자 단말에는 HTML5에 기반한 모바일 웹 앱이 실행되도록 지원하여, 상기 사용자 단말의 OS나 기기에 독립적으로 상기 웹 앱을 실행시킬 수 있는 것을 특징으로 하는 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 방법.
  12. 청구항 7에 있어서,
    상기 데이터베이스는 클라우드 컴퓨팅 네트워크의 가상화된 저장장치이며, 상기 저장장치는 서비스 제공자가 제공하는 전용 클라우드 저장장치, 포털 사이트에서 제공하는 무료 클라우드 저장장치 또는 네트워크 HDD 또는 이들의 조합을 포함하는 것을 특징으로 하는 OCR을 이용한 폰트를 인식하고 폰트정보를 제공하는 방법.
KR1020140012803A 2014-02-04 2014-02-04 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법 KR101552525B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140012803A KR101552525B1 (ko) 2014-02-04 2014-02-04 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140012803A KR101552525B1 (ko) 2014-02-04 2014-02-04 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법

Publications (2)

Publication Number Publication Date
KR20150091948A KR20150091948A (ko) 2015-08-12
KR101552525B1 true KR101552525B1 (ko) 2015-09-14

Family

ID=54056623

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140012803A KR101552525B1 (ko) 2014-02-04 2014-02-04 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR101552525B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190056664A (ko) * 2017-11-17 2019-05-27 (주)위즈데이타 폰트 저작권 보호 시스템 및 방법

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105117740B (zh) * 2015-08-21 2021-06-15 北京旷视科技有限公司 字体识别方法及装置
WO2019093755A1 (ko) * 2017-11-13 2019-05-16 (주)위즈데이타 폰트 저작권 보호 시스템 및 방법
KR102053067B1 (ko) * 2018-03-12 2019-12-06 주식회사 한글과컴퓨터 폰트 결정 장치 및 이의 동작 방법
KR102257323B1 (ko) * 2019-01-18 2021-06-07 주식회사 우아한형제들 한글 폰트 파일을 포함하는 컴퓨터 프로그램, 상기 한글 폰트 파일의 생성방법, 및 활용방법
KR20220077536A (ko) 2020-12-02 2022-06-09 신명하 이미지 인식을 통한 세탁 정보 제공 및 일회용 의류 세정 밴드 판매기
KR20220077524A (ko) 2020-12-02 2022-06-09 신명하 이미지 인식을 통한 세탁 정보 제공 시스템 및 그 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252430A (ja) 2005-03-14 2006-09-21 Ricoh Co Ltd 画像処理装置とフォント作成方法
JP2010176672A (ja) 2009-01-28 2010-08-12 Xerox Corp ベクトル系列用モデル基準比較指標及びそれを用いたワードスポッティング

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006252430A (ja) 2005-03-14 2006-09-21 Ricoh Co Ltd 画像処理装置とフォント作成方法
JP2010176672A (ja) 2009-01-28 2010-08-12 Xerox Corp ベクトル系列用モデル基準比較指標及びそれを用いたワードスポッティング

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190056664A (ko) * 2017-11-17 2019-05-27 (주)위즈데이타 폰트 저작권 보호 시스템 및 방법
KR101990998B1 (ko) 2017-11-17 2019-06-20 (주)위즈데이타 폰트 저작권 보호 시스템 및 방법

Also Published As

Publication number Publication date
KR20150091948A (ko) 2015-08-12

Similar Documents

Publication Publication Date Title
KR101552525B1 (ko) 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법
US9811749B2 (en) Detecting a label from an image
US9916499B2 (en) Method and system for linking printed objects with electronic content
CN110889402A (zh) 一种基于深度学习的营业执照内容识别方法及系统
Rigaud et al. Knowledge-driven understanding of images in comic books
KR101377601B1 (ko) 모바일 카메라를 이용한 자연 영상 다국어 문자 인식과 번역 시스템 및 방법
KR102373884B1 (ko) 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법
KR20200020305A (ko) 문자 인식을 위한 방법 및 장치
CN114092938A (zh) 图像的识别处理方法、装置、电子设备及存储介质
CN104424166A (zh) 文本处理装置和文本显示系统
RU2603495C1 (ru) Классификация изображений документов на основе параметров цветовых слоев
Hung et al. Automatic vietnamese passport recognition on android phones
CN115661846A (zh) 数据处理方法、装置、电子设备和存储介质
Chavre et al. Scene text extraction using stroke width transform for tourist translator on android platform
KR101160968B1 (ko) 색상 정보 및 외곽선 정보를 이용한 문자열 인식 시스템 및 그 방법
CN111638792A (zh) Ar效果的呈现方法、装置、计算机设备及存储介质
US20160283520A1 (en) Search device, search method, and computer program product
JP2013152564A (ja) 文書処理装置及び文書処理方法
KR101800975B1 (ko) 필기체가 인식되어 생성된 전자문서의 공유 방법 및 그 장치
KR20220079431A (ko) 스크린샷 이미지로부터 태그 정보를 추출하는 방법 및 시스템
Selmi et al. A framework of text detection and recognition from natural images for mobile device
US11010978B2 (en) Method and system for generating augmented reality interactive content
Bataineh et al. A robust algorithm for emoji detection in smartphone screenshot images
Gnanavel et al. Portable camera based text and product label reading from hand-held object for blind persons
Ahmed et al. OCR System for Poor Quality Images Using Chain-Code Representation

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180903

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20191120

Year of fee payment: 5