KR20240052185A - 문자의 컴포넌트-분리에 기반한 폰트 생성 시스템 및 폰트 생성 방법 - Google Patents

문자의 컴포넌트-분리에 기반한 폰트 생성 시스템 및 폰트 생성 방법 Download PDF

Info

Publication number
KR20240052185A
KR20240052185A KR1020220131907A KR20220131907A KR20240052185A KR 20240052185 A KR20240052185 A KR 20240052185A KR 1020220131907 A KR1020220131907 A KR 1020220131907A KR 20220131907 A KR20220131907 A KR 20220131907A KR 20240052185 A KR20240052185 A KR 20240052185A
Authority
KR
South Korea
Prior art keywords
component
font
character
characters
components
Prior art date
Application number
KR1020220131907A
Other languages
English (en)
Inventor
최재영
박장경
정근호
Original Assignee
숭실대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 숭실대학교산학협력단 filed Critical 숭실대학교산학협력단
Priority to KR1020220131907A priority Critical patent/KR20240052185A/ko
Priority to US18/111,002 priority patent/US20240127502A1/en
Priority to CN202310147010.7A priority patent/CN117892696A/zh
Priority to JP2023024962A priority patent/JP2024058540A/ja
Publication of KR20240052185A publication Critical patent/KR20240052185A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/203Drawing of straight lines or curves
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • G06N3/0455Auto-encoder networks; Encoder-decoder networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

폰트 생성 시스템 및 폰트 생성 방법이 개시된다. 본 발명의 폰트 생성 시스템 및 폰트 생성 방법은, 적어도 하나의 문자가 입력되고, 상기 입력된 문자를 적어도 하나 이상의 컴포넌트로 분해하는 컴포넌트 분해부; 상기 적어도 하나 이상의 컴포넌트를 미리 지정된 폰트의 컴포넌트로 변환하여 적어도 하나 이상의 이미징 컴포넌트를 생성하는 컴포넌트 변환부; 및 상기 적어도 하나 이상의 이미징 컴포넌트를 재결합하여 폰트화된 문자를 생성하는 컴포넌트 재결합부;를 포함하여 제공될 수 있다.

Description

문자의 컴포넌트-분리에 기반한 폰트 생성 시스템 및 폰트 생성 방법{FONT GENERATING SYSTEM AND METHODS COMPONENT-SAPERATION OF CHARACTERS}
본 발명은 폰트 생성 시스템 및 폰트 생성 방법에 관한 것으로, 보다 상세하게는 다수의 컴포넌트를 포함하는 복잡한 문자를 분해하고, 이를 변환한 뒤 재결합하여 폰트화된 문자를 생성하는 폰트 생성 시스템 및 폰트 생성 방법에 관한 것이다.
폰트(font)는 서체 또는 글씨체라고도 명명되며, 글자(또는 글씨, character)의 모양 또는 양식을 의미한다. 동일한 언어에 해당하는 글자이더라도, 폰트가 상이할 수 있으며, PC, 휴대폰 등에는 서로 다른 복수의 폰트가 제공되고 있다. 이러한 폰트는, 그 종류에 따라 보는 사람으로 하여금 동일한 글자이더라도, 서로 다른 분위기를 느끼게 해주므로, 최근에는 중요한 디자인 요소로 자리잡고 있다.
한편, 최근에는 기술의 발전에 따라, 손글씨의 폰트 특성을 추출하여 데이터화 또는 디지털화 함으로써, 전자기기 상에서 손글씨의 폰트를 이용할 수 있게 되었다. 다만, 손글씨에 해당하는 폰트를 데이터화 하기 위해서는, 언어를 구성하는 모든 글자에 해당하는 손글씨 폰트의 정보를 수집하고, 수집된 정보를 디지털화 해야 하므로, 매우 많은 노력이 필요하다.
특히, 중국어, 한국어(한글), 태국어 등과 같이, 낱자들의 조합에 의하여 글자가 형성되는 글자의 경우에는, 낱자들의 조합의 경우의 수가 매우 방대하여, 모든 글자에 대한 데이터를 수집하고, 이를 데이터화 하는 것은 실질적으로 매우 어려운 작업으로 분류된다.
특히, 상기 글자들은, 다수의 낱자들의 조합으로 수천가지의 조합으로 글자가 형성될 수 있다. 예를 들어, 중국어의 한자는 복잡한 낱자들로 구성된 번체의 경우, 70,244의 글자(GB18030)가 있으며, 보다 간소화된 낱자들로 구성된 간체에도 6,763의 글자(GB2312)가 있는 것으로 알려져 있다.
이처럼, 복수 개의 낱자들에 조합들로 형성되는 문자들을 가지는 글자는, 적어도 수천개의 조합에서 수만개의 조합으로 구성될 수 있고, 이를 수작업으로 폰트화 처리하는 것은 사실상 불가능의 영역에 가깝다.
이와 같은 문제를 보완하기 위하여, 적은 손글씨 데이터를 이용하여, 다양한 조합의 글자를 생성하기 위한 활발한 연구가 진행되고 있으며, 그 일예로서, 대한민국 등록특허 10-1229175에 따른 선행문헌에서는 자필 폰트 생성 방법 및 장치에 대하여 개시하고 있다.
대한민국 등록특허공보 제10-1229175호(2013년 01월 28일, 등록)
본 발명은 모든 한자에 대해 폰트화된 문자를 제공할 수 있는 폰트 생성 시스템 및 폰트 생성 방법을 제공할 수 있다.
본 발명은 글자를 컴포넌트로 분리한 후 이를 폰트화된 컴포넌트로 변환한 뒤 재결합함으로써, 모든 글자에 대한 폰트 변환을 수행할 수 있는 폰트 생성 시스템 및 폰트 생성 방법을 제공할 수 있다.
본 발명은 폰트 생성의 결과에 대한 신뢰성 및 정확성이 향상된 폰트 생성 시스템 및 폰트 생성 방법을 제공할 수 있다.
본 발명은 중국어(한자), 태국어, 또는 한국어(한글)의 폰트 변환을 수행할 수 있고, 폰트 변환을 위한 문자의 종류가 이에 한정되지 않고 다양한 문자(또는 언어)에 대한 폰트 변환을 수행하는 폰트 생성 시스템 및 폰트 생성 방법을 제공할 수 있다.
본 발명의 다양한 실시예에 따르면, 폰트 생성 시스템은, 적어도 하나의 문자가 입력되고, 상기 입력된 문자를 적어도 하나 이상의 컴포넌트로 분해하는 컴포넌트 분해부; 상기 적어도 하나 이상의 컴포넌트를 미리 지정된 폰트의 컴포넌트로 변환하여 적어도 하나 이상의 이미징 컴포넌트를 생성하는 컴포넌트 변환부; 및 상기 적어도 하나 이상의 이미징 컴포넌트를 재결합하여 폰트화된 문자를 생성하는 컴포넌트 재결합부;를 포함할 수 있다.
상기 적어도 하나의 문자는, 번체의 한자, 또는 간체의 한자일 수 있다.
상기 컴포넌트 분해부는, 상기 번체의 한자, 또는 상기 간체의 한자로 구성된 상기 적어도 하나의 문자를 편방으로 분리하여 적어도 하나 이상의 제1 컴포넌트를 생성할 수 있다.
상기 컴포넌트 분해부는, 상기 적어도 하나 이상의 제1 컴포넌트를 적어도 하나 이상의 제2 컴포넌트로 분리할 수 있다.
상기 컴포넌트 변환부는, 상기 적어도 하나 이상의 제2 컴포넌트를 상기 미리 지정된 폰트의 컴포넌트로 변환하여 상기 이미징 컴포넌트를 생성할 수 있다.
상기 폰트 생성 시스템은, 적어도 하나의 인코더 및 디코더를 포함하는 GAN 모델을 이용하여, 상기 컴포넌트의 분리 및 상기 이미징 컴포넌트의 재결합을 통해 상기 폰트화된 문자를 생성하도록 구성될 수 있다.
본 발명의 다양한 실시예에 따르면, 폰트 생성 방법은, 적어도 하나의 문자가 입력되고, 상기 입력된 문자를 적어도 하나 이상의 컴포넌트로 분해하는 단계; 상기 적어도 하나 이상의 컴포넌트를 미리 지정된 폰트의 컴포넌트로 변환하여 적어도 하나 이상의 이미징 컴포넌트를 생성하는 단계; 및 상기 적어도 하나 이상의 이미징 컴포넌트를 재결합하여 폰트화된 문자를 생성하는 단계;를 포함할 수 있다.
상기 적어도 하나의 문자는, 번체의 한자, 또는 간체의 한자일 수 있다.
상기 컴포넌트로 분해하는 단계는, 상기 번체의 한자, 또는 상기 간체의 한자로 구성된 상기 적어도 하나의 문자를 편방으로 분리하여 적어도 하나 이상의 제1 컴포넌트를 생성하는 단계를 포함할 수 있다.
상기 컴포넌트로 분해하는 단계는, 상기 적어도 하나 이상의 제1 컴포넌트를 적어도 하나 이상의 제2 컴포넌트로 분리하는 단계를 포함할 수 있다.
상기 이미징 컴포넌트를 생성하는 단계는, 상기 적어도 하나 이상의 제2 컴포넌트를 상기 미리 지정된 폰트의 컴포넌트로 변환하여 상기 이미징 컴포넌트를 생성할 수 있다.
상기 폰트 생성 방법은, 적어도 하나의 인코더 및 디코더를 포함하는 GAN 모델을 이용하여, 상기 컴포넌트의 분리 및 상기 이미징 컴포넌트의 재결합을 통해 상기 폰트화된 문자를 생성하도록 구성될 수 있다.
본 발명의 폰트 생성 시스템 및 폰트 생성 방법은 모든 한자에 대해 폰트화된 문자를 제공할 수 있다.
본 발명의 폰트 생성 시스템 및 폰트 생성 방법은 글자를 컴포넌트로 분리한 후 이를 폰트화된 컴포넌트로 변환한 뒤 재결합함으로써, 모든 글자에 대한 폰트 변환을 수행할 수 있다.
본 발명의 폰트 생성 시스템 및 폰트 생성 방법은 폰트 생성의 결과에 대한 신뢰성 및 정확성이 향상될 수 있다.
본 발명의 폰트 생성 시스템 및 폰트 생성 방법은, 중국어(한자), 태국어, 또는 한국어(한글)의 폰트 변환을 수행할 수 있고, 폰트 변환을 위한 문자의 종류가 이에 한정되지 않고 다양한 문자(또는 언어)에 대한 폰트 변환을 제공할 수 있다.
도 1은 본 발명의 실시예에 따른, 폰트 생성 시스템의 블록도이다.
도 2는 예시적인 실시예에 따른, 한자의 편방을 설명하기 위한 도면이다.
도 3은 본 발명의 폰트 생성 시스템의 컴포넌트 분해부를 통해 한자를 컴포넌트로 분리하는 과정을 설명하기 위한 도면이다.
도 4 내지 도 5는 본 발명의 실시예에 따른 폰트 생성 시스템을 통해 어떤 하나의 한자에 대한 폰트화된 한자를 생성하는 과정을 설명하기 위한 도면이다.
도 6 내지 7은 본 발명의 실시예에 따른, 폰트 생성 시스템에 포함된 모델의 구성을 설명하기 위한 도면이다.
도 8은 본 발명의 실시예에 따른, 판별부를 설명하기 위한 블록도이다.
도 9는 본 발명의 실시예에 따른, 폰트 생성 시스템을 이용하여 다양한 폰트의 글자를 생성한 상태를 설명하기 위한 도면이다.
도 10은 본 발명의 폰트 생성 시스템을 이용하여 생성된 문자의 일부를 나타내는 도면이다.
도 11은 본 발명의 폰트 생성 시스템을 이용하여 한글과 태국어를 폰트화된 결과를 출력한 도면이다.
도 12는 본 발명의 폰트 생성 시스템과 기존의 폰트 생성 시스템의 폰트 생성 결과를 정량적으로 비교한 결과를 나타낸 표이다.
도 13은 본 발명의 폰트 생성 시스템과 기존의 폰트 생성 시스템의 폰트 생성 결과를 정량적으로 비교하기 위한 도표이다.
도 14는 본 발명의 폰트 생성 시스템과 기존의 폰트 생성 시스템의 폰트 생성 결과를 정량적으로 비교하기 위한 도표이다.
도 15는 본 발명의 폰트 생성 방법을 설명하기 위한 흐름도이다.
이하에서는 본 발명의 실시 예를 첨부 도면을 참조하여 상세히 설명한다. 이하의 실시 예는 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 본 발명의 사상을 충분히 전달하기 위해 제시하는 것이다. 본 발명은 여기서 제시한 실시 예만으로 한정되지 않고 다른 형태로 구체화될 수도 있다. 도면은 본 발명을 명확히 하기 위해 설명과 관계없는 부분의 도시를 생략하고, 이해를 돕기 위해 구성요소의 크기를 다소 과장하여 표현할 수 있다.
본 명세서에 기재된 실시예와 도면에 도시된 구성은 개시된 발명의 바람직한 일 예에 불과할 뿐이며, 본 출원의 출원시점에 있어서 본 명세서의 실시예와 도면을 대체할 수 있는 다양한 변형 예들이 있을 수 있다.
본 명세서의 각 도면에서 제시된 동일한 참조번호 또는 부호는 실질적으로 동일한 기능을 수행하는 부품 또는 구성요소를 나타낸다. 도면에서 요소들의 형상 및 크기 등은 명확한 설명을 위해 과장된 것일 수 있다.
본 명세서에서 사용한 용어는 실시예를 설명하기 위해 사용된 것으로, 개시된 발명을 제한 및/또는 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, “포함하다” 또는 “가지다” 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는다.
본 명세서에서 사용한 “제1”, “제2”등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않으며, 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. “및/또는”이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
이하에서 사용되는 용어 "상단", "하단", "상부", "하부" 등은 도면을 기준으로 정의한 것이며, 이 용어에 의하여 각 구성요소의 형상 및 위치가 제한되는 것은 아니다.
명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 명세서가 실시 예들의 모든 요소들을 설명하는 것은 아니며, 본 발명이 속하는 기술분야에서 일반적인 내용 또는 실시 예들 간에 중복되는 내용은 생략한다.
명세서에서 사용되는 '부, 모듈, 장치'라는 용어는 소프트웨어 또는 하드웨어로 구현될 수 있으며, 실시 예들에 따라 복수의 '부, 모듈, 장치'가 하나의 구성요소로 구현되거나, 하나의 '부, 모듈, 장치'가 복수의 구성요소들을 포함하는 것도 가능하다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 간접적으로 연결되어 있는 경우를 포함하고, 간접적인 연결은 무선 통신망을 통해 연결되는 것을 포함한다.
또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
제1, 제2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 전술된 용어들에 의해 제한되는 것은 아니다.
단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다.
각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다.
도 1은 본 발명의 실시예에 따른, 폰트 생성 시스템의 블록도이다.
도 1을 참조하면, 폰트 생성 시스템(100)은, 컴포넌트 분해부(120), 컴포넌트 변환부(140), 또는 컴포넌트 재결합부(160)를 포함할 수 있다.
일 예로서, 폰트 생성을 위한 소스 문자(SRC)는, 중국어(한자), 태국어, 또는 한국어(한글)일 수 있으나, 이에 한정되지 않는다. 이하, 설명의 편의를 위해, 중국어의 폰트를 생성하는 방법을 일 예로서 설명하나, 본 발명은 이에 한정하지 않고 다양한 소스 문자(SRC)의 폰트를 변환하도록 구성될 수 있다.
컴포넌트 분해부(120)는, 폰트 생성 시스템(100)에 입력되는 소스 문자(src)를 컴포넌트(CP)(components)로 분리, 또는 분해할 수 있다.
일 예로서, 소스 문자(SRC)는, 한자의 번체일 수 있고, 또는 간체일 수 있다. 본 발명은 번체로 구성된 한자, 또는 간체로 구성된 한자에 상관없이 소스 문자(SRC)인 한자의 폰트를 생성할 수 있다.
컴포넌트 분해부(120)는, 입력된 소스 문자(SRC)의 조합인 한자의 조합의 모든 한자에 대해 컴포넌트(CP)로 분리할 수 있다. 컴포넌트(CP)는 한자를 구성하는 부수(部首)일 수 있으나, 이에 한정되지 않는다.
컴포넌트 분해부(120)는, 소스 문자(SRC)의 각각의 한자에 대한 컴포넌트(CP)를 분리하고, 분리된 컴포넌트(CP)들은 각각 컴포넌트 변환부(140)에서 미리 지정된 폰트의 컴포넌트(CP)들로 변환될 수 있고, 상기 변환된 컴포넌트들은 이미징 컴포넌트(IM-CP)로 정의될 수 있다. 상기 미리 지정된 폰트의 컴포넌트들은, 사용자가 디자인한 컴포넌트일 수 있으나, 이에 한정하지 않는다.
이에 따라, 어떤 하나의 한자는, 어떤 하나의 한자의 컴포넌트(CP)들로 변환되어, 이미징 컴포넌트(IM-CP)들을 형성할 수 있고, 상기 이미징 컴포넌트(IM-CP)들을 컴포넌트 재결합부(160)에서 다시 결합하면, 상기 어떤 하나의 한자에 대한 폰트화된 문자(FC)가 형성될 수 있다.
본 발명의 실시예에 따른, 폰트 생성 시스템(100)은, 전술한 과정을 입력된 소스 문자(SRC)들에 대한 모든 한자에 대해 각각 수행함으로써, 소스 문자(SRC)들에 대한 모든 한자의 폰트화된 문자(FC)를 형성할 수 있다.
도 2는 예시적인 실시예에 따른, 한자의 편방을 설명하기 위한 도면이다.
도 2에 도시된 한자는, 어머니 마(뜻: 어머니, 음: 마)를 나타내는 번체의 한자(11)와 간체의 한자(12)가 도시된다.
도시된 한자(11, 12) 이외에도 나머지 한자들은, 좌편방과 우편방, 그리고 상방향과 하방향으로 구성되거나, 하나의 편방으로 구성될 수도 있다.
도시된 한자(11, 12)를 살펴보면, 좌편방(11a, 12a)은, 뜻을 나타내고, 우편방(11b, 12b)은, 음(소리)를 나타낼 수 있다. 도시된 한자(11, 12)의 우편방을 살펴보면, 동일한 한자(뜻: 말, 음: 마)(11b, 12b)이지만, 실질적으로 다른 형상으로 형성될 수 있다. 한자는, 이와 같이 동일한 글자라 하더라도, 번체와 간체에 따라 그 문자의 형상이 다를 수 있다. 이에 따라, 종래의 폰트 생성 시스템들은, 수많은 한자들을 변환하기 위한 적절한 방법을 제시하지 못하였다.
본 발명의 실시예에 따른, 폰트 생성 시스템(100)은, 이와 같이 복잡한 구조를 갖는 한자들을 컴포넌트(CP)로 분리, 또는 분해함으로써, 번체, 또는 간체에 상관없이 모든 한자들의 폰트를 생성할 수 있다.
도 3은 본 발명의 폰트 생성 시스템의 컴포넌트 분해부를 통해 한자를 컴포넌트로 분리하는 과정을 설명하기 위한 도면이다.
도 3을 참조하면, 소스 문자(21)(SRC)가 도시된다. 컴포넌트 분해부(120)는, 소스 문자(21)(SRC)를 좌편방과 우편방으로 구성된 제1 컴포넌트(22)로 분리할 수 있다. 도시된 실시예를 살펴보면, 제1 컴포넌트(22)는, 하나의 편방으로 구성되거나, 또는 2개의 편방(좌편방, 우편방)으로 구성될 수 있다.
컴포넌트 분해부(120)는, 제1 컴포넌트(22)를 최소 단위인 제2 컴포넌트(23)로 분리할 수 있다. 상기 제2 컴포넌트(23)는, 컴포넌트 변환부(140)를 통해 미리 지정된 폰트의 컴포넌트로 변환되기 위한 컴포넌트(CP)를 형성할 수 있다.
이와 같이, 컴포넌트 분해부(120)는, 소스 문자(SRC)의 한자들을 폰트화 처리하기 위한 최소 단위의 제2 컴포넌트(23)들로 변환할 수 있다. 상기 제2 컴포넌트(23)(CP)들은, 컴포넌트 변환부(140)를 통해 미리 지정된 폰트의 컴포넌트로 변환되어 이미징 컴포넌트(IM-CP)들을 형성할 수 있다.
도 4 내지 도 5는 본 발명의 실시예에 따른 폰트 생성 시스템을 통해 어떤 하나의 한자에 대한 폰트화된 한자를 생성하는 과정을 설명하기 위한 도면이다.
도 4 내지 도 5를 참조하면, 어떤 하나의 한자(30)는, 컴포넌트 분해부(120)에 의해 5개의 컴포넌트(31)로 분리, 또는 분해될 수 있다. 상기 분리, 또는 분해된 5개의 컴포넌트(31)(CP)는, 컴포넌트 변환부(140)에 의해 미리 지정된 폰트의 컴포넌트로 변환되어 이미징 컴포넌트(32)(IM-CP)를 형성할 수 있다. 상기 이미징 컴포넌트(32)(IM-CP)는, 컴포넌트 재결합부(160)에 의해 재결합되어 폰트화된 문자, 또는 폰트화된 한자(33)를 형성할 수 있다.
대부분의 한자(약, 99.99%)는, 14개 미만의 컴포넌트를 가지지만, 일부의 한자는 14개 이상의 컴포넌트를 가질 수 있다. 또한, 번체의 한자는, 간체의 한자보다 많은 컴포넌트를 가질 수 있다.
도 6 내지 7은 본 발명의 실시예에 따른, 폰트 생성 시스템에 포함된 모델의 구성을 설명하기 위한 도면이다.
도 8은 본 발명의 실시예에 따른, 판별부를 설명하기 위한 블록도이다.
도 6 내지 도 8을 참조하면, 폰트 생성 시스템(100)은, 인코더(encoder) 및 디코더(decoder)를 포함하는 모델을 이용하여 폰트화된 문자를 생성할 수 있다.
복잡한 모양의 한자로부터 고품질의 폰트화된 이미지의 한자를 생성하기 위해서는, 모델의 학습 중 정보가 손실되지 않도록 대상 스타일의 정보 특징을 정확하게 추출할 필요가 있다.
본 발명의 폰트 생성 시스템(100)은, GAN 모델(generative adversarial networks using generation model)을 포함할 수 있다. 본 발명의 실시예에 따른, GAN 모델은, 일반적인 GAN 모델과 달리 2개의 인코더(encoder)를 포함할 수 있다. 제1 인코더(Ec)는, 폰트 콘텐츠 정보를 생성하고, 제2 인코더(Es)는, 폰트 스타일 정보를 생성할 수 있다. 이는 대상 폰트 컴포넌트에서 보다 정확한 스타일 정보를 얻기 위한 것으로, 손실을 방지하기 위해 컴포넌트별 이미지를 유지할 수 있다.
도 6을 참조하면, 본 발명의 GAN 모델은, 일대다(1:다수)의 프레임워크에서 한자의 구성과 컴포넌트를 활용한 모델일 수 있다. 또한, 상기 GAN 모델은, 변환하고자 하는 글자 컴포넌트의 콘텐츠 이미지(Xc)와 스타일 이미지(Xs)를 입력으로 사용하는 조건부 GAN 구조로 두 개의 인코더 구조(Ec, Es)를 가질 수 있다. 제1 인코더(Ec) 및 제2 인코더(Es)는, 다중의 레이어로 다운-샘플링할 수 있다. 각 컨볼루션 레이어(convolution layer)는 kernel=4 및 stride=2를 사용하고, kernel=7 및 stride=1을 사용하는 첫 번째 레이어를 제외하고 IN(instance normalization)을 따를 수 있다. 본 발명의 GAN 모델은, 활성화 함수로 LeakyRelu를 사용하고, 모든 레이어에 SC(skip connection) 구조가 형성될 수 있다.
제1 인코더(Ec) 및 제2 인코더(Es)의 결과 잠재 벡터(Zc및, Zs)는 병합되어 디코더(decoder)에 대한 입력으로 사용된 다음 다중의 컨볼루션 레이어(convolution layer)을 통해 다시 업-샘플링되어 변환된 스타일의 콘텐츠를 생성할 수 있다. 하나의 예로서, 각 레이어는 kernel=5, stride=1, IN(instance normalization) 방식 및 LeakyReLU 함수를 사용하여 디컨볼루션(deconvolution)을 수행할 수 있다. 모든 레이어는 인코더 레이어와 콘텐츠/스타일이 업샘플링된 벡터와 병합되는 SC(skip connection) 구조가 형성될 수 있다. 또한, 결과 이미지(G(x))는 컨볼루션 (convolution) 및 tanh 함수를 통해 생성될 수 있다. 생성된 결과는 판별부(discriminator(D))에 입력되고, 소스 이미지와 생성된 결과 이미지를 비교하여 GAN 손실을 계산할 수 있다. 원본 이미지에서 생성된 벡터와 결과 이미지 벡터를 비교하여 글자 및 스타일 손실을 계산하고, 대상 이미지와 생성된 이미지(L1 Loss)를 비교하여 이미지 품질을 향상시킬 수 있다.
본 발명의 폰트 생성 시스템(100) 및/또는 이에 포함된 GAN 모델은, 상기 원본 이미지와 생성된 결과 이미지를 비교하여 손실값을 계산하고, 상기 손실값을 이용하여 상기 생성된 결과 이미지의 문자의 폰트가 상기 원본 이미지의 문자의 폰트와 동일한지 여부를 판별할 수 있다.
예를 들어, 폰트 생성 시스템(100) 및/또는 이에 포함된 GAN 모델은, Adversarial 손실(LADV), 스타일 손실(LS), 및 L1 손실(LL1)을 합하여 상기 손실값을 산출할 수 있다.
Adversarial 손실(LADV)은 min-max Loss로 알려진 아래 [수식1] 과 같이 나타낼 수 있다.
[수식1]
minG maxD LADV(G,D) = Ey [log D(y)] + Ex [log(1-D(G(x)))]
예를 들어, GAN 모델의 폰트 판별부(discriminator)는 입력받은 이미지(G(x))가 진짜(True:1)인지 가짜(False:0)인지를 판별하여 최대화(D(y)=1)할 수 있다.
스타일 손실(LS)은 D(yS)를 최대화하고 G(xS)를 최소화하는 아래 [수식2]와 같이 나타낼 수 있다.
[수식2]
minG maxD Ls(G,D) = Ey [log D(yS)] + Ex [log (1-D(G(xS)))]
예를 들어, 폰트 판별부는 일대다의 스타일 변환된 이미지를 생성하기 위해서 진짜와 가짜를 판별하고 생성된 문자 스타일이 원본 문자 스타일과 같은지를 판별(D(yS))할 수 있다.
L1 손실(LL1)은 아래 [수식3]과 같이 나타낼 수 있다.
[수식3]
LL1 = Ex,y [ || Y - G(x) || ]
예를 들어, 폰트 판별부는 원본 문자 스타일과 생성된 문자 스타일을 픽셀별로 비교한 MAE(Mean Absolute Error) 값을 감소시켜 두 이미지가 같게 되도록 할 수 있다.
도 9는 본 발명의 실시예에 따른, 폰트 생성 시스템을 이용하여 다양한 폰트의 글자를 생성한 상태를 설명하기 위한 도면이다. 도 9를 참조하면, 본 발명의 폰트 생성 시스템(100)을 이용하여, 어떤 하나의 한자에 대해 생성된 다양한 폰트의 한자가 도시된다.
도 10은 본 발명의 폰트 생성 시스템을 이용하여 생성된 문자의 일부를 나타내는 도면이다.
도 10을 참조하면, 본 발명의 폰트 생성 시스템은, 타겟팅한 폰트(tgt)와 같은 스타일의 문자가 출력(out)되는 것을 확인할 수 있다.
도 11은 본 발명의 폰트 생성 시스템을 이용하여 한글과 태국어를 폰트화된 결과를 출력한 도면이다.
도 11을 참조하면, 본 발명의 폰트 생성 시스템은, 한자 이외에도 한글, 또는 태국어와 같이 컴포넌트로 분리할 수 있는 다양한 문자들에 적용될 수 있다.
도 12는 본 발명의 폰트 생성 시스템과 기존의 폰트 생성 시스템의 폰트 생성 결과를 정량적으로 비교하기 위한 표이고, 도 13은 본 발명의 폰트 생성 시스템과 기존의 폰트 생성 시스템의 폰트 생성 결과를 정량적으로 비교하기 위한 도표이다. 도 14는 본 발명의 폰트 생성 시스템과 기존의 폰트 생성 시스템의 폰트 생성 결과를 정량적으로 비교하기 위한 도표이다.
본 발명의 폰트 생성 시스템(100)(CCFont)의 성능을 확인하기 위하여 기존의 폰트 생성 시스템 중 zi2zi, 및 MX-Font를 비교하였다. zi2zi, 및 MX-Font 대비, 본 발명의 폰트 생성 시스템(CCFont)이 선명하고 명확한 고품질의 폰트를 생성하는 것을 알 수 있다.
도 12 및 13을 참조하면, L1, L2 손실 값은 미세 조정 없이 생성된 CCFont 모델(0.2728, 0.2689)이 zi2zi 모델(0.5104, 0.4225) 및 MX-Font 모델(0.5388, 0.5360) 대비 크게 낮게 나타났으며, 유사도는 CCFont(0.8808) 모델이 MX-Font 모델(0.3276)보다 높게 나타나 CCFont 모델이 월등히 우수함을 보여주고 있다.
또한, CCFont 모델은, 미세조정이 수행되는 zi2zi 대비, 미세조정 없이 상기 유사도 수치가 도출되었으므로, 미세조정이 수행되지 않으면서도 향상된 품질의 폰트화된 글자를 제공함으로, 폰트화 처리에 시간 및 비용이 절감되는 효과가 있다.
FID 점수는 실제 이미지의 특징 벡터와 가짜 이미지의 특징 벡터 사이의 거리를 계산하는 성능 지수이다. 즉, FID 점수가 낮을수록 폰트 생성 시스템에 의해 생성된 문자의 이미지의 품질이 실제와 더 비슷하고 더 우수하다는 것을 의미할 수 있다.
아울러, CCFont 모델은, 낮을수록 원본에 가깝게 평가되는 FID 점수(29.2)가, zi2zi(104.8), MX-Font(132.5) 대비 낮게 형성됨으로써, 문자의 구조를 해하지 않으면서 폰트화 처리 가능한 본 발명의 우수성을 확인할 수 있다.
도 15는 본 발명의 폰트 생성 방법을 설명하기 위한 흐름도이다.
본 발명의 폰트 생성 방법은, 폰트 생성 시스템(100)을 이용하여, 입력된 문자를 적어도 하나 이상의 제1 컴포넌트로 분해하는 단계(S10), 적어도 하나 이상의 제2 컴포넌트를 각각 적어도 하나 이상의 제2 컴포넌트로 분해하는 단계(S20), 적어도 하나 이상의 제2 컴포넌트를 각각 이미징 컴포넌트로 변환하는 단계(S30), 및 이미징 컴포넌트들을 재결합하여 폰트화된 문자를 생성하는 단계(S40)를 포함할 수 있다.
추가적으로 도 12내지 도 14를 참조하면, FID 점수의 값이 낮을수록 원본에 가깝게 평가되는데, zi2zi(104.8) 및 MX-Font(132.5)와 비교하여, CCFont의 FID 점수는 29.2로 낮게 형성됨으로써, 본 발명의 우수성을 확인할 수 있다.
이상에서 설명된 시스템 및 방법은, 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.
이상과 같이, 본 발명은 비록 한정된 실시 예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
100: 폰트 생성 시스템
120: 컴포넌트 분해부
140: 컴포넌트 변환부
160: 컴포넌트 재결합부

Claims (12)

  1. 폰트 생성 시스템에 있어서,
    적어도 하나의 문자가 입력되고, 상기 입력된 문자를 적어도 하나 이상의 컴포넌트로 분해하는 컴포넌트 분해부;
    상기 적어도 하나 이상의 컴포넌트를 미리 지정된 폰트의 컴포넌트로 변환하여 적어도 하나 이상의 이미징 컴포넌트를 생성하는 컴포넌트 변환부; 및
    상기 적어도 하나 이상의 이미징 컴포넌트를 재결합하여 폰트화된 문자를 생성하는 컴포넌트 재결합부;를 포함하는 폰트 생성 시스템.
  2. 제1 항에 있어서,
    상기 적어도 하나의 문자는,
    번체의 한자, 또는 간체의 한자인 것을 특징으로 하는 폰트 생성 시스템.
  3. 제2 항에 있어서,
    상기 컴포넌트 분해부는,
    상기 번체의 한자, 또는 상기 간체의 한자로 구성된 상기 적어도 하나의 문자를 편방으로 분리하여 적어도 하나 이상의 제1 컴포넌트를 생성하는 폰트 생성 시스템.
  4. 제3 항에 있어서,
    상기 컴포넌트 분해부는,
    상기 적어도 하나 이상의 제1 컴포넌트를 적어도 하나 이상의 제2 컴포넌트로 분리하는 폰트 생성 시스템.
  5. 제4 항에 있어서,
    상기 컴포넌트 변환부는,
    상기 적어도 하나 이상의 제2 컴포넌트를 상기 미리 지정된 폰트의 컴포넌트로 변환하여 상기 이미징 컴포넌트를 생성하는 폰트 생성 시스템.
  6. 제1 항에 있어서,
    상기 폰트 생성 시스템은,
    적어도 하나의 인코더 및 디코더를 포함하는 GAN 모델을 이용하여, 상기 컴포넌트의 분리 및 상기 이미징 컴포넌트의 재결합을 통해 상기 폰트화된 문자를 생성하도록 구성된 폰트 생성 시스템.
  7. 폰트 생성 방법에 있어서,
    적어도 하나의 문자가 입력되고, 상기 입력된 문자를 적어도 하나 이상의 컴포넌트로 분해하는 단계;
    상기 적어도 하나 이상의 컴포넌트를 미리 지정된 폰트의 컴포넌트로 변환하여 적어도 하나 이상의 이미징 컴포넌트를 생성하는 단계; 및
    상기 적어도 하나 이상의 이미징 컴포넌트를 재결합하여 폰트화된 문자를 생성하는 단계;를 포함하는 폰트 생성 방법.
  8. 제7 항에 있어서,
    상기 적어도 하나의 문자는,
    번체의 한자, 또는 간체의 한자인 것을 특징으로 하는 폰트 생성 방법.
  9. 제8 항에 있어서,
    상기 컴포넌트로 분해하는 단계는,
    상기 번체의 한자, 또는 상기 간체의 한자로 구성된 상기 적어도 하나의 문자를 편방으로 분리하여 적어도 하나 이상의 제1 컴포넌트를 생성하는 단계를 포함하는 폰트 생성 방법.
  10. 제9 항에 있어서,
    상기 컴포넌트로 분해하는 단계는,
    상기 적어도 하나 이상의 제1 컴포넌트를 적어도 하나 이상의 제2 컴포넌트로 분리하는 단계를 포함하는 폰트 생성 방법.
  11. 제10 항에 있어서,
    이미징 컴포넌트를 생성하는 단계는,
    상기 적어도 하나 이상의 제2 컴포넌트를 상기 미리 지정된 폰트의 컴포넌트로 변환하여 상기 이미징 컴포넌트를 생성하는 폰트 생성 방법.
  12. 제7 항에 있어서,
    상기 폰트 생성 방법은,
    적어도 하나의 인코더 및 디코더를 포함하는 GAN 모델을 이용하여, 상기 컴포넌트의 분리 및 상기 이미징 컴포넌트의 재결합을 통해 상기 폰트화된 문자를 생성하도록 구성된 폰트 생성 방법.
KR1020220131907A 2022-10-14 2022-10-14 문자의 컴포넌트-분리에 기반한 폰트 생성 시스템 및 폰트 생성 방법 KR20240052185A (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020220131907A KR20240052185A (ko) 2022-10-14 2022-10-14 문자의 컴포넌트-분리에 기반한 폰트 생성 시스템 및 폰트 생성 방법
US18/111,002 US20240127502A1 (en) 2022-10-14 2023-02-17 Font generating system and font generating method based on component separation of character
CN202310147010.7A CN117892696A (zh) 2022-10-14 2023-02-21 基于字的部件分离的字体生成系统及字体生成方法
JP2023024962A JP2024058540A (ja) 2022-10-14 2023-02-21 文字のコンポーネント-分割に基づくフォント生成システムおよびフォント生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220131907A KR20240052185A (ko) 2022-10-14 2022-10-14 문자의 컴포넌트-분리에 기반한 폰트 생성 시스템 및 폰트 생성 방법

Publications (1)

Publication Number Publication Date
KR20240052185A true KR20240052185A (ko) 2024-04-23

Family

ID=90626640

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220131907A KR20240052185A (ko) 2022-10-14 2022-10-14 문자의 컴포넌트-분리에 기반한 폰트 생성 시스템 및 폰트 생성 방법

Country Status (4)

Country Link
US (1) US20240127502A1 (ko)
JP (1) JP2024058540A (ko)
KR (1) KR20240052185A (ko)
CN (1) CN117892696A (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101229175B1 (ko) 2012-04-06 2013-02-01 (주)정글시스템 자필 폰트 생성 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101229175B1 (ko) 2012-04-06 2013-02-01 (주)정글시스템 자필 폰트 생성 방법 및 장치

Also Published As

Publication number Publication date
JP2024058540A (ja) 2024-04-25
US20240127502A1 (en) 2024-04-18
CN117892696A (zh) 2024-04-16

Similar Documents

Publication Publication Date Title
Gómez et al. Textproposals: a text-specific selective search algorithm for word spotting in the wild
US11055555B2 (en) Zero-shot object detection
US10572728B2 (en) Text image processing method and apparatus
US10191889B2 (en) Systems, apparatuses and methods for generating a user interface by performing computer vision and optical character recognition on a graphical representation
US9530102B2 (en) Multimodal input processing
CN111832396B (zh) 文档布局的解析方法、装置、电子设备和存储介质
US11556610B2 (en) Content alignment
CN111209909B (zh) 资质识别模板构建方法、装置、设备和存储介质
KR102305229B1 (ko) 객체 경계정보의 추출에 사용되는 피쳐맵 정보를 생성하는 방법 및 장치
Liu et al. Rotated multi-scale interaction network for referring remote sensing image segmentation
US10120852B2 (en) Data processing method, non-transitory computer-readable storage medium, and data processing device
Cong et al. Query-guided Prototype Evolution Network for Few-Shot Segmentation
WO2016093839A1 (en) Structuring of semi-structured log messages
Chen et al. UI layers merger: merging UI layers via visual learning and boundary prior
Jubaer et al. BN-DRISHTI: Bangla document recognition through instance-level segmentation of handwritten text images
KR20240052185A (ko) 문자의 컴포넌트-분리에 기반한 폰트 생성 시스템 및 폰트 생성 방법
AU2017279613A1 (en) Method, system and apparatus for processing a page of a document
Li et al. Comic image understanding based on polygon detection
CN117037136A (zh) 场景文本识别方法、系统、设备及存储介质
KR20200045447A (ko) 문자 인식을 위한 영상 전처리 장치 및 방법
Milleville et al. Automatic extraction of specimens from multi-specimen herbaria
JPH08320914A (ja) 表認識方法および装置
CN116229497A (zh) 版面文本的识别方法、装置及电子设备
JP6264179B2 (ja) コンパイル方法、コンパイル装置およびコンパイルプログラム
KR102661819B1 (ko) 시간적 관계정보의 컨텍스트 이해를 위한 오픈 도메인 정보 활용 방법