KR20190008168A - 인공지능 딥러닝 기술을 이용하여 예쁜글씨를 폰트화하는 과정에서 초/중/종성을 분리하고 이를 이용하여 템프리트에서 얻지 못하는 한글글자를 구성하는 기술 - Google Patents

인공지능 딥러닝 기술을 이용하여 예쁜글씨를 폰트화하는 과정에서 초/중/종성을 분리하고 이를 이용하여 템프리트에서 얻지 못하는 한글글자를 구성하는 기술 Download PDF

Info

Publication number
KR20190008168A
KR20190008168A KR1020180171688A KR20180171688A KR20190008168A KR 20190008168 A KR20190008168 A KR 20190008168A KR 1020180171688 A KR1020180171688 A KR 1020180171688A KR 20180171688 A KR20180171688 A KR 20180171688A KR 20190008168 A KR20190008168 A KR 20190008168A
Authority
KR
South Korea
Prior art keywords
font
template
neural network
artificial neural
network application
Prior art date
Application number
KR1020180171688A
Other languages
English (en)
Inventor
정우곤
Original Assignee
정우곤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 정우곤 filed Critical 정우곤
Priority to KR1020180171688A priority Critical patent/KR20190008168A/ko
Publication of KR20190008168A publication Critical patent/KR20190008168A/ko

Links

Images

Classifications

    • G06F17/2755
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • G06F17/22
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Document Processing Apparatus (AREA)

Abstract

템플리트를 통해서 UNICODE UTF-8 기준인 한글 11,184글자를 얻기에는 현실적으로 불가능하다. 본 발명은 딥러닝 기술중에서 객체인식에 탁월한 효과를 제공하는 CNN을 이용하여 템플리트으로부터 초/중/종성 자모를 분리 인식하고 이들을 이용하여 폰트화 하는데 필요조건인 11,184개의 한글글자를 완성하는 기술이다.

Description

인공지능 딥러닝 기술을 이용하여 예쁜글씨를 폰트화하는 과정에서 초/중/종성을 분리하고 이를 이용하여 템플리트에서 얻지 못한 한글글자를 구성하는 기술. {An artificial neural network application technology for converting hand-written Korean sample text into its own font.}
본 발명은 예쁜 글씨를 템플리트를 통해서 수집하여 스캔하고 디지탈화하여 폰트로 변환하는 과정에서 템플리트에서 제공하는 글자가 UNICODE UTF-8에서 요구하는 총 11,184개의 한글글자를 전부 제공할 수 없기 때문에 발생하는 문제를 인공지능 딥러닝 기술(Convolutional Neural Network: CNN)을 이용하여 UNICODE UTF-8에서 요구하는 11,184자의 한글글자를 생성하는 기술에 관한 것이다. 그 과정은 다음과 같다.
(1)샘플 손글씨 템플리트 [참조: 도면 도1]를 통해서 예쁜 손글씨 샘플을 수집한다.
(2)이를 디지탈화 (각 글자 28 x 28 흑백 이미지)하고 머신러닝(Convolutional Neural Network: CNN)을 이용하여 예쁜글씨의 초/중/종을 분리 생성하고
(3) 이를 이용하여 한글 글자의 전체 집합 (총 11,184 글자; UNICODE UTF-8 등록)을 생성하여 컴퓨터 폰트로 완성하는 기술이다.
인공지능의 딥러닝 (Deep Learning)기술 중에서 본 발명의 고안을 가능케하는 Convolutional Neural Network (CNN)은 이미지 분리, 인식과정을 학습을 통해서 가능케 한다. 예쁜 글씨 샘플(모든 글자를 포함하지 않음)에서 초/중/종성 "위치" 와 "모양새"를 인공지능 학습을 통해 얻어내고 이를 조합함으로 한글의 전체집합인 11,184개의 글자를 생성할 수 있다.
[1]https://medium.com/nanonets/how-to-do-image-segmentation-using-deep-learning-c673cc5862ef [2]https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf [3]국민대학교 테크노디자인 전문대학원 석사학위논문: 손글씨 조형성을 바탕으로 한 디지털폰트 개발에 관한 연구. 이정은 [4]한국정보과학회 학술논문발표논문집 Vol.35 No.1 [2008] 275-280(6쪽): 한글 트루타입폰트 및 손글씨의 자동 획 분할 알고리즘. 곽윤석, 구상옥, 정순기
종래에는 손글씨를 폰트화 하는 과정에서 폰트그래퍼 (fontgrapher)나 어도비일러스트레이터와 같은 소프트웨어를 사용하여 캘리그래픽 (Calligraphics)에 소양을 가진 자가 수작업을 통해서 구현하였다. 이러한 방법은 일부 폰트 디자이너의 경험과 소양에 따라 생산됨으로 다양성이 한정된다.
본 발명에서는 주위에 많은 예쁜글씨를 머신러닝을 통해서 학습하고 이를 통해서 초중성 자모를 구성케 하여 한글폰트의 11,184개의 글자를 제공함으로 다양하고 풍부한 예쁜글씨의 폰트화를 가능케 한다.
본 발명은 아래와 같이 요약된다.
(1) 위의 예쁜글씨의 정의를 만족하는 예쁜글씨를 수집하기 위하여 A4용지 상에 아래 [도면][도1]에서 보듯이 0.8cm2 정방형 글칸 504 (= 18 x 28)개로 구성된 템플리트를 제공한다. 여기에 예쁜글체 소유자가 주어진 내용에 따라 기입한다.
(2) 이러한 템플리트에서 본 발명제품의 일부인 이미지 소프트웨어를 통해서 각 템플리트에서 504자의 한글글자를 추출하고 이를 디지탈 데이터로 변환한다.
(3) 상기 (1)의 템플리트에서 제공되는 한글글자는 전체 한글 글자 조합의 일부이기 때문에 템플리트에서 제공되지 않는 한글글자를 초중종성의 위치에 따라 그 모양새가 꼭 같게하여 템플리트에서 제공하지 못하는 한글글자를 생성하여 충당한다. 이때, 머신러닝 (CNN)을 사용하여 초중종성에 해당하는 자모 이미지를 분리(Segmentation)하고 이들을 이용하여 총 11,184개의 한글글자를 요소로 하는 집합을 완성하여 한글폰트화의 데이터를 제공한다. (여기서 특수문자, 부호, 숫자는 다른 공개폰트에서 빌어서 사용할 수 있다.)
(4) 상기 (3)과정을 거친 후 웹폰트 (*.woff) 또는 데스크톱 폰트 (*.ttf, *.otf)의 형식으로 전환하여 폰트화를 완성한다.
(1) 본 발명제품을 통하여 예쁜 손글씨를 소지한 사람은 본인 고유의 폰트를 얻을 수 있다.
(2) 또한, 이를 다른 사람에게 판매하여 폰트 소유권을 양도할 수 있어 누구든지 본인 고유브랜드의 폰트를 구매하여 소지할 수 있다.
(3) 다양한 예 쁜글씨체를 인터넷이나 데스크톱 퍼블리싱을 위하여 폰트화하여 공급함으로 많은 한글 폰트를 제공한다.
[도 1]은 다양한 템플리트 중에 하나를 들어서 보여준다.
[도 2]는 템플리트에서 한글글자의 초/중/종성을 인식하여 분리하는 인공지능 기술로서 본 발명의 핵심내용이다.
본 발명은 아래와 같이 요약된다.
(1) 위의 예쁜글씨의 정의를 만족하는 예쁜글씨를 수집하기 위하여 A4용지 상에 아래 [도면][도1]에서 보듯이 0.8cm2 정방형 글칸 504 (= 18 x 28)개로 구성된 템플리트를 제공한다. 여기에 예쁜글체 소유자가 주어진 내용에 따라 기입한다.
(2) 이러한 템플리트에서 본 발명제품의 일부인 이미지 소프트웨어를 통해서 각 템플리트에서 504자의 한글글자를 추출하고 이를 디지탈 데이터로 변환한다.
(3) 상기 (1)의 템플리트에서 제공되는 한글글자는 전체 한글 글자 조합의 일부이기 때문에 템플리트에서 제공되지 않는 한글글자를 초중종성의 위치에 따라 그 모양새가 꼭 같게하여 템플리트에서 제공하지 못하는 한글글자를 생성하여 충당한다. 이때, 머신러닝 (CNN)을 사용하여 초중종성에 해당하는 자모 이미지를 분리(Segmentation)하고 이들을 이용하여 총 11,184개의 한글글자를 요소로 하는 집합을 완성하여 한글폰트화의 데이터를 제공한다. (여기서 특수문자, 부호, 숫자는 다른 공개폰트에서 빌어서 사용할 수 있다.)
(4) 상기 (3)과정을 거친 후 웹폰트 (*.woff) 또는 데스크톱 폰트 (*.ttf, *.otf)의 형식으로 전환하여 폰트화를 완성한다.
(1) 예쁜글시체를 소지한 자는 본인의 폰트를 가질 수 있게된다. 본 제품 발명자가 제공하는 웹사이트 ( www.prettyfonts.net )에 등록하고 이를 상품화 할 수 있다.
(2) 또는, 한글마을 ( www.koreafont.com )에 등록한 후 대중에게 공개할 수 있다.
딥러닝: (Deep Learning)은 인공지능망 (Artificial Neural Network)중에서 입력단 (Input Layer)과 출력단 (Output Layer)사이에 1개 이상의 레이어
Figure pat00001
가지는 신경망 구조를 말한다.
(CNN: Convolutional Neural Network)은 인공지능 기술로서 이미지 패턴인식에 탁월한 효과를 제공하는 인공지능망 구조를 말한다.
예쁜글씨의 정의: 예쁜글자는 초성 (19개), 중성 (21개) 그리고 종성 (27개)이 쓰여질 때 초중종성의 위치에 따라 그 모양새가 꼭 같이 쓰여질 때의 손글씨를 말한다. 또한, 본 제품의 프로그램 상에서 각 개의 자모에 대한 샘플로부터의 표준편차를 구해서 일정한 값보다 작거나 같을 경우를 프로그램 상에서 예쁜글씨라고 정의한다.

Claims (1)

  1. 템플리트를 통해서 디지털 이미지로 변환된 한글글자 파일에 인공지능(CNN)을 이요?여 초/중/종성으로 분리 인식하고 이를 이용하여 템플리트에서 제공하지 못하는 다른 한글글자를 생성하는 기술.
KR1020180171688A 2018-12-28 2018-12-28 인공지능 딥러닝 기술을 이용하여 예쁜글씨를 폰트화하는 과정에서 초/중/종성을 분리하고 이를 이용하여 템프리트에서 얻지 못하는 한글글자를 구성하는 기술 KR20190008168A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180171688A KR20190008168A (ko) 2018-12-28 2018-12-28 인공지능 딥러닝 기술을 이용하여 예쁜글씨를 폰트화하는 과정에서 초/중/종성을 분리하고 이를 이용하여 템프리트에서 얻지 못하는 한글글자를 구성하는 기술

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180171688A KR20190008168A (ko) 2018-12-28 2018-12-28 인공지능 딥러닝 기술을 이용하여 예쁜글씨를 폰트화하는 과정에서 초/중/종성을 분리하고 이를 이용하여 템프리트에서 얻지 못하는 한글글자를 구성하는 기술

Publications (1)

Publication Number Publication Date
KR20190008168A true KR20190008168A (ko) 2019-01-23

Family

ID=65324099

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180171688A KR20190008168A (ko) 2018-12-28 2018-12-28 인공지능 딥러닝 기술을 이용하여 예쁜글씨를 폰트화하는 과정에서 초/중/종성을 분리하고 이를 이용하여 템프리트에서 얻지 못하는 한글글자를 구성하는 기술

Country Status (1)

Country Link
KR (1) KR20190008168A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110196635A (zh) * 2019-04-28 2019-09-03 浙江大学 一种基于可穿戴设备的手势输入方法
KR20200092487A (ko) * 2019-01-10 2020-08-04 한국전자통신연구원 다중 뉴럴 네트워크를 이용한 문자 인식을 위한 장치 및 그것의 동작 방법

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
[1]https://medium.com/nanonets/how-to-do-image-segmentation-using-deep-learning-c673cc5862ef
[2]https://people.eecs.berkeley.edu/~jonlong/long_shelhamer_fcn.pdf
[3]국민대학교 테크노디자인 전문대학원 석사학위논문: 손글씨 조형성을 바탕으로 한 디지털폰트 개발에 관한 연구. 이정은
[4]한국정보과학회 학술논문발표논문집 Vol.35 No.1 [2008] 275-280(6쪽): 한글 트루타입폰트 및 손글씨의 자동 획 분할 알고리즘. 곽윤석, 구상옥, 정순기

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200092487A (ko) * 2019-01-10 2020-08-04 한국전자통신연구원 다중 뉴럴 네트워크를 이용한 문자 인식을 위한 장치 및 그것의 동작 방법
CN110196635A (zh) * 2019-04-28 2019-09-03 浙江大学 一种基于可穿戴设备的手势输入方法

Similar Documents

Publication Publication Date Title
Chang et al. Generating handwritten chinese characters using cyclegan
Aksan et al. Deepwriting: Making digital ink editable via deep generative modeling
CN108090400B (zh) 一种图像文本识别的方法和装置
WO2020059527A1 (ja) フォント作成装置、フォント作成方法及びフォント作成プログラム
KR20150082097A (ko) 클라우드 기반 폰트 서비스 시스템
CN113191375A (zh) 一种基于联合嵌入的文本到多对象图像生成方法
Kia et al. A novel method for recognition of persian alphabet by using fuzzy neural network
KR20190008168A (ko) 인공지능 딥러닝 기술을 이용하여 예쁜글씨를 폰트화하는 과정에서 초/중/종성을 분리하고 이를 이용하여 템프리트에서 얻지 못하는 한글글자를 구성하는 기술
El-Melegy et al. Recognition of Arabic handwritten literal amounts using deep convolutional neural networks
Inunganbi et al. Recognition of handwritten Meitei Mayek script based on texture feature
CN112528989B (zh) 一种图像语义细粒度的描述生成方法
Kawabe et al. Application of deep learning to classification of braille dot for restoration of old braille books
CN113408418A (zh) 一种书法字体与文字内容同步识别方法及系统
JP2004178010A (ja) 文書処理装置並びにその方法及びプログラム
Gordienko et al. Capsule deep neural network for recognition of historical Graffiti handwriting
Dai et al. Classification of calligraphy style based on convolutional neural network
Baloun et al. ChronSeg: Novel Dataset for Segmentation of Handwritten Historical Chronicles.
Roy et al. Handwritten character recognition with feedback neural network
JP7435098B2 (ja) くずし字認識システム、くずし字認識方法及びプログラム
Melistas et al. A Deep Learning Pipeline for the Synthesis of Graphic Novels.
CN113129399A (zh) 纹样生成
Han et al. Development of a gold-standard Pashto dataset and a segmentation app
Roy et al. Recognition of handwritten text: artificial neural network approach
Khan et al. Introducing urdu digits dataset with demonstration of an efficient and robust noisy decoder-based pseudo example generator. Symmetry. 2022; 14 (10): 1976
CN116975344B (zh) 一种基于Stable Diffusion的中文字库生成方法及装置