KR102588680B1 - 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법, 장치, 및 컴퓨터 프로그램 - Google Patents

대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법, 장치, 및 컴퓨터 프로그램 Download PDF

Info

Publication number
KR102588680B1
KR102588680B1 KR1020210183159A KR20210183159A KR102588680B1 KR 102588680 B1 KR102588680 B1 KR 102588680B1 KR 1020210183159 A KR1020210183159 A KR 1020210183159A KR 20210183159 A KR20210183159 A KR 20210183159A KR 102588680 B1 KR102588680 B1 KR 102588680B1
Authority
KR
South Korea
Prior art keywords
features
font file
letters
extracted
font
Prior art date
Application number
KR1020210183159A
Other languages
English (en)
Other versions
KR20230094023A (ko
Inventor
박용범
조인수
Original Assignee
단국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 단국대학교 산학협력단 filed Critical 단국대학교 산학협력단
Priority to KR1020210183159A priority Critical patent/KR102588680B1/ko
Publication of KR20230094023A publication Critical patent/KR20230094023A/ko
Application granted granted Critical
Publication of KR102588680B1 publication Critical patent/KR102588680B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • G06F16/1834Distributed file systems implemented based on peer-to-peer networks, e.g. gnutella
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19113Selection of pattern recognition techniques, e.g. of classifiers in a multi-classifier system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법, 장치, 및 컴퓨터 프로그램이 제공된다. 상기 본 발명에 일 측면에 따른 서버에서 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법은, 상기 대상 폰트 파일을 입력받는 단계; 상기 입력받은 대상 폰트 파일 내 글자 영역을 식별하여 추출하는 단계; 상기 추출된 대상 폰트 파일 내 글자 영역에서 글자를 추출 및 분류하는 단계; 상기 분류된 글자를 인코딩하여 입력 특징이 압축된 제1 글자 정보를 생성하는 단계; 상기 분류된 글자에 대응하는 표준 글자를 인코딩하여 입력 특징이 압축된 제2 글자 정보를 생성하는 단계; 상기 생성된 제1 글자 정보와 제2 글자 정보에 기초하여 상기 분류된 글자의 글씨 특징을 추출하는 단계; 및 상기 추출된 글씨 특징에 대한 대체 불가능한 토큰을 생성하여 블록체인에 저장하는 단계를 포함한다.

Description

대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법, 장치, 및 컴퓨터 프로그램{METHOD, APPARATUS AND COMPUTER PROGRAM FOR PROCESSING DIGITALIZATION OF HANDWRITING FEATURES FROM TARGETED FONT FILE}
본 발명은 글씨 특징의 처리 방법, 장치 및 컴퓨터 프로그램에 관한 것이다. 보다 상세하게는, 본 발명은 대상 폰트 파일로부터 ICT(Information and Communication Teconology) 기술을 이용하여 글씨 특징의 디지털화 처리 방법, 장치 및 컴퓨터 프로그램에 관한 것이다.
폰트(font)란 일반적으로 글자의 모양을 의미하며, 학술적 개념으로 기록이나 표시, 인쇄 등의 문자 세트로 사용하기 위하여 통일적인 컨셉트에 기해서 작성된 문자 또는 기호 등의 한 벌의 디자인을 의미한다.
이러한 폰트 파일을 제작하기 위해서는, 한글의 경우 2350자의 글자를 하나하나 모두 디자인해야 한다. 최근 인공지능 기법을 활용하여 2350자를 모두 생성하지 않고, 조합에 필요한 자음, 모음, 및 받힘만을 디자인하여 폰트 파일을 제작하는 프로그램이 개발되기도 하였으나, 여전히 사용자가 신규 폰트 파일을 생성하기 위해서는 새롭게 글자를 디자인해야 한다는 사실은 변함이 없다.
또한, 이렇게 힘들게 제작한 폰트 파일에 대해서도, 대한민국 저작권법에 따르면 폰트와 폰트 파일에 대한 보호는 구분되며, 법원은 폰트 자체의 보호는 부정하는 반면 폰트 파일에 대한 보호는 인정하고 있다. 따라서 사용자는 원칙적으로 합법적인 절차를 거쳐 폰트 파일을 구매하여 이용해야 한다.
하지만, 사용자의 저작권법에 대한 인식의 부제로 제대로 보호받지 못하는 한편, 단지 사소한 이용 약관을 위반한 경우에도 무분별한 고소에 의한 부당한 합의금이나 고액의 폰트 파일 패키지 구매로 강요당하는 경우가 빈번한 문제점이 있다.
공개특허공보 제10-2019-0119715호, 2021.04.06
본 발명에 개시된 실시예는 인공지능 기반으로 대상 폰트 파일로부터 사용자의 글씨체에 대한 고유한 특징을 자동 추출하여 폰트 파일을 생성함으로써 저작권 등 재산권의 보호가 가능하도록 제공하는데 그 목적이 있다.
본 발명이 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상술한 기술적 과제를 달성하기 위한 본 발명에 일 측면에 따른 서버에서 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법은, 상기 대상 폰트 파일을 입력받는 단계; 상기 입력받은 대상 폰트 파일 내 글자 영역을 식별하여 추출하는 단계; 상기 추출된 대상 폰트 파일 내 글자 영역에서 글자를 추출 및 분류하는 단계; 상기 분류된 글자를 인코딩하여 입력 특징이 압축된 제1 글자 정보를 생성하는 단계; 상기 분류된 글자에 대응하는 표준 글자를 인코딩하여 입력 특징이 압축된 제2 글자 정보를 생성하는 단계; 상기 생성된 제1 글자 정보와 제2 글자 정보에 기초하여 상기 분류된 글자의 글씨 특징을 추출하는 단계; 및 상기 추출된 글씨 특징에 대한 대체 불가능한 토큰을 생성하여 블록체인에 저장하는 단계를 포함할 수 있다.
또한, 본 발명의 다른 측면에 따른 컴퓨터 프로그램은, 하드웨어인 컴퓨터와 결합되어, 상기 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법을 수행하기 위해 컴퓨터 판독 가능한 기록매체에 저장될 수 있다.
또한, 본 발명의 다른 측면에 따른 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 장치는, 표준 글자를 저장하는 데이터베이스; 및 프로세서를 포함하되, 상기 프로세서는, 상기 대상 폰트 파일을 입력받아 상기 대상 폰트 파일 내 글자 영역을 식별하여 추출하고, 상기 추출된 대상 폰트 파일 내 글자 영역에서 글자를 추출 및 분류하며, 상기 분류된 글자를 인코딩하여 입력 특징이 압축된 제1 글자 정보를 생성하고, 상기 분류된 글자에 대응하는 표준 글자를 인코딩하여 입력 특징이 압축된 제2 글자 정보를 생성하여, 상기 생성된 제1 글자 정보와 제2 글자 정보에 기초하여 상기 분류된 글자의 글씨 특징을 추출하고, 상기 추출된 글씨 특징에 대한 대체 불가능한 토큰을 생성하여 블록체인에 저장할 수 있다.
또한, 본 발명의 다른 측면에 따른 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 시스템은, 글씨 특징 디지털화 처리를 요청하는 단말; 및 서버를 포함하되, 상기 서버는, 표준 글자를 저장하는 데이터베이스와, 상기 대상 폰트 파일을 입력받아 상기 대상 폰트 파일 내 글자 영역을 식별하여 추출하고, 상기 추출된 대상 폰트 파일 내 글자 영역에서 글자를 추출 및 분류하며, 상기 분류된 글자를 인코딩하여 입력 특징이 압축된 제1 글자 정보를 생성하고, 상기 분류된 글자에 대응하는 표준 글자를 인코딩하여 입력 특징이 압축된 제2 글자 정보를 생성하여, 상기 생성된 제1 글자 정보와 제2 글자 정보에 기초하여 상기 분류된 글자의 글씨 특징을 추출하고, 상기 추출된 글씨 특징에 대한 대체 불가능한 토큰을 생성하여 블록체인에 저장하는 프로세서를 포함할 수 있다.
이 외에도, 본 발명을 구현하기 위한 다른 방법, 다른 시스템 및 상기 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공될 수 있다.
본 발명의 기타 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.
본 발명의 전술한 과제 해결 수단에 의하면, 인공지능 기반으로 문서 등 소스로부터 사용자의 글씨체에 대한 고유한 특징을 자동 추출하여 폰트 파일을 생성함으로써 저작권 등 재산권의 보호가 가능하도록 하는 효과를 제공한다.
본 발명의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시 예에 따른 글씨 특징의 디지털화 처리 시스템을 도시한 도면이다.
도 2는 본 발명의 일 실시 예에 따른 서버의 구성 블록도이다.
도 3은 본 발명의 일 실시 예에 따른 프로세서의 구성 블록도이다.
도 4는 본 발명의 일 실시 예에 따른 제어부의 구성 블록도이다.
도 5는 본 발명의 일 실시 예에 따른 글씨 특징의 디지털화 처리 방법을 설명하기 위해 도시한 흐름도이다.
도 6은 본 발명의 일 실시 예에 따른 글자 영역으로부터 글자 추출 방법을 설명하기 위해 도시한 도면이다.
도 7은 본 발명의 일 실시 예에 따른 글자 추출 및 분류 방법을 설명하기 위해 도시한 도면이다.
도 8은 본 발명의 일 실시 예에 따른 고유한 글씨 특징 생성 방법을 설명하기 위해 도시한 도면이다.
도 9는 본 발명의 일 실시 예에 따른 고유한 글씨 특징에 대한 NFT 발행 동작을 설명하기 위해 도시한 도면이다.
도 10은 본 발명의 일 실시 예에 따른 글씨 특징에 대해 발행된 NFT의 거래와 관련된 블록체인 시스템을 도시한 도면이다.
명세서 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 명세서가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 발명이 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 ‘부, 모듈, 부재, 블록’이라는 용어는 소프트웨어 또는 하드웨어로 구현될 수 있으며, 실시예들에 따라 복수의 '부, 모듈, 부재, 블록'이 하나의 구성요소로 구현되거나, 하나의 '부, 모듈, 부재, 블록'이 복수의 구성요소들을 포함하는 것도 가능하다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우뿐 아니라, 간접적으로 연결되어 있는 경우를 포함하고, 간접적인 연결은 무선 통신망을 통해 연결되는 것을 포함한다.
또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
명세서 전체에서, 어떤 부재가 다른 부재 "상에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.
제 1, 제 2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 전술된 용어들에 의해 제한되는 것은 아니다.
단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다.
각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다.
이하 첨부된 도면들을 참고하여 본 발명의 작용 원리 및 실시예들에 대해 설명한다.
본 명세서에서 '본 발명에 따른 ICT(Information and Communication Technology) 기반 글씨 특징의 디지털화 처리 장치'는 연산 처리를 수행하여 사용자에게 결과를 제공할 수 있는 다양한 장치들이 모두 포함된다. 예를 들어, 본 발명에 따른 블록체인 기반 글씨 특징의 디지털화 처리 장치는, 컴퓨터, 서버 장치 및 휴대용 단말기를 모두 포함하거나, 또는 어느 하나의 형태가 될 수 있다.
여기에서, 상기 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop), 태블릿 PC, 슬레이트 PC 등을 포함하고, 상기 서버 장치는 외부 장치와 통신을 수행하여 정보를 처리하는 서버로써, 애플리케이션 서버, 컴퓨팅 서버, 데이터베이스 서버, 파일 서버, 게임 서버, 메일 서버, 프록시 서버 및 웹 서버 등을 포함하고, 상기 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), WiBro(Wireless Broadband Internet) 단말, 스마트 폰(Smart Phone) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치와 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD) 등과 같은 웨어러블 장치를 포함할 수 있다.
본 명세서에서 기술되는 “NFT(Non-Fungible Token, 대체 불가능한 토큰)”는, 저작권에 대해서 민감한 예술 분야에서는 저작권의 문제를 해결의 한 방안으로 대두되고 있다. NFT는 Ethereum Improvement Proposals (EIP) ? 721에 의해서 제안되었으며, 일반적인 암호 화폐와 다르게, 각 코인에 대한 고유한 값을 가지고 있어, 다른 토큰으로 대체할 수 없는 토큰을 의미한다. 때문에 각 토큰이 서로 다른 가치를 가지고 있는 고유한 자산을 의미하며, 최근 디지털 자산을 형성하는데 사용하고 있다.
본 명세서에서는 본 발명에 따라 폰트 파일(Font file)을 보다 쉽게 제작할 수 있게 하기 위해서, 사용자가 새롭게 글자를 디자인할 필요 없이, 기존 작성된 문서 등에서 사용자의 글씨의 고유한 특성을 추출하여 기존 폰트와 융합하여 폰트 파일을 제작하는 시스템과 폰트 파일의 저작권 문제를 해결하기 위해서 저작권법으로 보호받는 폰트 파일에서 주요 특징을 추출하여 NFT로 발행하는 시스템을 제안한다. 폰트 파일 그 자체를 NFT화하기에는 파일 용량에 대한 효율성의 문제가 있기에, 해당 폰트 파일의 주요 특징만을 이용하여 NFT를 발행하면, 사용자가 사용하고자 하는 폰트 파일의 유료 여부를 쉽게 파악할 수 있으며, 폰트 파일 제작자 또한 NFT를 통하여 저작권을 보호받을 수 있다. 이 때, 상기 폰트 파일은 사용자에 의해 기존에 작성한 텍스트(글이나 문장 등)를 포함할 수 있다.
본 명세서에서는 본 발명의 실시예에 따른 글씨 특징의 디지털화 처리를 위하여, 상기 글씨 특징에 관한 처리와 관련하여 인공 지능(AI: Artificial Intelligence) 기술을 이용하고, 상기 처리된 글씨 특징의 디지털화와 관련하여 블록체인(Block-chain) 기술이 이용되는 등 ICT(Information and Communication Technology) 기반으로 글씨 특징의 디지털화 처리를 수행할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 글씨 특징의 디지털화 처리 시스템을 도시한 도면이다.
도 1을 참고하면, 글씨 특징의 디지털화 처리 시스템은, 단말(100)과 서버(150)를 포함하여 구성될 수 있다. 실시 예에 따라, 글씨 특징의 디지털화 처리 시스템은 상기 ICT 기술을 이용하는바 상기 도 1에 도시된 단말(100)과 서버(150) 외에 추가적인 구성을 더 포함하여 구현될 수도 있다.
단말(100)은 ICT 기반의 글씨 특징에 대한 디지털화 처리를 서버(150)에 요청할 수 있다. 이를 위해, 상기 단말(100)은 사용자의 글씨가 포함된 문서를 상기 서버(150)에 업로드 또는 전송할 수 있다. 이 때, 본 발명은 상기 문서에 한정되지 않고, 상기 사용자가 글씨가 포함되었으면 이미지, 동영상 등 특정 포맷에 한정되지 않는다. 이러한 사용자의 글씨가 전부 또는 적어도 일부에 포함된 문서를 포함한 포맷을 소스(source)라고 칭할 수 있다. 다만, 이하 본 명세서에서는 소스는 문서를 예로 하여 설명하나, 이에 한정되지 않는다.
상기 단말(100)은 사용자의 글씨가 포함된 문서를 캡쳐나 이미지 센서를 통해 촬영하여 획득하여 메모리에 저장할 수 있다. 이 때, 상기 메모리는 반드시 단말(100)에 내장될 필요는 없다. 예를 들어, 상기 메모리는 USB 등과 같이 탈부착 가능한 형태도 포함할 수 있다. 한편, 상기 메모리는, 클라우드(Cloud)와 같은 서버 형태도 포함할 수 있다. 그 밖에, 상기 메모리의 용량, 성능, 형태 등에 대한 특별한 제한은 없다.
상기 단말(100)은 본 발명에 따른 글씨 특징의 디지털화 처리 서비스와 관련된 요청, 결과 제공 등 다양한 동작과 관련하여 각종 센서, 입/출력 인터페이스부를 포함할 수 있다.
상기 단말(100)은 비록 도 1에서는 1개만 도시되었으나, 복수 개일 수 있다.
서버(150)는 상기 단말(100)로부터 글씨 특징의 디지털화 처리 요청을 수신하고 대상 폰트 파일이 업로드되면, 인공 지능과 블록체인과 같은 ICT 기술 기반으로 상기 요청에 대응되는 동작을 수행할 수 있다. 이 때, 상기 대상 폰트 파일은 한 페이지 또는 복수의 페이지들로 구성될 수도 있다. 실시 예에 따라, 대상 폰트 파일 내 대상 페이지는 적어도 일부 영역에 글자가 포함된 페이지를 나타낼 수 있다. 이하에서는, 본 발명의 이해를 돕고 설명의 편의를 위하여, 대상 폰트 파일은 특별히 설명하지 않는 한, 하나의 페이지를 나타내며, 상기 페이지의 적어도 일 영역에는 글자가 포함된 것을 나타낼 수 있다. 다만, 이에 한정되는 것은 아니다.
상기 서버(150)는 원격(Remote)에 위치할 수 있으며, 컴퓨팅 디바이스(computing device), 제어부, 콘트롤러 등 다양한 명칭으로 불리울 수 있다.
상기 서버(150)는 상기 단말(100)로부터 업로드되는 대상 폰트 파일뿐만 아니라 대상 폰트 파일로부터 글씨 특징의 디지털화 처리에 관련된 수집, 처리 등이 되는 다양한 데이터를 일시 저장하는 데이터베이스(DB: Database)를 포함할 수 있다.
상기 서버(150)는 본 발명에 따른 글씨 특징의 디지털화 처리 서비스를 어플리케이션이나 웹 서비스 형태로 제공할 수 있으며, 관련 사용자 인터페이스를 제공할 수 있다. 따라서, 단말(100)은 어플리케이션을 다운로드 및 인스톨 후 실행하여 제공되는 사용자 인터페이스를 이용하거나 웹 페이지에 접속하여 가입 및 로그인 후에 사용자 인터페이스를 통해 관련 서비스를 이용할 수 있다. 상기 서버(150)는 그러한 서비스를 제공에 필요한 어플리케이션이나 API(Application Programming Interface), 플러그-인(Plug-in) 등을 단말(100)에 제공할 수 있다.
도 2는 본 발명의 일 실시 예에 따른 서버(150)의 구성 블록도이다. 도 3은 본 발명의 일 실시 예에 따른 프로세서(220)의 구성 블록도이다.
도 2를 참조하면, 서버(150)는 데이터베이스(DB)(210)와 프로세서(220)를 포함하여 구현될 수 있다. 이때, 상기 데이터베이스 (210)와 프로세서(220)는 각각 별개의 칩으로 구현될 수 있다. 또는, 메모리와 프로세서는 단일 칩으로 구현될 수도 있다.
이 때, 상기 데이터베이스(210)는 단말(100)로부터 업로드되는 대상 폰트 파일뿐만 아니라 서버(150)에 의해 수집, 가공 및 처리되는 각종 데이터를 일시 저장할 수 있다.
프로세서(220)는 본 발명에 따른 글씨 특징의 디지털화 처리를 위한 서버(150)의 전반적인 동작을 처리, 제어 등을 담당할 수 있다.
도 3을 참고하면, 프로세서(220)는 통신부(310), 제어부(320) 및 NFT 처리부(330)를 포함하여 구현될 수 있다. 도 3에 도시된 구성요소들은 본 발명에 따른 글씨 특징의 디지털화 처리 장치를 구현하는데 있어서 필수적인 것은 아니어서, 본 명세서 상에서 설명되는 글씨 특징의 디지털화 처리 장치는 위에서 열거된 구성요소들 보다 많거나 적은 구성요소들을 가질 수 있다.
상기 구성요소들 중 통신부(310)는 단말(100), 외부 데이터베이스(DB) 등 외부 장치와 통신을 가능하게 하는 하나 이상의 구성 요소를 포함할 수 있으며, 예를 들어, 유선통신 모듈, 무선통신 모듈, 근거리 통신 모듈, 위치정보 모듈 등 중 적어도 하나를 포함할 수 있다.
상기 유선통신 모듈은, 지역 통신(Local Area Network; LAN) 모듈, 광역 통신(Wide Area Network; WAN) 모듈 또는 부가가치 통신(Value Added Network; VAN) 모듈 등 다양한 유선 통신 모듈뿐만 아니라, USB(Universal Serial Bus), HDMI(High Definition Multimedia Interface), DVI(Digital Visual Interface), RS-232(recommended standard232), 전력선 통신, 또는 POTS(plain old telephone service) 등 다양한 케이블 통신 모듈을 포함할 수 있다.
상기 무선통신 모듈은 와이-파이(Wi-fi) 모듈, 와이브로(Wireless broadband) 모듈 외에도, GSM(global System for Mobile Communication), CDMA(Code Division Multiple Access), WCDMA(Wideband Code Division Multiple Access), UMTS(universal mobile telecommunications system), TDMA(Time Division Multiple Access), LTE(Long Term Evolution), 4G, 5G, 6G 등 다양한 무선 통신 방식을 지원하는 무선 통신 모듈을 포함할 수 있다.
상기 근거리 통신 모듈은 근거리 통신(Short range communication)을 위한 것으로서, 블루투스(Bluetooth™), RFID(Radio Frequency Identification), 적외선 통신(Infrared Data Association; IrDA), UWB(Ultra Wideband), ZigBee, NFC(Near Field Communication), Wi-Fi(Wireless-Fidelity), Wi-Fi Direct, Wireless USB(Wireless Universal Serial Bus) 기술 중 적어도 하나를 이용하여, 근거리 통신을 지원할 수 있다.
상기 위치정보 모듈은 단말(100)의 위치(또는 현재 위치)를 획득하기 위한 모듈로서, 그의 대표적인 예로는 GPS(Global Positioning System) 모듈 또는 Wi-Fi 모듈이 있다. 예를 들어, GPS 모듈을 활용하면, GPS 위성에서 보내는 신호를 이용하여 단말(100)의 위치를 획득할 수 있다. 다른 예로서, Wi-Fi 모듈을 활용하면, Wi-Fi 모듈과 무선 신호를 송신 또는 수신하는 무선 AP(Wireless Access Point)의 정보에 기반하여, 본 장치의 위치를 획득할 수 있다. 필요에 따라서, 위치정보 모듈은 치환 또는 부가적으로 단말(100)의 위치에 관한 데이터를 얻기 위해 통신부의 다른 모듈 중 어느 기능을 수행할 수 있다. 위치정보 모듈은 단말(100)의 위치(또는 현재 위치)를 획득하기 위해 이용되는 모듈로, 상기 단말(100)의 위치를 직접적으로 계산하거나 획득하는 모듈로 한정되지는 않는다. 이러한 위치정보 모듈은 서버(150)가 아닌 단말(100)에 내장되어 단말(100)에서 자신의 위치정보를 서버(150)로 제공할 수도 있다. 한편, 이러한 단말(100)의 위치 정보는 추후 대상 폰트 파일 내 글씨의 특징에 대한 처리에 이용될 수 있는데, 이에 대해서는 후술한다.
제어부(320)는 프로세서(220)의 구성요소들의 동작을 제어하기 위한 알고리즘(algorithm) 또는 알고리즘을 재현한 프로그램(program)에 대한 데이터를 저장하는 메모리, 및 메모리에 저장된 데이터를 이용하여 전술한 동작을 수행할 수 있다.
또한, 제어부는 이하의 도 4 내지 도 10에서 설명되는 본 발명에 따른 다양한 실시 예들을 구현하기 위하여, 위에서 살펴본 구성요소들을 중 어느 하나 또는 복수를 조합하여 제어할 수 있다.
NFT 처리부(330)는 제어부(320)의 동작에 따라 구현된 글씨 특징의 디지털화를 위한 처리를 담당할 수 있다. 특히, NFT 처리부(330)는 블록체인 기반의 NFT(Non-fungible Token, 대체 불가능한 토큰)를 발행하고, 블록체인상에 저장 처리를 수행할 수 있다.
도 4는 본 발명의 일 실시 예에 따른 제어부(320)의 구성 블록도이다. 도 5는 본 발명의 일 실시 예에 따른 글씨 특징의 디지털화 처리 방법을 설명하기 위해 도시한 흐름도이다. 도 6은 본 발명의 일 실시 예에 따른 글자 영역으로부터 글자 추출 방법을 설명하기 위해 도시한 도면이다. 도 7은 본 발명의 일 실시 예에 따른 글자 추출 및 분류 방법을 설명하기 위해 도시한 도면이다. 도 8은 본 발명의 일 실시 예에 따른 고유한 글씨 특징 생성 방법을 설명하기 위해 도시한 도면이다. 도 9는 본 발명의 일 실시 예에 따른 고유한 글씨 특징에 대한 NFT 발행 동작을 설명하기 위해 도시한 도면이다.
도 2 내지 4의 구성요소에 대하여 도 5 내지 10을 참조하여 더욱 상세하게 설명한다.
먼저, 도 4를 참조하면, 제어부(320)는 글자영역 추출부(410), 글자 추출부(420) 및 폰트 처리부(430)를 포함하여 구성될 수 있다. 도 4에 도시된 구성요소들은 본 발명에 따른 글씨 특징의 디지털화 처리를 위한 제어부를 구현하는데 있어서 필수적인 것은 아니어서, 본 명세서 상에서 설명되는 글씨 특징의 디지털화 처리를 위한 제어부는 위에서 열거된 구성요소들 보다 많거나 적은 구성요소들을 가질 수 있다.
도 4 및 도 5를 참조하면, 동작 11에서, 글자영역 추출부(410)는 대상 폰트 파일 내 글자 영역을 식별하고 추출할 수 있다.
제어부(320)는 상기 동작 11 이전에, 통신부(310)를 통하여 단말(100)에 의해 업로드되는 상기 대상 폰트 파일을 수신할 수 있다. 상기 단말(100)은 전술한 바와 같이, 카메라 센서를 이용한 캡쳐, 이미지 또는 동영상 촬영을 통하여 대상 폰트 파일을 일시 저장하고 이를 업로드할 수 있다. 특히, 제어부(320)는 단말(100)에서 업로드된 데이터가 동영상 데이터인 경우에는, 해당 동영상을 구성하는 프레임들 중에서 글자가 포함된 적어도 하나 이상의 특정 프레임(frame)을 추출하여 이용할 수 있다.
실시 예에 따라서, 상기 대상 폰트 파일은, 상기 단말(100)이 아닌 특정 위치로부터 수신 또는 다운로드할 수 있다. 상기에서 특정 위치라 함은 예를 들어, 상기 대상 폰트 파일이 저장된 웹 스토리지나 클라우드 서버의 주소일 수 있다. 한편, 상기에서 특정 위치는 단말(100)에 의해 제공될 수 있다.
여기서, 상기 글자영역 추출부(410)는, 도 6의 (a)에 도시된 바와 같이 대상 폰트 파일(611)가 입력되면, 도 6의 (b)에 도시된 바와 같이 해당 문서(611) 내 글자 영역(612)을 식별하여 추출할 수 있다. 이 때, 상기 글자영역 추출부(410)는 상기 글자 영역(612)을 추출하기 위하여 OCR(Optimal Character Recognition) 방법을 이용할 수 있다. 즉, 상기 글자영역 추출부(410)는, 도 6의 (a)에 도시된 바와 같이 입력되는 대상 폰트 파일(611)을 OCR 모듈(620)을 이용하여 도 6의 (b)에 도시된 바와 같이 해당 문서(611) 내 글자 영역(612)을 식별하여 추출할 수 있다. 다만, 본 발명은 대상 폰트 파일로부터 글자 영역을 추출하기 위하여 상기 OCR에만 한정되지 않는다. 예를 들어, 도 6에서 글자 영역의 인식은 글자(또는 글씨)를 정확하게 인식할 필요가 없고, 단지 글자 영역임을 인식하면 족하다. 따라서, 상기 OCR과 같이 문자를 인식하는 방식이 아니어도 무방하다. 다만, 사용자의 손 글씨에 따라서 글자 여부가 모호한 경우도 있을 수 있고 후술하는 동작 12의 글자 추출 및 분류와 관련하여, OCR과 같은 문자 인식 기술이 유용할 수 있다.
한편, 도 6의 (b)에서는 설명의 편의상 크게 이미지 영역과 글자 영역(612)으로 구분하고, 추출되는 글자 영역(612)이 한 개만 도시되었으나, 반드시 이에 한정되는 것은 아니다. 예를 들어, 대상 폰트 파일 내 글자 영역과 글자 영역 사이에 이미지(글자 영역이 아닌)가 있는 경우에는 적어도 두 개의 글자 영역이 식별되고 추출될 수 있다.
그 밖에, 전술한 바와 같이, 대상 폰트 파일은 편의상 특정 페이지를 예로 하여 설명하나, 반드시 이에 한정되지 않는다. 예를 들어, 대상 폰트 파일이 복수의 페이지들로 구성된 경우, 페이지 단위로 글자 영역을 식별 및 추출할 수 있다. 이 때, 추출된 모든 글자 영역은 페이지 단위로 구분되어 저장될 수 있다.
또한, 상기 글자영역 추출부(410)는 대상 폰트 파일의 타입이나 특성을 참조하여, 추출될 글자 영역을 다르게 설정할 수 있다. 예를 들어, 대상 폰트 파일 내 페이지의 상단에서부터 하단까지 순서대로 기재하는 방식의 일반적인 문서 형태인 경우와 논문과 같은 형식의 문서는 기재 방식이 상이하므로, 글자 영역을 인식하고 추출할 때 다른 방식으로 처리될 수 있다.
다시 도 5를 참조하면, 동작 12에서, 글자 추출부(420)는 상기 동작 11에서 추출된 글자 영역에서 글자를 추출하고 이를 분류할 수 있다.
상기 동작 12와 관련하여, 글자 추출부(420)는 예를 들어, 도 6의 (b)의 글자 영역(610)(도 7의 (a)와 동일)으로부터 도 7의 (c)와 같이 글자를 추출하고 분류할 수 있다. 이 때, 상기 도 7의 (a)의 글자 영역에서 도 7의 (c)와 같이 글자를 추출하고 분류하는 기술은 인공 지능 모듈이 참조될 수 있다. 실시 예에 따라, 상기 참조되는 인공 지능 모듈은 지역 기반 컨볼루션 신경망(RCNN: Region based Convolutional Neural Network)을 포함한 기계학습 모듈이 이용될 수 있으나, 본 발명은 이에 한정되지 않는다.
예를 들어, 글자 추출부(420)는 기계학습 모듈을 이용하여 도 7의 (a)에 도시된 대상 폰트 파일로부터 추출된 글자 영역에서 도 7의 (c)와 같이 각 글자에 대응하는 이미지('번', '에', '설', '계')를 각각 추출하고, 이를 분류하여 라벨링(labeling)할 수 있다. 이 때, 글자 추출부(420)는 미리 표준 글자를 저장하여 이에 기초하여 분류함으로써 상기 라벨링을 할 수 있다. 상기 표준 글자는 외부 데이터베이스로부터 수집하여 정의될 수도 있다. 한편, 상기 표준 글자는 도 7의 (c)에 도시된 바와 같이, 반드시 하나의 폰트가 아니라 종래 정의된 다양한 폰트들을 포함할 수도 있다.
상기 글자 추출부(420)는 기계학습 모듈을 통하여 글자 즉, 이미지가 추출된 경우 상기 표준 글자와의 비교(또는 학습)를 통해 분류 및 라베링을 함에 있어서, 글자 영역 내 글씨(체)에 따라서 만약 상기 분류나 라벨링이 모호한 경우가 있을 수 있다.
예를 들어, 상기 글자 추출부(420)는 기계학습 모듈을 통한 학습을 통해 추출된 글자 이미지에 대하여 분류시에 상기 분류의 신뢰도값을 계산하여, 미리 설정된 기준 즉, 임계값 이상 여부를 판단할 수 있다. 이는 사람의 손 글씨는 매우 다양하여 추출된 이미지가 분류를 위한 표준 글자와 매칭 여부가 모호한 경우가 있을 수 있고, 이 경우 잘못 분류되고 라벨링될 수 있으므로, 실시 예에 따라서 신뢰도값을 산출하여 참조할 수 있다.
상기 글자 추출부(420)는 각 추출된 글자 이미지를 분류하고 라벨링하되, 상기 분류/라벨링 시에 신뢰도 값이 임계값 미만인 글자 이미지를 구분하여 해당 글자 이미지(들)에 대해서는 별도 프로세스를 거쳐 최종 분류 및 라벨링할 수 있다.
이 때, 상기 별도 프로세스는 시스템 설계에 따라 다양할 수 있다. 예를 들어, 분류 동작을 반복 수행하여 이전 결과값과 비교하고, 비교 결과 동일한 결과값이 나오면 신뢰하는 방식이 이용될 수 있다.
다른 실시 예로, 해당 글자 이미지가 추출된 영역을 기계학습 모듈을 통해 재학습하여 다시 글자 이미지를 추출하고 분류 및 라벨링할 수 있다. 왜냐하면, 손 글씨에 따라서 개별 글자 이미지에 다른 글자 이미지의 일부가 포함될 수 있고, 이 경우에는 해당 글자 이미지의 분류에 오류가 발생할 수 있기 때문이다.
또 다른 실시 예로, 해당 글자 이미지와 동일한 분류 및 라벨링된 글자 이미지와 해당 글자 이미지를 비교하여 유사도를 판단하고, 판단된 유사도 여부에 따라 동일 분류 및 라벨링 또는 다른 분류 및 라벨링할 수도 있다. 또 다른 실시 예로, 해당 글자 이미지에 대하여 기할당된 표준 글자와 유사 단어 또는 유사 분류의 표준 글자(예를 들어, '어'와 '여' 등)와 해당 분류의 다른 글자 이미지와 대조하여, 유사도 여부 판단 결과에 따라 분류 및 라벨링을 결정할 수도 있다.
상기 별도 프로세스의 다른 실시 예로, 다음과 같은 방법이 참고될 수 있다. 예를 들어, 추출된 글자 이미지에 대한 폰트(예를 들어, 고딕체)를 다른 폰트(예를 들어, 명조체)를 사용하여 대조하여 분류 및 라벨링할 수 있다.
상기 별도 프로세스의 또 다른 실시 예로, 다음과 같은 방법이 참고될 수도 있다. 예를 들어, 상기한 별도 프로세스를 통해서도 분류의 신뢰도값이 낮거나 상기한 방법을 대신하여 추출된 해당 글자 이미지의 글자 영역 내 위치 정보 등을 참고하여, 해당 글자 이미지의 타입을 참고할 수 있다. 여기서, 상기 글자 이미지의 타입이라 함은 예를 들어, 해당 글자 이미지가 명사/동사 여부, 인접하여 추출된 글자 이미지와의 관계 예를 들어, 조사 여부, 접두사/접미사 여부, 또는 인접하여 추출된 글자 이미지와의 조합을 통한 단어를 형성하여 단어의 모형 등을 포함할 수 있다. 한편, 이 때, 위치 정보를 참조하여, 상기 분류 신뢰도 값이 임계값 미만인 글자에 대한 분석에 참조할 수도 있다. 예컨대, 위치에 따른 지역 정보 기반으로, 사투리나 방언 등을 데이터베이스화하여 참조함으로써, 해당 미분류 또는 분류 신뢰도값이 떨어지는 글자의 분류에 이용할 수 있다.
다시 도 5를 참조하면, 동작 13에서, 폰트 처리부(430)는 도 8에 도시된 바와 같이 상기 동작 12를 통해 추출된 글자 이미지를 제1 인코더(810)를 통해 인코딩하여 입력 특징이 압축된 1차원 정보 즉, 제1 정보를 생성할 수 있다.
동작 14에서, 상기 폰트 처리부(430)는 도 8에 도시된 바와 같이, 상기 동작 13에서 인코딩 대상이 된 글자 이미지에 대응하는 표준 글자를 제2 인코더(820)를 통하여 인코딩하여 입력 특징이 압축된 1차원 정보, 즉 제2 정보를 생성할 수 있다.
도 8에서는 상기 동작 13을 위한 제1 인코더(810)와 동작 14를 위한 제2 인코더(820)를 개별 도시하고 서로 다른 구성요소로 기술하였으나, 반드시 이에 한정되는 것은 아니다. 상기 경우에는 동작 13과 동작 14는 동시에 수행될 수 있다. 예컨대, 상기 제1 인코더(810)와 제2 인코더(820)는 동일 성능, 동일 타입의 인코딩 기술이 적용된 구성요소일 수 있으나, 이에 한정되지 않는다. 다른 실시 예로, 도 8에 도시된 바와 달리, 제1 인코더(810)와 제2 인코더(820)는 하나의 구성요소로서, 본 발며에서는 동작 13과 동작 14를 위하여 1개의 인코더만 이용될 수도 있다.
동작 15에서, 폰트 처리부(430)는 상기 생성된 제1 정보와 제2 정보 기반으로 제3 정보를 생성할 수 있다. 이 때, 상기 제3 정보는 상기 제1 정보에서 제2 정보를 제거함으로써 생성될 수 있다. 예를 들어, 도 8에 도시된 바와 같이, 상기 폰트 처리부(430)는 상기 제1 정보에서 상기 제2 정보와 중복되는 부분을 제거하고 남는 부분만을 추출할 수 있는데, 이것이 제3 정보 즉, 유일 특징(unique feature)(고유한 글씨 특징)에 해당할 수 있다.
동작 16에서, NFT 처리부(330)는 도 9에 도시된 바와 같이, 상기 동작 15를 통해 폰트 처리부(430)에서 개별 글자 이미지에 대해 추출된 유일 특징을 수신하면, 이를 기준으로 NFT(대체 불가능한 토큰)을 발행할 수 있다. 상기 고유한 글씨 특징에 대해 발행된 NFT는 블록체인에 저장될 수 있다.
상기 동작들에서 수신, 생성 등 처리되는 데이터는 데이터베이스(340)에 저장되고 필요에 따라 추출되어 이용될 수 있다.
한편, 도 5에 도시된 동작 순서는 반드시 순차로 수행되지 않을 수 있다. 예를 들어, 특정 동작은 도시된 바와 다른 순서로 동작하거나 다른 동작과 동시에 수행될 수도 있다.
도 10은 글씨 특징에 대해 발행된 NFT의 거래와 관련된 블록체인 시스템을 도시한 도면이다.
도 10을 참조하면, 글씨 특징에 대해 발행된 NFT의 거래와 관련된 블록체인 시스템은 서버(150), 블록체인 컨센서스 노드(1010) 및 NFT 구매 단말(1020)을 포함하여 구성될 수 있다.
전술한 바와 같이, 서버(150)는 폰트 파일이 수신되면 이를 인코딩하고 임베딩 벡터(embedding vector)를 참조하여 고유한 글씨 특징을 추출하여 NFT를 발행하고 블록체인 컨센서스 노드(1010)로 전송할 수 있다.
본 명세서에서 인코더는 컨벌루션 오토인코더(Convolution Autoencoder)로, 입력받는 이미지와 최대한 유사하게 이미지를 생성하는 인공지능 모델일 수 있다. 따라서, 상기 인코더를 지나서 생성된 잠재 변수에는 입력된 이미지를 복원하기 위해서 필요한 주요 특징들이 추출될 수 있다. 이러한 특징을 이용하여, 일부 노이즈가 있는 이미지에서 노이즈를 제거하거나, 추출된 주요 특징을 이용하여 폰트를 제작할 수 있다. 또한 추출된 주요 특징은 상기 임베딩 벡터을 추가하는 것으로 여러 특징들을 담아 내고 출력할 수 있다.
상기 서버(150)에서 발행된 NFT는 블록체인 컨센서스 노드(1010)에 저장며, NFT 구매 단말(1020)과의 관계에서 거래의 대상이 될 수 있다.
다시 말해, 본 발명에 따른 시스템은, 임베딩 벡터를 이용하여 다양한 폰트의 특징을 담은 잠재 변수는 여러 특징들을 보간한 새로운 폰트의 특징을 만들 수 있다.
이런 기능을 활용하여 손 글씨 데이터를 이용하여 해당 폰트의 고유 특징을 만드는 것 또한 가능하다. 제작된 폰트 파일을 인코더를 통해서 주요 특징을 추출한 다음 이것을 기반으로 NFT와 해당 NFT에 대한 정보가 기입된 NFT 컨트랙트(Contract)를 발행한다. 인코더는 입력값의 주요 특징을 잠재 변수 형태로 출력하는 역할을 하게 되는데 폰트 데이터를 인코더의 입력값으로 취했을 때 얻은 잠재변수가 해당 폰트 데이터의 고유 특징이라고 할 수 있다. 이 때, 추가되는 임베딩 벡터는 여러 종류의 폰트 특징을 담을 수 있는 공간을 마련해 주는 역할을 하며, 이 폰트 데이터가 어떤 종류인지 구분해 주는 역할을 하게 된다. 임베딩 벡터는 워드 인베딩(word embedding)과 같은 방식을 사용하여 얻을 수 있으며, 텐서플로우(tensorflow)에서 제공하는 인베딩 생성 함수를 사용해도 무방하다.
이중 NFT 컨트랙트에는 발행되는 NFT의 고유 ID, 제작자, 이용 약관 등이 기재되어 있으며, 해당 토큰의 이용자 명단이 첨부되어 있을 수 있다. 이러한 NFT 컨트랙트에 대한 증빙을 블록체인을 통해서 받으며, 만약 특정 유로 폰트 파일에 대상 사용권이 특정 사용자에게 있는지를 해당 폰트 파일의 NFT 컨트랙트를 통해서 쉽게 파악할 수 있다.
마찬가지로 사용자 역시 NFT의 컨트랙트를 통하여 사용 범위를 쉽게 파악이 가능하며, 자신의 사용권에 대한 증빙 또한 가능할 수 있다.
상술한 바와 같이, 본 발명에서는 인공 지능 기법을 이용하여 현재 제작된 폰트의 주요 특징을 추출하고, 그것을 기반으로 NFT를 발행하고, 그것과 연관된 NFT 컨트랙트를 동시에 발행하여, 추후에 발생 가능한 저작권 문제들을 미연에 방지할 수 있다.
한편, 개시된 실시예들은 컴퓨터에 의해 실행 가능한 명령어를 저장하는 기록매체의 형태로 구현될 수 있다. 명령어는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 프로그램 모듈을 생성하여 개시된 실시예들의 동작을 수행할 수 있다. 기록매체는 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.
컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터에 의하여 해독될 수 있는 명령어가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다.
이상에서와 같이 첨부된 도면을 참조하여 개시된 실시예들을 설명하였다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고도, 개시된 실시예들과 다른 형태로 본 발명이 실시될 수 있음을 이해할 것이다. 개시된 실시예들은 예시적인 것이며, 한정적으로 해석되어서는 안 된다.
100 : 단말
150 : 서버
210: 메모리
220: 프로세서
310: 통신부
320: 제어부
330: NFT 처리부
340: DB
410: 글자영역 추출부
420: 글자 추출부
430: 폰트 처리부

Claims (18)

  1. 서버에서 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법에 있어서,
    상기 대상 폰트 파일을 입력받는 단계;
    상기 입력받은 대상 폰트 파일 내 글자 영역을 식별하여 추출하는 단계;
    상기 추출된 대상 폰트 파일 내 글자 영역에서 글자를 추출 및 분류하는 단계;
    상기 분류된 글자를 인코딩하여 입력 특징과 매핑된 제1 정보를 생성하는 단계;
    상기 분류된 글자에 대응하는 표준 글자를 인코딩하여 입력 특징과 매핑된 제2 정보를 생성하는 단계;
    상기 생성된 제1 정보에서 상기 생성된 제2 정보와 중복되는 부분을 제거하고 남는 고유한 글씨 특징을 포함하는 제3 정보를 추출하는 단계; 및
    상기 추출된 고유한 글씨 특징에 대한 대체 불가능한 토큰을 생성하여 블록체인에 저장하는 단계를 포함하는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법.
  2. 제1항에 있어서,
    상기 입력받은 대상 폰트 파일 내 글자 영역을 식별하여 추출하는 단계는,
    OCR(Optimal Character Recognition)에 기초하여 이루어지는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법.
  3. 제2항에 있어서,
    상기 추출된 대상 폰트 파일 내 글자 영역에서 글자를 추출 및 분류하는 단계는,
    지역 기반 컨볼루션 신경망(RCNN: Region based Convolutional Neural Networks)를 포함한 기계 학습에 기반하여 이루어지는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법.
  4. 제3항에 있어서,
    상기 추출되는 글자는,
    개별 이미지 형태를 가지는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법.
  5. 제4항에 있어서,
    상기 추출되는 글자는,
    상기 표준 글자를 참조하여 분류 및 라벨링되는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법.
  6. 제5항에 있어서,
    상기 추출되는 글자의 분류 신뢰도 값을 산출하는 단계;
    상기 산출된 분류 신뢰도 값을 임계값과 비교하는 단계; 및
    상기 비교 결과, 상기 산출된 분류 신뢰도 값이 임계값 미만이면, 해당 글자는 다른 글자와 별도 프로세스 생성하여 처리하는 단계를 더 포함하는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법.
  7. 제6항에 있어서,
    상기 별도 프로세스는,
    해당 글자에 대하여 기할당된 표준 글자와 유사 단어 또는 유사 분류를 참고하여 분류 판단하는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법.
  8. 삭제
  9. 하드웨어인 컴퓨터와 결합되어, 상기 제1 항 내지 제7 항 중 어느 한 항의 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법을 수행하기 위해 컴퓨터 판독 가능한 기록매체에 저장된, 컴퓨터 프로그램.
  10. 표준 글자를 저장하는 데이터베이스; 및
    프로세서를 포함하되, 상기 프로세서는,
    대상 폰트 파일을 입력받아 상기 대상 폰트 파일 내 글자 영역을 식별하여 추출하고, 상기 추출된 대상 폰트 파일 내 글자 영역에서 글자를 추출 및 분류하며, 상기 분류된 글자를 인코딩하여 입력 특징과 매핑된 제1 정보를 생성하고, 상기 분류된 글자에 대응하는 표준 글자를 인코딩하여 입력 특징과 매핑된 제2 정보를 생성하며, 상기 생성된 제1 정보에서 상기 생성된 제2 정보와 중복되는 부분을 제거하고 남는 고유한 글씨 특징을 포함하는 제3 정보를 추출하고, 상기 추출된 고유한 글씨 특징에 대한 대체 불가능한 토큰을 생성하여 블록체인에 저장하는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 장치.
  11. 제10항에 있어서,
    상기 프로세서는,
    OCR(Optimal Character Recognition)에 기초하여 상기 입력받은 대상 폰트 파일 내 글자 영역을 식별하여 추출하는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 장치.
  12. 제11항에 있어서,
    상기 프로세서는,
    지역 기반 컨볼루션 신경망(RCNN: Region based Convolutional Neural Networks)를 포함한 기계 학습에 기반하여 상기 추출된 대상 폰트 파일 내 글자 영역에서 글자를 추출 및 분류하는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 장치.
  13. 제12항에 있어서,
    상기 추출되는 글자는,
    개별 이미지 형태를 가지는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 장치.
  14. 제13항에 있어서,
    상기 추출되는 글자는,
    상기 표준 글자를 참조하여 분류 및 라벨링되는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 장치.
  15. 제14항에 있어서,
    상기 프로세서는,
    상기 추출되는 글자의 분류 신뢰도 값을 산출하고, 상기 산출된 분류 신뢰도 값을 임계값과 비교하여, 상기 비교 결과, 상기 산출된 분류 신뢰도 값이 임계값 미만이면, 해당 글자는 다른 글자와 별도 프로세스 생성하여 처리하는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 장치.
  16. 제15항에 있어서,
    상기 프로세서는,
    상기 별도 프로세스에서 해당 글자에 대하여 기할당된 표준 글자와 유사 단어 또는 유사 분류를 참고하여 분류 판단하는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 장치.
  17. 삭제
  18. 글씨 특징 디지털화 처리를 요청하는 단말; 및
    서버를 포함하되, 상기 서버는,
    표준 글자를 저장하는 데이터베이스와,
    대상 폰트 파일을 입력받아 상기 대상 폰트 파일 내 글자 영역을 식별하여 추출하고, 상기 추출된 대상 폰트 파일 내 글자 영역에서 글자를 추출 및 분류하며, 상기 분류된 글자를 인코딩하여 입력 특징과 매핑된 제1 정보를 생성하고, 상기 분류된 글자에 대응하는 표준 글자를 인코딩하여 입력 특징과 매핑된 제2 정보를 생성하며, 상기 생성된 제1 정보에서 상기 생성된 제2 정보와 중복되는 부분을 제거하고 남는 고유한 글씨 특징을 포함하는 제3 정보를 추출하고, 상기 추출된 고유한 글씨 특징에 대한 대체 불가능한 토큰을 생성하여 블록체인에 저장하는 프로세서를 포함하는,
    대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 시스템.
KR1020210183159A 2021-12-20 2021-12-20 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법, 장치, 및 컴퓨터 프로그램 KR102588680B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210183159A KR102588680B1 (ko) 2021-12-20 2021-12-20 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법, 장치, 및 컴퓨터 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210183159A KR102588680B1 (ko) 2021-12-20 2021-12-20 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법, 장치, 및 컴퓨터 프로그램

Publications (2)

Publication Number Publication Date
KR20230094023A KR20230094023A (ko) 2023-06-27
KR102588680B1 true KR102588680B1 (ko) 2023-10-11

Family

ID=86946934

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210183159A KR102588680B1 (ko) 2021-12-20 2021-12-20 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법, 장치, 및 컴퓨터 프로그램

Country Status (1)

Country Link
KR (1) KR102588680B1 (ko)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102183909B1 (ko) 2018-04-13 2020-12-01 이호형 서포트블록과 인장재가 보강된 강합성거더교의 구조, 이의 시공방법
KR102122560B1 (ko) * 2018-11-22 2020-06-12 삼성생명보험주식회사 글자 인식 모델의 업데이트 방법
KR20210094823A (ko) * 2020-01-22 2021-07-30 정학선 개인 필적 맞춤형 한글 폰트 생성 방법 및 장치
KR102376231B1 (ko) * 2020-04-17 2022-03-21 네이버 주식회사 폰트 생성 방법 및 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
font.community, font.community Whitepaper, font.community, 2020*

Also Published As

Publication number Publication date
KR20230094023A (ko) 2023-06-27

Similar Documents

Publication Publication Date Title
CA3087534C (en) System and method for information extraction with character level features
CN106203425B (zh) 字符识别方法及装置
CN113627395B (zh) 文本识别方法、装置、介质及电子设备
CN113033269B (zh) 一种数据处理方法及装置
KR101552525B1 (ko) 폰트를 인식하고 폰트정보를 제공하는 시스템 및 그 방법
CN113705733A (zh) 医疗票据图像处理方法及装置、电子设备、存储介质
CN113420690A (zh) 基于感兴趣区域的静脉识别方法、装置、设备及存储介质
CN112330331A (zh) 基于人脸识别的身份验证方法、装置、设备及存储介质
CN105740808A (zh) 人脸识别方法和装置
CN110019867A (zh) 图像搜索方法、系统和索引构建方法和介质
CN111651674B (zh) 双向搜索方法、装置及电子设备
Wang et al. From object detection to text detection and recognition: A brief evolution history of optical character recognition
KR102588679B1 (ko) Nft 기반 신규 폰트 파일을 생성하는 방법, 장치, 및 컴퓨터 프로그램
CN115983271A (zh) 命名实体的识别方法和命名实体识别模型的训练方法
Rehman et al. Efficient coarser‐to‐fine holistic traffic sign detection for occlusion handling
Sharma et al. [Retracted] Optimized CNN‐Based Recognition of District Names of Punjab State in Gurmukhi Script
US11699297B2 (en) Image analysis based document processing for inference of key-value pairs in non-fixed digital documents
KR102588680B1 (ko) 대상 폰트 파일로부터 글씨 특징을 디지털화 처리하는 방법, 장치, 및 컴퓨터 프로그램
Myasnikov et al. Detection of sensitive textual information in user photo albums on mobile devices
CN116127925B (zh) 基于对文本进行破坏处理的文本数据增强方法及装置
CN116469123A (zh) 文档图片处理方法、装置、电子设备及可读存储介质
CN114328884A (zh) 一种图文去重方法及装置
CN113901817A (zh) 文档分类方法、装置、计算机设备和存储介质
CN112765937A (zh) 文本正则方法、装置、电子设备及存储介质
KR102507534B1 (ko) 인공지능 기반의 ocr 인식을 이용한 회계 관리 방법 및 장치

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant