JP2014522048A - 漢字構成方法および装置、文字構成方法および装置、ならびにフォントライブラリ構築方法 - Google Patents

漢字構成方法および装置、文字構成方法および装置、ならびにフォントライブラリ構築方法 Download PDF

Info

Publication number
JP2014522048A
JP2014522048A JP2014523197A JP2014523197A JP2014522048A JP 2014522048 A JP2014522048 A JP 2014522048A JP 2014523197 A JP2014523197 A JP 2014523197A JP 2014523197 A JP2014523197 A JP 2014523197A JP 2014522048 A JP2014522048 A JP 2014522048A
Authority
JP
Japan
Prior art keywords
component
kanji
character
code
glyph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014523197A
Other languages
English (en)
Other versions
JP5851607B2 (ja
Inventor
英 敏 唐
蕾 馬
洋 劉
晨 曦 王
金 ▲ニ▼ 劉
瑛 欒
萍 萍 于
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Original Assignee
Peking University
Peking University Founder Group Co Ltd
Beijing Founder Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, Peking University Founder Group Co Ltd, Beijing Founder Electronics Co Ltd filed Critical Peking University
Publication of JP2014522048A publication Critical patent/JP2014522048A/ja
Application granted granted Critical
Publication of JP5851607B2 publication Critical patent/JP5851607B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1223Dedicated interfaces to print systems specifically adapted to use a particular technique
    • G06F3/1224Client or server resources management
    • G06F3/1225Software update, e.g. print driver, modules, plug-ins, fonts
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0487Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser
    • G06F3/0488Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures
    • G06F3/04883Interaction techniques based on graphical user interfaces [GUI] using specific features provided by the input device, e.g. functions controlled by the rotation of a mouse with dual sensing arrangements, or of the nature of the input device, e.g. tap gestures based on pressure sensed by a digitiser using a touch-screen or digitiser, e.g. input of commands through traced gestures for inputting data by handwriting, e.g. gesture or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/203Drawing of straight lines or curves

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本発明はフォントライブラリの技術分野に関し、漢字構成方法および装置、ならびにフォントライブラリ構築方法を提供し、現在の漢字構成技術は効率が低く、コストが高く、リアルタイムに文字を組織することができないという問題を解決することができる。本発明の漢字構成方法は、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得し、コンポーネントコードに従って漢字コンポーネントライブラリから漢字コンポーネントを抽出することを含み、ストラクチャコードは、漢字の構造および漢字中の漢字コンポーネントの位置を特定し、さらに、ストラクチャコードに従って漢字コンポーネントを使用することによって漢字のグリフデータを生成し、グリフデータを文字コードに整合させることを含む。本発明のフォントライブラリ構築方法は、漢字構成方法を使用することによって漢字に対応するグリフデータおよび文字コードを生成することと、グリフデータを使用することによってフォントライブラリを構築することとを含む。相応して、構造を有するすべての文字に適用可能な文字構成方法、フォントライブラリ構築方法、および文字構成装置も提供される。本発明は、スーパーフォントライブラリを構築するために使用することができる。

Description

本発明はフォントライブラリの技術分野に関し、特に漢字構成方法および装置、文字構成方法および装置、ならびにフォントライブラリ構築方法に関する。
電子装置において、漢字は文字コード(Unicode、GB2312など)の形態で表わされる。しかし、文字コードは電子装置内でのコードにすぎず、漢字をあるフォント(太字体、宋朝体など)で表示するかまたは印刷する必要がある場合は、グリフデータを使用しなければならない。グリフデータは、当該漢字が何の「ように見える」かを特定するために、スケルトンマップ、ビットマップ、ベクトグラムの形態であり得る。漢字のグリフデータを構成し、それを文字コードに対応させるプロセスを「文字構成」と称する。明らかに、異なるフォントライブラリ内の同じ漢字のグリフデータは同じではなく、したがって新しいフォントライブラリを構築するには膨大な量の文字構成作業を行わなければならない。
既存の漢字構成方法は概して、まずフォント設計者が数百個もの一般に使用される漢字を1つのフォントを用いて設計し、次いで当該スタッフがこれらの一般に使用される漢字に基づき、彼らの感覚に従って一ストロークごとに他の漢字のグリフデータを構成し、それらに対して調整を行うようなものである。
発明者は、先行技術には少なくとも以下の問題があることが分かる。既存の漢字構成方法は1字ずつ手作業で行なわれるが、効率が低く、長い時間がかかり(たとえば約1万字の従来のフォントライブラリを構成するには一般に数カ月かかる)、コストが高い。特に、何十万個もの漢字を含むスーパーフォントライブラリ(たとえば漢字研究分野で使用されるフォントライブラリ)のための文字構成が行なわれる場合、作業量はより膨大となるであろう。フォントライブラリがどれほど大きくても、人々によって使用され得る漢字をすべて含むことは不可能であるため、フォントライブラリに含まれていないいくつかの文字(珍しい文字または自分で構成した文字など)をユーザが使用した場合、これらの文字を表示することができないか、または必要とされるフォントで表示することができない。
本発明によって解決されるべき技術的課題は、漢字構成方法は効率が低く、コストが高く、リアルタイムに文字を体系化することができないという先行技術の問題を含む。したがって、高効率であり、コストが低く、リアルタイムに文字を体系化することができる漢字構成方法が提供される。
本発明の技術的課題を解決するために採用される技術的解決法は、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得し、上記コンポーネントコードに従って漢字コンポーネントライブラリから対応する漢字コンポーネントを抽出することを含み、上記ストラクチャコードは、上記漢字の構造および上記漢字中の上記漢字コンポーネントの位置を特定し、さらに、上記ストラクチャコードに従って上記漢字コンポーネントを使用することによって上記漢字のグリフデータを生成し、上記漢字のグリフデータを上記漢字の上記文字コードに対応させることを含む漢字構成方法である。
好ましくは、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得する前に、漢字コンポーネントを取得し、上記漢字コンポーネントにコンポーネントコードを付与して漢字コンポーネントライブラリを構築するステップをさらに含み、上記漢字コンポーネントおよび上記対応するコンポーネントコードは、漢字コンポーネントライブラリに記憶される。
さらに好ましくは、漢字コンポーネントを取得する上記ステップは、具体的には、漢字コンポーネント取得ユニットによって漢字コンポーネントを取得することであり、上記漢字コンポーネント取得ユニットは、手書き記録装置、画像取得装置、画像処理装置、およびデータ記憶装置のうち少なくとも1つである。
さらに好ましくは、漢字コンポーネントライブラリを構成する上記ステップはさらに、上記漢字コンポーネントライブラリ中の上記漢字コンポーネントのコンポーネントパラメータを取得し、上記コンポーネントパラメータを上記漢字コンポーネントライブラリに記憶することを含み、上記コンポーネントパラメータは、上記コンポーネントの高さ、上記コンポーネントの幅、上記コンポーネントのアスペクト比、上記コンポーネントの面積、上記コンポーネントの黒白比、上記コンポーネントの重心、上記コンポーネントの元の文字、上記コンポーネントの当初の位置、および上記コンポーネントの推奨位置のうち少なくとも1つを含み、さらに、上記コンポーネントパラメータに従って同じ形状の漢字コンポーネントを選択することを含む。
好ましくは、上記漢字コンポーネントライブラリにおいて、1つのコンポーネントコードは同じ形状の複数の漢字コンポーネントに対応し、上記コンポーネントコードに従って漢字コンポーネントライブラリから対応する漢字コンポーネントを抽出する上記ステップは、具体的には、上記コンポーネントコードに従って上記コンポーネントコードに対応する同じ形状の複数の漢字コンポーネントを取得し、次いで上記コンポーネントパラメータに従って同じ形状の上記複数の漢字コンポーネントから所望の漢字コンポーネントを抽出することを含む。
好ましくは、上記ストラクチャコードは、ISO 10646規格のIDS属性のストラクチャコードである。
好ましくは、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得する上記ステップは、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを入力装置によって取得すること、または、あらかじめ記憶されたコード対応テーブルから、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得することを含み、上記あらかじめ記憶されたコード対応テーブルには、構成されるべき漢字の上記文字コード、上記コンポーネントコードおよび上記ストラクチャコードの対応関係が記憶されている。
好ましくは、上記ストラクチャコードに従って上記漢字コンポーネントを使用することによって上記漢字のグリフデータを生成する上記ステップは、中間グリフを取得するために、上記ストラクチャコードに従って指定された位置に上記漢字コンポーネントを配置するステップ1と、上記中間グリフの上記グリフパラメータが所定値を満たすかどうかを判定するステップ2とを含み、イエスであればステップ5に進み、そうでなければステップ3に進み、さらに、上記グリフパラメータと上記所定値との差に基づいて上記中間グリフを調整するステップ3と、上記調整された中間グリフのグリフパラメータが上記所定値を満たすかどうか、および調整の回数が限度を越えたかどうかを判定するステップ4とを含み、少なくとも一方がイエスであればステップ5に進み、そうでなければステップ3に戻り、さらに、上記現在の中間グリフに従って上記漢字のグリフデータを生成するステップ5を含む。
さらに好ましくは、上記グリフパラメータは、上記漢字の高さ、上記漢字の幅、上記漢字のアスペクト比、上記漢字の面積、上記漢字の黒白比、上記漢字の重心、上記コンポーネントの高さ、上記コンポーネントの幅、上記コンポーネントのアスペクト比、上記コンポーネントの面積、上記コンポーネントの黒白比、上記コンポーネントの重心、上記コンポーネント同士の距離、および上記コンポーネント同士のサイズ比のうち少なくとも1つを含む。
さらに好ましくは、ステップ3において上記中間グリフを調整するプロセスは、以下の調整操作、上記漢字の高さを調整すること、上記漢字の幅を調整すること、上記漢字の面積を調整すること、上記漢字の黒白比を調整すること、上記コンポーネントの高さを調整すること、上記コンポーネントの幅を調整すること、上記コンポーネントの面積を調整すること、上記コンポーネントの黒白比を調整すること、上記コンポーネントの位置を調整することのうち少なくとも1つを含む。
好ましくは、上記中間グリフのグリフパラメータは、上記中間グリフを分析し算出することによって、または上記漢字コンポーネントライブラリ中の上記漢字コンポーネントの上記コンポーネントパラメータを算出することによって取得される。
本発明の漢字構成方法では、漢字コンポーネントライブラリを用いて文字構成プロセスを自動的に行うことができ、それにより構成効率が大幅に上昇し、構成時間が短縮され、構成コストが下がる。ユーザがフォントライブラリに含まれていない珍しい文字または自分で構成した文字を使用したい場合、彼または彼女は当該文字を彼自身または彼女自身で構成し、必要とされる漢字をフォントライブラリに追加してもよく、それにより使用しやすくなる。
本発明によって解決されるべき技術的課題はさらに、フォントライブラリ構築方法は効率が低く、コストが高く、リアルタイムに文字を体系化することができないという先行技術の問題を含む。したがって、高効率であり、コストが低く、リアルタイムに文字を体系化することができるフォントライブラリ構築方法が提供される。
本発明の技術的課題を解決するために採用される技術的解決法は、上記の漢字構成方法を使用することによって漢字に対応するグリフデータおよび文字コードを生成することと、上記漢字についての上記取得されたグリフデータを使用することによってフォントライブラリを構築することとを含むフォントライブラリ構築方法である。
本発明のフォントライブラリ構築方法では、漢字コンポーネントライブラリを用いて、フォントライブラリを構築するために文字構成プロセスを自動的に行うことができ、それによりフォントライブラリ構築効率が大幅に上昇し、フォントライブラリ構築時間が短縮され、フォントライブラリを構築するためのコストが下がる。これは特にスーパーフォントライブラリに当てはまる。ユーザがフォントライブラリに含まれていない珍しい文字または自分で構成した文字を使用したい場合、彼または彼女は当該文字を彼自身または彼女自身で構成し、必要とされる漢字をフォントライブラリに追加してもよく、それにより使用しやすくなる。
本発明によって解決されるべき技術的課題はさらに、漢字構成技術は効率が低く、コストが高く、リアルタイムに文字を体系化することができないという先行技術の問題を含む。したがって、高効率であり、コストが低く、リアルタイムに文字を体系化することができるフォントライブラリ構築装置が提供される。
本発明の技術的課題を解決するために採用される技術的解決法は、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得するためのコード取得ユニットを備え、上記ストラクチャコードは上記漢字の構造および上記漢字中の上記漢字コンポーネントの位置を特定し、さらに、上記コンポーネントコードに従って漢字コンポーネントライブラリから対応する漢字コンポーネントを抽出するための漢字コンポーネント抽出ユニットと、上記ストラクチャコードに従って上記漢字コンポーネントを使用することによって上記漢字のグリフデータを生成し、上記漢字のグリフデータを上記漢字の上記文字コードに対応させるためのグリフデータ生成ユニットとを備える漢字構成装置である。
好ましくは、漢字構成装置は、上記漢字コンポーネントおよび上記対応するコンポーネントコードが記憶される上記漢字コンポーネントライブラリを記憶するための漢字コンポーネントライブラリ記憶ユニットをさらに備える。
好ましくは、漢字構成装置は、漢字コンポーネントを取得し、それを上記漢字コンポーネントライブラリ記憶ユニットに提供するための漢字コンポーネント取得ユニットをさらに備える。
好ましくは、上記漢字コンポーネント取得ユニットは、手書き記録装置、画像取得装置、画像処理装置、およびデータ記憶装置のうち少なくとも1つである。
好ましくは、上記漢字コンポーネントライブラリは上記漢字コンポーネントのコンポーネントパラメータも記憶し、上記コンポーネントパラメータは、上記コンポーネントの高さ、上記コンポーネントの幅、上記コンポーネントのアスペクト比、上記コンポーネントの面積、上記コンポーネントの黒白比、上記コンポーネントの重心、上記コンポーネントの元の文字、上記コンポーネントの当初の位置、および上記コンポーネントの推奨位置のうち少なくとも1つを含み、上記漢字コンポーネント抽出ユニットはさらに、上記漢字コンポーネントライブラリ中の上記コンポーネントパラメータを抽出し、上記コンポーネントパラメータに従って同じコンポーネントコードに対応する同じ形状の上記抽出された複数の漢字コンポーネントから所望の漢字コンポーネントを選択するために使用される。
文字構成プロセスは、本発明の漢字構成装置を使用することによって自動的に行うことができ、それにより構成効率が大幅に上昇し、構成時間が短縮され、構成コストが下がる。ユーザがフォントライブラリに含まれていない珍しい文字または自分で構成した文字を使用したい場合、彼または彼女は当該文字を彼自身または彼女自身で構成し、必要とされる漢字をフォントライブラリに追加してもよく、それにより使用しやすくなる。
上記の漢字構成方法および装置は、少なくとも1つのコンポーネントを含み、かつある構造を有する、漢字以外の他の文字を構成するようにも適合化され、したがって本発明はさらに、構成されるべき文字の文字コード、コンポーネントコードおよびストラクチャコードを取得し、上記コンポーネントコードに従ってコンポーネントライブラリから対応する文字コンポーネントを抽出することを含み、上記ストラクチャコードは、上記文字の構造および上記文字中の上記文字コンポーネントの位置を特定し、さらに、上記ストラクチャコードに従って上記文字コンポーネントを使用することによって上記文字のグリフデータを生成し、上記文字のグリフデータを上記文字の上記文字コードに対応させることを含む文字構成方法を提供する。
本発明はさらに、上記の文字構成方法を使用することによって対応する文字のグリフデータおよび文字コードを生成することと、上記文字についての上記取得されたグリフデータを使用することによってフォントライブラリを構築することとを含むフォントライブラリ構築方法を提供する。
本発明はさらに、構成されるべき文字の文字コード、コンポーネントコードおよびストラクチャコードを取得するためのコード取得ユニットを備え、上記ストラクチャコードは、上記文字の構造および上記文字中の上記文字コンポーネントの位置を特定し、さらに、上記コンポーネントコードに従ってコンポーネントライブラリから対応する文字コンポーネントを抽出するためのコンポーネント抽出ユニットと、上記ストラクチャコードに従って上記文字コンポーネントを使用することによって上記文字のグリフデータを生成し、上記文字のグリフデータを上記文字の上記文字コードに対応させるためのグリフデータ生成ユニットとを備える文字構成装置を提供する。
本発明は、スーパーフォントライブラリを構築するのに特に適用可能である。
本発明の実施形態に係る漢字構成方法の文字構成プロセスの概略図である。 本発明の実施形態に係る漢字構成方法の別の文字構成プロセスの概略図である。 本発明の第2の実施形態に係る漢字構成方法のフローチャートである。 本発明の第2の実施形態に係る漢字構成方法においてグリフデータを生成する詳細なプロセスのフローチャートである。
好ましい実施形態の詳細な説明
当業者が本発明の技術的解決法をより良く理解することが可能となるように、図および特定の実施形態に関連して本発明をさらに詳細に以下に説明する。
第1の実施形態
本実施形態は、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得し、コンポーネントコードに従って漢字コンポーネントライブラリから対応する漢字コンポーネントを抽出することを含み、ストラクチャコードは、漢字の構造および漢字中の漢字コンポーネントの位置を特定し、さらに、ストラクチャコードに従って漢字コンポーネントを使用することによって漢字のグリフデータを生成し、漢字のグリフデータを漢字の文字コードに対応させることを含む漢字構成方法を提供する。
本実施形態の漢字構成方法では、漢字コンポーネントライブラリを用いて文字構成プロセスを自動的に行うことができ、それにより構成効率が大幅に上昇し、構成時間が短縮され、構成コストが下がる。ユーザがフォントライブラリに含まれていない珍しい文字または自分で構成した文字を使用したい場合、彼または彼女は当該文字を彼自身または彼女自身で構成し、必要とされる漢字をフォントライブラリに追加してもよく、それにより使用しやすくなる。
第2の実施形態
本実施形態は、以下の複数のステップを含む漢字構成方法を提供する。
漢字構成方法は、漢字コンポーネント取得ユニットによって漢字コンポーネントを取得するステップS01を含む。換言すると、漢字構成方法は、漢字コンポーネントを用いて文字を構成するための基盤を提供するために、様々な漢字コンポーネントのグリフデータを取得するステップを含む。
好ましくは、漢字コンポーネント取得ユニットは、手書き記録装置、画像取得装置、画像処理装置、およびデータ記憶装置のうち少なくとも1つである。明らかに、漢字コンポーネントを取得する特定の手法は、漢字コンポーネント取得ユニットに依存して異なり得る。たとえば、手書き記録装置が使用される場合、グリフ設計者は特定の漢字コンポーネント(または漢字)を直接手書きすればよく、手書き記録装置が書かれた漢字コンポーネントのデータを取得する。画像取得装置が使用される場合、グリフ設計者は漢字コンポーネント(または漢字)を紙に書き留め、次いで走査または写真撮影よって漢字コンポーネントのデータを取得し得る。画像処理装置が使用される場合、グリフ設計者によって設計された漢字または既存のフォントライブラリ中の漢字の画像が、異なる漢字コンポーネントに「分割」され得る。データ記憶装置が使用される場合、あらかじめ記憶された漢字コンポーネントのデータが直接インポートされ得る。
上記漢字構成方法は、漢字コンポーネントおよび対応するコンポーネントコードが漢字コンポーネントライブラリに記憶されるように、取得された漢字コンポーネントにコンポーネントコードを付与して、漢字コンポーネントライブラリを構築するステップS02を含む。換言すると、上記漢字構成方法は、漢字コンポーネントをコンポーネントコードに対応させ、データベースを特定のフォーマットで構築するステップを含む。
コンポーネントコードを付与するプロセス中、同じ(または同様の)形状の複数の漢字コンポーネント(たとえば同じ形状の複数の「宀」コンポーネント)に1つのコンポーネントコードを一般に付与することができる。そのような手法は先行技術と組合わせられるように比較的適合化され、コード量が少なく、把握しやすくなる。しかし後のステップにおいて、同じ形状の複数の漢字コンポーネントからさらなる選択を行う必要がある。もちろん、各漢字コンポーネントに個々のコンポーネントコードを付与することも実現可能である。
明らかに、漢字コンポーネントの量は漢字の量よりもはるかに少ないため、あるフォントの漢字コンポーネントを取得する(または漢字コンポーネントライブラリを構築する)操作は、そのようなフォントのすべての漢字を構成する操作よりも明らかにはるかに容易である。漢字は様々な漢字コンポーネントで構成されるため、漢字コンポーネントライブラリが構築された後、前記フォントの大量の漢字を取得するためにその中の漢字コンポーネントを自動的に組合わせることができ、それにより漢字構成効率が大幅に上昇し、コストが下がる。
上記漢字構成方法は、漢字コンポーネントライブラリ中の漢字コンポーネントのコンポーネントパラメータを取得し、コンポーネントパラメータを漢字コンポーネントライブラリに記憶し、コンポーネントパラメータに従って同じ形状の漢字コンポーネントを選択するステップS03を含む。たとえば、文字を構成するために1つのコンポーネントコードに対応する同じ形状の複数の漢字コンポーネントから1つの漢字コンポーネントを選択することが必要とされる場合、コンポーネントパラメータを取得するステップは後のステップに便宜をもたらし得る。選択は、それらのコンポーネントパラメータに従って行うことができる。コンポーネントパラメータは、漢字コンポーネントライブラリ中の漢字コンポーネントのデータを算出することによって取得することができるが、算出プロセスは画像を分析し処理する従来の手法であり得るため、その詳細な説明はここでは省略する。もちろん、漢字コンポーネントを取得する時に、コンポーネントパラメータを算出するかまたは取得(入力など)してもよい。
好ましくは、コンポーネントパラメータは、コンポーネントの高さ、コンポーネントの幅、コンポーネントのアスペクト比、コンポーネントの面積、コンポーネントの黒白比、コンポーネントの重心、コンポーネントの元の文字、コンポーネントの当初の位置、およびコンポーネントの推奨位置のうち少なくとも1つを含む。コンポーネントの高さ、コンポーネントの幅、コンポーネントのアスペクト比、およびコンポーネントの面積は理解しやすいため、具体的には説明しない。コンポーネントの黒白比は、漢字コンポーネントのグラフィックス中の黒い部分(またはストロークによって占められた部分)と残りの空白部分との面積の比率を指し、漢字コンポーネントが全く「完全に」ストロークによって占められているかどうかを反映する。漢字コンポーネントのストロークが均一な重みのあるエンティティと見なされる場合、コンポーネントの重心は漢字コンポーネント全体の重心の位置を示す。コンポーネントの元の文字およびコンポーネントの当初の位置は、当該漢字コンポーネントがどの漢字のどの部分から抽出されるかを示し、コンポーネントの推奨位置は、漢字のどの位置(上、左など)においてどんな構造(左−右構造、半分囲まれた構造など)で漢字コンポーネントを用いるのが好ましいかを示す。3つのパラメータはすべて、文字を構成するために最も適切な漢字コンポーネントを選択することを容易にすることができる(たとえば、上−下構造の漢字の上側部分からの漢字コンポーネントは、上−下構造の他の漢字の上側部分で使用されるのに恐らく最も好適であることが明らかである)。
上記漢字構成方法は、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得し、コンポーネントコードに従って漢字コンポーネントライブラリから対応する漢字コンポーネントを抽出するステップS04を含む。つまり、上記漢字構成方法は、文字コード、コンポーネントコードおよびストラクチャコードを取得することによって、どんな漢字が構成されるべきか、この漢字がどの漢字コンポーネントで構成されるか、およびそれぞれのコンポーネントがどこに配置されるかを決定するステップを含む。
たとえば図1において、「字」という文字を構成するために、上側コンポーネント「宀」および下側コンポーネント「子」が選択される。図2では、「明」という文字を構成するために、左側コンポーネント「日」および右側コンポーネント「月」が選択される。
文字コードは、Unicode、GB2312、GB18030、GB13000(つまりGBK)、Big5などの従来の漢字コードであり得、構成されるべき漢字を表わすのに使用される。
ストラクチャコードは、漢字の構造および漢字中のそれぞれの漢字コンポーネントの位置を特定する。好ましくは、ストラクチャコードはISO 10646規格のIDS属性のストラクチャコードとすることができ、当該IDS属性は漢字ストラクチャ属性のためのコードであり、異なるコードは漢字が異なる構造(左−右構造、上−下構造、左−中−右構造、半分囲まれた構造など)であることを示す。明らかに、1つの漢字は複数の漢字コンポーネントによって(つまり多数のコンポーネントコードを有して)形成され得るため、漢字コンポーネントの位置はある規則によって決定することができる。たとえば、漢字が左−右構造であることをストラクチャコードが示している場合、先に入力されたコンポーネントコードが左側の漢字コンポーネントを表わし、後で入力されたコンポーネントコードが右側の漢字コンポーネントを表わすと特定することができる。
好ましくは、漢字コンポーネントライブラリにおいて、1つのコンポーネントコードは概して、同じ形状の複数の漢字コンポーネントに対応し、次いでステップS04において、コンポーネントコードに従って漢字コンポーネントライブラリから対応する漢字コンポーネントを抽出することは、具体的には、コンポーネントコードに従ってコンポーネントコードに対応する同じ形状の複数の漢字コンポーネントを取得し、次いでコンポーネントパラメータに従って同じ形状の複数の漢字コンポーネントから所望の漢字コンポーネントを抽出することを含む。
明らかに、1つのコンポーネントコードが同じ形状の複数の漢字コンポーネントを表わす場合、対応する漢字コンポーネントを漢字コンポーネントライブラリから抽出することが必要とされると、どの漢字コンポーネントが具体的に使用されるかをユーザがさらに選択することが可能であり得る。たとえば、ユーザがコンポーネント「宀」のコンポーネントコードを入力した後、システムは、同じ形状であるが異なる形態の複数のコンポーネント「宀」の画像と、ユーザが選択するための対応するコンポーネントパラメータ情報とを提供することができ、ユーザがあるコンポーネント「宀」を選択した後、システムは、対応する漢字コンポーネントを漢字コンポーネントライブラリから抽出する。
本実施形態の方法は、ユーザが文字を彼自身または彼女自身で構成する場合に特に適用可能である。ユーザがフォントライブラリに含まれていない文字を使用したい場合、彼または彼女は、本実施形態の方法を用いて文字を構成し、それをフォントライブラリに追加することができる。もちろん、フォントライブラリ全体が構築される場合に、本実施形態の文字構成方法を使用することもできる。または異なる漢字(または文字コード)をシステムによって一つずつ提供することができ、その場合、対応するコンポーネントコードおよびストラクチャコードは手作業で選択される。
上記漢字構成方法は、ストラクチャコードに従って漢字コンポーネントを使用することによって漢字のグリフデータを生成するステップS05を含む。すなわち、上記漢字構成方法は、選択された漢字コンポーネントをストラクチャコードに従って特定の位置に配置し、漢字の所望のグリフデータを形成するステップを含む。
好ましくは、このステップは、ループ計算を用いてグリフデータを最適化するプロセスをさらに含み、その具体的な方法は、中間グリフを取得するために、漢字コンポーネントをストラクチャコードに従って指定された位置に配置するステップS051を含み得る。
たとえば、コンポーネント「宀」は上側に配置され、コンポーネント「子」は下側に配置され、次いで2つのコンポーネントが組合わせられて図1の右側から3番目の文字「字」を形成する。または、コンポーネント「日」が左側に配置され、コンポーネント「月」が右側に配置され、次いで2つのコンポーネントが組合わせられて図2の右側から4番目の文字「明」を形成する。
上記の具体的な方法は、中間グリフのグリフパラメータが所定値を満たすかどうかを判定するステップS052を含み得る。イエスであればステップS055に進み、そうでなければステップS053に進む。中間グリフのグリフパラメータは、中間グリフを分析し算出することによって、または漢字コンポーネントライブラリ中の漢字コンポーネントのコンポーネントパラメータを算出することによって取得することができる。このステップは、調整すべきかどうかを判定するために、現在の中間グリフ(美しいか否か、人々の読取り癖に合うかどうかなど)を判断することを目的とする。
明らかに、「美しい」と見なされる漢字の構造は、一般にある共通の特徴を有する。たとえば、文字全体の高さ、幅、および面積がある範囲内にあり、アスペクト比がほぼ1であり、漢字全体の重心が漢字の幾何学的中心に近く、それぞれの漢字コンポーネント同士の距離が比較的小さく、そのサイズスケールが適切であり、その分布が均一である。また、これらの共通の特徴は通常、あるパラメータによって反映させることができる。したがって、グリフパラメータのいくつかの所定値を設定することができ、中間グリフのグリフパラメータがこれらの所定値を満たすかどうかを判定することによって、グリフを判断することができる。
もちろん、所定値および特定の値の選択は、漢字構造に依存して異なり得る(たとえば、コンポーネント同士の距離のパラメータは、個別に体系化された文字には必要でなく、上−下構造および上−中−下構造の文字のコンポーネント同士の距離のパラメータの所定値は、明確に同じではない)。
グリフパラメータが所定値を満たすかどうかを判定するための様々な方法もあり、たとえば、複数のグリフパラメータが対応する所定値をそれぞれ満たすかどうか、または複数のグリフパラメータを算出することによって取得される包括的な値が所定値を満たすかどうかを判定することができる。または、ある(またはいくつかの)グリフパラメータをまず判断し、グリフパラメータが適格(または不適格)である場合にのみ他のグリフパラメータが判断される。
好ましくは、グリフパラメータは、漢字の高さ、漢字の幅、漢字のアスペクト比、漢字の面積、漢字の黒白比、漢字の重心、コンポーネントの高さ、コンポーネントの幅、コンポーネントのアスペクト比、コンポーネントの面積、コンポーネントの黒白比、コンポーネントの重心、コンポーネント同士の距離、コンポーネント同士のサイズ比のうち少なくとも1つを含む。漢字の幅および漢字の高さなどのパラメータは、中間グリフ全体の対応するパラメータを指し、コンポーネントの面積およびコンポーネントの黒白比などのパラメータは、中間グリフ中のそれぞれの漢字コンポーネントの対応するパラメータを指す。コンポーネント同士の距離は、中間グリフ中のそれぞれの漢字コンポーネント同士の距離を指し(漢字コンポーネントの縁同士の距離、または漢字コンポーネントの中心同士の距離であり得る)、それぞれの漢字コンポーネントの位置が適切であるか否かを反映することができる。コンポーネント間のサイズはそれぞれの漢字コンポーネントのサイズの割合を指し(面積比、高さ比などであり得る)、漢字中のそれぞれの漢字コンポーネントのサイズが適切であるか否かを反映することができる。
たとえば、ステップS051で取得された図1の右側から3番目の文字「字」(つまり中央グリフ)の上部および下部は互いに離間しているように見え、算出後、コンポーネント同士の距離(上部と下部との距離)はわずかに大きいことが分かり、したがってこの中間グリフのグリフパラメータは所定値を満たしていないと判定される。同様に、ステップS051で取得された図2の右側から4番めの文字「明」(つまり中央グリフ)のコンポーネント同士の距離(左側部分と右側部分との距離)も若干大きいため、この中間グリフのグリフパラメータは所定値を満たしていないと判定される。
上記の具体的な方法は、グリフパラメータと所定値との差に従って中間グリフを調整するステップS053を含み得る。つまり、上記の具体的な方法は、ステップS052の判定の結果に基づいて中間グリフのどの部分が適切でないかを具体的に判定し、新しい中間グリフを取得するために、対応する調整を行うステップを含み得る。
明らかに、このステップにおける調整は、中間グリフのグリフパラメータと所定値との差に従って行われるべきである。たとえば、漢字の高さが若干大きいことが分かった場合、その所定値に一致するかまたは近付くまで、漢字の高さを低減することができる調整操作が行なわれるべきである。
好ましくは、中間グリフを調整する操作は、漢字の高さを調整すること、漢字の幅を調整すること、漢字の面積を調整すること、漢字の黒白比を調整すること、コンポーネントの高さを調整すること、コンポーネントの幅を調整すること、コンポーネントの面積を調整すること、コンポーネントの黒白比を調整すること、コンポーネントの位置を調整することのうち少なくとも1つを含む。漢字の高さを調整することおよび漢字の幅を調整することなどは、漢字を全体的に調整することを指し、コンポーネントの高さを調整することおよびコンポーネントの位置を調整することなどは、漢字中のそれぞれの漢字コンポーネントを別々に調整することを指す。漢字の黒白比を調整することおよびコンポーネントの黒白比を調整することは、ストロークによって占められる割合を変更するためにグリフ中のストロークの「厚み」を変更することを指す。漢字の面積を調整することおよびコンポーネントの面積を調整することは、アスペクト比が変更されないという条件下で漢字コンポーネントまたは漢字を拡大および縮小することを指す。コンポーネントの位置を調整することは、中間グリフ中で漢字コンポーネントを移動させることを指す。もちろん、中間グリフを調整する多くの他の操作(たとえば漢字または漢字コンポーネントを傾斜させるかまたはねじること)もあるが、ここでは一つずつ説明しない。
明らかに、調整操作はグリフパラメータと一対一対応にはない。1つのグリフパラメータをいくつかの異なる調整操作によって取得してもよく、いくつかのグリフパラメータを変更するために1つの調整操作を用いてもよい。たとえば、中間グリフの漢字の重心のパラメータが不適格である場合、コンポーネントの位置を調整する操作、コンポーネントの面積を調整する操作、またはコンポーネントの高さを調整する操作、コンポーネントの幅を調整すること、漢字の高さを調整すること、漢字の幅を調整することなどのいずれかによって解決することができる。同様に、コンポーネントの位置を調整する操作は、漢字の重心を調整するためだけでなく、コンポーネント同士の距離を調整し、漢字の高さおよび漢字の幅を調整するためにも使用することができる。
たとえば、図1の右側からの3番目の文字「字」のコンポーネント同士の距離(上部と下部との距離)が若干大きいとステップS052で判定され、したがってコンポーネントの位置を調整する操作が行なわれ、上側および下側の漢字コンポーネントが互いに「引き寄せられ」、右側から2番目の文字「字」が取得される。図2の右側から4番めの文字「明」のコンポーネント同士の距離(左側部分と右側部分との距離)が若干大きいとステップS052で判定され、したがってコンポーネントの位置を調整する操作が行なわれ、左側および右側漢字コンポーネントが互いに「引き寄せられ」、右側から3番目の文字「明」が取得される。明らかに、図1および図2の例ではこのステップにおいて調整操作は1つしか行なわれないが、このステップにおいて複数の調整操作を行なうことも実現可能である。
上記の具体的な方法は、中間グリフの調整されたグリフパラメータが所定値を満たすかどうか、および調整の回数が限度を越えたかどうかを判定するステップS054を含み得る。少なくとも一方がイエスであればステップS055に進み、そうでなければステップS503に戻る。すなわち、中間グリフの調整されたグリフパラメータが再び判断され、依然として不適格である場合、グリフパラメータが適格となるかまたは調整の回数が限度を越えるまで、プロセスは調整を繰り返し続ける。
たとえば、図1の右側から2番目の文字「字」のすべてのグリフパラメータは、一旦調整されると適格となるため、直接ステップS055に進む。一方、図2の右側からの3番目の文字「明」のコンポーネント同士の距離は一旦調整されると適格となるが、その左側のコンポーネント「日」が明らかに幅広く短すぎる。つまりそのコンポーネントのアスペクト比が依然として不適格であるため、ステップS053に戻り、右側から2番目の文字「明」を得るために、コンポーネント「日」の高さ、幅を調整する操作を行なうべきであり、この文字「明」のグリフパラメータはすべて適格であるため、ステップS055に進むことができる。もちろん、上述の通り、図2の右側から4番めの文字「明」のコンポーネント同士の距離およびコンポーネントのアスペクト比が両方とも不適格であり、コンポーネント同士の距離を調整し、コンポーネントの高さを調整し、コンポーネントの幅を調整する操作がステップS053で同時に行なわれたとステップS052で直接判定された場合、図2の右側から2番目の文字「明」は、1ステップ後に取得されることになり、調整を繰り返すことは不必要であろう。したがって、グリフパラメータを判断し、中間グリフを調整する特定のプロセスは様々であり得ることが分かる。
明らかに、上記の調整は結局のところ手作業と同じではない。いくつかのグリフパラメータに対して合理的な調整を行なうのは困難な場合があるか、またはあるグリフパラメータが適格となるように調整される一方で他のグリフパラメータが不適格となる可能性があり、したがってそのような調整は非常に長い時間を要する(つまりループを多数回行なう)可能性があり、停止することのない無限ループに陥る可能性すらある。そのような現象を回避するために、調整の回数を記録することができ(たとえば、調整が行われるたびに調整の回数が1増大するかまたは、調整が行われるたびに調整の残り回数が1減少する)、調整の回数が限度を越えた(たとえば調整が多く行なわれすぎである)かどうかを判定するべきである。イエスであればステップS055に強制的に進み、グリフパラメータが不適格であるか否かに関わらず調整を終了する。
上記の具体的な方法は、現在の中間グリフに基づいて漢字のグリフデータを生成するステップS055を含み得る。つまり、上記の具体的な方法は、フォントライブラリで使用されるビットマップ、ベクトグラム、スケルトンマップの形態でグリフデータを生成するステップを含み得る。
たとえば、図1の右端の文字「字」および図2の右端の文字「明」が最終的なグリフデータと考えられる。
上記の漢字構成方法は、取得されたグリフデータを漢字の文字コードに対応させるステップS06を含む。つまり、上記の漢字構成方法は、文字構成を完了するために、グリフデータがどの漢字を表わすかを明示的に判定するステップを含む。
第3の実施形態
本実施形態は、第2の実施形態の漢字構成方法と同様の漢字構成方法を提供する。相違点は以下の点である。
ステップS04において、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードは、ユーザによって入力されるのではなく、あらかじめ記憶されたコード対応テーブルから取得される。コード対応テーブルは、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードの対応関係を記憶する。
すなわち、コード対応テーブルを前もって構成することができ(別個に構成するか、または先の構成プロセス中に同時に生成することができ)、したがって後で文字を構成する際、システムは、文字コードおよび対応するコンポーネントコードおよびストラクチャコードをコード対応テーブルから一つずつ読出し、構成プロセスを自動的に行うことができる。このように、フォントライブラリ(特にスーパーフォントライブラリ)が構築された後、フォントライブラリのためのコード対応テーブルを同時に取得することができ、それにより、コード対応テーブルを用いて多くの他のフォントライブラリの文字構成作業を十分自動的に行うことができ(もちろん、それぞれの文字構成プロセス中で使用される漢字コンポーネントライブラリのコードルールの一貫性が必要とされる)、したがって文字構成効率がさらに大きく向上する。
第4の実施形態
本実施形態は、上記の実施形態の漢字構成方法を使用することによって対応する漢字のグリフデータおよび文字コードを生成するステップ、つまり、上記の漢字構成方法を用いて、フォントライブラリにおいて必要とされる漢字を構成するステップを含むフォントライブラリ構築方法を提供する。第3の実施形態の方法が使用される場合、このステップを十分自動的に行なうことができる。第2の実施形態の方法が使用される場合、システムは異なる漢字または文字コードを一つずつ付与してもよく(もちろんそれらをユーザによって入力することもできる)、その場合には、ユーザは、対応するコンポーネントコードおよびストラクチャコードを選択する。当該方法はさらに、取得されたグリフデータを使用することによってフォントライブラリを構築するステップ、つまり、フォントライブラリによって必要とされるフォーマットに従ってグリフデータを「ライブラリにロード」して、利用可能なフォントライブラリファイルを取得するステップを含む。
本実施形態のフォントライブラリ構築方法では、漢字コンポーネントライブラリを用いて、フォントライブラリを構築するために文字構成プロセスを自動的に行うことができ、それによってフォントライブラリ構築効率が大きく上昇し、フォントライブラリ構築時間が短縮され、フォントライブラリ構築コストが下がる。これは特にスーパーフォントライブラリに当てはまる。ユーザがフォントライブラリに含まれていない珍しい文字または自分で構成した文字を使用したい場合、彼または彼女は当該文字を彼自身または彼女自身で構成し、必要とされる漢字をフォントライブラリに追加してもよく、それにより使用しやすくなる。
第5の実施形態
本実施形態は、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得するためのコード取得ユニットを備え、ストラクチャコードは漢字の構造および漢字中の漢字コンポーネントの位置を特定し、さらに、コンポーネントコードに従って漢字コンポーネントライブラリから対応する漢字コンポーネントを抽出するための漢字コンポーネント抽出ユニットと、ストラクチャコードに従って漢字コンポーネントを使用することによって漢字のグリフデータを生成し、漢字のグリフデータを漢字の文字コードに対応させるためのグリフデータ生成ユニットとを備える漢字構成装置を提供する。
好ましくは、漢字構成装置は、漢字コンポーネントおよび対応するコンポーネントコードが記憶される漢字コンポーネントライブラリを記憶するための漢字コンポーネントライブラリ記憶ユニットをさらに備える。
好ましくは、漢字構成装置は、漢字コンポーネントを取得し、それを漢字コンポーネントライブラリ記憶ユニットに提供するための漢字コンポーネント取得ユニットをさらに備え、漢字コンポーネント取得ユニットは、手書き記録装置、画像取得装置、画像処理装置、およびデータ記憶装置のうち少なくとも1つである。
好ましくは、漢字コンポーネントライブラリは漢字コンポーネントのコンポーネントパラメータも記憶し、コンポーネントパラメータは、コンポーネントの高さ、コンポーネントの幅、コンポーネントのアスペクト比、コンポーネントの面積、コンポーネントの黒白比、コンポーネントの重心、コンポーネントの元の文字、コンポーネントの当初の位置、およびコンポーネントの推奨位置のうち少なくとも1つを含む。
漢字コンポーネント抽出ユニットはさらに、漢字コンポーネントライブラリ中のコンポーネントパラメータを抽出し、コンポーネントパラメータに従って同じコンポーネントコードに対応する同じ形状の抽出された複数の漢字コンポーネントから所望の漢字コンポーネントを選択するために使用される。
もちろん、漢字構成装置は、上記のそれぞれの実施形態の漢字構成方法のプロセスに対応するコンポーネントパラメータを算出するためのユニット、グリフパラメータを算出するためのユニット、中間グリフを調整するためのユニットなどの機能ユニットをさらに含んでもよい。漢字構成装置のそれぞれのユニットは独立しているか、または全体的に一体化することができ、たとえばプロセッサおよびメモリとして一体化することができる。
文字構成プロセスは、本実施形態の漢字構成装置を用いることによって自動的に行うことができ、それによって文字構成効率が大きく上昇し、文字構成時間が短縮され、文字構成コストが下がる。ユーザがフォントライブラリに含まれていない珍しい文字または自分で構成した文字を使用したい場合、彼または彼女は当該文字を彼自身または彼女自身で構成し、必要とされる漢字をフォントライブラリに追加してもよく、それにより使用しやすくなる。
第6の実施形態
本実施形態は、構成されるべき文字の文字コード、コンポーネントコードおよびストラクチャコードを取得し、コンポーネントコードに従ってコンポーネントライブラリから対応する文字コンポーネントを抽出することを含み、ストラクチャコードは、文字の構造および文字中の文字コンポーネントの位置を特定し、さらに、ストラクチャコードに従って文字コンポーネントを使用することによって文字のグリフデータを生成し、文字のグリフデータを文字の文字コードに対応させることを含む文字構成方法を提供する。
本実施形態において構成されるべき文字は、少なくとも1つのコンポーネントを含み、かつある構造を有する文字、たとえば漢字、ハングル文字、日本語の文字等を指し、前述の方法によって構成することができる。なお、本実施形態の文字構成方法の詳細な実施プロセスは、第1〜第3の実施形態の漢字構成方法と同様であり、ここでは詳しく説明しない。
第7の実施形態
本実施形態は、第6の実施形態に係る文字構成方法を使用することによって文字に対応するグリフデータおよび文字コードを生成することと、文字の取得されたグリフデータを使用することによってフォントライブラリを構築することとを含むフォントライブラリ構築方法を提供する。
第8の実施形態
本実施形態は、構成されるべき文字の文字コード、コンポーネントコードおよびストラクチャコードを取得するためのコード取得ユニットを備え、ストラクチャコードは、文字の構造および文字中の文字コンポーネントの位置を特定し、さらに、コンポーネントコードに従ってコンポーネントライブラリから対応する文字コンポーネントを抽出するためのコンポーネント抽出ユニットと、ストラクチャコードに従って文字コンポーネントを使用することによって文字のグリフデータを生成し、文字のグリフデータを文字の文字コードに対応させるためのグリフデータ生成ユニットとを備える文字構成装置を提供する。
本実施形態で構成されるべき文字は、少なくとも1つのコンポーネントを含み、かつある構造を有する文字、たとえば漢字、ハングル文字、日本語の文字等を指し、前記装置によって構成することができる。なお、本実施形態の文字構成装置の特定のユニットは第5の実施形態の漢字構成装置のものと同様であり、ここでは詳細に説明しない。
上記の実施形態は本発明の原理を説明するための例示的な実施形態にすぎず、本発明はそれに限定されないことが理解されるであろう。当業者にとって、本発明の精神および本質から逸脱することなく様々な修正および改良を行うことができ、そのような修正および改良も本発明の範囲内にあると認められるべきである。

Claims (20)

  1. 構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得し、前記コンポーネントコードに従って漢字コンポーネントライブラリから対応する漢字コンポーネントを抽出することを含み、前記ストラクチャコードは、前記漢字の構造および前記漢字中の前記漢字コンポーネントの位置を特定し、さらに、
    前記ストラクチャコードに従って前記漢字コンポーネントを使用することによって前記漢字のグリフデータを生成し、前記漢字のグリフデータを前記漢字の前記文字コードに対応させることを含む、漢字構成方法。
  2. 構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得する前に、
    漢字コンポーネントを取得し、前記漢字コンポーネントにコンポーネントコードを付与して漢字コンポーネントライブラリを構築するステップをさらに含み、前記漢字コンポーネントおよび前記対応するコンポーネントコードは、前記漢字コンポーネントライブラリに記憶される、請求項1に記載の漢字構成方法。
  3. 漢字コンポーネントを取得する前記ステップは、具体的には、漢字コンポーネント取得ユニットによって漢字コンポーネントを取得することであり、前記漢字コンポーネント取得ユニットは、手書き記録装置、画像取得装置、画像処理装置、およびデータ記憶装置のうち少なくとも1つである、請求項2に記載の漢字構成方法。
  4. 漢字コンポーネントライブラリを構成する前記ステップはさらに、
    前記漢字コンポーネントライブラリ中の前記漢字コンポーネントのコンポーネントパラメータを取得し、前記コンポーネントパラメータを前記漢字コンポーネントライブラリに記憶することを含み、前記コンポーネントパラメータは、前記コンポーネントの高さ、前記コンポーネントの幅、前記コンポーネントのアスペクト比、前記コンポーネントの面積、前記コンポーネントの黒白比、前記コンポーネントの重心、前記コンポーネントの元の文字、前記コンポーネントの当初の位置、および前記コンポーネントの推奨位置のうち少なくとも1つを含み、さらに、
    前記コンポーネントパラメータに従って同じ形状の漢字コンポーネントを選択することを含む、請求項2に記載の漢字構成方法。
  5. 前記漢字コンポーネントライブラリにおいて、1つのコンポーネントコードは同じ形状の複数の漢字コンポーネントに対応し、前記コンポーネントコードに従って漢字コンポーネントライブラリから対応する漢字コンポーネントを抽出する前記ステップは、具体的には、前記コンポーネントコードに従って前記コンポーネントコードに対応する同じ形状の複数の漢字コンポーネントを取得し、次いで前記コンポーネントパラメータに従って同じ形状の前記複数の漢字コンポーネントから所望の漢字コンポーネントを抽出することを含む、請求項4に記載の漢字構成方法。
  6. 前記ストラクチャコードは、ISO 10646規格のIDS属性のストラクチャコードである、請求項1に記載の漢字構成方法。
  7. 構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得する前記ステップは、
    構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを入力装置によって取得すること、または、
    あらかじめ記憶されたコード対応テーブルから、構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得することを含み、前記あらかじめ記憶されたコード対応テーブルには、構成されるべき漢字の前記文字コード、前記コンポーネントコードおよび前記ストラクチャコードの対応関係が記憶されている、請求項1に記載の漢字構成方法。
  8. 前記ストラクチャコードに従って前記漢字コンポーネントを使用することによって前記漢字のグリフデータを生成する前記ステップは、
    中間グリフを取得するために、前記ストラクチャコードに従って指定された位置に前記漢字コンポーネントを配置するステップ1と、
    前記中間グリフの前記グリフパラメータが所定値を満たすかどうかを判定するステップ2とを含み、イエスであればステップ5に進み、そうでなければステップ3に進み、さらに、
    前記グリフパラメータと前記所定値との差に基づいて前記中間グリフを調整するステップ3と、
    前記調整された中間グリフのグリフパラメータが前記所定値を満たすかどうか、および調整の回数が限度を越えたかどうかを判定するステップ4とを含み、少なくとも一方がイエスであればステップ5に進み、そうでなければステップ3に戻り、さらに、
    前記現在の中間グリフに従って前記漢字のグリフデータを生成するステップ5を含む、請求項1〜7のいずれかに記載の漢字構成方法。
  9. 前記グリフパラメータは、前記漢字の高さ、前記漢字の幅、前記漢字のアスペクト比、前記漢字の面積、前記漢字の黒白比、前記漢字の重心、前記コンポーネントの高さ、前記コンポーネントの幅、前記コンポーネントのアスペクト比、前記コンポーネントの面積、前記コンポーネントの黒白比、前記コンポーネントの重心、前記コンポーネント同士の距離、および前記コンポーネント同士のサイズ比のうち少なくとも1つを含む、請求項8に記載の漢字構成方法。
  10. ステップ3において前記中間グリフを調整することは、以下の調整操作、
    前記漢字の高さを調整すること、前記漢字の幅を調整すること、前記漢字の面積を調整すること、前記漢字の黒白比を調整すること、前記コンポーネントの高さを調整すること、前記コンポーネントの幅を調整すること、前記コンポーネントの面積を調整すること、前記コンポーネントの黒白比を調整すること、前記コンポーネントの位置を調整することのうち少なくとも1つを含む、請求項8に記載の漢字構成方法。
  11. 前記中間グリフのグリフパラメータは、前記中間グリフを分析し算出することによって、または前記漢字コンポーネントライブラリ中の前記漢字コンポーネントの前記コンポーネントパラメータを算出することによって取得される、請求項8に記載の漢字構成方法。
  12. 請求項1〜11のうちいずれかに係る前記漢字構成方法を使用することによって漢字に対応するグリフデータおよび文字コードを生成することと、
    前記漢字についての前記取得されたグリフデータを使用することによってフォントライブラリを構築することとを含む、フォントライブラリ構築方法。
  13. 構成されるべき漢字の文字コード、コンポーネントコードおよびストラクチャコードを取得するためのコード取得ユニットを備え、前記ストラクチャコードは前記漢字の構造および前記漢字中の前記漢字コンポーネントの位置を特定し、さらに、
    前記コンポーネントコードに従って漢字コンポーネントライブラリから対応する漢字コンポーネントを抽出するための漢字コンポーネント抽出ユニットと、
    前記ストラクチャコードに従って前記漢字コンポーネントを使用することによって前記漢字のグリフデータを生成し、前記漢字のグリフデータを前記漢字の前記文字コードに対応させるためのグリフデータ生成ユニットとを備える、漢字構成装置。
  14. 前記漢字コンポーネントおよび前記対応するコンポーネントコードが記憶される前記漢字コンポーネントライブラリを記憶するための漢字コンポーネントライブラリ記憶ユニットをさらに備える、請求項13に記載の漢字構成装置。
  15. 漢字コンポーネントを取得し、それを前記漢字コンポーネントライブラリ記憶ユニットに提供するための漢字コンポーネント取得ユニットをさらに備える、請求項14に記載の漢字構成装置。
  16. 前記漢字コンポーネント取得ユニットは、手書き記録装置、画像取得装置、画像処理装置、およびデータ記憶装置のうち少なくとも1つである、請求項15に記載の漢字構成装置。
  17. 前記漢字コンポーネントライブラリは前記漢字コンポーネントのコンポーネントパラメータも記憶し、前記コンポーネントパラメータは、前記コンポーネントの高さ、前記コンポーネントの幅、前記コンポーネントのアスペクト比、前記コンポーネントの面積、前記コンポーネントの黒白比、前記コンポーネントの重心、前記コンポーネントの元の文字、前記コンポーネントの当初の位置、および前記コンポーネントの推奨位置のうち少なくとも1つを含み、
    前記漢字コンポーネント抽出ユニットはさらに、前記漢字コンポーネントライブラリ中の前記コンポーネントパラメータを抽出し、前記コンポーネントパラメータに従って同じコンポーネントコードに対応する同じ形状の前記抽出された複数の漢字コンポーネントから所望の漢字コンポーネントを選択するために使用される、請求項14に記載の漢字構成装置。
  18. 構成されるべき文字の文字コード、コンポーネントコードおよびストラクチャコードを取得し、前記コンポーネントコードに従ってコンポーネントライブラリから対応する文字コンポーネントを抽出することを含み、前記ストラクチャコードは、前記文字の構造および前記文字中の前記文字コンポーネントの位置を特定し、さらに、
    前記ストラクチャコードに従って前記文字コンポーネントを使用することによって前記文字のグリフデータを生成し、前記文字のグリフデータを前記文字の前記文字コードに対応させることを含む、文字構成方法。
  19. 請求項18に係る前記文字構成方法を使用することによって対応する文字のグリフデータおよび文字コードを生成することと、
    前記文字についての前記取得されたグリフデータを使用することによってフォントライブラリを構築することとを含む、フォントライブラリ構築方法。
  20. 構成されるべき文字の文字コード、コンポーネントコードおよびストラクチャコードを取得するためのコード取得ユニットを備え、前記ストラクチャコードは、前記文字の構造および前記文字中の前記文字コンポーネントの位置を特定し、さらに、
    前記コンポーネントコードに従ってコンポーネントライブラリから対応する文字コンポーネントを抽出するためのコンポーネント抽出ユニットと、
    前記ストラクチャコードに従って前記文字コンポーネントを使用することによって前記文字のグリフデータを生成し、前記文字のグリフデータを前記文字の前記文字コードに対応させるためのグリフデータ生成ユニットとを備える、文字構成装置。
JP2014523197A 2011-12-31 2012-12-31 漢字構成方法および装置、文字構成方法および装置、ならびにフォントライブラリ構築方法 Expired - Fee Related JP5851607B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201110459270.5 2011-12-31
CN201110459270.5A CN103186511B (zh) 2011-12-31 2011-12-31 汉字造字方法和设备、构造字体库的方法
PCT/CN2012/088100 WO2013097826A1 (zh) 2011-12-31 2012-12-31 汉字造字方法和设备、造字方法和设备、构造字体库的方法

Publications (2)

Publication Number Publication Date
JP2014522048A true JP2014522048A (ja) 2014-08-28
JP5851607B2 JP5851607B2 (ja) 2016-02-03

Family

ID=48677682

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014523197A Expired - Fee Related JP5851607B2 (ja) 2011-12-31 2012-12-31 漢字構成方法および装置、文字構成方法および装置、ならびにフォントライブラリ構築方法

Country Status (5)

Country Link
US (1) US20140176564A1 (ja)
JP (1) JP5851607B2 (ja)
KR (1) KR101604931B1 (ja)
CN (1) CN103186511B (ja)
WO (1) WO2013097826A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7250734B2 (ja) 2020-04-17 2023-04-03 ネイバー コーポレーション フォント生成方法及びシステム

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6229303B2 (ja) * 2013-05-16 2017-11-15 富士通株式会社 プログラム、情報処理装置および文字認識方法
CN104346375B (zh) 2013-07-31 2017-10-13 北大方正集团有限公司 一种制作中间字库的方法以及装置
CN104424183A (zh) * 2013-08-19 2015-03-18 北大方正集团有限公司 字库及其制作方法
CN104424195B (zh) * 2013-08-20 2018-03-23 北大方正集团有限公司 一种构建部件库的方法及装置
CN104424264A (zh) * 2013-08-29 2015-03-18 北大方正集团有限公司 汉字制作方法和装置
CN104063359B (zh) * 2014-05-19 2017-01-18 严永亮 个性化汉字字库的实现方法
CN104217012B (zh) * 2014-09-22 2018-07-27 朱信 一种字库发行方法及字库保护系统
WO2017078252A1 (ko) * 2015-11-03 2017-05-11 주식회사 한컴플렉슬 Pdf 문서에 포함된 문자의 모양 유지 복사를 위한 전자 단말 장치 및 상기 전자 단말 장치의 pdf 문서에 포함된 문자에 대한 모양 유지 복사 방법
TWM522398U (zh) * 2015-11-11 2016-05-21 Cheah-Shen Yap 替換式組字系統
US10324537B2 (en) * 2017-05-31 2019-06-18 John Park Multi-language keyboard system
CN109657203B (zh) * 2017-10-12 2020-12-04 北大方正集团有限公司 字库字面大小调整的方法、系统
CN109697275A (zh) * 2017-10-20 2019-04-30 北大方正集团有限公司 字库生成方法及装置
CN110379217A (zh) * 2019-07-19 2019-10-25 李春宾 一种文字处理系统和方法
JP6713657B1 (ja) * 2019-10-23 2020-06-24 日本加除出版株式会社 外字管理システム
CN112926334A (zh) * 2019-12-06 2021-06-08 北京三星通信技术研究有限公司 确定词表示向量的方法、装置及电子设备
CN111027550B (zh) * 2019-12-17 2023-09-08 新方正控股发展有限责任公司 字库视觉重心调整的方法和装置
CN111507064A (zh) * 2020-04-15 2020-08-07 伍曙光 一种基于计算机的字库设计方法
CN112784931B (zh) * 2021-01-19 2023-08-22 浪潮金融信息技术有限公司 一种汉字数据集构造方法、系统及介质
CN113127127A (zh) * 2021-04-30 2021-07-16 上海锐线创意设计有限公司 合成字的生成方法及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11288262A (ja) * 1998-04-01 1999-10-19 Omron Corp 文字合成装置、文字合成方法および記憶媒体
JP2000066657A (ja) * 1998-08-24 2000-03-03 Omron Corp フォント作成方法及び装置並びに記憶媒体

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6501475B1 (en) * 1999-10-22 2002-12-31 Dynalab Inc. Glyph-based outline font generation independent of resolution
WO2002059779A1 (en) * 2001-01-25 2002-08-01 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for optimised indexing records of static data with different lenghts
CN1253781C (zh) * 2004-01-20 2006-04-26 华南理工大学 汉字电子化中的拼部组字方法
CN1257446C (zh) * 2004-04-12 2006-05-24 张满元 计算机汉字输入法
US7710422B2 (en) * 2004-07-26 2010-05-04 Microsoft Corporation Font representations
CN101930299B (zh) * 2010-08-25 2014-04-02 华南理工大学 一种无字库的汉字智能生成方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11288262A (ja) * 1998-04-01 1999-10-19 Omron Corp 文字合成装置、文字合成方法および記憶媒体
JP2000066657A (ja) * 1998-08-24 2000-03-03 Omron Corp フォント作成方法及び装置並びに記憶媒体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
上地 宏一: "GlyphWiki 開放型フォント開発環境の構築に向けて", 漢字文▲献▼情報▲処▼理研究, vol. 第7号, JPN6015000306, 1 October 2006 (2006-10-01), JP, pages 12 - 18, ISSN: 0003184371 *
上地 宏一: "漢字フォント自動生成サーバ"影KAGE"の構築", 漢字文▲献▼情報▲処▼理研究, vol. 第3号, JPN6015000308, 1 October 2002 (2002-10-01), JP, pages 4 - 13, ISSN: 0003184372 *
安本 護 外2名: "部分字形組合せを用いた手書き風フォントの自動生成", 電子情報通信学会技術研究報告, vol. 第94巻第423号, JPN6015000304, 16 December 1994 (1994-12-16), JP, pages 87 - 95, ISSN: 0002979781 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7250734B2 (ja) 2020-04-17 2023-04-03 ネイバー コーポレーション フォント生成方法及びシステム

Also Published As

Publication number Publication date
KR20140056260A (ko) 2014-05-09
WO2013097826A1 (zh) 2013-07-04
US20140176564A1 (en) 2014-06-26
JP5851607B2 (ja) 2016-02-03
CN103186511B (zh) 2017-03-08
CN103186511A (zh) 2013-07-03
KR101604931B1 (ko) 2016-03-18

Similar Documents

Publication Publication Date Title
JP5851607B2 (ja) 漢字構成方法および装置、文字構成方法および装置、ならびにフォントライブラリ構築方法
US10984295B2 (en) Font recognition using text localization
US10699166B2 (en) Font attributes for font recognition and similarity
CN102117269B (zh) 对文档进行数字化的装置及方法
US9824304B2 (en) Determination of font similarity
JP4093241B2 (ja) 書類作成支援装置、書類作成支援プログラムおよび記憶媒体、並びに書類作成支援方法
CN101908218A (zh) 编辑设备和布置方法
KR102248823B1 (ko) 데이터 시각화 서비스 시스템, 방법 및 어플리케이션
US10558745B2 (en) Information processing apparatus and non-transitory computer readable medium
US11144717B2 (en) Automatic generation of document layouts
CN112686015A (zh) 图表生成方法、装置、设备及存储介质
US20140267302A1 (en) Method and apparatus for personalized handwriting avatar
JP2019028094A (ja) 文字生成装置、プログラム及び文字出力装置
JP2010027042A (ja) デザイン生成装置、方法およびプログラム
CN110020416A (zh) 一种表单生成方法、装置和存储介质
US8326812B2 (en) Data search device, data search method, and recording medium
US20170262141A1 (en) Information processing apparatus, information processing method and non-transitory computer readable medium
US20210182477A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
JP4631587B2 (ja) 書類作成支援装置、書類作成支援プログラムおよび記憶媒体、並びに書類作成支援方法
CN106776489B (zh) 显示设备的电子文档显示方法和系统
TWI664604B (zh) 電腦手寫中文字集創建及應用系統
US20230419572A1 (en) Information processing apparatus and method for controlling the same
JP7095541B2 (ja) 階層構造認識プログラム、階層構造認識方法及び階層構造認識装置
CN103176957B (zh) 文件的处理方法和装置
US20230419575A1 (en) Information processing apparatus, control method therefor, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150113

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151202

R150 Certificate of patent or registration of utility model

Ref document number: 5851607

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313117

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350