JP2002287733A - 外字データの一元管理方法 - Google Patents

外字データの一元管理方法

Info

Publication number
JP2002287733A
JP2002287733A JP2001084020A JP2001084020A JP2002287733A JP 2002287733 A JP2002287733 A JP 2002287733A JP 2001084020 A JP2001084020 A JP 2001084020A JP 2001084020 A JP2001084020 A JP 2001084020A JP 2002287733 A JP2002287733 A JP 2002287733A
Authority
JP
Japan
Prior art keywords
character
external
data
external character
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001084020A
Other languages
English (en)
Inventor
Kenichi Ikeda
健一 池田
Yoshiyuki Tatsumi
義行 巽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001084020A priority Critical patent/JP2002287733A/ja
Publication of JP2002287733A publication Critical patent/JP2002287733A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Controls And Circuits For Display Device (AREA)
  • Image Analysis (AREA)
  • Record Information Processing For Printing (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】任意の類似度をパラメータとして与えるのみ
で、既に存在する外字文字データと、新たに入力された
外字文字データとを機械的に比較し、他のシステム装置
などでにて作成された大量の外字文字データの一括取り
込みと一元管理が可能な方法を提供する。 【解決手段】入力された外字文字のビットマップフォン
トデータの文字素片と、既に存在する外字文字のそれと
を比較し、予め与えられた一致率に従って文字の同一性
を機械的に判断し、同一と判断された場合にのみアウト
ラインフォントへ変換する処理を行い、新規の外字文字
として登録する。システム装置へ大量の外字文字を取り
込む際でも、人間の判断を介さず、一定の基準の相同性
を確保して容易に外字を文字の取り込み変換、一元管理
が可能となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、外字データの作成
における外字データ作成基準を任意に設定でき、並びに
他のシステム装置にて作成された外字を当該作成基準に
従って取込むことを可能とする、外字の一元管理方法に
関する。
【0002】
【従来の技術】従来の日本語ワープロソフトを搭載した
パーソナルコンピュータなどの情報処理装置では、文字
フォントデータは、例えば、JIS第1水準や第2水準フ
ォントなどの標準フォントと各々のフォントに対応する
コードとして装置内部記憶装置に格納されている。従っ
て、第1水準、第2水準フォントなどの規格化された標
準コード、標準フォント(以下、内字と言う)と、ユー
ザが定義する外字と呼ばれる規格外の外字フォントとが
運用されている。この外字は、各機器で独自に外字コー
ドおよび外字フォントを管理し、外字ファイルとして装
置内に保存され、必要に応じてフロッピー(登録商標)
ディスク(FD)などの記憶媒体に複写可能とされてい
る。さらに、最近の他の機器で当該外字を使用する場合
には当該外字フォントおよび区点コードを、FDなどの
記憶媒体やネットワークを経由して複写を行っている。
フォントは、複数のドットのON/OFFにより文字を
表すビットマップフォントと、文字上の基本的な位置に
あるいくつかの点と、それを結ぶ輪郭線(アウトライ
ン)により定義され文字上の基本的な位置にある点の座
標と、それらの点の接続関係により文字を表すアウトラ
インフォントの2つに大別される。アウトラインフォン
トは、文字が配置される座標系の大きさを変更すること
により、読み出すフォントサイズが異なっても、文字の
大きさを自由に生成することが可能であることから、ベ
クトルフォントとも呼ばれている。
【0003】これらの規格化された内字フォントと、ユ
ーザが定義して運用する外字フォントを用いて文書ファ
イルを作成する場合、その装置の外字ファイル上でし
か、指定している外字フォントを識別可能な文書として
出力できず、このため、各文書ファイルに外字も付与し
て管理するか、外字ファイルの外字を使うことにより、
その外字付き文書の運用を可能にしている状況であっ
た。
【0004】従来の外字ファイル管理技術として、例え
ば外字フォントを登録管理する例として特開昭63−1
37348号公報に記載の、ホストコンピュータと交信
する各端末で登録された異なる外字コードを、ホストコ
ンピュータの文字コード系に変換するためのコード変換
テーブルを設け、そのコード変換により共通の外字パタ
ーンに登録してホストコンピュータと交信する方法や、
特開平2−291059号公報に記載の、外字パターン
を外字辞書に登録する際に置換する内字パターンの文字
コードのアドレスと対応してアドレス変換テーブルに登
録しておき、外字の登録後は対応の汎用文字パターンを
作成する場合と同一のキー操作によって外字パターンを
自動的に作成する方法、特開平8−234888号公報
に記載の、標準文字と外字との関連付けを明確にし外字
の確認を容易にする方法、特公平9−62246号公報
に記載の、外字作成時に流用可能な文字素片はそのまま
使い、文字素片がだれでも必要とする文字の骨格を作り
適当に文字素片に分解することで、短い時間でデザイン
的に統一感のある文字を簡単に作成できる外字文字作成
方法、等が提示されている。
【0005】
【発明が解決しようとする課題】上述した従来の文字作
成方式のうち、特公平9−62246号公報に記載の技
術では文字素片の利用により短時間で多様な外字を作成
することが可能であるが、作成しようとする文字が既に
存在する外字と等しいか否かの判断を人間が行う必要が
あることから、既に登録された外字中に近似した文字が
存在する場合には、その類似度の判断が人により差が生
じること、および、既に登録された外字数や作成する外
字数が大量に存在する場合には文字の調査そのものに時
間がかかること、更には、機械的な管理を行っていない
ことから不必要なベクトルフォント外字とその区点コー
ドを作成した結果、管理対象の文字種とそのデータ量が
増大してしまうなどの欠点があった。
【0006】本発明の目的は、上記の欠点を解消し、任
意の類似度をパラメータとして与えることで、入力され
た外字文字のビットマップフォントデータを文字素片単
位に機械的に比較し、一定の基準で外字文字を作成する
ことを可能とし、さらに他のシステム装置などで既に登
録された大量の外字文字データの一括作成と一元管理が
可能な外字データの管理方法を提供することにある。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、本発明のシステムは、外字として登録済みの区点コ
ード, ビットマップフォントデータ,当該ビットマップ
フォントデータの合計画素数,文字素片パターンデータ
単位のビットマップデータ,当該ビットマップフォント
データの画素数,アウトラインフォントを1レコードと
して記憶されたテーブルを備える。このテーブルを用い
て、登録されたデータと入力された外字文字のビットマ
ップフォントデータの文字素片を比較し、予め与えられ
た任意の一致率に従って文字の同一性を機械的に判断す
る。同一と判断された場合には、その文字に既に登録済
みの区点コードを与え、重複してアウトラインフォント
へ変換する処理を抑止する。また、異なる文字であると
判断された場合には、前記のテーブルへ新たにレコード
を追加する。条件として与える一致率は、任意に設定す
ることができるので、字形が完全に一致することが要求
される業務ではしきい値を高く、書き方等による異形を
容認できる業務ではしきい値を低くする等、適用業務に
合わせた外字管理を行うことが可能となる。
【0008】
【発明の実施の形態】以下に図1〜図4を用いて、本発
明の外字文字の一元管理方法の一実施形態について説明
する。図1は、本発明の一実施形態である外字管理シス
テムの全体構成の説明図である。図2は、本発明の一実
施例の処理フロー図である。図3は本発明の一実施例に
おける文字素片への分解パターンの例である。図4は本
発明の一実施例における外字テーブルのレコード構成図
である。
【0009】最初に、図1を用いて、本発明の外字文字
の一元管理方式に関する一実施形態である外字管理シス
テムの全体構成について説明する。図1において、1は
外字管理システムにビットマップフォントデータを入力
するデータ入力部である。2は入力されたビットマップ
フォントデータと既に登録済みの文字データとを比較す
る際に、文字の構成パターンに従って文字を文字素片単
位に分割する文字素片切り出し部である。ここで入力さ
れた文字の骨格を偏や旁などの文字素片に分解し大き
さ,位置,パターンデータを抽出する。3は前記文字素
片切り出し部にて分割された各文字素片をパターン認識
の手法で認識するパターン認識部である。4は登録済の
文字素片と入力されたデータの文字素片とを比較する文
字素片比較部である。5は入力された文字データが、既
存の登録済外字と指定した一致率以上の相同性と判断さ
れた場合、既存の外字文字コードを与える既存文字コー
ド付与部である。6は相同性が認められなかった場合、
ビットマップフォントデータをベクトルフォントへ変換
するベクトルフォント変換部である。7は変換したベク
トルフォントデータを、新規に外字文字コードを付与
し、ビットマップフォントデータ、及び、各文字素片エ
リア毎の2値データドット数共に外字テーブルへ登録す
る外字テーブル登録部である。
【0010】次に本発明の一実施形態による外字の変換
・生成方法について、図2の処理フロー図に沿って説明
する。
【0011】文字データ入力部1は、他のシステム装置
にて作成された文字のビットマップフォントデータを読
み込むか、又は、手書き文字をイメージスキャナで読み
込むか、もしくは、直接ペン入力装置などで入力画面の
指定枠内に書き込むことにより、システム装置に作成す
る外字文字のビットマップフォントデータを取得する
(201)。
【0012】文字素片切り出し部2は、入力された骨格
文字を図3に例示するような文字の構成パターンに従っ
て文字素片に分解し(202)、分解した各文字素片を
エリア単位にドット数の算出を行う(203)。図3で
は偏(301)や旁(302)、冠(303)、にょう
(304)、垂れ(305)、構え(306)などの一
般的な文字素片への分解例を示しているが、文字素片へ
の分解は横分割やL字形,逆L字形,矩形などを任意の
位置の縦と横の直線の組合わせで行うことも可能であ
る。
【0013】パターン認識部3は、切り出し部2から分
解された各文字素片のデータを受け取り、分解した各文
字素片の情報をそれぞれについて大きさ,形状,位置,
パターンデータを抽出してデータ化する。
【0014】文字素片比較部4は、パターン認識部3に
おいてデータ化した各文字素片毎のデータが、登録済外
字テーブルに格納されているどの文字素片と一致するか
を調べる(205)。その際、パターン照合の効率を向
上させるため、図4に示すように外字テーブルに、外字
文字コード(401)とビットマップフォントデータ
(402)に加え、文字素片の各パターン毎に2値デー
タのドット数の合計値(403)を、ベクトルフォント
データ(404)と共に登録しておく。これにより、文
字素片のパターンマッチング対象を予めパラメータとし
て与えられた基準に従って絞り込むことができると共
に、業務要件により、類似度の設定を可変とすることが
できる(204)。
【0015】既存文字コード付与部5は、文字素片比較
部4にて入力データが既に存在する文字であると判断
(206)された場合に、入力データに対し既存の文字
コードを付与する(207)。
【0016】ベクトルフォント変換部6は、文字素片比
較部4にて入力データが新規の外字文字と判断(20
6)された場合に、ビットマップフォントデータをベク
トルフォントへ変換する(208)と共に、新規外字文
字コードとして図4に示すようなデータ項目を持つ外字
テーブルに、ベクトルフォントデータ(404)を含む
データを新規レコードとして登録する(209)。
【0017】このように、入力された文字の文字素片を
あらかじめ登録された指定書体の文字素片との相同性を
比較し、パラメータで与えた基準で同一の文字素片であ
ると判断された場合には、新たにベクトルフォントを作
成する必要が無くなり、既に作成されたベクトルフォン
トとその文字コードを用いることができる。この方法に
より、重複したベクトルフォントを作成すること無く、
大量の外字文字作成処理を機械的に一定の基準で行うこ
とが可能となる。
【0018】
【発明の効果】以上のように、本発明の外字文字管理方
法によれば、他のシステム装置で作成された外字文字
を、書体の文字素片単位に一致率を解析することで一定
の基準の相同性を確保して取り込むことができ、外字を
一元管理することが容易となる。従って、システム装置
へ大量の外字文字を取り込む際に、一致率の基準値パラ
メータを与えるだけで、人間の判断を介さずに一定基準
に従った外字文字テーブルの作成が可能となり、作成済
外字の有効活用や大量の外字文字の取り込み変換時の作
業負荷及び外字作成後の運用管理負荷を軽減する等の効
果を挙げることができる。
【0019】また、一致率の基準値を低く設定すること
により、既存の外字文字を一括して類似の外字文字へ変
換したり、更には内字へ置換したりするなどの応用も可
能となる。
【図面の簡単な説明】
【図1】本発明の一実施形態の構成を示す機能ブロック
図である。
【図2】本実施形態における文字作成処理の推移の一例
を示す処理フロー図である。
【図3】文字素片をパターンマッチングする際に切り出
す分割パターンの一例を示す図である。
【図4】外字文字コードとビットマップ、ベクトルフォ
ントデータを対応付ける外字テーブルの一例を示す図で
ある。
【符号の説明】
1…文字データ入力部、2…文字素片切り出し部、3…
パターン認識部、4…文字素片比較部、5…既存文字コ
ード付与部、6…ベクトルフォントへの変換部。
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 2C087 AA02 AA19 AB06 BA01 BA02 BA05 BA09 BA10 BB10 BD01 EA03 5B009 RA01 VC03 5C082 AA17 BA02 BB15 BB46 CB03 DA32 MM02 5L096 AA03 AA07 BA08 CA18 CA25 DA05 EA23 FA06 HA08 JA03

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 外字文字をビットマップデータ化したも
    のを基にベクトルフォントへ変換する外字データ処理装
    置において、ビットマップデータとして登録済みの文字
    素片のパターンデータとそれを数値化したテーブルを備
    え、前記テーブルのデータと入力された外字文字ビット
    マップデータの文字素片を比較し、任意に与える一致率
    で判定を行うことにより、任意の同一性基準によって文
    字データを管理することを特徴とする外字データの管理
    方法。
JP2001084020A 2001-03-23 2001-03-23 外字データの一元管理方法 Pending JP2002287733A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001084020A JP2002287733A (ja) 2001-03-23 2001-03-23 外字データの一元管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001084020A JP2002287733A (ja) 2001-03-23 2001-03-23 外字データの一元管理方法

Publications (1)

Publication Number Publication Date
JP2002287733A true JP2002287733A (ja) 2002-10-04

Family

ID=18939752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001084020A Pending JP2002287733A (ja) 2001-03-23 2001-03-23 外字データの一元管理方法

Country Status (1)

Country Link
JP (1) JP2002287733A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010282200A (ja) * 2009-06-02 2010-12-16 Rixco Inc アニメーションフォントファイルの構造及び携帯用端末のテキスト出力方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010282200A (ja) * 2009-06-02 2010-12-16 Rixco Inc アニメーションフォントファイルの構造及び携帯用端末のテキスト出力方法

Similar Documents

Publication Publication Date Title
JP4757001B2 (ja) 画像処理装置、画像処理方法
JP6229303B2 (ja) プログラム、情報処理装置および文字認識方法
JP2019215593A (ja) 画像処理装置,画像処理方法ならびに画像処理プログラムおよびそのプログラムを格納した記録媒体
JP2008176521A (ja) パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
US20020016796A1 (en) Document processing method, system and medium
JP3634574B2 (ja) 情報処理方法及び装置
JP2006227824A (ja) 図面認識方法および装置
JP2002287733A (ja) 外字データの一元管理方法
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP2009122758A (ja) 文書処理装置、文書処理方法及び文書処理プログラム
JP6542546B2 (ja) 文書データ処理方法およびシステム
JP2002024761A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JP5657401B2 (ja) 文書処理装置、及び文書処理プログラム
WO2015136692A1 (ja) 電子イメージ文書編集システム
JP2001084336A (ja) 文字認識装置及びその方法とプログラム記録媒体
JP2020047031A (ja) 文書検索装置、文書検索システム及びプログラム
US20200304671A1 (en) Apparatus and method
CN116861879A (zh) 日志模板提取方法、装置、设备以及存储介质
JP3164086B2 (ja) 手書き文字フォント作成方法及びそれを適用した手書き文字情報処理装置
JP2993880B2 (ja) 電子ファイル装置
JP2905334B2 (ja) オンライン手書き文字認識用辞書作成方法およびオンライン手書き文字認識用辞書作成装置
CN116401237A (zh) 一种数据的质量业务规则生成方法及质量规则评定系统
JPH08180050A (ja) 難読漢字検索装置
CN111859972A (zh) 实体识别方法、装置、计算机设备及计算机可读存储介质
CN112101368A (zh) 一种字符图像处理方法、装置、设备和介质