JPH03177963A - 漢字分類方法及び漢字分類表及び漢字処理装置 - Google Patents

漢字分類方法及び漢字分類表及び漢字処理装置

Info

Publication number
JPH03177963A
JPH03177963A JP1317377A JP31737789A JPH03177963A JP H03177963 A JPH03177963 A JP H03177963A JP 1317377 A JP1317377 A JP 1317377A JP 31737789 A JP31737789 A JP 31737789A JP H03177963 A JPH03177963 A JP H03177963A
Authority
JP
Japan
Prior art keywords
character
kanji
characters
representative
variant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1317377A
Other languages
English (en)
Other versions
JP2974346B2 (ja
Inventor
Toshio Tanaka
敏雄 田中
Taizo Yoko
横 泰三
Tsutomu Nakano
中野 力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toppan Inc
Original Assignee
Toppan Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toppan Printing Co Ltd filed Critical Toppan Printing Co Ltd
Priority to JP1317377A priority Critical patent/JP2974346B2/ja
Publication of JPH03177963A publication Critical patent/JPH03177963A/ja
Application granted granted Critical
Publication of JP2974346B2 publication Critical patent/JP2974346B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は電算写植或いはワープロ等で文書を編集する際
の同音同義の漢字の処理に関する。
〔従来の技術〕
漢字処理の分野においては、数万字にも及ぶ漢字を扱う
関係上、いずれの文字を使用するのがより適切であるか
を判断することが非常に困難であされ、これらはその両
者が現在においても通用するため、その取扱いを一層複
雑にしている。
例えば、偏「全」は常用漢字指定時に「乍」から「食」
に変更されたが、このときに常用漢字に指定されなかっ
た「飴」は依然として正確な漢字としては「飴」である
が、これを誤って’4’6.+と表す場合が少なくない
。文書編纂においては、このような現在における正確な
漢字とは異なる漢字の使用が求められることがあり、こ
れに対処するために、電算写植機では正確な漢字即ち正
字の他に、国字、本字、古学、別体字、俗字、略字、誤
字、偽字等に分類される漢字をフォントメモリーに記憶
している。
〔発明が解決しようとする課題〕
このような背景の中で、特に前記の「飴」r4i、> 
Jの如く発音が同して意味内容も同しである所謂同音同
義の文字が複数ある場合は、いずれの字を使用するかを
例えば、出版社により指定されたときに、出版社の意図
どおりになっているかどうかを確認する必要が生しる。
この確認のために、同音同義の漢字を膨大な数の漢字の
なかから抽出して(ることは極めて面倒な作業である。
また、日本語ワードプロセッサではカナで「あめ」と打
鍵すれば、同音の漢字が複数或いは順次画面上に現れる
が、同音同義の漢字がまとまって現れるものではないの
で、やはり探し出す面倒な作業が残っている。
(課題を解決するための手段〕 上記の如くの従来技術における問題点を解決すべくなさ
れた本発明によれば、正しいと認められる通用字形の字
体を代表文字とし、代表文字に異形の同音同義の文字を
異体字とし、代表文字に対して異体字が存在すればそれ
らを同字とみなして一つの同字グループを形成し、異体
字が存在しない代表文字と前記同字グループとを混在せ
しめて部首別に区分して配列することを特徴とする漢字
分類方法及びそのようにして分類された漢字分類表が提
供される。
また、本発明によれば、電算写植機、日本語ワードプロ
セッサ等の漢字処理機能を有する装置において、正しい
と認められる通用字形の字体を代表文字とし、代表文字
に異形の同音同義の文字を異体字とし、代表文字に対し
て異体字が存在すればそれらを同字とみなして一つの同
字グループを形成するように漢字を区分して記憶する記
憶手段と、任意の漢字について同字が存在するとき前記
記憶手段にアクセスし、当該漢字の同字を出力し、印字
或いは表示を行なう出力手段とを備えた漢字処理装置が
提供される。
(作用) 上記の如くの構成とすることにより、正しいと認められ
る通用字形の字体を代表文字とし、代表文字に対して異
形の同音同義の文字を異体字として、これら代表文字と
異体字とをまとめて同字として表示できるので、使用す
べき漢字の確認を適切に行なうことができ、特にこれを
電算写植機或いは日本語ワードプロセッサに適用したと
き文書作成時における漢字の使用の誤りを例えば印刷物
依頼者側と印刷物作製者側で相互に簡単に確認できるの
でトラブルの発生を減少せしめることが可能となる。
〔実施例] 以下に本発明を一つの実施例に基づき詳細に説明する。
第1図に本発明により得られる漢字分類表の一例を示す
第1図では代表文字が部首「−」に属する漢字の一部が
示されている。ここで漢字r、、「下」「三」、「上」
、「丈」、「万Jについては、これらを正しいと認めら
れる通用字形の字体であるとして親字とみなし、これら
に異形の同音同義の漢字が存在するのでこれを異体字と
して親字に併記する。そして、これらを本発明において
は同字と称する。
具体的には、「−」についてはr弐」、「下」について
はr千」、三についてはr−(」、上については「工」
、丈については’CJ’fl」を異体字として代表文字
に併記する。
なお、その他の「七」、「で」、「丁」、「5」「ゴ」
、「1」、「マ」は同音同義の文字がなく、従ってそれ
らを代表文字として1頃に列記する。
また、部首キーは代表文字についてのキーであり、代表
文字を部首順に並べるために定めたキーである。この例
では、上位3桁を部首コードに、中位2桁を総字画数に
、下位3桁を部首、画数が同し場合の枝番に当てである
各漢字には、その漢字についての情報がコードで付記さ
れている。第2図に漢字に付記される情報についての説
明図を示す。
エリア11は異体字区分を示すエリアであり、対象にな
っている漢字がいかなる種類に属するのかを示している
。区分としては、正字、国字、本字、古学、別体率、俗
字、略字、誤字、仏学があり、各々略して「正」、「国
」、「本」、「古」、「別」、「俗J、「略」、「誤」
、「偽」をエリア11に表記する。
エリア12には、その漢字が常用漢字、人名漢字、旧字
のいずれに属するのかを示す「常」、「人」、「旧」が
記入される。
さらに、エリア13は特定の字種にマークを付ける場合
のエリアであり、エリア14は正確でない情報などのメ
モを表示する場合のエリアである。
また、エリア15に電算処理における漢字のコードを記
入するようにしても良い。
このように異体字を含む或いは含まない代表文字を部首
別に配列し、テーブル化することにより同字を正確に認
識することができ、複数の同字のうち適切な漢字が使わ
れているかどうかを確認することができる。
なお、このような同字の選択については新字源、大漢和
、康煕等の漢和辞典をよりどころにすることができ、ま
た、代表文字についてはより適切な文字が存在すること
が判明したならば、その同字についての代表文字を変更
可能にする。
次に、上記の如くの漢字分類方法に従って漢字の処理を
行なう漢字処理装置について説明する。
この漢字処理装置の一例として第3図及び第4図に電算
写植機を示す、第3図は電算写植機の概要を示す説明図
であり、第4図はその機能ブロック図である。
第3図に示すように、電算写植機の大まかな構成は、キ
ーボード20、磁気テープを用いた記憶製置22、電″
H,機21、印字装置23からなっている。
そして、電算写植機の機能的に分けた構成を説明すれば
第4図に示すようになっている。すなわち、電算写植機
は、文字情報人力部30、文字情報記憶部32、割付情
報人力部34、割付情報記憶部36、割付編集部42、
記憶部44、出力部46を備えている。
文字情報入力部30は印字しようとする文字情報を人力
する部分であり、この文字情報は文字を表す文字データ
と当該文字の印字位置を指定する位置データとを含んで
いる。この文字情報入力部30はキーボード20により
構成され、人力された文字情報が’IX機21へ入力さ
れる。
割付情報入力部34は印刷物の紙サイズや印字の行間、
余白といった書式を指定する書式データと印字位置を指
定する位置データとを含む割付情報を入力する部分であ
る。この割付情報入力部34はキーボード20により構
成され、キーボード20を操作することにより割付情報
が電算機21へ入力される。
文字情報記憶部32は文字情報入力部30から入力され
た文字情報を記憶しておく部分である。
割付情報記憶部36は割付情報入力部34から入力され
た割付情報を記憶しておく部分である。
割付編集部42は文字情報記憶部32から文字情報を割
付情報記憶部36から割付情報をそれぞれ読み出して文
字情報を割付情報に結び付ける部分である。
記憶部44は割付編集部42で文字情報に割付情報、パ
ターンマトリックス情報を結び付けた情報を記憶する部
分である。
フォント情報記憶部45は文字のフォントをラスター或
いはベクター形式で記憶している部分である。
上記文字情報記憶部32、割付情報記憶部36、記憶部
44、フォント情報記憶部45は電算41a21のメモ
リにより構成され、割付編集部42は電算機21の演算
装置により構成されている。
出力部46は記憶部44から読み出された情報に基づい
て、フォント情報記憶部45から読み出されるフォント
文字を版下様出力媒体(印画紙、フィルム等)に印字部
48にて印字を行って製版用版下の作製を制御する部分
で、また印字部48はレーザープリンタ等の装W23に
より構成されている。
このような電算写植機において、文字情報入力部30か
ら、正しいと認められる通用字形の字体を代表文字とし
、代表文字に異形の同音同義の文字を異体字とし、代表
文字に対して異体字が存在すればそれらを同字とみなし
て一つの同字グルー・ブを形成し、異体字が存在しない
代表文字と前記1同字グループを入力する。他方、割付
情報入力部34から、これらの入力された代表文字及び
異体字をいかなるフォーマットで配置するか、即ち文字
割付に関する情報を入力する。
割付編集部42にて、文字情報記憶部32に記憶されて
いる代表文字及び異体字と、割付情報記憶部36に記憶
されているフォーマット情報とにより、代表文字ε異体
字とを例えば第1図の分類表の如くに割付ける。割付処
理が完了した同字情報(即ち漢字分類表)は記憶部44
に記憶される。
記憶部44に記憶されている割付処理が施された漢字分
類表を出力するにおいては、出力部46にてその漢字分
類表にて使用されるフォント文字をフォント情報記憶部
45に格納されているフォント文字から読み出し、印字
部48を制御して印字する。出力形態としては印字だけ
でなく、CRTによる表示等も可能である。
また、電算写植機だけでなく、他の漫字処理装置即ち日
本語ワードプロセッサにおいても、割付処理が施された
同字情報を記憶装置Cコ持ち、必要に応して例えば同字
出力モードを指定t、7て「音」を入力し、CRTデイ
スプレィにその「音」に対応する同音同義の同字情報即
ち代表文字とその異体字を表示することができる。
〔発明の効果〕
以上に詳述したように、本発明によれば、同音同義の漢
字が複数存在する場合に、これらの識別または確認を容
易に行なうことができ、漢字の誤りによるトラブルを良
好に防止することが可能となる。
【図面の簡単な説明】
第1図は本発明による漢字骨w4表の一例を示す説明図
、第2図は漢字に付記する情報についての説明図、第3
図は電算写植機の概略説明図、第4図は電算写植機の機
能ブロック図である。 11・・・異体字区分エリア、12・・・常用・人名・
旧字区分エリア、15・・・文字コードエリア、20・
・・キーボード、21・・・電算機、22・・・記憶装
置、23・・・印字部 特  許  出  願  人 凸版印刷株式会社 代表者 鈴木和夫 部首キー代表文字  同字 00101001  −’    #古0010200
1  七6 00102003 00102005 00102006 00102007 00102008 00102009 00103002 00103003 00103004 00103005 00103007 丁1 ラエ ゴ づ 下1 丁オ 三6 式オ 上1 土8 丈6 丈1丈、 万7 萬rB万、万 萬 第1図 15 第2図 第 図

Claims (4)

    【特許請求の範囲】
  1. (1)正しいと認められる通用字形の字体を代表文字と
    し、代表文字に(通用している)異形の同音同義の文字
    を異体字とし、代表文字に対して異体字が存在すればそ
    れらを同字とみなして一つの同字グループを形成し、異
    体字が存在しない代表文字と前記同字グループとを混在
    せしめて部首別に区分して配列することを特徴とする漢
    字分類方法。
  2. (2)正しいと認められる通用字形の字体を代表文字と
    して部首別に配列され、代表文字について異形の同音同
    義の文字が存在すればそれを異体字として代表文字に並
    べて配置され、各代表文字及び異体字にはその字に固有
    の情報が付されていることを特徴とする漢字分類表。
  3. (3)前記固有の情報は異体字の種類を表す情報と、常
    用漢字か人名漢字か旧字か或いはそれ以外の漢字のいず
    れかを示す情報とを含むものである特許請求の範囲第2
    項記載の漢字分類表。
  4. (4)正しいと認められる通用字形の字体を代表文字と
    し、代表文字に異形の同音同義の文字を異体字とし、代
    表文字に対して異体字が存在すればそれらを同字とみな
    して一つの同字グループを形成するように漢字情報を区
    分して記憶する記憶手段と、任意の漢字について同字が
    存在するとき前記記憶手段にアクセスし、当該漢字の同
    字を出力し、印字或いは表示を行なう出力手段とを有す
    る漢字処理装置。
JP1317377A 1989-12-06 1989-12-06 漢字処理装置 Expired - Lifetime JP2974346B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1317377A JP2974346B2 (ja) 1989-12-06 1989-12-06 漢字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1317377A JP2974346B2 (ja) 1989-12-06 1989-12-06 漢字処理装置

Publications (2)

Publication Number Publication Date
JPH03177963A true JPH03177963A (ja) 1991-08-01
JP2974346B2 JP2974346B2 (ja) 1999-11-10

Family

ID=18087573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1317377A Expired - Lifetime JP2974346B2 (ja) 1989-12-06 1989-12-06 漢字処理装置

Country Status (1)

Country Link
JP (1) JP2974346B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108616A (ja) * 1991-10-11 1993-04-30 Sharp Corp 文書処理装置
US6522330B2 (en) 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method
JP2016212626A (ja) * 2015-05-08 2016-12-15 株式会社アイビーシー Webを介した外字・異体字含有文字群入力利用システム
CN112001170A (zh) * 2020-05-29 2020-11-27 中国人民大学 一种识别经过变形的敏感词的方法和系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108616A (ja) * 1991-10-11 1993-04-30 Sharp Corp 文書処理装置
US6522330B2 (en) 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method
JP2016212626A (ja) * 2015-05-08 2016-12-15 株式会社アイビーシー Webを介した外字・異体字含有文字群入力利用システム
CN112001170A (zh) * 2020-05-29 2020-11-27 中国人民大学 一种识别经过变形的敏感词的方法和系统
CN112001170B (zh) * 2020-05-29 2023-05-09 中国人民大学 一种识别经过变形的敏感词的方法和系统

Also Published As

Publication number Publication date
JP2974346B2 (ja) 1999-11-10

Similar Documents

Publication Publication Date Title
US7651286B2 (en) Method arrangement and computer software for the printing of a separator sheet by means of an electrophotographic printer or copier
Swanson et al. Mathematics into type
JPH03177963A (ja) 漢字分類方法及び漢字分類表及び漢字処理装置
Ilson Recent research in text processing
Bowman et al. Desktop publishing: Things Gutenberg never taught you
EP0190511A1 (en) Block processing apparatus
JP3663865B2 (ja) 帳票処理装置及び記憶媒体
JP3244433U (ja) フォント計測ツール
JPH07105197A (ja) 文書処理装置
JP3008855B2 (ja) ラベルプリンタ
JP2002341854A (ja) 手書き文字フォント作成装置、手書き文字フォント作成プログラム、手書き文字フォント作成方法、及び手書き文字フォントを用いた文書作成装置
Biemesderfer et al. The AASTEX Macros for Manuscript Preparation
JPS61286177A (ja) 文書作成装置
JPS6389925A (ja) ワ−ドプロセツサ
JPH04343127A (ja) 文字処理装置
JPS61286157A (ja) 文書作成装置
JPS625469A (ja) 文字等入力装置
Moen A comparative study of IBM PC and Apple MacIntosh electronic publishing systems
JPS61286156A (ja) 文書作成装置
Hensch IBM History of Far Eastern Languages in Computing: National Language Support Since 1961;[looking to East Asia]
JPH08263482A (ja) フォント管理装置
JPH0554180A (ja) 光学式文字読取装置における帳票フオーマツト定義方式
JPH0291761A (ja) 文字処理方法
JPH08315164A (ja) レイアウト修正装置
JPH05169613A (ja) 使用書体名表示機能付き電算写植印字装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070903

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080903

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080903

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090903

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090903

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100903

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100903

Year of fee payment: 11