JPH03177963A - 漢字分類方法及び漢字分類表及び漢字処理装置 - Google Patents
漢字分類方法及び漢字分類表及び漢字処理装置Info
- Publication number
- JPH03177963A JPH03177963A JP1317377A JP31737789A JPH03177963A JP H03177963 A JPH03177963 A JP H03177963A JP 1317377 A JP1317377 A JP 1317377A JP 31737789 A JP31737789 A JP 31737789A JP H03177963 A JPH03177963 A JP H03177963A
- Authority
- JP
- Japan
- Prior art keywords
- character
- kanji
- characters
- representative
- variant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 7
- 239000000463 material Substances 0.000 abstract description 3
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 1
- 240000000220 Panda oleosa Species 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
め要約のデータは記録されません。
Description
の同音同義の漢字の処理に関する。
関係上、いずれの文字を使用するのがより適切であるか
を判断することが非常に困難であされ、これらはその両
者が現在においても通用するため、その取扱いを一層複
雑にしている。
に変更されたが、このときに常用漢字に指定されなかっ
た「飴」は依然として正確な漢字としては「飴」である
が、これを誤って’4’6.+と表す場合が少なくない
。文書編纂においては、このような現在における正確な
漢字とは異なる漢字の使用が求められることがあり、こ
れに対処するために、電算写植機では正確な漢字即ち正
字の他に、国字、本字、古学、別体字、俗字、略字、誤
字、偽字等に分類される漢字をフォントメモリーに記憶
している。
Jの如く発音が同して意味内容も同しである所謂同音同
義の文字が複数ある場合は、いずれの字を使用するかを
例えば、出版社により指定されたときに、出版社の意図
どおりになっているかどうかを確認する必要が生しる。
なかから抽出して(ることは極めて面倒な作業である。
鍵すれば、同音の漢字が複数或いは順次画面上に現れる
が、同音同義の漢字がまとまって現れるものではないの
で、やはり探し出す面倒な作業が残っている。
れた本発明によれば、正しいと認められる通用字形の字
体を代表文字とし、代表文字に異形の同音同義の文字を
異体字とし、代表文字に対して異体字が存在すればそれ
らを同字とみなして一つの同字グループを形成し、異体
字が存在しない代表文字と前記同字グループとを混在せ
しめて部首別に区分して配列することを特徴とする漢字
分類方法及びそのようにして分類された漢字分類表が提
供される。
セッサ等の漢字処理機能を有する装置において、正しい
と認められる通用字形の字体を代表文字とし、代表文字
に異形の同音同義の文字を異体字とし、代表文字に対し
て異体字が存在すればそれらを同字とみなして一つの同
字グループを形成するように漢字を区分して記憶する記
憶手段と、任意の漢字について同字が存在するとき前記
記憶手段にアクセスし、当該漢字の同字を出力し、印字
或いは表示を行なう出力手段とを備えた漢字処理装置が
提供される。
る通用字形の字体を代表文字とし、代表文字に対して異
形の同音同義の文字を異体字として、これら代表文字と
異体字とをまとめて同字として表示できるので、使用す
べき漢字の確認を適切に行なうことができ、特にこれを
電算写植機或いは日本語ワードプロセッサに適用したと
き文書作成時における漢字の使用の誤りを例えば印刷物
依頼者側と印刷物作製者側で相互に簡単に確認できるの
でトラブルの発生を減少せしめることが可能となる。
。
示されている。ここで漢字r、、「下」「三」、「上」
、「丈」、「万Jについては、これらを正しいと認めら
れる通用字形の字体であるとして親字とみなし、これら
に異形の同音同義の漢字が存在するのでこれを異体字と
して親字に併記する。そして、これらを本発明において
は同字と称する。
はr千」、三についてはr−(」、上については「工」
、丈については’CJ’fl」を異体字として代表文字
に併記する。
、「1」、「マ」は同音同義の文字がなく、従ってそれ
らを代表文字として1頃に列記する。
文字を部首順に並べるために定めたキーである。この例
では、上位3桁を部首コードに、中位2桁を総字画数に
、下位3桁を部首、画数が同し場合の枝番に当てである
。
れている。第2図に漢字に付記される情報についての説
明図を示す。
っている漢字がいかなる種類に属するのかを示している
。区分としては、正字、国字、本字、古学、別体率、俗
字、略字、誤字、仏学があり、各々略して「正」、「国
」、「本」、「古」、「別」、「俗J、「略」、「誤」
、「偽」をエリア11に表記する。
のいずれに属するのかを示す「常」、「人」、「旧」が
記入される。
のエリアであり、エリア14は正確でない情報などのメ
モを表示する場合のエリアである。
入するようにしても良い。
別に配列し、テーブル化することにより同字を正確に認
識することができ、複数の同字のうち適切な漢字が使わ
れているかどうかを確認することができる。
、康煕等の漢和辞典をよりどころにすることができ、ま
た、代表文字についてはより適切な文字が存在すること
が判明したならば、その同字についての代表文字を変更
可能にする。
行なう漢字処理装置について説明する。
写植機を示す、第3図は電算写植機の概要を示す説明図
であり、第4図はその機能ブロック図である。
ーボード20、磁気テープを用いた記憶製置22、電″
H,機21、印字装置23からなっている。
第4図に示すようになっている。すなわち、電算写植機
は、文字情報人力部30、文字情報記憶部32、割付情
報人力部34、割付情報記憶部36、割付編集部42、
記憶部44、出力部46を備えている。
する部分であり、この文字情報は文字を表す文字データ
と当該文字の印字位置を指定する位置データとを含んで
いる。この文字情報入力部30はキーボード20により
構成され、人力された文字情報が’IX機21へ入力さ
れる。
余白といった書式を指定する書式データと印字位置を指
定する位置データとを含む割付情報を入力する部分であ
る。この割付情報入力部34はキーボード20により構
成され、キーボード20を操作することにより割付情報
が電算機21へ入力される。
た文字情報を記憶しておく部分である。
た割付情報を記憶しておく部分である。
付情報記憶部36から割付情報をそれぞれ読み出して文
字情報を割付情報に結び付ける部分である。
ターンマトリックス情報を結び付けた情報を記憶する部
分である。
いはベクター形式で記憶している部分である。
44、フォント情報記憶部45は電算41a21のメモ
リにより構成され、割付編集部42は電算機21の演算
装置により構成されている。
て、フォント情報記憶部45から読み出されるフォント
文字を版下様出力媒体(印画紙、フィルム等)に印字部
48にて印字を行って製版用版下の作製を制御する部分
で、また印字部48はレーザープリンタ等の装W23に
より構成されている。
ら、正しいと認められる通用字形の字体を代表文字とし
、代表文字に異形の同音同義の文字を異体字とし、代表
文字に対して異体字が存在すればそれらを同字とみなし
て一つの同字グルー・ブを形成し、異体字が存在しない
代表文字と前記1同字グループを入力する。他方、割付
情報入力部34から、これらの入力された代表文字及び
異体字をいかなるフォーマットで配置するか、即ち文字
割付に関する情報を入力する。
いる代表文字及び異体字と、割付情報記憶部36に記憶
されているフォーマット情報とにより、代表文字ε異体
字とを例えば第1図の分類表の如くに割付ける。割付処
理が完了した同字情報(即ち漢字分類表)は記憶部44
に記憶される。
類表を出力するにおいては、出力部46にてその漢字分
類表にて使用されるフォント文字をフォント情報記憶部
45に格納されているフォント文字から読み出し、印字
部48を制御して印字する。出力形態としては印字だけ
でなく、CRTによる表示等も可能である。
本語ワードプロセッサにおいても、割付処理が施された
同字情報を記憶装置Cコ持ち、必要に応して例えば同字
出力モードを指定t、7て「音」を入力し、CRTデイ
スプレィにその「音」に対応する同音同義の同字情報即
ち代表文字とその異体字を表示することができる。
字が複数存在する場合に、これらの識別または確認を容
易に行なうことができ、漢字の誤りによるトラブルを良
好に防止することが可能となる。
、第2図は漢字に付記する情報についての説明図、第3
図は電算写植機の概略説明図、第4図は電算写植機の機
能ブロック図である。 11・・・異体字区分エリア、12・・・常用・人名・
旧字区分エリア、15・・・文字コードエリア、20・
・・キーボード、21・・・電算機、22・・・記憶装
置、23・・・印字部 特 許 出 願 人 凸版印刷株式会社 代表者 鈴木和夫 部首キー代表文字 同字 00101001 −’ #古0010200
1 七6 00102003 00102005 00102006 00102007 00102008 00102009 00103002 00103003 00103004 00103005 00103007 丁1 ラエ ゴ づ 下1 丁オ 三6 式オ 上1 土8 丈6 丈1丈、 万7 萬rB万、万 萬 第1図 15 第2図 第 図
Claims (4)
- (1)正しいと認められる通用字形の字体を代表文字と
し、代表文字に(通用している)異形の同音同義の文字
を異体字とし、代表文字に対して異体字が存在すればそ
れらを同字とみなして一つの同字グループを形成し、異
体字が存在しない代表文字と前記同字グループとを混在
せしめて部首別に区分して配列することを特徴とする漢
字分類方法。 - (2)正しいと認められる通用字形の字体を代表文字と
して部首別に配列され、代表文字について異形の同音同
義の文字が存在すればそれを異体字として代表文字に並
べて配置され、各代表文字及び異体字にはその字に固有
の情報が付されていることを特徴とする漢字分類表。 - (3)前記固有の情報は異体字の種類を表す情報と、常
用漢字か人名漢字か旧字か或いはそれ以外の漢字のいず
れかを示す情報とを含むものである特許請求の範囲第2
項記載の漢字分類表。 - (4)正しいと認められる通用字形の字体を代表文字と
し、代表文字に異形の同音同義の文字を異体字とし、代
表文字に対して異体字が存在すればそれらを同字とみな
して一つの同字グループを形成するように漢字情報を区
分して記憶する記憶手段と、任意の漢字について同字が
存在するとき前記記憶手段にアクセスし、当該漢字の同
字を出力し、印字或いは表示を行なう出力手段とを有す
る漢字処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1317377A JP2974346B2 (ja) | 1989-12-06 | 1989-12-06 | 漢字処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1317377A JP2974346B2 (ja) | 1989-12-06 | 1989-12-06 | 漢字処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH03177963A true JPH03177963A (ja) | 1991-08-01 |
JP2974346B2 JP2974346B2 (ja) | 1999-11-10 |
Family
ID=18087573
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1317377A Expired - Lifetime JP2974346B2 (ja) | 1989-12-06 | 1989-12-06 | 漢字処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2974346B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05108616A (ja) * | 1991-10-11 | 1993-04-30 | Sharp Corp | 文書処理装置 |
US6522330B2 (en) | 1997-02-17 | 2003-02-18 | Justsystem Corporation | Character processing system and method |
JP2016212626A (ja) * | 2015-05-08 | 2016-12-15 | 株式会社アイビーシー | Webを介した外字・異体字含有文字群入力利用システム |
CN112001170A (zh) * | 2020-05-29 | 2020-11-27 | 中国人民大学 | 一种识别经过变形的敏感词的方法和系统 |
-
1989
- 1989-12-06 JP JP1317377A patent/JP2974346B2/ja not_active Expired - Lifetime
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05108616A (ja) * | 1991-10-11 | 1993-04-30 | Sharp Corp | 文書処理装置 |
US6522330B2 (en) | 1997-02-17 | 2003-02-18 | Justsystem Corporation | Character processing system and method |
JP2016212626A (ja) * | 2015-05-08 | 2016-12-15 | 株式会社アイビーシー | Webを介した外字・異体字含有文字群入力利用システム |
CN112001170A (zh) * | 2020-05-29 | 2020-11-27 | 中国人民大学 | 一种识别经过变形的敏感词的方法和系统 |
CN112001170B (zh) * | 2020-05-29 | 2023-05-09 | 中国人民大学 | 一种识别经过变形的敏感词的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
JP2974346B2 (ja) | 1999-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7651286B2 (en) | Method arrangement and computer software for the printing of a separator sheet by means of an electrophotographic printer or copier | |
Swanson et al. | Mathematics into type | |
JPH03177963A (ja) | 漢字分類方法及び漢字分類表及び漢字処理装置 | |
Ilson | Recent research in text processing | |
Bowman et al. | Desktop publishing: Things Gutenberg never taught you | |
EP0190511A1 (en) | Block processing apparatus | |
JP3663865B2 (ja) | 帳票処理装置及び記憶媒体 | |
JP3244433U (ja) | フォント計測ツール | |
JPH07105197A (ja) | 文書処理装置 | |
JP3008855B2 (ja) | ラベルプリンタ | |
JP2002341854A (ja) | 手書き文字フォント作成装置、手書き文字フォント作成プログラム、手書き文字フォント作成方法、及び手書き文字フォントを用いた文書作成装置 | |
Biemesderfer et al. | The AASTEX Macros for Manuscript Preparation | |
JPS61286177A (ja) | 文書作成装置 | |
JPS6389925A (ja) | ワ−ドプロセツサ | |
JPH04343127A (ja) | 文字処理装置 | |
JPS61286157A (ja) | 文書作成装置 | |
JPS625469A (ja) | 文字等入力装置 | |
Moen | A comparative study of IBM PC and Apple MacIntosh electronic publishing systems | |
JPS61286156A (ja) | 文書作成装置 | |
Hensch | IBM History of Far Eastern Languages in Computing: National Language Support Since 1961;[looking to East Asia] | |
JPH08263482A (ja) | フォント管理装置 | |
JPH0554180A (ja) | 光学式文字読取装置における帳票フオーマツト定義方式 | |
JPH0291761A (ja) | 文字処理方法 | |
JPH08315164A (ja) | レイアウト修正装置 | |
JPH05169613A (ja) | 使用書体名表示機能付き電算写植印字装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070903 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080903 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080903 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090903 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090903 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100903 Year of fee payment: 11 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100903 Year of fee payment: 11 |