JPH0447446A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0447446A
JPH0447446A JP2156323A JP15632390A JPH0447446A JP H0447446 A JPH0447446 A JP H0447446A JP 2156323 A JP2156323 A JP 2156323A JP 15632390 A JP15632390 A JP 15632390A JP H0447446 A JPH0447446 A JP H0447446A
Authority
JP
Japan
Prior art keywords
character
variant
characters
variant form
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2156323A
Other languages
English (en)
Inventor
Eiichiro Toshima
英一朗 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2156323A priority Critical patent/JPH0447446A/ja
Publication of JPH0447446A publication Critical patent/JPH0447446A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は漢字仮名混り文を入力、編集する文字処理装置
に関する。
[従来の技術] 現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。
仮名漢字変換は辞書を参照することにより、入力された
読み列を漢字に変換するものである。ところが、辞書を
記憶するメモリ容量の関係で、あらゆる単語が辞書に一
登録されているとは限らない。この様に登録されない単
語の中には語量的に難解な単語と同様に、表記が一般的
でない単語、例えば、異体字で表記される単語も含まれ
ている。
例えば、「検針」という人名はある程度−船釣な姓であ
るので仮名漢字変換用辞書に登録されているのが普通で
ある。しかし「松」を異体字に変えた「套野」は珍しい
姓なので相当大容量の辞書でないと登録されない。
この様に、特に人名には異体字が使用される可能性が高
いが、ところが、異体字の人名を全て対応しようとして
も、組み合わせ数の問題でとても有限容量の辞書には登
録できない。
そこで、上記の問題を解決するために、異体字変換とい
う手法が提案されている。これは辞書上に標準的な字体
の単語(例えば「検針」)だけを登録しておき、異体字
の単語(例えば「否野」)は標準的な単語を異体字変換
することで入力しようというものである。
上記の手法によれば、例えば、「検針」の「松」のとこ
ろにカーソルを合わせ、「異体字変換」を指示すると、
「松」が「否」に変換される。
「崎」 「埼」 「碕」のように異体字の候補が複数個
あるときには異体字変換を複数回指示することになる。
例えば、「崎」を「碕」に変換するときは以下の様に操
作する。「崎」を異体字変換すると「埼」になる。これ
は望みの候補でないので、更に異体字変換すると「碕」
になり、ここで操作を終了する。
以上の説明は全てJIS X 020gコード内での異
体字の処理の説明であるが、異体字の中にはJIS X
0208コード内に存在しない文字もある。この様なJ
IS X 0208コードにない異体字はシステムとし
てサポートされないので、オペレータ側で外字を作成す
る必要がある。
[発明が解決しようとしている課題] ところが、この様なJIS X 020gコードにない
異体字を入力するためには、その異体字のパターンをデ
ザインし、外字コードを割り付け、外字として登録する
、などの厄介な作業を行なわなければならず、取り扱い
が面倒であるという欠点があった。
[課題を解決するための手段(及び作用)]本発明は、
標準的にはサポート(使用)されない異体字も候補とし
て表示し、もし、非標準の異体字を選択したときは、そ
の異体字の持つユニクなコードとともにパターンが非標
準文字エリアに登録され、非標準文字エリアにある文字
パターンがあたかも標準的にサポートされる文字である
かの様に処理する機構を持つことにより、オペレータが
非標準の異体字を容易に取り扱えるようにしようという
ものである。
[実施例] 以下図面を参照しながら本発明の詳細な説明する。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCB lxマイクロプロセッサCP
Uの制御の対象とする各構成要素のコントロール信号を
転送して印加する。データバスDBは各構成機器相互間
のデータの転送を行なう。
つぎにROMは、読出し専用の固定メモリであり、第8
図〜第11図につき後述するマイクロプロセッサCPU
による制御の手順、及び異体字変換用の辞書IDICを
記憶させておく。
また、RAMは、1ワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。TBUFはテキスト
バッファであり、入力編集中のテキストデータが記憶さ
れる。ILISTは異体字リストであり、異体字変換中
に必要な異体字候補を異体字辞書IDICより抜きだし
て一時的に記憶する。GAREAは非標準文字エリアで
あり、CGに存在しない非標準の文字のパターンを文字
コードと対応づけて記憶する。
KBはキーボードであって、アルファベットキ、ひらか
なキー、カタカナキー等の文字記号入カキ−5及び、異
体字変換キー、前画面キー、次画面キー等の本文字処理
装置に対する各種機能庖指示するための各種のファンク
ションキーを備えている。
DISKは文書データ、非標準文字ファイルGFILE
等を記憶するための外部記憶部である。
テキストバッファTBUF上に作成された文書はこの外
部記憶部に保管される。保管されたデータはキーボード
の指示により、必要な時呼び出される。また、非標準文
字ファイルGF I LEが格納されている。CGに存
在しない非標準の文字が文書中に出現したときはGF 
I LEより文字パターンを読込み処理することになる
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。
後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対応する表示装置CRT上の位置にカー
ソルを表示する。
DELIFは表示用バッファメモリで、表示すべきデー
タのパターンを蓄える。DBUFにドツトパターンを書
き込むことにより任意のパターンを表示することができ
る。テキストの内容を表示するときはテキストバッファ
TBUFの内容に応じて表示パターンがDBUPに作成
されることにより、表示されることになる。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドツト構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。通常は書込不可能であり、標準的な文字、
例えばJIS X 0208コ・−ドの第1水準、第2
水準文字のパターンのみを記憶する。JIS X 02
08コードの第1水準、第2水準以外の文字については
非標準文字ファイル中にパターンが格納されている。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの人力が供給される
と、まず、インクラブド信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶しである各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。
第2図は本発明装置による異体字変換の変換例を示した
図である。
2−1は通常の文書編集画面を示した図である。文書中
には「6碕」 「6崎」 「剣持」 「剣持」「否野」
 「検針」が入力されている。ここで、一番目の「剣持
」を「剣持」に変換したいのでカーソルは「剣」上にあ
る。
2−2は異体字変換キーを打鍵した状態の画面である。
「剣」の異体字候補の一覧がウィンドウ中に表示されて
いる。通常文字と異なり、異体字は大きく表示されてい
るので、細かな字体の違いが分かり、誤選択の可能性は
少ない。
−画面目には望む異体字候補が存在しなかったので次画
面キーを打鍵すると2−3の画面になり、次の異体字候
補−覧が表示される。
この画面で望む異体字「砺」があるので、それに対応゛
する数字「1」を打鍵すると、「勧」が文書中の「剣」
と置き換わり、異体字−覧ウイントウは消える。
第3図はテキストバッファTBUFの構成を示した図で
ある。
テキストバッファは文字の羅列から構成され、各文字は
2バイトで構成される。文字コードは、JIS X 0
208コードに準拠したコードを使用する。
、JIS X 0208コード第1水準、JIS X 
0208コード第2水準に含まれない文字の文字コード
はJIS X 0208コードの空きを利用する。例λ
ば、16ビツトのコードのMSBを1にし、JIS X
 0208コードと重ならない様に決める。
第4図は異体字辞書IDICの構成を示した図である。
漢字コードと異体字番号が対応づけて格納される。異体
字番号はその異体字がどのグループに属するかを示して
いる。例えば、「剣」 「創」[@J  rflJ  
raJ  riJは同じ異体字のグループに属するので
、同じ異体字番号rloOJが付けられている。「島」
 「嶋」 「嶌」も同じ異体字のグループに属するので
同じ異体字番号rl OIJが付けられている。
第5図は異体字リストILISTの構成を示した図で°
ある。
異体字リストは異体字変換を行なうときに異体字辞書I
DICより必要な異体字を抜き出して作成したテーブル
であり、このテーブルに基づいて異体字の候補−覧表示
、選択操作を処理する。
異体字個数はこのリストに格納されている異体字の個数
である。
異体字個数を例えばnとすると、異体字1〜異体字nが
その次から格納される。
例えば、「剣」の異体字−覧を表示中は「剣」「創」 
「剣」 「創」 「劫」 「靭」が異体字リストに格納
される。
第6図は非標準文字エリアGAREAの構成を示した図
である。
CG中に格納されている文字パターンは、−船釣に使用
される文字、例えば、JIS X 020gコードで記
述される文字についてのみである。それ以外の標準でな
い文字、例えば、JIS X 0208コード外の文字
については、その一部の使用する文字だけをこの非標準
文字エリアGAREAに登録し、表示、印刷等の処理を
行なうことになる。
「登録数」はGAREAに登録されている文字の個数が
格納される。
「登録数」の次の部分から登録文字が「登録数」分だけ
固定長で格納される。
各登録文字iは文字コードと、必要なパターンが格納さ
れる。
GAREAは高速処理が可能な様にRAM上に配置され
る。
第7図は非標準文字ファイルGF I LEの構成を示
した図である。
GF I LEにはCG中に格納されていない文字の文
字パターンが網羅されて格納される。その内容は必要に
応じて読み込まれ、必要な文字のパターンのみがGAR
EA中に転送され登録される。
7−1はGF I LEの全体構成を示している。
「索引部」はGF I LEにアクセスするための索引
部であり、この内容を読むことによって、必要な文字の
文字パターンがどのレコードにあるかが分かる様になっ
ている。「索引部」に引き続(「レコード」には文字パ
ターンが連続して固定長で格納される。レコード内では
、連続する文字コードのパターンは連続して格納される
7−2は索引部の構成を示している。索引部には先頭か
ら文字コードが連続して昇順で格納される。先頭からi
番目の文字コードはレコードiの先頭文字コードを意味
している。従って、目指す文字コードが索引部中のどの
文字コードとどの文字コードの間にあるかを調べること
により、目指す文字コードが格納されているレコードの
番号が分かることになる。レコードの番号が分かればそ
のレコードをアクセスすることにより、目指す文字のパ
ターンを得ることができる。
上述の実施例の動作を第8図以下のフローチャに従って
説明する。
第8図はキー人力を取り込み、処理を行なう部分のフロ
ーチャートである。
ステップ8−1はキーボードからのデータを取り込む処
理である。ステップ8−2で取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。
異体字変換キーであったときはステップ8−3に分岐し
、ステップ8−3において第9図に詳述するように異体
字変換処理が行なわれる。
その他のキーのときはステップ8−4に分岐し、挿入、
削除等の通常の文字処理装置において行なわれるその他
の処理が行なわれる。
各キーの処理が終了すると、ステップ8−1に分岐する
第9図はステップ8−3の「異体字変換処理Jを詳細化
したフローチャートである。
ステップ9−1において、テキストバッファTBUFか
らカーソル上にある文字を取り込む。
ステップ9−2において、第10図に詳述する様に異体
字の候補−覧を表示する。最終的に異体次候補が決定す
ると次のステップに進む。
ステップ9−3において、決定された異体字候補がもし
、非標準文字であれば、非標準文字エリアGAREAに
登録する。
ステップ9−4において、決定された異体字候補をテキ
ストバッファTBUF上で元の文字と置換える処理を行
なう。
第10図はステップ9−2の「異体字−覧表示」を詳細
化したフローチャートである。
ステップ10−1において、指定された文字に従って異
体字辞書IDICをサーチする。
ステップ10−2において、サーチ結果に基づいて異体
字リストILISTを作成する。
ステップ10−3において、もし、異体字リストILI
ST上に非標準の文字、例えば、JIS X0208コ
ード外の文字が存在すれば、非標準文字ファイルGF 
I LEにアクセスし、必要な文字のパターンを取り出
す。
ステップ10−4において、異体字候補−覧を表示する
ためのウィンドウをオーブンする。
ステップ】0−5において、文字サイズを小文字に設定
する。
ステップ10−6において、異体字候補−覧の丈夫に表
示される候補番号を表示する。このときのも次サイズは
小文字であるので、候補番号は小文字で表示されること
になる。
ステップ10−7において、文字サイズを大文字に設定
する。これにより、これ以降の異体字候補は大文字で表
示されることになる。
ステップ10−8において、ループ変数1をOに初期設
定する。
ステップ10−9においてILISTに存在する異体字
を(i + 1’)番目から3文字分表示する。文字表
示を行なうとき、標準文字(CG内に存在する文字)で
あれば、文字コードを指定して表示することになる。非
標準文字(CG内に存在しない文字)のときはステップ
10−3で得られた文字パターンを指定して表示するこ
とになる。
このとき文字サイズが大文字になっているので、異体字
は大文字で表示されることになる。
ステップ10−10において、キーボードからのデータ
を取り込む。
ステップ10−11において、取り込まれたキーの種別
を判定し、各キーの処理ルーチンに分岐する。
次画面キーのときはステップ10−12に分岐し、iの
値に3を加算する。もし、3を加算したiの値がILI
STの異体字個数をオーバーするときは3の可算は行な
わない。その後、ステップ10−9に分岐する。
前画面キーのときはステップ10−13に分岐し、iの
値から3を減する。もし、3を減じたiの値がマイナス
になるときは3の減算は行なわない。その後、ステップ
10−9に分岐する。
数字キーのときは異体字候補の選択を意味し、ステップ
10−14に分岐する。
ステップ10−14において、異体字−覧ウイントウを
クローズする。
ステップ10−15において、ILISTの(打鍵され
た数字の値+i)番目の異体字を決定された異体字とし
て出力し、リターンする。
第11図は1文字表示が指示されたときに行なわれる処
理を示したフローチャートである。
ステップ11−1は文字表示の指示がコード指定で行な
われているか、パターン指定で行なわれているか、どち
らであるかを判定する。パターン指定のときはパターン
を求める処理が不要であるのでステップ11−8にスキ
ップする。コード指定のときはステップ11−2に進む
ステップ11−2において指示された文字がCG内にパ
ターンが存在する文字かどうか判定する。CG内に存在
するときはステップ11−3に分岐し、CG内に存在し
ないときはステップ11−4に分岐する。
ステップ11−3において、指示された文字のパターン
はCGに存在するので、CGよりバターンをGETL、
ステップ11−8に分岐する。
ステップ11−4において、指示された文字のパターン
が非標準文字エリアGAREAに存在するかどうかサー
チする。
ステップ11−5において、もし、GAREAに存在す
れば、ステップ11−6に分岐し、パターンを得る。存
在しなければステップ11−7に分岐し、表示のしよう
がないので、特定のパターンを設定する。処理が終れば
ステップ11−8に分岐する。
ステップ11−8において、ここまでの処理で文字パタ
ーンが決定しているので、文字サイズに合わせてパター
ンを拡大縮小し、実際に表示を行なう。
[他の実施例] 以上の説明において、選択された非標準の異体字は非標
準文字エリアに登録されるとして説明したが、外字を処
理するための外字バッファに登録する様に処理すること
もできる。
また、文字コードは各異体字にあらかじめ固有の値が割
り付けられている様に説明したが、異体字の登録の時点
で独自のコードを割り付けて登録する様処理しても本発
明の趣旨を損なうものではない。
また、表示されるものとしては異体字のみについて説明
しているが、使用するかどうかは各オペレータによって
決まるもので標準的′にサポートするわけにはいかない
文字の選択に本発明を応用することもできる。
[発明の効果] 以上の説明から明らかなように、本発明によれば、異体
字変換を行なって選択された異体字が標準的にサポート
(使用)されない文字であっても自動的にパターンが非
標準文字エリアに登録され、非標準文字エリアに登録さ
れた文字パターンはそれ以降標準的な文字と同様に使用
できるので、面倒な外字登録の手間がな(なり、操作性
の優れた快適な文字処理装置を実現することができる。
【図面の簡単な説明】
第1図は本発明の全体構成のブロック図、第2図は本発
明における異体字変換の変換例を示した図、 第3図は本発明における漢字仮名混り文を記憶するテキ
ストバッファTBUFの構成を示した図、 第4図は本発明における異体字辞書IDICの構成を示
した図、 第5図は本発明における異体字変換の途中で作成される
異体字リストILISTの構成を示した図、 第6図は本発明における標準でない文字のパターンをメ
モリ上に記憶する非標準文字エリアGAREAの構成を
示した図、 第7図は本発明における標準でない文字のパターンをデ
ィスク上に格納する非標準文字ファイルGF I LE
の構成を示した図、 第8図〜第11図は本発明に係る文字処理装置の動作を
示すフローチャートである。 DISK   ・・・外部記憶部  P U OM AM T” B  U  F LIST GA REA DIC GF  I  LE ・・・マイクロプロセッサ ・・・読出し専用メモリ ・・・ランダムアクセスメモリ ・・・テキストバッファ ・・・異体字リスト ・・・非標準文字エリア ・・・異体字辞書 ・・・非標準文字ファイル 第2図 ↓ 異体字変換キー ↓ 次画面 ↓ lJ テキストバッファの構成 2゜ 第6図 非標準文字エリアの構成 文字コード    文字パターン 第7図 1)非標準文字ファイルの構成 2)索引部の構成 第8図 第10図 第11図

Claims (1)

  1. 【特許請求の範囲】 1、漢字仮名混り文から構成された文書を記憶する文書
    記憶手段と、 漢字に対して変換すべき異体字を記憶した異体字変換辞
    書と、 前記文書上の漢字に対して異体字に変換することを指示
    する異体字変換指示手段と、 前記異体字変換指示手段により指示された漢字を前記異
    体字辞書を参照しつつ異体字候補に変換する異体字変換
    手段と、 前記異体字変換手段により出力された異体字候補を表示
    する異体字候補表示手段と、 前記異体字候補表示手段により表示された候補から自分
    の望む異体字候補を選択する異体字選択手段と、 標準的に使用されない文字の文字パターンを文字コード
    と対応づけて記憶した非標準文字記憶手段と、 前記異体字選択手段により選択された異体字候補の文字
    パターンを自動的に前記非標準文字記憶手段に登録する
    よう制御する制御手段とを具備することを特徴とする文
    字処理装置。
JP2156323A 1990-06-13 1990-06-13 文字処理装置 Pending JPH0447446A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2156323A JPH0447446A (ja) 1990-06-13 1990-06-13 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2156323A JPH0447446A (ja) 1990-06-13 1990-06-13 文字処理装置

Publications (1)

Publication Number Publication Date
JPH0447446A true JPH0447446A (ja) 1992-02-17

Family

ID=15625282

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2156323A Pending JPH0447446A (ja) 1990-06-13 1990-06-13 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0447446A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522330B2 (en) 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522330B2 (en) 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method

Similar Documents

Publication Publication Date Title
JPH0447446A (ja) 文字処理装置
JPH0447445A (ja) 文字処理装置
JPH0447447A (ja) 文字処理装置
JPS6010348B2 (ja) 半角・全角文字の自動変換方式
JPH0612548B2 (ja) 文書処理装置
JPS6246029B2 (ja)
JPH0447451A (ja) 文字処理装置
JPH0452500B2 (ja)
JPH0442350A (ja) 文字処理装置
JPH0452853A (ja) 文字処理装置
JPS5836368B2 (ja) 辞書登録機能をもつ漢字まじり文作成装置
JPH0628062B2 (ja) 文字処理装置及びその方法
JPS62119665A (ja) ワ−ドプロセツサ
JPH0452852A (ja) 文字処理装置
JPH0628061B2 (ja) 文字処理装置及びその方法
JPH0628060B2 (ja) 文字処理装置
JPH09231210A (ja) 文字処理装置および読み出し可能な記憶媒体
JPS61180360A (ja) 文書編集装置
JPH069043B2 (ja) 文字処理方法
JPS60110074A (ja) 文字処理装置
JPH02165271A (ja) 文字処理装置
JPH03116364A (ja) 文字処理装置
JPS62260266A (ja) カナ漢字変換方式
JPH04332073A (ja) 文字処理方法及びその装置
JPH0731679B2 (ja) 文字処理装置