JPH0447446A

JPH0447446A - 文字処理装置

Info

Publication number: JPH0447446A
Application number: JP2156323A
Authority: JP
Inventors: Eiichiro Toshima; 英一朗戸島
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1990-06-13
Filing date: 1990-06-13
Publication date: 1992-02-17

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は漢字仮名混り文を入力、編集する文字処理装置
に関する。

［従来の技術］現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。

仮名漢字変換は辞書を参照することにより、入力された
読み列を漢字に変換するものである。ところが、辞書を
記憶するメモリ容量の関係で、あらゆる単語が辞書に一
登録されているとは限らない。この様に登録されない単
語の中には語量的に難解な単語と同様に、表記が一般的
でない単語、例えば、異体字で表記される単語も含まれ
ている。

例えば、「検針」という人名はある程度−船釣な姓であ
るので仮名漢字変換用辞書に登録されているのが普通で
ある。しかし「松」を異体字に変えた「套野」は珍しい
姓なので相当大容量の辞書でないと登録されない。

この様に、特に人名には異体字が使用される可能性が高
いが、ところが、異体字の人名を全て対応しようとして
も、組み合わせ数の問題でとても有限容量の辞書には登
録できない。

そこで、上記の問題を解決するために、異体字変換とい
う手法が提案されている。これは辞書上に標準的な字体
の単語（例えば「検針」）だけを登録しておき、異体字
の単語（例えば「否野」）は標準的な単語を異体字変換
することで入力しようというものである。

上記の手法によれば、例えば、「検針」の「松」のとこ
ろにカーソルを合わせ、「異体字変換」を指示すると、
「松」が「否」に変換される。

「崎」　「埼」　「碕」のように異体字の候補が複数個
あるときには異体字変換を複数回指示することになる。

例えば、「崎」を「碕」に変換するときは以下の様に操
作する。「崎」を異体字変換すると「埼」になる。これ
は望みの候補でないので、更に異体字変換すると「碕」
になり、ここで操作を終了する。

以上の説明は全てＪＩＳ　Ｘ　０２０ｇコード内での異
体字の処理の説明であるが、異体字の中にはＪＩＳ　Ｘ
０２０８コード内に存在しない文字もある。この様なＪ
ＩＳ　Ｘ　０２０８コードにない異体字はシステムとし
てサポートされないので、オペレータ側で外字を作成す
る必要がある。

［発明が解決しようとしている課題］ところが、この様なＪＩＳ　Ｘ　０２０ｇコードにない
異体字を入力するためには、その異体字のパターンをデ
ザインし、外字コードを割り付け、外字として登録する
、などの厄介な作業を行なわなければならず、取り扱い
が面倒であるという欠点があった。

［課題を解決するための手段（及び作用）］本発明は、
標準的にはサポート（使用）されない異体字も候補とし
て表示し、もし、非標準の異体字を選択したときは、そ
の異体字の持つユニクなコードとともにパターンが非標
準文字エリアに登録され、非標準文字エリアにある文字
パターンがあたかも標準的にサポートされる文字である
かの様に処理する機構を持つことにより、オペレータが
非標準の異体字を容易に取り扱えるようにしようという
ものである。

［実施例］以下図面を参照しながら本発明の詳細な説明する。

第１図は本発明の全体構成の一例である。

図示の構成において、ＣＰＵは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスＡＢ、コントロールバスＣＢ、データバスＤ
Ｂを介して、それらのバスに接続された各構成要素を制
御する。

アドレスバスＡＢはマイクロプロセッサＣＰＵの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスＣＢ　ｌｘマイクロプロセッサＣＰ
Ｕの制御の対象とする各構成要素のコントロール信号を
転送して印加する。データバスＤＢは各構成機器相互間
のデータの転送を行なう。

つぎにＲＯＭは、読出し専用の固定メモリであり、第８
図〜第１１図につき後述するマイクロプロセッサＣＰＵ
による制御の手順、及び異体字変換用の辞書ＩＤＩＣを
記憶させておく。

また、ＲＡＭは、１ワード１６ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。ＴＢＵＦはテキスト
バッファであり、入力編集中のテキストデータが記憶さ
れる。ＩＬＩＳＴは異体字リストであり、異体字変換中
に必要な異体字候補を異体字辞書ＩＤＩＣより抜きだし
て一時的に記憶する。ＧＡＲＥＡは非標準文字エリアで
あり、ＣＧに存在しない非標準の文字のパターンを文字
コードと対応づけて記憶する。

ＫＢはキーボードであって、アルファベットキ、ひらか
なキー、カタカナキー等の文字記号入カキ−５及び、異
体字変換キー、前画面キー、次画面キー等の本文字処理
装置に対する各種機能庖指示するための各種のファンク
ションキーを備えている。

ＤＩＳＫは文書データ、非標準文字ファイルＧＦＩＬＥ
等を記憶するための外部記憶部である。

テキストバッファＴＢＵＦ上に作成された文書はこの外
部記憶部に保管される。保管されたデータはキーボード
の指示により、必要な時呼び出される。また、非標準文
字ファイルＧＦ　Ｉ　ＬＥが格納されている。ＣＧに存
在しない非標準の文字が文書中に出現したときはＧＦ　
Ｉ　ＬＥより文字パターンを読込み処理することになる
。

ＣＲはカーソルレジスタである。ＣＰＵにより、カーソ
ルレジスタの内容を読み書きできる。

後述するＣＲＴコントローラＣＲＴＣは、ここに蓄えら
れたアドレスに対応する表示装置ＣＲＴ上の位置にカー
ソルを表示する。

ＤＥＬＩＦは表示用バッファメモリで、表示すべきデー
タのパターンを蓄える。ＤＢＵＦにドツトパターンを書
き込むことにより任意のパターンを表示することができ
る。テキストの内容を表示するときはテキストバッファ
ＴＢＵＦの内容に応じて表示パターンがＤＢＵＰに作成
されることにより、表示されることになる。

ＣＲＴＣはカーソルレジスタＣＲ及びバッファＤＢＵＦ
に蓄えられた内容を表示器ＣＲＴに表示する役割を担う
。

またＣＲＴは陰極線管等を用いた表示装置であり、その
表示装置ＣＲＴにおけるドツト構成の表示パターンおよ
びカーソルの表示をＣＲＴコントローラで制御する。

さらに、ＣＧはキャラクタジェネレータであって、表示
装置ＣＲＴに表示する文字、記号のパターンを記憶する
ものである。通常は書込不可能であり、標準的な文字、
例えばＪＩＳ　Ｘ　０２０８コ・−ドの第１水準、第２
水準文字のパターンのみを記憶する。ＪＩＳ　Ｘ　０２
０８コードの第１水準、第２水準以外の文字については
非標準文字ファイル中にパターンが格納されている。

かかる各構成要素からなる本発明文字処理装置において
は、キーボードＫＢからの各種の入力に応じて作動する
ものであって、キーボードＫＢからの人力が供給される
と、まず、インクラブド信号がマイクロプロセッサＣＰ
Ｕに送られ、そのマイクロプロセッサＣＰＵがＲＯＭ内
に記憶しである各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。

第２図は本発明装置による異体字変換の変換例を示した
図である。

２−１は通常の文書編集画面を示した図である。文書中
には「６碕」　「６崎」　「剣持」　「剣持」「否野」
　「検針」が入力されている。ここで、一番目の「剣持
」を「剣持」に変換したいのでカーソルは「剣」上にあ
る。

２−２は異体字変換キーを打鍵した状態の画面である。

「剣」の異体字候補の一覧がウィンドウ中に表示されて
いる。通常文字と異なり、異体字は大きく表示されてい
るので、細かな字体の違いが分かり、誤選択の可能性は
少ない。

−画面目には望む異体字候補が存在しなかったので次画
面キーを打鍵すると２−３の画面になり、次の異体字候
補−覧が表示される。

この画面で望む異体字「砺」があるので、それに対応゛
する数字「１」を打鍵すると、「勧」が文書中の「剣」
と置き換わり、異体字−覧ウイントウは消える。

第３図はテキストバッファＴＢＵＦの構成を示した図で
ある。

テキストバッファは文字の羅列から構成され、各文字は
２バイトで構成される。文字コードは、ＪＩＳ　Ｘ　０
２０８コードに準拠したコードを使用する。

、ＪＩＳ　Ｘ　０２０８コード第１水準、ＪＩＳ　Ｘ　
０２０８コード第２水準に含まれない文字の文字コード
はＪＩＳ　Ｘ　０２０８コードの空きを利用する。例λ
ば、１６ビツトのコードのＭＳＢを１にし、ＪＩＳ　Ｘ
　０２０８コードと重ならない様に決める。

第４図は異体字辞書ＩＤＩＣの構成を示した図である。

漢字コードと異体字番号が対応づけて格納される。異体
字番号はその異体字がどのグループに属するかを示して
いる。例えば、「剣」　「創」［＠Ｊ　　ｒｆｌＪ　　
ｒａＪ　　ｒｉＪは同じ異体字のグループに属するので
、同じ異体字番号ｒｌｏＯＪが付けられている。「島」
　「嶋」　「嶌」も同じ異体字のグループに属するので
同じ異体字番号ｒｌ　ＯＩＪが付けられている。

第５図は異体字リストＩＬＩＳＴの構成を示した図で°
ある。

異体字リストは異体字変換を行なうときに異体字辞書Ｉ
ＤＩＣより必要な異体字を抜き出して作成したテーブル
であり、このテーブルに基づいて異体字の候補−覧表示
、選択操作を処理する。

異体字個数はこのリストに格納されている異体字の個数
である。

異体字個数を例えばｎとすると、異体字１〜異体字ｎが
その次から格納される。

例えば、「剣」の異体字−覧を表示中は「剣」「創」　
「剣」　「創」　「劫」　「靭」が異体字リストに格納
される。

第６図は非標準文字エリアＧＡＲＥＡの構成を示した図
である。

ＣＧ中に格納されている文字パターンは、−船釣に使用
される文字、例えば、ＪＩＳ　Ｘ　０２０ｇコードで記
述される文字についてのみである。それ以外の標準でな
い文字、例えば、ＪＩＳ　Ｘ　０２０８コード外の文字
については、その一部の使用する文字だけをこの非標準
文字エリアＧＡＲＥＡに登録し、表示、印刷等の処理を
行なうことになる。

「登録数」はＧＡＲＥＡに登録されている文字の個数が
格納される。

「登録数」の次の部分から登録文字が「登録数」分だけ
固定長で格納される。

各登録文字ｉは文字コードと、必要なパターンが格納さ
れる。

ＧＡＲＥＡは高速処理が可能な様にＲＡＭ上に配置され
る。

第７図は非標準文字ファイルＧＦ　Ｉ　ＬＥの構成を示
した図である。

ＧＦ　Ｉ　ＬＥにはＣＧ中に格納されていない文字の文
字パターンが網羅されて格納される。その内容は必要に
応じて読み込まれ、必要な文字のパターンのみがＧＡＲ
ＥＡ中に転送され登録される。

７−１はＧＦ　Ｉ　ＬＥの全体構成を示している。

「索引部」はＧＦ　Ｉ　ＬＥにアクセスするための索引
部であり、この内容を読むことによって、必要な文字の
文字パターンがどのレコードにあるかが分かる様になっ
ている。「索引部」に引き続（「レコード」には文字パ
ターンが連続して固定長で格納される。レコード内では
、連続する文字コードのパターンは連続して格納される
。

７−２は索引部の構成を示している。索引部には先頭か
ら文字コードが連続して昇順で格納される。先頭からｉ
番目の文字コードはレコードｉの先頭文字コードを意味
している。従って、目指す文字コードが索引部中のどの
文字コードとどの文字コードの間にあるかを調べること
により、目指す文字コードが格納されているレコードの
番号が分かることになる。レコードの番号が分かればそ
のレコードをアクセスすることにより、目指す文字のパ
ターンを得ることができる。

上述の実施例の動作を第８図以下のフローチャに従って
説明する。

第８図はキー人力を取り込み、処理を行なう部分のフロ
ーチャートである。

ステップ８−１はキーボードからのデータを取り込む処
理である。ステップ８−２で取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。

異体字変換キーであったときはステップ８−３に分岐し
、ステップ８−３において第９図に詳述するように異体
字変換処理が行なわれる。

その他のキーのときはステップ８−４に分岐し、挿入、
削除等の通常の文字処理装置において行なわれるその他
の処理が行なわれる。

各キーの処理が終了すると、ステップ８−１に分岐する
。

第９図はステップ８−３の「異体字変換処理Ｊを詳細化
したフローチャートである。

ステップ９−１において、テキストバッファＴＢＵＦか
らカーソル上にある文字を取り込む。

ステップ９−２において、第１０図に詳述する様に異体
字の候補−覧を表示する。最終的に異体次候補が決定す
ると次のステップに進む。

ステップ９−３において、決定された異体字候補がもし
、非標準文字であれば、非標準文字エリアＧＡＲＥＡに
登録する。

ステップ９−４において、決定された異体字候補をテキ
ストバッファＴＢＵＦ上で元の文字と置換える処理を行
なう。

第１０図はステップ９−２の「異体字−覧表示」を詳細
化したフローチャートである。

ステップ１０−１において、指定された文字に従って異
体字辞書ＩＤＩＣをサーチする。

ステップ１０−２において、サーチ結果に基づいて異体
字リストＩＬＩＳＴを作成する。

ステップ１０−３において、もし、異体字リストＩＬＩ
ＳＴ上に非標準の文字、例えば、ＪＩＳ　Ｘ０２０８コ
ード外の文字が存在すれば、非標準文字ファイルＧＦ　
Ｉ　ＬＥにアクセスし、必要な文字のパターンを取り出
す。

ステップ１０−４において、異体字候補−覧を表示する
ためのウィンドウをオーブンする。

ステップ】０−５において、文字サイズを小文字に設定
する。

ステップ１０−６において、異体字候補−覧の丈夫に表
示される候補番号を表示する。このときのも次サイズは
小文字であるので、候補番号は小文字で表示されること
になる。

ステップ１０−７において、文字サイズを大文字に設定
する。これにより、これ以降の異体字候補は大文字で表
示されることになる。

ステップ１０−８において、ループ変数１をＯに初期設
定する。

ステップ１０−９においてＩＬＩＳＴに存在する異体字
を（ｉ　＋　１’）番目から３文字分表示する。文字表
示を行なうとき、標準文字（ＣＧ内に存在する文字）で
あれば、文字コードを指定して表示することになる。非
標準文字（ＣＧ内に存在しない文字）のときはステップ
１０−３で得られた文字パターンを指定して表示するこ
とになる。

このとき文字サイズが大文字になっているので、異体字
は大文字で表示されることになる。

ステップ１０−１０において、キーボードからのデータ
を取り込む。

ステップ１０−１１において、取り込まれたキーの種別
を判定し、各キーの処理ルーチンに分岐する。

次画面キーのときはステップ１０−１２に分岐し、ｉの
値に３を加算する。もし、３を加算したｉの値がＩＬＩ
ＳＴの異体字個数をオーバーするときは３の可算は行な
わない。その後、ステップ１０−９に分岐する。

前画面キーのときはステップ１０−１３に分岐し、ｉの
値から３を減する。もし、３を減じたｉの値がマイナス
になるときは３の減算は行なわない。その後、ステップ
１０−９に分岐する。

数字キーのときは異体字候補の選択を意味し、ステップ
１０−１４に分岐する。

ステップ１０−１４において、異体字−覧ウイントウを
クローズする。

ステップ１０−１５において、ＩＬＩＳＴの（打鍵され
た数字の値＋ｉ）番目の異体字を決定された異体字とし
て出力し、リターンする。

第１１図は１文字表示が指示されたときに行なわれる処
理を示したフローチャートである。

ステップ１１−１は文字表示の指示がコード指定で行な
われているか、パターン指定で行なわれているか、どち
らであるかを判定する。パターン指定のときはパターン
を求める処理が不要であるのでステップ１１−８にスキ
ップする。コード指定のときはステップ１１−２に進む
。

ステップ１１−２において指示された文字がＣＧ内にパ
ターンが存在する文字かどうか判定する。ＣＧ内に存在
するときはステップ１１−３に分岐し、ＣＧ内に存在し
ないときはステップ１１−４に分岐する。

ステップ１１−３において、指示された文字のパターン
はＣＧに存在するので、ＣＧよりバターンをＧＥＴＬ、
ステップ１１−８に分岐する。

ステップ１１−４において、指示された文字のパターン
が非標準文字エリアＧＡＲＥＡに存在するかどうかサー
チする。

ステップ１１−５において、もし、ＧＡＲＥＡに存在す
れば、ステップ１１−６に分岐し、パターンを得る。存
在しなければステップ１１−７に分岐し、表示のしよう
がないので、特定のパターンを設定する。処理が終れば
ステップ１１−８に分岐する。

ステップ１１−８において、ここまでの処理で文字パタ
ーンが決定しているので、文字サイズに合わせてパター
ンを拡大縮小し、実際に表示を行なう。

［他の実施例］以上の説明において、選択された非標準の異体字は非標
準文字エリアに登録されるとして説明したが、外字を処
理するための外字バッファに登録する様に処理すること
もできる。

また、文字コードは各異体字にあらかじめ固有の値が割
り付けられている様に説明したが、異体字の登録の時点
で独自のコードを割り付けて登録する様処理しても本発
明の趣旨を損なうものではない。

また、表示されるものとしては異体字のみについて説明
しているが、使用するかどうかは各オペレータによって
決まるもので標準的′にサポートするわけにはいかない
文字の選択に本発明を応用することもできる。

［発明の効果］以上の説明から明らかなように、本発明によれば、異体
字変換を行なって選択された異体字が標準的にサポート
（使用）されない文字であっても自動的にパターンが非
標準文字エリアに登録され、非標準文字エリアに登録さ
れた文字パターンはそれ以降標準的な文字と同様に使用
できるので、面倒な外字登録の手間がな（なり、操作性
の優れた快適な文字処理装置を実現することができる。

【図面の簡単な説明】

第１図は本発明の全体構成のブロック図、第２図は本発
明における異体字変換の変換例を示した図、第３図は本発明における漢字仮名混り文を記憶するテキ
ストバッファＴＢＵＦの構成を示した図、第４図は本発明における異体字辞書ＩＤＩＣの構成を示
した図、第５図は本発明における異体字変換の途中で作成される
異体字リストＩＬＩＳＴの構成を示した図、第６図は本発明における標準でない文字のパターンをメ
モリ上に記憶する非標準文字エリアＧＡＲＥＡの構成を
示した図、第７図は本発明における標準でない文字のパターンをデ
ィスク上に格納する非標準文字ファイルＧＦ　Ｉ　ＬＥ
の構成を示した図、第８図〜第１１図は本発明に係る文字処理装置の動作を
示すフローチャートである。ＤＩＳＫ　　　・・・外部記憶部　Ｐ　ＵＯＭＡＭＴ”　Ｂ　　Ｕ　　ＦＬＩＳＴＧＡ　ＲＥＡＤＩＣＧＦ　　Ｉ　　ＬＥ・・・マイクロプロセッサ・・・読出し専用メモリ・・・ランダムアクセスメモリ・・・テキストバッファ・・・異体字リスト・・・非標準文字エリア・・・異体字辞書・・・非標準文字ファイル第２図 ↓ 異体字変換キー ↓ 次画面 ↓ ｌＪテキストバッファの構成２゜第６図非標準文字エリアの構成文字コード　　　　文字パターン第７図１）非標準文字ファイルの構成２）索引部の構成第８図第１０図第１１図

Claims

【特許請求の範囲】１、漢字仮名混り文から構成された文書を記憶する文書
記憶手段と、漢字に対して変換すべき異体字を記憶した異体字変換辞
書と、前記文書上の漢字に対して異体字に変換することを指示
する異体字変換指示手段と、前記異体字変換指示手段により指示された漢字を前記異
体字辞書を参照しつつ異体字候補に変換する異体字変換
手段と、前記異体字変換手段により出力された異体字候補を表示
する異体字候補表示手段と、前記異体字候補表示手段により表示された候補から自分
の望む異体字候補を選択する異体字選択手段と、標準的に使用されない文字の文字パターンを文字コード
と対応づけて記憶した非標準文字記憶手段と、前記異体字選択手段により選択された異体字候補の文字
パターンを自動的に前記非標準文字記憶手段に登録する
よう制御する制御手段とを具備することを特徴とする文
字処理装置。