JPH0447451A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0447451A
JPH0447451A JP2156322A JP15632290A JPH0447451A JP H0447451 A JPH0447451 A JP H0447451A JP 2156322 A JP2156322 A JP 2156322A JP 15632290 A JP15632290 A JP 15632290A JP H0447451 A JPH0447451 A JP H0447451A
Authority
JP
Japan
Prior art keywords
word
variant
character
dictionary
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2156322A
Other languages
English (en)
Inventor
Eiichiro Toshima
英一朗 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2156322A priority Critical patent/JPH0447451A/ja
Publication of JPH0447451A publication Critical patent/JPH0447451A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は漢字仮名混り文を入力、編集する文字処理装置
に関する。
[従来の技術] 現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。
仮名漢字変換は辞書を参照することにより、入力された
読み列を漢字に変換するものである。ところが、辞書を
記憶するメモリ容量の関係で、あらゆる単語が辞書に登
録されているとは限らない。この様に登録されない単語
の中には語當的に難解な単語と同様に、表記が一般的で
ない単語、例えば、異体字で表記される単語も含まれて
いる。
例えば、「検針」という人名はある程度−船釣な姓であ
るので仮名漢字変換用辞書に登録されているのが普通で
ある。しかし「松」を異体字に変えた「塁野」は珍しい
姓なので相当大容量の辞書でないと登録されない。
この様に、特に人名には異体字が使用される可能性が高
いが、ところが、異体字の人名を全て対応しようとして
も、組み合わせ数の問題でとても有限容量の辞書には登
録できない。
そこで、上記の問題を解決するために、異体字変換とい
う手法が提案されている。これは辞書上に標準的な字体
の単語(例えば「検針」)だけを登録しておき、異体字
の単語(例えば「否野」)は標準的な単語を異体字変換
することで入力しようというものである。
上記の手法によれば、例えば、「検針」の「松」のとこ
ろにカーソルを合わせ、「異体字変換」を指示すると、
「松」が「否」に変換される。
「崎」 「埼」 「碕」のように異体字の候補が複数個
あるときには異体字変換を複数回指示することになる。
例えば、「崎」を「碕」に変換するときは以下の様に操
作する。「崎」を異体字変換すると「埼」になる。これ
は望みの候補でないので、更に異体字変換すると「碕」
になり、ここで操作を終了する。
[発明が解決しようとしている課題] ところが、この様な異体字を使用した単語は稀にしか出
現しないが、ひとたび出現すると、その後、頻繁に出現
する可能性が高い。例えば、人名はその例である。「否
野」という人は滅多にいないが、もし、その人が近(に
いると、「杢野」という人名を何度も入力する羽目にな
る。
−度だけの入力に対しては、従来の異体字変換の方式で
十分であるが、何度も使用するためには、結局オペレー
タ側で、単語登録しなければならない。単語登録するた
めには、読みの指定、表記の指定、品詞の指定などの作
業があり、操作が面倒であるという欠点があった。
[課題を解決するための手段(及び作用)]本発明は、
入力された異体字に対して、その異体字で構成される単
語を生成し、自動的に仮名漢字変換用辞書に単語登録す
ることにより、オペレータが異体字を含む単語を容易に
取り扱えるようにしようというものである。
[実施例コ 以下図面を参照しながら本発明の詳細な説明する。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。
つぎにROMは、読出し専用の固定メモリであり、第8
図〜第12図につき後述するマイクロプロセッサCPU
による制御の手順、及び異体字変換用の辞書IDICを
記憶させておく。
また、RAMは、1ワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。TBUFはテキスト
バッファであり、入力編集中のテキストデータが記憶さ
れる。DOBUFは同音語バッファであり、テキストバ
ッファTBtJFに記憶される文字に同音語候補が存在
するときはその候補が記憶される。ILISTは異体字
リストであり、異体字変換中に必要な異体字候補を異体
字辞書IDICより抜きだして一時的に記憶する。
KBはキーボードであって、アルファベットキ、ひらか
なキー、カタカナキー等の文字記号入カキ−1及び、変
換キー、異体字変換キー、前画面キー、次画面キー等の
本文字処理装置に対する各種機能を指示するための各種
のファンクションキーを備えている。
DISKは文書データ等を記憶するための外部記憶部で
ある。テキストバッファTBUF上に作成された文書は
この外部記憶部に保管される。保管されたデータはキー
ボードの指示により、必要な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。
後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対応する表示装置CRT上の位置にカー
ソルを表示する。
DBUFは表示用バッファメモリで、表示すべきデータ
のパターンを蓄える。DBUFにドツトパターンを書き
込むことにより任意のパターンを表示することができる
。テキストの内容を表示するときはテキストバッファT
BUFの内容に応じて表示パターンがDBUFに作成さ
れることにより、表示されることになる。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドツト構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インクラブド信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶しである各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。
第2図は本発明の文字処理装置による異体字変換の変換
例を示した図である。
2−1は通常の文書編集画面を示した図である。文書中
には「石岡」 「6崎」 「剣持」 「剣持」「杏野」
 「検針」が入力されている。ここで、一番目の「剣持
」を「勧持」に変換したいのでカーソルは「剣」上にあ
る。
2−2は異体字変換キーを打鍵した状態の画面である。
「剣」の異体字候補の一覧がウィンドウ中に表示されて
いる。通常文字と異なり、異体字は大きく表示されてい
るので、細かな字体の違いが分かり、誤選択の可能性は
少ない。
−画面目には望む異体字候補が存在しなかったので次画
面キーを打鍵すると2−3の画面になり、次の異体字候
補−覧が表示される。
この画面で望む異体字「錆」があるので、それに対応す
る数字rlJを打鍵すると、「劃」が文書中の「剣」と
置き換わり、異体字−覧ウイントウは消える。
第3図はテキストバッファTBUFの構成を示した図で
ある。
テキストバッファは文字の羅列から構成され、各文字は
2バイトで構成される。各文字のMSBは同音語フラグ
であり、0は通常文字、1が同音語を意味する。残りの
15ビツトは通常文字のときは文字コードを表現し、同
音語のときは同音語番号と文字番号を表現する。仮名漢
字変換の変換結果は同音語でテキストバッファ上に格納
される。
文字コードは、JIS X 0208コードを使用する
同音語番号は第4図に示す同音語バッファDOBUF上
のどの同音語であるかを示す番号である。文字番号はそ
の同音語の表記のうち、先頭から何番目の文字を表現す
るかを示す。例えば、「機械」の「機」に対しては1、
「械」に対しては2が格納される。この様に、一つの同
音語が複数文字からなる場合、テキストバッファ上に同
音語番号と文字番号の対が複数個並ぶことになる。
第4図は同音語バッファDOBUFの構成を示した図で
ある。各同音語には同音語番号が付いており、それによ
って識別される。
各同音語は「読み」 「候補総数J 「現候補番号」 
「第i候補情報」からなる。
「読み」はその同音語の読みを格納する。
「候補総数」はその同音に含まれる候補の総数を格納す
る。
「現候補番号」はその同音語の現在表示されている候補
番号が格納される。変換直後に第1候補が表示されるか
ら「1」が格納される。
「第i候補情報」は各候補の「表記」 「単語アドレス
」が格納される。
「表記」にはその候補の表記が格納される。
「単語アドレス」には、その単語の存在する辞書上のア
ドレスを格納する。
この様に各同音語に辞書上の単語情報へのポインタを持
っているので、ある同音語を構成する単語の読み、表記
、品詞を容易に求めることができる。。
第5図は異体字辞書IDICの構成を示した図である。
漢字コードと異体字番号が対応づけて格納される。異体
字番号はその異体字がどのグループに属するかを示して
いる。例えば、「剣J  Ra1lJ  reJ  r
flJ  #JJJ  rEJは同じ異体字のグループ
に属するので、同じ異体字番号rloOJが付けられて
いる。「島」 「嶋」 「嶌」も同じ異体¥のグループ
に属するので同じ異体字番号rloIJが付けられてい
る。
第6図は異体字リストILISTの構成を示した図であ
る。
異体字リストは異体字変換を行なうときに異体字辞書I
DICより必要な異体字を抜き出して作成したテーブル
であり、このテーブルに基づいて異体字の候補−覧表示
、選択操作を処理する。
異体字個数はこのリストに格納されている異体字の個数
である。
異体字個数を例えばnとすると、異体字1〜異体字nが
その次から格納される。
例えば、「剣」の異体字−覧を表示中は「剣」「創」 
「剣」 「劾」 「劫」 「靭」が異体字リストに格納
される。
第7図は辞書DICの構成を示した図である。
「読み」 「表記」 「品詞」のフィールドから構成さ
れる。
「読み」には単語の読み、「表記」には単語の表記、「
品詞」には単語の品詞が格納される。
各単語は読みの昇順にソートされている。すなわち、い
わゆる辞書式配列で単語が整列されている。
上述の実施例の動作を第8図以下のフローチャートに従
って説明する。
第8図はキー人力を取り込み、処理を行なう部分のフロ
ーチャートである。
ステップ8−1はキーボードからのデータを取り込む処
理である。ステップ8−2で取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。
変換キーであったときはステップ8−3に分岐し、ステ
ップ8−3において第9図に詳述する様に仮名漢字変換
処理が行なわれる。
異体字変換キーであったときはステップ8−4に分岐し
、ステップ8−4において第10図に詳述するように異
体字変換処理が行なわれる。
その他のキーのときはステップ8−5に分岐し、挿入、
削除等の通常の文字処理装置において行なわれるその他
の処理が行なわれる。
各キーの処理が終了すると、ステップ8−1に分岐する
第9図はステップ8−3の「仮名漢字変換処理」を詳細
化したフローチャートである。
ステップ9−1において、単語辞書のサーチを行なう。
ステップ9−2において、形態素解析を行なう。
ステップ9−3において、構文解析を行なう。
ステップ9−4において、妥当な解析結果のうちから第
1候補を決定する。
ステップ9−5において、決定された第1候補に基づい
て同音語バッファを作成し、変換結果をテキストバッフ
ァに出力する。
第1O図はステップ8−4の「異体字変換処理」を詳細
化したフローチャートである。
ステップ10−1において、テキストバッファTBUF
からカーソル上にある文字を取り込む。
運営は仮名漢字変換によって入力された文字であるので
、同音語である。具体的な文字コードは同音語バッファ
を参照することにより取り出す。
ステップ10−2において、第11図に詳述する様に異
体字の候補−覧を表示する。最終的に異体次候補が決定
すると次のステップに進む。
ステップ10−3において、第12図に詳述する様に、
決定された異体字候補を含む単語を単語辞書DICに登
録する単語登録処理を行なう。
ステップ10−4において、決定された異体字候補をテ
キストバッファTBUF上で元の文字と置換える処理を
行なう。
第11図はステップ10−2の「異体字−覧表示」を詳
細化したフローチャートである。
ステップ11−1において、指定された文字に従って異
体字辞書IDICをサーチする。
ステップ11−2において、サーチ結果に基づいて異体
字リストILISTを作成する。
ステップ11−3において、異体字候補−覧を表示する
ためのウィンドウをオーブンする。
ステップ11−4において、文字サイズを小文字に設定
する。
ステップ11−5において、異体字候補−覧の上部に表
示される候補番号を表示する。このときのも次サイズは
小文字であるので、候補番号は小文字で表示されること
になる。
ステップ11−6において、文字サイズを大文字に設定
する。これにより、これ以降の異体字候補は大文字で表
示されることになる。
ステップ11−7において、ループ変数iを0に初期設
定する。
ステップ11−8においてILISTに存在する異体字
を(i+1)番目から3文字分表示する。このとき文字
サイズが大文字になっているので、異体字は大文字で表
示されることになる。
ステップ11−9において、キーボードからのデータを
取り込む。
ステップ11−10において、取り込まれたキーの種別
を判定し、各キーの処理ルーチンに分岐する。
次画面キーのときはステップ11−11に分岐し、1の
値に3を加算する。もし、3を加算したlの値がILI
STの異体字個数をオーバーするときは3の可算は行な
わない。その後、ステップ11−8に分岐する。
前画面キーのときはステップ11−12に分岐し、iの
値から3を減する。もし、3を減じた1の値がマイナス
になるときは3の減算は行なわない。その後、ステップ
11−8に分岐する。
数字キーのときは異体字候補の選択を意味し、ステップ
11−13に分岐する。
ステップ11−13において、異体字−覧ウイントウを
クローズする。
ステップ11−14において、ILISTの(打鍵され
た数字の値+i)番目の異体字を決定された異体字とし
て出力し、リターンする。
第12図はステップ1O−3の「単語登録処理」を詳細
化したフローチャートである。
ステップ12−1において、異体字変換される前の漢字
を構成する単語を同音語バッファを参照することにより
調べ、異体字変換後の単語の読み、表記、品詞を求める
。これを新単語として登録することになる。
ステップ12−2において、登録すべき単語の読みで単
語辞書DICをサーチし、新単語を登録すべき位置を求
める。
ステップ12−3において、サーチされた位置に新単語
のための空きエリアを確保するため、新単語の容量分だ
け辞書のデータを後方にシフトする。
ステップ12−4において、確保された空きエノアに実
際に新単語を登録する。
[他の実施例] 以上の説明において、仮名漢字変換用辞書はRAM上に
存在する書き換え可能な辞書であるとし、登録単語もそ
こに登録されるとしたが、標準辞書と登録単語辞書が分
離されており、標準辞書は書き換え不可能なROM上に
あり、登録単語辞書のみRAM上にあり、仮名漢字変換
字には両方の辞書をサーチすることで変換するという様
に構成することもできる。
[発明の効果] 以上の説明から明らかなように、本発明によれば、入力
された異体字を含む単語が自動的に仮名漢字変換用辞書
に登録されるので、2回目からは単に仮名漢字変換する
だけで目的の異体字を含む単語を入力できるので、異体
字の入力が便利な、操作性の高い、快適な文字処理装置
を実現することができる。
【図面の簡単な説明】
第1図は本発明に係る文字処理装置の全体構成のブロッ
ク図、 第2図は本発明における異体字変換の変換例を示した図
、 第3図は本発明における漢字仮名混り文を記憶するテキ
ストバッファTBUFの構成を示した図、 第4図は本発明における同音語バッファDOBUFの構
成を示した図、 第5図は本発明における異体字辞書IDICの構成を示
した図、 第6図は本発明における異体字変換の途中で作成される
異体字リストILISTの構成を示した図、 第7図は本発明における単語辞書DICの構成を示した
図、 第8図〜第12図は本発明文字処理装置の動作を示すフ
ローチャートである。 DISK   ・・・外部記憶部 CPU    ・・・マイクロプロセッサROM   
 ・・・読出し専用メモリRAM    ・・・ランダ
ムアクセスメモリTBUF   ・・・テキストバッフ
ァDOBUF  ・・・同音語バッファ ILIST  ・・・異体字リスト IDIC・・・異体字辞書 第2図 ↓ 異体字変換キー ↓ 次画面 ↓ 「1」 テキストバッファの構成 0:通常文字 1:同音語 第4図 第8図 第11図

Claims (1)

  1. 【特許請求の範囲】 1、単語の読みを入力する入力手段と、 単語の読みと漢字を対応づけて記憶した単語辞書と、 前記単語辞書を参照しつつ入力された読みを漢字に変換
    するための仮名漢字変換手段と、漢字仮名混り文から構
    成された文書を記憶する文書記憶手段と、 漢字に対して変換すべき異体字を記憶した異体字変換辞
    書と、 前記文書上の漢字に対して異体字に変換することを指示
    する異体字変換指示手段と、 前記異体字変換指示手段により指示された漢字を前記異
    体字辞書を参照しつつ異体字候補に変換する異体字変換
    手段と、 前記異体字変換手段により出力された異体字候補を表示
    する異体字候補表示手段と、 前記異体字候補表示手段により表示された候補から自分
    の望む異体字候補を選択する異体字選択手段と、 前記異体字選択手段により選択された異体字を含む単語
    を自動的に前記単語辞書に登録するよう制御する制御手
    段とを具備することを特徴とする文字処理装置。
JP2156322A 1990-06-13 1990-06-13 文字処理装置 Pending JPH0447451A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2156322A JPH0447451A (ja) 1990-06-13 1990-06-13 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2156322A JPH0447451A (ja) 1990-06-13 1990-06-13 文字処理装置

Publications (1)

Publication Number Publication Date
JPH0447451A true JPH0447451A (ja) 1992-02-17

Family

ID=15625263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2156322A Pending JPH0447451A (ja) 1990-06-13 1990-06-13 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0447451A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522330B2 (en) 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6522330B2 (en) 1997-02-17 2003-02-18 Justsystem Corporation Character processing system and method

Similar Documents

Publication Publication Date Title
JPH0447451A (ja) 文字処理装置
JP4115568B2 (ja) 文章入力装置
JPS6057422A (ja) 文書目次索引作成装置
JPS59100941A (ja) 仮名漢字変換装置
JP2819612B2 (ja) 文字変換装置
JPH0447445A (ja) 文字処理装置
JPH0447446A (ja) 文字処理装置
JPH0447447A (ja) 文字処理装置
JPH03116363A (ja) 文字処理装置
JPH0447442A (ja) 文字処理装置及びその方法
JPS6068421A (ja) 日本語文章入力方式
JPS63298564A (ja) 日本語文書作成装置
JPH0628062B2 (ja) 文字処理装置及びその方法
JPH0452853A (ja) 文字処理装置
JPS62119665A (ja) ワ−ドプロセツサ
JPH09231210A (ja) 文字処理装置および読み出し可能な記憶媒体
JPH03116368A (ja) 文字処理装置
JPH03116364A (ja) 文字処理装置
JPH03116369A (ja) 文字処理装置
JPH0488552A (ja) 文字処理装置
JPS61180360A (ja) 文書編集装置
JPH03116362A (ja) 文字処理装置
JPH03167660A (ja) 文字処理装置及びその方法
JPH03286249A (ja) 文字処理装置
JPH04133167A (ja) かな漢字変換装置