JPH0628056B2 - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH0628056B2
JPH0628056B2 JP1012501A JP1250189A JPH0628056B2 JP H0628056 B2 JPH0628056 B2 JP H0628056B2 JP 1012501 A JP1012501 A JP 1012501A JP 1250189 A JP1250189 A JP 1250189A JP H0628056 B2 JPH0628056 B2 JP H0628056B2
Authority
JP
Japan
Prior art keywords
kana
candidate
stored
homophone
misuse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1012501A
Other languages
English (en)
Other versions
JPH02250144A (ja
Inventor
駿平 竹中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1012501A priority Critical patent/JPH0628056B2/ja
Publication of JPH02250144A publication Critical patent/JPH02250144A/ja
Publication of JPH0628056B2 publication Critical patent/JPH0628056B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は日本語を処理する文字処理装置に関し、特に仮
名漢字変換処理において、正しい文章を作成する文字処
理装置に関するものである。
[従来技術の説明とその課題] 従来、日本語の文章を入力する際に、用例を用いて仮名
漢字変換を行う文字処理装置があった。この種の文字処
理装置では、文章を構成する文節において、隣接する文
節間のペアの用例を持った用例辞書を持ち、仮名漢字変
換処理において隣接する文節の各候補の中に用例辞書中
にある候補の組合せがあるか否かを調べ、存在する場合
はそれを第1番目に出力するようにしたものである。
[発明が解決しようとしている課題] しかしながら、上記従来の用例辞書を有する文字処理装
置において、実際に用いられている用例の組合せは極め
て多く、それらの用例を全て予め用例辞書に記憶してお
くことは非常に不経済である。また、用例のうちの使用
頻度は高いもののみを用例辞書に記憶しているように構
成した文字処理装置もあるが、文章の分野によっても用
例の傾向は違うし、時代とともに用例の変化もあること
が知られており、用例辞書に誤用例があっても対処でき
ないという問題が生じていた。
[課題を解決するための手段及び作用] 上記課題を解決するために、本発明の文字処理装置は、
仮名文字列を入力するための入力手段と、該入力手段よ
り入力された仮名文字列を記憶する記憶手段と、該記憶
手段に記憶された仮名文字列を文節ごとに分割する分割
手段と、該分割手段により分割された各文節の仮名文字
列を、漢字混じり表記による文節候補群に変換する変換
手段と、誤って用いられ易い、誤用となる隣接文節の組
の自立語同士が関連づけられて、予め誤用例として記憶
された誤用例辞書手段と、前記各文節について、前記文
節候補群より一つの文節候補を表示する候補表示手段
と、該候補表示手段による表示の際に、隣接する文節の
文節候補の組で、自立語同士が前記誤用例記憶手段に記
憶された誤用例に該当する組があれば、該組をなす文節
候補を、他の文節の文節候補と識別して表示するよう
に、前記候補表示手段を制御する表示制御手段とを具え
る。
[実施例] 以下図面を参照しながら本発明の実施例に係る文字処理
装置について説明する。
第1図は、実施例に係る文字処理装置のブロック図であ
る。
1は装置全体の制御を行うマイクロプロセッサから成る
CPUであり、後述する用例学習処理を行う。2はキー
ボード3の制御を行うキーボードコントローラKBCで
あり、3は文字キー、機能キー等のキー群から成るキー
ボードKBDである。4はCRT表示装置5の制御を行
うCRTコントローラであり、5は仮名漢字変換された
漢字等の文字表示が可能なCRT表示装置である。6は
外部記憶装置であるフロッピィ・ディスク装置7を制御
するFDDコントローラであり、7は編集処理された文
書データ等を記憶するための外部記憶装置であるフロッ
ピィ・ディスク装置FDDである。8は後述する用例学
習処理プログラム等の前記CPU1の制御プログラムや
制御データや辞書等を記憶しているROM(リードオン
リーメモリ)であり、9は仮名漢字変換入力バッファ9
a、仮名漢字変換出力バッファ9b、読み区切りバッフ
ァ9c、表記区切りバッファ9d、同音語バッファ9
1、92、93、…9N及びそのほかCPUのワークエ
リア等を有するRAM(ランダムアクセスメモリ)であ
る。10は用例辞書であり用例辞書部10a及び誤用例
辞書部10bからなる。11は用例学習用の書換可能な
メモリである。
以上の構成から成る文字処理装置の用例学習処理につい
て第2図以下のフローチャートに基いて説明する。
まず、KBD3によりキー入力が行われると、第2図に
示すキーボードKBD入力処理が実行される。この処理
においては、入力データによって異なる処理が行われ
る。まず文字データの入力である場合は、ステップS1
で入力される文字データをRAM9の仮名漢字変換入力
バッファ9aに格納する。仮名漢字変換処理を起動する
為のキー、例えば句読点キーや変換キーの入力である場
合は、ステップ2に移り仮名漢字変換入力バッファ9a
に記憶された文字データに対して仮名漢字処理を行う。
この仮名漢字変換処理は第3図のフローチャートに示す
通りである。すなわち、ステップ2aではRAM9の仮
名漢字変換入力バッファ9aの中の文字データ列を2文
節最長一致法により文節に分割し、その分割された文節
の文字データの内、仮名の読みの区切りデータを読み区
切りバッファ9cに入れ、変換結果の区切りデータを表
記区切りバッファ9cに入れる。ステップ2bの仮名漢
字変換の結果である仮名漢字混じり文データは変換結果
出力バッファ9bに入れる。さらに同音語は先頭の文節
から順に同音語バッファ91、92、93、…と入れ
る。従って、各同音語バッファには通常複数個の同音語
が記憶されることになる。次にステップ2cにおいて、
ステップ2aで分割された各文節間に用例があるか否か
を調べる。これは用例辞書部10aに記憶された用例と
既に使われた用例を記憶している用例学習用メモリ11
に記憶された用例があるか否か調べるのと、誤用例でな
いか否か誤用例辞書部10bを調べる処理である。ステ
ップ2cで誤用例があるか否かを調べた結果、誤用例が
ない場合にはステップ2dでステップ2gに処理を移
す。ステップ2gでは、用例が発見されていたか否かを
調べ、発見されていた場合ステップ2hに移る。ステッ
プ2hでは、用例が両方にあったか否かを調べ、もし両
方にあった場合ステップ2iに移る。ステップ2iでは
用例学習メモリ11内にある用例が優先的に出力される
ように仮名漢字変換出力バッファ9bを変更すると共
に、同音語バッファ内の同音語データを入れ替え、第1
番目には用例学習メモリ11で見つかった語を第1番目
に入れ他の同音語を順に下位の順位にシフトする。これ
は用例としてペアとなった同音語、即ち、後ろに隣接す
る文節の同音語バッファ内のデータについても同様であ
る。この場合、既に該同音語が第1順位にあった場合に
は、変更する必要はないとことは当然である。更に同音
語バッファの第2順位には用例辞書10にあった用例の
同音語を入れ、その他のものは第3位以下にシフトす
る。この場合も既に第2順位に用例辞書のデータが入っ
ていた場合は前記と同様入れ替える必要はないことは当
然である。また、用例学習メモリ11と用例辞書10の
内容が一致している場合にも変更する必要はない、ステ
ップ2iが済んだら仮名漢字変換処理を終了する。ま
た、ステップ2hで片方にしか無かった場合にはステッ
プ2jに移り、見つかった用例が優先的に出力されるよ
うに仮名漢字変換出力バッファ9bを変更すると共に同
音語バッファ内の同音語データを入れ替え、用例として
見つかった語は第1番目に入れ、他の同音語を順に下位
の順位にシフトする。これは用例としてペアとなった同
音語、即ち、後ろに隣接する文節の同音語についても同
様である。ステップ2jが済んだら、仮名漢字変換処理
を終了する。他方、ステップ2dで誤用例が発見された
場合はステップ2eに移り、誤用例の存在を示す為、仮
名漢字変換出力バッファ9bの誤用例部分の文節を反転
表示するごとく反転表示指示フラグを立てる。更にステ
ップ2fでは、ステップ2cで見付けた用例に対する正
しい用例を同音語バッファの第1番目に入れる。ここ
で、仮名漢字変換出力バッファ9bの内容は変更しな
い。誤用例辞書部10bは、誤用例とそれに対する正し
い用例が予め記憶されており、例えば「汚名:挽回」に
対し、「名誉:挽回」、「汚名:そそぐ」等が記憶され
るが如くである。なお、各自立語に対し品詞情報、関係
付属情報等が記憶されており、誤用例一致の検出には、
これらの品詞情報等から接続可能の付属語が組み合わさ
れ検出されるものである。
第2図の処理に戻り、カーソル移動キーによる入力であ
れば、ステップ4で通常のカーソル移動処理を行う。そ
の他のキーの入力であれば、ステップ5でキー入力に対
応した夫々の処理を行う。
また、同音語の変更指示キーが入力されたときは、ステ
ップ3で現在カーソルのある位置を判別してどの同音語
バッファに対応する文節が変更されるかを判別し同音語
をCRT表示装置5に列挙表示し、その中から所望の同
音語を選択するものである。同音語バッファには最初に
出力された同音語から順に記憶されているため、選択さ
れた同音語が第1の候補であったかどうかがわかる。ス
テップ6で第1の候補の同音語が選択されたか否かを調
べ、第1の順位の場合はそのまま選択処理を終了する。
第1の順位でない場合は、ステップ7に移り、ステップ
3で変更した同音語バッファの第1順位に保存されてい
る同音語とその前後の文節との各ペアが用例学習データ
として用例学習用メモリ11内に存在しているか否かを
調べる。用例の存在を具体的に調べる方法は、従来より
周知の一致検索の方法によるのでその詳細は省略する。
ステップ7で用例学習データとして用例学習用メモリ1
1内に存在することがわかった場合、ステップ8に移
り、当該用例データを削除し、次のステップ11に移
る。他方、用例学習データとして存在しない場合は、ス
テップ9に移り、用例学習用メモリ11内に用例学習領
域が有るか否かを調べる。もしない場合はステップ10
に移り、最も古い用例学習データ削除を学習領域を作
り、次のステップ11に移る。用例学習領域がある場合
は、そのままステップ11に移り、変更した結果の同音
語とその同音語の文節の前後の同音語のうち出力されて
いる同音語とペア、即ち直前の文節の語と変更した結果
の同音語のペア、及び変更した同音語とその同音語に続
く同音語とのペアの二つを用例学習用メモリ11に記憶
させる。
上記説明においては、分割された文節について単純に実
施する場合について示したが、一般的には文節は自立語
と付属語とからなり、学習データは前の自立部と後の自
立部とのペアで記憶され、さらに各自立部の付属語を各
自立部を構成する自立語に関連付けた形で分けて記憶す
るものである。即ち、単純な例として、「そうさしよ
う」というような場合、変換結果が「操作使用」とな
り、それを「操作仕様」に変更した場合が当てはめられ
る。この場合は「使用」を「仕様」に変更したわけで、
上記説明したように変更した同音語の「仕様」が「操
作」と「仕様」のペアで用例学習用メモリ11内に記憶
される。これに対して、「しようのけんとうをおこなっ
た」と入力された場合は、自立語である「仕様」と「検
討」ペアが学習され、さらに「仕様」の付属語である
「の」と「検討」の付属語である「を」が夫々自立語に
関連付られて記憶されるものである。
尚、上記実施例では、仮名漢字変換処理時における実施
例を示したが、文節の切り出しと切り出した一部の文節
の変更を検出することで、変換が全て終わって既に文節
として一応完成した時点においても実施可能である。
[発明の効果] 以上説明したように、本発明に係る文字処理装置によれ
ば、効果的に用例の学習処理が行えるだけでなく、誤用
例の検出も容易で、経済的に高い変換効率で仮名漢字変
換処理が行えるものである。
【図面の簡単な説明】
第1図は本発明の実施例に係る文字処理装置のブロック
図、 第2図は本発明の用例学習処理を示すフローチャート、 第3図は本発明の仮名漢字変換処理を示すフローチャー
トである。 1……CPU、3……KBD、 5……CRT、8……ROM、 9……RAM、10……用例辞書、 11……用例学習用メモリ。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】仮名文字列を入力するための入力手段と、 該入力手段より入力された仮名文字列を記憶する記憶手
    段と、 該記憶手段に記憶された仮名文字列を文節ごとに分割す
    る分割手段と、 該分割手段により分割された各文節の仮名文字列を、漢
    字混じり表記による文節候補群に変換する変換手段と、 誤って用いられ易い、誤用となる隣接文節の組の自立語
    同士が関連づけられて、予め誤用例として記憶された誤
    用例辞書手段と、 前記各文節について、前記文節候補群より1つの文節候
    補を表示する候補表示手段と、 該候補表示手段による表示の際に、隣接する文節の文節
    候補の組で、自立語同士が前記誤用例記憶手段に記憶さ
    れた誤用例に該当する組があれば、該組をなす文節候補
    を、他の文節の文節候補と識別して表示するように、前
    記候補表示手段を制御する表示制御手段とを有すること
    を特徴とする文字処理装置。
JP1012501A 1989-01-21 1989-01-21 文字処理装置 Expired - Fee Related JPH0628056B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1012501A JPH0628056B2 (ja) 1989-01-21 1989-01-21 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1012501A JPH0628056B2 (ja) 1989-01-21 1989-01-21 文字処理装置

Publications (2)

Publication Number Publication Date
JPH02250144A JPH02250144A (ja) 1990-10-05
JPH0628056B2 true JPH0628056B2 (ja) 1994-04-13

Family

ID=11807115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1012501A Expired - Fee Related JPH0628056B2 (ja) 1989-01-21 1989-01-21 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0628056B2 (ja)

Also Published As

Publication number Publication date
JPH02250144A (ja) 1990-10-05

Similar Documents

Publication Publication Date Title
JPH0628056B2 (ja) 文字処理装置
JPH0619771B2 (ja) 文字処理装置
JPS628259A (ja) かな漢字変換方式
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPH0619770B2 (ja) 文字処理装置
JPH03129568A (ja) 文書処理装置
JP2833650B2 (ja) 文書処理装置
JP2761606B2 (ja) 文書データ処理装置
JPS58151637A (ja) 日本語ワ−ドプロセツサ
JPH07122875B2 (ja) 文書編集装置
JPH0566875A (ja) キー入力装置
JP2802369B2 (ja) かな漢字変換装置
JP2944666B2 (ja) 文字処理装置
JPH0115105B2 (ja)
JPS6375873A (ja) 文書作成装置
JPS59153232A (ja) 文字変換装置
JPS6246030B2 (ja)
JPH08272797A (ja) 文字処理装置及びその方法
JPH08287062A (ja) 文字処理装置及びその方法
JPH07141348A (ja) 文字処理装置
JPH0561855A (ja) 日本語処理装置
JPH0721176A (ja) 文字訂正方法および文字訂正装置
JPH069044B2 (ja) 文字処理装置
JPH05189414A (ja) 文書作成装置及び方式
JPH0589094A (ja) かな漢字変換装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees