JPH02250145A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH02250145A
JPH02250145A JP1012502A JP1250289A JPH02250145A JP H02250145 A JPH02250145 A JP H02250145A JP 1012502 A JP1012502 A JP 1012502A JP 1250289 A JP1250289 A JP 1250289A JP H02250145 A JPH02250145 A JP H02250145A
Authority
JP
Japan
Prior art keywords
kanji
kana
homophone
learning
same sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1012502A
Other languages
English (en)
Other versions
JPH0619770B2 (ja
Inventor
Shunpei Takenaka
竹中 駿平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1012502A priority Critical patent/JPH0619770B2/ja
Publication of JPH02250145A publication Critical patent/JPH02250145A/ja
Publication of JPH0619770B2 publication Critical patent/JPH0619770B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野〕 本発明は日本語を処理する文字処理装置に関し、特に仮
名漢字変換処理において、正しい文章を作成する文字処
理装置に関するものである。
[従来技術の説明とその課題] 従来、日本語の文章を入力する際に、用例を用いて仮名
漢字変換を行う文字処理装置があった。
この種の文字処理装置では、文章を構成する文節におい
て、隣接する文節間のベアの用例を持った用例辞書を持
ち、仮名漢字変換処理において隣接する文節の各候補の
中に用例辞書中にある候補の組合せがあるか否かを調べ
、存在する場合はそれを第1番目に出力するようにした
ものである。
[発明か解決しようとしている課題] しかしながら、上記従来の用例辞書を有する文字処理装
置において、実際に用いられている用例の組合せは極め
て多く、それらの用例を全て予め用例辞書に記憶してお
くことは非割に不紅済である。また、これに対処するも
のとし゛C用例のへうちの使用頻度の高いもののみを用
例辞書に記)、eしているように構成した文字lA埋装
置もあるが、文章の分野によっても用例の傾向は違うし
、時代とともに用例の変化もあることか知られており、
このような場合には対処できない上に、用例辞書による
変換率の向上には制限が生していた。
[課題を解決するための手段及び作用]本発明に係る文
字処理装置は、上記課題を解決する為に成されたもので
、 仮名文字列を入力するための入力手段と、該入力手段に
より入力された仮名文字列を記憶する記憶手段と、 該記憶手段に記憶された仮名文字列を文節ごとに分割す
る分割手段と、 前記記憶手段に記憶された仮名文字列に対して仮名漢字
変換を行う変換手段と、 該分割手段により分割された文節における、前記変換手
段により仮名漢字変換された同音語の漢字候補を表示す
る表示手段と、 該表示手段により表示された同音語の漢字候補の中から
所望の漢字候補を選択する選択手段と、 前記選択手段により所望の漢字候補が選択されたとき、
選択された当該漢字候補と隣接する文節の組合せを記憶
する用例記憶手段と、予め同音語の漢字候補の用例を記
憶する用例辞書手段と、 新たに前記変換手段により仮名漢字変換された同音語の
漢字候補に対して、当該漢字候補の用例として前記用例
記憶手段の用例を前記用例辞書手段の用例に優先する用
例検索手段を有する。
[実施例] 以下図面を参照しながら本発明の実施例に係る文字処理
装置について説明する。
第1図は、実施例に係る文字処理装置のブロック図であ
る。
1は装置全体の制御を行うマイクロプロセッサから成る
CPUであり、後述する用例学習処理を行う。2はキー
ボード3の制御を行うキーボードコントローラKBCで
あり、3は文字キー、機能キー等のキー群から成るキー
ボードKBDである。4はCRT表示装置5の制御を行
うCRTコントローラであり、5は仮名漢字変換された
漢字等の文字表示が可能なCRT表示装置である。6は
外部記憶装置であるフロッピィ・ディスク装置7を制御
するF、 D Dコントローラであり、7は編集処理さ
れた文書データ等を記憶するための外部記憶装置である
フロッピィ・ディスク装置1fFDDである。8は後述
する用例学習処理プログラム等の前記cpu iの制御
プログラムや制御データや辞書等を記憶しているROM
 (リードオンリーメモリ)であり、9は仮名漢字変換
入力バッファ9a、仮名漢字変換出力バッファ9b、読
み区切りバッファ9c、表記区切りバッファ9d、同音
語バッファ91.92.93、・・・9N及びそのほか
CPUのワークエリア等を有するRAM(ランダムアク
セスメモリ)である。10は用例辞書、11は用例学習
用の書換可能なメ干りである。
以上の構成から成る文字処理装置の用例学習処理につい
て第2図以下のフローチャートに基いて説明する。
まず、KBD3によりキー入力が行われると、第2図に
示すキーボードKBD入力処理が実行される。この処理
においては、入力データによって異なる処理か行われる
。まず文字データの入力である場合は、ステップS1て
入力さる文字データをRAM9の仮名漢字変換入力バッ
ファ9aに格納する。仮名漢字変換処理を起動する為の
キー例えば句読点キーや変換キーの入力である場合は、
ステップ2に移り仮名漢字変換入力バッファ9aに記憶
された文字データに対して仮名漢字処埋を行う。この仮
名漢字変換処理は第3図のフロヂャートに示す通りであ
る。すなわち、ステップ2aてはRAM9の仮名逆字変
換入力バッファ9aの中の文字データ列を2文節最長一
致法により文節に分割し、その分割された文節の文字ブ
タの内、仮名の読みの区切りデータを読み区切りバッフ
ァ9cに入れ、変換結果の区切りデータを表記区切りバ
ッファ9cに入れる。ステップ2bの仮名漢字変換の結
果である仮名漢字混じり文デタは変換結果出力バッファ
9bに入れる。さらに同音語は先頭の文節から順に同音
語バッファ91.92.93、・・・と入れる。従って
、各同音語バッファには通常複数個の同音語が記憶され
ることになる。次にステップ2cにおいて、ステップ2
aで分割された各文節間に用例かあるか否かを調べる。
これは用例辞書10に記憶された用例と既に使われた用
例を記憶している用例学習用メモリ11に記憶された用
例を調べる処理である。ステップ2Cて用例があるか否
か調へた結果、用例がある場合にはステップ2dてステ
ップ2eに処理を移す。ステップ2eでは、用例が両方
にあったか否かを調へ、もし両方にあった場合ステップ
2fに移る。ステップ2fでは用例学習メモリ11内に
ある用例か優先的に出力されるように仮名漢字変換出力
バッファ9bを変更すると共に、同音語バッファ内の同
音語データを入れ替え、第1番目には用例学習メモリ1
1て見つかった語を第1番目に入れ他の同音語を順に下
位の順位にシフトする。これは用例としてベアとなった
同音語、即ち、後ろに隣接する文節の同音語バッファ内
のデータについても同様である。この場合、既に該同音
語か第1順位にあった場合には、変更する必要はないこ
とは当然である。更に同音語バッファの第2順位には用
例辞書10にあった用例の同音語を入れ、その他のもの
は第3位以下にシフトする。この場合も既に第2順位に
用例辞書のデータが人っていた場合は前記と同様入れ替
える必要はないことは当然である。また、用例学習メモ
リ11と用例辞書10の内容が一致している場合にも変
更する必要はない。ステップ2fが済んたら仮名漢字変
換処理を終了する。また、ステップ2eて片方にしか無
かった場合にはステップ2gに移り、見つかった用例か
((先約に出力されるように仮名漢字変換出力バッファ
9bを変更すると共に同音語バッファ内の同音語データ
を入れ替え、用例として見つかった語は第1番目に入れ
、他の同音語を順に下位の順位にシフト場−る。
こねは用例としてベアと〕ぼった同音語、即ち、後ろに
隣接する文節の同音語についても同様である。ステップ
2gが済んたら、仮名漢字変換処理を終了する。
第2図の処理に戻り、カーソル移動キーによる入力であ
れは、ステップ4て通常のカーソル移動処理を行う。そ
の他のキーの入力てあれば、ステップ5でキー入力に対
応した夫々の処理を行う。
また、同音語の変更指示キーか入力されたときは、ステ
ップ3で現在カーソルのある位置を判別してどの同音語
バッファに対応する文節が変更されるかを判別し同音語
をCR7表示装置5に列挙表示し、その中から所望の同
音語を選択するものである。同音語バッファには最初に
出力された同音語から順に記憶されているため、選択さ
れた同音語か第1の候補てあったかどうかかわかる。ス
テップ6で第1の候補の同音語が選択されたか否かを調
へ、第1の順位の場合はそのまま選択処理を終了する。
第1の順位てない場合は、ステップ7に移り、ステップ
3で変更した同音語バッファの第1順位に保存されてい
る同音語とその前後の文節との各ベアが用例学習データ
として用例学習用メモリ11内に存在してるいか否かを
調べる。
用例の存在を具体的に調へる方法は、従来より周知の一
致検索の方法によるのでその詳細は省略する。ステップ
7で用例学習データとして用例学習用メモリ11内に存
在することがわかった場合、ステップ8に移り、当該用
例データを削除し、次のステップ11に移る。他方、用
例学習データとして存在しない場合は、ステップ9に移
り、用例学習用メモリ11内に用例学習領域が有るか否
かを調へる。もしない場合はステップ10に移り、最も
古い用例学習データ削除し学習領域を作り、次のステッ
プ1】に移る。用例学習処理がある場合は、そのままス
テップ11に移り、変更した結果の同音語とその同音語
の文節の前後の同音語のうち出力されている同音語とベ
ア、即ち直前の文節の語と変更した結果の同音語のベア
、及び変更した同音語とその同音語に続く同音語とのベ
アの二つを用例学習用メモリ11に記憶させる。
上記説明においては、分割された文節について単純に実
施する場合について示したか、一般的には文節は自立語
と付属語とからなり、学習データは前の自立部と後の自
立部とのベアて記憶され、さらに各自立部の付属語を各
自立部を構成する自立語に関連付けた形て分りで記憶す
るものである。即ち、単純な例として、「そうさしよう
」というような場合、変換結果が「操作使用」となり、
それを「操作仕様」に変更した場合が当てはめられる。
この場合は「便用」を「仕様」に変更したわけで、上記
説明したように変更した同音語の「仕様」が「操作」と
「仕様」のベアで用例学習用メモリ11内に記憶される
。これに対して、「しようのけんとうをおこなったJと
入力された場合は、自立語である「仕様」と「検M”J
Jベアか学習され、さらに「仕様」の付属語である「の
」と「検討」のイ」属語である「を」が夫々自立語に関
連イ」られて記憶されるものである。
尚、上記実施例では、仮名漢字変換処理時における実施
例を示したが、文節の切り出しと切り出した一部の文節
の変更を検出することて、変換が全て終わって既に文書
として一応完成した時点においても実施可能である。
[発明の効果] 以上説明したように、木発明に係る文字処理装置によれ
ば、効果的に用例の学習処理が行え、その学習データに
基いて経済的に高い変換効率で仮名漢字変換処理が行え
るものである。
【図面の簡単な説明】
第1図は本発明の実施例に係る文字処理装置のブロック
図、 第2図は本発明の用例学習処理を示すフローヂャート、 第3図は木発明の仮名漢字変換処理を示すフロヂャート
である。 1・・・CPU、    3・・・KBD、5・・・C
RT、    8・・・ROM。 9・・・RAM、   10・・・用例辞相、11・・
・用例学習用メモリ。

Claims (1)

  1. 【特許請求の範囲】 1、仮名文字列を入力するための入力手段と、該入力手
    段により入力された仮名文字列を記憶する記憶手段と、 該記憶手段に記憶された仮名文字列を文節ごとに分割す
    る分割手段と、 前記記憶手段に記憶された仮名文字列に対して仮名漢字
    変換を行う変換手段と、 該分割手段により分割された文節における、前記変換手
    段により仮名漢字変換された同音語の漢字候補を表示す
    るための表示手段と、 該表示手段により表示された同音語の漢字候補の中から
    所望の漢字候補を選択する選択手段と、 前記選択手段により所望の漢字候補が選択されたとき、
    選択された当該漢字候補と隣接する文節の組合せを記憶
    する用例記憶手段と、 予め同音語の漢字候補の用例を記憶する用例辞書手段と
    、 新たに前記変換手段により仮名漢字変換された同音語の
    漢字候補に対して、当該漢字候補の用例として前記用例
    記憶手段の用例を前記用例辞書手段の用例に優先する用
    例検索手段を有することを特徴とする文字処理装置。
JP1012502A 1989-01-21 1989-01-21 文字処理装置 Expired - Lifetime JPH0619770B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1012502A JPH0619770B2 (ja) 1989-01-21 1989-01-21 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1012502A JPH0619770B2 (ja) 1989-01-21 1989-01-21 文字処理装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP7343090A Division JPH08272797A (ja) 1995-12-28 1995-12-28 文字処理装置及びその方法

Publications (2)

Publication Number Publication Date
JPH02250145A true JPH02250145A (ja) 1990-10-05
JPH0619770B2 JPH0619770B2 (ja) 1994-03-16

Family

ID=11807138

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1012502A Expired - Lifetime JPH0619770B2 (ja) 1989-01-21 1989-01-21 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0619770B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5819933A (ja) * 1981-07-29 1983-02-05 Toshiba Corp かな漢字変換装置
JPS592125A (ja) * 1982-06-29 1984-01-07 Comput Basic Mach Technol Res Assoc 仮名漢字変換方法
JPS59132029A (ja) * 1983-01-14 1984-07-30 Sharp Corp 仮名漢字変換装置
JPS60239864A (ja) * 1984-05-14 1985-11-28 Fujitsu Ltd 仮名漢字変換の複合語処理方式
JPS613268A (ja) * 1984-06-15 1986-01-09 Sharp Corp 仮名漢字変換処理装置
JPS63311471A (ja) * 1987-06-12 1988-12-20 Matsushita Electric Ind Co Ltd かな漢字変換装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5819933A (ja) * 1981-07-29 1983-02-05 Toshiba Corp かな漢字変換装置
JPS592125A (ja) * 1982-06-29 1984-01-07 Comput Basic Mach Technol Res Assoc 仮名漢字変換方法
JPS59132029A (ja) * 1983-01-14 1984-07-30 Sharp Corp 仮名漢字変換装置
JPS60239864A (ja) * 1984-05-14 1985-11-28 Fujitsu Ltd 仮名漢字変換の複合語処理方式
JPS613268A (ja) * 1984-06-15 1986-01-09 Sharp Corp 仮名漢字変換処理装置
JPS63311471A (ja) * 1987-06-12 1988-12-20 Matsushita Electric Ind Co Ltd かな漢字変換装置

Also Published As

Publication number Publication date
JPH0619770B2 (ja) 1994-03-16

Similar Documents

Publication Publication Date Title
JP3762300B2 (ja) テキスト入力処理装置及び方法並びにプログラム
JP3952964B2 (ja) 読み情報決定方法及び装置及びプログラム
JPH02250145A (ja) 文字処理装置
JPH07271774A (ja) 文章入力装置
JPH02250148A (ja) 文字処理装置
JPS628259A (ja) かな漢字変換方式
JP5767784B2 (ja) 情報処置装置、文字列候補確定方法及びプログラム
JP2833650B2 (ja) 文書処理装置
JPH0380363A (ja) 文書処理装置
JPH02250144A (ja) 文字処理装置
JPS6068425A (ja) 学習機能を備えた仮名漢字変換装置
JPH0441398Y2 (ja)
JPH04281558A (ja) 文書検索方法および装置
JP2634596B2 (ja) かな漢字変換装置
JP2537991B2 (ja) 文字入力装置および方法
JP2744430B2 (ja) 自然言語処理装置
JPS6198475A (ja) 日本語文章入力装置
JPH0683809A (ja) 文書処理装置
JPS60173666A (ja) 漢字検索機
JPH07160700A (ja) 文書処理方法及びその装置
JPH04365166A (ja) 文章検査装置
JPH03212762A (ja) かな漢字変換装置
JPH03111965A (ja) 仮名漢字変換方法及び仮名漢字変換装置
JPH0561855A (ja) 日本語処理装置
JPH07141348A (ja) 文字処理装置