JPH03286248A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH03286248A
JPH03286248A JP2086154A JP8615490A JPH03286248A JP H03286248 A JPH03286248 A JP H03286248A JP 2086154 A JP2086154 A JP 2086154A JP 8615490 A JP8615490 A JP 8615490A JP H03286248 A JPH03286248 A JP H03286248A
Authority
JP
Japan
Prior art keywords
word
character string
dictionary
connection information
registered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2086154A
Other languages
English (en)
Inventor
Kazuyo Ikeda
和世 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2086154A priority Critical patent/JPH03286248A/ja
Publication of JPH03286248A publication Critical patent/JPH03286248A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、カナ読み列を漢字カナ交じり文に変換するカ
ナ漢字変換のように、辞書を用いて文字列を解析する文
字処理装置に関するちのである。
〔従来の技術] 従来、日本語の解析を行う文字処理装置として、例えば
日本語ワードプロセッサにおけるカナ漢字変換装置が広
く普及している。カナ漢字変換は、通常、単語の読みと
表記を関連付けて格納したカナ漢字変換用辞書を用いて
、カナ読みを漢字に変換している。ところが、カナ漢字
変換用辞書に、あらゆるユーザーが使用する全ての単語
を登録することは現実的に不可能であり、あらかじめ用
意されているカナ漢字変換用辞書だけでは、全てのユー
ザーの入力したカナ読みを的確に漢字がな交じり文に変
換することができない。そこで、ユーザーが必要とする
単語を、カナ漢字変換用辞書にユーザーが登録できる単
語登録機能により、ユーザーの目的にあったカナ漢字変
換装置を築きあげることができるようになっている。
〔発明が解決しようとしている課題〕
しかしながら、従来の単語登録機能では、ユーザーが登
録できる単語は、名詞などの簡単な品詞の単語に限って
いる場合が多く、例えば、助動詞や助詞などの付属語な
どを登録することはできなかった。また、登録できたと
しても、登録した単語と他の単語との接続関係を明確に
しなければならず、ある程度の文法的な知識が必要とな
り、だれでも簡単に登録することは不可能であった。
〔課題を解決するための手段(及び作用)〕本発明の目
的は、上記従来例の欠点を除去することにある。
すなわち、ユーザーがカナ漢字変換用辞書に登録されて
いない単語を登録する際、その単語と同じように使われ
る単語を提示して登録できるようにする。そして、同じ
ように使われる単語と一致するカナ漢字変換用辞書中の
単語の接続情報を求める。そして、求められた接続情報
を登録すべき単語の接続情報として、カナ漢字変換用辞
書に登録する。こうすることによって、文法的な知識が
なくても、使用方法が同じ単語を提示することによって
、登録すべき単語の文法的な情報が付加されて、カナ漢
字変換用辞書に登録することができる。
その為に本発明は以下の手段を備える。
すなわち、単語の文字列と、その単語と他の単語との接
続情報を対応させて格納した単語辞書を有し、前記単語
辞書を用いて、文字列を解析する文字処理装置において
、 登録する単語の文字列を入力する登録単語入力手段と、 前記単語の文字列を言い換えた他の言い換え文字列を入
力する言い換え文字列入力手段と、 前記言い換え文字
列入力手段により入力された言い換え文字列と一致する
前記単語辞書中の単語の文字列の接続情報を、当該単語
の文字列と他の単語の文字列との接続情報として求める
接続情報抽出手段と、 前記一致する単語の文字列と、前記接続情報抽出手段に
よって抽出された接続情報を対応させて前記単語辞書に
登録する、単語登録手段を備える。
これによって、例えば「違いまんがな」の「まんがな」
という付属語を登録する際、その付属語を言い換えた「
違います」の「まず」という付属語を提示するだけで、
「まんがな」の文法的な情報が付加されて、辞書に登録
でき、「まんがな」が辞書に存在しなかったために「ち
がいまんがな」という読みが「違いマンが名」と変換さ
れていたのを、正しく変換できるようになる。
〔実施例〕
以下、図面を参照して本発明の詳細な説明する。
第1図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。
次にROMは、読出し専用の固定メモリである。PAは
、第4図〜第8図につき後述するマイクロプロセッサC
PUによる制御手順等を記憶させたプログラムエリアで
ある。
また、RAMは、1ワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。
TBUFは文書バッファであり、キーボードKBより入
力された文書情報を蓄えるためのメモリである。
FUZD I Cは、付属語の情報を格納した付属語辞
書であり、かな漢字変換において用いられる。
5TZKTBは、単語と単語の接続関係を記述した接続
テーブルであり、カナ漢字変換において用いられる。
FUZ IYは、登録したい付属語の読みを格納する登
録付属語読みバッファである。
FUZ I Kは、登録したい付属語の表記を格納する
登録付属語表記バッファである。
FUZ2Yは、登録したい付属語と同じ使われ方をする
付属語の読みを格納する言い換え付属語読みバッファで
ある。
KBはキーボードであって、アルファベットキー、ひら
がなキー、カタカナキー等の文字記号入カキ−1及び、
変換を指示する変換キーなどの各種のファンクションキ
ーを備えている。
図において、YOMは、カナ漢字変換のための読みを入
力するためのキー、HENは入力した読みを変換するた
めの変換指示キー、TOUは置き換えペアを登録するた
めの置き換え登録キーである。
DISKは定型文書を記憶するためのメモリで作成され
た文書の保管を行ない、保管された文書はキーボードの
指示により、必要な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。
後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対する表示装置CRT上の位置にカーソ
ルを表示する。
DBUFは表示用バッファメモリで、TBUFに蓄えら
れた文書情報等のパターンを蓄える。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
また、CRTは陰極線管等を用いた表示装置であり、そ
の表示装置CRTにおけるドツト構成のパターンおよび
カーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ちのである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラブド信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶しである各種の制御信号を読出し、それらの制御
信号に従って、各種の制御が行なわれる。
第2図は、付属語辞書FUZD I Cの構成を示した
図である。
付属語辞書は、付属語の読みと、前の単語との接続関係
の観点から分類した前方接続分類と、後の単語との接続
関係の観点から分類した後方接続分類と、付属語の表記
とを対応させて格納している。
第3図は、接続テーブル5TZKTBの構成を示した図
である。
接続テーブルは、図のように、後方接続分類と前方接続
分類とによってマトリックスを作り、後方接続分類の単
語の後ろに前方接続分類の単語が出現した場合に、接続
可能かどうかの情報をマトリックスの要素とする。図に
おいては、要素の値が1であれば接続可能であり、Oで
あれば接続不可能であるとする。
上述の実施例の作動をフローに従って説明する。
第4図は本発明文字処理装置の動作を示すフローチャー
トである。
54−1においてキーボードよりキーが押下され、割り
込みが発生するのを待つ。キーが入力されると54−2
においてキー判別し、キーの種類に応じて54−3.5
4−4.54−5のいずれかのステップに分岐する。
54−3は読み入カキ−YOMが押下されたときの処理
であり、押下された読みを付属語辞書FUZD I C
と接続テーブル5TZKTBを用いてカナ漢字変換する
。カナ漢字変換処理は、同種の文字処理装置において一
般に行なわれている処理であり、公知であるので特に記
述しない。
54−4は付属語登録キーTOtJが押下されたときの
処理であり、付属語辞書FUZD I Cに指定された
付属語を登録する。
54−5は、YOM、TOU以外のキー(例えば、カー
ソル移動キーなどの文書編集で用いるキーなど)が押下
された場合の処理であり、同種の文字処理装置において
一般に行なわれている処理であり、公知であるので特に
記述しない。
54−6は上記の処理の結果、変更された部分を表示す
る表示処理である0文書中のデータ1文字を読んではパ
ターンに展開し、表示バッファに出力するという通常広
く行なわれている処理である。
第5図は、54−4の処理を詳細化したフローチャート
である。
55−1は、登録する付属語の読みを取り入れて、登録
付属語読みバッファFUZIYに格納する処理である。
キーボードから入力された読みを受は付け、FUZIY
に格納する。
55−2は、登録する付属語の表記を取り入れて、登録
付属語表記バッファFUZI Kに格納する処理である
。キーボードから入力された読みをかな漢字変換し、F
UZ I Kに格納する。
55−3は、登録する付属語と同じように使われる付属
語の読みを取り入れて、言い換え付属語読みバッファF
UZ2Yに格納する処理である。
キーボードから入力された読みを受は付け、FUZ2Y
に格納する。
55−4は、55−4でFUZ2Yに格納された読みを
、付属語辞書FUZDICと接続テーブル5TZKTB
を用いて解析する処理である。すなわち、FUZ2Yに
格納されている読みが、FUZD I Cに格納されて
いる付属語の読みを連接させて構成されているか調べ、
連接されている場合は、連接した各付属語がすべて接続
可能であるかどうか、5TZKTBによって判定する。
そして、すべて接続可能であれば、解析できたものとし
、そうでなければ、解析できなかったものとする。解析
できた場合は、FUZ2Yに格納された読みをFUZD
IC中の付属語の連接と見なし、その中で、先頭の付属
語の前方接続分類と、末尾る。
55−6は、55−1,55−2で入力された付属語を
FUZDICに登録する処理であり、F後方接続分類を
対応させて、FUZD I Cに登録する。
〔他の実施例〕
以上の説明において、登録の対象となる単語を付属語の
みに限っているが、−船釣な自立語に対しても、同じよ
うな処理をすることによって、文法的な情報が自動的に
付加されて登録される。
また、以上の説明では、カナ漢字変換で使用する辞書に
、単語を登録する例を挙げたが、漢字カナ混じり文を解
析する処理が用いる辞書に対しても、同じように用いら
れる言葉の表記を提示することによって、同様に実施で
きる。
〔効果の説明〕
以上の説明から明らかなように、本発明によれば、単語
を辞書に登録する際、その単語と同じ使われ方をする単
語を提示するだけで、その単語の文法的な情報が付加さ
れて登録されるので、文法的な知識が豊富でない人でも
、複雑な文法的な特徴のある単語を、容易に、辞書に登
録することができる。
【図面の簡単な説明】
第1図は本発明の全体構成のブロック図、第2図は本発
明の付属語辞書構成の例を示す図、 第3図は本発明の接続テーブルの構成例を示す図、 第4図〜第5図は本発明文字処理装置の動作を示すフロ
ーチャート。 FUZD I C・・・付属語辞書、 5TZKTB・・・接続テーブル、 FUZ IY・・・登録付属語読みバッファ、FUZ 
 I  K  ・ ・ FUZ2Y  ・ ・ ・登録付属語表記バッファ、 ・言い換え付属語読み バッファ。 第20 イ;し3L11弓4本書っA−転仔Z 躬 う 圃 稽■金ヲーフ゛IL/)構6 窮、!4−図 4係のフo−−+ヤート

Claims (1)

  1. 【特許請求の範囲】 1、単語の文字列と、その単語と他の単語との接続情報
    を対応させて格納した単語辞書を有し、前記単語辞書を
    用いて、文字列を解析する文字処理装置において、 登録する単語の文字列を入力する登録単語入力手段と、 前記単語の文字列を言い換えた他の言い換え文字列を入
    力する言い換え文字列入力手段と、前記言い換え文字列
    入力手段により入力された言い換え文字列と一致する前
    記単語辞書中の単語の文字列の接続情報を、当該単語の
    文字列と他の単語の文字列との接続情報として求める接
    続情報抽出手段と、 前記一致する単語の文字列と、前記接続情報抽出手段に
    よって抽出された接続情報を対応させて、前記単語辞書
    に登録する、単語登録手段を備えることを特徴とする文
    字処理装置。
JP2086154A 1990-03-30 1990-03-30 文字処理装置 Pending JPH03286248A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2086154A JPH03286248A (ja) 1990-03-30 1990-03-30 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2086154A JPH03286248A (ja) 1990-03-30 1990-03-30 文字処理装置

Publications (1)

Publication Number Publication Date
JPH03286248A true JPH03286248A (ja) 1991-12-17

Family

ID=13878825

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2086154A Pending JPH03286248A (ja) 1990-03-30 1990-03-30 文字処理装置

Country Status (1)

Country Link
JP (1) JPH03286248A (ja)

Similar Documents

Publication Publication Date Title
JPH03286248A (ja) 文字処理装置
JPH03286249A (ja) 文字処理装置
JP2621999B2 (ja) 文書処理装置
JPS628259A (ja) かな漢字変換方式
JPS5832418B2 (ja) 漢字まじり文入力装置
JPH05151256A (ja) 機械翻訳方法および機械翻訳装置
JP3278148B2 (ja) 文字処理装置及びその方法
JPS60207948A (ja) カナ漢字変換処理装置
JPH11175528A (ja) 電子辞書
JPH0258656B2 (ja)
JPH0468466A (ja) かな漢字変換装置
JP2004355248A (ja) 電子辞書
JPH0394367A (ja) 日本語入力方式
JPH06119379A (ja) ふりがな機能つき機械翻訳装置および方法
JPH03286250A (ja) 文字処理装置及びその方法
JPH07121542A (ja) 機械翻訳装置
JPS6365564A (ja) 質問応答システムの日本語入力処理方式
JPH04160668A (ja) 文字処理装置
JPS6386067A (ja) 日本語文書作成装置
JPS6051925A (ja) ワ−ドプロセツサ
JPH03154154A (ja) 仮名漢字変換装置
JPH02176965A (ja) かな漢字変換装置
JPH03286251A (ja) 文字処理装置
JPH03116363A (ja) 文字処理装置
JPH03296856A (ja) 文書処理装置