JPH07182334A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPH07182334A
JPH07182334A JP5327956A JP32795693A JPH07182334A JP H07182334 A JPH07182334 A JP H07182334A JP 5327956 A JP5327956 A JP 5327956A JP 32795693 A JP32795693 A JP 32795693A JP H07182334 A JPH07182334 A JP H07182334A
Authority
JP
Japan
Prior art keywords
kana
analysis result
kanji conversion
result
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5327956A
Other languages
English (en)
Inventor
Kazuyo Ikeda
和世 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP5327956A priority Critical patent/JPH07182334A/ja
Publication of JPH07182334A publication Critical patent/JPH07182334A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 例えば1文を区切って入力したような場合で
も、正解率の高いかな漢字変換を実現すること。 【構成】 かな漢字変換の対象となる読みを入力するキ
ーボードKBと、キーボードKBによって入力された読
みを、漢字かな混じり文に変換するかな漢字変換手段を
構成するCPUと、かな漢字変換によって変換結果を出
力した後も、かな漢字変換結果を決定するために使用し
た解析結果を記憶保持する解析結果記憶保持手段を構成
するRAMとを具備し、CPUは、RAMに格納されて
いる解析結果を、キーボードKBによって入力された読
みに対するかな漢字変換結果を決定するために利用す
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、かな漢字変換処理を有
する文字処理装置に関する。
【0002】
【従来の技術】最近、入力された読みをかな漢字混じり
文に変換するかな漢字変換を用いて、日本語文章を作成
していく日本語ワードプロセッサが幅広く利用されてい
る。
【0003】ところが、日本語には、読みが同じで意味
が異なる単語や句が多数存在するという性質があり、こ
れに対処するために、同音異義語を状況に応じて正しく
変換出力する同音異義語選択技術がかな漢字変換処理に
おいて重要な技術になっている。また、日本語は単語単
位に区切れておらず、べた書きで行われるために、かな
漢字変換の読みも区切りを入れずに入力されるため、単
語の区切り位置を決定する技術も、かな漢字変換処理に
おいて重要な技術になっている。
【0004】同音異義語選択技術や、単語の区切り位置
を決定する技術として、いわゆるAI辞書と呼ばれてい
る単語対の共起パターンを利用したり、構文解析技術を
利用したりして、単語間の関係を利用するものがある。
【0005】
【発明が解決しようとする課題】しかしながら、従来の
かな漢字変換においては、単語間の関係を利用する技術
は、その技術を適用する範囲が、一度に入力されたかな
漢字変換の対象となる読みに限定されていたために、1
文をすべて入力せず、きりのよいところで区切って入力
する場合などには、この技術を利用した同音異義語選択
技術や単語の区切り位置を決定する技術の効果を生かせ
ないという欠点があった。
【0006】例えば、「雨が」と「降る」が共起パター
ンとして辞書中に登録されている場合、図2に示すよう
に、「雨が昨日降った。」という文をかな漢字変換させ
る場合、図2(a)から図2(e)に示すように、「雨
が」と「昨日」とに分けて変換した後、図2(f)に示
すように、「ふった」をかな漢字変換すると、かな漢字
変換の対象として「ふった」しかとらえていないため
に、「雨が」と「降る」の共起パターンを利用すること
ができず、図2(g)に示すように、「振った」と誤変
換されてしまう場合があった。
【0007】ここで、図2において、(i)のように網
かけが施してある部分は、かな漢字変換の対象となる読
みと他のかな漢字変換候補を表示可能なかな漢字変換結
果を表示している状態である。(j)はかな漢字変換の
読みを入力する位置を示すカーソルである。CNVTキ
ーは、かな漢字変換を起動するキーであり、SLCTキ
ーは、かな漢字変換結果を他の変換候補が表示できる状
態から、表示できない状態に確定するキーであり、NE
XTキーは、かな漢字変換結果の他の変換候補を表示す
るキーである。
【0008】そこで本発明の目的は以上のような問題を
解消した文字処理装置を提供することにある。
【0009】
【課題を解決するための手段】本発明によれば、かな漢
字変換によって変換結果を出力した後も、変換結果を決
定するためにかな漢字変換が使用した解析結果を記憶保
持する解析結果記憶保持手段を設け、かな漢字変換は、
入力された読みに対する解析結果だけでなく、解析結果
記憶保持手段によって記憶保持されている解析結果も使
用して、入力された読みに対するかな漢字変換結果を決
定するようにしたものである。
【0010】すなわち、かな漢字変換の変換結果を出力
した後も、かな漢字変換の解析結果を記憶保持している
ので、1文をすべて入力せず、区切って入力された場合
でも、あたかも、1文が1度に入力されたように、1文
のすべての情報を用いることができ、同音異義語選択技
術や単語の区切り位置を決定する技術の効果を十分に発
揮できる。
【0011】例えば、図2(a)から図2(e)までの
操作を行った後、図2(f)に示すように、「ふった」
をかな漢字変換すると、「雨が」と「昨日」という文節
をかな漢字変換する時に用いた解析結果を記憶保持して
いるので、「雨が」と「降る」の共起パターンを利用す
ることができ、図2(h)に示すように、「降った」と
正しく変換することができる。
【0012】さらに本発明によれば、かな漢字変換の変
換結果が変更された場合に、記憶保持されているかな漢
字変換の解析結果も、新しい変換結果に対応させて変更
する手段を設けることによって、記憶保持されている解
析結果とかな漢字変換結果との間で矛盾が発生しないよ
うにしたものである。
【0013】さらに本発明によれば、記憶保持されてい
る前回のかな漢字変換の解析結果が、今回のかな漢字変
換を行う際、有効であるかどうかを判定する手段を設け
ることによって、前回のかな漢字変換の解析結果が有効
であると判定された時のみ、かな漢字変換が前回のかな
漢字変換の解析結果を利用するようにしたものである。
【0014】さらに本発明によれば、記憶保持されてい
るかな漢字変換の解析結果の中から、次のかな漢字変換
を行うために必要な情報を選び出す手段を設けることに
よって、解析結果記憶保持手段は、必要な解析結果の情
報のみを記憶保持することになるので、記憶保持する解
析結果を必要最低限に抑えることができ、必要となるメ
モリ量を削減し、かな漢字変換処理時間を軽減すること
ができるようにしたものである。
【0015】さらに本発明によれば、前回のかな漢字変
換の解析結果を次のかな漢字変換に利用するモードと利
用しないモードの2つのモードを設け、このモードを切
り替える手段によって、かな漢字変換が前回のかな漢字
変換の解析結果を利用するかどうかを制御できるように
したものである。
【0016】さらに本発明によれば、前回のかな漢字変
換の解析結果を無効指示に基づいて無効化する手段を設
けることによって、かな漢字変換が前回のかな漢字変換
の解析結果を利用するかどうかを、ユーザが制御できる
ようにしたものである。
【0017】
【実施例】以下図面を参照しながら本発明を詳細に説明
する。
【0018】図1は本発明の全体構成の一例である。
【0019】図示の構成において、CPUは、マイクロ
プロセッサであり、文字処理のための演算、論理判断等
を行ない、アドレスバスAB、コントロールバスCB、
データバスDBを介して、それらのバスに接続された各
構成要素を制御する。
【0020】アドレスバスABはマイクロプロセッサC
PUの制御の対象とする構成要素を指示するアドレス信
号を転送する。コントロールバスCBはマイクロプロセ
ッサCPUの制御の対象とする各構成要素のコントロー
ル信号を転送して印加する。データバスDBは各構成機
器相互間のデータ転送を行なう。
【0021】次にROMは、読出し専用の固定メモリで
ある。ROMに設けられているPAは、図6〜図13に
つき後述するマイクロプロセッサCPUによる制御の手
順を記憶させたプログラムエリアである。
【0022】また、RAMは、1ワード16ビットの構
成の書込み可能のランダムアクセスメモリであって、各
構成要素からの各種データの一時記憶に用いる。RAM
は、解析結果保持モードHMOD,単語辞書WDIC,
構文規則辞書GDIC,共起パターン辞書KDIC,形
態素解析情報KTTB,構文解析情報KBTB,変換開
始文節番号BNUM,構文解析情報スタックポインタS
TOP,変換結果出力位置CURP,読みバッファYB
UFで構成されている。
【0023】解析結果保持モードHMODは、かな漢字
変換の解析結果を、かな漢字変換結果出力後も保持する
かどうかのモードの状態を示すグラフであり、この値が
1であれば、かな漢字変換の解析結果を保持するモード
であることを意味し、0であれば、かな漢字変換の解析
結果を保持しないモードであることを意味する。
【0024】単語辞書WDICは、かな漢字変換を行う
ための単語の情報を格納したものであり、単語の読みと
表記と品詞と意味分類を対応させた辞書である。単語辞
書はかな漢字変換を行う文字処理装置で一般的に用いら
れており、特に詳細な説明は行わない。
【0025】構文規則辞書GDICは、構文解析で用い
られる構文規則を格納した辞書であり、詳細は図3を用
いて後述する。
【0026】共起パターン辞書KDICは、構文解析で
用いる構文規則の制約を記述した辞書であり、句を構成
する単語の共起パターンを記述するものである。詳細は
図4を用いて後述する。
【0027】形態素解析情報KTTBは、形態素解析し
た結果求められた形態素の情報を文節単位に格納するテ
ーブルであり、詳細は図5を用いて後述する。
【0028】構文解析情報KBTBは、構文解析する過
程の情報を格納するスタックであり、詳細は図5を用い
て後述する。
【0029】変換開始文節番号BNUMは、形態素解析
情報KTTBにおいて、かな漢字変換の対象となる先頭
の文節番号を示す変数であり、詳細は図5を用いて後述
する。
【0030】構文解析情報スタックポインタSTOP
は、構文解析情報KBTBのスタックの先頭を示すポイ
ンタであり、詳細は図5を用いて後述する。
【0031】変換結果出力位置CURPは、かな漢字変
換結果を出力した時に、次のかな漢字変換結果を出力す
る位置を記憶する変数である。かな漢字変換結果を出力
した直後のカーソル位置のx座標とy座標を記憶するこ
とにより、出力する位置を記憶する。
【0032】読みバッファYBUFは、かな漢字変換の
対象となる文字列を格納するバッファである。かな漢字
変換は、このバッファに蓄えられた文字列に対して、最
適なかな漢字変換結果を求める。読みバッファはかな漢
字変換を行う文字処理装置で一般的に用いられており、
特に詳細な説明は行わない。
【0033】KBはキーボードであって、アルファベッ
トキー、ひらがなキー、カタカナキー、句点等の文字記
号入力キー、及び、カーソル移動を指示するカーソル移
動キー等のような各種のファンクションキーを備えてい
る。ファンクションキーとしては、MODE,CNV
T,NEXT,SLCT,MOVE,CLERを備えて
いる。
【0034】MODEは、かな漢字変換結果を出力した
後も解析結果を保持するかどうかのモードを切り替える
キーである。CNVTは、入力した文字列に対して、か
な漢字変換を指示するキーである。NEXTは、かな漢
字変換によって求められた変換候補に対して、次の変換
候補を出力するように指示するキーである。SLCT
は、表示されているかな漢字変換の候補を選んで確定す
るキーである。MOVEはかな漢字変換結果の対象文節
を移動するキーである。CLERは、記憶保持されてい
るかな漢字変換の解析結果をクリアするキーである。
【0035】DISKは文書データ等を記憶するための
外部メモリである。文書データ等は必要に応じて保管さ
れ、また、保管されたデータはキーボードの指示によ
り、必要な時呼び出される。
【0036】CRはカーソルレジスタである。CPUに
より、カーソルレジスタの内容を読み書きできる。後述
するCRTコントローラCRTCは、ここに蓄えられた
アドレスに対する表示装置CRT上の位置にカーソルを
表示する。
【0037】DBUFは表示用バッファメモリで、表示
すべきデータのパターンを蓄える。
【0038】CRTCはカーソルレジスタCR及びバッ
ファDBUFに蓄えられた内容を表示器CRTに表示す
る役割を担う。
【0039】また、CRTは陰極線管等を用いた表示装
置であり、その表示装置CRTにおけるドット構成の表
示パターンおよびカーソルの表示をCRTコントローラ
で制御する。
【0040】さらに、CGはキャラクタジェネレータで
あって、表示装置CRTに表示する文字、記号のパター
ンを記憶するものである。
【0041】かかる各構成要素からなる本発明文字処理
装置においては、キーボードKBからの各種の入力に応
じて作動するものであって、キーボードKBからの入力
が供給されると、まず、インタラプト信号がマイクロプ
ロセッサCPUに送られ、そのマイクロプロセッサCP
UがROM内に記憶してある各種の制御信号を読出し、
それらの制御信号に従って、各種の制御が行なわれる。
【0042】図3は、構文規則辞書GDICの構成例を
説明した図である。構文規則は、句構造文法の句構造規
則に見られるような、書き換え規則であり、句と、その
句を構成する要素を対応させたものである。構文規則
は、構文解析において用いられる。図中において、
「+」は、句を構成する要素が、要素が並ぶ順番通りに
無条件に結合して、句を構成できることを意味してい
る。したがって、図中の規則の一つ(rule 2)
は、「副詞」と「動詞」がこの順番に連続して出現すれ
ば、結合して、「動詞句」になれることを示している。
図中において、「*」は、句を構成する要素が、図4に
て後述する共起パターンの条件を満たした時のみ、要素
が並ぶ順番通りに結合して、句を構成できることを意味
している。したがって、(rule 1)は、「名詞
句」と「動詞句」がこの順番通りに連続して出現した場
合、「名詞句」と「動詞句」が図4にて後述する共起パ
ターンの条件を満たしている時のみ、「文」になれるこ
とを意味している。構文規則を次々と適用して、「文」
になれれば、構文解析は成功したことになる。
【0043】図4は、共起パターン辞書KDICの構成
例を説明した図である。共起パターン辞書KDICは、
単語とその単語と共起するパターンを対応させた辞書で
あり、単語を見出しに格納し、その単語と共起するパタ
ーンを共起パターンに格納する。共起パターンには、単
語を直接記述することも、単語の属する意味分類を記述
することもできる。図中の共起パターンにおいて、
〈雨〉は、「雨」という単語そのものを意味しており、
[人]は意味分類が「人」であるようなすべての単語を
意味している。共起パターンにおいて、(が)や(を)
は、それぞれ、格助詞「が」や格助詞「を」に相当する
助詞を意味している。また、「/」は、文節の区切りを
意味している。したがって、(pattern 1)
は、「降る」という単語が、「雨」という単語に助詞
(が)が結合した文節と共起することを示しており、
(pattern 2)は、「振る」という単語が、意
味分類が「人」である単語と助詞(が)が結合した文節
と、意味分類が[棒]である単語と助詞(を)が結語し
た文節と共に共起することを示している。日本語では、
省略が多いので、「/」で区切られた共起パターンは、
そのいずれか1つでも出現すれば、共起可能なものとす
る。図中の例から、例えば、「振る」という単語は、意
味分類が[棒]である単語と助詞(を)が結合した文節
のみとでも、共起可能である。
【0044】図5(a)は、形態素解析情報KTTBの
構成例を説明した図である。形態素解析情報KTTB
は、文節番号と、文節の読みと、文節を構成する単語を
対応させて、形態素解析の結果求まった単語を文節単位
に管理している。図中において、文節番号が1の文節の
読みは、「あめが」であり、その文節は、名詞〈雨〉と
格助詞(が)から構成されていることを示している。文
節番号は、最初に、かな漢字変換された文節から順番に
番号がふられる。形態素解析情報KTTBには、かな漢
字変換の対象となる文字列に対する形態素解析の結果だ
けでなく、すでにかな漢字変換を終えて出力した文字列
に対する形態素結果を格納することができる。変換開始
文節番号BNUMによって、この2種類の形態素解析結
果を識別できる。変換開始文節番号BNUMには、かな
漢字変換の対象となる文字列に対する形態素結果の先頭
の文節の番号が格納されるので、変換開始文節番号BN
UMより小さい文節番号を持つ文節は、すでにかな漢字
変換を終えて出力した文字列に対する形態素結果という
ことになる。図中で「φ」が格納されている欄は、情報
が存在しないことを意味する。図5(a)は、図2
(c)に示したように、「きのう」という読みをかな漢
字変換する時の、形態素解析情報KTTBの例であり、
この場合は、変換開始文節番号BNUMは2である。し
たがって、この場合は、「あめが」という文節が、すで
にかな漢字変換されて出力されている。同じ文節の位置
に対しては、同じ文節番号がつけられるので、「きの
う」という読みに対する名詞〈機能〉と副詞〈昨日〉2
種類の文節に対して、同じ文節番号がふられている。
【0045】図5(b)は、構文解析情報KBTBの構
成例を説明した図である。構文解析情報KBTBは、構
文解析の過程を記憶するスタックであり、1つの文節に
対する情報が、構文規則を適用するための句情報と、共
起パターンの条件を判定するために必要な共起情報とで
対応づけられてスタックに積まれる。スタックの先頭
は、構文解析情報スタックポインタSTOPで示され
る。図5(b)は、図5(a)の形態素結果に対して、
名詞〈機能〉の文節を用いて、構文解析を行った例であ
る。文節番号1と文節番号2の文節をスタックに積ん
で、構文規則を適用した結果、これ以上構文規則が適用
できなくなった状態である。スタック中に、「文」とい
う句情報が唯一残っていれば、構文解析に成功したこと
になる。この例では、その状態になっていないので、構
文解析に失敗した状態である。
【0046】上述の実施例のPAに格納された手順の動
作をフローに従って説明する。
【0047】図6は本発明文字処理装置の動作を示すフ
ローチャートである。
【0048】S6−1はキーボードからのデータを取り
込む処理である。S6−2で取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。
【0049】文字キーが入力された時はS6−3に分岐
し、図7に詳述するかな漢字入力処理が行なわれる。か
な漢字入力処理が行なわれた後、S6−7へ進む。
【0050】MODEキーが入力されたときはS6−4
に分岐し、かな漢字変換の解析結果を保持するモードと
保持しないモードの切替を行う。かな漢字変換の解析結
果を変換結果出力後も保持するモードであれば保持しな
いモードに、保持しないモードであれば保持するモード
に切り替える。すなわち、解析結果保持モードHMOD
の値を調べ、1であれば0に、0であれば1に切り替え
る。切替を行った後S6−7へ進む。
【0051】CLERキーが入力された時はS6−5に
分岐し、記憶保持されているかな漢字変換の解析結果を
クリアする。すなわち、形態素解析情報KTTBをクリ
アし、構文解析情報KBTBをクリアし、変換開始文節
番号BNUMに1を代入し、構文解析情報スタックポイ
ンタSTOPをスタックの底に指すようにする。処理を
行った後S6−7へ進む。
【0052】その他のキーのときはS6−6に分岐し、
挿入、削除等の通常の文字処理装置において行なわれる
その他の処理が行なわれる。これらの処理は同種の文字
処理装置において一般に行われている処理であり、公知
であるので特に記述しない。処理が行われた後S6−7
に進む。
【0053】S6−7は上述の処理の結果、変更された
部分を表示する表示処理である。文書中のデータ一文字
を読むごとに文字パターンに展開し、表示バッファに出
力するというように通常一般に行われている処理であ
る。処理を終えると、S6−1へ進む。
【0054】図7は、S6−3のかな漢字入力処理を詳
細化したフローチャートである。
【0055】S7−1は、現在のカーソル位置が、変換
結果出力位置CURPで記憶しているx座標とy座標に
一致するかどうか判定する。一致すれば、前回かな漢字
変換結果を出力した位置から続けて入力することにな
り、前回のかな漢字変換の解析結果を利用できるので、
解析結果をクリアせずにS7−3へ分岐する。一致しな
ければ、前回かな漢字変換結果を出力した位置から、続
けて入力することにならないので、前回のかな漢字変換
の解析結果を利用できず、解析結果をクリアするため
に、S7−2へ分岐する。
【0056】S7−2は、前回までに出力したかな漢字
変換結果に対する解析結果をクリアする処理である。形
態素解析情報KTTBをクリアし、構文解析情報KBT
Bをクリアし、変換開始文節番号BNUMに1を代入
し、構文解析情報スタックポインタSTOPをスタック
の底に指すようにする。処理を終えた後S7−3へ進
む。
【0057】S7−3は、かな漢字変換の最適な変換結
果を求めるかな漢字変換処理である。かな漢字変換処理
は図8において詳述する。処理を終えた後S7−4へ進
む。
【0058】S7−4は、S7−3において求められた
かな漢字変換の最適な候補を変更して変換結果を選択
し、かな漢字変換結果を出力する候補選択処理である。
候補選択処理は図12において詳述する。処理を終える
と、かな漢字入力処理を終了する。
【0059】図8は、S7−3のかな漢字変換処理を詳
細化したフローチャートである。
【0060】S8−1は、S6−1およびS8−2にお
いて入力されたかな漢字変換の対象となるすべての文字
を読みバッファYBUFに格納する文字格納処理であ
る。格納した結果は、表示バッファに出力することで、
CRTに表示する。処理を終えた後S8−2へ進む。
【0061】S8−2はキーボードからのデータを取り
込む処理である。S8−3で取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。
【0062】文字キーが入力された時はS8−1に分岐
する。
【0063】CNVTキーまたは、句点が入力された時
はS8−4に分岐し、読みバッファYBUFに格納され
た文字列に対する最適なかな漢字変換結果を求める最適
候補変換処理を行った後、かな漢字変換処理を終了す
る。最適候補変換処理は、図9に置いて詳述する。
【0064】その他のキーが入力された時は、何も処理
を行わず、S8−2に分岐する。
【0065】図9は、S8−4の最適候補変換処理を詳
細化したフローである。
【0066】S9−1は、読みバッファYBUFに格納
された文字列に対して、単語辞書WDICを参照しなが
ら、形態素解析を行う形態素解析処理である。形態素解
析を行うに当たって、形態素解析情報KTTBに格納さ
れている文節番号の最大値に1を加えた値を変換開始文
節番号BNUMに格納する。形態素解析情報KTTBに
文節の情報が格納されていなければ、変換開始文節番号
BNUMに1を格納する。その後、形態素解析を行っ
て、解釈可能な文節と文節の構造を明らかにし、その結
果を形態素解析情報KTTBに追加する。形態素解析
は、この種のかな漢字変換処理において一般に行われて
いる処理であり、公知であるので、特に詳細な説明は行
わない。S9−1の形態素解析が行われる具体例を、図
10において後述する。
【0067】S9−2は、形態素解析情報KTTBと構
文解析情報KBTBをもとに、構文規則辞書GDICと
共起パターン辞書KDICを参照しながら、構文解析を
行う構文解析処理である。形態素解析情報KTTBか
ら、変換開始文節番号BNUMよりも大きい文節番号を
持つ文節の候補を各文節番号に対して1つずつ選び出
し、構文解析情報KBTBに積んでいき、構文解析情報
KBTBのスタックの上方から構文規則辞書GDICを
参照して句を生成していき、構文解析を行い、最終的に
構文解析情報KBTB中に「文」という句のみが残れ
ば、構文解析に成功したものとみなす。このようなスタ
ックを用いた構文解析の方法は、構文解析手法として一
般的に行われており、公知であるので、詳細は記述しな
い。ただし、本実施例における構文規則は、共起パター
ンによる制約があるので、そのような制約がある構文規
則を適用する場合は、共起パターンによる制約を満たし
ているかどうかを共起パターン辞書KDICを参照して
判断し、制約条件を満たしている場合に限り、その構文
規則が適用可能になる。共起パターン辞書KDICの共
起パターンには、単語の意味分類が記述されている場合
があり、この場合は、構文解析情報KBTBの共起情報
によって、単語辞書WDICを検索し、単語の意味分類
を求めて、共起パターンとマッチングを取る必要があ
る。構文解析に成功した場合は、S9−3へ進む。構文
解析に失敗した場合は、形態素解析情報KTTB中の文
節の候補を変更して構文解析を行う。すべての文節の候
補に対して構文解析に失敗した場合は、S9−3へ進
む。構文解析の具体例を、図11において後述する。
【0068】S9−3は、形態素解析および構文解析に
よって解析された結果に基づいて、変換開始文節番号B
NUMよりも大きい文節番号を持つ文節に対して、最適
な変換結果を決定する変換結果決定処理である。S9−
2において構文解析に成功していれば、成功した構文解
析で使用している文節の候補を最適な変換結果として決
定する。構文解析に成功したものがなければ、S9−1
の形態素解析のみで、最適な変換結果を決定する。構文
解析を行わず、形態素解析のみで変換結果を決定する処
理は、構文解析がないかな漢字変換において一般的に行
われており、公知であるので、特に詳細な説明は行わな
い。形態素解析によって変換結果を決定した場合は、決
定された文節の情報を構文解析情報KBTBに積みなお
す。変換結果決定処理を終えた後、S9−4へ進む。
【0069】S9−4は、S9−3で決定された最適な
かな漢字変換結果を表示する変換結果表示処理である。
この処理はかな漢字変換処理において一般的に行われて
おり、公知であるので、特に詳細な説明は行わない。変
換結果表示処理を終えた後、最適候補変換処理を終了す
る。
【0070】図10(a)は、図2(f)に示すよう
に、「雨が昨日」と変換出力された後、「ふった。」が
入力されて、形態素解析が行われる前の形態素解析情報
KTTBを示している。この状態で、形態素解析処理を
行うと、形態素解析情報KTTBは図10(b)のよう
になる。この状態の変換開始文節情報BNUMの値は3
である。文節番号3の文節が2種類解析されたことが分
かる。
【0071】図11は、S9−2の構文解析が行われる
具体例を示したものである。
【0072】図11(a)は、図10(b)の形態素解
析が終了した場合の、構文解析情報KBTBの例であ
る。図10(b)の中から文節番号3に対して、動詞
〈振る〉連用形を選び、構文解析情報KBTBに積む
と、図11(b)のようになる。
【0073】図11(b)に対して、構文規則辞書GD
ICを参照して適用可能な構文規則を検索すると、図3
の(rule 2)が見つかる。(rule 2)は、
共起パターンによる制約条件がないので、構文規則を適
用すると、図11(c)のようになる。
【0074】図11(c)に対して、構文規則辞書GD
ICを参照して適用可能な構文規則を検索すると、図3
の(rule 1)が見つかる。(rule 1)は、
共起パターンによる制約条件があるので、共起パターン
辞書KDICを参照して、共起情報の「振る」を見出し
とする共起パターンを検索すると、図4の(patte
rn 2)が見つかる。(pattern 2)は、意
味分類によって記述されているので、単語辞書WDIC
を検索して、〈雨〉と言う単語の意味分類を求める。と
ころが、〈雨〉と言う単語の意味分類は[人]ではない
ので、(pattern 2)の共起パターンの条件を
満たすことができず、(rule 1)を適用すること
ができず、構文解析に失敗する。
【0075】そこで、また、図11(a)に戻り、図1
0(b)の中から文節番号3に対して、動詞〈降る〉連
用形を選び、構文解析情報KBTBに積んで、前述と同
様に図3の(rule 2)を適用すると、図11
(d)のようになる。
【0076】図11(d)に対する構文規則と、前述と
同様に図3の(rule 1)が見つかり、共起情報の
「降る」を見出しとする共起パターンを検索すると、図
4の(pattern 1)が見つかる。(patte
rn 1)の共起パターンと、名詞句に対する共起情報
が一致するので、(pattern 1)の制約条件を
満たし、(rule 1)が適用可能になり、(rul
e 1)を適用すると、図11(e)のようになり、構
文解析に成功する。
【0077】図12は、S7−4の候補選択処理を詳細
化したフローである。
【0078】S12−1はキーボードからのデータを取
り込む処理である。S12−2で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。
【0079】SLCTキーが入力された時はS12−3
に分岐し、形態素解析情報KTTBから選択されなかっ
た文節の候補を取り除き、表示されているかな漢字変換
結果を出力する選択結果出力処理が行なわれる。変換結
果を出力する処理は、表示されている変換結果を文字列
として出力する処理であり、かな漢字変換において一般
に行われており、公知であるので、特に詳細な説明は行
わない。形態素解析情報KTTBから選択されなかった
文節の候補を取り除く処理によって、例えば、図2
(e)における形態素解析情報KTTBが図5(a)で
あった時、SLCTキーが入力されて「昨日」が選ばれ
た時、選択されなかった「機能」の情報が、形態素解析
情報KTTBから取り除かれ、図10(a)のようにな
る。処理を終えた後、S12−6へ進む。
【0080】MOVEキーが入力された時はS12−4
へ分岐し、対象となる文節を移動する対象文節移動処理
である。かな漢字変換結果の対象となる文節を移動する
処理は、この種のかな漢字変換において一般に行われて
おり、公知であるので、特に詳細な説明は行わない。処
理を終えた後、S12−1へ進む。
【0081】NEXTキーが入力された時はS12−5
へ分岐し、対象となる文節に対するかな漢字変換の別の
候補を表示させる変換候補変更処理である。変換候補変
更処理は、図13において詳述する。処理を終えた後、
S12−1へ進む。
【0082】その他のキーが入力された時は、何も処理
を行わずS12−1へ進む。
【0083】S12−6において、かな漢字変換の解析
結果を保持するモードであるかどうかを判定する。解析
結果保持モードHMODの値が1であればかな漢字変換
の解析結果を保持するモードであり、0であれば保持し
ないモードである。保持するモードであればS12−7
へ分岐し、保持しないモードであればS12−9へ分岐
する。
【0084】S12−7は、表示されていたかな漢字変
換結果が、句点「。」によって変換されたかどうか判定
する処理である。S12−3において出力された最後の
文字が句点であれば、句点によって変換されたことにな
り、句点でなければCNVTキーによって変換されたこ
とになる。句点で変換された場合はS12−9へ分岐
し、句点で変換されなかった場合はS12−8へ分岐す
る。
【0085】S12−8は、カーソル位置を記憶するカ
ーソル位置セーブ処理である。かな漢字変換結果を出力
することで、カーソル位置が変化し、新しいカーソル位
置のx座標とy座標を変換結果出力位置CURPに記憶
する。これは、次にかな漢字変換を開始した時に、今回
のかな漢字変換結果を出力した直後の同じ位置からかな
漢字変換を行うかどうか判定するためである。同じ位置
からかな漢字変換を行う場合は、今回までのかな漢字変
化における解析結果を利用できるが、位置が異なれば、
利用できない。処理を終えた後、候補選択処理を終了す
る。
【0086】S12−9は、かな漢字変換の解析結果を
クリアする処理である。形態素解析情報KTTBをクリ
アし、構文解析情報KBTBをクリアし、変換開始文節
番号BNUMに1を代入し、構文解析情報スタックポイ
ンタSTOPをスタックの底を指すようにする。処理を
終えた後、候補選択処理を終了する。
【0087】図13は、S12−5の変換候補変更処理
を詳細化したフローである。
【0088】S13−1は、対象となる文節の次のかな
漢字変換候補を取得する次候補取得処理である。次候補
取得処理は、形態素解析を行うことによって取得するこ
とができ、かな漢字変換において一般に行われており、
公知であるので特に詳細な説明は行わない。処理を終え
た後、S13−2へ進む。
【0089】S13−2は、S13−1によって取得さ
れた文節の候補で、形態素解析情報KKTBと構文解析
情報KBTBを変更する解析情報変更処理である。例え
ば、図2(d)の状態で、NEXTキーが入力されて図
2の(e)のようになった場合、形態素解析情報KKT
Bを、図14から図10(a)のように変更し、構文解
析情報KBTBは、解析情報変更処理によって、図5
(b)から図11(a)のように変更する。形態素解析
情報KKTBは、S13−1で求まる形態素解析結果に
よって変更し、構文解析情報KBTBは、新たに変更さ
れた形態素解析情報KKTBの文節の情報を構文解析情
報KBTBに積みなおすことによって変更する。処理を
終えた後、S13−3へ進む。
【0090】S13−3は、S13−1で取得したかな
漢字変換の候補を表示する次候補表示処理である。次候
補表示手段は、かな漢字変換において一般に行われてお
り、公知であるので特に詳細な説明は行わない。処理を
終えた後、変換候補変更処理を終了する。
【0091】[他の実施例]なお、本発明は上述した実
施例に限定されるものではない。
【0092】上述の実施例においては、形態素解析の結
果と構文解析の結果の両方を記憶保持していたが、必ず
しも両方を記憶保持する必要はない。形態素解析の結果
だけを形態素解析情報KTTBに記憶保持していたとし
ても、形態素解析情報KKTBに格納されている情報を
元に、構文解析を行ってその結果を構文解析情報KBT
Bに格納する処理を、図7のS7−1の直前に行えば、
形態素解析の結果と構文解析の結果の両方を保持してい
ることと同等になる。また、構文解析情報KBTBのみ
を記憶保持していたとしても、すでに変換出力されてい
るかな漢字変換結果の形態素解析の情報を利用できない
だけで、記憶保持されている構文解析情報KBTB内の
情報を、十分構文解析に生かすことができる。
【0093】また、上述の実施例においては、意味解析
を行っていないが、意味解析の結果も、形態素解析と構
文解析の解析結果と同様、記憶保持しておくことによっ
て、すでに変換出力されたかな漢字変換の意味的な情報
を意味解析に利用することができる。
【0094】また、前述の実施例においては、構文解析
を行っているが、構文解析を行わなくても、いわゆるA
I辞書と呼ばれている単語の共起関係を利用するかな漢
字変換において、すでに変換出力されているかな漢字変
換の情報を共起関係に当てはめることで、記憶保持して
いる解析結果を最適なかな漢字変換結果を決定するのに
生かすことができる。この場合は、形態素解析の結果の
みを記憶保持しておけば、図9のS9−2における構文
解析の変わりに、共起関係を用いて共起関係を見いだす
処理を行えばよい。この処理は、すでに公知である。
【0095】また、構文解析も単語の共起関係を利用す
る処理がなくても、変換出力された最後の文節の形態素
解析結果を記憶保持していれば、その情報を次のかな漢
字変換に生かすことができる。例えば、「赤い」という
文節を変換した後、「とり」と入力された場合、「赤
い」という文節の形態素解析結果を記憶保持していれ
ば、「赤い」という文節の活用形が連体形であることか
ら、「とり」のかな漢字変換結果を決定する際、名詞で
あるほうが望ましく、動詞の「取り」ではなく、名詞の
「鳥」を変換結果として選ぶことができる。
【0096】また、上記実施例においては、同音異義語
の中からかな漢字変換結果を選び出すために、すでに変
換出力されたかな漢字変換の解析結果を利用したが、こ
の記憶保持している解析結果は、文節の区切りを決定す
るためにも容易に利用できる。
【0097】また、上述の実施例においては、記憶保持
している解析結果と、入力された読みに対する解析結果
を同一のテーブル上に同一の形式で記憶しているが、必
ずしも、同一のテーブルに記憶保持する必要はないし、
同一の形式で記憶保持する必要もない。それぞれ、異な
る形式で異なるテーブルに記憶保持しても構わない。
【0098】また、上述の実施例においては、構文解析
はスタックを用いた手法を用いているが、構文解析とし
てどのような方式を採用しようとも、すでに変換出力さ
れたかな漢字変換結果に対する解析結果を、次のかな漢
字変換結果に生かすことができる。
【0099】また、上述の実施例において、図12のS
12−3において説明したように、すでに変換出力され
たかな漢字変換結果に対して記憶保持している解析結果
は、SLCTキーによりオペレータが選択した唯1つの
かな漢字変換結果に対する解析結果を保持するようにし
ているが、他のかな漢字変換候補に対する解析結果をす
べて記憶保持するようにしても構わない。その場合は、
オペレータが選んだ変換結果に対する解析結果がどれで
あるのかが分かるような情報を記憶しておく必要があ
る。
【0100】また、上述の実施例において、文節の区切
りが変わらない同音異義語のかな漢字変換候補を変更し
た時に、記憶保持している解析結果を変更しているが、
文節の区切りを変更する場合も、記憶保持している解析
結果を変更する必要がある。区切りを変更する際に形態
解析と構文解析を行うことで、形態素解析の情報と構文
解析の情報を容易に変更することができる。
【0101】また、上述の実施例において、前回のかな
漢字変換結果を出力し終ったカーソル位置と、今回のか
な漢字変換の読みを入力しようとしているカーソル位置
が異なった場合に、記憶保持している解析結果をクリア
しているが、クリアするタイミングは、この場合に限る
必要はない。例えば、前回のかな漢字変換結果を出力し
終えた後、続けてかな漢字変換の読みが入力されなかっ
た場合に、記憶保持している解析結果をクリアするよう
にしてもよい。この場合は、カーソル位置を記憶する必
要はない。また、前回出力したかな漢字変換結果が、編
集操作によって変更を受けた場合、例えば、削除された
ような場合も、例え、前回記憶しておいたカーソル位置
が同じであっても、記憶保持している解析結果をクリア
する必要がある。この場合は、例えば、記憶保持してい
る解析結果に対するかな漢字変換の範囲を記憶しておい
て、その範囲の文字列が変更を受けた場合に、クリアす
ればよい。
【0102】また、上述の実施例において、解析結果を
保持する必要がなくなることを検知する文字として、句
点を用いたが、句点に限る必要はまったくない。1文が
入力されて、解析結果を保持する必要がなくなる文字で
あれば、何でもよい。例えば、「?」や「!」などがあ
る。
【0103】また、上述の実施例において、解析結果を
保持する必要がなくなることを検知する手段として、文
字の情報を利用したが、構文解析が成功した時点で、解
析結果をクリアするようにしてもよい。例えば、S12
−7で、句点で変換されたかどうかを判定する変わり
に、構文解析情報KBTBに「文」のみが残っているか
どうか判定し、「文」のみが残っていれば、構文解析が
成功したとみなし、S12−9へ進んで、記憶保持して
いる解析結果をクリアしてもよい。
【0104】また、上述の実施例において、解析結果全
体を保持する必要があるかどうか判定し、必要でないと
判断されると、すべての解析結果をクリアしてしまう
が、必ずしも、解析結果全体が必要であるかどうか判定
する必要はない。解析結果の中から、次のかな漢字変換
に必要な情報と必要でない情報を分離し、必要でない情
報のみを削除するようにしてもよい。例えば、名詞句
は、次のかな漢字変換のために、名詞句を構成するすべ
ての情報を記憶保持しておく必要はない。例えば、「髪
の長い少女は」という名詞句は、「髪の」「長い」「少
女は」という文節から構成されているが、次のかな漢字
変換で必要とされているのは、名詞句の一番最後の文節
である「少女は」という文節のみである。この場合は、
「髪の」「長い」「少女は」というすべての文節の情報
を記憶保持しておく必要はなく、「少女は」という文節
の情報のみを残しておけばよい。
【0105】また、形態素解析情報KKTBの「単語
1」「単語2」や、構文解析情報KBTBの「共起情
報」には、単語そのものの情報しか格納していないが、
単語の意味分類の情報も一緒に格納するようにしてもよ
い。そうすることによって、共起パターンの状況を判定
する際、一々単語辞書を検索して単語の意味分類を検索
する必要がなくなる。
【0106】その他、本発明はその要旨を逸脱しない範
囲で種々変形して実施することができる。
【0107】
【発明の効果】以上の説明から明らかなように本発明に
よれば、かな漢字変換結果が出力された時に、変換結果
を求めるために利用した解析結果をクリアせずに記憶保
持し、記憶保持された解析結果を次回のかな漢字変換結
果を求めるために利用しているので、1文を区切って入
力された場合でも、それまでに変換された情報を用いて
変換結果を決定でき、正解率の高いかな漢字変換を実現
できる。
【0108】さらに本発明によれば、前回のかな漢字変
換結果が変更された場合に、前回のかな漢字変換の解析
結果も変換結果に合わせて変更する手段を設けることに
よって、状況に応じて適切なかな漢字変換結果を求める
変換精度の高いかな漢字変換を実現できる。
【0109】さらに本発明によれば、前回のかな漢字変
換の解析結果が有効であるかどうかを判定する手段を設
けることによって、状況に応じて利用する情報を選択し
て適切なかな漢字変換結果を求める変換精度の高いかな
漢字変換を実現できる。
【0110】さらに本発明によれば、記憶保持されてい
るかな漢字変換の解析結果の中から、次のかな漢字変換
を行うために必要な情報を選び出し、必要と判断された
解析結果の情報のみを記憶保持することによって、記憶
保持する解析結果を必要最低限に抑えることができ、必
要となるメモリ量を削減し、かな漢字変換処理時間を軽
減することができる。
【0111】さらに本発明によれば、前回のかな漢字変
換の解析結果を利用するかしないかのモードを設けて、
モードを切り替えることによって、ユーザの希望に合わ
せて、前回のかな漢字変換の解析結果を利用するかしな
いかを制御できるかな漢字変換を実現できる。
【0112】さらに本発明によれば、無効指示に基づい
て前回のかな漢字変換の解析結果を無効にすることによ
って、状況に応じて、前回のかな漢字変換の解析結果を
利用するかしないかを制御できるかな漢字変換を実現で
きる。
【図面の簡単な説明】
【図1】本発明の全体構成のブロック図である。
【図2】本発明の効果を従来技術とに比較において示す
操作例を示す図である。
【図3】本発明における構文規則辞書GDICの構成例
を示した図である。
【図4】本発明における共起パターン辞書KDICの構
成例を示した図である。
【図5】本発明における形態素解析情報KTTBと構文
解析情報KBTBの構成例を示した図である。
【図6】本発明における文字処理装置の動作を示すフロ
ーチャートである。
【図7】本発明におけるかな漢字入力の動作を示すフロ
ーチャートである。
【図8】本発明におけるかな漢字変換の動作を示すフロ
ーチャートである。
【図9】本発明における最適候補変換の動作を示すフロ
ーチャートである。
【図10】本発明における形態素解析情報KKTBの推
移の例を示した図である。
【図11】本発明における構文解析情報KBTBの推移
の例を示した図である。
【図12】本発明における候補選択の動作を示すフロー
チャートである。
【図13】本発明における変換候補変更の動作を示すフ
ローチャートである。
【図14】本発明における変換候補変更前の形態素解析
情報KKTBの例を示した図である。

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 かな漢字変換の対象となる読みを入力す
    る読み入力手段と、 前記読み入力手段によって入力された読みを、漢字かな
    混じり文に変換するかな漢字変換手段と、 前記かな漢字変換手段によって変換結果を出力した後
    も、前記かな漢字変換手段が変換結果を決定するために
    使用した解析結果を記憶保持する解析結果記憶保持手段
    とを具備し、 前記かな漢字変換手段は、前記解析結果記憶保持手段に
    格納されている解析結果を、前記読み入力手段によって
    入力された読みに対するかな漢字変換結果を決定するた
    めに利用することを特徴とする文字処理装置。
  2. 【請求項2】 請求項1において、さらに前記かな漢字
    変換手段によって出力されたかな漢字変換結果を、他の
    かな漢字変換結果に変更するかな漢字変換結果変更手段
    と、 前記かな漢字変換結果変更手段によって、かな漢字変換
    結果が変更された場合、前記解析結果記憶保持手段によ
    って記憶保持されている解析結果を、新しいかな漢字変
    換結果と対応が取れるように変更する解析結果変更手段
    とを具備することを特徴とする文字処理装置。
  3. 【請求項3】 請求項1において、さらに前記解析結果
    記憶保持手段によって記憶保持されている解析結果が有
    効かどうかを判定する解析結果有効判定手段を具備し、 前記解析結果有効判定手段によって、前記解析結果記憶
    保持手段によって記憶保持されている解析結果が有効で
    ないと判定された場合は、かな漢字変換手段は、前記解
    析結果記憶保持手段に格納されている解析結果を利用し
    ないで、前記読み入力手段によって入力された読みに対
    するかな漢字変換結果を決定することを特徴とする文字
    処理装置。
  4. 【請求項4】 請求項1において、さらに前記解析結果
    記憶保持手段によって記憶保持されている解析結果の中
    で、次のかな漢字変換のために必要な情報を選び出す必
    要解析結果選定手段を具備し、 前記解析結果記憶保持手段は、前記必要解析結果選定手
    段によって、必要と判断された情報のみを記憶保持する
    ことを特徴とする文字処理装置。
  5. 【請求項5】 請求項1において、さらに前記かな漢字
    変換手段が前記解析結果記憶保持手段によって記憶保持
    されている解析結果を利用するモードと利用しないモー
    ドのどちらか一方を記憶する解析結果利用モード記憶手
    段と、 前記解析結果利用モード記憶手段に記憶されているモー
    ドを切り替える解析結果利用モード切り替え手段とを具
    備し、 前記かな漢字変換手段は、解析結果利用モード記憶手段
    によって記憶されているモードが、解析結果を利用する
    モードである時のみ、前記解析結果記憶保持手段に格納
    されている解析結果を、前記読み入力手段によって入力
    された読みに対するかな漢字変換結果を決定するために
    利用することを特徴とする文字処理装置。
  6. 【請求項6】 請求項1において、さらに前記解析結果
    記憶保持手段によって記憶保持されている解析結果を無
    効指示に基づいて無効にする解析結果無効化手段を具備
    し、 前記かな漢字変換手段は、前記解析結果無効化手段によ
    って前記解析結果記憶保持手段に格納されている解析結
    果が無効になっている場合は、前記解析結果記憶保持手
    段に格納されている解析結果を利用しないで、前記読み
    入力手段によって入力された読みに対するかな漢字変換
    結果を決定することを特徴とする文字処理装置。
JP5327956A 1993-12-24 1993-12-24 文字処理装置 Pending JPH07182334A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5327956A JPH07182334A (ja) 1993-12-24 1993-12-24 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5327956A JPH07182334A (ja) 1993-12-24 1993-12-24 文字処理装置

Publications (1)

Publication Number Publication Date
JPH07182334A true JPH07182334A (ja) 1995-07-21

Family

ID=18204898

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5327956A Pending JPH07182334A (ja) 1993-12-24 1993-12-24 文字処理装置

Country Status (1)

Country Link
JP (1) JPH07182334A (ja)

Similar Documents

Publication Publication Date Title
JPH07182334A (ja) 文字処理装置
JPS59100941A (ja) 仮名漢字変換装置
JPH0677252B2 (ja) 和文データ入力処理装置
JP3809238B2 (ja) 文書処理方法及びその装置
JP2662392B2 (ja) 文字処理装置
JPH0567079A (ja) 文字処理装置
JP3524189B2 (ja) 文字処理装置
JPH03164975A (ja) 機械翻訳方法及び機械翻訳装置
JP2832003B2 (ja) 文字処理装置
JPH0981555A (ja) 文書処理装置及びその方法
JPH05189421A (ja) 古文かな漢字変換装置及び方法
JP2003173332A (ja) かな漢字変換方式及び文字処理装置
JPH10187705A (ja) 文書処理方法及びその装置
JPS6257055A (ja) 日本語ワ−ド・プロセツサ
JPH0442350A (ja) 文字処理装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH07200568A (ja) 文字処理装置
JPH05135010A (ja) 文字処理方法及び装置
JPH05233604A (ja) 単語登録方法
JPH0327469A (ja) かな漢字変換装置
JPH0488550A (ja) 文字処理装置
JPS60110074A (ja) 文字処理装置
JPH01204174A (ja) 文字処理装置
JPH0844731A (ja) 文書編集装置
JPS63259763A (ja) 文字処理装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040416