JPH07182334A

JPH07182334A - 文字処理装置

Info

Publication number: JPH07182334A
Application number: JP5327956A
Authority: JP
Inventors: Kazuyo Ikeda; 和世池田
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1993-12-24
Filing date: 1993-12-24
Publication date: 1995-07-21

Abstract

(57)【要約】【目的】例えば１文を区切って入力したような場合で
も、正解率の高いかな漢字変換を実現すること。【構成】かな漢字変換の対象となる読みを入力するキ
ーボードＫＢと、キーボードＫＢによって入力された読
みを、漢字かな混じり文に変換するかな漢字変換手段を
構成するＣＰＵと、かな漢字変換によって変換結果を出
力した後も、かな漢字変換結果を決定するために使用し
た解析結果を記憶保持する解析結果記憶保持手段を構成
するＲＡＭとを具備し、ＣＰＵは、ＲＡＭに格納されて
いる解析結果を、キーボードＫＢによって入力された読
みに対するかな漢字変換結果を決定するために利用す
る。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、かな漢字変換処理を有
する文字処理装置に関する。

【０００２】

【従来の技術】最近、入力された読みをかな漢字混じり
文に変換するかな漢字変換を用いて、日本語文章を作成
していく日本語ワードプロセッサが幅広く利用されてい
る。

【０００３】ところが、日本語には、読みが同じで意味
が異なる単語や句が多数存在するという性質があり、こ
れに対処するために、同音異義語を状況に応じて正しく
変換出力する同音異義語選択技術がかな漢字変換処理に
おいて重要な技術になっている。また、日本語は単語単
位に区切れておらず、べた書きで行われるために、かな
漢字変換の読みも区切りを入れずに入力されるため、単
語の区切り位置を決定する技術も、かな漢字変換処理に
おいて重要な技術になっている。

【０００４】同音異義語選択技術や、単語の区切り位置
を決定する技術として、いわゆるＡＩ辞書と呼ばれてい
る単語対の共起パターンを利用したり、構文解析技術を
利用したりして、単語間の関係を利用するものがある。

【０００５】

【発明が解決しようとする課題】しかしながら、従来の
かな漢字変換においては、単語間の関係を利用する技術
は、その技術を適用する範囲が、一度に入力されたかな
漢字変換の対象となる読みに限定されていたために、１
文をすべて入力せず、きりのよいところで区切って入力
する場合などには、この技術を利用した同音異義語選択
技術や単語の区切り位置を決定する技術の効果を生かせ
ないという欠点があった。

【０００６】例えば、「雨が」と「降る」が共起パター
ンとして辞書中に登録されている場合、図２に示すよう
に、「雨が昨日降った。」という文をかな漢字変換させ
る場合、図２（ａ）から図２（ｅ）に示すように、「雨
が」と「昨日」とに分けて変換した後、図２（ｆ）に示
すように、「ふった」をかな漢字変換すると、かな漢字
変換の対象として「ふった」しかとらえていないため
に、「雨が」と「降る」の共起パターンを利用すること
ができず、図２（ｇ）に示すように、「振った」と誤変
換されてしまう場合があった。

【０００７】ここで、図２において、（ｉ）のように網
かけが施してある部分は、かな漢字変換の対象となる読
みと他のかな漢字変換候補を表示可能なかな漢字変換結
果を表示している状態である。（ｊ）はかな漢字変換の
読みを入力する位置を示すカーソルである。ＣＮＶＴキ
ーは、かな漢字変換を起動するキーであり、ＳＬＣＴキ
ーは、かな漢字変換結果を他の変換候補が表示できる状
態から、表示できない状態に確定するキーであり、ＮＥ
ＸＴキーは、かな漢字変換結果の他の変換候補を表示す
るキーである。

【０００８】そこで本発明の目的は以上のような問題を
解消した文字処理装置を提供することにある。

【０００９】

【課題を解決するための手段】本発明によれば、かな漢
字変換によって変換結果を出力した後も、変換結果を決
定するためにかな漢字変換が使用した解析結果を記憶保
持する解析結果記憶保持手段を設け、かな漢字変換は、
入力された読みに対する解析結果だけでなく、解析結果
記憶保持手段によって記憶保持されている解析結果も使
用して、入力された読みに対するかな漢字変換結果を決
定するようにしたものである。

【００１０】すなわち、かな漢字変換の変換結果を出力
した後も、かな漢字変換の解析結果を記憶保持している
ので、１文をすべて入力せず、区切って入力された場合
でも、あたかも、１文が１度に入力されたように、１文
のすべての情報を用いることができ、同音異義語選択技
術や単語の区切り位置を決定する技術の効果を十分に発
揮できる。

【００１１】例えば、図２（ａ）から図２（ｅ）までの
操作を行った後、図２（ｆ）に示すように、「ふった」
をかな漢字変換すると、「雨が」と「昨日」という文節
をかな漢字変換する時に用いた解析結果を記憶保持して
いるので、「雨が」と「降る」の共起パターンを利用す
ることができ、図２（ｈ）に示すように、「降った」と
正しく変換することができる。

【００１２】さらに本発明によれば、かな漢字変換の変
換結果が変更された場合に、記憶保持されているかな漢
字変換の解析結果も、新しい変換結果に対応させて変更
する手段を設けることによって、記憶保持されている解
析結果とかな漢字変換結果との間で矛盾が発生しないよ
うにしたものである。

【００１３】さらに本発明によれば、記憶保持されてい
る前回のかな漢字変換の解析結果が、今回のかな漢字変
換を行う際、有効であるかどうかを判定する手段を設け
ることによって、前回のかな漢字変換の解析結果が有効
であると判定された時のみ、かな漢字変換が前回のかな
漢字変換の解析結果を利用するようにしたものである。

【００１４】さらに本発明によれば、記憶保持されてい
るかな漢字変換の解析結果の中から、次のかな漢字変換
を行うために必要な情報を選び出す手段を設けることに
よって、解析結果記憶保持手段は、必要な解析結果の情
報のみを記憶保持することになるので、記憶保持する解
析結果を必要最低限に抑えることができ、必要となるメ
モリ量を削減し、かな漢字変換処理時間を軽減すること
ができるようにしたものである。

【００１５】さらに本発明によれば、前回のかな漢字変
換の解析結果を次のかな漢字変換に利用するモードと利
用しないモードの２つのモードを設け、このモードを切
り替える手段によって、かな漢字変換が前回のかな漢字
変換の解析結果を利用するかどうかを制御できるように
したものである。

【００１６】さらに本発明によれば、前回のかな漢字変
換の解析結果を無効指示に基づいて無効化する手段を設
けることによって、かな漢字変換が前回のかな漢字変換
の解析結果を利用するかどうかを、ユーザが制御できる
ようにしたものである。

【００１７】

【実施例】以下図面を参照しながら本発明を詳細に説明
する。

【００１８】図１は本発明の全体構成の一例である。

【００１９】図示の構成において、ＣＰＵは、マイクロ
プロセッサであり、文字処理のための演算、論理判断等
を行ない、アドレスバスＡＢ、コントロールバスＣＢ、
データバスＤＢを介して、それらのバスに接続された各
構成要素を制御する。

【００２０】アドレスバスＡＢはマイクロプロセッサＣ
ＰＵの制御の対象とする構成要素を指示するアドレス信
号を転送する。コントロールバスＣＢはマイクロプロセ
ッサＣＰＵの制御の対象とする各構成要素のコントロー
ル信号を転送して印加する。データバスＤＢは各構成機
器相互間のデータ転送を行なう。

【００２１】次にＲＯＭは、読出し専用の固定メモリで
ある。ＲＯＭに設けられているＰＡは、図６〜図１３に
つき後述するマイクロプロセッサＣＰＵによる制御の手
順を記憶させたプログラムエリアである。

【００２２】また、ＲＡＭは、１ワード１６ビットの構
成の書込み可能のランダムアクセスメモリであって、各
構成要素からの各種データの一時記憶に用いる。ＲＡＭ
は、解析結果保持モードＨＭＯＤ，単語辞書ＷＤＩＣ，
構文規則辞書ＧＤＩＣ，共起パターン辞書ＫＤＩＣ，形
態素解析情報ＫＴＴＢ，構文解析情報ＫＢＴＢ，変換開
始文節番号ＢＮＵＭ，構文解析情報スタックポインタＳ
ＴＯＰ，変換結果出力位置ＣＵＲＰ，読みバッファＹＢ
ＵＦで構成されている。

【００２３】解析結果保持モードＨＭＯＤは、かな漢字
変換の解析結果を、かな漢字変換結果出力後も保持する
かどうかのモードの状態を示すグラフであり、この値が
１であれば、かな漢字変換の解析結果を保持するモード
であることを意味し、０であれば、かな漢字変換の解析
結果を保持しないモードであることを意味する。

【００２４】単語辞書ＷＤＩＣは、かな漢字変換を行う
ための単語の情報を格納したものであり、単語の読みと
表記と品詞と意味分類を対応させた辞書である。単語辞
書はかな漢字変換を行う文字処理装置で一般的に用いら
れており、特に詳細な説明は行わない。

【００２５】構文規則辞書ＧＤＩＣは、構文解析で用い
られる構文規則を格納した辞書であり、詳細は図３を用
いて後述する。

【００２６】共起パターン辞書ＫＤＩＣは、構文解析で
用いる構文規則の制約を記述した辞書であり、句を構成
する単語の共起パターンを記述するものである。詳細は
図４を用いて後述する。

【００２７】形態素解析情報ＫＴＴＢは、形態素解析し
た結果求められた形態素の情報を文節単位に格納するテ
ーブルであり、詳細は図５を用いて後述する。

【００２８】構文解析情報ＫＢＴＢは、構文解析する過
程の情報を格納するスタックであり、詳細は図５を用い
て後述する。

【００２９】変換開始文節番号ＢＮＵＭは、形態素解析
情報ＫＴＴＢにおいて、かな漢字変換の対象となる先頭
の文節番号を示す変数であり、詳細は図５を用いて後述
する。

【００３０】構文解析情報スタックポインタＳＴＯＰ
は、構文解析情報ＫＢＴＢのスタックの先頭を示すポイ
ンタであり、詳細は図５を用いて後述する。

【００３１】変換結果出力位置ＣＵＲＰは、かな漢字変
換結果を出力した時に、次のかな漢字変換結果を出力す
る位置を記憶する変数である。かな漢字変換結果を出力
した直後のカーソル位置のｘ座標とｙ座標を記憶するこ
とにより、出力する位置を記憶する。

【００３２】読みバッファＹＢＵＦは、かな漢字変換の
対象となる文字列を格納するバッファである。かな漢字
変換は、このバッファに蓄えられた文字列に対して、最
適なかな漢字変換結果を求める。読みバッファはかな漢
字変換を行う文字処理装置で一般的に用いられており、
特に詳細な説明は行わない。

【００３３】ＫＢはキーボードであって、アルファベッ
トキー、ひらがなキー、カタカナキー、句点等の文字記
号入力キー、及び、カーソル移動を指示するカーソル移
動キー等のような各種のファンクションキーを備えてい
る。ファンクションキーとしては、ＭＯＤＥ，ＣＮＶ
Ｔ，ＮＥＸＴ，ＳＬＣＴ，ＭＯＶＥ，ＣＬＥＲを備えて
いる。

【００３４】ＭＯＤＥは、かな漢字変換結果を出力した
後も解析結果を保持するかどうかのモードを切り替える
キーである。ＣＮＶＴは、入力した文字列に対して、か
な漢字変換を指示するキーである。ＮＥＸＴは、かな漢
字変換によって求められた変換候補に対して、次の変換
候補を出力するように指示するキーである。ＳＬＣＴ
は、表示されているかな漢字変換の候補を選んで確定す
るキーである。ＭＯＶＥはかな漢字変換結果の対象文節
を移動するキーである。ＣＬＥＲは、記憶保持されてい
るかな漢字変換の解析結果をクリアするキーである。

【００３５】ＤＩＳＫは文書データ等を記憶するための
外部メモリである。文書データ等は必要に応じて保管さ
れ、また、保管されたデータはキーボードの指示によ
り、必要な時呼び出される。

【００３６】ＣＲはカーソルレジスタである。ＣＰＵに
より、カーソルレジスタの内容を読み書きできる。後述
するＣＲＴコントローラＣＲＴＣは、ここに蓄えられた
アドレスに対する表示装置ＣＲＴ上の位置にカーソルを
表示する。

【００３７】ＤＢＵＦは表示用バッファメモリで、表示
すべきデータのパターンを蓄える。

【００３８】ＣＲＴＣはカーソルレジスタＣＲ及びバッ
ファＤＢＵＦに蓄えられた内容を表示器ＣＲＴに表示す
る役割を担う。

【００３９】また、ＣＲＴは陰極線管等を用いた表示装
置であり、その表示装置ＣＲＴにおけるドット構成の表
示パターンおよびカーソルの表示をＣＲＴコントローラ
で制御する。

【００４０】さらに、ＣＧはキャラクタジェネレータで
あって、表示装置ＣＲＴに表示する文字、記号のパター
ンを記憶するものである。

【００４１】かかる各構成要素からなる本発明文字処理
装置においては、キーボードＫＢからの各種の入力に応
じて作動するものであって、キーボードＫＢからの入力
が供給されると、まず、インタラプト信号がマイクロプ
ロセッサＣＰＵに送られ、そのマイクロプロセッサＣＰ
ＵがＲＯＭ内に記憶してある各種の制御信号を読出し、
それらの制御信号に従って、各種の制御が行なわれる。

【００４２】図３は、構文規則辞書ＧＤＩＣの構成例を
説明した図である。構文規則は、句構造文法の句構造規
則に見られるような、書き換え規則であり、句と、その
句を構成する要素を対応させたものである。構文規則
は、構文解析において用いられる。図中において、
「＋」は、句を構成する要素が、要素が並ぶ順番通りに
無条件に結合して、句を構成できることを意味してい
る。したがって、図中の規則の一つ（ｒｕｌｅ２）
は、「副詞」と「動詞」がこの順番に連続して出現すれ
ば、結合して、「動詞句」になれることを示している。
図中において、「＊」は、句を構成する要素が、図４に
て後述する共起パターンの条件を満たした時のみ、要素
が並ぶ順番通りに結合して、句を構成できることを意味
している。したがって、（ｒｕｌｅ１）は、「名詞
句」と「動詞句」がこの順番通りに連続して出現した場
合、「名詞句」と「動詞句」が図４にて後述する共起パ
ターンの条件を満たしている時のみ、「文」になれるこ
とを意味している。構文規則を次々と適用して、「文」
になれれば、構文解析は成功したことになる。

【００４３】図４は、共起パターン辞書ＫＤＩＣの構成
例を説明した図である。共起パターン辞書ＫＤＩＣは、
単語とその単語と共起するパターンを対応させた辞書で
あり、単語を見出しに格納し、その単語と共起するパタ
ーンを共起パターンに格納する。共起パターンには、単
語を直接記述することも、単語の属する意味分類を記述
することもできる。図中の共起パターンにおいて、
〈雨〉は、「雨」という単語そのものを意味しており、
［人］は意味分類が「人」であるようなすべての単語を
意味している。共起パターンにおいて、（が）や（を）
は、それぞれ、格助詞「が」や格助詞「を」に相当する
助詞を意味している。また、「／」は、文節の区切りを
意味している。したがって、（ｐａｔｔｅｒｎ１）
は、「降る」という単語が、「雨」という単語に助詞
（が）が結合した文節と共起することを示しており、
（ｐａｔｔｅｒｎ２）は、「振る」という単語が、意
味分類が「人」である単語と助詞（が）が結合した文節
と、意味分類が［棒］である単語と助詞（を）が結語し
た文節と共に共起することを示している。日本語では、
省略が多いので、「／」で区切られた共起パターンは、
そのいずれか１つでも出現すれば、共起可能なものとす
る。図中の例から、例えば、「振る」という単語は、意
味分類が［棒］である単語と助詞（を）が結合した文節
のみとでも、共起可能である。

【００４４】図５（ａ）は、形態素解析情報ＫＴＴＢの
構成例を説明した図である。形態素解析情報ＫＴＴＢ
は、文節番号と、文節の読みと、文節を構成する単語を
対応させて、形態素解析の結果求まった単語を文節単位
に管理している。図中において、文節番号が１の文節の
読みは、「あめが」であり、その文節は、名詞〈雨〉と
格助詞（が）から構成されていることを示している。文
節番号は、最初に、かな漢字変換された文節から順番に
番号がふられる。形態素解析情報ＫＴＴＢには、かな漢
字変換の対象となる文字列に対する形態素解析の結果だ
けでなく、すでにかな漢字変換を終えて出力した文字列
に対する形態素結果を格納することができる。変換開始
文節番号ＢＮＵＭによって、この２種類の形態素解析結
果を識別できる。変換開始文節番号ＢＮＵＭには、かな
漢字変換の対象となる文字列に対する形態素結果の先頭
の文節の番号が格納されるので、変換開始文節番号ＢＮ
ＵＭより小さい文節番号を持つ文節は、すでにかな漢字
変換を終えて出力した文字列に対する形態素結果という
ことになる。図中で「φ」が格納されている欄は、情報
が存在しないことを意味する。図５（ａ）は、図２
（ｃ）に示したように、「きのう」という読みをかな漢
字変換する時の、形態素解析情報ＫＴＴＢの例であり、
この場合は、変換開始文節番号ＢＮＵＭは２である。し
たがって、この場合は、「あめが」という文節が、すで
にかな漢字変換されて出力されている。同じ文節の位置
に対しては、同じ文節番号がつけられるので、「きの
う」という読みに対する名詞〈機能〉と副詞〈昨日〉２
種類の文節に対して、同じ文節番号がふられている。

【００４５】図５（ｂ）は、構文解析情報ＫＢＴＢの構
成例を説明した図である。構文解析情報ＫＢＴＢは、構
文解析の過程を記憶するスタックであり、１つの文節に
対する情報が、構文規則を適用するための句情報と、共
起パターンの条件を判定するために必要な共起情報とで
対応づけられてスタックに積まれる。スタックの先頭
は、構文解析情報スタックポインタＳＴＯＰで示され
る。図５（ｂ）は、図５（ａ）の形態素結果に対して、
名詞〈機能〉の文節を用いて、構文解析を行った例であ
る。文節番号１と文節番号２の文節をスタックに積ん
で、構文規則を適用した結果、これ以上構文規則が適用
できなくなった状態である。スタック中に、「文」とい
う句情報が唯一残っていれば、構文解析に成功したこと
になる。この例では、その状態になっていないので、構
文解析に失敗した状態である。

【００４６】上述の実施例のＰＡに格納された手順の動
作をフローに従って説明する。

【００４７】図６は本発明文字処理装置の動作を示すフ
ローチャートである。

【００４８】Ｓ６−１はキーボードからのデータを取り
込む処理である。Ｓ６−２で取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。

【００４９】文字キーが入力された時はＳ６−３に分岐
し、図７に詳述するかな漢字入力処理が行なわれる。か
な漢字入力処理が行なわれた後、Ｓ６−７へ進む。

【００５０】ＭＯＤＥキーが入力されたときはＳ６−４
に分岐し、かな漢字変換の解析結果を保持するモードと
保持しないモードの切替を行う。かな漢字変換の解析結
果を変換結果出力後も保持するモードであれば保持しな
いモードに、保持しないモードであれば保持するモード
に切り替える。すなわち、解析結果保持モードＨＭＯＤ
の値を調べ、１であれば０に、０であれば１に切り替え
る。切替を行った後Ｓ６−７へ進む。

【００５１】ＣＬＥＲキーが入力された時はＳ６−５に
分岐し、記憶保持されているかな漢字変換の解析結果を
クリアする。すなわち、形態素解析情報ＫＴＴＢをクリ
アし、構文解析情報ＫＢＴＢをクリアし、変換開始文節
番号ＢＮＵＭに１を代入し、構文解析情報スタックポイ
ンタＳＴＯＰをスタックの底に指すようにする。処理を
行った後Ｓ６−７へ進む。

【００５２】その他のキーのときはＳ６−６に分岐し、
挿入、削除等の通常の文字処理装置において行なわれる
その他の処理が行なわれる。これらの処理は同種の文字
処理装置において一般に行われている処理であり、公知
であるので特に記述しない。処理が行われた後Ｓ６−７
に進む。

【００５３】Ｓ６−７は上述の処理の結果、変更された
部分を表示する表示処理である。文書中のデータ一文字
を読むごとに文字パターンに展開し、表示バッファに出
力するというように通常一般に行われている処理であ
る。処理を終えると、Ｓ６−１へ進む。

【００５４】図７は、Ｓ６−３のかな漢字入力処理を詳
細化したフローチャートである。

【００５５】Ｓ７−１は、現在のカーソル位置が、変換
結果出力位置ＣＵＲＰで記憶しているｘ座標とｙ座標に
一致するかどうか判定する。一致すれば、前回かな漢字
変換結果を出力した位置から続けて入力することにな
り、前回のかな漢字変換の解析結果を利用できるので、
解析結果をクリアせずにＳ７−３へ分岐する。一致しな
ければ、前回かな漢字変換結果を出力した位置から、続
けて入力することにならないので、前回のかな漢字変換
の解析結果を利用できず、解析結果をクリアするため
に、Ｓ７−２へ分岐する。

【００５６】Ｓ７−２は、前回までに出力したかな漢字
変換結果に対する解析結果をクリアする処理である。形
態素解析情報ＫＴＴＢをクリアし、構文解析情報ＫＢＴ
Ｂをクリアし、変換開始文節番号ＢＮＵＭに１を代入
し、構文解析情報スタックポインタＳＴＯＰをスタック
の底に指すようにする。処理を終えた後Ｓ７−３へ進
む。

【００５７】Ｓ７−３は、かな漢字変換の最適な変換結
果を求めるかな漢字変換処理である。かな漢字変換処理
は図８において詳述する。処理を終えた後Ｓ７−４へ進
む。

【００５８】Ｓ７−４は、Ｓ７−３において求められた
かな漢字変換の最適な候補を変更して変換結果を選択
し、かな漢字変換結果を出力する候補選択処理である。
候補選択処理は図１２において詳述する。処理を終える
と、かな漢字入力処理を終了する。

【００５９】図８は、Ｓ７−３のかな漢字変換処理を詳
細化したフローチャートである。

【００６０】Ｓ８−１は、Ｓ６−１およびＳ８−２にお
いて入力されたかな漢字変換の対象となるすべての文字
を読みバッファＹＢＵＦに格納する文字格納処理であ
る。格納した結果は、表示バッファに出力することで、
ＣＲＴに表示する。処理を終えた後Ｓ８−２へ進む。

【００６１】Ｓ８−２はキーボードからのデータを取り
込む処理である。Ｓ８−３で取り込まれたキーの種別を
判定し、各キーの処理ルーチンに分岐する。

【００６２】文字キーが入力された時はＳ８−１に分岐
する。

【００６３】ＣＮＶＴキーまたは、句点が入力された時
はＳ８−４に分岐し、読みバッファＹＢＵＦに格納され
た文字列に対する最適なかな漢字変換結果を求める最適
候補変換処理を行った後、かな漢字変換処理を終了す
る。最適候補変換処理は、図９に置いて詳述する。

【００６４】その他のキーが入力された時は、何も処理
を行わず、Ｓ８−２に分岐する。

【００６５】図９は、Ｓ８−４の最適候補変換処理を詳
細化したフローである。

【００６６】Ｓ９−１は、読みバッファＹＢＵＦに格納
された文字列に対して、単語辞書ＷＤＩＣを参照しなが
ら、形態素解析を行う形態素解析処理である。形態素解
析を行うに当たって、形態素解析情報ＫＴＴＢに格納さ
れている文節番号の最大値に１を加えた値を変換開始文
節番号ＢＮＵＭに格納する。形態素解析情報ＫＴＴＢに
文節の情報が格納されていなければ、変換開始文節番号
ＢＮＵＭに１を格納する。その後、形態素解析を行っ
て、解釈可能な文節と文節の構造を明らかにし、その結
果を形態素解析情報ＫＴＴＢに追加する。形態素解析
は、この種のかな漢字変換処理において一般に行われて
いる処理であり、公知であるので、特に詳細な説明は行
わない。Ｓ９−１の形態素解析が行われる具体例を、図
１０において後述する。

【００６７】Ｓ９−２は、形態素解析情報ＫＴＴＢと構
文解析情報ＫＢＴＢをもとに、構文規則辞書ＧＤＩＣと
共起パターン辞書ＫＤＩＣを参照しながら、構文解析を
行う構文解析処理である。形態素解析情報ＫＴＴＢか
ら、変換開始文節番号ＢＮＵＭよりも大きい文節番号を
持つ文節の候補を各文節番号に対して１つずつ選び出
し、構文解析情報ＫＢＴＢに積んでいき、構文解析情報
ＫＢＴＢのスタックの上方から構文規則辞書ＧＤＩＣを
参照して句を生成していき、構文解析を行い、最終的に
構文解析情報ＫＢＴＢ中に「文」という句のみが残れ
ば、構文解析に成功したものとみなす。このようなスタ
ックを用いた構文解析の方法は、構文解析手法として一
般的に行われており、公知であるので、詳細は記述しな
い。ただし、本実施例における構文規則は、共起パター
ンによる制約があるので、そのような制約がある構文規
則を適用する場合は、共起パターンによる制約を満たし
ているかどうかを共起パターン辞書ＫＤＩＣを参照して
判断し、制約条件を満たしている場合に限り、その構文
規則が適用可能になる。共起パターン辞書ＫＤＩＣの共
起パターンには、単語の意味分類が記述されている場合
があり、この場合は、構文解析情報ＫＢＴＢの共起情報
によって、単語辞書ＷＤＩＣを検索し、単語の意味分類
を求めて、共起パターンとマッチングを取る必要があ
る。構文解析に成功した場合は、Ｓ９−３へ進む。構文
解析に失敗した場合は、形態素解析情報ＫＴＴＢ中の文
節の候補を変更して構文解析を行う。すべての文節の候
補に対して構文解析に失敗した場合は、Ｓ９−３へ進
む。構文解析の具体例を、図１１において後述する。

【００６８】Ｓ９−３は、形態素解析および構文解析に
よって解析された結果に基づいて、変換開始文節番号Ｂ
ＮＵＭよりも大きい文節番号を持つ文節に対して、最適
な変換結果を決定する変換結果決定処理である。Ｓ９−
２において構文解析に成功していれば、成功した構文解
析で使用している文節の候補を最適な変換結果として決
定する。構文解析に成功したものがなければ、Ｓ９−１
の形態素解析のみで、最適な変換結果を決定する。構文
解析を行わず、形態素解析のみで変換結果を決定する処
理は、構文解析がないかな漢字変換において一般的に行
われており、公知であるので、特に詳細な説明は行わな
い。形態素解析によって変換結果を決定した場合は、決
定された文節の情報を構文解析情報ＫＢＴＢに積みなお
す。変換結果決定処理を終えた後、Ｓ９−４へ進む。

【００６９】Ｓ９−４は、Ｓ９−３で決定された最適な
かな漢字変換結果を表示する変換結果表示処理である。
この処理はかな漢字変換処理において一般的に行われて
おり、公知であるので、特に詳細な説明は行わない。変
換結果表示処理を終えた後、最適候補変換処理を終了す
る。

【００７０】図１０（ａ）は、図２（ｆ）に示すよう
に、「雨が昨日」と変換出力された後、「ふった。」が
入力されて、形態素解析が行われる前の形態素解析情報
ＫＴＴＢを示している。この状態で、形態素解析処理を
行うと、形態素解析情報ＫＴＴＢは図１０（ｂ）のよう
になる。この状態の変換開始文節情報ＢＮＵＭの値は３
である。文節番号３の文節が２種類解析されたことが分
かる。

【００７１】図１１は、Ｓ９−２の構文解析が行われる
具体例を示したものである。

【００７２】図１１（ａ）は、図１０（ｂ）の形態素解
析が終了した場合の、構文解析情報ＫＢＴＢの例であ
る。図１０（ｂ）の中から文節番号３に対して、動詞
〈振る〉連用形を選び、構文解析情報ＫＢＴＢに積む
と、図１１（ｂ）のようになる。

【００７３】図１１（ｂ）に対して、構文規則辞書ＧＤ
ＩＣを参照して適用可能な構文規則を検索すると、図３
の（ｒｕｌｅ２）が見つかる。（ｒｕｌｅ２）は、
共起パターンによる制約条件がないので、構文規則を適
用すると、図１１（ｃ）のようになる。

【００７４】図１１（ｃ）に対して、構文規則辞書ＧＤ
ＩＣを参照して適用可能な構文規則を検索すると、図３
の（ｒｕｌｅ１）が見つかる。（ｒｕｌｅ１）は、
共起パターンによる制約条件があるので、共起パターン
辞書ＫＤＩＣを参照して、共起情報の「振る」を見出し
とする共起パターンを検索すると、図４の（ｐａｔｔｅ
ｒｎ２）が見つかる。（ｐａｔｔｅｒｎ２）は、意
味分類によって記述されているので、単語辞書ＷＤＩＣ
を検索して、〈雨〉と言う単語の意味分類を求める。と
ころが、〈雨〉と言う単語の意味分類は［人］ではない
ので、（ｐａｔｔｅｒｎ２）の共起パターンの条件を
満たすことができず、（ｒｕｌｅ１）を適用すること
ができず、構文解析に失敗する。

【００７５】そこで、また、図１１（ａ）に戻り、図１
０（ｂ）の中から文節番号３に対して、動詞〈降る〉連
用形を選び、構文解析情報ＫＢＴＢに積んで、前述と同
様に図３の（ｒｕｌｅ２）を適用すると、図１１
（ｄ）のようになる。

【００７６】図１１（ｄ）に対する構文規則と、前述と
同様に図３の（ｒｕｌｅ１）が見つかり、共起情報の
「降る」を見出しとする共起パターンを検索すると、図
４の（ｐａｔｔｅｒｎ１）が見つかる。（ｐａｔｔｅ
ｒｎ１）の共起パターンと、名詞句に対する共起情報
が一致するので、（ｐａｔｔｅｒｎ１）の制約条件を
満たし、（ｒｕｌｅ１）が適用可能になり、（ｒｕｌ
ｅ１）を適用すると、図１１（ｅ）のようになり、構
文解析に成功する。

【００７７】図１２は、Ｓ７−４の候補選択処理を詳細
化したフローである。

【００７８】Ｓ１２−１はキーボードからのデータを取
り込む処理である。Ｓ１２−２で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。

【００７９】ＳＬＣＴキーが入力された時はＳ１２−３
に分岐し、形態素解析情報ＫＴＴＢから選択されなかっ
た文節の候補を取り除き、表示されているかな漢字変換
結果を出力する選択結果出力処理が行なわれる。変換結
果を出力する処理は、表示されている変換結果を文字列
として出力する処理であり、かな漢字変換において一般
に行われており、公知であるので、特に詳細な説明は行
わない。形態素解析情報ＫＴＴＢから選択されなかった
文節の候補を取り除く処理によって、例えば、図２
（ｅ）における形態素解析情報ＫＴＴＢが図５（ａ）で
あった時、ＳＬＣＴキーが入力されて「昨日」が選ばれ
た時、選択されなかった「機能」の情報が、形態素解析
情報ＫＴＴＢから取り除かれ、図１０（ａ）のようにな
る。処理を終えた後、Ｓ１２−６へ進む。

【００８０】ＭＯＶＥキーが入力された時はＳ１２−４
へ分岐し、対象となる文節を移動する対象文節移動処理
である。かな漢字変換結果の対象となる文節を移動する
処理は、この種のかな漢字変換において一般に行われて
おり、公知であるので、特に詳細な説明は行わない。処
理を終えた後、Ｓ１２−１へ進む。

【００８１】ＮＥＸＴキーが入力された時はＳ１２−５
へ分岐し、対象となる文節に対するかな漢字変換の別の
候補を表示させる変換候補変更処理である。変換候補変
更処理は、図１３において詳述する。処理を終えた後、
Ｓ１２−１へ進む。

【００８２】その他のキーが入力された時は、何も処理
を行わずＳ１２−１へ進む。

【００８３】Ｓ１２−６において、かな漢字変換の解析
結果を保持するモードであるかどうかを判定する。解析
結果保持モードＨＭＯＤの値が１であればかな漢字変換
の解析結果を保持するモードであり、０であれば保持し
ないモードである。保持するモードであればＳ１２−７
へ分岐し、保持しないモードであればＳ１２−９へ分岐
する。

【００８４】Ｓ１２−７は、表示されていたかな漢字変
換結果が、句点「。」によって変換されたかどうか判定
する処理である。Ｓ１２−３において出力された最後の
文字が句点であれば、句点によって変換されたことにな
り、句点でなければＣＮＶＴキーによって変換されたこ
とになる。句点で変換された場合はＳ１２−９へ分岐
し、句点で変換されなかった場合はＳ１２−８へ分岐す
る。

【００８５】Ｓ１２−８は、カーソル位置を記憶するカ
ーソル位置セーブ処理である。かな漢字変換結果を出力
することで、カーソル位置が変化し、新しいカーソル位
置のｘ座標とｙ座標を変換結果出力位置ＣＵＲＰに記憶
する。これは、次にかな漢字変換を開始した時に、今回
のかな漢字変換結果を出力した直後の同じ位置からかな
漢字変換を行うかどうか判定するためである。同じ位置
からかな漢字変換を行う場合は、今回までのかな漢字変
化における解析結果を利用できるが、位置が異なれば、
利用できない。処理を終えた後、候補選択処理を終了す
る。

【００８６】Ｓ１２−９は、かな漢字変換の解析結果を
クリアする処理である。形態素解析情報ＫＴＴＢをクリ
アし、構文解析情報ＫＢＴＢをクリアし、変換開始文節
番号ＢＮＵＭに１を代入し、構文解析情報スタックポイ
ンタＳＴＯＰをスタックの底を指すようにする。処理を
終えた後、候補選択処理を終了する。

【００８７】図１３は、Ｓ１２−５の変換候補変更処理
を詳細化したフローである。

【００８８】Ｓ１３−１は、対象となる文節の次のかな
漢字変換候補を取得する次候補取得処理である。次候補
取得処理は、形態素解析を行うことによって取得するこ
とができ、かな漢字変換において一般に行われており、
公知であるので特に詳細な説明は行わない。処理を終え
た後、Ｓ１３−２へ進む。

【００８９】Ｓ１３−２は、Ｓ１３−１によって取得さ
れた文節の候補で、形態素解析情報ＫＫＴＢと構文解析
情報ＫＢＴＢを変更する解析情報変更処理である。例え
ば、図２（ｄ）の状態で、ＮＥＸＴキーが入力されて図
２の（ｅ）のようになった場合、形態素解析情報ＫＫＴ
Ｂを、図１４から図１０（ａ）のように変更し、構文解
析情報ＫＢＴＢは、解析情報変更処理によって、図５
（ｂ）から図１１（ａ）のように変更する。形態素解析
情報ＫＫＴＢは、Ｓ１３−１で求まる形態素解析結果に
よって変更し、構文解析情報ＫＢＴＢは、新たに変更さ
れた形態素解析情報ＫＫＴＢの文節の情報を構文解析情
報ＫＢＴＢに積みなおすことによって変更する。処理を
終えた後、Ｓ１３−３へ進む。

【００９０】Ｓ１３−３は、Ｓ１３−１で取得したかな
漢字変換の候補を表示する次候補表示処理である。次候
補表示手段は、かな漢字変換において一般に行われてお
り、公知であるので特に詳細な説明は行わない。処理を
終えた後、変換候補変更処理を終了する。

【００９１】［他の実施例］なお、本発明は上述した実
施例に限定されるものではない。

【００９２】上述の実施例においては、形態素解析の結
果と構文解析の結果の両方を記憶保持していたが、必ず
しも両方を記憶保持する必要はない。形態素解析の結果
だけを形態素解析情報ＫＴＴＢに記憶保持していたとし
ても、形態素解析情報ＫＫＴＢに格納されている情報を
元に、構文解析を行ってその結果を構文解析情報ＫＢＴ
Ｂに格納する処理を、図７のＳ７−１の直前に行えば、
形態素解析の結果と構文解析の結果の両方を保持してい
ることと同等になる。また、構文解析情報ＫＢＴＢのみ
を記憶保持していたとしても、すでに変換出力されてい
るかな漢字変換結果の形態素解析の情報を利用できない
だけで、記憶保持されている構文解析情報ＫＢＴＢ内の
情報を、十分構文解析に生かすことができる。

【００９３】また、上述の実施例においては、意味解析
を行っていないが、意味解析の結果も、形態素解析と構
文解析の解析結果と同様、記憶保持しておくことによっ
て、すでに変換出力されたかな漢字変換の意味的な情報
を意味解析に利用することができる。

【００９４】また、前述の実施例においては、構文解析
を行っているが、構文解析を行わなくても、いわゆるＡ
Ｉ辞書と呼ばれている単語の共起関係を利用するかな漢
字変換において、すでに変換出力されているかな漢字変
換の情報を共起関係に当てはめることで、記憶保持して
いる解析結果を最適なかな漢字変換結果を決定するのに
生かすことができる。この場合は、形態素解析の結果の
みを記憶保持しておけば、図９のＳ９−２における構文
解析の変わりに、共起関係を用いて共起関係を見いだす
処理を行えばよい。この処理は、すでに公知である。

【００９５】また、構文解析も単語の共起関係を利用す
る処理がなくても、変換出力された最後の文節の形態素
解析結果を記憶保持していれば、その情報を次のかな漢
字変換に生かすことができる。例えば、「赤い」という
文節を変換した後、「とり」と入力された場合、「赤
い」という文節の形態素解析結果を記憶保持していれ
ば、「赤い」という文節の活用形が連体形であることか
ら、「とり」のかな漢字変換結果を決定する際、名詞で
あるほうが望ましく、動詞の「取り」ではなく、名詞の
「鳥」を変換結果として選ぶことができる。

【００９６】また、上記実施例においては、同音異義語
の中からかな漢字変換結果を選び出すために、すでに変
換出力されたかな漢字変換の解析結果を利用したが、こ
の記憶保持している解析結果は、文節の区切りを決定す
るためにも容易に利用できる。

【００９７】また、上述の実施例においては、記憶保持
している解析結果と、入力された読みに対する解析結果
を同一のテーブル上に同一の形式で記憶しているが、必
ずしも、同一のテーブルに記憶保持する必要はないし、
同一の形式で記憶保持する必要もない。それぞれ、異な
る形式で異なるテーブルに記憶保持しても構わない。

【００９８】また、上述の実施例においては、構文解析
はスタックを用いた手法を用いているが、構文解析とし
てどのような方式を採用しようとも、すでに変換出力さ
れたかな漢字変換結果に対する解析結果を、次のかな漢
字変換結果に生かすことができる。

【００９９】また、上述の実施例において、図１２のＳ
１２−３において説明したように、すでに変換出力され
たかな漢字変換結果に対して記憶保持している解析結果
は、ＳＬＣＴキーによりオペレータが選択した唯１つの
かな漢字変換結果に対する解析結果を保持するようにし
ているが、他のかな漢字変換候補に対する解析結果をす
べて記憶保持するようにしても構わない。その場合は、
オペレータが選んだ変換結果に対する解析結果がどれで
あるのかが分かるような情報を記憶しておく必要があ
る。

【０１００】また、上述の実施例において、文節の区切
りが変わらない同音異義語のかな漢字変換候補を変更し
た時に、記憶保持している解析結果を変更しているが、
文節の区切りを変更する場合も、記憶保持している解析
結果を変更する必要がある。区切りを変更する際に形態
解析と構文解析を行うことで、形態素解析の情報と構文
解析の情報を容易に変更することができる。

【０１０１】また、上述の実施例において、前回のかな
漢字変換結果を出力し終ったカーソル位置と、今回のか
な漢字変換の読みを入力しようとしているカーソル位置
が異なった場合に、記憶保持している解析結果をクリア
しているが、クリアするタイミングは、この場合に限る
必要はない。例えば、前回のかな漢字変換結果を出力し
終えた後、続けてかな漢字変換の読みが入力されなかっ
た場合に、記憶保持している解析結果をクリアするよう
にしてもよい。この場合は、カーソル位置を記憶する必
要はない。また、前回出力したかな漢字変換結果が、編
集操作によって変更を受けた場合、例えば、削除された
ような場合も、例え、前回記憶しておいたカーソル位置
が同じであっても、記憶保持している解析結果をクリア
する必要がある。この場合は、例えば、記憶保持してい
る解析結果に対するかな漢字変換の範囲を記憶しておい
て、その範囲の文字列が変更を受けた場合に、クリアす
ればよい。

【０１０２】また、上述の実施例において、解析結果を
保持する必要がなくなることを検知する文字として、句
点を用いたが、句点に限る必要はまったくない。１文が
入力されて、解析結果を保持する必要がなくなる文字で
あれば、何でもよい。例えば、「？」や「！」などがあ
る。

【０１０３】また、上述の実施例において、解析結果を
保持する必要がなくなることを検知する手段として、文
字の情報を利用したが、構文解析が成功した時点で、解
析結果をクリアするようにしてもよい。例えば、Ｓ１２
−７で、句点で変換されたかどうかを判定する変わり
に、構文解析情報ＫＢＴＢに「文」のみが残っているか
どうか判定し、「文」のみが残っていれば、構文解析が
成功したとみなし、Ｓ１２−９へ進んで、記憶保持して
いる解析結果をクリアしてもよい。

【０１０４】また、上述の実施例において、解析結果全
体を保持する必要があるかどうか判定し、必要でないと
判断されると、すべての解析結果をクリアしてしまう
が、必ずしも、解析結果全体が必要であるかどうか判定
する必要はない。解析結果の中から、次のかな漢字変換
に必要な情報と必要でない情報を分離し、必要でない情
報のみを削除するようにしてもよい。例えば、名詞句
は、次のかな漢字変換のために、名詞句を構成するすべ
ての情報を記憶保持しておく必要はない。例えば、「髪
の長い少女は」という名詞句は、「髪の」「長い」「少
女は」という文節から構成されているが、次のかな漢字
変換で必要とされているのは、名詞句の一番最後の文節
である「少女は」という文節のみである。この場合は、
「髪の」「長い」「少女は」というすべての文節の情報
を記憶保持しておく必要はなく、「少女は」という文節
の情報のみを残しておけばよい。

【０１０５】また、形態素解析情報ＫＫＴＢの「単語
１」「単語２」や、構文解析情報ＫＢＴＢの「共起情
報」には、単語そのものの情報しか格納していないが、
単語の意味分類の情報も一緒に格納するようにしてもよ
い。そうすることによって、共起パターンの状況を判定
する際、一々単語辞書を検索して単語の意味分類を検索
する必要がなくなる。

【０１０６】その他、本発明はその要旨を逸脱しない範
囲で種々変形して実施することができる。

【０１０７】

【発明の効果】以上の説明から明らかなように本発明に
よれば、かな漢字変換結果が出力された時に、変換結果
を求めるために利用した解析結果をクリアせずに記憶保
持し、記憶保持された解析結果を次回のかな漢字変換結
果を求めるために利用しているので、１文を区切って入
力された場合でも、それまでに変換された情報を用いて
変換結果を決定でき、正解率の高いかな漢字変換を実現
できる。

【０１０８】さらに本発明によれば、前回のかな漢字変
換結果が変更された場合に、前回のかな漢字変換の解析
結果も変換結果に合わせて変更する手段を設けることに
よって、状況に応じて適切なかな漢字変換結果を求める
変換精度の高いかな漢字変換を実現できる。

【０１０９】さらに本発明によれば、前回のかな漢字変
換の解析結果が有効であるかどうかを判定する手段を設
けることによって、状況に応じて利用する情報を選択し
て適切なかな漢字変換結果を求める変換精度の高いかな
漢字変換を実現できる。

【０１１０】さらに本発明によれば、記憶保持されてい
るかな漢字変換の解析結果の中から、次のかな漢字変換
を行うために必要な情報を選び出し、必要と判断された
解析結果の情報のみを記憶保持することによって、記憶
保持する解析結果を必要最低限に抑えることができ、必
要となるメモリ量を削減し、かな漢字変換処理時間を軽
減することができる。

【０１１１】さらに本発明によれば、前回のかな漢字変
換の解析結果を利用するかしないかのモードを設けて、
モードを切り替えることによって、ユーザの希望に合わ
せて、前回のかな漢字変換の解析結果を利用するかしな
いかを制御できるかな漢字変換を実現できる。

【０１１２】さらに本発明によれば、無効指示に基づい
て前回のかな漢字変換の解析結果を無効にすることによ
って、状況に応じて、前回のかな漢字変換の解析結果を
利用するかしないかを制御できるかな漢字変換を実現で
きる。

【図面の簡単な説明】

【図１】本発明の全体構成のブロック図である。

【図２】本発明の効果を従来技術とに比較において示す
操作例を示す図である。

【図３】本発明における構文規則辞書ＧＤＩＣの構成例
を示した図である。

【図４】本発明における共起パターン辞書ＫＤＩＣの構
成例を示した図である。

【図５】本発明における形態素解析情報ＫＴＴＢと構文
解析情報ＫＢＴＢの構成例を示した図である。

【図６】本発明における文字処理装置の動作を示すフロ
ーチャートである。

【図７】本発明におけるかな漢字入力の動作を示すフロ
ーチャートである。

【図８】本発明におけるかな漢字変換の動作を示すフロ
ーチャートである。

【図９】本発明における最適候補変換の動作を示すフロ
ーチャートである。

【図１０】本発明における形態素解析情報ＫＫＴＢの推
移の例を示した図である。

【図１１】本発明における構文解析情報ＫＢＴＢの推移
の例を示した図である。

【図１２】本発明における候補選択の動作を示すフロー
チャートである。

【図１３】本発明における変換候補変更の動作を示すフ
ローチャートである。

【図１４】本発明における変換候補変更前の形態素解析
情報ＫＫＴＢの例を示した図である。

Claims

【特許請求の範囲】

【請求項１】かな漢字変換の対象となる読みを入力す
る読み入力手段と、前記読み入力手段によって入力された読みを、漢字かな
混じり文に変換するかな漢字変換手段と、前記かな漢字変換手段によって変換結果を出力した後
も、前記かな漢字変換手段が変換結果を決定するために
使用した解析結果を記憶保持する解析結果記憶保持手段
とを具備し、前記かな漢字変換手段は、前記解析結果記憶保持手段に
格納されている解析結果を、前記読み入力手段によって
入力された読みに対するかな漢字変換結果を決定するた
めに利用することを特徴とする文字処理装置。
【請求項２】請求項１において、さらに前記かな漢字
変換手段によって出力されたかな漢字変換結果を、他の
かな漢字変換結果に変更するかな漢字変換結果変更手段
と、前記かな漢字変換結果変更手段によって、かな漢字変換
結果が変更された場合、前記解析結果記憶保持手段によ
って記憶保持されている解析結果を、新しいかな漢字変
換結果と対応が取れるように変更する解析結果変更手段
とを具備することを特徴とする文字処理装置。
【請求項３】請求項１において、さらに前記解析結果
記憶保持手段によって記憶保持されている解析結果が有
効かどうかを判定する解析結果有効判定手段を具備し、前記解析結果有効判定手段によって、前記解析結果記憶
保持手段によって記憶保持されている解析結果が有効で
ないと判定された場合は、かな漢字変換手段は、前記解
析結果記憶保持手段に格納されている解析結果を利用し
ないで、前記読み入力手段によって入力された読みに対
するかな漢字変換結果を決定することを特徴とする文字
処理装置。
【請求項４】請求項１において、さらに前記解析結果
記憶保持手段によって記憶保持されている解析結果の中
で、次のかな漢字変換のために必要な情報を選び出す必
要解析結果選定手段を具備し、前記解析結果記憶保持手段は、前記必要解析結果選定手
段によって、必要と判断された情報のみを記憶保持する
ことを特徴とする文字処理装置。
【請求項５】請求項１において、さらに前記かな漢字
変換手段が前記解析結果記憶保持手段によって記憶保持
されている解析結果を利用するモードと利用しないモー
ドのどちらか一方を記憶する解析結果利用モード記憶手
段と、前記解析結果利用モード記憶手段に記憶されているモー
ドを切り替える解析結果利用モード切り替え手段とを具
備し、前記かな漢字変換手段は、解析結果利用モード記憶手段
によって記憶されているモードが、解析結果を利用する
モードである時のみ、前記解析結果記憶保持手段に格納
されている解析結果を、前記読み入力手段によって入力
された読みに対するかな漢字変換結果を決定するために
利用することを特徴とする文字処理装置。
【請求項６】請求項１において、さらに前記解析結果
記憶保持手段によって記憶保持されている解析結果を無
効指示に基づいて無効にする解析結果無効化手段を具備
し、前記かな漢字変換手段は、前記解析結果無効化手段によ
って前記解析結果記憶保持手段に格納されている解析結
果が無効になっている場合は、前記解析結果記憶保持手
段に格納されている解析結果を利用しないで、前記読み
入力手段によって入力された読みに対するかな漢字変換
結果を決定することを特徴とする文字処理装置。