JP3873293B2

JP3873293B2 - 仮名漢字変換装置および仮名漢字変換方法

Info

Publication number: JP3873293B2
Application number: JP32355694A
Authority: JP
Inventors: 庸雄河西; 隆志山村
Original assignee: Seiko Epson Corp
Current assignee: Seiko Epson Corp
Priority date: 1994-11-30
Filing date: 1994-11-30
Publication date: 2007-01-24
Anticipated expiration: 2022-01-24
Also published as: JPH08161325A

Description

【０００１】
【産業上の利用分野】
本発明は、仮名漢字変換装置および仮名漢字変換方法に関し、詳しくは単語間の係り受けの情報を用いて、文節を構成する単語の漢字候補の選択に利用する仮名漢字変換装置および仮名漢字変換方法に関する。
【０００２】
【従来の技術】
従来、キーボードなどから入力された仮名文字列を、所望の仮名漢字混じり文に変換する仮名漢字変換装置が、日本語文の入力装置として、あるいは日本語文の編集装置として、種々提案されている。こうした仮名漢字変換装置は、使用者が単語や文節の区切り位置をいちいち指定する必要がなく、しかも変換後の文字列は使用者が望んだ表記となるものが望まれている。日本語には、同音異議語や同訓異議語が多数存在することから、誤りなく所望の仮名漢字混じり文を得るためには、おそらく最終的には文の意味を解析しなければならないが、意味を解析するためには、少なくとも有機的に関連づけられた数万に上る言葉の知識ベースが必要となり、実現は極めて困難である。
【０００３】
そこで、従来の仮名漢字変換装置では、文節分かち書きの処理や、同音異議語の選択における学習処理を工夫し、意味の解析なしで、使用者が望む結果を得るよう試みている。文節分かち書きの処理としては、２文節を基本単位とし成り立ち得る文節の中で最長の文節が得られる２文節を第１候補とする２文節最長一致法や、文節を構成する単語の候補となり得る単語および単語同士の組合わせにコストを付け、この点数が所定の条件を満たす文節を第１候補とする最小コスト法などがある。また、学習処理には、同音異議語の中から直前に使用者が選択した単語を最優先で次回の候補とする同音異議語の学習や、ある単語を含んだ文節の長さとして直前に使用者が指定した長さを最優先とする文節長の学習などが知られている。
【０００４】
更に、最近では、単語同士の特定の関係（例えば、「熱いお茶」の「熱い」と「お茶」、あるいは「暑い夏」の「暑い」と「夏」）に着目し、この関係を記憶した辞書を用意することで、一方の単語（例えば「お茶」）が特定されたとき、この単語に関係のある言葉（例えば「あつい」の候補のうちの「熱い」）を第１候補として選択するものも提案されている（例えば特開平３−１０５６６４号の「かな漢字変換装置」や特開平４−２７７８６１号公報の「かな漢字変換装置」など）。こうした単語間の特定の関係は、「係り受け」あるいは「共起」と呼ばれる。
【０００５】
【発明が解決しようとする課題】
しかしながら、現実に用いられている言語の構文規則は極めて複雑であり、係り受けの関係をもれなく辞書に用意することは、極めて困難であった。また、特定の個人が作成する日本語文に総ての係り受けが必要となる訳ではなく、またあらゆる係り受けの存在を想定した辞書を作成すると、どんな文節間にも係り受けが成立してしまいかねず、仮名漢字変換の精度を高めることにならない場合も考えられた。
【０００６】
更に、日本語には、様々な文型があり、例えば「赤い」＋「花」と「花が」＋「赤い」といった関係、あるいは「野菜を」＋「食べる」と「野菜を」＋「食べさせる」と「野菜が」＋「食べられる」など使役や受動の関係があり、これらの関係も含めて係り受け関係が成立するか否かを示す辞書を作ろうとすると、辞書が膨大なものになってしまうという問題があった。
【０００７】
本発明の仮名漢字変換装置および仮名漢字変換方法は、こうした問題を明らかにし、係り受けの関係を利用して所望の仮名漢字混じり文を得ることを目的としてなされ、次の構成を採った。
【０００８】
【課題を解決するための手段および作用】
請求項１の仮名漢字変換装置は、
入力された仮名文字列から、文法辞書を参照して、仮名漢字混じり文字列候補を生成する仮名漢字変換装置であって、
前記入力された仮名文字列を、前記文法辞書を参照して文節分かち書きする分かち書き手段と、
該分かち書きされた各文節において、該文節を構成する単語を変換済みの形態で示す候補単語表示手段と、
文節を単位として、該文節を構成する単語同士の係り受けの情報を記憶した係り受け情報辞書と、
前記分かち書きされた一つの文節を起点とし、該係り受け情報辞書を参照して他の文節との係り受けの存在を、検定する係り受け検定手段と、
該係り受けの検定により係り受け関係の成立が検定された文節の少なくとも一方の文節において、前記候補単語表示手段により表示された単語とは異なる単語が選択されたとき、該選択された単語を、係り受け情報として学習する係り受け学習手段と
を備え、
前記係り受け学習手段は、
候補単語表示手段により表示された単語とは異なる単語が選択されたとき、該単語が係り受け関係の成立が検定されたときの単語と前記係り受け関係が維持される点で文法上の性質が同一の単語か否かを判断する判断手段と、
該判断手段により前記文法上の性質が同一の単語であると判断された時のみ、前記学習を行なう学習実行手段と
からなることを要旨とする。
【０００９】
この仮名漢字変換装置では、分かち書き手段が、文法辞書を参照して、入力された仮名文字列を文節分かち書きし、分かち書きされた各文節において、候補単語表示手段が、文節を構成する単語を変換済みの形態で示す。この状態で、係り受け検定手段が、分かち書きされた一つの文節を起点とし、所定の文節同士の係り受けの情報を記憶した係り受け情報辞書を参照して、他の文節との係り受けの存在を検定する。この係り受けの検定により係り受け関係の成立が検定された文節の少なくとも一方の文節において、候補単語表示手段により表示された単語とは異なる単語が選択されると、係り受け学習手段が、この選択された単語を、係り受け情報として学習する。従って、新たな係り受けの関係を学習していくことができる。
【００１０】
しかもこの仮名漢字変換装置では、係り受け学習手段が、候補単語表示手段により表示された単語とは異なる単語が選択されたとき、該単語が係り受け関係の成立が検定されたときの単語と前記係り受け関係が維持される点で文法上の性質が同一の単語か否かを判断する判断手段と、該判断手段により文法上の性質が同じであると判断された時のみ、前記学習を行なう学習実行手段とからなる。
【００１１】
従って、この仮名漢字変換装置では、新たな係り受けの学習が、候補単語表示手段により表示された単語と、この単語に代えて選択された単語との文法上の性質が同じであるときのみに行なわれ、本来検定された係り受けとは関係のない単語による文節の関係を係り受けとして学習することがない。
【００１３】
こうした仮名漢字変換装置では、係り受け検定手段が、係り受けの関係を、前記文節分かち書きされた文節を構成する単語に関し、体言＋用言、用言＋用言、体言＋体言、連体形＋体言、連体詞＋体言の少なくとも一つについて検定するものとすることができる。従って、これらの係り受けについて検定することができる。
【００１４】
この係り受け検定手段が、体言＋用言の係り受けパターンの解析時に、使役または受動の関係を用いた係り受けの検定を行なう第１手段を備え、前記学習手段が、該第１手段により係り受けの成立が検定されたとき、使役または受動の関係を原形に戻して係り受け関係を学習する第２手段を備えるものとすることができる。従って、使役または受動の関係について別途係り受け情報を記憶したり、係り受けの学習をする必要がない。
【００１５】
本発明の仮名漢字変換方法は、仮名文字列に基づいて、コンピュータが、記憶装置に記憶した文法辞書を参照して、仮名漢字混じり文字列候補を生成する仮名漢字変換方法であって、
キーボードを介して入力された仮名文字列を、前記文法辞書を参照して、コンピュータが文節分かち書きし、
該分かち書きされた各文節において、該文節を構成する単語を変換済みの形態で、表示装置に示し、
文節を単位として、文節を構成する単語同士の係り受けの情報を記憶した係り受け情報辞書であって記憶装置に記憶された辞書を参照し、コンピュータが、前記分かち書きされた一つの文節を起点として、他の文節との係り受けの存在を、検定し、
該係り受けの検定により係り受け関係の成立が検定された文節の少なくとも一方の文節において、前記表示された単語とは異なる単語が選択されたとき、該単語が係り受け関係の成立が検定されたときの単語と前記係り受け関係が維持される点で文法上の性質が同一の単語か否かを、前記記憶装置に記憶された文法辞書を参照することによりコンピュータが判断し、
文法上の性質が同じであると判断された時のみ、該選択された単語を、係り受け情報として学習すること
を要旨とする。
【００１６】
【実施例】
以上説明した本発明の構成・作用を一層明らかにするために、以下本発明の好適な実施例について説明する。図１は、仮名漢字変換の制御ロジックを示すブロック図、図２は、この仮名漢字変換制御ロジックが実際に動作するハードウェアを示すブロック図である。図２に示すように、この装置は、周知のＣＰＵ２１を中心にバス３１により相互に接続された次の各部を備える。ＣＰＵ２１とバス３１により相互に接続された各部について、簡単に説明する。
【００１７】
ＲＯＭ２２：仮名漢字変換プログラム等を記憶するマスクメモリ、
ＲＡＭ２３：主記憶を構成する読み出しおよび書き込みが可能なメモリ、
キーボードインタフェース２５：キーボード２４からのキー入力を司るインタフェース、
ＣＲＴＣ２７：カラーで表示可能なＣＲＴ２６への信号出力を制御するＣＲＴコントローラ、
プリンタインタフェース２９：プリンタ２８へのデータの出力を制御するインタフェース、
ハードディスクコントローラ（ＨＤＣ）３０；ハードディスク３２を制御するインタフェース、
である。ハードディスク３２には、ＲＡＭ２３にロードされて実行される各種プログラムやデバイスドライバの形式で提供される仮名漢字変換処理プログラム、あるいはその仮名漢字変換処理プログラムが参照する各種変換辞書などが記憶されている。
【００１８】
こうして構成されたハードウエアにより、文章が入力，仮名漢字変換，編集，表示，印刷などがなされる。すなわち、キーボード２４から入力された文字列は、ＣＰＵ２１により所定の処理がなされ、ＲＡＭ２３の所定領域に格納され、ＣＲＴＣ２７を介してＣＲＴ２６の画面上に表示される。
【００１９】
次に、こうして構成されたハードウエアにより実行される機能を図１を用いて説明する。図１に示した各部の構成と働きについて概説するが、ここで行なわれる処理は、キーボード２４より入力されたデータに基づき、中央処理装置（ＣＰＵ２１）が実行するものである。このＣＰＵ２１により、総ての処理がおこなわれる。仮名漢字変換については、キーボード２４が操作されたとき、所定の割込処理が起動し、入力したキーイメージを対応する仮名文字列に変換し、更にこれを仮名漢字混じり文字列に変換するデバイスドライバが起動する。もとより、並列処理可能なコンピュータであれば、仮名漢字変換を一つのアプリケーション（インプットメソッド）が行なうものとし、変換結果を、必要とするアプリケーションに引き渡す構成としても差し支えない。この場合には、キーボード２４からの入力をインプットメソッドが一括して引き受けることになる。
【００２０】
キーボード２４からのキーイメージは、文字入力部４０により受け付けられ、ここで、対応する仮名文字列に変換される。ローマ字入力の場合には所定の変換テーブルを参照して、仮名文字列に変換する。一つの仮名文字が得られる度に文字入力部４０は、その仮名文字を変換制御部４２に送出する。この変換制御部４２は、仮名漢字変換の中心的な役割を果たす所であり、後述する種々の仮名漢字変換を制御して、結果を変換後文字列出力部４４に送出する。変換後文字列出力部４４は、現実には、ＣＲＴＣ２７に信号を送り、ＣＲＴ２６に変換後文字列を表示する。
【００２１】
変換制御部４２は、受け取った仮名文字を文字列入力部５０に引き渡す。文字列入力部５０は、文字格納部５２に仮名文字列を格納する。この文字列に基づいて、自立語候補作成部５４と付属語候補作成部６４とが、単語データの候補を作成する。自立語候補作成部５４は、ハードディスク３２に予め記憶された自立語辞書５８を用い、自立語解析位置管理部５６の管理の下で、得られた仮名文字列から自立語候補を抽出する処理を行なう。一方、付属語候補作成部６４は、同じく付属語辞書６８を用い、付属語解析位置管理部６６の管理の下で、得られた仮名文字列から付属語候補を抽出する処理を行なう。解析位置を移動しつつ、自立語候補と付属語候補を抽出する処理については、後述する。
【００２２】
ここで、自立語辞書５８は、学習により、同音異義語や接辞などの優先順位を変更する。この学習処理を行なうのが、係り受け学習部７０，自立語学習部７２，補助語学習部７４，接辞学習部７６，文字変換学習部７８である。係り受け学習部７０は、係り受けが成立する条件で、使用者が係り受けに該当する単語以外の語を選択した場合、同じ単語の組合わせでは、使用者が選択した組合わせを優先するよう係り受けの関係を学習するものである。自立語学習部７２は、同音異義語の存在する自立語群において、最後に選択された単語を最優先の候補とするよう学習するものである。補助語学習部７４は、例えば「ください」などの補助語を「ください」「下さい」など、いずれの語形で変換するかを学習するものである。更に、接辞学習部７６は、接頭語，接尾語などの変換形式（例えば、「御」「ご」など）を学習するものである。文字変換学習部７８は、入力した文字列をそのままひらがなやカタカナとして確定させた場合に、その文字列を学習し、次回以降の変換処理では確定させたひらがなまたはカタカナを候補として出力するものである。
【００２３】
自立語候補作成部５４，付属語候補作成部６４により、作成された語候補を得て、単語データ作成部８０が、各語候補についてのデータを作成する。即ち、得られた自立語と付属語、自立語と自立語、更には「自立語＋付属語」からなる文節間の接続を接続検定テーブル８４を参照して接続検定部８２が行なった結果、および全体のコスト計算をコスト計算部８６が行なった結果を得て、単語毎のデータとして出力するのである。この単語データは、一旦単語データ格納部１００に格納され、係り受け候補調整部９０からの調整出力を受けて、文節分かち書きの処理に用いられる。
【００２４】
係り受け候補調整部９０は、自立語候補作成部５４，付属語候補作成部６４からの語候補を単語データ作成部８０，単語データ格納部１００，文節分かち書き部１０２を介して受けて、係り受けの検定を行なうものである。係り受けの検定は、ハードディスク３２に予め用意された係り受け辞書９８を参照することによって行なわれる。尚、係り受け辞書は、容量を小さくするために係り受け関係が逆となるものについても一つの係り受け情報のみを記憶しているに過ぎないので、文法的な解析を伴い転置情報調整部９９により、係り受け辞書９８の情報を拡張して、係り受け候補の調整を行なっている。例えば、係り語「花が」＋受け語「美しい」という係り受け情報のみ係り受け辞書９８に記憶しておき、係り語「美しい」＋受け語「花」という係り受けの検定も行なおうとするのである。
【００２５】
係り受けの検定を行なう範囲は、係り受け範囲管理部９６により管理される。また、係り受けの関係の検定には、いくつかの許容条件があり、これが使役・受動解析部９２，助詞許容解析部９４等により判定される。以上の係り受けの検定により調整された文節候補から文節分かち書きの第１候補が決定され、これが文節データ格納部１０６に格納される。格納された候補は、変換文字列出力部１０８により変換制御部４２に出力される。変換制御部４２は、この文字列を候補文字列として表示すると共に、非所望の文字列が候補となる場合もありえるから、使用者による指示を受けて、次候補の表示や選択などの処理を行なう。これらの指示や選択の結果などは、文節データ格納部１０６や既述した各学習部７０ないし７８に入力され、文節の一部確定や学習による優先順位の書換などに用いられる。なお、図示していないが、使用者により文字列の確定処理がなされると、各部に一時的に保存されたデータは総て消去され、次の変換に備える。
【００２６】
以上、仮名文字の入力から変換語文字列の出力までを概説したが、次に各処理の詳細について説明する。まず最初に一般的な文節分かち書きの処理について説明し、次に本発明の要部である係り受けの処理について説明する。図３は、最小コスト法による文節分かち書きの処理の概要を示すフローチャートである。図示するように、まず、一時的に保存されたデータの消去や解析位置を１桁目に初期化するなどの初期化の処理（ステップＳ２００）を行なった後、解析位置を求める処理を行なう（ステップＳ２１０）。解析位置とは、それまでに入力された仮名文字列の先頭から順に一つずつ進められていく位置である。例えば、図４に示す例文「くるまではこをはこぶ」という仮名文字列が入力されているとすれば、最初の解析位置は１桁目の「く」の位置である。この解析位置で、ハードディスク３２に記憶された自立語辞書５８および付属語辞書６８を検索する処理を行なう（ステップＳ２２０）。
【００２７】
辞書の検索を行なった後、得られた単語についてそれ以前の単語との結合をチェックする処理を行ない（ステップＳ２３０）、単語間の結合がありえない語しか得られていない場合には、更に辞書を検索する。例えば、図４に示した例では、「こをはこぶ」の「は」について付属語辞書６８から検索された係助詞の「は」は、そのなど直前の格助詞「を」との結合がありえないと判断されるから、単語データ作成部８０，接続検定部８２による接続の検定により、無効なデータとして扱われる。図４では、こうした結合チェックにより無効と判断された語に符号「×」を付けた。なお、単語間の結合は、接続検定テーブル８４に予め記憶されているが、この接続検定テーブル８４は、単語の品詞同士の結合の可能性についての情報を与えるテーブルであり、実施例では、４００×４００程度のマトリックスとして与えられている。一つの解析位置での辞書検索と結合チェックが終われば、解析位置を順に進めて更に処理を繰り返す。
【００２８】
結合の可能性のある単語については、次にコスト計算を行ない、その語の最小総コストを求める処理を行なう（ステップＳ２４０）。この処理は、コスト計算部８６が行なうもので、図４（Ａ）に示す例では、「くるま」は、例えば「く」＋「る」＋「ま」、「くる」＋「ま」「くるま」と分けることができ、これらに単語を当てはめてゆくとき、自立語＝２、付属語＝０のコストを持つものとし、「苦」（自立語）＋「流」（自立語）ならば、「流」の総コストは４、と求めるものである。この時、「間」のコストが４となるのは、最小の総コストを求めるからであり、「苦」＋「流」＋「間」のコスト６ではなく、「来る」＋「間」の場合のコスト４を採用するからである。「で」「は」は付属語なので、それ以前の単語のうち最小のコストの単語「車」＝２のコストがそれ自身のコストとなる。図４には、各語のコストを右下に示した。
【００２９】
以上のコスト計算の後で、各単語のコストをチェックし、不適切なコストのものを無効とする処理を行なう（ステップＳ２５０）。不適切なコストとは、他の語の組合わせと比べてコストが大きくなってしまう語の組合わせである。即ち、「区」＋「留」といった語の組合わせを選択することは、その位置までで得られる他の語「来る」や「繰る」のコストより高くなってしまうので、不適切なコストと判断して、これを文節候補から除外するのである。この最小コストの考え方から採用されない語を、図４では、語の右上に「●」として示した。なお、図４において、「○」は、その語が、上述した結合チェックとコストチェックの結果、文節候補を形成する可能性のある語として残ったものであることを示している。
【００３０】
次に、こうしてコストが与えられた単語候補をリンクする処理を行なう（ステップＳ２６０）。即ち、結合が有効とされた語について、その結合関係をポインタを設定することで関係づけるのである。図４の例では、「来る」「繰る」「車」「まで」「で」「は」「では」などが無効でない語として最小総コストの計算がなされたから、「来る」「繰る」については「まで」にリンクし、「車」については「で」「では」にリンクするというように関係づけるのである。こうした結合チェックやコスト計算、そしてリンクづけの処理を、一つの解析位置で総ての単語の検索が完了する間で繰り返す。また、その解析位置での辞書の検索が完了すると、更に解析位置を一つ進めて、新たな単語の成立を検討し、同様に結合チェックやコスト計算などを繰り返す。
【００３１】
解析位置が、既に入力された最後の仮名文字の位置に至り、全語について解析が完了した場合には（ステップＳ２６５）、以上の処理を前提として、最小コストのパスを検索する処理を行なう（ステップＳ２７０）。この処理は、文節分かち書き部１０２が行なうもので、有効とされた語の組合わせのなかで、語に付与されたコストの総和が最小になるものを検索する処理である。「くるまではこをはこぶ」の例では、図４（Ｂ）に実線Ｊのパスとして示すように、「車で」＋「箱を」＋「運ぶ」という分かち書きが総コスト１８となるので、最小コストとして選択される。なお、最小コストではないが、他の文節分かち書きの候補も検索される。例えば、図４（Ｂ）に破線Ｂのパスとして示すように、「車では」＋「子を」＋「運ぶ」という分かち書き（コスト＝２０）である。こうして分かち書きの候補を作成した後（ステップＳ２８０）、今度は各文節の内部での候補を作成する処理を行なう（ステップＳ２９０）。即ち、ひとつの文節分かち書きの内部で、例えば「はこを」に対して「箱を」や「函を」といった候補を用意するのである。これらの文節の候補や単語の候補は、使用者により文節の分け方をかえるよう指示されたり、次候補を表示するよう指示された場合に使用される。
【００３２】
次に、こうして文節分かち書き処理がなされ、各文節について漢字候補が作成された後で実行される係り受け検定処理について説明する。図５は仮名漢字変換を行なおうとする例文を示す説明図であり、図６は係り受け検定処理ルーチンを示すフローチャートである。ここでは例文として、図５（Ａ）に示すように、『わたしはくるまをかえた。』という文を取り上げる。最小コスト法を用いた分かち書きの処理により図５（Ｂ）に示す文節が取り出され、各文節内で図５（Ｃ）に示す単語が第１候補として表示されたと仮定する。なお、各単語候補はそれまでに学習された第１候補である。この場合の係り受けの検定処理ルーチンについて、図６に従って説明する。
【００３３】
図６の係り受け検定処理ルーチンが起動されると、まず検定範囲（通常は、分かち書きされた全文節）の終端の一つ前の文節を係り語として設定する処理を行なう（ステップＳ４００）。係り受けは、実施例では、係り語を優先として対応する受け語を検索するので、少なくとも一つの受け語を持つよう、検定範囲の終端一つ前の文節を係り語の文節として設定するのである。また、この時処理の各変数を初期化する処理も併せ行なう（例えばｎを値１に設定する）。次に係り語からｎ個後方の文節を受け語として設定する処理を行ない（ステップＳ４１０）、係り受け辞書９８を検索する処理を行なう（ステップＳ４２０）。尚、係り受け辞書は、「受け語語根」＋「係り語」という形式で記録されている。
【００３４】
辞書の一例を図７に示す。図７（Ａ）は、「機転＋利く」という係り受けが存在する場合の辞書の内容を模式的に示したものである。この辞書は、見出し語である「ききてん」という読みと「利く」と「機転」という語が登録されており、「車を＋代える」という係り受けであれば、図７（Ｂ）に示すように、見出し語である「かえくるま」という読みと「代える」と「車」という語が登録されている。尚、末尾には、後述する付属語許容解析用の付属語情報が付属している。実際の辞書は、この他検索用のインデックスや語の長さを示す情報などが付帯している。
【００３５】
係り語として設定された語と受け語として設定され語とから係り受け辞書を検索した結果、係り語と受け語から作成された見出し（例えば「かえくるま」）が辞書に存在するか否かを判断し（ステップＳ４３０）、係り受けが辞書に見いだされなければ、検定範囲の終端まで検定したか否かを判断し（ステップＳ４４０）、終端まで検定していなければ、変数ｎを値１だけインクリメントし（ステップＳ４５０）、ステップＳ４１０から処理を繰り返す。係り受けが係り受け辞書９８に見いだされた場合には（ステップＳ４３０）、受け語に既に係り受けが成立しているか否かの判断を行なう（ステップＳ４６０）。これは、図８に示すように、一度係り受けＱ１＋Ｒ２が成立した場合、次にその前の文節Ｐについて係り受けを判定するとき、既に見い出されたＱ１＋Ｒ２という係り受けを優先するよう処理を異ならせるためである。
【００３６】
受け語側（即ち語Ｐと語Ｑとの係り受け判定における語Ｑ）について既に係り受けが成立しているのでなければ、処理はステップＳ４７０以下に移行し、まず係り語優先で係り受けの成立する語を検索る。係り語優先で係り受けの成立する語を検索するのは、ステップＳ４３０の判断により、少なくともひとつ係り受けが有り得る語が存在することが分かっているから、どの単語について係り受けが成立するかを、係り語の側の順位を先にして判断するのである。この検索の様子を図９に示す。係り語の側に、その読みに対して複数の単語が見い出されている場合、その第１候補Ｘ１を固定して、受け語Ｙについて、既に自立語辞書５８に配列された学習の順位に従って、順位の高い側から順に、Ｙ１→Ｙ２→Ｙ３→Ｙ４・・・という順に係り受けが成立するかを見て行くのである（図９符号Ａ１の検索）。この検索によって、係り受けを満足する単語が見い出されなかった場合には、次の係り語Ｘ２を選択して同様に検定を行なう（符号Ａ２の検索）。
【００３７】
こうした検索により、係り受け辞書９８から読み出された係り受けを満足する係り語と受け語の組みが見い出されたとき、次に付属語の許容解析を行なう（ステップＳ４８０）。この処理について説明する。
【００３８】
助詞の許容解析は、係り受けのタイプにより定義された許容関係を満たしているかを判断するものであり、係り受けのタイプ毎に次の類型を持つ。
［Ｉ］連用修飾型
▲１▼名詞＋助詞＋用言の場合の助詞
格助詞「が」「から」「で」「と」「に」「へ」「より」「を」「の」
係助詞「は」
▲２▼用言連用形＋用言の場合
▲３▼名詞＋用言（助詞省略型）の場合の省略可能な助詞
「が」「は」係助詞，副助詞
［ＩＩ］連体修飾型
▲４▼名詞＋助詞＋名詞の場合の助詞
「の」
▲５▼体言＋体言（並列）の場合の助詞
「や」「と」
▲６▼用言連体形＋名詞の場合
▲７▼連体詞＋名詞の場合
【００３９】
即ち、係り受け関係にあると判断された２つの語の関係が上記の▲１▼ないし▲７▼のいずれかに属するとして、係り受け関係にある両語の間に存在する付属語（大部分は助詞もしくは助詞的表現）が上記のいずれかに該当する場合は、係り受け辞書９８には係り受け関係を有する語について許容する助詞の設定がなされているから、これを検定するのである。例えば、「機転」と「利く」との間の係り受けが助詞の許容設定（の・が）を伴っている場合、上記▲１▼のケース（名詞＋助詞＋用言）に属するから、「の」「が」は両語間に存在可能であるけれども（機転が利いた、機転の利いた→○）、他の格助詞「から」「で」などは許容できない（機転から利いた、機転で利いた→×）ということになる。
【００４０】
▲１▼ないし▲７▼の各関係について、そこに挙げられたもの以外については、許容されると判断する。この許容されると判断する例を以下に列挙するが、これらは、係り受けとしては実際の表現としては成り立たない場合を含む可能性がある。しかし、係り受けは、実際の人間の言語活動としては、広い概念であり、あまりに厳格な係り受けの取り決めはむしろ現実にそぐわないことが多い。また、余りに厳密な係り受けの取り決めは係り受け辞書９８のいたずらな増大を招くだけであり、係り受け検定の速度も低下させる。そこで、本実施例では、付属語の許容について、係り受けの生じる関係を▲１▼から▲７▼に分け、その中で許容・非許容の明確なものについては、係り受け辞書に許容するものとして係り受け関係の成り立つ語と共に記憶し、それ以外については、許容するものとしたのである。
【００４１】
［ＩＩＩ］許容される表現−連用修飾形の場合
・名詞＋格助詞的表現＋用言における格助詞的表現
「ずつ」「として」「のため」「において」「によって」など、
・名詞＋係助詞＋用言における係助詞
「こそ」「さえ」「しか」「でも」「も」など、
・名詞＋副助詞＋用言における副助詞
「きり」「くらい」「ずつ」「だけ」など、
・名詞＋副助詞的表現＋用言における副助詞的表現
「なので」「なら」など、
・用言＋助詞＋用言における助詞
「のは」など
・接続助詞「ので」「から」「から」「て」など、
・接続助詞的表現「からには」「ためには」「ほど」「うえ」など、
・用言＋用言を並列させる表現「か」「し」「たり」「と同時に」など、
【００４２】
［ＩＶ］許容される表現−連体修飾形
・名詞＋助詞的表現＋名詞における助詞的表現
「における」「に関する」「に基づいて」など、
・用言＋助詞的表現＋名詞における助詞的表現
「ための」「といった」「に伴う」「などの」「ごとき」など、
・体言＋体言を並列させる表現「か」。
【００４３】
以上の規則に従って、係り受けの関係が見い出された２つの語の間の付属語の許容について判断する。例として挙げた「車を」「代えた」の場合には、係り受けの成立が認められる。そこで、これを判定し（ステップＳ４８０）、係り受けが成立した場合には、成立が認められた語を、その文節を構成する自立語における係り語と受け語との第１候補とする処理を行なう（ステップＳ４９０）。即ち、自立語辞書５８の同音異語の学習による登録順序を入れ換えるのである。更にこうして見い出された受け語から係り語までの間を係り受け成立済み範囲として登録し、これを管理する処理を行ない（ステップＳ５００）、全範囲について係り受けの検索を行なったか否かの判断（ステップＳ５１０）に進む。なお、両語間に存在する付属語により係り受けの成立が否定された場合には、第１候補の変更を行なわず、更にその係り語と受け語について係り受け情報が他にあれば同様の検定を行ない（図示省略）、なければ全範囲について終了したかの判断に移行する。
【００４４】
係り受け検定の全範囲、即ち、図６に示した処理により確定された係り受けの解析範囲の全部について係り受けの検定が終了していなければ、変数ｎを値１に初期化し（ステップＳ５２０）、更に係り語を一つ前の文節に移動し（ステップＳ５３０）、全範囲について係り受けの検定が完了するまで、上記の処理（ステップＳ４１０ないし５００）を繰り返す。
【００４５】
ステップＳ４６０において、受け語に既に係り受けが成立していると判断された場合には、既に係り受けが成立しているとされた受け語を用いた係り受けが成立するかを判断する（ステップＳ５４０）。即ち、図８（Ａ）に示した例では、語Ｑ１と語Ｒ２との間に係り受けが成立していた場合、語Ｐと語Ｑとの間の係り受けの判定の際には、受け語となる語Ｑ１を固定して、係り受けの成立を判断するのである。従って、この場合には、係り受けＰ１＋Ｑ２が存在しても、これを採用することはない。但し、受け語をＱ１とする係り受けＰ２＋Ｑ１が見い出されれば、これは係り受けの成立とする。従って、図８（Ｂ）に示したように、Ｐ２＋Ｑ１＋Ｒ２という係り受けは成立するのである。図５に示した例文では、係り受けの検定範囲とされた「わたしはくるまをかえた」について、「車を」＋「代えた」という係り受けが見い出されて、「車」「代えた」が第１候補として学習されたあとでは、「私は」＋「代えた」という係り受けが存在したとして、この係り受けが採用されることはない。他方、仮に「私は」＋「車を」という係り受けが存在すれば、これは採用される。
【００４６】
そこで、この場合には、係り語の第１候補（例では語Ｐ２）を確定する（ステップＳ５５０）。その後、同様に係り受けの範囲の管理（ステップＳ５００）と、全範囲についての係り受け検定の終了かの判断（ステップＳ５１０）とを行なう。係り受けの検定範囲として確定された全範囲について係り受けの検定が終了した場合には、「ＥＮＤ」に抜けて本ルーチンを終了する。
【００４７】
次に、係り受けの学習ルーチンについて、図１０に従って説明する。図５に示した例文について、最初の３文節では、「私は」「車を」「代えた。」という単語がそれぞれ第１候補として表示されて、係り受けとして「車を」＋「代えた」が成立と判定されているとする。この状態で、変換中の文節のいずれかで次候補の単語が選択されたとき、図１０に示した係り受け学習処理ルーチンが起動され、まず係り受け学習フラグがオンとなっているか否かを判定する（ステップＳ６００）。係り受けの学習をするか否かは設定できるようになっているので、これをフラグにより判定するのである。係り受け学習がオフになっていれば、何も行なわず「ＥＮＤ」に抜けて、本ルーチンを終了する。なお、仮名漢字変換における学習には様々なものがあり、実施例では、係り受けの学習の前に、自立語学習（自立語の複数の候補のうち選択されたものを次の仮名漢字変換時の第１候補とする学習）、付属語の学習（接頭語「ご」「御」や助数詞「回」「会」などのいずれを優先するかの学習）、文節学習（文節の長さなど文節としていずれを優先するかの学習）などの学習がなされている。これらの学習は、すべて学習を行なうか否かの設定が可能となっており、フラグのオン／オフの形で記憶されている。
【００４８】
係り受け学習フラグがオンに設定されていれば、次に仮名漢字変換中で、現在係り受け学習のために注目している文節の中に係り語文節があるか否かの判定を行なう（ステップＳ６１０）。係り語文節があるか否かは、図６に示した処理ルーチンにより判定され、記憶されているので、この情報に基づいて判定する。係り語文節でなければ何も行なわずに「ＥＮＤ」に抜けて終了し、他方係り語文節があると判断されれば、受け語の文節を探す処理を行なう（ステップＳ６２０）。係り受けの情報から係り語に対応する受け語を見いだすことは容易である。変換中のカーソルが置かれた語が「車を」であれば、この語が係り語と判断され、「代えた」が受け語として見出される。
【００４９】
次に、係り語文節で次候補の選択がなされたか否かの判断を行ない（ステップＳ６３０）、係り語文節で次候補の選択がなされたのでなければ、受け語の文節で次候補の選択がなされた否かの判断を行なう（ステップＳ６４０）。これらの処理は、係り語や受け語の文節において、例えば係り受けが成立するとして第１候補として表示された「車を」に代えて「クルマを」が選択されたり（係り語における次候補の選択）、「代えた」に代えて「替えた」が選択された場合（受け語における次候補の選択）に相当する。
【００５０】
これらの場合には、次に係り受け情報を作成する処理を行なう（ステップＳ６５０）。係り受け情報の作成については、図１１を用いて後述する。係り受け情報を作成した後、この情報を用いて係り受け辞書９８への登録を行ない（ステップＳ６６０）、その後「ＥＮＤ」に抜けて本ルーチンを終了する。なお、係り語や受け語の文節で次候補の選択が行なわれなかった場合は、係り受けの学習をする必要は特にないから、何も行なわず「ＥＮＤ」に抜けて、本ルーチンを終了する。
【００５１】
以上説明した図１０の係り受け学習処理ルーチンが実行されると、係り受け学習フラグがオンであり、係り受けの成立が認められた係り語文節と受け語文節のいずれかで、次候補の選択がなされると、係り受け情報が作成され、係り受け辞書９８への登録が行なわれることになる。
【００５２】
次に、係り受け情報の作成処理ルーチン（図１０ステップＳ６５０）の詳細について、図１１のフローチャートを用いて説明する。係り受け情報の作成処理では、まず次候補が選択された係り語、受け語の品詞種類のチェックを行ない（ステップＳ７００）、係り受けを行なう品詞か否かの判断を行なう（ステップＳ７０５）。第１候補が表示された状態では、係り受けは成立とされていたわけであるが、次候補の選択によっては係り受け関係からはずれてしまうことがあるからである。例えば、「川の」＋「流れ」という係り受けが辞書に登録されていて、その成立が検定された場合で、「川の」（名詞＋助詞「の」）に代えて「河野」（固有名詞、姓）が選択されると、品詞が異なってしまい、通常は対応する語との間で係り受けを成立させない品詞となってしまう。係り受けを行なう品詞でなくなったと判断された場合には、何も行なわず「ＥＮＤ」に抜けて、本処理ルーチンを終了する。
【００５３】
選択された次候補が係り受けを行なう品詞であると判断された場合には、次に係り受けが成立するとされた係り語と受け語の文節の関係が、係り受け関係があり得るとして用意した次の５つの類型のいずれに属するかの判断を行なう。すなわち、「体言」＋「用言」であるか否か判断（ステップＳ７１５）、「用言」＋「用言」であるか否かの判断（ステップＳ７２０）、「体言」＋「体言」であるか否かの判断（ステップＳ７２５）、「連体形」＋「体言」であるか否かの判断（ステップＳ７３０）、「連体詞」＋「体言」であるか否かの判断（ステップＳ７３５）である。これらの判断がすべて「ＮＯ」であれば、係り受け学習を行なう組み合わせではないとして、「ＥＮＤ」に抜けて本ルーチンを終了する。
【００５４】
他方、係り語と受け語の文節とが「体言」＋「用言」の関係にあると判断された場合には、（ステップＳ７１５）、次にこの「体言」＋「用言」の係り受けのパターンの詳細を解析する処理を行なう（ステップＳ７４０）。この解析処理の詳細を示したのが、図１２のフローチャートである。「体言」＋「用言」の係り受けには、様々なパターンがあるので、詳しくこれを解析するのである。この解析処理について、図１２を参照して説明する。
【００５５】
「体言」＋「用言」のパターン解析処理ルーチンが開始されると、まず「体言」＋「用言」の間に助詞が存在するか否かの判断を行ない（ステップＳ８００）、存在しないと判断された場合には、省略可能な助詞（例えば格助詞「が」）が省略されているケースであると判断し、これは係り受け辞書９８に係り受けとして登録可能と判断する（ステップＳ８０５）。他方、「体言」＋「用言」の間に助詞が存在すると判断された場合には（ステップＳ８００）、その助詞が「の」や「や」であるか否かの判断を行なう（ステップＳ８１０）。通常、係り受けを構成する「体言」＋「用言」の間に助詞「の」や「や」が存在することはあり得ないから、係り受け成立と判断して各文節の単語の第１候補を表示したけれども、係り受けの成立との判断が誤っており、次候補の選択がなされたと考えられる。従ってこの場合には、何も行なわず「ＥＮＤ」に抜けて本ルーチンを終了する。
【００５６】
他方、「体言」＋「用言」の間に「の」や「や」以外の助詞が存在すると判断された場合には（ステップＳ８１０）、「体言」＋「用言」が使役の関係にあるか否かの判断を行なう（ステップＳ８１５）。使役とは、体言の文節である「人（もしくはもの）が」、「なになにを」あるいは「人（もしくはもの）に」と、用言の文節である「○○させる」とからなるいう性質を持つから、用言の語尾型からこれ判断するのである。例えば、「親鳥が餌を雛に食べさせる」といった文があり得、この場合、「体言」＋「用言」の形で使役の係り受けが見出されるのは、「餌を」＋「食べさせる」や「雛に」＋「食べさせる」である。使役であると判断された場合には（ステップＳ８１５）、更に「体言」＋「用言」の間に位置する助詞が「を」もしくは「に」であるか否かの判断を行なう（ステップＳ８２０）。「体言」＋「用言」の間に位置する助詞が「を」もしくは「に」であれば、使役の係り受けであると判断し、「体言」＋「助詞が」＋「用言」の形にし（ステップＳ８２５）、係り受けとして新たに登録可能としてステップＳ８０５に移行する。
【００５７】
ステップＳ８１５で使役でないと判断された場合には、次に受け身（受動）でないか否かの判断を行なう（ステップＳ８３０）。受け身とは、「人（あるいはもの）が」あるいは「人（あるいはもの）に」＋「動詞受動型（○○れる、られる）」からなる構文であり、例えば「彼に」＋「断わられる」（能動型は「彼が」＋「断わる」）とか、「扉が」＋「開かれる」（能動型は「扉を」＋「開く」）といった構文である。係り受け情報を作成する文節同士が「体言」＋「用言」の関係にあり、受け身であると判断されると、次に「体言」＋「用言」の間に存在する助詞が「が」であるか否かの判断を行なう（ステップＳ８３５）。この判断が「ＹＥＳ」であれば、「体言」＋「用言」の間の助詞を「を」に変更して（ステップＳ８４０）、ステップＳ８０５に移行して、係り受けの登録を可能とする。
【００５８】
受け身の場合であって「体言」＋「用言」の間の助詞が「が」でない場合には（ステップＳ８３５）、次に「体言」＋「用言」の間の助詞が「に」であるか否かの判断を行なう（ステップＳ８４５）。受け身で間の助詞が「に」であると判断されると、「体言」＋「用言」の間の助詞を「が」に変更して（ステップＳ８５０）、ステップＳ８０５に移行して、係り受けの登録を可能とする。
【００５９】
受け身でもなく、受け身の場合で間の助詞が「が」でも「に」でもなければ、通常の「体言」＋「用言」の係り受けであるか、または使役・受動で特定の助詞を採らない使役・受動（例えば「場所」＋「で」＋「動詞使役または受動型」など）であると判断し、ステップＳ８０５に移行し、係り受けの登録を可能とした後、本ルーチンを終了する。以上の処理により、「体言」＋「用言」の係り受けのパターンが解析され、特定の条件が満たされた場合には、登録が可能とされる。
【００６０】
図１１に戻って、係り受け情報作成処理ルーチンについての説明を続ける。ステップＳ７４０で「体言」＋「用言」の係り受けのパターン解析を行なった後、解析の対象となった文節の組み合わせが登録可能であるか否かの判断を行なう（ステップＳ７４５）。図１２に示したパターン解析により新たな係り受けとして登録可能であるとされた場合には、登録可能としてステップＳ７８０に進み、係り受け情報の作成を行なう。即ち、例えば受け身として登録可能とされた場合には、「餌を」＋「食べさせる」の例では、読み「たべえさ」，係り語「餌」，受け語「食べる」，付属語「が」という情報を作成する。また、例えば受け身として登録可能とされた場合には、「扉が」＋「開かれる」であれば、能動型である「扉を」＋「開ける」として登録用の情報を作るのである。この例では、読み「あけとびら」，受け語「開ける」，係り語「扉」，付属語「を」という情報が作られる。更に、「彼に」＋「断わられる」であれば、能動型である「彼が」＋「断わる」として登録用の情報を作るのである。この例では、読み「ことわかれ」，受け語「断わる」，係り語「彼」，付属語「が」という情報が作られる。
【００６１】
次に係り受けが成立するとされた係り語と受け語の文節の関係が、係り受け関係があり得るとして用意した５つの類型のうち、「体言」＋「用言」以外の４つのケースのいずれかに属すると判断された場合の処理について説明する。「用言」＋「用言」であると判断された場合には（ステップＳ７２０）、係り語が連用形であるか否か判断し（ステップＳ７５０）、連用形であれば格を連用修飾として（ステップＳ７５５）、ステップＳ７８０に移行し、係り受け情報を作成する。「用言」＋「用言」であると判断されても、係り語が連用形でないと判断された場合には、何も行なわず「ＥＮＤ」に抜けて、本ルーチンを終了する。
【００６２】
また、「体言」＋「体言」であると判断された場合は（ステップＳ７２５）、「体言」＋「体言」の間に助詞「の」や「と」や「や」が存在するか否かの判断を行なう（ステップＳ７６０）。「体言」と「体言」との間にこれらの助詞が入る場合には、並列関係（ＡとＢ、ＡやＢ）や、限定関係（ＡのＢ）を示すものとみなすことができ、これらの関係での係り受けの情報を、同様に作成する（ステップＳ７８０）。他方、「体言」と「体言」の間にこれらの助詞が入っていない場合には、何も行なわず「ＥＮＤ」に抜けて、本ルーチンを終了する。
【００６３】
同様に、「連体形」＋「体言」であると判断された場合や（ステップＳ７３０）、「連体詞」＋「体言」であると判断された場合には（ステップＳ７３５）、係り受けの関係成立として、連体修飾型として係り受けの情報を作成する（ステップＳ７８０）。「連体形」＋「体言」は、係り語が用言連体形であり、受け語として体言が見出されている場合であって、例えば、「連体形」＋「体言」の係り受け「美しい」＋「花」において次候補「うつくしい」が選択された場合の「うつくしい」＋「花」や、係り受け「走る」＋「車両」において次候補「車輌」が選択された場合の「走る」＋「車輌」などである。また、「連体詞」＋「体言」とは、例えば、「ある」＋「女」とか、「あの」＋「人」などであり、次候補「或る」が選択された場合の「或る」＋「女」などである。これらの場合には、連体修飾型として、係り受け情報が作成される。即ち、それぞれ係り受け情報として、読み「うくしはな」，受け語「うつくしい」，係り語「花」や、読み「はししゃりょう」，受け語「走る」，係り語「車輌」が作られるのである。この結果、「連体形」＋「体言」の場合には、「車輌」＋「走る」＋助詞「が」などの形式で、つまり「体言」＋「用言」の場合の係り受け情報と同じ形式で係り受け情報が作られ、記憶される。係り受け辞書９８は、体言と用言の係り受けとしては、係り語として体言を、受け語として用言をとるよう統一されているのである。
【００６４】
入力された仮名文字列が文節分かち書きされた後で、以上説明した図１０ないし図１２に示した処理がなされると、係り受けが成立すると判断されて第１候補の単語が選択・表示された状態でその単語の第２候補以下の候補が選択されるた場合、選択された次候補について、新たに係り受けの情報が作成され（ステップＳ７８０）、これが係り受け辞書９８に登録される。従って、係り受け辞書を９８を徒に大きくする必要がなく、かつこの仮名漢字変換装置を使用する人の癖や用法に応じた係り受けのパターンを記憶して、仮名漢字変換により所望の文字列を得られる可能性を高くすることができる。また、使役や受け身なども原形（この例では能動形）に帰って学習しておくので、いずれの構文にも適用することができる。
【００６５】
また、本実施例では、係り受けの検定を、係り受けの検定範囲とされた範囲内で文末に近い位置から開始し、かつ係り語を優先として行なっている。この構成は、係り受けによる単語候補の確定をより所望のものとする点で極めて有効であった。これは、日本語では文末の述部側が文の意味を担っていることが多いこと、および行為（一般に文末側の述部が記述）が同じで主体（一般により文頭側の記述）が代わることよりも、主体の行為が変化する場合が多いことからではないかと考えられる。
【００６６】
また、係り受けが一旦成立したと判断された場合には、その受け語から係り語までの範囲を係り受け成立範囲として管理するので、係り受けの範囲が交差することがない。また、２以上の受け語が一つの係り語を受けるという判断をすることもない。また、係り受けの成立を隣接する文節を越えて判断するので（ｎ≧２の場合）、副詞などによる修飾が係り受け関係の間に入っても係り受けの検定を正しく行なうことができる。従って、複数の係り受けが成立する場合には、図１３（Ａ）に示すように、独立した係り受けが別個に成立する組合わせか、図１３（Ｂ）に示すように、一つの受け語が２以上の係り語を受ける組合わせか、図１３（Ｃ）に示すように、一つの係り受けを跨ぐようにもう一つの係り受けが成立する組合わせが許されることになる。
【００６７】
次に本発明第２実施例について説明する。第２実施例では、まず第１実施例における図６の処理、即ち係り受けの検定処理ルーチンにおいて、係り受け辞書９８を検索して（ステップＳ４２０）係り受けがあるか否かを判定する際（ステップＳ４３０）、具体的な係り受けの関係を係り受け辞書９８に記憶しておくのではなく、図１４に示すように、通常の自立語辞書５８または係り受け辞書９８に意味分類品詞の情報を記憶しておき、これを用いて係り受けの判定を行なうのである。例えば、第１実施例では、「課長に」＋「言う」や「部長に」＋「言う」や「社長に」＋「言う」などを、個別の係り受け情報として係り受け辞書９８に記憶しておき、個別に係り受けの成立を検定していた。これに対して、第２実施例では、「課長」「部長」「社長」などの自立語辞書に、意味分類品詞という新たな品詞を通常の品詞情報の他に付け加えており、「課長」などには、「地位／役職」を示す意味品詞「地位」が付与されている。また、係り受け辞書９８には、個別の係り受け情報ではなく、「体言（地位）」＋「言う」＋助詞「に」といった情報が記憶されている。この例では、読みは「いＥ４」，受け語は「言う」，係り語は「地位」である。
【００６８】
文節分かち書きされた後で、各文節の文法情報を調べ、文節を構成する自立語の意味品詞を読み取っておく。次に係り受けの検定（図６）を行なうとき、この意味品詞を用いて係り受け辞書を検索する（ステップＳ４３０）。係り受け辞書９８に、「地位」＋「言う」に該当する係り受けが見出されるから、この場合係り受け成立とし、これを文節を構成する単語の第１候補として表示する。また、この状態で単語の次候補が選択された場合には、その次候補が第１候補と同じ意味分類を付与できる単語であるかを、係り受け情報の作成処理（図１１ステップＳ７００）において判断する。例えば、第２候補の通常の品詞が同一であれば、第１候補と同じ意味分類を付与できると判断する。第１候補が「課長」である場合に、次候補の中から「科長」や「家長」が選ばれると、これらの候補の品詞は「普通名詞」で同一なので、新たに「科長」や「家長」の意味品詞を「地位」とするのである。
【００６９】
この実施例によれば、係り受けの関係を個別に記憶しておく必要がなく、係り受け辞書を極めて小さくすることとができる。また、新たに係り受けの関係を追加する場合には、その単語の意味品詞を追加するだけですむので、係り受け辞書を改変する必要がない。従って、一旦表示された文節の単語候補の次候補が選択された場合の係り受けの学習も、自立語辞書５８の意味品詞を書き直すだけで済む。なお、係り受けを検定する際、意味品詞を用いた係り受けのみを対象としてもよいが、第１実施例で説明した個別の係り受けと、意味品詞を用いた係り受けの両方について検定するものとしても差し支えない。
【００７０】
以上本発明の実施例について説明したが、本発明はこうした実施例に何等限定されるものではなく、例えば最小コスト法に代えて２文節最長一致法などの他の文節分かち書きの手法を用いた構成、係り受け検定における係り語優先か受け語優先かを切り替えられる構成、係り受けの関係を「体言」＋「用言」など一つないし複数個に限定した構成など、本発明の要旨を逸脱しない範囲内において、種々なる態様で実施し得ることは勿論である。
【００７１】
【発明の効果】
以上説明したように本発明の請求項１の仮名漢字変換装置および請求項６の仮名漢字変換方法では、文法辞書を参照して、入力された仮名文字列を文節分かち書きし、分かち書きされた各文節において、文節を構成する単語を変換済みの形態で示す。この状態で、分かち書きされた一つの文節を起点とし、所定の文節同士の係り受けの情報を記憶した係り受け情報辞書を参照して、他の文節との係り受けの存在を検定する。この係り受けの検定により係り受け関係の成立が検定された文節の少なくとも一方の文節において、候補単語表示手段により表示された単語とは異なる単語が選択されると、この選択された単語を、係り受け情報として学習する。従って、新たな係り受けの関係を学習していくことができるという優れた効果を奏する。
【００７２】
請求項２記載の仮名漢字変換装置は、新たな係り受けの学習が、候補単語表示手段により表示された単語と、この単語に代えて選択された単語との文法上の性質が同じであるときのみに行なわれるので、検定された係り受けとは関係のない単語による文節の関係を係り受けとして学習することがないという効果を奏する。
【００７３】
請求項３記載の仮名漢字変換装置は、係り受け関係を有する文節を構成し得る単語について、該単語のカテゴリを記憶しておき、単語のカテゴリが同一の時、文法上の性質が同一と判断する手段を備えるから、単語に付与されたカテゴリにより文法上の性質が同一かどうかの判断を容易に行なうことができる。尚、このカテゴリの情報は文法辞書内に持たせることも可能である。
【００７４】
請求項４の仮名漢字変換装置は、係り受けの関係を、体言＋用言、用言＋用言、体言＋体言、連体形＋体言、連体詞＋体言の少なくとも一つについて検定するので、基本的な係り受けの関係について、確実に検定することができる。
【００７５】
請求項５記載の仮名漢字変換装置は、体言＋用言の係り受けパターンの解析時に、使役または受動の関係を用いた係り受けの検定を行ない、係り受けの成立が検定されたとき、使役または受動の関係を原形に戻して係り受け関係を学習するので、使役または受動の関係について別途係り受け情報を記憶したり、係り受けの学習をする必要がないという優れた効果を奏する。
【図面の簡単な説明】
【図１】本発明の一実施例である仮名漢字変換装置における仮名漢字変換機能の実現形態を示す機能ブロック図である。
【図２】実施例としての仮名漢字変換装置が実現されるハードウェアを示すブロック図である。
【図３】文節分かち書き部１０２において実行される文節分かち書き処理を示すフローチャートである。
【図４】実施例における最小コスト法による文節分かち書きの一例を示す説明図である。
【図５】実施例における係り受け検定の対象となる例文を示す説明図である。
【図６】実施例における係り受け検定処理ルーチンを示すフローチャートである。
【図７】実施例における係り受け辞書の一例を示す説明図である。
【図８】複数文節における係り受けの成立の様子を示す説明図である。
【図９】係り受けの検定における優先順位を示す説明図である。
【図１０】係り受け学習処理ルーチンを示すフローチャートである。
【図１１】係り受け情報作成処理ルーチンを示すフローチャートである。
【図１２】「体言」＋「用言」の係り受けパターン解析処理ルーチンを示すフローチャートである。
【図１３】係り受けが成立する文節の関係を示した説明図である。
【図１４】第２実施例にかける意味品詞を備えた辞書の一例を示す説明図である。
【符号の説明】
２１…ＣＰＵ
２２…ＲＯＭ
２３…ＲＡＭ
２４…キーボード
２５…キーボードインタフェース
２６…ＣＲＴ
２７…ＣＲＴＣ
２８…プリンタ
２９…プリンタインタフェース
３０…ハードディスクコントローラ（ＨＤＣ）
３１…バス
３２…ハードディスク
４０…文字入力部
４２…変換制御部
４４…変換後文字列出力部
５０…文字列入力部
５２…文字格納部
５４…自立語候補作成部
５６…自立語解析位置管理部
５８…自立語辞書
６４…付属語候補作成部
６６…付属語解析位置管理部
６８…付属語辞書
７０…係り受け学習部
７０…学習部
７２…自立語学習部
７４…補助語学習部
７６…接辞学習部
７８…文字変換学習部
８０…単語データ作成部
８２…接続検定部
８４…接続検定テーブル
８６…コスト計算部
９０…係り受け候補調整部
９２…受動解析部
９４…助詞許容解析部
９６…係り受け範囲管理部
９８…係り受け辞書
９９…係り受け転置情報調整部
１００…単語データ格納部
１０２…文節分かち書き部
１０４…係り受け転置情報調整部
１０６…文節データ格納部
１０８…変換文字列出力部

Claims

仮名文字列から、文法辞書を参照して、仮名漢字混じり文字列候補を生成する仮名漢字変換装置であって、
入力された仮名文字列を、前記文法辞書を参照して文節分かち書きする分かち書き手段と、
該分かち書きされた各文節において、該文節を構成する単語を変換済みの形態で示す候補単語表示手段と、
文節を単位として、該文節を構成する単語同士の係り受けの情報を記憶した係り受け情報辞書と、
前記分かち書きされた一つの文節を起点とし、該係り受け情報辞書を参照して他の文節との係り受けの存在を、検定する係り受け検定手段と、
該係り受けの検定により係り受け関係の成立が検定された文節の少なくとも一方の文節において、前記候補単語表示手段により表示された単語とは異なる単語が選択されたとき、該選択された単語を、係り受け情報として学習する係り受け学習手段と
を備え、
前記係り受け学習手段は、
候補単語表示手段により表示された単語とは異なる単語が選択されたとき、該単語が係り受け関係の成立が検定されたときの単語と前記係り受け関係が維持される点で文法上の性質が同一の単語か否かを判断する判断手段と、
該判断手段により前記文法上の性質が同一の単語であると判断された時のみ、前記学習を行なう学習実行手段と
からなる仮名漢字変換装置。
請求項１記載の仮名漢字変換装置であって、
前記文法辞書は、所定の単語については該単語のカテゴリを示す意味品詞を記憶しており、
前記係り受け情報辞書は、前記意味品詞を用いて係り受けの情報を記憶しており、
前記係り受け検定手段は、前記意味品詞を用いて係り受けの検定を行なう手段を備え、
前記学習実行手段は、前記判断手段により前記文法上の性質が同一であると判断された単語の意味品詞を、前記係り受け検定手段により前記係り受けが成立すると判断された単語の意味品詞に設定する手段を備えた
仮名漢字変換装置。
係り受け検定手段は、係り受けの関係を、前記文節分かち書きされた文節を構成する単語に関し、体言＋用言、用言＋用言、体言＋体言、連体形＋体言、連体詞＋体言の少なくとも一つについて検定する手段である請求項１記載の仮名漢字変換装置。
請求項３記載の仮名漢字変換装置であって、
前記係り受け検定手段は、体言＋用言の係り受けパターンの解析時に、使役または受動の関係を用いた係り受けの検定を行なう第１手段を備え、
前記学習手段は、該第１手段により係り受けの成立が検定されたとき、使役または受動の関係を原形に戻して係り受け関係を学習する第２手段を備えた
仮名漢字変換装置。
仮名文字列に基づいて、コンピュータが、記憶装置に記憶した文法辞書を参照して、仮名漢字混じり文字列候補を生成する仮名漢字変換方法であって、
キーボードを介して入力された仮名文字列を、前記文法辞書を参照して、コンピュータが文節分かち書きし、
該分かち書きされた各文節において、該文節を構成する単語を変換済みの形態で、表示装置に示し、
文節を単位として、文節を構成する単語同士の係り受けの情報を記憶した係り受け情報辞書であって記憶装置に記憶された辞書を参照し、コンピュータが、前記分かち書きされた一つの文節を起点として、他の文節との係り受けの存在を、検定し、
該係り受けの検定により係り受け関係の成立が検定された文節の少なくとも一方の文節において、前記表示された単語とは異なる単語が選択されたとき、該単語が係り受け関係の成立が検定されたときの単語と前記係り受け関係が維持される点で文法上の性質が同一の単語か否かを、前記記憶装置に記憶された文法辞書を参照することによりコンピュータが判断し、
文法上の性質が同じであると判断された時のみ、該選択された単語を、係り受け情報として学習する
仮名漢字変換方法。