JPH0962667A

JPH0962667A - 仮名漢字変換装置および仮名漢字変換方法

Info

Publication number: JPH0962667A
Application number: JP7240762A
Authority: JP
Inventors: Yasuo Koyama; 泰男小山
Original assignee: EE I SOFT KK
Current assignee: EE I SOFT KK
Priority date: 1995-08-25
Filing date: 1995-08-25
Publication date: 1997-03-07
Anticipated expiration: 2015-08-25
Also published as: JP3873305B2

Abstract

(57)【要約】【課題】補助用言など自立語と結合して一文節を構成
するとして扱うことが望ましい場合、次候補が独立に表
示することができない。【解決手段】文節分かち書き処理を行なう際には、補
助用言、接辞、指示連体詞、形式名詞などの見掛け自立
語は、付属語として扱い、自立語と結合して文節を構成
するものとして処理する。したがって、「はしるときえ
だが」は「走るとき」＋「枝が」と文節分かち書きさ
れ、「走る」＋「時枝が」と分かち書きされることはな
い。その上で、この分かち書きした各文節を表示する際
には、見掛け自立語については、独立した文節を構成す
るよう文節区切りを追加する。したがって、表示上の文
節は、「走る」＋「とき」＋「枝が」となり、「とき」
についての次候補「時」などは、文節長の変更などを行
なうことなく、表示させることができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、仮名漢字変換装置
および仮名漢字変換方法に関し、詳しくは入力した文字
列から辞書を参照して仮名漢字混じり文字列候補を生成
する仮名漢字変換装置および仮名漢字変換方法に関す
る。

【０００２】

【従来の技術】従来、入力された仮名文字列を、所望の
仮名漢字混じり文字列に変換するための仮名漢字変換装
置が種々提案されている。特に最近では、仮名漢字変換
を行なう際に、使用者が仮名の入力にあわせて単語や文
節などの区切りをいちいち指定することなく、仮名べた
書きの文字列を入力すれば所望の仮名漢字混じり文字列
が得られるよう、様々な工夫がなされている。

【０００３】仮名べた書きの文字列を正しく文節分かち
書きするための処理としては、２文節を基本単位として
解析し、成り立ち得る文節の中で最長の文節が得られる
２文節を第１候補とする２文節最長一致法や、文節を構
成する単語の候補となり得る単語および単語同士の組合
わせに各種の数値（コスト）を付け、その数値の合計が
最小となる文節を第１候補とする最小コスト法などがあ
る。後者の方法では、文節を、基本的には自立語と付属
語の結合からなるものとして扱い、自立語に付属語が接
続する場合には、文節が取る数値は付属語が付属する場
合でも変わらないとして扱っている。この結果、自立語
＋自立語などの組み合わせより、自立語＋付属語の組み
合わせが優先されやすくなる。

【０００４】他方、こうした仮名漢字変更装置により得
られた最初の単語候補が非所望のものである場合には、
次候補の指示により、各文節毎に、第２候補以下の単語
を表示する。日本語には、同音異義語が多いので、かな
り詳細に品詞情報を付与して、文節や単語の連なりの数
値を調整しても、一度の変換では所望の候補文字列が得
られない場合は少なくない。こうした場合には、複数の
同音異義語の中から使用者が一つの単語を選択すると、
この選択した単語を最優先で次回の候補とすることが行
なわれている。これがいわゆる同音異義語の学習である
が、このほか、文節区切りの位置が非所望なものであ
り、これを変更した場合に、使用者が指定した文節区切
りの位置を記憶して、次に同じ文字列が入力された場合
には、この文節区切りの位置を優先的に区切り位置とす
るいわゆる文節区切り学習などの学習処理も知られてい
る。

【０００５】

【発明が解決しようとする課題】以上説明したように、
仮名漢字変換では、自立語と付属語からなる文節を基本
として文字列の構成を考えることが基本となるが、自立
語や付属語の一部には、単に自立語としてあるいは付属
語として一律に扱ったのでは、仮名漢字変換の処理をス
ムースに行なうことができないものが存在することが分
かった。例えば、形式名詞（「こと」、「とき」など）
等の場合、品詞的には名詞と言えるから、これを自立語
として扱うことが考えられるが、自立語として扱ったの
では、非所望な変換結果を招来することが多い。

【０００６】「はやしをはしるときえだがじゃまだ」と
いう文字列が入力されて文節分かち書きをする場合を考
えると、形式名詞である「とき」を自立語として扱う
と、「林（自立語）＋を（付属語）」＋「走る（自
立語＋活用語尾）」＋「とき（自立語）」＋「枝
（自立語）＋が（付属語）」＋「邪魔（自立語）＋だ
（付属語）」という文節分かち書きよりも、「林（自
立語）＋を（付属語）」＋「走る（自立語＋活用語
尾）」＋「時枝（人名・自立語）＋が（付属語）」＋
「邪魔（自立語）＋だ（付属語）」の方が、文節数が
少なくなり、数値の総和も小さくなるから、後者の文節
分かち書きがなされてしまう。しかもこの場合には、
「時枝が」の文節にカーソルをおいて次候補キーを操作
しても、「時枝が」の次候補が得られるに過ぎず、「と
き」＋「枝が」が得られることはない。従って、使用者
は、文節長の変更を行なって、「とき」や「えだが」を
得てから改めて変換（次候補キー）を操作を行なう必要
があった。他方、形式名詞である「とき」や「こと」を
一律に付属語として扱うと、「はしるとき」が一つの文
節として扱われるから、第一候補として得られた「走る
とき」を「走る時」に変換しようとすると、予め両方の
語候補（「走るとき」と「走る時」）を辞書に登録して
おくか、文節の区切り位置を強制的に「はしる」と「と
き」との間に指定し、「とき」を自立語として扱って次
候補「時」に変換する他なかった。

【０００７】同様の問題は、補助用言や接辞（接頭語、
接尾語）等にも問題となる。接辞は、付属語として扱う
ことが可能であるが、この場合には、「接頭語＋自立語
＋付属語」や「自立語＋接尾語＋付属語」を一つの文節
と見るので、接辞（例えば「御」「回」など）が非所望
のものであっても、これを変更しようとすると、文節区
切りの位置を変更せねばならないと言う問題があった。
仮に「ごしゅっせき」という文字列を入力して文節分か
ち書きした結果、第一候補文字列として「御出席」とい
う文字列を得たとする。この時、「御」の文字を「ご」
に変更しようとすると、「御出席」「ご出席」の両方を
辞書に登録しておかなければならない。接辞や形式名詞
は広汎な語に付属するから、これらをすべて登録するこ
とは、辞書の肥大化や検索時間の長期化という問題を招
来してしまう。

【０００８】本発明の仮名漢字変換装置および仮名漢字
変換方法は、こうした問題を解決し、文節分かち書きの
使い勝手を向上することを目的としてなされ、次の構成
を採った。

【０００９】

【課題を解決するための手段およびその作用・効果】本
発明の第１の仮名漢字変換装置は、仮名文字列を入力
し、辞書を参照して、該入力された仮名文字列を文節分
かち書きし、仮名漢字混じり文字列候補を生成する仮名
漢字変換装置であって、自立語と付属語の結合を文節の
基本単位として扱うものとし、前記入力した仮名文字列
を、所定の規則に照らして妥当と判断される前記文節の
連なりとして分かち書きすると共に、該各文節のうち自
立語と所定の付属語との結合からなる文節については、
該文節を構成する単語候補の表示においては、該付属語
と自立語とを独立に表示することを要旨とする。

【００１０】また、本発明の仮名漢字変換方法によれ
ば、仮名文字列を入力し、辞書を参照して、該入力され
た仮名文字列を文節分かち書きし、仮名漢字混じり文字
列候補を生成する仮名漢字変換方法であって、自立語と
付属語の結合を文節の基本単位として扱うものとし、前
記入力した仮名文字列を、所定の規則に照らして妥当と
判断される前記文節の連なりとして分かち書きし、該各
文節のうち自立語と所定の付属語との結合からなる文節
については、該文節を構成する単語候補の表示において
は、該付属語と自立語とを独立に表示することを要旨と
する。

【００１１】かかる仮名漢字変換装置および仮名漢字変
換方法では、自立語と付属語の結合を文節の基本単位と
して扱うが、このうち所定の付属語との結合からなる文
節については、文節を構成する単語候補の表示において
は、この付属語と自立語とを独立に表示する。したがっ
て、文節分かち書きにおける最小単位である文節と表示
における最小単位とが異なるものとなり、文節分かち書
きの正確さと使い勝手とを両立させることができる。

【００１２】ここで、表示において独立に扱われる所定
の付属語としては、少なくとも補助用言，形式名詞，接
辞のうちの一つを考えることができる。これら補助用
言、形式名詞、接辞（接頭語，接尾語）は、文節の構成
上は、自立語に付属するものとして扱った方が自然な語
であり、かつ表記上は複数の表記があり得る語だからで
ある。

【００１３】また、前記所定の付属語について、異なる
単語候補が選択された場合には、他の文節におけるその
付属語について、該選択された単語候補を第一候補とし
て表示する学習手段を備えることも好適である。接頭語
を例に取ると、「ごしゅっせき」という文節で、「ご出
席」に代えて「御出席」が選択された場合には、以後の
「ごあいさつ」などの文節でも「御挨拶」を優先するの
である。

【００１４】なお、本発明で、入力した仮名文字列に対
して、所定の規則に照らして妥当と判断される文節と
は、分かち書きした文節間の結合および該文節を構成す
る単語間の結合の生じ易さが最大となる組合わせとする
ことができる。この場合には、２文節を越えるような長
い文字列に対しても自然な日本語を構成する文節分かち
書き処理を実現することができる。もとより、この所定
の規則としては、２文節最長一致など、他のアルゴリズ
ムを採用することも差し支えない。

【００１５】本発明の第二の仮名漢字変換装置は、仮名
文字列を入力し、辞書を参照して、該入力された仮名文
字列を文節分かち書きし、仮名漢字混じり文字列候補を
生成する仮名漢字変換装置であって、自立語と付属語の
結合を文節の基本単位として扱うものとし、前記入力し
た仮名文字列を、所定の規則に照らして妥当と判断され
る前記文節の連なりとして分かち書きする分かち書き手
段と、該各文節のうち自立語と所定の付属語との結合か
らなる文節については、該文節を構成する単語候補の表
示においては、該付属語と自立語とを独立に表示する文
節表示手段と、該文節について次候補の指示がなされた
とき、該付属語と該自立語については、個別に次候補を
表示する次候補表示手段とを備えたことを要旨とする。

【００１６】この仮名漢字変換装置は、分かち書き手段
が、自立語と付属語の結合を文節の基本単位として扱う
ものとし、入力した仮名文字列を、所定の規則に照らし
て妥当と判断される文節の連なりとして分かち書きする
が、得られた各文節のうち自立語と所定の付属語との結
合からなる文節については、文節表示手段が、文節を構
成する単語候補の表示において、付属語と自立語とを独
立に表示する。その上で、文節について次候補の指示が
なされたとき、次候補表示手段が、付属語と自立語につ
いては、個別に次候補を表示する。従って、文節分かち
書きのための文節と次候補表示のための文節とを異なる
扱いとすることができ、正確な文節分かち書き処理と使
い勝手の良い次候補表示とを両立させることができる。

【００１７】

【発明の他の態様】本発明の他の態様としては、コンピ
ュータのメモリにロードされることで、コンピュータに
備えられた入力手段から仮名文字列を入力し、辞書を参
照して、該入力された仮名文字列を文節分かち書きし、
仮名漢字混じり文字列候補を生成する仮名漢字変換装置
を実現するプログラムを記録した媒体であって、自立語
と付属語の結合を文節の基本単位として扱うものとし、
前記入力した仮名文字列を、所定の規則に照らして妥当
と判断される前記文節の連なりとして分かち書きすると
共に、該各文節のうち自立語と所定の付属語との結合か
らなる文節については、該文節を構成する単語候補の表
示においては、該付属語と自立語とを独立に表示するプ
ログラムを記録した媒体などを考えることができる。

【００１８】この媒体はコンピュータのフレキシブルデ
ィスク装置や光磁気ディスク装置などに装着され、磁気
的な手段や光学的な手段により記録したプログラムをコ
ンピュータのメモリに転送することにより、コンピュー
タにおける仮名漢字変換機能を実現するものである。

【００１９】また、文節分かち書きやその後の候補単語
の表示において、係り受けの情報を利用することも、所
望の日本語文字列を得る上で好適である。

【００２０】

【発明の実施の形態】以上説明した本発明の構成・作用
を一層明らかにするために、以下本発明の実施の形態を
実施例に基づき説明する。図１は本発明の好適な一実施
例である仮名漢字変換装置において、仮名漢字変換制御
ロジックが実際に動作するハードウェアの構成を示すブ
ロック図である。図１に示すように、この装置は、予め
設定されたプログラムに従って仮名漢字変換に関わる動
作を制御するための各種演算処理を実行するＣＰＵ２１
を中心に、バス３１により相互に接続された次の各部を
備える。ＲＯＭ２２は、ＣＰＵ２１で各種演算処理を実
行するのに必要な仮名漢字変換に関わるプログラムやデ
ータなどを予め格納しており、ＲＡＭ２３は、同じくＣ
ＰＵ２１で各種演算処理を実行するのに必要な仮名漢字
変換に関わる各種データが一時的に読み書きされるメモ
リである。キーボードインターフェース２５は、キーボ
ード２４からのキー入力を司り、ＣＲＴＣ２７は、カラ
ーで表示可能なＣＲＴ２６への信号出力を制御し、プリ
ンタインターフェース２９は、プリンタ２８へのデータ
の出力を制御する。ハードディスク３２には、ＲＡＭ２
３にロードされて実行される各種プログラムやデバイス
ドライバの形式で提供される仮名漢字変換処理プログラ
ム、あるいは各種変換辞書などが記憶されており、この
ハードディスク３２をハードディスクコントローラ（Ｈ
ＤＣ）３０が制御する。タイマ３３は、現時点における
時刻、年月日などの所定の時点を示す日時情報を発生し
ている。

【００２１】このように構成されたハードウェアによ
り、文字列の入力、仮名漢字変換、編集、表示、印刷な
どがなされる。すなわち、キーボード２４から入力され
た文字列は、ハードディスク３２に記憶した各種データ
を参照しながらＣＰＵ２１により所定の処理がなされ、
ＲＡＭ２３の所定領域に格納され、ＣＲＴＣ２７を介し
てＣＲＴ２６の画面上に表示される。

【００２２】次に、こうして構成されたハードウェアに
より実行される仮名漢字変換処理の詳細について説明す
る。まず、に図２を用いて仮名漢字変換処理に関わる各
部の構成と働きについて概説するが、ここで行なわれる
処理は、キーボード２４より入力されたデータに基づ
き、中央処理装置（ＣＰＵ２１）が実行するものであ
る。このＣＰＵ２１により、すべての処理が行なわれ
る。仮名漢字変換については、キーボード２４が操作さ
れたとき、所定の割り込み処理が起動し、入力したキー
イメージを対応する仮名文字列に変換し、更にこれを仮
名漢字混じり文字列に変換するデバイスドライバが起動
する。もとより、並行処理可能なコンピュータであれ
ば、仮名漢字変換を一つのアプリケーション（インプッ
トメソッド）が行なうものとし、変換結果を、必要とす
るアプリケーションに引き渡す構成としても差し支えな
い。この場合には、キーボード２４からの入力をインプ
ットメソッドが一括して引き受けることになる。

【００２３】キーボード２４からのキーイメージは、文
字入力部４０により受け付けられ、ここで、対応する文
字列に変換される。ローマ字入力の場合には所定の変換
テーブルを参照して、仮名文字列に変換する。一つの仮
名文字が得られる度に文字入力部４０は、その仮名文字
を変換制御部４２に送出する。この変換制御部４２は、
仮名漢字変換の中心的な役割を果たすところであり、後
述する種々の仮名漢字変換を制御して、結果を変換後文
字列出力部４４に送出する。変換後文字列出力部４４
は、現実には、ＣＲＴＣ２７に信号を送り、ＣＲＴ２６
に変換後文字列を表示する。

【００２４】変換制御部４２は、受け取った仮名文字を
文字列入力部５０に引き渡す。文字列入力部５０は、文
字格納部５２に仮名文字列を格納する。この文字列に基
づいて、自立語候補作成部５４と付属語候補作成部６４
とが、単語データの候補を作成する。自立語候補作成部
５４は、ハードディスク３２に予め記憶された自立語辞
書５８を用い、自立語解析位置管理部５６の管理の下
で、得られた仮名文字列から自立語候補を抽出する処理
を行なう。一方、付属語候補作成部６４は、同じく付属
語辞書６８を用い、付属語解析位置管理部６６の管理の
下で、得られた仮名文字列から付属語候補を抽出する処
理を行なう。解析位置を移動しつつ、自立語候補と付属
語候補を抽出する処理については、後述する。

【００２５】自立語辞書５８および付属語辞書６８は、
Ｂ−Ｔｒｅｅ構造を有し、数万の語について、読みと、
表記と、品詞と、意味用例（係り受け情報）と、その他
のデータを記憶している。以下、自立語辞書５８の構成
について説明する。単語辞書５８は、図３に示すよう
に、ヘッダとインデックスと辞書本体からなる。ヘッダ
は、辞書自体を管理するための情報である。インデック
スおよび辞書本体は、代表表記と派生表記と意味用例と
に分けて管理されている。代表表記とは、一つの単語が
複数の表記を許容されている場合、例えば「取り扱い」
に対して「取扱い」や「取扱」などが表記として許され
ている場合、「取り扱い」をこれらの表記を代表するも
のとする、というように予め定めた単語表記である。派
生表記とは、「取扱い」「取扱」の様に、一つの単語に
対して許容されたその他の表記のことである。文節分か
ち書き処理を行なう際には、このように派生表記を有す
る語については、派生表記を代表する代表表記を用いて
文節分かち書き処理が行なわれる。意味用例についての
領域は、ある語と他の語との間に生じる特定の関係、例
えば「暑い夏」における「暑い」と「夏」、「熱いお
茶」における「熱い」と「お茶」など、ある語が他の特
定の語と共に用いられやすい関係（以下、この関係を
「係り受け」と呼ぶ）に関する情報が管理されている領
域である。

【００２６】これらの代表表記、派生表記、意味用例
は、辞書本体においては、ＢーＴｒｅｅ構造により管理
されている。Ｂ−Ｔｒｅｅ構造は、多数のデータを外部
記憶に置く場合に採用される周知の管理構造であり、本
実施例のＢ−Ｔｒｅｅ構造では、分木の節にはデータを
置かず、データはすべて分木の終端に置く構造を取って
いる。多分木の構造を取っているので、２分木と比べて
木構造の深さが浅くなり、外部記憶を用いる場合には、
アクセス時間を短いという特徴を有するものとして知ら
れている（Ｂ＋Ｔｒｅｅと呼ぶこともある）。辞書本体
におけるＢ−Ｔｒｅｅ構造の一例を図４に示した。単語
の読み（仮名文字列）に基づいてＢ−Ｔｒｅｅ制御ブロ
ックを辿って単語ブロックに至ると、ここに実際の単語
データがおかれている。なお、このタイプのＢ−Ｔｒｅ
ｅ構造では、当初、キーは、その節に置くことができる
キーの最大数より少ない数だけ置かれ、データの追加な
どに柔軟に対応できるものとしている。

【００２７】以下に、単語の読みに基づいてＢ−Ｔｒｅ
ｅ制御ブロックを辿る様子を図４に即して説明する。例
えば、「かわき」という仮名文字列が入力され、自立語
辞書５８における代表表記領域で検索が開始されるとき
を示す。Ｂ−Ｔｒｅｅの根元にあたる１段目には、それ
ぞれ１つの文字を持つキーが５０音順に並んでいる。
「かわき」から次段のどの分木に検索を進めるかは、
「かわき」の最初の文字である「か」を、１段目の節Ｓ
１の各キーと比較することにより知ることができる。こ
の例では、「かわき」は少なくともキー「か」とキー
「さ」との間に存在するから、２段目の節Ｓ２が探索の
対象となる。次にこの節Ｓ２において、同様の判断を行
ない、「かわき」という読みは５０音順でキー「かる」
より後、キー「くり」より前であると判断し、キー「か
る」以降でキー「くり」間での範囲に対応する３段目の
節Ｓ３が探索される。この３段目の４個のキーの中で
「かわき」を検索すると、５０音順でキー「かわ」より
後、キー「きじ」より前であるので、この範囲に対応す
る単語ブロックが探索される。この範囲に対応する単語
ブロックの中に「かわき」という読みを持つ語に関する
実際の単語データが格納されているのである。

【００２８】代表表記領域などの単語データは、大まか
には、図５に示すデータ構造を有している。即ち、先頭
に単語データのレコード長Ｘを示すデータが存在し、そ
の後、Ｘバイトの実データが続いている。実データの先
頭には、見出し語の長さＹが記録されており、続いてＹ
バイトの見出し語が記録されている。実際の単語データ
は、その後に続いている。単語データは、その先頭に単
語長Ｗが記録されており、その直後に漢字データの有無
などを示す１バイトのフラグが記録されている。フラグ
の後には、漢字データが記録されているが、この漢字デ
ータは、漢字データ長と実際の漢字文字列を示す漢字コ
ードから構成されている。その後、単語情報および品詞
データ（場合によっては複数の品詞データ）が記録され
ている。単語情報は、単語情報の長さを示すデータと、
実際の単語情報とからなる。また、品詞データは、品詞
データの長さを示す品詞データ長とその後の主たる品詞
および品詞に関する品詞情報からなる。品詞情報は、通
常複数あり、その後の意味上の役割（人名、役職、住
所、動物・・・・等）を示す情報や、活用形、活用語尾
長、連語品詞、短文品詞、特殊品詞など様々な情報が記
憶されている。このほか、その語が、接頭語を取りうる
か否か、接尾語を取りうるか否か、連用名詞化するか否
か、自動詞か他動詞か、意志動詞か無意志動詞かなどの
情報も記憶されている。

【００２９】自立語辞書５８，付属語辞書６８では、Ｂ
−Ｔｒｅｅ構造を用いて、単語の見出し文字列に基づい
て、所望の単語に関する情報を取り出すことができる。
これらの単語情報は、更に図９に示すように、セパレー
タとこれに続くデータとから構成されている。セパレー
タとしては、それ以後に続くデータが表示される漢字の
データであることを示す表示漢字セパレータや、データ
が読み情報であることを示す読み情報セパレータ、派生
表記であることを示す派生表記セパレータなどがある。
表示漢字とは、一つの単語に代表表記と派生表記とがあ
る場合に、デフォルトで漢字を表示するために、代表表
記に対応する漢字での表記を記録しているものである。
派生表記には種々の形態が存在するが、各単語について
はそれぞれ許容された表記が派生表記情報として記憶さ
れている。派生表記セパレータは、派生表記領域にのみ
存在する情報であり、その下位３ビットは、各派生表記
セパレータの後に情報が記憶されている派生表記が、派
生表記の形態の何種類分に対応するのかを示している。
一例として、「売り上げ」という単語を挙げると、「売
り上げ」という表記は、派生表記の「本則」と「送る」
の両者に該当するため、その派生表記セパレータの下位
３ビットには、派生表記形態の２種類に対応するとし
て、値２が設定されている。また、読み情報は、単語の
読みを与えるものであり、見出し語が漢字である場合な
どにその読みを与えるものである。この情報は、漢字か
らその読みを得て、読みを同じくする単語を検索する場
合などに用いられる。例えば、文字の入力をキーボード
からの他に手書き入力などで行なって、仮名と共に漢字
を含む文字列が入力されたとき、これを正しく変換する
際に用いられる（例「ひ行き」→「飛行機」）。なお、
一つの代表表記とこの代表表記に対応する派生表記と
は、別々の領域で管理されているが、単語の読み（見出
し）と単語の品詞情報とが一致するものについて、対応
関係があるとみなしている。

【００３０】同音異義語や接辞の表記について、仮名漢
字変換においていずれかの語や表記が選択されると、こ
れを自立語辞書５８内に記録し、次回以降の変換では、
その語が第一候補になりやすくする学習処理がなされて
いる。この学習処理を行なうのが、図２に示した自立語
学習部７２、補助語学習部７４、接辞学習部７６、文字
変換学習部７８である。自立語学習部７２は、同音異義
語の存在する自立語群において、最後に選択された単語
を次回以降の変換において最優先の候補とするよう学習
するものである。補助語学習部７４は、例えば「くださ
い」などの補助語を「ください」「下さい」など、いず
れの語形で変換するかを学習するものである。更に、接
辞学習部７６は、接頭語、接尾語などの変換形式（例え
ば、「御」「ご」など）を学習するものである。文字変
換学習部７８は、入力した文字列をそのままひらがなや
カタカナとして確定させた場合に、その文字列を学習
し、次回以降の変換処理では確定させたひらがなまたは
カタカナを候補として出力するものである。

【００３１】付属語辞書６８も、基本的には自立語辞書
と同一の構造を備える。両辞書に登録されている語の種
別を以下に示す。品詞番号品詞登録辞書表示上の取扱い (1) １〜７９自立語自立語辞書自立語 (2) ８０〜１１９活用語尾自立語辞書活用語尾 (3) １２０〜１９９補助用言付属語辞書見掛け自立語 (4) ２００〜２０５形式名詞付属語辞書見掛け自立語 (5) ２０６〜２４８接辞付属語辞書見掛け自立語 (6) ２４９基数付属語辞書付属語 (7) ２５０〜２９９助動詞付属語辞書付属語 (8) ３００〜４３９助詞付属語辞書付属語 (9) ４４０〜４５９助動詞的表現付属語辞書付属語 (10)４６０〜４９９助詞的表現付属語辞書付属語ここで、「表示上の取扱い」とは、文節分かち書きなど
の処理で用いられる文法情報とは別に、文節分かち書き
された文字列をＣＲＴ２６に表示する際の取扱いに関す
る情報である。補助用言や形式名詞に、接辞について
は、自立語ではないが、表示においては見掛け上、自立
語として扱うので、「見掛け自立語」という取り扱うも
のとしている。見掛け自立語と自立語との違いについて
は、後で詳しく説明する。

【００３２】自立語候補作成部５４および付属語候補作
成部６４により作成された語候補は、単語データ作成部
８０に出力される。単語データ作成部８０が、作成され
た語候補を得て、各語候補についてのデータを作成す
る。単語データ作成部８０の制御の下で、接続検定部８
２は、得られた自立語と付属語、自立語と自立語、更に
は「自立語＋付属語」からなる文節間の接続を、接続検
定テーブル８４を参照して検定する。また、コスト計算
部８６は、全体のコスト計算を行なう。これら接続検定
部８２およびコスト計算部８６の処理の結果を得て、単
語データ作成部８０は、単語毎のコストや連なりの妥当
性に関するデータを出力する。この単語データは、一旦
単語データ格納部１００に格納され、文節分かち書きの
処理に供される。文節分かち書き部１０２は、得られた
データから文節分かち書きの第１候補を決定する。

【００３３】以上の処理により文節分かち書きの第１候
補と、その文節毎の仮名漢字変換の第１候補が決定され
る。文節分かち書き部１０２は、その候補を文節データ
格納部１０６に格納し、格納された候補は、変換文字列
出力部１０８により変換制御部４２に出力される。変換
制御部４２は、この文字列を候補文字列として表示する
と共に、非所望の文字列が候補となる場合もありえるか
ら、使用者による指示を受けて、次候補の表示や選択な
どの処理を行なう。これらの指示や選択の結果などは、
文節データ格納部１０６や既述した各学習部７２ないし
７８に入力され、文節の一部確定や学習による優先順位
の書き換えなどに用いられる。なお、図示していない
が、使用者により文字列の確定処理がなされると、各部
に一時的に保存されたデータはすべて消去され、次の変
換に備える。

【００３４】以上、仮名文字列の入力から変換後文字列
の出力までを概説したが、次に各処理の詳細について説
明する。まず始めに仮名漢字変換処理について大まかに
説明し、次に単語辞書の構造、各処理の詳細について説
明する。図７は、本実施例における仮名漢字変換処理ル
ーチンの概略を示すフローチャートである。この処理ル
ーチンは、キーボード２４から一ないし複数の仮名文字
が入力された後、変換キー（例えば「スペースキー」）
が押されたとき、開始される処理である。なお、変換キ
ーが操作されなくても、所定数の仮名文字が入力された
とき、あるいは「。」や「、」「．」などの区切り記号
が入力されたときに、図７の仮名漢字変換処理が開始さ
れるものとしても差し支えない。

【００３５】この処理が開始されると、まず単語検索処
理（ステップＳ１００）と分かち書き処理（ステップＳ
１１０）とが行なわれる。これらの処理について、図８
のフローチャートを用いて説明する。図８は一般的な文
節分かち書き処理の一つである最小コスト法による文節
分かち書き処理の概要を示すフローチャートであり、図
７におけるステップＳ１００およびステップＳ１１０に
相当する。また、図９は、最小コスト法による文節分か
ち書きの様子を示す説明図である。以下、図７における
文節分かち書き処理の流れを、図９での具体例に即して
説明する。

【００３６】キーボード２４から文字列が入力されて文
節分かち書き処理が開始されると、まず、展開バッファ
に保存されたデータの消去や解析位置を１桁目に初期化
するなどの初期化の処理（ステップＳ２００）を行なっ
た後、解析位置を求める処理を行なう（ステップＳ２１
０）。いま、キーボード２４から「はしるときえだがじ
ゃまだ」という仮名文字列を入力したならば、最初の解
析位置は１桁目の「は」の位置となる。この解析位置
は、入力された仮名文字列の解析が進むに従って、入力
された仮名文字列の先頭から順に一つずつ進められてい
く。すなわち、まず「は」の位置を解析位置として、後
述するような検索処理を行ない、その後、次の解析位置
を「し」とし、その次は「る」というように順次進んで
行くのである。

【００３７】ステップＳ２１０で解析位置が決まると、
各解析位置において、ハードディスク３２に記憶された
自立語辞書５８および付属語辞書６８を検索する処理を
行なう（ステップＳ２２０）。例えば、いま解析位置が
図９の「は」の位置であるとすると、「葉」「歯」
「波」などの単語が検索結果として得られる。「は」に
は、付属語としての「は」も存在するが、付属語が先頭
に来る場合の取扱いは別になるので、ここでは取り上げ
ない。これら検索の結果得られた単語は、図９に示すよ
うに、その単語の終わる桁位置にリンクしておく。「は
しる」まで検索を行なうと、「はしる」以降の読みを持
つ自立語（例えば、「はしると」や「はしるとき」な
ど）は辞書を検索しても見つからないため、「は」を解
析位置とした辞書検索を終了する。辞書は、Ｂ−Ｔｒｅ
ｅ構造を取っているため、それ以上長い読みの単語があ
るか否かは容易に知ることができる。辞書検索が終了す
ると、得られた単語についてそれ以前の単語との結合の
可能性をチェックする処理を行なう（ステップＳ２３
０）。上記「は」を解析位置とした例では、「は」は入
力された文頭の文字であるためそれ以前の単語との結合
の可能性をチェックすることはないが、例えば、係助詞
の直前に助詞が存在する場合など、その結合がありえな
いと判断される時には、無効なデータとして扱われる
（ステップＳ２３５）。

【００３８】結合の可能性のある単語については、次に
コスト計算を行ない、その単語の最小総コストを求める
処理を行なう（ステップＳ２４０）。これは、自立語＝
２、付属語＝０のコストを持つものとし、入力された文
字列の先頭から各単語までの最小総コストを求める処理
である。図９では、付属語は二重四角で囲って示した。
コスト計算は次のように行なう。先頭の自立語「葉」
（自立語）の場合は、総コストは自身のコスト２とな
り、「四」の総コストは「葉」（自立語）＋「四」（自
立語）と考え、そのコストは４となる。このとき、最小
の総コストを求めるため、「る」の総コストは、「葉」
＋「四」＋「留」のコスト６ではなく、「橋」＋「留」
の場合のコスト４を採用する。「氏」や「市」は、人の
名字や都市名に付属する接辞の一種として扱うことがで
きるので、実施例では付属語として扱っている。したが
って、その直前にリンクされた単語のうち最小の総コス
トを有する単語「葉」＝２のコストがそれ自身のコスト
になる。図９では、各単語のコストをそれぞれの右下に
記した。図９に示した例では、形式名詞「とき」を付属
語として処理しているので、「はしるとき」は、自立語
「走る」＋形式名詞「とき」でコスト２として処理して
いる。なお、本実施例では、付属語のコストを一律に０
として扱ったが、付属語を、更に助動詞とそれ以外に分
け、前者のコストを値１、後者のコストを値０として扱
うことなども好適である。

【００３９】以上のコスト計算が終わると、次に各単語
のコストチェックを行なう（ステップＳ２５０）。これ
は、文字列を単語の組合わせに分けたとき、他の組合わ
せに較べてコストが大きくなる組合わせを除く処理であ
る。例えば、「葉」＋「四」という組合わせは「橋」や
「端」のコストよりも高くなるので、「葉」＋「四」の
組合わせは不適切であると判断して、文節候補から除外
する（ステップＳ２５５）。図９では、このようなコス
トチェックの結果文節候補として採用しないと判断した
単語の右上に「●」を、文節候補を形成する可能性のあ
る語として残った単語の右上に「○」を付した。

【００４０】次に、こうして有効な語として残った単語
同士をリンクする処理を行なう（ステップＳ２６０）。
すなわち、前記の結合チェックの結果、結合が有効とさ
れた単語の組合わせについて、ポインタを設定すること
で単語同士を結び付けるのである。図９の例では、
「は」を解析位置としている場合には、「はしるとき」
まで解析し、自立語「走る」と付属語である形式名詞
「とき」をリンクする。

【００４１】以上のような結合チェック、コスト計算、
コストチェック、単語間のリンクなどの処理を一つの解
析位置で検索されるすべての単語について終了すると、
ステップＳ２１０に戻って解析位置を一桁進めて再び辞
書検索を行ない、結合チェックやコスト計算など同様の
処理を繰り返す。

【００４２】解析位置が入力された仮名文字列の最後の
桁に達し、入力した仮名文字列の全語について解析が終
了すると（ステップＳ２６５）、次に、以上の解析結果
を踏まえて最小コストパスの検索が行なわれる（ステッ
プＳ２７０）。このステップでは、これまでの処理の中
で有効な単語として残り互いにリンクされた組合わせの
中で、各単語に与えられたコストの合計が最小になる組
合わせを検索する。図９の例ではコスト計算からは、文節「走るとき」（コスト２）＋文節「枝が」（コス
ト２）＋文節「邪魔だ」（コスト２）のリンク（図９実
線Ｇ、総コスト６）、文節「走る」（コスト２）＋文節「時枝が」（「時枝
は人名・文節のコスト２）＋文節「邪魔だ」（コスト
２）のリンク（図９破線Ｂ、総コスト６）、文節「走る」（コスト２）＋文節「時江だが」（「時
江」は人名・文節のコスト２）＋文節「邪魔だ」（コス
ト２）のリンク（図９一点鎖線Ｒ、総コスト６）の３つが、妥当な文節の連なりとして残ることになる。
更に、結びつきが強い単語間には、特別なコストが割り
当てられているので、この点を評価して最小コストのパ
スを検索するのである。即ち、自立語＋形式名の結合
は、語の現れ方として、より一般的と考えられるので、
この結合にコスト「−１」を与えるものとしている。し
たがって、のパスが全体として最小コスト（１６−１
＝１５）のパスとして検索されることになる。このほ
か、接辞＋自立語や自立語＋補助用言などについても、
単語間の結合が強いものと評価し、最小コストを求める
上で、有利な取扱いをしている。

【００４３】このように最小コストを持つ文節分かち書
き候補が作成されると（ステップＳ２８０）、次に文節
分かち書き候補の各文節内での候補が作成される（ステ
ップＳ２９０）。例えば「えだ」という単語に対して
「枝」「江田」「荏田」などの同音異義語が候補として
用意される。これら各文節内での候補は、自立語学習部
７２により、直前に使用した語を最優先で選択するなど
所定の方法で優先順位が決められている。ここで、形式
名詞「とき」という語についても、「とき」と「時」の
いずれが優先順位が高いかが、補助語学習部７４により
決定される。図９に例示した「はしるときえだがじゃま
だ。」という文字列を文節分かち書きすると、図中に実
線Ｇで示した「走るとき」＋「枝が」＋「邪魔だ」が第
１候補として得られることになる。

【００４４】以上の説明では、説明を簡略にするために
コスト計算は各単語自身のコストを基本とし、例外的に
特定の品詞間の結合し易さに着目した単語間コストを設
け単語間の結びつきの優先順位の高いものについて言及
したが、文法上結合し易いと判断される文節間のコスト
を下げるための文節間コストを設けるなど、所望の変換
結果を得やすくするための様々な工夫を加えることが可
能である。

【００４５】上記の処理により作成された文節分かち書
き候補に対して、次に、文節分かち書き処理を施した変
換結果をＣＲＴディスプレイ２６に出力する表示処理
（ステップＳ１３０）を行ない、その後、第一候補を表
示した文節のいずれかについて次候補の要求があるかを
判断し（ステップＳ１４０）、次候補の要求がある場合
には、次候補処理（ステップＳ１５０）を行なって、こ
の仮名漢字変換処理ルーチンを終了する。

【００４６】この表示処理（ステップＳ１３０）につい
て説明する。図１０は、これらの処理の詳細を示すフロ
ーチャートである。この処理が開始されると、まずステ
ップＳ１１０までの処理によりなされた文節分かち書き
の結果を受けて、最小コストとなるパスの各文節を展開
バッファから読み出す（ステップＳ３００）。次に、第
１文節を指定すべく変数Ｎを値１とし（ステップＳ３１
０）、第Ｎ文節に見掛け自立語が存在するか否かの判断
を行なう（ステップＳ３２０）。見掛け自立語は、既に
説明したように、本実施例では、補助用言，形式名詞，
接辞が該当する。従って、図９に示した例では、「走る
とき」という文節に着目した場合には、形式名詞が存在
することから、見掛け自立語ありと判断することにな
る。

【００４７】見掛け自立語が存在する場合には（ステッ
プＳ３２０）、見掛け自立語を独立の文節として文節区
切りを追加する処理を行なう（ステップＳ３３０）。
「走るとき」の例では、見掛け自立語「とき」を独立の
文節として扱うことができるよう「走る」と「とき」と
の間に文節区切りの情報を追加するのである。文節区切
りの情報の追加は、本実施例では、展開バッファ内に展
開されている仮名文字列において、文節の区切りを示す
情報を文字間に加えることにより実現している。なお、
追加される新たな文節の区切りの情報は、文節分かち書
き本来の処理により付与された区切りの情報と区別可能
な形態としておくことが、後の候補文字列の表示の処理
上好ましい。見かけ自立語が存在する場合に文節区切り
の情報を追加する以上の処理は、見掛け自立語をそれぞ
れの文法情報（形式名詞など）を用いて文節分かち書き
し、自立語＋形式名詞の結びつきからなる一つの文節と
して切り出した文節について、後から文節の区切りを追
加するのであって、「とき」を自立語と見て文節分かち
書きをやり直すというものではない。

【００４８】第Ｎ文節に見掛け自立語があれば文節区切
りを追加し（ステップＳ３３０）、第Ｎ文節に見掛け自
立語がなければ、特に文節区切りの追加などは行なわ
ず、その後、変数Ｎを値１だけインクリメントし（ステ
ップＳ３４０）、全文節が終了した否かの判断を行なう
（ステップＳ３５０）。全文節について終了していなけ
ればステップＳ３２０に戻って上述した処理を繰り返
す。即ち、入力された一連の仮名文字列について得られ
た全文節について、見掛け自立語の存在についての検討
が終了するまで、変数Ｎをインクリメントしつつ、各文
節について、見掛け自立語が存在するか否かを判断し、
見掛け自立語を含む文節については、これを独立の文節
として扱えるよう、文節区切りを追加するのである。

【００４９】全文節について、上述した処理が完了した
と判断した場合には（ステップＳ３５０）、得られた全
文節をＣＲＴ２６上に表示する処理を行なう（ステップ
Ｓ３６０）。この場合、文節分かち書きにより得られた
文節はもとより、ステップ３３０の処理により追加され
た文節（見掛け自立語の文節）も、独立した文節として
表示される。この様子を図１１に示した。即ち、「はし
るときえだがじゃまだ」という文字列から得られた「走
るとき」＋「枝が」＋「邪魔だ」という文節（以下、内
部文節という）に対して、見掛け自立語である「とき」
を独立の文節として文節区切りを追加し、図１１下欄に
示すように、「走る」＋「時」＋「枝が」＋「邪魔だ」
と区切って表示するのである（以下、これを表示文節と
いう）。

【００５０】したがって、これら４つの文節のいずれか
にカーソルを置き、キーボード２４の「次候補」が割り
当てられたキーを操作すると、その語の次候補あるいは
次候補以下の候補が表示される。即ち、図９を例にとれ
ば、「走る」にカーソルキーが存在する場合には、「は
しる」が表示され、「とき」にカーソルキーが存在する
場合には、「時」や「朱鷺」等が表示されることにな
る。従来、形式名詞「とき」を単に付属語として扱って
いると、「走るとき」が次候補表示可能な文節の単位に
なってしまい、「走る時」を表示させようとすると、予
め「走るとき」と「走る時」とを登録しておくか、文節
区切りの変更をいちいち指示する他なかったのと比べる
と、辞書登録すべき語をむやみに増やす必要がなく、辞
書容量を小さくすることができる。この結果、辞書検索
の時間も短縮することができる。また、文節区切りの位
置の変更をいちいち指示する必要もない。他方、形式名
詞「とき」を自立語として扱っていたものでは、「走
る」＋「とき」＋「枝が」よりも「走る」＋「時枝が」
の方が文節数が少なくなるので、こちらが優先されてし
まい、所望の文節分かち書きを得ることができなかっ
た。本実施例では、文節分かち書きのための内部文節
と、次候補表示のための表示文節とを異なるものとして
いるので、これらの問題を悉く解決することができる。

【００５１】同様に、「あそんでいるまについた」を文
節分かち書きする場合を考えると、「遊んで」に連なる
「いる」は、自立語（動詞）「居る」と考えるよりも、
補助用言であって、「遊んで」と結合した一文節「遊ん
でいる」と扱うのが妥当である。そこで、本実施例で
は、補助用言についても、内部文節を構成するまでは付
属語として扱い、表示文節において、図１２に示すよう
に、独立の文節として表示し、次候補の表示を可能とし
ている。したがって、「いる」について他の候補が必要
となった場合、文節の長さの区切り直しなどを行なうこ
となく、直ちに次候補を表示させることができる。

【００５２】本実施例では、接辞も同様に扱い、内部文
節と表示文節とを異ならせている。図１３に示した例
「１かいのさぎょう」を文節分かち書きする場合、「か
い」を接辞と見なし、助数詞「回」や「階」などが数詞
「１」に付属して文節を構成するとして扱っている。こ
のため、「１」＋「甲斐の」＋「作業」とはならず、よ
り確からしい文節候補「１回の作業」が得られる。しか
も、表示文節としては、「１」＋「回の」＋「作業」と
なるから、「１」の次候補「一」や「壱」、「回の」の
次候補「階の」や「甲斐の」を得ることも容易である。

【００５３】同様に、指示連体詞「その」が含まれる仮
名文字列の文節分かち書きについて例示する。例えば、
図１４に示したように、「そのきょうかいでは」という
文字列を分かち書きする場合、指示連体詞である「そ
の」を自立語として扱うものとすると、「その」につい
て「園」が学習されていると、「園」＋「境界では」と
いった語候補が得られてしまう。しかし、指示連体詞
「その」を文節分かち書き処理では付属語として扱え
ば、「その境界では」が一つの文節として区切られ、好
ましい語候補が得られる。しかも、表示文節では、指示
連体詞の部分を独立の文節として表示するから、ここに
カーソルを移動して次候補の表示を指示すれば、容易に
次候補「其の」や「園」を得ることができる。同様に、
「境界では」についても「協会では」や「教会では」な
どの次候補を表示することができる。

【００５４】以上説明した実施の形態では、文節分かち
書きにおいては、形式名詞、接辞、補助用言、指示連体
詞などを付属語として扱い、表示と次候補の選択におい
てはこれらを自立語として扱っている。したがって、こ
れらの語は、文節分かち書きでは、自立語に付属する語
として扱われて、好ましい文節の切りだしを可能とさ
せ、他方、次候補の選択という場面では、あたかも自立
語のように扱って次候補を表示させることができる。こ
の結果、仮名文字列を入力して漢字仮名混じりの日本語
を得る仮名漢字変換装置としては、文節分かち書きの正
確さと使い勝手の良さとを両立させることができる。

【００５５】以上本発明の実施例について説明したが、
本発明はこうした実施例に何等限定されるものではな
く、例えば最小コスト法に替えて２文節最長一致法など
の他の文節分かち書きの手法を用いた構成など、本発明
の要旨を逸脱しない範囲内において種々なる様態で実施
し得ることは勿論である。

【図面の簡単な説明】

【図１】本発明の一実施例である仮名漢字変換装置が実
現されるハードウェアを示すブロック図である。

【図２】実施例としての仮名漢字変換装置における仮名
漢字変換機能の実現形態を示す機能ブロック図である。

【図３】自立語辞書５８の内部構成を示す説明図であ
る。

【図４】代表表記領域の管理の様子を示す説明図であ
る。

【図５】単語データの構成を示す説明図である。

【図６】単語情報の詳細を各セパレータとともに示す説
明図である。

【図７】本発明の実施例で実行される仮名漢字変換処理
ルーチンを説明するフローチャートである。

【図８】文節分かち書き部１０２において実行される文
節分かち書き処理を示すフローチャートである。

【図９】最小コスト法による文節分かち書き処理の様子
を示す説明図である。

【図１０】表示・次候補処理ルーチンを示すフローチャ
ートである。

【図１１】形式名詞が含まれる文節分かち書きの様子と
表示との相違を示す説明図である。

【図１２】補助用言が含まれる文節分かち書きの様子と
表示との相違を示す説明図である。

【図１３】接辞が含まれる文節分かち書きの様子と表示
との相違を示す説明図である。

【図１４】指示連体詞が含まれる文節分かち書きの様子
と表示との相違を示す説明図である。

【符号の説明】

２１…ＣＰＵ２２…ＲＯＭ２３…ＲＡＭ２４…キーボード２５…キーボードインターフェース２６…ＣＲＴディスプレイ２７…ＣＲＴＣ２８…プリンタ２９…プリンタインターフェース３１…バス３２…ハードディスク３３…タイマ４０…文字入力部４２…変換制御部４４…変換後文字列出力部５０…文字列入力部５２…文字格納部５４…自立語候補作成部５６…自立語解析位置管理部５８…自立語辞書６４…付属語候補作成部６６…付属語解析位置管理部６８…付属語辞書７２…自立語学習部７４…補助語学習部７６…接辞学習部７８…文字変換学習部８０…単語データ作成部８２…接続検定部８４…接続検定テーブル８６…コスト計算部１００…単語データ格納部１０２…文節分かち書き部１０６…文節データ格納部１０８…変換文字列出力部

Claims

【特許請求の範囲】

【請求項１】仮名文字列を入力し、辞書を参照して、
該入力された仮名文字列を文節分かち書きし、仮名漢字
混じり文字列候補を生成する仮名漢字変換装置であっ
て、自立語と付属語の結合を文節の基本単位として扱うもの
とし、前記入力した仮名文字列を、所定の規則に照らし
て妥当と判断される前記文節の連なりとして分かち書き
すると共に、該各文節のうち自立語と所定の付属語との結合からなる
文節については、該文節を構成する単語候補の表示にお
いては、該付属語と自立語とを独立に表示する仮名漢字
変換装置。
【請求項２】前記所定の付属語が、少なくとも補助用
言，形式名詞，接辞のうちの一つである請求項１記載の
仮名漢字変換装置。
【請求項３】請求項１または２記載の仮名漢字変換装
置であって、前記所定の付属語について、異なる単語候補が選択され
た場合には、他の文節におけるその付属語について、該
選択された単語候補を第一候補として表示する学習手段
を備えた仮名漢字変換装置。
【請求項４】請求項１ないし３記載の仮名漢字変換装
置であって、前記入力した仮名文字列を、所定の規則に照らして妥当
と判断されるのは、分かち書きした文節間の結合および
該文節を構成する単語間の結合の生じ易さが最大となる
組合わせである仮名漢字変換装置。
【請求項５】仮名文字列を入力し、辞書を参照して、
該入力された仮名文字列を文節分かち書きし、仮名漢字
混じり文字列候補を生成する仮名漢字変換装置であっ
て、自立語と付属語の結合を文節の基本単位として扱うもの
とし、前記入力した仮名文字列を、所定の規則に照らし
て妥当と判断される前記文節の連なりとして分かち書き
する分かち書き手段と、該各文節のうち自立語と所定の付属語との結合からなる
文節については、該文節を構成する単語候補の表示にお
いては、該付属語と自立語とを独立に表示する文節表示
手段と、該文節について次候補の指示がなされたとき、該付属語
と該自立語については、個別に次候補を表示する次候補
表示手段とを備えた仮名漢字変換装置。
【請求項６】仮名文字列を入力し、辞書を参照して、
該入力された仮名文字列を文節分かち書きし、仮名漢字
混じり文字列候補を生成する仮名漢字変換方法であっ
て、自立語と付属語の結合を文節の基本単位として扱うもの
とし、前記入力した仮名文字列を、所定の規則に照らし
て妥当と判断される前記文節の連なりとして分かち書き
し、該各文節のうち自立語と所定の付属語との結合からなる
文節については、該文節を構成する単語候補の表示にお
いては、該付属語と自立語とを独立に表示する仮名漢字
変換方法。