JPH01134563A

JPH01134563A - かな漢字変換装置

Info

Publication number: JPH01134563A
Application number: JP62293694A
Authority: JP
Inventors: Noriyuki Osuga; 典之大須賀; Takeshi Nishibe; 西部　毅; Seiko Ishikawa; 石川　せい子
Original assignee: Brother Industries Ltd
Current assignee: Brother Industries Ltd
Priority date: 1987-11-19
Filing date: 1987-11-19
Publication date: 1989-05-26

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、゛自然言語処理手段を用いることによりかな
漢字変換精度の向上を図ったかな漢字変換装置に関する
。

（従来技術）従来から、入力装置から入力したかな文字列（自然さｉ
！）に応じて漢字かな混じり文に変換するかな漢字変換
装置がある。

このようなかな漢字変換装置は辞書および文法書（以下
、単に辞書という）を有し、この辞書には漢字、あるい
は漢字かな混じり文が登録されている。このかな漢字変
換装置に入力されたかな文字列に上記辞１にθ録されて
いる漢字、あるいは漢字かな混じり文が含まれている場
合、上記かな文字列は上記辞１に基づいて漢字かな゛混
じり文に変換される。

そして、この漢字かな混じり文に変換する際、上記かな
文字列に含まれいる各文節間の係り受けを調べ、係り受
けが妥当な漢字かな混じり文に変換するようにしたもの
、−さらに、上記かな文字列を構成する文節（単ａＩ）
の並び（例えば、主語、述語などの並び）が、文法にか
なうように変換するようにしたもの、あるいは上記かな
文字列を構成する単語の意味や、文章の内容に基づいて
変換するようにしたものなどがある。ところが、自然言
語は本質的に不明瞭であいまいなものであることから、
上記のようなかな漢字変換装置であっても、意図してい
たものと異なる変換結果が出力されることもあり、その
ような誤変換の低減を目的に種々の取組が図られている
。

（発明の目的）本発明は、上記背景のもとになされたもので、入力され
たかな文字列の文節間の係り受けと、この文節の係り受
番ノの妥当性、および辞書引き回数とにより、かな漢字
変換の出力対栗となる複数の文の出力順位を決定するこ
とにより、意図していたものと同じ変換結果の文を迅速
に出力することができ、変換精度の向上を図ったかな漢
字変換装置を提供することを目的とする。

（発明の構成）本発明は、かな文字列を入力する入力装置と、自立語を
登録している辞書と、付属語を登録している文法書と、
上記入力されたかな文字列を上記辞書と上記文法１とを
参照して形態素解析する形態素解析部と、上記形態素解
析されたかな文字列を文節ごとに構文解析する構文解析
部と、上記かな文字列に動詞句があるとき、このかな文
字列から動詞句に対応する格フレームを抽出するマツチ
ング部と、上記かな文字列の文節間の意味情報の係り受
けを分析する意味分析部と、上記構文解析に基づいて予
測されたかな文字列の文節の妥当性を判断する判断部と
、上記辞書と文法書とを参照した回数に基いて上記かな
文字列の文節を重みづけする回数重みづけ部と、上記マ
ツチング部と意味分析部と判断部および回数重みづけ部
の処理結果に基づいてかな漢字変換結果の出力順位を決
定する出力順位判断部と、上記の出力順位の決定された
かな漢字変換結果を出力する出力装置とから構成された
ものである。

この構成により、辞書と文法書の参照回数による遥みづ
けがなされて変換の出力順位が決定され、したがって、
かな漢字変換結果の対像となる文の中から意図していた
ちのを選択するための操作を少なくでき、意図していた
変換結果の文を迅速に出力することができる。

（実施例）第１図は、本発明の一実施例によるかな漢字変換装置の
ブロック構成を示す。同図において、１は自然８語から
なるかな文字列（文）を入力する入力装置、２は形態素
解析部で、この形！！！素解析部２は自立語を登録して
いる辞内３と付属語を登録している文法ａ４とを参照し
て上記入力されたかな文字文を形態素解析する。ここで
、形態素解析とは、構文解析を行ううえで必要十分な大
きざの文節に文を分割する処理のことをいい、入力され
たかな文字文によっては、文節の分割の仕方が多数存在
する可能性を有している。

５は上記形態素解析されたかな文字文を文節ごとに構文
解析を行う構文解析部、６は構文解析結果を記憶するデ
ータベース部であり、構文解析部５においては、第２図
の例に示すように、「わたしは」の文節の文中における
役割別に分析し、自立語「わたしは」は、品詞が“名詞
”、文法カテゴリ第１候補が“主ｍ“、文節予測第１候
補が“目的語″、付属語「は」は、品詞が“格助詞”で
あると解析する。これらはまとめてデータベース部６に
記憶される。このように、構文解析とは、“形容調子名
詞”で“名詞句”、“名詞句＋格助詞（は、が）パで“
主語”とみなし、゛主語十目的ｉ十動詞（述１ｆｆｌ）
”で“文”を構成するとみなすように文法規劇に基づい
て文の構造の予測を行うことをいう。

７はマツチング部で、上記形態素解析および構文解析さ
れたかな文字文の文節から、動詞句の有無を判別し、動
詞句があれば、この動詞句に対応する格フレームを抽出
し、この格フレームの内容（格フレームの構成に必要な
名詞、格助詞等）に基づいて重みづけの値を設定する。

すなわち、それぞれの動詞句には固有の格フレームが対
応しており、格フレームは動詞句（動詞）に対応する必
修格（主格等、必ず必要とする格）と自由格（必ずしも
必要としない格）および格助詞（助詞の種類）とから構
成されている。

この格フレームの例を第３図に示す。この例のように、
動詞の°゛呼ぶ″ならば、゛［人ｆｌｌ（ＨｔＪＭ）］
が［人人間動物（ＤＩＶ）］を”の格フレームを持つ。

なお、［１内は、第４図に示すように、名詞の意味（内
容）マーカのことであり、辞書３中の名詞には全て意味
マーカが付されている。

また、第３図で人間（ＨＵＭ）　、動物（ＡＮＩ）のど
ちらでも格フレームの格助詞に対応する場合は、“ＤＩ
Ｖ”と表示する。

８は上記形態素解析されたかな文字文の名詞旬間の係り
受けに基づいて重みづけの値を設定する意味分析部、９
は構文解析された文節予測に基づいて、各文節に重みづ
けの値を設定する判断部、１０は回数重みづけ部で、形
態素解析部２において、辞書３および文法１４を引いた
口数に基づいて入力されたかな文字文の重みづけの値を
設定する。１１は出力順位決定部で、上記マツチング部
７と分析部８と判断部９および回ａ重みづけ部１０にて
設定された１みづけの値に基づいて入力されたかな文字
文に対応する変換結果が複数存在する場合、これらの変
換結果に順位を定め、この順位にそって出力装置１２へ
出力する。そして、出力装ｕ１２に表示された複数の変
換結果の中から入力装置１を用いて、入力されたかな文
字文に該当する変換結果を選択する。

次に、この変換動作について、第５図の７０−チャート
を用いて説明する。

まず、ステップＳ１で入力装置１からかな文字文が文単
位で入力され、ステップＳ２で上記かな文字文は形態素
解析部２によって辞書３および文ｖＸ１４を参照して形
態素解析される。次に、上記形態素解析されたかな文字
文は構文解析部５によって構文解析（文節予測）され、
文節ごとにデータベース部６に記憶される。

そして、ステップＳ４で上記データベース部６に記憶さ
れたかな文字文の文節に動詞句があるかどうかが判定さ
れ、動詞句があれば、ステップＳ５で動詞句に対応する
格フレームを抽出し、第６図の例に示すように、この格
フレームの内容に基づいて道みづけの値が決められる（
マツチング部７によるマツチング処理）。例えば、マツ
チング処理による這みづけの値は、マツチング’ｆｕｌｌ！による重みづけの値＝格フレー
ムによる重みづけの値の合計−（格フレーム以外の文節
の個数Ｘ０．５）として、計算される。

一方、ステップＳ４でかな文字文に動詞句がなければ、
ステップＳｓの処理を行わずにステップＳｏへ移行する
。

そして、ステップＳ６で上記データベース部６に記憶さ
れたかな文字文の文節の中に名詞句があり、かつ、この
名詞句に係り得る名詞句の文節が存在するかどうかが判
定され、係り得る文節が存在すれば、ステップＳ７で各
色ｇｉｉＷａの係り受は関係に基づいて重みづけの値が
決められる（意味分析部８による意味照合処理）。すな
わち、名詞の意味マーカに基づく重みづけの値を各名調
間の係り受は藺係別に定義し、これを用いて上記かな文
字文の重みづけの値が決められる。

例えば、“だいかくのいちょう°°の場合、“だいがく
”は辞書３において、“大学”と変換されるが、“いち
ょう”は゛胃腸″および“銀杏′°の２つが変換対象と
なる。ここに、第４図に示すように、“大学”の意味マ
ーカはＯＲＧ　（組織、ａｍ＞”で、“銀杏°°および
“胃腸”の意味マーカはそれぞれ“ＰＬＡ　（植物）′
、“ＰＡＲ（生物の部分）′であり、“大学（ＯＲＧ）
”と上記２つの変換対象との係り受は関係は、第７図に
示すように、“大学（ＯＲＧ）”と“銀杏（ＰＬＡ）”
との重みづけの値が３点であるのに対し、゛大学（ＯＲ
Ｇ）″と“胃腸（ＰＡＲ）”との垂みづけの値が１点で
あり、前者の方が後者よりも大きくなる。かくして、意
味的つながりの重みづけがなされる。

一方、ステップＳ６で係り得る名詞句の文節が存在しな
ければ、ステップＳ７の処理を行わずにステップＳ８へ
移行する。

そして、ステップＳ８では、ステップＳ３にて構文解析
されたかな文字文はステップＳ４からステップＳ７まで
の処理が行なわれることにより、上記かな文字文の文節
はある程度確定されるので、次に来る可能性の高い文節
力１ゴリ（範躊）の候補が予測される。この予測に基づ
いて、解析中の文節が予測にどの程度合っているかく判
断部９による妥当性判断）の重みづけが行われる。つま
り、第８図の例に示すように、構文解析部５において主
語（構文解析部５は、文頭の文節を主語とみなす）と予
測された文節は、この主語に対する条件と照合し、条件
に対応した重みづけの値が決められる。

次に、ステップＳ９では、入力されたかな文字文を形８
素解析したときの辞書３および文法間４の参照回数に基
づいて重みづけ（回数重みづけ部１０による重みづけ）
が決められる。

すなわら、重みづけの値−辞書３の参照回数十文法書４の参照回数
−（辞潴３も文法間４ら参照できない残りのかな文字数
×２）として、重みづけの値を計算する。

ただし、文法間４の参照回数において、文法潟４の参照
を連続して行った場合は、２回目以降は２．０とする。

この計算例として、“どうしたらいいのか″について、
説明する。まず、辞書３および文法間４を参照して文節
ごとに変換した結果、“Ｕ　他Ｕ　の　ｐ′°と変換さ
れた場合、辞書３および文法Ｎ４の参照回数に基づいて
重みづけの値を計算すると、Ｕ［辞書（１）］　他［辞
書（１）］　敦１［辞府（１）］　　（７）［文法間（
１）］　か［文文法間２．０）］”となり、市みづけの
値の合計は、６．０となる。

一方、“くユ　旦　互５　へ公　の　ケ′°と変換され
た場合、上記と同様に重みづけの値を訓算すると、゛ど
〕［辞書（１）］　見［文法間（１）］　丸５［文法間
（２，Ｏ）コ　鷺公［文法間（２，、Ｏ）］　　の［文
文法間２．、−０）］　　た［文文法間２．０）］”と
なり、市みづけの値の合計は、１０．０となり、”ｕ　
　ｔ　　Ｌｍ　　（７）　　ｆｉｔ”と変換された場合
の重みづけの値に比べ、ζ】旦　互５　へ公　の　た″
と変換された場合の市みづけの値が大きくなる。

次に、ステップＳｔＯで、ステップｓ２からステップＳ
９までの処理によって、かな漢字変換結果の対象文が複
数になるかどうかを判定する。

そして、ステップＳ　１ａで上記対象文が複数であれば
、ステップＳ１１で、ステラ７Ｓ５．Ｓ７　、Ｓ８、Ｓ
９の各処理に基づいて行なわれた償みづけにより、かな
漢字変換結果の対象文の出力順位が決められ、ステップ
Ｓｔ２で上記変換結果の対象文の中から入力装置１を用
いて選択を行い、ステップＳｎ″Ｃ−選択された変換結
果が表示される。一方、ステップＳ１０で上記対象文が
複数でなければ、ステップＳ１３へ移行し、変換結果が
表示される。

なお、第４図、第７図の例に示したような、名詞のみな
らず、他の品詞についても同様の処理を行ってもよい。

また、かな漢字変換結果の対象文の出力順位は上記のよ
うに各処理の重みづけの値の高いものから決めてもよい
が、１みづけの値の設定次第では低いｂのから決めても
よい。また、ステップＳ１１の順位づけにおいて、ステ
ップ３５゜Ｓ７　、Ｓａ　、８９の処理ごとに重みづけ
の大きさを変えて設定してもよく、計算の式も変形して
もよい。

かくして、かな文字列を総合的に判断し、意図していた
ものと同じかな漢字変換の文を得る確率が高くなり、変
換の精度が向上するとともに、かな漢字変換結果の対象
文の中から選択する操作を少なくでき、従ってかな漢字
変換を迅速に行うことができる。

（発明の効果）以上のよう、に本発明によれば、格フレームの内容と、
名詞間の係り受は関係と、文節予測の妥当性および辞書
引き回数とに基づいてかな漢字変換の対象になるかな文
字列を判断し、出力順位を決定するようにしているので
、少ない選択操作によって、意図していたものと同じか
な漢字変換の文を得る確率が高くなり、かな漢字変換精
度の向上および操作性の向上を図ることができる。

【図面の簡単な説明】

第１図は本発明の一実施例によるかな漢字変換装置の１
０ツク構成図、第２図は構文解析された文節の構成例を
示す図、第３図は動詞の格フレームの構成例を示す図、
第４図は名詞の意味マー力の構成例を示す図、第５図は
本発明装置の動作を示すフローチャート、第６図は？ツ
チング処理による重みづけの一実施例を示す図、第７図
は意味照合処理による重みづけの一実施例を示す図、第
８図は文節予測と適合条件の一実施例を示す図である。１・・・入力装置、２・・・形態素解析部、３・・・辞
書、４・・・文法占、５・・・構文解析部、７・・・マ
ツチング部、８・・・意味分析部、９・・・判断部、１
０・・・回数重みづけ部、１１・・・出力順位決定部、
１２・・・出力装置。第　　３　　図第　　４　　図第　　６　　図第　　７　　図第　　８　　図

Claims

【特許請求の範囲】

１、かな文字列を入力する入力装置と、自立語を登録し
ている辞書と、付属語を登録している文法書と、上記入
力されたかな文字列を上記辞書と上記文法書とを参照し
て形態素解析する形態素解析部と、上記形態素解析され
たかな文字列を文節ごとに構文解析する構文解析部と、
上記かな文字列に動詞句があるとき、このかな文字列か
ら動詞句に対応する格フレームを抽出するマッチング部
と、上記かな文字列の文節間の意味情報の係り受けを分
析する意味分析部と、上記構文解析に基づいて予測され
たかな文字列の文節の妥当性を判断する判断部と、上記
辞書と文法書とを参照した回数に基いて上記かな文字列
の文節を重みづけする回数重みづけ部と、上記マッチン
グ部と意味分析部と判断部および回数重みづけ部の処理
結果に基づいてかな漢字変換結果の出力順位を決定する
出力順位判断部と、上記の出力順位の決定されたかな漢
字変換結果を出力する出力装置とから構成されたことを
特徴とするかな漢字変換装置。