JPH01134563A - かな漢字変換装置 - Google Patents
かな漢字変換装置Info
- Publication number
- JPH01134563A JPH01134563A JP62293694A JP29369487A JPH01134563A JP H01134563 A JPH01134563 A JP H01134563A JP 62293694 A JP62293694 A JP 62293694A JP 29369487 A JP29369487 A JP 29369487A JP H01134563 A JPH01134563 A JP H01134563A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- character string
- kana character
- dictionary
- output order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 235000016496 Panda oleosa Nutrition 0.000 title claims abstract description 57
- 240000000220 Panda oleosa Species 0.000 title claims abstract description 57
- 238000006243 chemical reaction Methods 0.000 claims abstract description 41
- 238000004458 analytical method Methods 0.000 claims abstract description 27
- 239000000284 extract Substances 0.000 claims abstract description 5
- 230000000877 morphologic effect Effects 0.000 claims description 7
- 230000004048 modification Effects 0.000 abstract description 9
- 238000012986 modification Methods 0.000 abstract description 9
- 238000000034 method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 7
- 239000002245 particle Substances 0.000 description 6
- 241000196324 Embryophyta Species 0.000 description 3
- 241000218628 Ginkgo Species 0.000 description 3
- 235000011201 Ginkgo Nutrition 0.000 description 3
- 235000008100 Ginkgo biloba Nutrition 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 244000194101 Ginkgo biloba Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000000921 elemental analysis Methods 0.000 description 2
- 230000002496 gastric effect Effects 0.000 description 2
- 241000862969 Stella Species 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、゛自然言語処理手段を用いることによりかな
漢字変換精度の向上を図ったかな漢字変換装置に関する
。
漢字変換精度の向上を図ったかな漢字変換装置に関する
。
(従来技術)
従来から、入力装置から入力したかな文字列(自然さi
!)に応じて漢字かな混じり文に変換するかな漢字変換
装置がある。
!)に応じて漢字かな混じり文に変換するかな漢字変換
装置がある。
このようなかな漢字変換装置は辞書および文法書(以下
、単に辞書という)を有し、この辞書には漢字、あるい
は漢字かな混じり文が登録されている。このかな漢字変
換装置に入力されたかな文字列に上記辞1にθ録されて
いる漢字、あるいは漢字かな混じり文が含まれている場
合、上記かな文字列は上記辞1に基づいて漢字かな゛混
じり文に変換される。
、単に辞書という)を有し、この辞書には漢字、あるい
は漢字かな混じり文が登録されている。このかな漢字変
換装置に入力されたかな文字列に上記辞1にθ録されて
いる漢字、あるいは漢字かな混じり文が含まれている場
合、上記かな文字列は上記辞1に基づいて漢字かな゛混
じり文に変換される。
そして、この漢字かな混じり文に変換する際、上記かな
文字列に含まれいる各文節間の係り受けを調べ、係り受
けが妥当な漢字かな混じり文に変換するようにしたもの
、−さらに、上記かな文字列を構成する文節(単aI)
の並び(例えば、主語、述語などの並び)が、文法にか
なうように変換するようにしたもの、あるいは上記かな
文字列を構成する単語の意味や、文章の内容に基づいて
変換するようにしたものなどがある。ところが、自然言
語は本質的に不明瞭であいまいなものであることから、
上記のようなかな漢字変換装置であっても、意図してい
たものと異なる変換結果が出力されることもあり、その
ような誤変換の低減を目的に種々の取組が図られている
。
文字列に含まれいる各文節間の係り受けを調べ、係り受
けが妥当な漢字かな混じり文に変換するようにしたもの
、−さらに、上記かな文字列を構成する文節(単aI)
の並び(例えば、主語、述語などの並び)が、文法にか
なうように変換するようにしたもの、あるいは上記かな
文字列を構成する単語の意味や、文章の内容に基づいて
変換するようにしたものなどがある。ところが、自然言
語は本質的に不明瞭であいまいなものであることから、
上記のようなかな漢字変換装置であっても、意図してい
たものと異なる変換結果が出力されることもあり、その
ような誤変換の低減を目的に種々の取組が図られている
。
(発明の目的)
本発明は、上記背景のもとになされたもので、入力され
たかな文字列の文節間の係り受けと、この文節の係り受
番ノの妥当性、および辞書引き回数とにより、かな漢字
変換の出力対栗となる複数の文の出力順位を決定するこ
とにより、意図していたものと同じ変換結果の文を迅速
に出力することができ、変換精度の向上を図ったかな漢
字変換装置を提供することを目的とする。
たかな文字列の文節間の係り受けと、この文節の係り受
番ノの妥当性、および辞書引き回数とにより、かな漢字
変換の出力対栗となる複数の文の出力順位を決定するこ
とにより、意図していたものと同じ変換結果の文を迅速
に出力することができ、変換精度の向上を図ったかな漢
字変換装置を提供することを目的とする。
(発明の構成)
本発明は、かな文字列を入力する入力装置と、自立語を
登録している辞書と、付属語を登録している文法書と、
上記入力されたかな文字列を上記辞書と上記文法1とを
参照して形態素解析する形態素解析部と、上記形態素解
析されたかな文字列を文節ごとに構文解析する構文解析
部と、上記かな文字列に動詞句があるとき、このかな文
字列から動詞句に対応する格フレームを抽出するマツチ
ング部と、上記かな文字列の文節間の意味情報の係り受
けを分析する意味分析部と、上記構文解析に基づいて予
測されたかな文字列の文節の妥当性を判断する判断部と
、上記辞書と文法書とを参照した回数に基いて上記かな
文字列の文節を重みづけする回数重みづけ部と、上記マ
ツチング部と意味分析部と判断部および回数重みづけ部
の処理結果に基づいてかな漢字変換結果の出力順位を決
定する出力順位判断部と、上記の出力順位の決定された
かな漢字変換結果を出力する出力装置とから構成された
ものである。
登録している辞書と、付属語を登録している文法書と、
上記入力されたかな文字列を上記辞書と上記文法1とを
参照して形態素解析する形態素解析部と、上記形態素解
析されたかな文字列を文節ごとに構文解析する構文解析
部と、上記かな文字列に動詞句があるとき、このかな文
字列から動詞句に対応する格フレームを抽出するマツチ
ング部と、上記かな文字列の文節間の意味情報の係り受
けを分析する意味分析部と、上記構文解析に基づいて予
測されたかな文字列の文節の妥当性を判断する判断部と
、上記辞書と文法書とを参照した回数に基いて上記かな
文字列の文節を重みづけする回数重みづけ部と、上記マ
ツチング部と意味分析部と判断部および回数重みづけ部
の処理結果に基づいてかな漢字変換結果の出力順位を決
定する出力順位判断部と、上記の出力順位の決定された
かな漢字変換結果を出力する出力装置とから構成された
ものである。
この構成により、辞書と文法書の参照回数による遥みづ
けがなされて変換の出力順位が決定され、したがって、
かな漢字変換結果の対像となる文の中から意図していた
ちのを選択するための操作を少なくでき、意図していた
変換結果の文を迅速に出力することができる。
けがなされて変換の出力順位が決定され、したがって、
かな漢字変換結果の対像となる文の中から意図していた
ちのを選択するための操作を少なくでき、意図していた
変換結果の文を迅速に出力することができる。
(実施例)
第1図は、本発明の一実施例によるかな漢字変換装置の
ブロック構成を示す。同図において、1は自然8語から
なるかな文字列(文)を入力する入力装置、2は形態素
解析部で、この形!!!素解析部2は自立語を登録して
いる辞内3と付属語を登録している文法a4とを参照し
て上記入力されたかな文字文を形態素解析する。ここで
、形態素解析とは、構文解析を行ううえで必要十分な大
きざの文節に文を分割する処理のことをいい、入力され
たかな文字文によっては、文節の分割の仕方が多数存在
する可能性を有している。
ブロック構成を示す。同図において、1は自然8語から
なるかな文字列(文)を入力する入力装置、2は形態素
解析部で、この形!!!素解析部2は自立語を登録して
いる辞内3と付属語を登録している文法a4とを参照し
て上記入力されたかな文字文を形態素解析する。ここで
、形態素解析とは、構文解析を行ううえで必要十分な大
きざの文節に文を分割する処理のことをいい、入力され
たかな文字文によっては、文節の分割の仕方が多数存在
する可能性を有している。
5は上記形態素解析されたかな文字文を文節ごとに構文
解析を行う構文解析部、6は構文解析結果を記憶するデ
ータベース部であり、構文解析部5においては、第2図
の例に示すように、「わたしは」の文節の文中における
役割別に分析し、自立語「わたしは」は、品詞が“名詞
”、文法カテゴリ第1候補が“主m“、文節予測第1候
補が“目的語″、付属語「は」は、品詞が“格助詞”で
あると解析する。これらはまとめてデータベース部6に
記憶される。このように、構文解析とは、“形容調子名
詞”で“名詞句”、“名詞句+格助詞(は、が)パで“
主語”とみなし、゛主語十目的i十動詞(述1ffl)
”で“文”を構成するとみなすように文法規劇に基づい
て文の構造の予測を行うことをいう。
解析を行う構文解析部、6は構文解析結果を記憶するデ
ータベース部であり、構文解析部5においては、第2図
の例に示すように、「わたしは」の文節の文中における
役割別に分析し、自立語「わたしは」は、品詞が“名詞
”、文法カテゴリ第1候補が“主m“、文節予測第1候
補が“目的語″、付属語「は」は、品詞が“格助詞”で
あると解析する。これらはまとめてデータベース部6に
記憶される。このように、構文解析とは、“形容調子名
詞”で“名詞句”、“名詞句+格助詞(は、が)パで“
主語”とみなし、゛主語十目的i十動詞(述1ffl)
”で“文”を構成するとみなすように文法規劇に基づい
て文の構造の予測を行うことをいう。
7はマツチング部で、上記形態素解析および構文解析さ
れたかな文字文の文節から、動詞句の有無を判別し、動
詞句があれば、この動詞句に対応する格フレームを抽出
し、この格フレームの内容(格フレームの構成に必要な
名詞、格助詞等)に基づいて重みづけの値を設定する。
れたかな文字文の文節から、動詞句の有無を判別し、動
詞句があれば、この動詞句に対応する格フレームを抽出
し、この格フレームの内容(格フレームの構成に必要な
名詞、格助詞等)に基づいて重みづけの値を設定する。
すなわち、それぞれの動詞句には固有の格フレームが対
応しており、格フレームは動詞句(動詞)に対応する必
修格(主格等、必ず必要とする格)と自由格(必ずしも
必要としない格)および格助詞(助詞の種類)とから構
成されている。
応しており、格フレームは動詞句(動詞)に対応する必
修格(主格等、必ず必要とする格)と自由格(必ずしも
必要としない格)および格助詞(助詞の種類)とから構
成されている。
この格フレームの例を第3図に示す。この例のように、
動詞の°゛呼ぶ″ならば、゛[人fll(HtJM)]
が[人人間動物(DIV)]を”の格フレームを持つ。
動詞の°゛呼ぶ″ならば、゛[人fll(HtJM)]
が[人人間動物(DIV)]を”の格フレームを持つ。
なお、[1内は、第4図に示すように、名詞の意味(内
容)マーカのことであり、辞書3中の名詞には全て意味
マーカが付されている。
容)マーカのことであり、辞書3中の名詞には全て意味
マーカが付されている。
また、第3図で人間(HUM) 、動物(ANI)のど
ちらでも格フレームの格助詞に対応する場合は、“DI
V”と表示する。
ちらでも格フレームの格助詞に対応する場合は、“DI
V”と表示する。
8は上記形態素解析されたかな文字文の名詞旬間の係り
受けに基づいて重みづけの値を設定する意味分析部、9
は構文解析された文節予測に基づいて、各文節に重みづ
けの値を設定する判断部、10は回数重みづけ部で、形
態素解析部2において、辞書3および文法14を引いた
口数に基づいて入力されたかな文字文の重みづけの値を
設定する。11は出力順位決定部で、上記マツチング部
7と分析部8と判断部9および回a重みづけ部10にて
設定された1みづけの値に基づいて入力されたかな文字
文に対応する変換結果が複数存在する場合、これらの変
換結果に順位を定め、この順位にそって出力装置12へ
出力する。そして、出力装u12に表示された複数の変
換結果の中から入力装置1を用いて、入力されたかな文
字文に該当する変換結果を選択する。
受けに基づいて重みづけの値を設定する意味分析部、9
は構文解析された文節予測に基づいて、各文節に重みづ
けの値を設定する判断部、10は回数重みづけ部で、形
態素解析部2において、辞書3および文法14を引いた
口数に基づいて入力されたかな文字文の重みづけの値を
設定する。11は出力順位決定部で、上記マツチング部
7と分析部8と判断部9および回a重みづけ部10にて
設定された1みづけの値に基づいて入力されたかな文字
文に対応する変換結果が複数存在する場合、これらの変
換結果に順位を定め、この順位にそって出力装置12へ
出力する。そして、出力装u12に表示された複数の変
換結果の中から入力装置1を用いて、入力されたかな文
字文に該当する変換結果を選択する。
次に、この変換動作について、第5図の70−チャート
を用いて説明する。
を用いて説明する。
まず、ステップS1で入力装置1からかな文字文が文単
位で入力され、ステップS2で上記かな文字文は形態素
解析部2によって辞書3および文vX14を参照して形
態素解析される。次に、上記形態素解析されたかな文字
文は構文解析部5によって構文解析(文節予測)され、
文節ごとにデータベース部6に記憶される。
位で入力され、ステップS2で上記かな文字文は形態素
解析部2によって辞書3および文vX14を参照して形
態素解析される。次に、上記形態素解析されたかな文字
文は構文解析部5によって構文解析(文節予測)され、
文節ごとにデータベース部6に記憶される。
そして、ステップS4で上記データベース部6に記憶さ
れたかな文字文の文節に動詞句があるかどうかが判定さ
れ、動詞句があれば、ステップS5で動詞句に対応する
格フレームを抽出し、第6図の例に示すように、この格
フレームの内容に基づいて道みづけの値が決められる(
マツチング部7によるマツチング処理)。例えば、マツ
チング処理による這みづけの値は、 マツチング’full!による重みづけの値=格フレー
ムによる重みづけの値の合計−(格フレーム以外の文節
の個数X0.5) として、計算される。
れたかな文字文の文節に動詞句があるかどうかが判定さ
れ、動詞句があれば、ステップS5で動詞句に対応する
格フレームを抽出し、第6図の例に示すように、この格
フレームの内容に基づいて道みづけの値が決められる(
マツチング部7によるマツチング処理)。例えば、マツ
チング処理による這みづけの値は、 マツチング’full!による重みづけの値=格フレー
ムによる重みづけの値の合計−(格フレーム以外の文節
の個数X0.5) として、計算される。
一方、ステップS4でかな文字文に動詞句がなければ、
ステップSsの処理を行わずにステップSoへ移行する
。
ステップSsの処理を行わずにステップSoへ移行する
。
そして、ステップS6で上記データベース部6に記憶さ
れたかな文字文の文節の中に名詞句があり、かつ、この
名詞句に係り得る名詞句の文節が存在するかどうかが判
定され、係り得る文節が存在すれば、ステップS7で各
色giiWaの係り受は関係に基づいて重みづけの値が
決められる(意味分析部8による意味照合処理)。すな
わち、名詞の意味マーカに基づく重みづけの値を各名調
間の係り受は藺係別に定義し、これを用いて上記かな文
字文の重みづけの値が決められる。
れたかな文字文の文節の中に名詞句があり、かつ、この
名詞句に係り得る名詞句の文節が存在するかどうかが判
定され、係り得る文節が存在すれば、ステップS7で各
色giiWaの係り受は関係に基づいて重みづけの値が
決められる(意味分析部8による意味照合処理)。すな
わち、名詞の意味マーカに基づく重みづけの値を各名調
間の係り受は藺係別に定義し、これを用いて上記かな文
字文の重みづけの値が決められる。
例えば、“だいかくのいちょう°°の場合、“だいがく
”は辞書3において、“大学”と変換されるが、“いち
ょう”は゛胃腸″および“銀杏′°の2つが変換対象と
なる。ここに、第4図に示すように、“大学”の意味マ
ーカはORG (組織、am>”で、“銀杏°°および
“胃腸”の意味マーカはそれぞれ“PLA (植物)′
、“PAR(生物の部分)′であり、“大学(ORG)
”と上記2つの変換対象との係り受は関係は、第7図に
示すように、“大学(ORG)”と“銀杏(PLA)”
との重みづけの値が3点であるのに対し、゛大学(OR
G)″と“胃腸(PAR)”との垂みづけの値が1点で
あり、前者の方が後者よりも大きくなる。かくして、意
味的つながりの重みづけがなされる。
”は辞書3において、“大学”と変換されるが、“いち
ょう”は゛胃腸″および“銀杏′°の2つが変換対象と
なる。ここに、第4図に示すように、“大学”の意味マ
ーカはORG (組織、am>”で、“銀杏°°および
“胃腸”の意味マーカはそれぞれ“PLA (植物)′
、“PAR(生物の部分)′であり、“大学(ORG)
”と上記2つの変換対象との係り受は関係は、第7図に
示すように、“大学(ORG)”と“銀杏(PLA)”
との重みづけの値が3点であるのに対し、゛大学(OR
G)″と“胃腸(PAR)”との垂みづけの値が1点で
あり、前者の方が後者よりも大きくなる。かくして、意
味的つながりの重みづけがなされる。
一方、ステップS6で係り得る名詞句の文節が存在しな
ければ、ステップS7の処理を行わずにステップS8へ
移行する。
ければ、ステップS7の処理を行わずにステップS8へ
移行する。
そして、ステップS8では、ステップS3にて構文解析
されたかな文字文はステップS4からステップS7まで
の処理が行なわれることにより、上記かな文字文の文節
はある程度確定されるので、次に来る可能性の高い文節
力1ゴリ(範躊)の候補が予測される。この予測に基づ
いて、解析中の文節が予測にどの程度合っているかく判
断部9による妥当性判断)の重みづけが行われる。つま
り、第8図の例に示すように、構文解析部5において主
語(構文解析部5は、文頭の文節を主語とみなす)と予
測された文節は、この主語に対する条件と照合し、条件
に対応した重みづけの値が決められる。
されたかな文字文はステップS4からステップS7まで
の処理が行なわれることにより、上記かな文字文の文節
はある程度確定されるので、次に来る可能性の高い文節
力1ゴリ(範躊)の候補が予測される。この予測に基づ
いて、解析中の文節が予測にどの程度合っているかく判
断部9による妥当性判断)の重みづけが行われる。つま
り、第8図の例に示すように、構文解析部5において主
語(構文解析部5は、文頭の文節を主語とみなす)と予
測された文節は、この主語に対する条件と照合し、条件
に対応した重みづけの値が決められる。
次に、ステップS9では、入力されたかな文字文を形8
素解析したときの辞書3および文法間4の参照回数に基
づいて重みづけ(回数重みづけ部10による重みづけ)
が決められる。
素解析したときの辞書3および文法間4の参照回数に基
づいて重みづけ(回数重みづけ部10による重みづけ)
が決められる。
すなわら、
重みづけの値−辞書3の参照回数十文法書4の参照回数
−(辞潴3も文法間4ら参照できない残りのかな文字数
×2) として、重みづけの値を計算する。
−(辞潴3も文法間4ら参照できない残りのかな文字数
×2) として、重みづけの値を計算する。
ただし、文法間4の参照回数において、文法潟4の参照
を連続して行った場合は、2回目以降は2.0とする。
を連続して行った場合は、2回目以降は2.0とする。
この計算例として、“どうしたらいいのか″について、
説明する。まず、辞書3および文法間4を参照して文節
ごとに変換した結果、“U 他U の p′°と変換さ
れた場合、辞書3および文法N4の参照回数に基づいて
重みづけの値を計算すると、U[辞書(1)] 他[辞
書(1)] 敦1[辞府(1)] (7)[文法間(
1)] か[文文法間2.0)]”となり、市みづけの
値の合計は、6.0となる。
説明する。まず、辞書3および文法間4を参照して文節
ごとに変換した結果、“U 他U の p′°と変換さ
れた場合、辞書3および文法N4の参照回数に基づいて
重みづけの値を計算すると、U[辞書(1)] 他[辞
書(1)] 敦1[辞府(1)] (7)[文法間(
1)] か[文文法間2.0)]”となり、市みづけの
値の合計は、6.0となる。
一方、“くユ 旦 互5 へ公 の ケ′°と変換され
た場合、上記と同様に重みづけの値を訓算すると、゛ど
〕[辞書(1)] 見[文法間(1)] 丸5[文法間
(2,O)コ 鷺公[文法間(2,、O)] の[文
文法間2.、−0)] た[文文法間2.0)]”と
なり、市みづけの値の合計は、10.0となり、”u
t Lm (7) fit”と変換された場合
の重みづけの値に比べ、ζ】旦 互5 へ公 の た″
と変換された場合の市みづけの値が大きくなる。
た場合、上記と同様に重みづけの値を訓算すると、゛ど
〕[辞書(1)] 見[文法間(1)] 丸5[文法間
(2,O)コ 鷺公[文法間(2,、O)] の[文
文法間2.、−0)] た[文文法間2.0)]”と
なり、市みづけの値の合計は、10.0となり、”u
t Lm (7) fit”と変換された場合
の重みづけの値に比べ、ζ】旦 互5 へ公 の た″
と変換された場合の市みづけの値が大きくなる。
次に、ステップStOで、ステップs2からステップS
9までの処理によって、かな漢字変換結果の対象文が複
数になるかどうかを判定する。
9までの処理によって、かな漢字変換結果の対象文が複
数になるかどうかを判定する。
そして、ステップS 1aで上記対象文が複数であれば
、ステップS11で、ステラ7S5.S7 、S8、S
9の各処理に基づいて行なわれた償みづけにより、かな
漢字変換結果の対象文の出力順位が決められ、ステップ
St2で上記変換結果の対象文の中から入力装置1を用
いて選択を行い、ステップSn″C−選択された変換結
果が表示される。一方、ステップS10で上記対象文が
複数でなければ、ステップS13へ移行し、変換結果が
表示される。
、ステップS11で、ステラ7S5.S7 、S8、S
9の各処理に基づいて行なわれた償みづけにより、かな
漢字変換結果の対象文の出力順位が決められ、ステップ
St2で上記変換結果の対象文の中から入力装置1を用
いて選択を行い、ステップSn″C−選択された変換結
果が表示される。一方、ステップS10で上記対象文が
複数でなければ、ステップS13へ移行し、変換結果が
表示される。
なお、第4図、第7図の例に示したような、名詞のみな
らず、他の品詞についても同様の処理を行ってもよい。
らず、他の品詞についても同様の処理を行ってもよい。
また、かな漢字変換結果の対象文の出力順位は上記のよ
うに各処理の重みづけの値の高いものから決めてもよい
が、1みづけの値の設定次第では低いbのから決めても
よい。また、ステップS11の順位づけにおいて、ステ
ップ35゜S7 、Sa 、89の処理ごとに重みづけ
の大きさを変えて設定してもよく、計算の式も変形して
もよい。
うに各処理の重みづけの値の高いものから決めてもよい
が、1みづけの値の設定次第では低いbのから決めても
よい。また、ステップS11の順位づけにおいて、ステ
ップ35゜S7 、Sa 、89の処理ごとに重みづけ
の大きさを変えて設定してもよく、計算の式も変形して
もよい。
かくして、かな文字列を総合的に判断し、意図していた
ものと同じかな漢字変換の文を得る確率が高くなり、変
換の精度が向上するとともに、かな漢字変換結果の対象
文の中から選択する操作を少なくでき、従ってかな漢字
変換を迅速に行うことができる。
ものと同じかな漢字変換の文を得る確率が高くなり、変
換の精度が向上するとともに、かな漢字変換結果の対象
文の中から選択する操作を少なくでき、従ってかな漢字
変換を迅速に行うことができる。
(発明の効果)
以上のよう、に本発明によれば、格フレームの内容と、
名詞間の係り受は関係と、文節予測の妥当性および辞書
引き回数とに基づいてかな漢字変換の対象になるかな文
字列を判断し、出力順位を決定するようにしているので
、少ない選択操作によって、意図していたものと同じか
な漢字変換の文を得る確率が高くなり、かな漢字変換精
度の向上および操作性の向上を図ることができる。
名詞間の係り受は関係と、文節予測の妥当性および辞書
引き回数とに基づいてかな漢字変換の対象になるかな文
字列を判断し、出力順位を決定するようにしているので
、少ない選択操作によって、意図していたものと同じか
な漢字変換の文を得る確率が高くなり、かな漢字変換精
度の向上および操作性の向上を図ることができる。
第1図は本発明の一実施例によるかな漢字変換装置の1
0ツク構成図、第2図は構文解析された文節の構成例を
示す図、第3図は動詞の格フレームの構成例を示す図、
第4図は名詞の意味マー力の構成例を示す図、第5図は
本発明装置の動作を示すフローチャート、第6図は?ツ
チング処理による重みづけの一実施例を示す図、第7図
は意味照合処理による重みづけの一実施例を示す図、第
8図は文節予測と適合条件の一実施例を示す図である。 1・・・入力装置、2・・・形態素解析部、3・・・辞
書、4・・・文法占、5・・・構文解析部、7・・・マ
ツチング部、8・・・意味分析部、9・・・判断部、1
0・・・回数重みづけ部、11・・・出力順位決定部、
12・・・出力装置。 第 3 図 第 4 図 第 6 図 第 7 図 第 8 図
0ツク構成図、第2図は構文解析された文節の構成例を
示す図、第3図は動詞の格フレームの構成例を示す図、
第4図は名詞の意味マー力の構成例を示す図、第5図は
本発明装置の動作を示すフローチャート、第6図は?ツ
チング処理による重みづけの一実施例を示す図、第7図
は意味照合処理による重みづけの一実施例を示す図、第
8図は文節予測と適合条件の一実施例を示す図である。 1・・・入力装置、2・・・形態素解析部、3・・・辞
書、4・・・文法占、5・・・構文解析部、7・・・マ
ツチング部、8・・・意味分析部、9・・・判断部、1
0・・・回数重みづけ部、11・・・出力順位決定部、
12・・・出力装置。 第 3 図 第 4 図 第 6 図 第 7 図 第 8 図
Claims (1)
- 1、かな文字列を入力する入力装置と、自立語を登録し
ている辞書と、付属語を登録している文法書と、上記入
力されたかな文字列を上記辞書と上記文法書とを参照し
て形態素解析する形態素解析部と、上記形態素解析され
たかな文字列を文節ごとに構文解析する構文解析部と、
上記かな文字列に動詞句があるとき、このかな文字列か
ら動詞句に対応する格フレームを抽出するマッチング部
と、上記かな文字列の文節間の意味情報の係り受けを分
析する意味分析部と、上記構文解析に基づいて予測され
たかな文字列の文節の妥当性を判断する判断部と、上記
辞書と文法書とを参照した回数に基いて上記かな文字列
の文節を重みづけする回数重みづけ部と、上記マッチン
グ部と意味分析部と判断部および回数重みづけ部の処理
結果に基づいてかな漢字変換結果の出力順位を決定する
出力順位判断部と、上記の出力順位の決定されたかな漢
字変換結果を出力する出力装置とから構成されたことを
特徴とするかな漢字変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62293694A JPH01134563A (ja) | 1987-11-19 | 1987-11-19 | かな漢字変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62293694A JPH01134563A (ja) | 1987-11-19 | 1987-11-19 | かな漢字変換装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH01134563A true JPH01134563A (ja) | 1989-05-26 |
Family
ID=17798026
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62293694A Pending JPH01134563A (ja) | 1987-11-19 | 1987-11-19 | かな漢字変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH01134563A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0336662A (ja) * | 1989-07-03 | 1991-02-18 | Ricoh Co Ltd | 自然言語処理方式 |
JPH03172961A (ja) * | 1989-11-30 | 1991-07-26 | M C Waade Center:Kk | 同音異義語認識装置 |
-
1987
- 1987-11-19 JP JP62293694A patent/JPH01134563A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0336662A (ja) * | 1989-07-03 | 1991-02-18 | Ricoh Co Ltd | 自然言語処理方式 |
JPH03172961A (ja) * | 1989-11-30 | 1991-07-26 | M C Waade Center:Kk | 同音異義語認識装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Constant et al. | Discriminative strategies to integrate multiword expression recognition and parsing | |
US20040054530A1 (en) | Generating speech recognition grammars from a large corpus of data | |
Mesfar | Named entity recognition for arabic using syntactic grammars | |
US11386269B2 (en) | Fault-tolerant information extraction | |
Samih et al. | Detecting code-switching in moroccan Arabic social media | |
Pérez et al. | Inferred joint multigram models for medical term normalization according to ICD | |
KR20040101678A (ko) | 복합 형태소 분석 장치 및 방법 | |
Onyenwe et al. | Toward an effective igbo part-of-speech tagger | |
KR101757222B1 (ko) | 한글 문장에 대한 의역 문장 생성 방법 | |
Stoness et al. | Incremental parsing with reference interaction | |
Elsheikh | Timeline of the development of Arabic PoS taggers and Morphological analysers | |
JPH01134563A (ja) | かな漢字変換装置 | |
Agrawal et al. | Role of Expectation and Working Memory Constraints in Hindi Comprehension: An Eye-tracking Corpus Analysis | |
JP2005025555A (ja) | シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体 | |
Abouenour et al. | Building an Arabic morphological analyzer as part of an open Arabic NLP platform | |
Sankaravelayuthan et al. | A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam | |
Naserzade et al. | CKMorph: a comprehensive morphological analyzer for Central Kurdish | |
Galicia-Haro | Using electronic texts for an annotated corpus building | |
Ahmed | Detection of foreign words and names in written text | |
JP3698454B2 (ja) | 並列句解析装置および学習データ自動作成装置 | |
JPH03260764A (ja) | 翻訳用辞書登録方式 | |
Salim Elsheikh et al. | TIMELINE OF THE DEVELOPMENT OF ARABIC POS TAGGERS AND MORPHOLOGICALANALYSERS | |
JP4036172B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
KR100214629B1 (ko) | 자연언어 인터페이스 에이전트의 애매성 제거방법 | |
Ahmed et al. | Detection of foreign entities in native text using n-gram based cumulative frequency addition |