JPH01134563A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH01134563A
JPH01134563A JP62293694A JP29369487A JPH01134563A JP H01134563 A JPH01134563 A JP H01134563A JP 62293694 A JP62293694 A JP 62293694A JP 29369487 A JP29369487 A JP 29369487A JP H01134563 A JPH01134563 A JP H01134563A
Authority
JP
Japan
Prior art keywords
kana
character string
kana character
dictionary
output order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62293694A
Other languages
English (en)
Inventor
Noriyuki Osuga
典之 大須賀
Takeshi Nishibe
西部 毅
Seiko Ishikawa
石川 せい子
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP62293694A priority Critical patent/JPH01134563A/ja
Publication of JPH01134563A publication Critical patent/JPH01134563A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、゛自然言語処理手段を用いることによりかな
漢字変換精度の向上を図ったかな漢字変換装置に関する
(従来技術) 従来から、入力装置から入力したかな文字列(自然さi
!)に応じて漢字かな混じり文に変換するかな漢字変換
装置がある。
このようなかな漢字変換装置は辞書および文法書(以下
、単に辞書という)を有し、この辞書には漢字、あるい
は漢字かな混じり文が登録されている。このかな漢字変
換装置に入力されたかな文字列に上記辞1にθ録されて
いる漢字、あるいは漢字かな混じり文が含まれている場
合、上記かな文字列は上記辞1に基づいて漢字かな゛混
じり文に変換される。
そして、この漢字かな混じり文に変換する際、上記かな
文字列に含まれいる各文節間の係り受けを調べ、係り受
けが妥当な漢字かな混じり文に変換するようにしたもの
、−さらに、上記かな文字列を構成する文節(単aI)
の並び(例えば、主語、述語などの並び)が、文法にか
なうように変換するようにしたもの、あるいは上記かな
文字列を構成する単語の意味や、文章の内容に基づいて
変換するようにしたものなどがある。ところが、自然言
語は本質的に不明瞭であいまいなものであることから、
上記のようなかな漢字変換装置であっても、意図してい
たものと異なる変換結果が出力されることもあり、その
ような誤変換の低減を目的に種々の取組が図られている
(発明の目的) 本発明は、上記背景のもとになされたもので、入力され
たかな文字列の文節間の係り受けと、この文節の係り受
番ノの妥当性、および辞書引き回数とにより、かな漢字
変換の出力対栗となる複数の文の出力順位を決定するこ
とにより、意図していたものと同じ変換結果の文を迅速
に出力することができ、変換精度の向上を図ったかな漢
字変換装置を提供することを目的とする。
(発明の構成) 本発明は、かな文字列を入力する入力装置と、自立語を
登録している辞書と、付属語を登録している文法書と、
上記入力されたかな文字列を上記辞書と上記文法1とを
参照して形態素解析する形態素解析部と、上記形態素解
析されたかな文字列を文節ごとに構文解析する構文解析
部と、上記かな文字列に動詞句があるとき、このかな文
字列から動詞句に対応する格フレームを抽出するマツチ
ング部と、上記かな文字列の文節間の意味情報の係り受
けを分析する意味分析部と、上記構文解析に基づいて予
測されたかな文字列の文節の妥当性を判断する判断部と
、上記辞書と文法書とを参照した回数に基いて上記かな
文字列の文節を重みづけする回数重みづけ部と、上記マ
ツチング部と意味分析部と判断部および回数重みづけ部
の処理結果に基づいてかな漢字変換結果の出力順位を決
定する出力順位判断部と、上記の出力順位の決定された
かな漢字変換結果を出力する出力装置とから構成された
ものである。
この構成により、辞書と文法書の参照回数による遥みづ
けがなされて変換の出力順位が決定され、したがって、
かな漢字変換結果の対像となる文の中から意図していた
ちのを選択するための操作を少なくでき、意図していた
変換結果の文を迅速に出力することができる。
(実施例) 第1図は、本発明の一実施例によるかな漢字変換装置の
ブロック構成を示す。同図において、1は自然8語から
なるかな文字列(文)を入力する入力装置、2は形態素
解析部で、この形!!!素解析部2は自立語を登録して
いる辞内3と付属語を登録している文法a4とを参照し
て上記入力されたかな文字文を形態素解析する。ここで
、形態素解析とは、構文解析を行ううえで必要十分な大
きざの文節に文を分割する処理のことをいい、入力され
たかな文字文によっては、文節の分割の仕方が多数存在
する可能性を有している。
5は上記形態素解析されたかな文字文を文節ごとに構文
解析を行う構文解析部、6は構文解析結果を記憶するデ
ータベース部であり、構文解析部5においては、第2図
の例に示すように、「わたしは」の文節の文中における
役割別に分析し、自立語「わたしは」は、品詞が“名詞
”、文法カテゴリ第1候補が“主m“、文節予測第1候
補が“目的語″、付属語「は」は、品詞が“格助詞”で
あると解析する。これらはまとめてデータベース部6に
記憶される。このように、構文解析とは、“形容調子名
詞”で“名詞句”、“名詞句+格助詞(は、が)パで“
主語”とみなし、゛主語十目的i十動詞(述1ffl)
”で“文”を構成するとみなすように文法規劇に基づい
て文の構造の予測を行うことをいう。
7はマツチング部で、上記形態素解析および構文解析さ
れたかな文字文の文節から、動詞句の有無を判別し、動
詞句があれば、この動詞句に対応する格フレームを抽出
し、この格フレームの内容(格フレームの構成に必要な
名詞、格助詞等)に基づいて重みづけの値を設定する。
すなわち、それぞれの動詞句には固有の格フレームが対
応しており、格フレームは動詞句(動詞)に対応する必
修格(主格等、必ず必要とする格)と自由格(必ずしも
必要としない格)および格助詞(助詞の種類)とから構
成されている。
この格フレームの例を第3図に示す。この例のように、
動詞の°゛呼ぶ″ならば、゛[人fll(HtJM)]
が[人人間動物(DIV)]を”の格フレームを持つ。
なお、[1内は、第4図に示すように、名詞の意味(内
容)マーカのことであり、辞書3中の名詞には全て意味
マーカが付されている。
また、第3図で人間(HUM) 、動物(ANI)のど
ちらでも格フレームの格助詞に対応する場合は、“DI
V”と表示する。
8は上記形態素解析されたかな文字文の名詞旬間の係り
受けに基づいて重みづけの値を設定する意味分析部、9
は構文解析された文節予測に基づいて、各文節に重みづ
けの値を設定する判断部、10は回数重みづけ部で、形
態素解析部2において、辞書3および文法14を引いた
口数に基づいて入力されたかな文字文の重みづけの値を
設定する。11は出力順位決定部で、上記マツチング部
7と分析部8と判断部9および回a重みづけ部10にて
設定された1みづけの値に基づいて入力されたかな文字
文に対応する変換結果が複数存在する場合、これらの変
換結果に順位を定め、この順位にそって出力装置12へ
出力する。そして、出力装u12に表示された複数の変
換結果の中から入力装置1を用いて、入力されたかな文
字文に該当する変換結果を選択する。
次に、この変換動作について、第5図の70−チャート
を用いて説明する。
まず、ステップS1で入力装置1からかな文字文が文単
位で入力され、ステップS2で上記かな文字文は形態素
解析部2によって辞書3および文vX14を参照して形
態素解析される。次に、上記形態素解析されたかな文字
文は構文解析部5によって構文解析(文節予測)され、
文節ごとにデータベース部6に記憶される。
そして、ステップS4で上記データベース部6に記憶さ
れたかな文字文の文節に動詞句があるかどうかが判定さ
れ、動詞句があれば、ステップS5で動詞句に対応する
格フレームを抽出し、第6図の例に示すように、この格
フレームの内容に基づいて道みづけの値が決められる(
マツチング部7によるマツチング処理)。例えば、マツ
チング処理による這みづけの値は、 マツチング’full!による重みづけの値=格フレー
ムによる重みづけの値の合計−(格フレーム以外の文節
の個数X0.5) として、計算される。
一方、ステップS4でかな文字文に動詞句がなければ、
ステップSsの処理を行わずにステップSoへ移行する
そして、ステップS6で上記データベース部6に記憶さ
れたかな文字文の文節の中に名詞句があり、かつ、この
名詞句に係り得る名詞句の文節が存在するかどうかが判
定され、係り得る文節が存在すれば、ステップS7で各
色giiWaの係り受は関係に基づいて重みづけの値が
決められる(意味分析部8による意味照合処理)。すな
わち、名詞の意味マーカに基づく重みづけの値を各名調
間の係り受は藺係別に定義し、これを用いて上記かな文
字文の重みづけの値が決められる。
例えば、“だいかくのいちょう°°の場合、“だいがく
”は辞書3において、“大学”と変換されるが、“いち
ょう”は゛胃腸″および“銀杏′°の2つが変換対象と
なる。ここに、第4図に示すように、“大学”の意味マ
ーカはORG (組織、am>”で、“銀杏°°および
“胃腸”の意味マーカはそれぞれ“PLA (植物)′
、“PAR(生物の部分)′であり、“大学(ORG)
”と上記2つの変換対象との係り受は関係は、第7図に
示すように、“大学(ORG)”と“銀杏(PLA)”
との重みづけの値が3点であるのに対し、゛大学(OR
G)″と“胃腸(PAR)”との垂みづけの値が1点で
あり、前者の方が後者よりも大きくなる。かくして、意
味的つながりの重みづけがなされる。
一方、ステップS6で係り得る名詞句の文節が存在しな
ければ、ステップS7の処理を行わずにステップS8へ
移行する。
そして、ステップS8では、ステップS3にて構文解析
されたかな文字文はステップS4からステップS7まで
の処理が行なわれることにより、上記かな文字文の文節
はある程度確定されるので、次に来る可能性の高い文節
力1ゴリ(範躊)の候補が予測される。この予測に基づ
いて、解析中の文節が予測にどの程度合っているかく判
断部9による妥当性判断)の重みづけが行われる。つま
り、第8図の例に示すように、構文解析部5において主
語(構文解析部5は、文頭の文節を主語とみなす)と予
測された文節は、この主語に対する条件と照合し、条件
に対応した重みづけの値が決められる。
次に、ステップS9では、入力されたかな文字文を形8
素解析したときの辞書3および文法間4の参照回数に基
づいて重みづけ(回数重みづけ部10による重みづけ)
が決められる。
すなわら、 重みづけの値−辞書3の参照回数十文法書4の参照回数
−(辞潴3も文法間4ら参照できない残りのかな文字数
×2) として、重みづけの値を計算する。
ただし、文法間4の参照回数において、文法潟4の参照
を連続して行った場合は、2回目以降は2.0とする。
この計算例として、“どうしたらいいのか″について、
説明する。まず、辞書3および文法間4を参照して文節
ごとに変換した結果、“U 他U の p′°と変換さ
れた場合、辞書3および文法N4の参照回数に基づいて
重みづけの値を計算すると、U[辞書(1)] 他[辞
書(1)] 敦1[辞府(1)]  (7)[文法間(
1)] か[文文法間2.0)]”となり、市みづけの
値の合計は、6.0となる。
一方、“くユ 旦 互5 へ公 の ケ′°と変換され
た場合、上記と同様に重みづけの値を訓算すると、゛ど
〕[辞書(1)] 見[文法間(1)] 丸5[文法間
(2,O)コ 鷺公[文法間(2,、O)]  の[文
文法間2.、−0)]  た[文文法間2.0)]”と
なり、市みづけの値の合計は、10.0となり、”u 
 t  Lm  (7)  fit”と変換された場合
の重みづけの値に比べ、ζ】旦 互5 へ公 の た″
と変換された場合の市みづけの値が大きくなる。
次に、ステップStOで、ステップs2からステップS
9までの処理によって、かな漢字変換結果の対象文が複
数になるかどうかを判定する。
そして、ステップS 1aで上記対象文が複数であれば
、ステップS11で、ステラ7S5.S7 、S8、S
9の各処理に基づいて行なわれた償みづけにより、かな
漢字変換結果の対象文の出力順位が決められ、ステップ
St2で上記変換結果の対象文の中から入力装置1を用
いて選択を行い、ステップSn″C−選択された変換結
果が表示される。一方、ステップS10で上記対象文が
複数でなければ、ステップS13へ移行し、変換結果が
表示される。
なお、第4図、第7図の例に示したような、名詞のみな
らず、他の品詞についても同様の処理を行ってもよい。
また、かな漢字変換結果の対象文の出力順位は上記のよ
うに各処理の重みづけの値の高いものから決めてもよい
が、1みづけの値の設定次第では低いbのから決めても
よい。また、ステップS11の順位づけにおいて、ステ
ップ35゜S7 、Sa 、89の処理ごとに重みづけ
の大きさを変えて設定してもよく、計算の式も変形して
もよい。
かくして、かな文字列を総合的に判断し、意図していた
ものと同じかな漢字変換の文を得る確率が高くなり、変
換の精度が向上するとともに、かな漢字変換結果の対象
文の中から選択する操作を少なくでき、従ってかな漢字
変換を迅速に行うことができる。
(発明の効果) 以上のよう、に本発明によれば、格フレームの内容と、
名詞間の係り受は関係と、文節予測の妥当性および辞書
引き回数とに基づいてかな漢字変換の対象になるかな文
字列を判断し、出力順位を決定するようにしているので
、少ない選択操作によって、意図していたものと同じか
な漢字変換の文を得る確率が高くなり、かな漢字変換精
度の向上および操作性の向上を図ることができる。
【図面の簡単な説明】
第1図は本発明の一実施例によるかな漢字変換装置の1
0ツク構成図、第2図は構文解析された文節の構成例を
示す図、第3図は動詞の格フレームの構成例を示す図、
第4図は名詞の意味マー力の構成例を示す図、第5図は
本発明装置の動作を示すフローチャート、第6図は?ツ
チング処理による重みづけの一実施例を示す図、第7図
は意味照合処理による重みづけの一実施例を示す図、第
8図は文節予測と適合条件の一実施例を示す図である。 1・・・入力装置、2・・・形態素解析部、3・・・辞
書、4・・・文法占、5・・・構文解析部、7・・・マ
ツチング部、8・・・意味分析部、9・・・判断部、1
0・・・回数重みづけ部、11・・・出力順位決定部、
12・・・出力装置。 第  3  図 第  4  図 第  6  図 第  7  図 第  8  図

Claims (1)

    【特許請求の範囲】
  1. 1、かな文字列を入力する入力装置と、自立語を登録し
    ている辞書と、付属語を登録している文法書と、上記入
    力されたかな文字列を上記辞書と上記文法書とを参照し
    て形態素解析する形態素解析部と、上記形態素解析され
    たかな文字列を文節ごとに構文解析する構文解析部と、
    上記かな文字列に動詞句があるとき、このかな文字列か
    ら動詞句に対応する格フレームを抽出するマッチング部
    と、上記かな文字列の文節間の意味情報の係り受けを分
    析する意味分析部と、上記構文解析に基づいて予測され
    たかな文字列の文節の妥当性を判断する判断部と、上記
    辞書と文法書とを参照した回数に基いて上記かな文字列
    の文節を重みづけする回数重みづけ部と、上記マッチン
    グ部と意味分析部と判断部および回数重みづけ部の処理
    結果に基づいてかな漢字変換結果の出力順位を決定する
    出力順位判断部と、上記の出力順位の決定されたかな漢
    字変換結果を出力する出力装置とから構成されたことを
    特徴とするかな漢字変換装置。
JP62293694A 1987-11-19 1987-11-19 かな漢字変換装置 Pending JPH01134563A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62293694A JPH01134563A (ja) 1987-11-19 1987-11-19 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62293694A JPH01134563A (ja) 1987-11-19 1987-11-19 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH01134563A true JPH01134563A (ja) 1989-05-26

Family

ID=17798026

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62293694A Pending JPH01134563A (ja) 1987-11-19 1987-11-19 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH01134563A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0336662A (ja) * 1989-07-03 1991-02-18 Ricoh Co Ltd 自然言語処理方式
JPH03172961A (ja) * 1989-11-30 1991-07-26 M C Waade Center:Kk 同音異義語認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0336662A (ja) * 1989-07-03 1991-02-18 Ricoh Co Ltd 自然言語処理方式
JPH03172961A (ja) * 1989-11-30 1991-07-26 M C Waade Center:Kk 同音異義語認識装置

Similar Documents

Publication Publication Date Title
Constant et al. Discriminative strategies to integrate multiword expression recognition and parsing
US20040054530A1 (en) Generating speech recognition grammars from a large corpus of data
Mesfar Named entity recognition for arabic using syntactic grammars
US11386269B2 (en) Fault-tolerant information extraction
Samih et al. Detecting code-switching in moroccan Arabic social media
Pérez et al. Inferred joint multigram models for medical term normalization according to ICD
KR20040101678A (ko) 복합 형태소 분석 장치 및 방법
Onyenwe et al. Toward an effective igbo part-of-speech tagger
KR101757222B1 (ko) 한글 문장에 대한 의역 문장 생성 방법
Stoness et al. Incremental parsing with reference interaction
Elsheikh Timeline of the development of Arabic PoS taggers and Morphological analysers
JPH01134563A (ja) かな漢字変換装置
Agrawal et al. Role of Expectation and Working Memory Constraints in Hindi Comprehension: An Eye-tracking Corpus Analysis
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
Abouenour et al. Building an Arabic morphological analyzer as part of an open Arabic NLP platform
Sankaravelayuthan et al. A Comprehensive Study of Shallow Parsing and Machine Translation in Malaylam
Naserzade et al. CKMorph: a comprehensive morphological analyzer for Central Kurdish
Galicia-Haro Using electronic texts for an annotated corpus building
Ahmed Detection of foreign words and names in written text
JP3698454B2 (ja) 並列句解析装置および学習データ自動作成装置
JPH03260764A (ja) 翻訳用辞書登録方式
Salim Elsheikh et al. TIMELINE OF THE DEVELOPMENT OF ARABIC POS TAGGERS AND MORPHOLOGICALANALYSERS
JP4036172B2 (ja) 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム
KR100214629B1 (ko) 자연언어 인터페이스 에이전트의 애매성 제거방법
Ahmed et al. Detection of foreign entities in native text using n-gram based cumulative frequency addition