JPH0877157A - 仮名漢字変換方法 - Google Patents

仮名漢字変換方法

Info

Publication number
JPH0877157A
JPH0877157A JP6213328A JP21332894A JPH0877157A JP H0877157 A JPH0877157 A JP H0877157A JP 6213328 A JP6213328 A JP 6213328A JP 21332894 A JP21332894 A JP 21332894A JP H0877157 A JPH0877157 A JP H0877157A
Authority
JP
Japan
Prior art keywords
word
information
noun
clause
modified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6213328A
Other languages
English (en)
Inventor
Hiroyasu Nogami
宏康 野上
Yoshimi Saito
佳美 齋藤
Tatsuya Uehara
龍也 上原
Tatsuya Dewa
達也 出羽
Yumi Mizutani
由美 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6213328A priority Critical patent/JPH0877157A/ja
Publication of JPH0877157A publication Critical patent/JPH0877157A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 本発明は、変換精度の高い仮名漢字変換装置
を提供することを目的としている。 【構成】自立語に対し、付属語を伴わず単独で文節を形
成する名詞による被修飾性の情報を記憶する被修飾性記
憶手段と、前記被修飾性に基づいた、名詞と自立語との
修飾関係を記憶する修飾関係記憶手段との情報に基づい
て、文節候補間の修飾関係の有無を判定し、その結果に
基づいて文節候補の優先順位を決定するように構成す
る。 【効果】 付属語を伴わず単独で文節を形成する名詞に
よる被修飾性を持たない自立語が名詞により修飾される
表現への変換誤りを回避することができ、高精度の変換
が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、仮名表現で与えられた
日本語文を仮名漢字混じり文に変換する仮名漢字変換方
法に関する。
【0002】
【従来の技術】近年、日本語文章の読み情報を仮名情報
として入力して、仮名漢字混じりの文章情報に変換する
ための変換手段として、日本語ワードプロセッサが広く
普及している。
【0003】このような日本語ワードプロセッサでは、
キーボードを用いてひら仮名入力もしくはローマ字入力
により文章の読み情報が入力されると、文節および文の
切れ目などを指示する特定キーの操作タイミング、ある
いは仮名情報の入力中に句読点が入力されたり、入力さ
れた文字数があらかじめ定められた文字数を越えた場合
などのタイミングで、それぞれ入力された仮名情報を対
応する仮名漢字混じり表記に変換する処理が行われ、そ
の変換処理結果をCRTなどのディスプレイに表示する
ようにしている。この一連の変換処理および表示が繰り
返されることにより、利用者は所望する文書についての
仮名漢字混じり表記を作成していくことができる。
【0004】このような日本語ワードプロセッサでの仮
名情報の入力を仮名漢字混じりの表記に変換する処理に
おいては、利用者が意図する仮名漢字表記に正確に変換
できることが必要とされる。もし、正確に変換できない
場合には、変換を誤った部分についての修正を、利用者
自らが行わなければならず、その修正には多大な労力が
必要とされる。そのため、仮名漢字変換装置の開発いお
いては、読みを漢字に変換するに際して、その読みに対
応する変換候補のうち、利用者が入力したいと考えてい
る語をいかに第1候補として変換できるかという観点か
ら技術の開発が行われている。
【0005】従来の変換処理においては、日本語には英
語などの言語と異なり単語の分かち書きの習慣がないこ
とから、まず単語ごとに分割し文節を認定する処理を行
う。次に、上記文節の認定処理で生成された文節候補か
ら、第1候補を選択する処理を行う。ここでは、共起関
係の情報やその単語の出現の尤度として頻度情報等を用
いる。
【0006】上記自立語には、付属語を伴わない名詞に
よる被修飾性を持つものと、持たないものとが存在す
る。例えば形容詞の場合は、前者の例としては「正し
い」、「良い」、後者の例としては「厚い」、「美し
い」、形容動詞の場合は、前者の例としては「明快」、
「容易」、後者の例としては「幼稚」、「意外」、副詞
の場合は、前者の例としては「ともども」、「少々」、
後者の例としては「更に」、「いよいよ」、名詞の場合
は、前者の例としては「高騰」、「大会」、後者の例と
しては「口頭」、「場」動詞の場合は、前者の例として
は「づける」、「めく」、「極まる」、後者の例として
は「食べる」、「走る」、接続詞の場合は、前者の例と
しては「および」、「並びに」、後者の例としては「し
かし」、「したがって」などがある。
【0007】例えば、「正しい」は、「礼儀正しい」
「規則正しい」と付属語を伴わない名詞により修飾され
ているが、「厚い」はこのような名詞からの修飾は受け
ない(例えば「大変厚い」)。
【0008】従来は、各自立語の名詞による被修飾性に
関する情報を用いていなかったため、「付属語を伴わな
い名詞が、付属語を伴わない名詞による被修飾性を持た
ない自立語を修飾する表現」を許していた。したがっ
て、これが原因で変換誤りを生じていた。その例を図6
(1)〜(4)の変換候補1に示す。
【0009】例えば、(1)の変換候補1の例では、名
詞による被修飾性を持たない形容詞「厚い」が、名詞
「大使」から修飾された表現になっている。このような
誤りに対しては、従来、共起情報等により解決を図って
きた。これは、例えば、(2)の例では「工場−用地」
という関係を予め記憶しておき、変換候補の中から、こ
の関係にあるものを優先するという方法である。しかし
ながら、このような共起関係は多種多様で、その数は非
常に多い。今、単語辞書に登録されている語数を10万
語とすると、2語のペアは単純計算で10万語×10万
語=100億ペアとなる。これらの中で共起関係にある
ものは遥かに少ないが、それでも数百万ないし数千万ペ
アは存在すると考えられる。したがって、このような多
数の組み合わせの可能性を調べ、さらに、多数のペアを
予め共起表として格納しておくことは、実際問題として
不可能である。
【0010】以上の理由から、従来技術では正しく変換
するのは不十分で、高い変換精度が得られず、利用者に
対し次候補選択を指示する手間と、精神的負担をかける
結果となっていた。
【0011】
【発明が解決しようとする課題】上記したように、従来
の変換においては、各自立語が名詞による被修飾性の観
点からの情報を持っていなかったため、図6に示すよう
な「名詞が、名詞被修飾性を持たない単語を修飾する変
換誤り」を回避することができないという問題点があっ
た。
【0012】本発明は、各単語に名詞被修飾性の有無の
情報を付加し、その情報に基づいて、上記のような変換
誤りを回避し、変換精度の高い仮名漢字変換方法を提供
することを目的とする。
【0013】
【課題を解決するための手段】本発明は自立語に対し、
付属語を伴わず単独で文節を形成する名詞による被修飾
情報と、前記被修飾情報に基づいた名詞と自立語との修
飾関係の有無の情報とを用いて、入力された仮名に対応
する単語を検索し、検索された単語と付属語間の接続性
および付属語と付属語間の接続性を判定して文節候補を
生成し、生成された文節候補間の修飾関係の有無を判定
し、判定された修飾関係の有無に基づいて、前期文節候
補の優先準位を決定し、これらの文節候補に基づいて仮
名漢字混じり文に変換することを特徴とする仮名漢字変
換方法である。
【0014】
【作用】自立語に対し、付属語を伴わず単独で文節を形
成する名詞による被修飾性の情報、各自立語の被修飾性
に基づいた、名詞と自立語との修飾関係の有無の情報に
基づいて、文節候補間の優先順位を決定する。これによ
り、名詞による被修飾性を持たない自立語が名詞により
修飾される誤った表現への変換を回避することができ
る。
【0015】
【実施例】以下、本発明に係る1実施例を図面を参照し
て説明する。図1は、本発明に係る仮名漢字変換装置の
構成を示したブロック図である。図1に示すように本実
施例の仮名漢字変換装置は、入力部1が単語検索部2と
接続されており、単語検索部2は、単語辞書11と付属
語辞書12を備え、文節候補生成部3と接続され、この
文節候補生成部3は接続テーブル13を備え、系列候補
選択部4と接続され、さらにこの系列候補選択部4は構
文判定部5と出力部7と接続され、構分判定部5は修飾
関係判定部6と接続され、修飾関係判定部6は、修飾関
係規則14を備えている。
【0016】次に、図2を参照して、本実施例の仮名漢
字変換装置における処理の概略を説明する。図2を参照
するに、本実施例における処理は、大きく分けて2つの
処理から構成されている。第1の処理(ステップS2
1)は、入力される仮名文字列に対し、自立語と付属語
の接続性に関する情報、付属語と付属語の接続性に関す
る情報等を用いて文節の範囲を認定する処理である。こ
の処理は、図1に示した入力部1、単語検索部2、文節
候補生成部3での処理に対応する。なお、ここでの処理
は特開平3−265061号公報に詳しいので、ここで
は簡単に説明する。
【0017】また第2の処理(ステップS22)は、文
節認定処理により文節と認定された各候補に対し、その
第1候補を決定する処理である。ここでの処理は、図1
に示す系列候補選択部4、構文判定部5、修飾関係判定
部6での処理に対応する。
【0018】まず、第1の処理について説明すると、入
力部1から変換対象である読み情報が入力され、順次、
単語検索部2に送られる。単語検索部2では、単語辞書
11、付属語辞書12を参照して単語候補が抽出され
る。単語辞書11には、図3に示すように、自立語の各
単語に対する読み31、漢字仮名表記32、品詞33、
用言修飾フラグ34、名詞被修飾フラグ35、単語番号
36が記憶されている。また、付属語辞書12には、図
4に示すように、付属語の読み41、当該単語の文法情
報42がそれぞれ記憶されている。
【0019】単語検索部2で抽出された単語候補は、文
節候補生成部3に送られる。文節候補生成部3では接続
テーブル13を参照して、単語候補から文節候補を生成
し、結果を系列候補選択部4に送る。接続テーブル13
には、図5に示すように、自立語と付属語、および付属
語と付属語の接続情報が格納されている。前期図6
(1)の入力に対して、図3に示す単語辞書、図4に示
す付属語辞書、図5に示す接続テーブルを用いて、上記
公報と同様の処理を行ない生成した系列候補の構造例を
図7に示す。この構造について説明する。
【0020】図6(1)に示す入力例に対する、第1の
処理の結果である系列候補の構造の例を図7(1)に示
す。この系列候補の構造は、系列番号701、構文判定
702、文節番号703、単語番号704、品詞70
5、用言修飾フラグ706、名詞被修飾フラグ707、
修飾文法情報708、修飾文節709から構成されてい
る。
【0021】系列番号とは系列候補の番号であり、今回
の例の場合は、図6(1)の第1候補が図7(1)の系
列番号0、第2候補が系列番号1に対応している。構文
判定とはその系列の構文妥当性を示す情報であり、1は
系列を構成する文節が修飾先を持つこと、−1修飾先が
存在しない文節が存在することを意味する。初期値とし
て0がセットされている。文節番号とは文節候補の番号
であり、今回の例の場合は、文節「大使」は文節番号
0、文節「厚く」は文節番号1、文節「対し」は文節番
号2に対応している。
【0022】品詞といえば、例えば、名詞、動詞など自
立語の品詞である。用言修飾フラグとは、付属語を伴わ
ず単独で文節を形成する名詞の用言に対する修飾性の有
無に関する情報であり、0の場合は修飾性が無いこと
を、1の場合は修飾性があることを意味している。前者
の例としては、大使、工場、後者の例としては、「今
年」、「他方」、「くらい」、「大勢」などである。名
詞被修飾フラグとは、付属語を伴わず単独で文節を形成
する名詞による被修飾性の情報に関する情報であり、0
の場合は被修飾性が無いことを、1の場合は被修飾性が
あることを意味している。
【0023】修飾文法情報とは、文節を構成する最後尾
の単語の形態的または構文的文法情報であり、例えば、
名詞、動詞の連体形、形容詞の連用形、格助詞「を」
「の」などである。今回の例の場合は文節番号0の「大
使」の場合は、修飾文法情報は名詞である。また、文節
番号1の「厚く」は、修飾文法情報は形容詞連用形であ
る。修飾文節は当該単語が修飾している文節番号を表
す。これらは、後述する修飾関係判定部6における処理
により判定され記入される。
【0024】ここでは、文節候補生成部3から送られて
きた系列候補を構文判定部5へ送る処理と、構文判定部
5での判定結果に基づいて系列候補の中から候補を選択
し出力部7へ送る処理とを行なう。図9は、前者の処理
の流れを示すフローチャートである。ステップS901
で系列候補数をNにセットする。ステップS902で、
系列候補を表すjを0にセットする。ステップS903
で、系列jを構文判定部へ先に送る。この処理を系列候
補全てに対して行なう(ステップS904、S90
5)。この処理が終了した後、系列候補を出力部7へ送
る処理を行なう。図10は、この処理の流れを示すフロ
ーチャートである。ステップS1001で、系列候補数
をNにセットする。ステップS1002で、系列候補を
表すjを0にセットする。ステップS1003で、系列
候補の構文判定の項目が1かどうか、ステップS100
4で0かどうかを判定し、1の場合はステップS100
5でメモリ1に保存し、0の場合はステップS1006
でメモリ2に保存する。それ意外の場合はメモリ3に保
存する。この処理を系列全てに対して行ない(ステップ
S1008、S1009)、その後、ステップS101
0で、メモリ1、メモリ2、メモリ3の順で出力部へ送
る。
【0025】図6(1)の入力の場合について具体的に
説明する。この例の場合の文節候補生成部の結果は図7
(1)であり、系列番号0、1の順で構文判定部5へ送
り、図8(1)の構文判定の値が返される。つまり系列
番号0の構文判定結果として−1が返される。したがっ
て、系列番号1、2の順で、出力部7へ送る。
【0026】次に、構文判定部の処理について説明す
る。ここでは系列候補の構文的妥当性の判定を行なう。
図11は、ここでの処理の流れを示すフローチャートで
ある。ステップS1101で系列候補の総文節数をBに
セットする。また、ステップS1102で文節を表すb
に0をセットする。ステップS1003で、文節bに修
飾文節が存在するかどうか(系列候補の修飾文節の項が
−1かどうか)を調べる。−1の場合は、ステップS1
106で、当該系列の構文判定の項目(702)に−1
をセットする。この処理を、系列内の最右文節を除く全
ての文節に対して行ない(ステップS1004、S10
05)、終了したら系列候補選択部4に戻る。
【0027】具体的に図6(1)の入力例の場合で説明
する。この例の場合は、後述する処理によって図8
(1)の修飾文節の項目(709)に記入された値の状
態になっている。したがって系列番号0の場合は修飾文
節の項目が−1となっているので、構文判定の項目(7
02)に、−1を記入する。
【0028】系列番号1の場合は、構文判定には何も書
き込まないので0のままである。次に修飾関係判定部6
の処理について説明する。ここでは、文節間の修飾関係
を有無を判定する処理を行なう。図12は、ここでの処
理の流れを示すフローチャートである。ステップS12
01で系列候補の総文節数をBにセットする。ステップ
S1202で、系列候補の文節を表すbを0にセットす
る。ステップS1203で文節bに対し修飾先の判定処
理を行なう。この処理については後述する。この処理を
最右文節以外の全文節候補に対して行なう(ステップS
1204、S1205)。
【0029】具体的に図6(1)に示す入力例の場合で
説明する。系列番号0の場合(「大使厚く」)は、文節
番号0「大使」と文節番号1「厚く」から構成されてい
るので、文節番号0「大使」の修飾先を後述する処理に
よって求めることになる。
【0030】次に、ステップS1203の処理について
説明する。ここでは、各文節に対し修飾関係を調べる。
図13は、ここでの処理の流れを示すフローチャートで
ある。ステップS1301で修飾関係判定規則(図1
4)の総数をRにセットする。修飾関係判定規則につい
ては後述する。ステップS1302で修飾関係規則を表
すrに0をセットする。ステップS1303で、文節b
は規則rの修飾品詞か、ステップS1304で、文節b
は規則rの品詞条件を満たすかを、それぞれ図7に示す
系列候補情報の用言修飾フラグ706、修飾文法情報7
08を参照することによりチェックする。いずれも条件
を満たした場合は、ステップS1305へ進む。いずれ
かの条件を満たさなかった場合は、次の修飾関係規則の
適用を試みる。この処理を全規則を適用するまで行なう
(ステップS1313、S1314)。
【0031】ステップS1305では修飾先の文節を表
すjにb+1をセットする。ステップS1306で、文
節jは規則rの被修飾品詞か、ステップS1307で、
文節jは規則rの品詞条件を満たすか、をチェックす
る。
【0032】いずれも条件を満たした場合は、ステップ
S1308で文節bの修飾文節(709)に、文節jを
セットする。いずれかの条件を満たさなかった場合は、
修飾先として、系列候補内の次の文節をチェックする
(ステップS1309)。この場合、次文節がない場合
は、その以降の入力の中に修飾する文節が存在する可能
性を示す。kに1をセットする。次文節がある場合は、
ステップS1311で、規則rの適用範囲を満たすかを
チェックする。満たす場合はステップS1306以降の
処理を繰り返す。満たさない場合は次の規則の適用を試
みる(ステップS1313、S1314)。
【0033】全ての規則にマッチしなかった場合は、ス
テップS1315へ進み、kが1かどうかをチェックす
る。kが1の場合は、文節bの修飾文節(709)に0
をセットする(ステップS1316)。kが−1の場合
は、文節bの修飾文節に−1をセットする(ステップS
1317)。
【0034】次に修飾関係規則について説明する。図1
4に修飾関係規則の例を示している。この規則は、修飾
する文節の最後尾の単語の品詞1401、修飾品詞の満
たすべき条件1402、修飾される文節の品詞140
3、被修飾品詞の満たすべき条件1404、当該規則の
適用範囲1405から構成されている。例えば、規則
(1)は、「格助詞「が」は、形容詞を修飾する」とい
うことを、規則(2)は、「動詞の連用形は、次に出現
する動詞を修飾する」ということを、規則(3)は「名
詞が付属語を伴わず単独で文節を構成する場合、用言修
飾性が有る場合は形容詞を修飾する」ということを、規
則(4)は、「名詞が付属語を伴わず単独で文節を構成
しており、かつ用言修飾性が無い場合は、形容詞を修飾
できるのは、その形容詞に名詞による被修飾性が有り、
かつその形容詞は次文節である場合に限る」ということ
を意味している。
【0035】具体的に図6(1)の例で、修飾関係を求
める場合について説明する。まず、文節番号0「大使」
の修飾関係を調べる場合について説明する最初に上記修
飾関係規則(1)について調査する。文節「大使」が規
則(1)の修飾品詞「格助詞が」であるかを調べる。
「大使」は、名詞であるので、この規則の適用は行なわ
ず次の規則の適用を試みる。「大使」は、規則(3)の
修飾品詞「名詞」を満足するが、品詞条件「用言修飾性
有り」を満足しないので、この規則の適用も行なわな
い。「大使」は、規則(4)の修飾品詞「名詞」、品詞
条件「用言修飾性なし」を満足するので、次に1つ右側
の文節「厚く」が、被修飾品詞「形容詞」を満足するか
調べる。「厚く」の被修飾品詞は「形容詞」であるが、
品詞条件「名詞被修飾性有り」を満足しないので、「厚
く」との間には修飾関係が存在しないことがわかる。
【0036】したがって次の規則の適用を試みるが、こ
れ以降の規則にはマッチしないので、結局「大使」は修
飾先を持たないことになる。したがって、当該文節の修
飾文節には−1をセットする。系列番号(2)に対して
も同様の処理を行なう。この場合は、修飾関係規則
(2)にマッチするが、被修飾品詞とマッチするものが
入力されたものの中にはないので、文節「対し」の修飾
文節(709)に0をセットすることになる。
【0037】前述したが、この情報を用いて構文判定が
行なわれ、系列候補選択部によって系列番号(1)の
「対し厚く」が先に選択され出力部で表示されることに
なる。また、本実施例においては、修飾関係規則として
修飾関係のあるものを記述しているが、逆に修飾関係の
無いものを記述しておき、その規則にマッチした時点で
修飾先を持たないと判断するようにすることも可能であ
る。
【0038】また、本格的に構文解析することも当然可
能である。反対に非常に簡易に品詞の並びのパターンで
判断することも可能である。また、系列候補を選択する
場合、当然、頻度情報、共起情報など他の情報を利用す
ることも可能である。
【0039】また、系列候補の作成の際には、他の系列
と共有する文節については当然別々に持つ必要はなく共
有する形で持つことも可能である。また、本実施例で
は、名詞被修飾性情報は辞書中に記述したが必ずしも辞
書中である必要はない。
【0040】要するに、本発明は上記例のみならず、そ
の要旨を逸脱しない範囲で種々変形して用いられる。次
に、第2の発明について説明する。
【0041】図15は、第2の発明に係る仮名漢字変換
装置の構成を示したブロック図である。本発明は第1の
発明とは、編集制御部8、名詞被修飾情報9、名詞被修
飾情報記憶部10、修飾関係判定部6、名詞被修飾情報
学習規則14の部分が異なっているので、これらについ
て説明する。
【0042】編集制御部8は利用者から、表示した変換
結果に対し確定を指示するキーの入力があった場合、確
定された系列候補情報を名詞被修飾情報学習部9へ送
る。「かんこうびれっじ」という入力が行なわれた場合
について図3に示す辞書において「びれっじ」に対して
は、名詞被修飾情報が0という前提で説明する。この場
合は、第1の発明と同様の処理により系列候補の構造は
図16に示すようになり、この表示に対し利用者が確定
操作を行なったとする。この場合、編集制御部7は、表
示系列候補情報(図16)を名詞被修飾情報判定部9に
送る。
【0043】次に、名詞被修飾情報判定部9における処
理について説明する。ここでは後述する名詞被修飾情報
記憶部10に、単語とその名詞被修飾情報を記帳する処
理を行なう。ここで、名詞被修飾情報記憶部10の構造
について説明する。図19にその構造例を示す。この構
造は単語番号1901、名詞被修飾フラグ1902から
構成されている。名詞被修飾情報判定部9での処理の結
果はこの名詞被修飾情報記憶部10に記入されることに
なる。
【0044】図17は、名詞被修飾情報判定部10での
処理の流れを示すフローチャートである。ステップS1
701で、学習規則(図18)の総数をRにセットす
る。ステップS1702で、学習規則を表すrを0にセ
ットする。編集制御部8から送られてきた系列候補情報
(図16)に対して最左の文節bに対し規則rの修飾品
詞かどうか(S1703)規則rの品詞条件を満たすか
(S1704)をチェックし、いずれの条件も満たした
場合は、次文節に対し(S1705)、規則rの被修飾
品詞か(ステップS1706)、規則rの品詞条件を満
たすか(ステップS1707)、規則rの適用範囲を満
たすか(ステップS1708)をチェックし、いずれも
条件を満たした場合は、名詞被修飾情報記憶部の単語番
号に文節jの単語番号を、名詞被修飾フラグに1を記入
する。
【0045】次に、名詞被修飾性学習規則について説明
する。図18にその例を示している。この規則は修飾元
である単語の品詞1801、品詞条件1802、修飾を
受ける単語の品詞1803、当該規則の適用範囲180
4から構成されている。例えば第1番目の規則は、「用
言修飾性のない名詞の直後の文節が形容詞であれば、そ
の形容詞は名詞被修飾性を持つこと」を意味している。
【0046】第2番目の規則は、「用言修飾性のない名
詞の直後の文節が名詞であれば、その名詞は名詞被修飾
性を持つこと」を意味している。具体的に図16に示し
た系列に対して、名詞被修飾情報を求める場合について
説明する。最初に、上記名詞被修飾情報学習規則の第1
番目の規則に対して調査する。文節「観光」が規則の修
飾品詞「名詞」であるかを調べる。「観光」は名詞であ
るので、次の条件「用言修飾性無し」かどうかを調べ
る。これも満足するので、次に1つ右側の文節「ビレッ
ジ」が、品詞条件「形容詞」を満足するか調べる。この
条件は満足しないので、次の規則の適用を行う。この規
則の場合も、同様に処理を進め、「観光」、「ビレッ
ジ」とも品詞および品詞条件を満足し、さらに適用範囲
も満足するので、この規則にマッチしたことがわかる。
したがってステップS1709で、名詞被修飾情報記憶
部の単語番号の項目に、「ビレッジ」の単語番号025
を、名詞被修飾フラグに1を記入する(図19)。
【0047】次に本発明における修飾関係判定部6にお
ける処理について説明する。ここでの処理は、第1の発
明における修飾関係判定部6における処理のステップS
1307が異なるので、その部分について説明する。こ
の処理の流れを図20に示す。ステップS2001で、
名詞被修飾情報記憶部の単語の中に当該単語と一致する
ものがあるかを調べる。一致するものがある場合は、品
詞条件(1404)のうち、名詞被修飾情報に関するも
のは、名詞被修飾情報記憶部の情報を利用する。一致し
ない場合は単語辞書の情報を利用する。
【0048】名詞被修飾情報記憶部10が図19に示す
状態で、「かんこうびれっじ」が入力された場合には、
その系列候補構造情報は図16(2)に示すようにな
り、正しく構文判定されることになる。同様の処理によ
り、「子供ビレッジ」、「若者ビレッジ」なども正しく
構文判定されることになる。以上のようにして本発明に
おいては、名詞被修飾性に関する情報を学習することが
できる。
【0049】
【発明の効果】本発明によれば、各単語に対し名詞によ
る被修飾性の有無、および名詞と各品詞の修飾関係の有
無に関する規則により、変換時に名詞被修飾性のない単
語が名詞により修飾を受ける表現となる誤変換を回避す
ることができる。
【図面の簡単な説明】
【図1】 本発明に係る仮名漢字変換装置の1実施例の
概略を示すブロック図
【図2】 図1に示す仮名漢字変換装置の処理の概略を
示すフローチャート
【図3】 単語辞書に記載される情報の一例を示す図表
【図4】 付属語辞書に記載される情報の一例を示す図
【図5】 接続テーブルに記載される情報の一例を示す
図表
【図6】 入力例に対する変換候補の一例を示す図
【図7】 文節候補生成部での処理結果である系列候補
の構造の一例を示す図表
【図8】 構文判定部での処理結果である系列候補の構
造の一部を示す図表
【図9】 系列候補選択部における処理の流れを示すフ
ローチャート
【図10】 系列候補選択部における処理の流れを示す
フローチャート
【図11】 構文判定部の処理の流れを示すフローチャ
ート
【図12】 修飾関係判定処理部における処理の流れを
示すフローチャート
【図13】 修飾関係規則の適用処理の流れを示すフロ
ーチャート
【図14】 修飾関係規則の一例を示す図表
【図15】 第2の発明に係る仮名漢字変換装置の1実
施例の概略を示すブロック図
【図16】 系列候補の構造の一例を示す図表
【図17】 名詞被修飾情報学習部における処理の流れ
を示すフローチャート
【図18】 名詞被修飾情報学習規則の一例を示す図表
【図19】 名詞被修飾情報学習部に記憶される情報の
1例を示す図表
【図20】 第2の発明に係る、修飾関係判定処理部に
おける処理の流れを示すフローチャート
【符号の説明】
1…入力部 2…単語検索部 3…文節候補生成部 4…文節候補選択部 5…構文判定部 6…修飾関係判定部 7…出力部 8…編集制御部 9…名詞被修飾情報学習部 10…名詞被修飾情報記憶部 11…単語辞書 12…付属語辞書 14…修飾関係規則 15…名詞被修飾情報学習規則
───────────────────────────────────────────────────── フロントページの続き (72)発明者 出羽 達也 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内 (72)発明者 水谷 由美 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】仮名に対応する自立語に対し、付属語を伴
    わず単独で文節を形成する名詞による被修飾情報と、前
    記被修飾情報に基づいた名詞と自立語との修飾関係の有
    無の情報とを用いて、入力された仮名に対応する単語を
    検索し、 検索された単語と付属語間の接続性および付属語と付属
    語間の接続性を判定して文節候補を生成し、 生成された文節候補間の修飾関係の有無を判定し、 判定された修飾関係の有無に基づいて、前期文節候補の
    優先準位を決定し、これらの文節候補に基づいて仮名漢
    字混じり文に変換することを特徴とする仮名漢字変換方
    法。
JP6213328A 1994-09-07 1994-09-07 仮名漢字変換方法 Pending JPH0877157A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6213328A JPH0877157A (ja) 1994-09-07 1994-09-07 仮名漢字変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6213328A JPH0877157A (ja) 1994-09-07 1994-09-07 仮名漢字変換方法

Publications (1)

Publication Number Publication Date
JPH0877157A true JPH0877157A (ja) 1996-03-22

Family

ID=16637342

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6213328A Pending JPH0877157A (ja) 1994-09-07 1994-09-07 仮名漢字変換方法

Country Status (1)

Country Link
JP (1) JPH0877157A (ja)

Similar Documents

Publication Publication Date Title
JP3277123B2 (ja) 中国語テキストを処理するためのシステムおよび方法
JP2016186805A (ja) 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法
JP2016186805A5 (ja)
JPH0351020B2 (ja)
US20070179779A1 (en) Language information translating device and method
Sproat et al. The taxonomy of writing systems: How to measure how logographic a system is
Shukla et al. Natural Language Processing: Unlocking the Power of Text and Speech Data
WO2003079224A1 (fr) Procede et dispositif de generation de texte
JP2000298667A (ja) 構文情報による漢字変換装置
JPH05120324A (ja) 言語処理方式
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH0877157A (ja) 仮名漢字変換方法
KR950013129B1 (ko) 기계번역장치 및 방법
JP3454895B2 (ja) 仮名漢字変換方法
ASAHIAH et al. A survey of diacritic restoration in abjad and alphabet writing systems
Tsai et al. Applying an NVEF Word-Pair Identifier to the Chinese Syllable-to-Word Conversion Problem
Van Nam et al. Building a spelling checker for documents in Khmer language
JPS60193074A (ja) 日本語解析装置
JP2915225B2 (ja) 文書作成装置
JP3386520B2 (ja) 仮名漢字変換装置および方法
JPH11327871A (ja) 音声合成装置
JPH08123806A (ja) 仮名漢字変換方法および仮名漢字変換装置
JPH01185766A (ja) かな漢字変換装置
Srinivasan Translating Tamil Speech (SL) as English Text Message (TL) in Android Mobile Phones
Lukanin Normalization of non-standard words with finite state transducers for russian speech synthesis