JPH07200574A - 仮名漢字変換方法 - Google Patents

仮名漢字変換方法

Info

Publication number
JPH07200574A
JPH07200574A JP5349334A JP34933493A JPH07200574A JP H07200574 A JPH07200574 A JP H07200574A JP 5349334 A JP5349334 A JP 5349334A JP 34933493 A JP34933493 A JP 34933493A JP H07200574 A JPH07200574 A JP H07200574A
Authority
JP
Japan
Prior art keywords
word
likelihood
information
candidate
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5349334A
Other languages
English (en)
Other versions
JP3454895B2 (ja
Inventor
Hiroyasu Nogami
宏康 野上
Yoshimi Saito
佳美 齋藤
Tatsuya Dewa
達也 出羽
Yumi Mizutani
由美 水谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP34933493A priority Critical patent/JP3454895B2/ja
Publication of JPH07200574A publication Critical patent/JPH07200574A/ja
Application granted granted Critical
Publication of JP3454895B2 publication Critical patent/JP3454895B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 変換精度の高い仮名漢字変換方法を提供する
ことを目的とする。 【構成】 本発明の仮名漢字変換方法は、変換対象とし
て入力された仮名情報を仮名漢字混じり文に変換するた
めの仮名漢字変換方法において、仮名情報に対応する漢
字仮名情報および文法情報を参照して、入力された仮名
情報に対応する単語を検索し、文節候補を生成する文節
候補生成ステップと、この生成された文節候補間の修飾
関係を判定する修飾関係判定ステップと、各単語に対し
て該単語と修飾関係または被修飾関係となる単語の文法
情報に基づいて設定された尤度情報と前記修飾関係判定
ステップによる判定結果とに基づいて、前記文節候補の
優先順位を決定する優先順位決定ステップとを有するこ
とを特徴とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、仮名表現で与えられた
日本語文を仮名漢字混じり文に変換するための仮名漢字
変換方法に関する。
【0002】
【従来の技術】近年、日本語文章の読み情報を仮名情報
として入力して、仮名漢字混じりの文章情報に変換する
ための変換手段として、日本語ワードプロセッサが広く
普及している。
【0003】このような日本語ワードプロセッサでは、
キーボードを用いてひら仮名入力もしくはローマ字入力
により文章の読み情報が入力されると、文節および文の
切れ目などを指示する特定キーの操作タイミング、ある
いは仮名情報の入力中に句読点が入力されたり、入力さ
れた文字数があらかじめ定められた文字数を越えた場合
などのタイミングで、それぞれ入力された仮名情報を対
応する仮名漢字混じり表記に変換する処理が行われ、そ
の変換処理結果をCRTなどのディスプレイに表示する
ようにしている。この一連の変換処理および表示が繰り
返されることにより、利用者は所望する文章についての
仮名漢字混じり表記を作成していくことができる。
【0004】このような日本語ワードプロセッサでの仮
名情報の入力を仮名漢字混じりの表記に変換する処理に
おいては、利用者が意図する仮名漢字表記に正確に変換
できることが必要とされる。もし、正確に変換できない
場合には、変換を誤った部分についての修正を、利用者
自らが行わなければならず、その修正には多大な労力が
必要とされる。そのため、仮名漢字変換装置の開発にお
いては、読みを漢字に変換するに際して、その読みに対
応する変換候補のうち、利用者が入力したいと考えてい
る語をいかに第1候補として変換できるかという観点か
ら技術の開発が行われている。
【0005】従来の変換処理においては、日本語には英
語などの言語と異なり単語の「分かち書き」の習慣がな
いことから、まず単語ごとに分割し文節を認定する処理
を行う。次に、上記文節の認定処理で生成された文節候
補から、第1候補を選択する処理を行なう。ここでは、
共起関係の情報やその単語の出現の尤度として頻度情報
等を用いる。
【0006】従来用いられている単語の頻度情報は、そ
の単語と修飾関係あるいは被修飾関係になる文法情報に
基づいて付与されたものではなかった。したがって、文
法的に頻度の低い表現が第1候補として変換されること
を回避することができなかった。その例を図8(a)、
(b)に示す。「かんこう」に対する変換候補には「観
光」「慣行」「感光」等があるが、一般に「観光」は
「慣行」と比較して動詞連体形による修飾を受けにく
い。にもかかわらず、「観光」は「慣行」よりも一般に
は出現頻度が高いため、図8(a)の場合は良いが、
(b)の場合は誤変換を生じていた。
【0007】このような誤りに対しては、従来、共起情
報等により解決を図ってきた。これは、例えば、「繰り
返す−慣行」という関係を予め記憶しておき、変換候補
の中から、この関係にあるものを優先するという方法で
ある。しかしながら、このような共起関係は多種多様
で、その数は非常に多い。今、単語辞書に登録されてい
る語数を10万語とすると、2語のペアは単純計算で1
0万語×10万語=100億ペアとなる。これらの中で
共起関係にあるものは遥かに少ないが、それでも数百万
ないし数千万ペアは存在すると考えられる。したがっ
て、このような多数の組み合わせの可能性を調べ、さら
に、多数のペアを予め共起表として格納しておくこと
は、実際問題として不可能である。
【0008】以上の理由から、従来技術では正しく変換
するのは不十分で、高い変換精度が得られず、利用者に
対し次候補選択を指示する手間と、精神的負担をかける
結果となっていた。
【0009】
【発明が解決しようとする課題】上記したように、従来
の仮名漢字変換においては、その単語と修飾関係あるい
は被修飾関係になる単語の文法情報に基づいた適切な変
換を行うことができないという問題点があった。
【0010】本発明は、上記課題を考慮してなされたも
のであり、各単語に、その単語と修飾関係あるいは被修
飾関係になる単語の文法情報に応じた頻度情報を用いる
ことにより、変換精度の高い仮名漢字変換方法を提供す
ることを第1の目的とする。
【0011】また、前記頻度情報を利用者の入力する文
から学習することで、さらに変換精度の高い仮名漢字変
換方法を提供することを第2の目的とする。
【0012】
【課題を解決するための手段】上記第1の目的を達成す
るために本発明(請求項1)は、変換対象として入力さ
れた仮名情報を仮名漢字混じり文に変換するための仮名
漢字変換方法において、仮名情報に対応する漢字仮名情
報および文法情報を参照して、入力された仮名情報に対
応する単語を検索し、文節候補を生成する文節候補生成
ステップと、この生成された文節候補間の修飾関係を判
定する修飾関係判定ステップと、各単語に対して該単語
と修飾関係または被修飾関係となる単語の文法情報に基
づいて設定された尤度情報と前記修飾関係判定ステップ
による判定結果とに基づいて、前記文節候補の優先順位
を決定する優先順位決定ステップとを有することを特徴
とする。
【0013】また、上記第2の目的を達成するために本
発明(請求項2)は、前記優先順位決定ステップにより
決定された優先順位の最も高い文節候補に替えて、所望
の他の優先順位の文節候補語を変換候補として選択する
変換候補選択ステップと、この操作された単語に対し
て、該単語と修飾関係または被修飾関係にある単語の文
法情報と該単語の尤度情報とを学習する尤度情報学習ス
テップとをさらに有することを特徴とする。
【0014】
【作用】本発明(請求項1)は、各単語に対して、該単
語と修飾関係あるいは被修飾関係となる単語の文法情報
に応じた尤度情報と、文節候補生成ステップにより生成
された文節候補間の修飾関係の判定結果とに基づいて、
文節候補の優先順位を決定する。これにより、文法的に
頻度の低い誤った表現への変換を回避することができ、
仮名漢字変換の精度を向上することができる。
【0015】さらに、本発明(請求項2)によれば、仮
名漢字変換された変換候補について、所望の変換候補を
選択する変換候補選択ステップにより、ユーザによって
操作された単語に対して、該単語と修飾関係あるいは被
修飾関係にある単語の文法情報とともにその単語の尤度
情報を記憶し、その情報をそれ以降の文節候補の優先順
位を決定する際に利用することにより、さらに文法的に
頻度の低い誤った表現への変換を回避することができ
る。
【0016】
【実施例】以下、図面を参照しながら本発明の実施例を
説明する。
【0017】(第1の実施例)図1は、本発明の第1の
実施例に係わる仮名漢字変換装置の概略構成を示すブロ
ック図である。本実施例の仮名漢字変換装置は、入力部
1、単語検索部2、文節候補生成部3、系列候補選択部
4、文節尤度計算部5、修飾関係判定部6、編集制御部
7、出力部8、単語辞書11、付属語辞書12および接
続テーブル13を有する構成となっている。
【0018】図1に示すように、編集制御部7には、入
力部1、単語検索部2、系列候補選択部4および出力部
8が接続されている。また、単語検索部2は、単語辞書
11および付属語辞書12を備えるとともに、文節候補
生成部3に接続されている。この文節候補生成部3は、
接続テーブル13を備えるとともに、系列候補選択部4
に接続されている。また、この系列候補選択部4は文節
尤度計算部5に接続されており、文節尤度計算部5は修
飾関係判定部6に接続されている。
【0019】編集制御部7の処理の概略は、図2に示す
ごとくである。編集制御部7では、入力部1から送られ
てくるキー入力に対し、キーの種別を判定し(ステップ
S21)、変換キーの場合は後述する仮名漢字変換の処
理を行なう(ステップS22)。また、カーソルの移
動、文字列の削除、文節の切り直し、次候補の指示など
の各種の編集コマンドの場合は、それぞれのコマンドに
従って予め決められた動作を行う(ステップS23)。
また、これらの処理の結果に基づいて利用者に提示する
情報を決定し、出力部8へ送る処理を行なう(ステップ
S24)。
【0020】次に、図3を参照して、本実施例の仮名漢
字変換装置における仮名漢字変換処理の概略を説明す
る。図3を参照するに、本実施例における処理は、大き
く分けて2つのものから構成されている。第1の処理
(ステップS31)は、入力される仮名文字列に対し、
自立語と付属語の接続性に関する情報、付属語と付属語
の接続性に関する情報等を用いて文節の範囲を認定する
処理である。この処理は、図1の単語検索部2、文節候
補生成部3での処理に対応する。なお、ここでの処理は
特願平2−62785号に詳しいので、ここでは簡単に
説明する。
【0021】また第2の処理(ステップS12)は、文
節認定処理により文節と認定された各候補に対し、その
第1候補を決定する処理である。本発明は、この第2の
処理を要旨とするものである。ここでの処理は、図1に
示す系列候補選択部4、文節尤度計算部5、修飾関係判
定部6での処理に対応する。
【0022】まず、第1の処理について説明すると、入
力部1から変換対象である読み情報が入力され、順次、
編集制御部7を介して単語検索部2に送られる。単語検
索部2では、単語辞書11、付属語辞書12を参照して
単語候補が抽出される。単語辞書6には、図4および図
5に示すように、自立語の各単語に対する読み41、仮
名漢字表記42、品詞43、尤度情報としてデフォール
トの尤度44、被修飾文法情報に基づく条件45と尤度
46、修飾文法情報に基づく条件47と尤度48、単語
番号49が記憶されている。また、付属語辞書12に
は、図6に示すように、付属語の読み51、当該単語の
文法情報52、付属語番号53がそれぞれ記憶されてい
る。
【0023】単語検索部2で抽出された単語候補は、文
節候補生成部3に送られる。文節候補生成部3では、接
続テーブル13を参照して、単語候補から文節候補を生
成し、結果を系列候補選択部4に送る。接続テーブル1
3には、図7に示すように、自立語と付属語、および付
属語と付属語の接続情報が格納されている。前記図8
(b)における入力(入力文字列2)に対して、図4お
よび図5に示す単語辞書、図6に示す付属辞書、図7に
示す接続テーブルを用いて、特願平2−62785号と
同様の処理を行なって系列候補を生成する。
【0024】この生成された系列候補の構造例を図9に
示す。以下、この構造について説明する。図8(b)に
示す入力例「くりかえすかんこうを」に対する第1の処
理の結果である系列候補の構造の一例が図9の(a)で
ある。この系列候補の構造は、系列番号801、系列尤
度802、文節番号803、被修飾文法情報804、修
飾文法情報805、被修飾文節806、修飾文節80
7、文節尤度808から構成されている。
【0025】系列番号とは系列候補の番号であり、図8
(b)の例では、第1候補「繰り返す観光を」が図9
(a)の系列番号0に、第2候補「繰り返す慣行を」が
系列番号1に、第3候補「繰り返す感光を」が系列番号
2にそれぞれ対応している。
【0026】系列尤度はその系列の尤もらしさを示す情
報であり、値が大きいものほど尤もらしいということを
意味する。
【0027】文節番号とは文節候補の番号であり、図8
(b)の例では、文節「繰り返す」は文節番号0に、文
節「観光」は文節番号1に、文節「慣行」は文節番号2
に、文節「感光」は文節番号3にそれぞれ対応してい
る。
【0028】被修飾文法情報とは修飾を受ける側の単語
の形態的または構文的文法情報であり、例えば、名詞、
動詞など自立語の品詞である。
【0029】修飾文法情報とは修飾する側の文節を構成
する最後尾の単語の形態的または構文的文法情報であ
り、例えば、名詞、動詞の連体形、形容詞の連用形、格
助詞「を」、「の」、過去の助動詞「た」、動詞連体接
続の過去の助動詞「た」などの付属語またはそれをグル
ープ化したものなどである。
【0030】上記例では、文節番号0の「繰り返す」の
場合は、被修飾文法情報は動詞であり、修飾文法情報は
動詞連体形である。また、文節番号1の「観光」、文節
番号2の「慣行」、および文節番号3の「感光」の場合
は、いずれも被修飾文法情報は名詞であり、修飾文法情
報は付属語「を」である。
【0031】被修飾文節は当該単語を修飾している文節
番号を表す。また、修飾文節は当該単語が修飾している
文節番号を表す。これらは、後述する修飾関係判定部6
における処理により判定され記入される。
【0032】文節尤度はその文節の尤もらしさを示す情
報であり、値が大きいものほど尤もらしいということを
意味する。この値は、後述する文節尤度計算部5におけ
る処理により計算され記入される。
【0033】次に、第2の処理について説明する。第1
の処理の結果は、上記したように文節候補生成部3から
系列候補選択部4へ送られてくる。系列候補選択部4で
は、文節候補に対する文節尤度計算部5での計算結果に
基づいて、系列候補から第1候補を選択する。文節尤度
計算部5は文節の尤度を修飾関係判定部6の結果に基づ
いて求める。修飾関係判定部6は、文節間の修飾関係を
修飾関係規則(図15)を参照して判定する。系列候補
選択部4で選択された系列候補は、編集制御部7に渡さ
れ出力部8に表示される。なお、出力部8は、CRTデ
ィスプレイ等の任意の表示装置あるいは印字装置からな
る。
【0034】以下、第2の処理についてさらに詳細に説
明する。
【0035】まず、系列候補選択部4における処理につ
いて説明する。ここでは、系列候補の中から第1候補を
選択し編集制御部7へ送る処理を行なう。図10は、こ
こでの処理の流れを示すフローチャートである。ステッ
プS901で系列を表すiを0にセットする。また、系
列尤度を表すrを処理上許される最低値にセットする。
ステップS902で系列候補数をNにセットする。ステ
ップS903で系列iの尤度をnにセットする。なお、
系列候補iの尤度の求め方については後述する。
【0036】ステップS904でそれまでの系列尤度よ
りも系列候補iの尤度の方が大きい場合は、系列を表す
iの値を保存する(ステップS904、ステップS90
5)。この処理を系列全てに対して行ない(ステップS
906、ステップS907)、終了したらその時点でM
に保存されている、最大尤度の系列候補を、第1候補と
して編集制御部7へ送る処理を行なう。
【0037】例えば、図8(b)の入力の場合は、後述
する処理によって図9(d)の系列尤度の項目に記入さ
れた値の状態になる。つまり、第1系列候補(「繰り返
す観光」)の尤度は8、第2系列候補(「繰り返す慣
行」)の尤度は10、第3系列候補の尤度は5となって
いるので、第1候補として第2系列候補の編集制御部7
へ送る。
【0038】次に、上記系列候補iの尤度の求め方につ
いて説明する。図11は、この処理の流れを示すフロー
チャートである。ステップS1001で系列候補の総文
節数をBにセットする。また、ステップS1002で文
節を表すbを0にセットし、系列尤度を表すrを処理上
許される最低値にセットする。ステップS1003でr
に文節bの尤度を付加する。なお、文節の尤度の求め方
については後述する。この処理を、系列を構成する文節
全てに対して行ない(ステップS1004、ステップS
1005)、終了したらその時点でrに保存されている
尤度の値を系列尤度としてステップS1004に戻る。
【0039】具体的に図8(b)に示す入力例における
各系列候補の系列尤度を求める場合について説明する。
この例の場合は、後述する処理によって図9(c)の文
節尤度の項目に記入された値の状態になっている。第1
系列候補(「繰り返す観光」)の尤度は文節番号0
(「繰り返す」)の文節尤度5と文節番号1(「観
光」)の文節尤度3を足した8となる。第2系列候補
(「繰り返す慣行」)の尤度は文節番号0(「繰り返
す」)の文節尤度5と文節番号2(「慣行」)の文節尤
度5を足した10となる。第3系列候補(「繰り返す感
光」)の尤度は文節番号0(「繰り返す」)の文節尤度
5と文節番号3(「感光」)の文節尤度0を足した5と
なる。
【0040】次に、上記文節尤度の求め方について説明
する。ここでの処理は、文節尤度計算部5における処理
に対応している。図12は、ここでの処理の流れを示す
フローチャートである。ステップS1101で文節を構
成する自立語のデフォールト尤度をrにセットする。ス
テップS1002で自立語の尤度情報の被修飾条件を満
足するかを、後述する修飾関係判定部6の判定結果に基
づいて調べる。満足する場合は、ステップS1103
で、rに被修飾の場合の尤度を付加する。この処理を全
ての被修飾条件に対して行なう(ステップS110
4)。次に、ステップS1105で自立語の尤度情報の
修飾条件を満足するかを調べ、満足する場合は、ステッ
プS1106で、rに修飾の尤度を付加する。この処理
を全ての修飾条件に対して行なう(ステップS110
7)。終了したらその時点でrに保存されている尤度の
値を文節尤度としてステップS1003に戻る。
【0041】具体的に図8(b)に示す入力例における
第1系列候補の文節尤度を求める場合について説明す
る。この例の場合は、後述する処理によって図9(b)
の被修飾文節および修飾文節の項目に値が記入された状
態になっている。
【0042】第1系列候補(「繰り返す観光」)は、文
節番号0「繰り返す」と文節番号1「観光」から構成さ
れている。まず、文節番号0「繰り返す」の尤度を求め
る場合は、当該文節を構成する自立語の尤度情報のデフ
ォールトは5である(図4および図5の項目44参照)
ので、rに5をセットする。当該自立語には被修飾文法
情報に基づく尤度46および修飾文法情報に基づく尤度
48はないので、最終的なrの値である5を文節尤度と
して返す。
【0043】次に、文節番号1「観光」の場合を説明す
る。この場合は、当該文節を構成する自立語の尤度情報
のデフォールトは5であるので、rに5をセットする。
当該自立語の尤度情報として被修飾文法情報に基づく尤
度46は、被修飾文法情報が「動詞連体形」の場合に
「−2」となっている。今回の入力の例において当該文
節の被修飾文節は文節候補0「繰り返す」であり(図9
(b))、この文節の修飾文法情報の項目は動詞連体形
となっている。この「動詞連体形」は、辞書の被修飾文
法情報の条件を満足するため、rに「−2」を付加す
る。その結果として、rは3となる。当該自立語には、
他に被修飾文法情報に基づく尤度46および修飾文法情
報に基づく尤度48はないので、この文節の場合は最終
的に3を返すことになる。
【0044】次に、第2系列候補の文節尤度を求める場
合について説明する。文節番号0「繰り返す」の尤度を
求める場合は、上記した第1系列候補の場合と同様であ
る。文節番号2「慣行」の場合は、当該文節を構成する
自立語の尤度情報のデフォールトは3であるので、rに
3をセットする。当該自立語の尤度情報として被修飾文
法情報に基づく尤度45は、被修飾文法情報が「動詞連
体形」の場合に「+2」となっている。今回の入力の例
において、当該文節の被修飾文法情報は、上記文節番号
1「観光」の場合と同様に動詞連体形となる。この「動
詞連体形」は、辞書の被修飾文法情報の条件を満足する
ため、rに「+2」を付加する。その結果として、rは
5となる。当該自立語には、他に被修飾文法情報に基づ
く尤度46および修飾文法情報に基づく尤度48はない
ので、この文節の場合は最終的に5を返すことになる。
【0045】第3系列候補の第2文節候補3「感光」の
場合は、上記と同様の処理を行ない、「動詞連体形,−
2」の条件を満たすので、この文節の場合は最終的に0
を返すことになる。
【0046】次に、上記修飾関係の求め方について説明
する。ここでの処理は、修飾関係判定部6における処理
に対応している。図13は、この処理の流れを示すフロ
ーチャートである。まず、ステップS1201で、系列
候補数をNにセットする。ステップS1202で、系列
候補を表すiを0に、さらにステップS1203で、系
列候補iの総文節数をBにセットする。次にステップS
1204で、系列候補iの文節を表すbを0にセットす
る。ステップS1205で、文節bに対し、後述するよ
うな修飾先の判定処理を行なう。この処理は、系列候補
を構成する最右文節以外の全文候補に対して行う(ステ
ップS1206、ステップS1207)。この処理が終
了の後、次の系列候補に対し同様の処理を行う。この処
理を全系列候補に対し行う(ステップS1208、ステ
ップS1209)。
【0047】例えば、図8(b)に示す入力例における
第1系列候補に対する修飾関係を求めるためには、第1
系列候補(「繰り返す観光」)は、文節番号0「繰り返
す」と文節番号1「観光」から構成されているので、文
節番号0「繰り返す」の修飾先を判定する処理によって
求めることになる。
【0048】以下、上記文節bの修飾先判定処理(ステ
ップS1205)について説明する。ここでは、各系列
候補を構成する文節に対し修飾関係を調べる。図14
は、ここでの処理の流れを示すフローチャートである。
ステップS1301で、後述する修飾関係判定規則の総
数をRにセットする。ステップS1302で修飾関係規
則を表すrに0をセットする。ステップS1303で、
文節bが規則rの修飾文法条件1401を満足するか
を、図9に示す系列候補情報の修飾文法情報804を参
照することによりチェックする。条件を満たした場合
は、ステップS1305へ進む。条件を満たさなかった
場合は、次の修飾関係規則の適用を試みる。ステップS
1304では、修飾先の文節を表すjにb+1をセット
する。ステップS1305で、規則rの適用範囲内にあ
るかをチェックする。
【0049】範囲内にある場合には、ステップS130
6で文節jの被修飾文法情報が規則rの被修飾文法条件
1402を満足するかをチェックする。満足する場合
は、ステップS1307で、図9に示す系列候補構造中
の文節bの修飾文節807にjを記入し、さらに文節i
の被修台文節806にjを記入する。ステップS130
6で条件を満たさない場合は、修飾先として、系列候補
内の次の文節をチェックする。この処理を、系列候補内
の全ての文節に対して行う(ステップS1308、ステ
ップS1309)。また、ステップS1305で文節j
が規則rの適用範囲外にある場合は、次の修飾関係規則
の適用を試みる。この処理を全規則を適用するまで続行
した後(ステップS1310、ステップS1311)、
ステップS1205に戻る。
【0050】次に、上記修飾関係規則について説明す
る。図15に、修飾関係規則の例を示している。この規
則は、修飾元である単語の文法条件1401、修飾され
る単語の満たすべき文法条件1402、当該規則の適用
範囲1403から構成されている。
【0051】例えば、第1番目の規則は、「形容詞は連
体形で名詞を修飾する。さらに名詞を越えて修飾するこ
とはない。」ということを意味している。第2番目の規
則は、「動詞は連体形で名詞を修飾する。さらに名詞を
越えて修飾することはない。」ということを意味してい
る。第3番目の規則は、「連体詞は名詞を修飾する。さ
らに名詞を越えて修飾することはない。」ということを
意味している。
【0052】ここで、具体的に、図8(b)に示す入力
例における第1系列候補の修飾関係を求める場合につい
て説明する。
【0053】文節番号0「繰り返す」の修飾関係を求め
る場合は、まず、上記修飾関係規則の第1番目の規則に
ついて調査する。文節番号0の修飾文法情報が、この規
則の修飾文法条件である「形容詞連体形」を満足するか
を調べる。文節番号0の修飾文法情報は動詞連体形であ
り(図9(a))満足しないので、この規則の適用は行
なわず次の規則の適用を試みる。文節番号0の修飾文法
情報は、次の規則の修飾文法条件「動詞連体形」を満足
するので、次に1つ右側の文節候補1「観光」が第2の
規則の被修飾文法条件である「名詞」を満足するかを調
べる。文節候補1「観光」の被修飾文法情報は「名詞」
であるので、文節番号0「繰り返す」と文節番号1「観
光」との間には修飾関係が存在することがわかる。そし
て、文節番号0「繰り返す」の修飾文節の項目に文節番
号1(「観光」)を、文節番号1(「観光」)の被修飾
文節の項目に文節番号0(「繰り返す」)を記入してこ
こでの処理を終了する。
【0054】また、残りの系列候補に対しても同様の処
理を行ない、文節番号0「繰り返す」と文節番号2「観
光」の間と、文節番号0「繰り返す」と文節番号3「感
光」の間に修飾関係があることがわかる(図9
(d))。
【0055】前述したように、この情報を用いて文節尤
度、そして系列尤度が求められる。そして、系列候補選
択部4によって第2系列候補「繰り返す慣行」が第1候
補として選択され出力部8で表示されることになる(図
8(d))。
【0056】(第2の実施例)次に、本発明の第2の実
施例について説明する。
【0057】図16は、本実施例に係わる仮名漢字変換
装置の概略構成を示すブロック図である。本実施例の仮
名漢字変換装置は、入力部1、単語検索部2、文節候補
生成部3、系列候補選択部4、文節尤度計算部5、修飾
関係判定部6、編集制御部7、出力部8、尤度情報学習
部9、単語辞書11、付属語辞書12、接続テーブル1
3および尤度情報記憶部14を有する構成となってい
る。
【0058】図16に示すように、編集制御部7には、
入力部1、単語検索部2、系列候補選択部4、尤度情報
学習部9および出力部8が接続されている。また、単語
検索部2は、単語辞書11と付属語辞書12を備えると
ともに、文節候補生成部3に接続されている。この文節
候補生成部3は、接続テーブル13を備えるとともに、
系列候補選択部4に接続されている。この系列候補選択
部4は文節尤度計算部5および尤度情報学習部9に接続
され、文節尤度計算部5には修飾関係判定部6と尤度情
報学習部9が接続されており、尤度情報学習部9は尤度
情報記憶部14を備えている。
【0059】本実施例は、第1の実施例とは、編集制御
部7、尤度情報学習部9、文節尤度計算部5での処理が
異なっているので、これらの処理について説明し、他の
構成要素に関する説明は省略する。
【0060】上記編集制御部7は、利用者から、表示し
た変換結果に対し次候補を指示するキーの入力があった
場合、その単語と現表示候補情報を尤度情報学習部9へ
送る。また、次に出力するデータとして第2系列候補を
系列候補選択部4から得て出力部8へ送る処理を行な
う。
【0061】図21に示す入力側1の場合について、図
8に示す辞書において、尤度情報としてはデフォールト
しかないという前提で説明する。この場合は、第1の実
施例と同様の処理により系列候補の構造は図17(b)
に示すようになり、「繰り返す観光を」が最初に表示さ
れることになる。この表示に対し利用者が「観光」に対
し次候補キーを入力したとする。この場合、編集制御部
7は、「観光」と表示系列候補情報(図17(b))を
尤度情報学習部9に送る。
【0062】次に、尤度情報学習部9における処理につ
いて説明する。ここでは、尤度情報記憶部14に、その
単語の尤度情報をその単語と修飾関係あるいは被修飾関
係にある単語の文法情報とともに記憶する処理を行う。
【0063】ここで、尤度情報記憶部14の構造につい
て説明する。図18(a)にその構造例を示す。この構
造は、単語番号1601、被修飾の条件1602と尤度
1603、修飾の条件1604と尤度1605から構成
されている。尤度情報学習部9での処理の結果は、この
尤度情報記憶部14に記入されることになる。
【0064】図19は、尤度情報学習部9での処理の流
れを示すフローチャートである。
【0065】ステップS1701で、編集制御部7から
送られてくる、利用者に次候補を指示された単語の単語
番号を尤度情報記憶部14の単語番号の項目に記入す
る。ステップS1702で、当該単語の被修飾文節をb
にセットし、ステップS1703で文節bの修飾文法情
報を記憶部の被修飾の条件の項目に記入する。次にステ
ップS1704で、当該単語の修飾文節をbにセット
し、ステップS1705で文節bの被修飾文法情報を記
憶部の修飾の条件の項目に記入し、ここでの処理を終了
する。
【0066】具体的に、図21の入力例1の場合で説明
する。尤度情報記憶部14の単語番号には「観光」に対
する単語番号0003を記入する。「観光」の被修飾文
節「繰り返す」の修飾文法情報は動詞連体形であるの
で、記憶部の被修飾の条件には「動詞連体形」を記入
し、尤度としては、今回は処理上許される最低値を記入
する。以上による処理の結果を図18(b)に示す。
【0067】次に、本実施例における文節尤度計算部5
における処理について説明する。図20は、ここでの処
理の流れを示すフローチャートである。ステップS18
01で尤度記憶部の単語番号の中に、当該単語と一致す
るものがあるかを調べる。一致しない場合はステップS
1101へ進む。一致した場合は、当該単語の被修飾文
法情報が被修飾の条件を満足するかを調べる。満足する
場合にはrに被修飾の場合の尤度をセットする。次にス
テップS1804で当該単語の修飾文法情報が修飾の条
件を満足するかを調べる。満足する場合には修飾の場合
の尤度をrに付加する。ステップS1806で尤度記憶
部の被修飾または修飾の条件を満足したかを調査し、満
足していない場合はステップS1101へ進む。満足し
た場合はステップS1003へ戻る。
【0068】尤度情報記憶部14が図18(b)に示す
状態で、図21の入力例2が入力された場合で説明す
る。図17(c)に示すように、第1系列候補の「見送
る観光」の「観光」に対しては、尤度情報記憶部14の
修飾の条件と一致するので、「観光」の文節尤度は処理
上許される最低値となる。その結果、系列候補選択部4
の処理によって、第1候補として「見送る観光」ではな
く「見送る慣行」が最初に表示されることになる。
【0069】上記処理によって、以降の入力に対し、
「かんこう」は、動詞連体形修飾を受ける場合は「慣
行」が「観光」より優先されて変換されるようになる
が、動詞連体形修飾を受けない場合は「観光」が「慣
行」より優先されて変換される。したがって、学習後
は、「しらべるかんこうを」に対しては「調べる慣行
を」と変換され、「ちかごろはかんこうを」に対しては
「近頃は観光を」と正しく変換することができる(図2
1参照)。
【0070】以上のようにして、上記各実施例において
は、単語に依存して文法的に頻度の低い誤変換を回避す
ることができる。なお、文節候補の優先順位を決定する
場合、当然他の情報も利用することも可能である。ま
た、上記実施例においては、修飾関係規則として修飾関
係のあるものを記述しているが、逆に修飾関係のないも
のを記述しておき、その規則にマッチした時点で修飾先
を持たないとすることも可能である。また、本格的に構
文解析することも当然可能である。反対に非常に簡易に
品詞の並びのパタンで判断することも可能である。ま
た、修飾先を複数持つ場合も系列候補を複数にする(1
つの修飾関係の組み合わせに対して1つの系列候補を対
応させる)等により、全く同様に処理することができ
る。
【0071】また、上記実施例においては、尤度を各語
彙に付加する例を述べたが、この尤度は語彙ではなく修
飾関係に尤度を記述することも当然可能である。また、
学習についても、上記実施例では、利用者から次候補を
指示された単語に対する例を示したが、ユーザが確定し
た単語に対してその尤度を上げるように学習することも
可能である。また尤度の値として処理上許される最低値
を用いたが、その値は適宜設定することも可能である。
【0072】また尤度も正と負の両方の値を用いて説明
したが、正だけあるいは負だけを用いて処理を行なうこ
とも当然可能である。この場合は、抑制または優先の一
方だけの処理となる。
【0073】また、系列候補の作成の際には、他の系列
と共有する文節に対しては当然別々に持つ必要はなく共
有する形で持つことも可能である。また、系列候補の構
造において、修飾文節と被修飾文節は対応するため片方
だけの情報を持つようにしても当然構わない。
【0074】また、上記実施例で各単語に付与した尤度
情報は辞書中に記述したが、必ずしも辞書中である必要
はない。
【0075】要するに、本発明は上記実施例のみなら
ず、その要旨を逸脱しない範囲で種々変形して用いられ
る。
【0076】
【発明の効果】本発明によれば、各単語に対し被修飾関
係または修飾関係にある単語の文法情報に応じた尤度情
報、および修飾関係に関する規則により、各単語に依存
して文法的に頻度の低い表現となる誤変換を回避するこ
とができる。これにより、仮名漢字変換の精度を向上す
ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係わる仮名漢字変換装
置の概略構成を示すブロック図
【図2】図1に示す仮名漢字変換装置の処理の概略を示
すフローチャート
【図3】図1に示す仮名漢字変換装置の処理の概略を示
すフローチャート
【図4】単語辞書に記載される情報の一例を示す図
【図5】単語辞書に記載される情報の一例を示す図
【図6】付属語辞書に記載される情報の一例を示す図
【図7】接続テーブルに記載される情報の一例を示す図
【図8】入力例に対する変換候補の一例を示す図
【図9】系列候補の構造の一例を示す図
【図10】系列候補選択部における処理の流れを示すフ
ローチャート
【図11】系列候補の尤度を求める処理の流れを示すフ
ローチャート
【図12】文節候補の尤度を求める処理の流れを示すフ
ローチャート
【図13】修飾関係判定処理部における処理の流れを示
すフローチャート
【図14】修飾関係規則の適用処理の流れを示すフロー
チャート
【図15】修飾関係規則の一例を示す図
【図16】本発明の第2の実施例に係わる仮名漢字変換
装置の概略構成を示すブロック図
【図17】系列候補の構造の一例を示す図
【図18】尤度情報学習部に記憶される情報の一例を示
す図
【図19】尤度情報学習部における処理の流れを示すフ
ローチャート
【図20】図17の文節尤度計算部における処理の流れ
を示すフローチャート
【図21】入力に対する変換候補の一例を示す図
【符号の説明】
1…入力部、2…単語検索部、3…文節候補生成部、4
…文節候補選択部、5…文節尤度計算部、6…修飾関係
判定部、7…編集制御部、8…出力部、9…尤度情報学
習部、11…単語辞書、12…付属語辞書、13…接続
テーブル、14…尤度情報記憶部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 水谷 由美 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝研究開発センター内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】変換対象として入力された仮名情報を仮名
    漢字混じり文に変換するための仮名漢字変換方法におい
    て、 仮名情報に対応する漢字仮名情報および文法情報を参照
    して、入力された仮名情報に対応する単語を検索し、文
    節候補を生成する文節候補生成ステップと、 この生成された文節候補間の修飾関係を判定する修飾関
    係判定ステップと、 各単語に対して該単語と修飾関係または被修飾関係とな
    る単語の文法情報に基づいて設定された尤度情報と前記
    修飾関係判定ステップによる判定結果とに基づいて、前
    記文節候補の優先順位を決定する優先順位決定ステップ
    とを有することを特徴とする仮名漢字変換方法。
  2. 【請求項2】前記優先順位決定ステップにより決定され
    た優先順位の最も高い文節候補に替えて、所望の他の優
    先順位の文節候補語を変換候補として選択する変換候補
    選択ステップと、 この変換候補選択ステップにおいて操作された単語に対
    して、該単語と修飾関係または被修飾関係にある単語の
    文法情報と該単語の尤度情報とを学習する尤度情報学習
    ステップとをさらに有することを特徴とする請求項1記
    載の仮名漢字変換方法。
JP34933493A 1993-12-28 1993-12-28 仮名漢字変換方法 Expired - Fee Related JP3454895B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34933493A JP3454895B2 (ja) 1993-12-28 1993-12-28 仮名漢字変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34933493A JP3454895B2 (ja) 1993-12-28 1993-12-28 仮名漢字変換方法

Publications (2)

Publication Number Publication Date
JPH07200574A true JPH07200574A (ja) 1995-08-04
JP3454895B2 JP3454895B2 (ja) 2003-10-06

Family

ID=18403080

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34933493A Expired - Fee Related JP3454895B2 (ja) 1993-12-28 1993-12-28 仮名漢字変換方法

Country Status (1)

Country Link
JP (1) JP3454895B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010003227A (ja) * 2008-06-23 2010-01-07 Toshiba Corp 情報処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010003227A (ja) * 2008-06-23 2010-01-07 Toshiba Corp 情報処理装置

Also Published As

Publication number Publication date
JP3454895B2 (ja) 2003-10-06

Similar Documents

Publication Publication Date Title
US8346537B2 (en) Input apparatus, input method and input program
JPH05151260A (ja) 翻訳テンプレート学習方法および翻訳テンプレート学習システム
JP2006164293A (ja) 自動自然言語翻訳
JP3454895B2 (ja) 仮名漢字変換方法
JPH11238051A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
KR950013129B1 (ko) 기계번역장치 및 방법
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JP2002073656A (ja) 異表記正規化処理・異表記展開処理方法および該処理方法による文書検索方法、該処理装置および文書検索装置並びにプログラム記録媒体
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JP3873299B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPH0877157A (ja) 仮名漢字変換方法
JP3386520B2 (ja) 仮名漢字変換装置および方法
JP3700193B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JP3048793B2 (ja) 文字変換装置
JP2580060B2 (ja) かな漢字変換方法及び装置
JP2608384B2 (ja) 機械翻訳装置及びその方法
JP3084864B2 (ja) 文章入力装置
JP3316884B2 (ja) 言語翻訳装置
JPH01185766A (ja) かな漢字変換装置
JPH0773174A (ja) 日本語処理システム
JPH08123806A (ja) 仮名漢字変換方法および仮名漢字変換装置
JPH0546612A (ja) 文章誤り検出装置
JPS6061824A (ja) 文字変換装置
JPH04130577A (ja) 自然言語処理装置
JPH01114973A (ja) 文書作成・校正支援装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080725

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090725

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090725

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100725

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110725

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees