JP3041002B2 - 仮名漢字変換方法及び仮名漢字変換装置 - Google Patents

仮名漢字変換方法及び仮名漢字変換装置

Info

Publication number
JP3041002B2
JP3041002B2 JP1248166A JP24816689A JP3041002B2 JP 3041002 B2 JP3041002 B2 JP 3041002B2 JP 1248166 A JP1248166 A JP 1248166A JP 24816689 A JP24816689 A JP 24816689A JP 3041002 B2 JP3041002 B2 JP 3041002B2
Authority
JP
Japan
Prior art keywords
node
word
value
occurrence data
kanji conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1248166A
Other languages
English (en)
Other versions
JPH03111965A (ja
Inventor
真家 天野
和広 木村
悦雄 伊藤
節 鈴岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1248166A priority Critical patent/JP3041002B2/ja
Publication of JPH03111965A publication Critical patent/JPH03111965A/ja
Application granted granted Critical
Publication of JP3041002B2 publication Critical patent/JP3041002B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、仮名漢字変換処理における同音異義語選択
の容易化・効率化を図った仮名漢字変換方法及び仮名漢
字変換装置に関する。
(従来の技術) 仮名漢字変換は、日本語ワードプロセッサにおける最
も重要な基本技術である。日本語には読みを同じくし、
その漢字表記によって意味を異にする、所謂同音異義語
が多数存在する。この為、読みの情報として与えられる
仮名文字列を単語や句の単位に区切って仮名漢字変換処
理する場合、往々にして複数の仮名漢字変換候補(同音
異義語)が求められる。
しかして従来一般的にはこれらの同音異義語を次々と
表示し、それらの中から適切なものをユーザに選択させ
る方式がとられている。しかし同音異義語が多数ある場
合、ユーザの希望する語が最初に表示されればよいが、
そうでない時は次候補キーの操作により他の候補を次々
と表示させなければならず、その選択に時間が掛かる。
そこで従来では、同音異義語の中で最も最近選択され
た語(句)が次の選択時にも選択される可能性が高いと
云う観点に立脚し、これを最優先の漢字変換候補として
選択することが行われている。この選択法は選択アルゴ
リズムが単純で簡単であり、そのインプリメントの効率
も良いと云う利点を持つ。
しかし同一文章中に同音異義語が存在するような場合
には正しく機能しないと云う問題を有している。例えば
『試行錯誤的に法律を定めることは人々を徒に混乱させ
るだけである。』なる文章情報の入力確定後に「ほうり
つをしこうするには…」なる文章情報を入力した場合、
「しこう」なる読みに対して最も最近選択された語
(句)が『試行』であることから、本来『施行』なる仮
名漢字変換結果を得たいにも拘らず『試行』なる語
(句)が選択されてしまう。
このような欠点を補うものとして、文中での複数の語
(単語や句)間の意味的な結合関係に着目し、これらの
意味的な結合関係を持つ2語を、所謂共起データとして
登録しておき、これを利用して同音異義語選択を行うこ
とが考えられている。例えば「あいつ」なる読みに示さ
れる語(句)についてみれば「熱い」「暑い」「厚い」
等の同音異義語が存在し、「熱い」なる語は「コーヒ
ー」なる語(句)と意味的に強い結合関係を持ち、「熱
い」と「夏」との意味的な結合関係はない。これに対し
て「暑い」なる語は「夏」なる語(句)と意味的に強い
結合関係を持ち、また「厚い」なる語は「友情」なる語
(句)と強い結合関係を持つ。
そこでこのような意味的な結合関係を持つ共起データ
を予め共起表として辞書登録しておき、同音異義語の選
択時にはその共起表にある単語や句を優先して表示した
り、自動選択することが試みられている。このような共
起データを利用することにより、例えば「あついなつ」
なるよみが与えられた場合、「あつい」に対する同音異
義語「熱い」「暑い」「厚い」等のから、「なつ;夏」
を修飾するものとして最大の可能性を与える「暑い」を
最尤候補として表示したり、または「暑い」を自動的に
選択したりすることができる。
然し乍ら、このような語(句)間の共起データの全て
を予め日本語ワードプロセッサ等のシステム内に格納し
ておくことは非常に困難である。
例えば仮名漢字変換辞書に登録されている語数を10万
語とすると、2語のペアは単純計算で10万語×10万語=
100億ペアとなる。これらの中で共起関係にあるものは
遥かに少ないが、それでも数百万乃至数千万ペアは存在
すると考えられる。このような多数の語(句)のペアを
全て共起データとして共起表に予め登録しておくことは
殆ど不可能に近く、しかも膨大な容量のメモリを必要と
する。更には共起データの収集および共起表の作成自体
にも多大な困難が伴い、現実的でない。
(発明が解決しようとする課題) このように従来の仮名漢字変換にあっては、以前に出
現したことのない語(句)の読み情報が与えられたとき
や、共起関係を示すテーブルに登録されていない語
(句)が出現したとき、これを正しく仮名漢字変換(同
音異義語選択)することができないと云う問題があっ
た。しかも共起テーブルの充実化を図るには膨大なメモ
リ容量と手間が掛かると云う問題があった。
本発明はこのような事情を考慮してなされたもので、
その目的とするところは、初めて出現した語(句)や共
起テーブルに記述されていないような語(句)が出現し
た場合であっても、簡易に適切な仮名漢字変換候補を求
めることができ、その変換効率の向上を図ることのでき
る実用性の高い仮名漢字変換方法及び仮名漢字変換装置
を提供することにある。
[発明の構成] (課題を解決するための手段) 本発明に係る仮名漢字変換方法は、仮名漢字変換時に
複数の同音異義語が求められた場合に、共起データ記憶
部を探索して、それぞれの同音異義語に対応する共起デ
ータが登録されているか否かを調べ、前記共起データ記
憶部に前記複数の同音異義語のいずれに対応する共起デ
ータも登録されていなかった場合に、読みを表す第1の
ノードと、これらの第1のノードにより管理されてその
読みに対応する語をそれぞれ示す値付きの第2のノード
と、これらの第2のノードを相互に結合する、これらの
第2のノード間の意味的な距離を示す値を持つリンクと
により構成された語ネットワークを探索し、対象となっ
ている読みを示す第1のノードにより管理されている第
2のノードにリンクを介して結合されている他の第2の
ノードの選択決定状況および該第1のノードにより管理
されている第2のノードの値の大きさに基づき、同音異
義語に対する選択処理を進める第1の手順と、前記語ネ
ットワークを構成する或る第2のノードの示す語が仮名
漢字変換処理時において選択された場合に、該或る第2
のノードの値を増加させるように更新するとともに、値
の更新された第2のノードに前記リンクを介して結合さ
れている他の第2のノードの値を、該更新されたノード
の値と前記リンクの値とに基づいて順次更新することに
よって、前記語ネットワークを管理する第2の手順とを
有することを特徴とする。
また、本発明に係る仮名漢字変換装置は、複数の共起
データを記憶部した共起データ記憶部と、読みを表す第
1のノードと、これらの第1のノードにより管理されて
その読みに対応する語をそれぞれ示す値付きの第2のノ
ードと、これらの第2のノードを相互に結合する、これ
らの第2のノード間の意味的な距離を示す値を持つリン
クとにより構成された語ネットワークと、仮名漢字変換
時に複数の同音異義語が求められた場合に、共起データ
記憶部を探索して、それぞれの同音異義語に対応する共
起データが登録されているか否かを調べる手段と、前記
共起データ記憶部に前記複数の同音異義語のいずれに対
応する共起データも登録されていなかった場合に、前記
語ネットワークを探索し、対象となっている読みを示す
第1のノードにより管理されている第2のノードにリン
クを介して結合されている他の第2のノードの選択決定
状況および該第1のノードにより管理されている第2の
ノードの値の大きさに基づき、同音異義語に対する選択
処理を進める手段と、前記語ネットワークを構成する或
る第2のノードの示す語が仮名漢字変換処理時において
選択された場合に、該或る第2のノードの値を増加させ
るように更新するとともに、値の更新された第2のノー
ドに前記リンクを介して結合されている他の第2のノー
ドの値を、該更新されたノードの値と前記リンクの値と
に基づいて順次更新することによって、前記語ネットワ
ークを管理する手段とを備えたことを特徴とする。
(作用) 本発明によれば、同音異義語が求められた場合に、ま
ず、共起データから確定的に定める同音異義語が存在す
る場合にはこれを選択し、また共起データからはその選
択候補が特定できない場合には語ネットワークから大局
的に選択候補の絞り込みを行うので、その同音異義語選
択を非常に容易にすることが可能となる。
つまり、共起データは2語の関係を非常に密接に結び
つけるものであり強力ではあるが、共起表として全ての
語の関係、および共起程の強い結び付きを持たない語の
関係を表すことは非常に困難である。これに対して、語
ネットワークは、共起データ程に強力に語と語との間の
結び付けを行うことはできないが、より広い範囲での複
数の語間の結び付き関係を示すことが可能である。この
ような共起データと語ネットワークとの互いに異なる性
質を有効に活用することにより、その同音異義語の選択
処理の効率化を図り、且つ尤度の高い仮名漢字変換候補
を効果的に求めることが可能となる。
(実施例) 以下、図面を参照して本発明の一実施例に係る仮名漢
字変換装置について説明する。
第1図は実施例装置の概略構成を示すブロック図であ
る。この第1図において、1は仮名漢字変換処理の対象
となる仮名文字列を入力したり、校正・追加やその他の
各種編集のためのコマンドを入力する為のキーボード等
からなる入力部である。また2は上記入力部1から与え
られた仮名文字列や、後述するように編集制御部3によ
る装置全体の処理制御の下で仮名漢字変換処理された変
換結果,或いは仮名漢字変換処理に用いられる同音異義
語リスト、その他の各種ガイドメッセージ等の表示を行
なう為の各種ディスプレイからなる表示部である。
しかして文節解析部4は、前記入力部1から与えられ
る読みを示す情報(仮名文字列)の中の文節を、文節文
法5や辞書6を参照して解析するもので、また文解析部
7は上記文節解析部4にて解析された文節間の係り受け
関係等を、文法8を参照してその文法的解析を行なうも
のである。
仮名漢字変換部9は上述した文節解析部4および文解
析部7による解析結果を用いて、前述した入力部1から
与えられた仮名文字列を、例えば文節単位に仮名漢字変
換処理し、仮名漢字混じりの文情報に変換するものであ
る。このようにして仮名漢字変換処理された結果が前述
した表示部2にて表示される。
ところで文法的関係判定部11は、上述した仮名漢字変
換処理において或る読みに対して求められた複数の同音
異義語から一つの語が選択されたとき、この被選択語と
他の語との文法的関係、例えば係り受け関係等を前記文
解析部7における文解析結果を利用して検出し、その検
出した文法的関係が特定の関係、即ち、予め文法的関係
表によって設定されている一つまたは複数の文法的関係
に一致するか否かを判定する。編集制御部3はこの文法
的関係判定部11による判定結果に従って、相互に密接な
意味的関係を持つ語(句)の組合わせの関係を共起デー
タとして作成し、これを共起データ記憶部12に逐次蓄積
している。
この共起データ記憶部12に登録される共起データの作
成とその登録手順を第3図に示す処理手続きに従って簡
単に説明する。
読みに対する仮名漢字変換結果に複数の同音異義語が
存在する場合、仮名漢字変換された文の表示において
は、同音異義語の存在する語の部分に、例えばオーバー
ラインが付加されて表示される。この場合、入力部1に
備えられた“次候補キー”を操作することにより、他の
同音異義語へとその表示が次々と変更される。また、例
えば入力部1に備えられた“同音異義語一括表示キー”
が操作された場合には、例えば前記表示部2の表示画面
の下方部に、それらの複数の同音異義語が同音異義語リ
ストとして一括表示される。
しかしてユーザが前記入力部1に備えられた“同音異
義語選択キー”を用いて複数の同音異義語の中から適切
な語を選択すると、編集制御部3はその選択指示された
語(句)を認識する(ステップS1)。すると前記文法的
関係判定部11は、その選択された語(被選択語)と、既
に仮名漢字変換された文中の他の語との間の文法的関係
をそれぞれ検出する(ステップS2)。そしてその検出さ
れた文法的関係が、予め文法的関係表によって設定され
ている所定の文法的関係に一致するか否かを判定する
(ステップS3)。
このステップS3での判定処理の結果、被選択語と他の
語との文法的関係が、予め設定されている文法的関係と
一致していると判定された場合、編集制御部3はその被
選択語の情報と他の語の情報との組を共起データとして
求め、これを共起データ記憶部12に送る。これにより前
記共起データ記憶部12において、上記被選択語と他の語
との組の情報が共起データとして記憶される(ステップ
S4)。
より具体的に説明すると、例えば 『しょうさいなしようをもちいてこんぴゅーたをせっけ
いする。』 なる仮名文字列が入力され、これを文節単位に仮名漢字
変換処理するものとする。この場合には、 例えば 『詳細な[使用]を用いてコンピュータを設計す
る。』 なる仮名漢字変換出力候補が求められ、 [しよう;使用] について複数の同音異義語が存在することが求められ
る。この場合、同音異義語リストとしては、 例えば 『1…枝葉,2…仕様,3…試用,4…私用,〜』 が求められる。
しかして仮名漢字変換された文の表示の中で「使用」
と表示されている部分に当たる適切な語として、「仕
様」がユーザにより選択されたとする。この場合、選択
された「仕様」は「詳細な」という形容動詞で修飾され
ており、また「用いて」という動詞の目的語となってい
る。即ち、この場合の被選択語である「仕様」と、同じ
文中の他の語である「詳細な」・「用いて」との文法的
関係(係り受けの関係)は、それぞれ修飾・目的語の関
係となっている。
文法的関係判定部11は、このような「仕様」と「詳細
な」および「仕様」と「用い」との間の文法的関係を検
出し、これが予め設定された特定の関係にあるかどうか
を判定する。そしてこれらの文法的関係はいずれも文法
的関係表に予め設定されている場合には、編集制御部3
では上記文法的関係判定部11の判定結果に従い、「仕
様」と「詳細な」の組の情報[仕様,詳細な]と、「仕
様」と「用い」の組の情報[仕様,用い]をそれぞれ共
起データとして求め、これを前記共起データ記憶部12に
記憶登録する。
尚、共起データ記憶部12への共起データの登録に際し
ては、上述したように共起データを構成する2語の文字
コードを組として記憶してもよいが、文字コードに付さ
れる辞書IDとよばれる識別番号を組として記憶すること
が望ましい。こうすることにより、「用い」という活用
形は、より一般に原形、或いは語幹で記憶される。
即ち、辞書6には、例えば第4図に示す形式で読みの
情報に対する、見出しや文法情報,更には辞書IDが格納
されている。例えば[仕様,用い]なる語(句)の組を
共起データとして記憶する場合には、これらの語(句)
をそれぞれ特定する辞書ID、つまり「仕様」を示す辞書
ID[13218]と、「用いる」の語幹である「用」を示す
辞書ID[53617]とを組にして第5図に示すように前記
共起データ記憶部12に記憶するようにすればよい。この
ような辞書IDの情報は、上述した各語(句)を示す文字
コード列に比較してはるかにビット数が少ない情報であ
る。従って辞書IDを用いて共起データを記憶することに
より、文字コードを用いて共起データを記憶する場合に
比較して共起データ記憶部12の必要記憶容量を十分少な
くすることが可能となる。また活用する語については、
一般的にその原形の語幹として簡単に記憶することがで
きる。
尚、このようにして共起データ記憶部12に共起データ
を登録するに際しては、例えば第6図に示すように共起
データを構成する2つの辞書IDの組に、両者の文法的関
係を示す情報である2項間関係名を付加するようにして
も良い。
共起データ検索部13は、前述した仮名漢字変換部9に
おいて複数の同音異義語が求められたとき、前記編集制
御部3の指示の下で後述するように共起データ記憶部12
を探索し、同音異義語選択に対する処理を実行する。
一方、語ネットワーク14は、例えば第7図に示すよう
に語(句)にそれぞれ対応するノードをリンクを介して
結合したネットワーク構造を有するもので、前記編集制
御部3に組み込まれているネットワーク管理部にてその
情報内容が管理されている。
語ネットワーク検索部15は、前記仮名漢字変換部9に
て複数の同音異義語が求められたとき、後述するように
前記文節解析部4による解析結果に従って語ネットワー
ク14を参照して読みに対する漢字変換候補を抽出する。
しかして上記語ネットワーク14は基本的には、読みを
表す第1のノード(読みノード)Aと、これらの第1の
ノードAにより管理されてその読みに対応する単語また
は句をそれぞれ示す第2のノード(表現ノード)Bと、
これらの第2のノードBを相互に結合するリンクCとに
より構成される。
第7図に示す例では第1のノードAの読み「しこう」
により管理されている第2のノードBとしては「試行」
…「施行」「施工」が存在し、また第1のノードAの読
み「こうじ」により管理されている第2のノードBとし
ては「工事」「公示」…「高次」が存在し、その他、別
の第1のノードAによりそれぞれ管理されている第2の
ノードBとして「錯誤」「法律」「公布」「告示」「憲
法」「選挙法」「選挙」…等があることが示される。そ
してこれらの第2のノードB中の「施工」と「工事」と
がリンクCを介して結合され、同様にして「試行」と
「錯誤」,「試行」と「法律」,「法律」と「憲法」,
「法律」と「公布」,「法律」と「選挙法」……がそれ
ぞれリンクCを介して結合されていることが示される。
しかして語(句)に対応する第2のノードBは、その
語iの選択の適確性を現す値Oi(例えばスカラー値)を
それぞれ持つ。このノード値Oiは、基本的には同音異義
語の選択がなされた時、その値Oiが高められるもので、
またリンクCを介して結合された第2のノードBの値Oj
が更新されたとき、これに伴って後述するように更新さ
れるようになっている。この第2のノードBの値Oiの更
新は前記編集制御部(ネットワーク管理部)3の管理の
下で連鎖的に行われる。
また複数の第2のノードBを相互に結合するリンクC
は、これらの第2のノードB(語iと語j)間の意味的
な距離を示す値(重み)Wijを持つものである。このリ
ンクCが持つ値Wijは、例えば[0≦Wij≦1.0]として
与えられ、Wij=0,Wij=Wjiとして定義される。このリ
ンクCの値(重み)Wijは、第2のノードBに示される
語iと語jと間の意味的な距離が近い程、つまり共起関
係にある等、語間の関連性が強い程、大きな値として与
えられる。
尚、上記[Wii=0]は表現ノード(語)iにおいて
自らの結合がないことを示しており、また[Wij=Wji
は表現ノード(語)iと表現ノード(語)jとの間のリ
ンク値に方向性がないことを示している。
しかして語iを示す第2のノードBにリンクCを介し
て結合された語jを示す第2のノードBの値Ojは、前記
ネットワーク管理部7の制御により ▲Ot+1 j▼=f(▲nett+1 j▼) ▲nett+1 j▼=δ ▲nett j▼+(1−δ)ΣWji▲Ot i
▼+▲It j▼ *fは上限・下限を持つ単調増加関数 *δは[0≦δ≦1]の定数 *▲It j▼は語jが選択された時にI1 (>0),
選択されない時にI0(<0)なる値をとる制御値 なる処理により更新される。
上記式における有界な単調増加関数fは、ノードの値
jを或る範囲内に抑えておく為のものであり、また第
2式における第1項はノード値Ojの急激な出力変化を
抑える慣性モーメントである。そして第2式における第
2項は隣接ノードの出力値(ノード値)が大きいとき、
自らの出力値(ノード値)を大きくする為の項であり、
また第3項は語が選ばれたとき、その語に対応する第2
のノードの値を大きくし、選択されなかった場合にはそ
のノード値を徐々に小さくする為の項である。
編集制御部3はこのような更新処理を逐次実行し、語
ネットワークにおける第2のノードの値をそのリンク構
造に従って連鎖的に更新する。このノード値の更新処理
は、仮名漢字変換処理とは独立に逐次連鎖的に実行さ
れ、また語の選択がなされる都度、その選択情報に従っ
てノード値を修正しながら実行される。そして仮名漢字
変換処理は、その時点での語ネットワークの状態に応じ
て進められる。
さて前記編集制御部3における同音異義語の選択処理
は基本的には次のようにして実行される。
即ち、編集制御部3は前記仮名漢字変換部9にて複数
の同音異義語が求められたとき、第2図にその基本的な
処理概念を示すように、前記共起データ記憶部12に登録
された共起データを利用してその同音異義語の選択処理
を行う確定的な処理手続き機能Iと、前述した語ネット
ワーク14を用いて同音異義語の選択処理を行う大局的な
処理手続き機能II、および従来より利用されている短期
学習等により同音異義語の選択処理を行う機能IIIを備
え、これらの各機能により得られる同音異義語に対する
選択処理結果を総合的に判断して最も確からしい選択候
補を求めるものとなっている(絞り込み処理IV)。
具体的には、編集制御部3は第8図に示すようにその
処理手続きを進め、複数の同音異義語の中から、その文
中において文法的・意味的に最も適切であると考えられ
る語を最尤候補として選択するものとなっている。この
処理手続きについて説明すると、前記漢字変換部9にお
ける仮名漢字変換処理においてその漢字変換候補が求め
られると(ステップa)、編集制御部3は上記漢字変換
候補が複数の同音異義語を含んで求められているか否か
を判定する(ステップb)。
この判定処理により、漢字変換候補が唯一つ求められ
ていること(同音異義語が存在しないこと)が確認され
た場合には、所謂同音異義語の選択処理が不要であるこ
とから、編集制御部3はその漢字変換候補を仮名漢字変
換結果として確定し、これを前記表示部2にて表示する
(ステップc)。
これに対して漢字変換候補に複数の同音異義語が含ま
れるような場合、編集制御部3は先ず前記共起データ検
索部13を起動し、その同音異義語内の1つについて共起
データ記憶部12を検索する(ステップd)。そしてこの
共起データ記憶部12の検索において、その検索対象とす
る漢字変換候補に該当するものが共起データとして登録
されていることが確認された場合には(ステップe)、
その漢字変換候補を選択の最尤候補として求め、これを
前記表示部2にて表示する(ステップf)。
尚、共起データ記憶部12の検索において、その検索対
象とする漢字変換候補に該当するものが登録されていな
いことが確認された場合には、前述した同音異義語の中
の次の漢字変換候補について同様にして前記共起データ
記憶部12の検索を行う。そしてこの処理を、該当する漢
字変換候補が共起データとして求められるまで、その同
音異義語の全てに対して繰り返し実行する(ステップ
g)。
しかして共起データ記憶部12から前述した複数の同音
異義語のいずれに対しても、これに該当する共起データ
が存在しないことが確認された場合には、編集制御部3
は共起データ記憶部12が持つ共起データからは、同音異
義語に対する選択処理が行えないと判断する。そしてこ
の場合には、次に前記語ネットワーク検索部15を起動
し、前記語ネットワーク14を用いた同音異義語選択の処
理を実行する。
この語ネットワーク14を用いた同音異義語選択の処理
は、前記複数の同音異義語の中の1つについて語ネット
ワーク14を検索し、リンクを介してその語に結合されて
いる他の語が既に選択決定されているか否か、またその
語に対して既に選択決定されている他の語が幾つリンク
されている調べることによりなされる(ステップh)。
この際、そのノード値を調べてその漢字変換候補の適確
性を同時に判断することも勿論可能である。
しかしてこのような語ネットワーク14の検索により、
検索対象とする漢字変換候補に該当する語が語ネットワ
ーク14内に存在したか否かを調べ(ステップi)、該当
する語が見出された場合には、その漢字変換候補を選択
の最尤候補として求め、これを前記表示部2にて表示す
る(ステップf)。そして語ネットワーク14から該当語
が見出されなかった場合には、前記同音異義語の中の次
の漢字変換候補について同様に語ネットワーク14の検索
処理を実行する。そして同音異義語の全てについて語ネ
ットワーク14を検索しても該当語が見出されなかった場
合には(ステップj)、前述した共起データ記憶部12に
対する検索にも失敗していることから、他の手法による
同音異義語選択処理に委ねる。
この場合には、例えば最も最近選択された語と同じも
のを選択する、所謂短期学習法等を導入してその同音異
義語の選択処理を実行する。
即ち、本装置では、仮名漢字変換処理の過程で逐次求
められて共起データ記憶部12に登録される共起データを
参照することで、そのデータ数としては少ないが漢字変
換候補の選択を行う上で確定的な強い結合関係を持つ共
起データを有効に利用して複数の同音異義語の中から適
切な漢字変換候補を選択処理する。そしてこの共起デー
タを利用した同音異義語の選択処理に失敗した場合に
は、共起データほど強い結合関係を示さないが、大局的
に他の語との間のある程度の結合関係を示す語ネットワ
ーク14の参照により、確からしい漢字変換候補を幅広く
求め、これに基づいて漢字変換候補を求めている。そし
てこの語ネットワーク14を用いた同音異義語の選択処理
にも失敗したときに始めて、従来より種々提唱されてい
る手法を用いて同音異義語の選択処理を行うものとなっ
ている。
これ故、複数の語間の関係を非常に密接に結び付ける
が、全ての語間の関係を現すことが困難な共起データ
と、逆に全ての語間の関係を幅広く効果的に現し得るが
その語間の特定の結び付き関係だけを強く現すことが困
難な語ネットワーク14が持つ性質を相互に有効に活用
し、且つそれらが持つ欠点を相互に補完しながら効率的
に同音異義語の選択処理を行うことが可能となる。
この結果、同音異義語の選択処理を容易に行い、適切
な漢字変換候補を提示してオペレータによる同音異義語
の訂正処理の負担を大幅に軽減することができる等の実
用上多大なる効果が奏せられる。
尚、本発明は第2図にその処理概念を示すように、共
起データを用いた確定的な同音異義語選択と、語ネット
ワークを用いた大局的な同音異義語選択とを行ってその
選択処理の効率かを図るものであり、その処理アルゴリ
ズムは種々変形可能である。例えば第8図に示す実施例
では、共起データを用いた確定的な同音異義語の選択処
理を実行し、これに失敗したときに語ネットワークを用
いた大局的な同音異義語の選択処理を実行するようにし
たが、これを逆の順序で実行するようにしても勿論良
い。この場合には、大局的な同音異義語の選択処理によ
り漢字変換候補の絞り込みを行った後、その漢字変換候
補が確定的に選択されるか否かの判定が行われることに
なる。
また語ネットワーク14を用いた同音異義語の選択処理
と、共起データを用いた同音異義語の選択処理とを並行
に実行し、これらの処理結果を所定の重み付けの下で総
合的に判断して漢字変換候補の選択を行うようにしても
良い。このようにすれば、その処理負担が多少増えるも
のの、より正確に、しかも高速に同音異義語に対する選
択処理を実行することが可能となる。その他、本発明は
その要旨を逸脱しない範囲で種々変形して実施すること
ができる。
[発明の効果] 以上説明したように本発明によれば、局部的ではある
が語間の意味的な強い結合関係を示すデータと、特定の
語間の結合関係についてはさほど強く現さないが、むし
ろ多くの語について幅広くその結合関係を示す語ネット
ワークとを用いることにより、これらのデータの性質を
相互に効果的に補完しながら複数の同音異義語に対する
選択処理を効率的に行うことができる。この結果、適切
な漢字変換候補を効率的に選び、これをユーザ(オペレ
ータ)に提示することができるので、同音異義語を持つ
漢字変換候補に対する次候補表示等の煩わしさを大幅に
軽減し、漢字変換処理を伴う日本語処理を非常に簡易な
ものとすることができる等の実用上多大なる効果が奏せ
られる。
【図面の簡単な説明】
図は本発明の一実施例に係る仮名漢字変換装置について
示すもので、第1図は実施例装置の要部概略構成を示す
ブロック図、第2図は実施例装置における同音異義語選
択の基本的な処理概念を示す図、第3図は実施例装置で
用いられる共起データの作成手順の一例を示す図、第4
図は仮名漢字変換に用いられる辞書の例を示す図、第5
図および第6図はそれぞれ共起データ記憶部に記憶され
る共起データの構造例を示す図、第7図は実施例装置で
用いられる語ネットワークの構成例を示す図、第8図は
実施例装置における同音異義語の選択処理手続きの流れ
を示す図である。 1…入力部、2…表示部、3…編集制御部、9…仮名漢
字変換部、11…文法的関係判定部、12…共起データ記憶
部、13…共起データ検索部、14…語ネットワーク、15…
語ネットワーク検索部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鈴岡 節 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝総合研究所内 (56)参考文献 特開 平1−229364(JP,A) 特開 昭55−102072(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/22

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】仮名漢字変換時に複数の同音異義語が求め
    られた場合に、共起データ記憶部を探索して、それぞれ
    の同音異義語に対応する共起データが登録されているか
    否かを調べ、 前記共起データ記憶部に前記複数の同音異義語のいずれ
    に対応する共起データも登録されていなかった場合に、
    読みを表す第1のノードと、これらの第1のノードによ
    り管理されてその読みに対応する語をそれぞれ示す値付
    きの第2のノードと、これらの第2のノードを相互に結
    合する、これらの第2のノード間の意味的な距離を示す
    値を持つリンクとにより構成された語ネットワークを探
    索し、対象となっている読みを示す第1のノードにより
    管理されている第2のノードにリンクを介して結合され
    ている他の第2のノードの選択決定状況および該第1の
    ノードにより管理されている第2のノードの値の大きさ
    に基づき、同音異義語に対する選択処理を進める第1の
    手順と、 前記語ネットワークを構成する或る第2のノードの示す
    語が仮名漢字変換処理時において選択された場合に、該
    或る第2のノードの値を増加させるように更新するとと
    もに、 値の更新された第2のノードに前記リンクを介して結合
    されている他の第2のノードの値を、該更新されたノー
    ドの値と前記リンクの値とに基づいて順次更新すること
    によって、前記語ネットワークを管理する第2の手順と
    を有することを特徴とする仮名漢字変換方法。
  2. 【請求項2】複数の共起データを記憶部した共起データ
    記憶部と、 読みを表す第1のノードと、これらの第1のノードによ
    り管理されてその読みに対応する語をそれぞれ示す値付
    きの第2のノードと、これらの第2のノードを相互に結
    合する、これらの第2のノード間の意味的な距離を示す
    値を持つリンクとにより構成された語ネットワークと、 仮名漢字変換時に複数の同音異義語が求められた場合
    に、共起データ記憶部を探索して、それぞれの同音異義
    語に対応する共起データが登録されているか否かを調べ
    る手段と、 前記共起データ記憶部に前記複数の同音異義語のいずれ
    に対応する共起データも登録されていなかった場合に、
    前記語ネットワークを探索し、対象となっている読みを
    示す第1のノードにより管理されている第2のノードに
    リンクを介して結合されている他の第2のノードの選択
    決定状況および該第1のノードにより管理されている第
    2のノードの値の大きさに基づき、同音異義語に対する
    選択処理を進める手段と、 前記語ネットワークを構成する或る第2のノードの示す
    語が仮名漢字変換処理時において選択された場合に、該
    或る第2のノードの値を増加させるように更新するとと
    もに、値の更新された第2のノードに前記リンクを介し
    て結合されている他の第2のノードの値を、該更新され
    たノードの値と前記リンクの値とに基づいて順次更新す
    ることによって、前記語ネットワークを管理する手段と
    を備えたことを特徴とする仮名漢字変換装置。
JP1248166A 1989-09-26 1989-09-26 仮名漢字変換方法及び仮名漢字変換装置 Expired - Lifetime JP3041002B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1248166A JP3041002B2 (ja) 1989-09-26 1989-09-26 仮名漢字変換方法及び仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1248166A JP3041002B2 (ja) 1989-09-26 1989-09-26 仮名漢字変換方法及び仮名漢字変換装置

Publications (2)

Publication Number Publication Date
JPH03111965A JPH03111965A (ja) 1991-05-13
JP3041002B2 true JP3041002B2 (ja) 2000-05-15

Family

ID=17174200

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1248166A Expired - Lifetime JP3041002B2 (ja) 1989-09-26 1989-09-26 仮名漢字変換方法及び仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JP3041002B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160002482U (ko) 2016-02-17 2016-07-14 (주)엔티코리아 액체 용기용 뚜껑

Also Published As

Publication number Publication date
JPH03111965A (ja) 1991-05-13

Similar Documents

Publication Publication Date Title
JP2007226729A (ja) 訳語情報出力処理プログラム,処理方法および処理装置
JPH0424869A (ja) 文書処理システム
JPH10232883A (ja) 多言語対応文書検索システム
JPH05314166A (ja) 電子化辞書および辞書検索装置
US20050065947A1 (en) Thesaurus maintaining system and method
JP2633824B2 (ja) 仮名漢字変換装置
JPH08129554A (ja) 関係表現抽出装置および関係表現検索装置
JP3041002B2 (ja) 仮名漢字変換方法及び仮名漢字変換装置
JP3937741B2 (ja) 文書の標準化
US20040054677A1 (en) Method for processing text in a computer and a computer
JPH07244665A (ja) 機械翻訳システム用辞書・ルール学習方法及び機械翻訳システム用辞書・ルール学習装置
KR20020059555A (ko) 자연어 질의 응답 검색 엔진 및 검색 방법
JPH06266770A (ja) 文書情報検索装置及び検索装置及び機械翻訳装置及び文書作成装置
JPH0793345A (ja) 文書検索装置
JP2783597B2 (ja) 仮名漢字変換装置
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JP2003173338A (ja) 辞書構築支援装置、辞書構築支援方法及び辞書構築支援プログラム
JPH04290158A (ja) 文書作成装置
JPH05101094A (ja) 辞書検索制御方法
JPH04281558A (ja) 文書検索方法および装置
JPH0232467A (ja) 機械翻訳方式
JP5454871B2 (ja) 辞書評価支援装置およびプログラム
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPH03161865A (ja) 文章の検索方法
JPH0668160A (ja) 情報検索方式