JP2783597B2 - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JP2783597B2
JP2783597B2 JP1157159A JP15715989A JP2783597B2 JP 2783597 B2 JP2783597 B2 JP 2783597B2 JP 1157159 A JP1157159 A JP 1157159A JP 15715989 A JP15715989 A JP 15715989A JP 2783597 B2 JP2783597 B2 JP 2783597B2
Authority
JP
Japan
Prior art keywords
node
value
word
reading
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1157159A
Other languages
English (en)
Other versions
JPH0322167A (ja
Inventor
節 鈴岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1157159A priority Critical patent/JP2783597B2/ja
Publication of JPH0322167A publication Critical patent/JPH0322167A/ja
Application granted granted Critical
Publication of JP2783597B2 publication Critical patent/JP2783597B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は仮名漢字変換処理における同音異義語選択を
効率的に行い得る仮名漢字変換装置に関する。
(従来の技術) 近時、日本語処理技術の発展が目覚ましく、入力され
た読み情報を適宜漢字変換して仮名漢字混じりの日本語
文章を作成していく日本語ワードプロセッサが種々開発
され、オフィス業務のみならずパーソナル分野にも幅広
く普及している。
このような日本語ワードプロセッサにおける重要な技
術に同音異義語選択がある。この同音異義語選択(漢字
変換候補の提示)は、読みを同じくする単語や句が多く
存在すると云う日本語特有の性質に対処するもので、従
来一般的には選択頻度の短期学習や近接単語間の共起を
利用して行われている。
この選択頻度の短期学習は、同音異義語の中で最も最
近選択された語(句)が次の選択時にも選択される可能
性が高いとして、これを最優先の漢字変換候補として提
示するものである。例えば『法律を施行する。』なる文
書情報が入力確定された後、「しこうびは…」なる文書
情報を与えて仮名漢字変換するとき、「しこう」なる読
みに対して最も最近選択された語が『施行』であること
から、「しこうびは」の「施行」について『施行』を選
択するものである。このような短期学習による同音異義
語選択は、その選択アルゴリズムが単純で簡単であり、
インプリメントの効率も良いと云う利点を持つ。
しかし同一文章中に同音異義語が存在するような場合
には正しく機能しないと云う問題を有している。例えば
『試行錯誤的に法律を定めることは人々を徒に混乱させ
るだけである。』なる文章情報の入力確定後に「ほうり
つをしこうするには…」なる文章情報を入力した場合、
「しこう」なる読みに対して最も最近選択された語
(句)が『試行』であることから、本来『施行』なる仮
名漢字変換結果を得たいにも拘らず『試行』なる語
(句)が選択されてしまう。
このような選択頻度の短期学習が持つ欠点を補うもの
として上述した近接単語間の共起関係を利用した同音異
義語選択がある。この方式は、或る単語が出現したと
き、これに関連して出現しやすい単語を共起関係にある
単語として選択するものである。例えば「あつい」なる
読みに示される語(句)についてみれば、『厚い』と
『友情』,『熱い』と『コーヒー』,『暑い』と『夏』
とがそれぞれ共起関係にあると云える。このような共起
関係にある単語(句)の情報を予め蓄えておくことによ
り、その一方が出現したとき、他方の単語(句)も出現
すると予測して仮名漢字変換(同音意義語選択)を行う
ものである。従って「あついなつ」なる読みが与えられ
た場合、上述した共起関係を利用することにより『厚い
夏』ではなく『暑い夏』が選択されることになる。
前述した例では、『施行』と『錯誤』,『法律』と
『施行』とがそれぞれ共起関係にあることから、その直
前に『試行錯誤的に法律を…』なる語が入力確定されて
いたとしても「ほうりつをしこうするには…」に対して
「法律を施行するには…」なる同音意義語選択による仮
名漢字変換が正しく行われることになる。
然し乍ら、このような手法を採用するには、場当り的
に大量の共起関係情報をテーブルとして予め登録してお
く必要があり、膨大なメモリの容量を必要とすると云う
不具合がある。またテーブルに共起関係として登録され
ていない語については全く無力であると云う問題があ
る。例えば法律に関する文章の作成時にあって、「しこ
うびは4がつ11にちとする。』なる文章情報が与えら
れ、「しこう」なる読み情報が初めて与えられた場合に
は、今迄に「しこう」についての仮名漢字変換(同音意
義語選択)がなされていないこと、また近接語として
「しこう」と共起関係にある語(句)がないことから、
これを正しく仮名漢字変換(同音意義語選択)すること
ができないと云う不具合が生じる。
(発明が解決しようとする課題) このように従来の仮名漢字変換にあっては、以前に出
現したことのない語(句)の読み情報が与えられたとき
や、共起関係を示すテーブルに登録されていない語
(句)が出現したとき、これを正しく仮名漢字変換(同
音意義語選択)することができないと云う問題があっ
た。しかも共起テーブルの充実化を図るには膨大なメモ
リ容量と手間が掛かると云う問題があった。
本発明はこのような事情を考慮してなされたもので、
その目的とするところは、初めて出現した語(句)や共
起テーブルに記述されていないような語(句)が出現し
た場合であっても、簡易に適切な仮名漢字変換候補を求
めることができ、その変換効率の向上を図ることのでき
る実用性の高い仮名漢字変換装置を提供することにあ
る。
[発明の構成] (課題を解決するための手段) 本発明に係る仮名漢字変換装置は、読みを表す第1の
ノードにより管理されてその読みに対応する単語または
句をそれぞれ示す、語選択に利用される値を持つ第2の
ノードと、これらの第2のノードを相互に結合し、これ
らの第2のノード間の意味的な距離を示す値を持つリン
クとにより構成された語ネットワークを備え、 この語ネットワークを、上記第2のノードの値を単語
または句に対する選択結果に従って順次更新すると共
に、値が更新された第2のノードに前記リンクを介して
接続されている第2のノードの値を上記更新されたノー
ドの値と前記リンクの値とに基づいて順次連鎖的に更新
して管理し、 同じ読みの語句の選択時には、その読みを示す第1の
ノードにより管理されている第2のノードの値が大きい
順に、その第2のノードが示す単語または句を当該読み
に対する変換候補として出力するようにしたことを特徴
とするものである。
また或いは上記各第2のノードの値にそれぞれ所定の
評価関数を作用させ、この評価関数を作用させた値が大
きい順に、その第2のノードが示す単語または句を当該
読みに対する変換候補として出力するようにしたことを
特徴とするものである。
(作 用) 本発明によれば、語ネットワークにより同音異義語の
それぞれが第2のノードにより管理され、且つ第2のノ
ードの値によりその選択の適確性が管理されている。そ
の上で、これらの第2のノード間を結合するリンクによ
り、それらの意味的な距離を示す値が付与され、同音異
義語選択がなされて或る第2のノードの値が更新された
とき、前記リンクを介して連鎖的に上記語ネットワーク
を構成している第2のノードの値がそれぞれ更新され
る。
このような連鎖的なノード値の更新により、或る語
(句)の選択に従ってこれに関連する語(句)のノード
値がリンクを介して更新されるので、共起関係にない語
(句)が与えられた場合であっても、また初めて出現し
た語(句)であっても、既に選択された語(句)に関連
している語(句)のノード値が、例えば第2のノードか
らリンクを多重に介して更新されていることから、その
語(句)に対する選択性が高められることになる。
この結果、読みを同じくする語(句)のノード値に従
い、或いはこれらのノード値に所定の評価関数を作用さ
せた値に従い、その変換候補の出力順序を決定すること
で効率的に適確な語(句)の変換出力(仮名漢字変換)
を行うことが可能となる。
(実施例) 以下、図面を参照して本発明の一実施例に係る仮名漢
字変換装置について説明する。
第1図は実施例装置の要部概略構成図で、1はCPUや
種々のメモリ等によって構成される仮名漢字変換処理部
本体である。仮名漢字変換による日本語文章作成は、こ
の仮名漢字変換処理部本体1に対して、キーボード等の
入力装置1を介して文章情報(読みの情報)や語選択の
指示情報等の制御情報を入力しながら、ディスプレイ等
の出力装置3にて上記仮名漢字変換処理部本体1による
処理結果等を提示出力しながら行われる。
しかしてこの実施例装置における仮名漢字変換処理部
本体1が特徴とするところは、前記入力装置2から与え
られる文章情報(読みの情報)を形態素解析してその文
節構造等を求める形態素解析部5等の一般的な日本語処
理機能を備えると共に、語ネットワーク装置6を備えて
いる点にある。この語ネットワーク装置6は、例えば第
2図に示すように語や句にそれぞれ対応するノードをリ
ンクを介して結合したネットワーク構造を有するもの
で、ネットワーク管理部7にてその情報内容が管理され
ている。
変換処理部本体1は入力文章情報に対する前記形態素
解析部5による解析結果に従い、語ネットワーク装置6
を参照して読みに対する漢字変換候補を抽出し、これを
前記出力装置3を介して出力する。ユーザは前記入力装
置2から与えた文章情報(読みの情報)についての仮名
漢字変換候補を出力装置3から得、ここに提示出力され
る仮名漢字変換候補に対して、前記入力装置2から選択
指示の情報、或いは次候補の提示出力要求を与えながら
仮名漢字変換による日本語文章の作成処理を進めていく
ことになる。
ところで上記語ネットワーク装置6は次のように構成
されている。この語ネットワークは、読みを表す第1の
ノード(読みノード)Aと、これらの第1のノードAに
より管理されてその読みに対応する単語または句をそれ
ぞれ示す第2のノード(表現ノード)Bと、これらの第
2のノードBを相互に結合するリンクCとにより構成さ
れる。
第2図に示す例では第1のノードAの読み「しこう」
により管理されている第2のノードBとしては「試行」
…「施行」「施工」が存在し、また第1のノードAの読
み「こうじ」により管理されている第2のノードBとし
ては「工事」「公示」…「高次」が存在し、その他、別
の第1のノードAによりそれぞれ管理されている第2の
ノードBとして「錯誤」「法律」「公布」「告示」「憲
法」「選挙法」「選挙」…等があることが示される。そ
してこれらの第2のノードB中の「施工」と「工事」と
がリンクCを介して結合され、同様にして「試行」と
「錯誤」,「試行」と「法律」,「法律」と「憲法」,
「法律」と「公布」,「法律」と「選挙法」……がそれ
ぞれリンクCを介して結合されていることが示される。
しかして語(句)に対応する第2のノードBは、その
語iの選択の適確性を現す値Oi(例えばスカラー値)を
それぞれ持つ。このノード値Oiは、基本的には同音異義
語選択された時、その値Oiが高められるもので、またリ
ンクCを介して結合された第2のノードBの値Ojが更新
されたとき、これに伴って後述するように更新されるよ
うになっている。この第2のノードBの値Oiの更新は前
記ネットワーク管理部7の管理の下で連鎖的に行われ
る。
また複数の第2のノードBを相互に結合するリンクC
は、これらの第2のノードB(語iと語j)間の意味的
な距離を示す値(重み)wijを持つものである。このリ
ンクCの値wijは、例えば[0≦wij≦1.0]として与え
られ、wij=0,wij=wjiとして定義される。このリンク
Cの値(重み)wijは、第2のノードBに示される語i
と語jと間の意味的な距離が近い程、つまり共起関係に
ある等、語間の関連性が強い程、大きな値として与えら
れる。
尚、上記[wii=0]は表現ノード(語)iにおいて
自らの結合がないことを示しており、また[wij=wji
は表現ノード(語)iと表現ノード(語)jとの間のリ
ンク値に方向性がないことを示している。
しかして語iを示す第2のノードBにリンクCを介し
て結合された語jを示す第2のノードBの値Ojは、前記
ネットワーク管理部7の制御により なる処理により更新される。
上記第1式における有界な単調増加関数fは、ノード
の値Ojを或る範囲内に抑えておく為のものであり、また
第2式における第1項はノード値Ojの急激な出力変化を
抑える慣性モーメントである。そして第2式における第
2項は隣接ノードの出力値(ノード値)が大きいとき、
自らの出力値(ノード値)を大きくする為の項であり、
また第3項は語が選ばれたとき、その語に対応する第2
のノードの値を大きくし、選択されなかった場合にはそ
のノード値を徐々に小さくする為の項である。
ネットワーク管理部7はこのような更新処理を逐次実
行し、語ネットワークにおける第2のノードの値をその
リンク構造に従って連鎖的に更新する。このノード値の
更新処理は、語ネットワーク装置6を用いた仮名漢字変
換処理とは独立に逐次連鎖的に実行され、また語の選択
がなされる都度、その選択情報に従ってノード値を修正
しながら実行される。そして仮名漢字変換処理は、その
時点での語ネットワークの状態に応じて進められる。
このような語ネットワークを用いた仮名漢字変換処理
は、前記形態素解析部5によって解析された語の読み情
報が与えられたとき、その読みを示す第1のノードAに
より管理されている第2のノードBの各値を調べ、例え
ばノード値の最も大きいノードBに示される語(句)を
前記読みに対する漢字変換候補として出力することによ
り行われる。このようにして出力した漢字変換候補に対
して次候補の出力要求がなされた場合には、その次にノ
ード値の大きい語(句)が漢字変換候補として出力され
る。
尚、ノード値を直接的に比較することに変えて、例え
ば各ノード値に所定の評価値を作用させ、この評価値を
作用させた値を比較して漢字変換候補の選択を行うよう
にしても良い。このような所定の評価値を作用させるこ
とは、例えば各ノード値がベクトルで示されるような場
合、その値を相互に比較するのに有用である。具体的に
はベクトルで示されるノード値に評価関数を作用させて
各ノードの距離値を求めれば、その相互比較を容易に行
うことが可能となる。
またノード値がスカラー値として与えられる場合であ
っても、所定の評価関数を作用させることによって各ノ
ード値の差異を明確にすることができるので、同音異義
語選択の判定を簡易に確実に行わせることが可能とな
る。
かくしてこのような語ネットワークを用いて仮名漢字
変換処理を実行する本装置によれば、既に選択された語
(句)に関連してその他の語(句)のノード値が連鎖的
に更新されるので、選択された語(句)に対する選択性
を高めると共に、共起関係にある語(句)に対する選択
性を高めることのみならず、選択された語(句)に関連
の在る語(句)についての選択性をも効果的に高めるこ
とができる。そして関連性の低い語(句)についての選
択性が徐々に低減されていく。この結果、初めて出現し
た読みに対しても、また共起関係にない読みが与えられ
た場合にであっても、既に選択されている語(句)の情
報に関連して適切な語(句)を漢字変換候補として選択
することが可能となり、その仮名漢字変換処理効率の向
上を図ることが可能となる。
具体的には、第2図において「公布」や「選挙法」と
いった語(句)が既に選択されている場合には、これら
の語(句)についてのノード値がそれぞれ高められ、こ
れに関連してこれらの語(句)に近い概念の語(句)で
ある「法律」や「施行」についてのノード値も高められ
ているので、「しこう」なる読み情報が初めて与えら
れ、且つこれに共起関係にある語(句)が出現していな
い場合であっても、「施行」なる漢字変換候補を適確に
選択して変換候補出力することが可能となる。
またこのような語ネットワークを構築しておくことに
より、従来のような共起関係テーブルをわざわざ作成し
ておく必要がなくなる。しかも共起関係にない語(句)
間についても、例えば複数のリンクCを介して結合され
る関連性のある語としてその意味的な距離関係を示すこ
とができるので、複雑な関係構造を持つ語(句)の構造
的な情報を効果的に示し、同音異義語選択の適確性を高
めることが可能となる。これ故、同音異義語選択を容易
化し、仮名漢字変換処理の効率を大幅に向上させること
が可能となる。
尚、本発明は上述した実施例に限定されるものではな
い。例えば語ネットワークの構成は日本語処理システム
の仕様に応じて構築すれば良いものであり、ノード値の
設定やリンク値の設定、およびノード値の更新処理手続
き等もその仕様に応じて定めれば良い。またノード値に
従う変換候補の出力制御についても、そこで用いる評価
関数等は仕様に応じて定めれば良いものである。その
他、本発明はその要旨を逸脱しない範囲で種々変形して
実施することができる。
[発明の効果] 以上説明したように本発明によれば、語ネットワーク
における語(句)のノード値に従って同音異義語選択を
行うので、初めて出現した読みや、共起関係にある語を
持たない読みが与えられた場合であっても、既に選択さ
れた語(句)の情報に従って適切な語(句)を効果的に
変換候補として求めていくことができ、その漢字変換効
率の向上を図ることができる。しかも従来の仮名漢字変
換処理における不具合を解消した効率的な仮名漢字変換
処理を実現し得る等の実用上多大なる効果が奏せられ
る。
【図面の簡単な説明】
第1図は本発明の一実施例に係る仮名漢字変換装置の要
部概略構成図、第2図は実施例装置で用いられる語ネッ
トワークの構成例を示す図である。 1……仮名漢字変換処理部本体、2……入力装置、3…
…出力装置、5……形態素解析部、6……語ネットワー
ク装置、7……ネットワーク管理部、A……第1のノー
ド(読みノード)、B……第2のノード(表現ノー
ド)、C……リンク。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】読みを表す第1のノードと、これらの第1
    のノードにより管理されてその読みに対応する単語また
    は句をそれぞれ示す値付きの第2のノードと、これらの
    第2のノードを相互に結合し、これらの第2のノード間
    の意味的な距離を示す値を持つリンクとにより構成され
    た語ネットワークを備え、 上記第2のノードの値を単語または句に対する選択結果
    に従って更新すると共に、値が更新された第2のノード
    に前記リンクを介して接続されている第2のノードの値
    を上記更新されたノードの値と前記リンクの値とに基づ
    いて順次更新して前記語ネットワークを管理し、 同じ読みの語句の選択時には、その読みを示す第1のノ
    ードにより管理されている第2のノードの値が大きい順
    に、その第2のノードが示す単語または句を当該読みに
    対する変換候補として出力することを特徴とする仮名漢
    字変換装置。
  2. 【請求項2】同じ読みの語句の選択時には、その読みを
    示す第1のノードにより管理されている第2のノードの
    値にそれぞれ所定の評価関数を作用させ、この評価関数
    を作用させた値が大きい順に、その第2のノードが示す
    単語または句を当該読みに対する変換候補として出力す
    ることを特徴とする請求項(1)に記載の仮名漢字変換
    装置。
  3. 【請求項3】ノード値がベクトルとして与えられると
    き、所定の評価関数はノード値を入力してスカラー値を
    出力する関数として与えられることを特徴とする請求項
    (2)に記載の仮名漢字変換装置。
  4. 【請求項4】リンクの値は、複数の単語または句の意味
    的な関係に従って予め与えられるものである請求項
    (1)に記載の仮名漢字変換装置。
JP1157159A 1989-06-20 1989-06-20 仮名漢字変換装置 Expired - Lifetime JP2783597B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1157159A JP2783597B2 (ja) 1989-06-20 1989-06-20 仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1157159A JP2783597B2 (ja) 1989-06-20 1989-06-20 仮名漢字変換装置

Publications (2)

Publication Number Publication Date
JPH0322167A JPH0322167A (ja) 1991-01-30
JP2783597B2 true JP2783597B2 (ja) 1998-08-06

Family

ID=15643474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1157159A Expired - Lifetime JP2783597B2 (ja) 1989-06-20 1989-06-20 仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JP2783597B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3364242B2 (ja) * 1992-07-03 2003-01-08 株式会社東芝 人工的神経回路網のリンク学習装置
JP4423327B2 (ja) 2005-02-08 2010-03-03 日本電信電話株式会社 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体

Also Published As

Publication number Publication date
JPH0322167A (ja) 1991-01-30

Similar Documents

Publication Publication Date Title
US11106873B2 (en) Context-based translation retrieval via multilingual space
JPH0869470A (ja) 自然言語処理装置及びその方法
JPH1011447A (ja) パターンに基づく翻訳方法及び翻訳システム
JP7297458B2 (ja) 対話コンテンツ作成支援方法
US10678820B2 (en) System and method for computerized semantic indexing and searching
CN110083681A (zh) 基于数据分析的搜索方法、装置及终端
JPS61255469A (ja) 言語生成装置
JP2783597B2 (ja) 仮名漢字変換装置
KR100376931B1 (ko) 정보 검색 기술을 이용한 한영번역 데이터베이스 시스템 구축 방법
JP6114090B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JPH0683812A (ja) 文書入力装置のかな漢字変換装置
JP2994681B2 (ja) 仮名漢字変換装置
JP2018055620A (ja) 情報処理装置及びプログラム
JP2010061532A (ja) 電子辞書、電子辞書の検索方法及び電子辞書の検索プログラム
Antony et al. Question Answering System for Tamil Using Deep Learning
JPH0528129A (ja) 文書作成装置
JPH05165889A (ja) 文書検索装置
JPH03273360A (ja) 機械翻訳方法及び装置
JPH0350668A (ja) 文字処理装置
JP2013206130A (ja) 検索装置、検索方法およびプログラム
JPH10149368A (ja) 文書検索装置
JPH07306859A (ja) 機械翻訳装置
JP2012027729A (ja) 検索装置、検索方法及びプログラム
JPH06187329A (ja) 自然言語処理装置
JP2002259424A (ja) クロスリンガル情報検索方法及び装置及びプログラム