JPH0322167A - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JPH0322167A
JPH0322167A JP1157159A JP15715989A JPH0322167A JP H0322167 A JPH0322167 A JP H0322167A JP 1157159 A JP1157159 A JP 1157159A JP 15715989 A JP15715989 A JP 15715989A JP H0322167 A JPH0322167 A JP H0322167A
Authority
JP
Japan
Prior art keywords
node
value
word
kana
kanji conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1157159A
Other languages
English (en)
Other versions
JP2783597B2 (ja
Inventor
Setsu Suzuoka
節 鈴岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1157159A priority Critical patent/JP2783597B2/ja
Publication of JPH0322167A publication Critical patent/JPH0322167A/ja
Application granted granted Critical
Publication of JP2783597B2 publication Critical patent/JP2783597B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は仮名漢字変換処理における同音異義語選択を効
率的に行い得る仮名漢字変換装置に関する。
(従来の技術) 近時、日本語処理技術の発展が目覚ましく、入力された
読み情報を適宜漢字変換して仮名漢字混じりの日本語文
章を作成していく日本語ワードプロセッサが種々開発さ
れ、オフィス業務のみならずパーソナル分野にも幅広く
普及している。
このような日本語ワードプロセッサにおける重要な技術
に同音異義語選択がある。この同音異義語選択(漢字変
換候補の提示)は、読みを同じくする単語や句が多く存
在すると云う日本語特有の性質に対処するもので、従来
一般的には選択頻度の短期学習や近接単語間の共起を利
用して行われている。
この選択頻度の短期学習は、同音異義語の中で最も最近
選択された語(句)が次の選択時にも選択される可能性
が高いとして、これを最優先の漢字変換候補として提示
するものである。例えば『法律を施行する。』なる文書
情報が入力確定された後、「シこうびは・・・」なる文
書情報を与えて仮名漢字変換するとき、「しこうJなる
読みに対して最も最近選択された語が『施行』であるこ
とから、、「しこうびは」の「施行」について『施行』
を選択するものである。このような短期学習による同音
異義語選択は、その選択アルゴリズムが単純で簡単であ
り、インプリメントの効率も良いと云う利点を持つ。
しかし同一文意中に同音異義語が存在するような場合に
は正しく機能しないと云う問題を有している。例えば『
試行錯誤的に法律を定めることは人々を徒に混乱させる
だけである。』なる文章情報の入力確定後に「ほうりつ
をしこうするには・・・」なる文章情報を入力した場合
、「シこう」なる読みに対して最も最近選択された語(
句)が『試行』であることから、本来『施行』なる仮名
漢字変換結果を得たいにも拘らずr試行』なる語(句)
が選択されてしまう。
このような選択頻度の短期学習が持つ欠点を袖うものと
して上述した近接単語間の共起関係を利用した同音累義
語選択がある。この方式は、或る単語が出現したとき、
これに関連して出現しゃすい単語を共起関係にある単語
として選択するものである。例えば「あつい」なる読み
に示される語(句)についてみれば、『厚い』と『友情
』,『熱い』と『コーヒー』,『暑いJと『夏』とがそ
れぞれ共起関係にあると云える。このような共起関係に
ある単語(句)の情報を予め蓄えておくことにより、そ
の一方が出現したとき、他方の単語(句)も出現すると
予測して仮名漢字変換(同音意義語選択)を行うもので
ある。従って「あついなつ」なる読みが与えられた場合
、上述した共起関係を利用することによりr厚い笈』で
はなくr暑い夏』が選択されることになる。
前述した例では、r施行』と『錯誤』.『法律』と『施
行jとがそれぞれ共起関係にあることから、その直前に
『試行錯誤的に法律を・・・』なる語が入力確定されて
いたとしても「ほうりっをしこうするには・・・」に対
して「法律を施行するには・・・」なる同音意義語選択
による仮名漢字変換が正しく行われることになる。
然し乍ら、このような手法を採用するには、場当り的に
大量の共起関係情報をテーブルとして予め登録しておく
必要があり、膨大なメモリの容量を必要とすると云う不
具合がある。またテーブルに共起関係として登録されて
いない語については全く無力であると云う問題がある。
例えば法律に関する文章の作成時にあって、「しこうび
は4がつ11にちとする。』なる文章情報が与えられ、
「しこう」なる読み情報が初めて与えられた場合には、
今迄に「しこう」についての仮名漢字変換(同音意義語
選択)がなされていないこと、また近接語として「しこ
う」と共起関係にある語(句)がないことから、これを
正しく仮名漠字変換(同音意義語選択〉することができ
ないと云う不具合が生じる。
(発明が解決しようとする課題) このように従来の仮名漢字変換にあっては、以前に出現
したことのない語(句)の読み情報が与えられたときや
、共起関係を示すテーブルに登録されていない語(句)
が出現したとき、これを正しく仮名漢字変換(同音意義
語選択)することができないと云う問題があった。しか
も共起テーブルの充実化を図るには膨大なメモリ容量と
手間が掛かると云う問題があった。
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、初めて出現した語(句)や共起
テーブルに記述されていないような語(句)が出現した
場合であっても、簡易に適切な仮名漢字変換候補を求め
ることができ、その変換効率の向上を図ることのできる
実用性の高い仮名漢字変換装置を提供することにある。
[発明の横成] (課題を解決するための手段) 本発明に係る仮名漢字変換装置は、読みを表す第1のノ
ードにより管理されてその読みに対応する単語または句
をそれぞれ示す、語選択に利用される値を持つ第2のノ
ードと、これらの第2のノードを相互に結合し、これら
の第2のノード間の意味的な距離を示す値を持つリンク
とにより構成された語ネットワークを備え、 この語ネットワークを、上記第2のノードの値を単語ま
たは句に対する選択結果に従って順次更新すると共に、
値が更新された第2のノードに前記リンクを介して接続
されている第2のノードの値を上記更新されたノードの
値と前記リンクの値とに基づいて順次連鎖的に更新して
管理し、同じ読みの語句の選択時には、その読みを示す
第1のノードにより管理されている第2のノードの値が
大きい順に、その第2のノードが示す単語または句を当
該読みに対する変換候補として出力するようにしたこと
を特徴とするものである。
また或いは上記各第2のノードの値にそれぞれ所定の評
価関数を作用させ、この評価関数を作用させた値が大き
い順に、その第2のノードが示す単語または句を当該読
みに対する変換候補として出力するようにしたことを特
徴とするものである。
(作 用) 本発明によれば、語ネットワークにより同音異義語のそ
れぞれが第2のノードにより管理され、且つ第2のノー
ドの値によりその選択の適確性が管理されている。その
上で、これらの第2のノード間を結合するリンクにより
、それらの意味的な距離を示す値が付与され、同音異義
語選択がなされて或る第2のノードの値が更新されたと
き、前記リンクを介して連鎖的に上記語ネットワークを
構成している第2のノードの値がそれぞれ更新される。
このような連鎖的なノード値の更新により、或る語(句
)の選択に従ってこれに関連する語(句)のノード値が
リンクを介して更新されるので、共起関係にない語(句
)が与えられた場合であっても、また初めて出現した語
(句〉であっても、既に選択された語(句)に関連して
いる語(句)のノード値が、例えば第2のノードからリ
ンクを多重に介して更新されていることから、その語(
句)に対する選択性が高められることになる。
この結果、読みを同じくする語(句)のノード値に従い
、或いはこれらのノード値に所定の評価関数を,作用さ
せた値に従い、その変換候補の出力順序を決定すること
で効率的に適確な語(句)の変換出力(仮名浅字変換)
を行うことが可能となる。
(実施例) 以下、図面を参照して本発明の一実施例に係る仮名漢字
変換装置について説明する。
第1図は実施例装置の要部概略構成図で、lはCPUや
種々のメモリ等によって構成される仮名漢字変換処理部
本体である。仮名漢字変換による日本語文章作成は、こ
の仮名漢字変換処理部本体lに対して、キーボード等の
入力装置lを介して文章情報(読みの情報)や語選択の
指示情報等の制御情報を入力しながら、ディスプレイ等
の・出力装置3にて上記仮名漢字変換処理部本体lによ
る処理結果等を提示出力しながら行われる。
しかしてこの実施例装置における仮名漢字変換処理部本
体lが特徴とするところは、前記入力装置2から与えら
れる文章情報(読みの情報)を形態素解析してその文節
構造等を求める形態素解析部5等の一般的な日本語処理
機能を備えると共に、語ネットワーク装置6を備えてい
る点にある。この語ネットワーク装置6は、例えば第2
図に示すように語や句にそれぞれ対応するノードをリン
クを介して結合したネットワーク構造を有するもので、
ネットワーク管理部7にてその情報内容が管理されてい
る。
変換処理部本体lは入力文章情報に対する前記形態素解
析部5による解析結果に従い、語ネットワーク装置6を
参照して読みに対する漢字変換候補を抽出し、これを前
記出力装置3を介して出力する。ユーザは前記入力装置
2から与えた文章情報(読みの情報)についての仮名漢
字変換候補を出力装置3から褥、ここに掲示出力される
仮名漢字変換候補に対して、前記入力装置2から選択指
示の情報、或いは次候補の提示出力要求を与えながら仮
名漢字変換による日本語文章の作成処理を進めていくこ
とになる。
ところで上記語ネットワーク装置6は次のように構成さ
れている。この語ネットワークは、読みを表す第1のノ
ード(読みノード)Aと、これらの第1のノードAによ
り管理されてその読みに対応する111語または句をそ
れぞれ示す第2のノード(表現ノード)Bと、これらの
第2のノードBを相互に結合するリンクCとにより構成
される。
第2図に示す例では第1のノードAの読み「しこう」に
より管理されている第2のノードBとしては「試行」・
・・「施行」 「施工」が存在し、また第1のノードA
の読み「こうじ」により管理されている第2のノードB
としては「工事」 「公示」・・・「高次」が存在し、
その他、別の第1のノードAによりそれぞれ管理されて
いる第2のノードBとして「錯誤」 「法律」 「公布
」 「告示」 「憲法」「選拳法」 「選挙」・・・等
があることが示される。
そしてこれらの第2のノードB中の「施工」と「工事」
とがリンクCを介して結合され、同様にして「試行」と
「錯誤」,「試行」と「法律」,「法律」と「憲法」,
「法律」と「公布」,「法律」と「選挙法」・・・・・
・がそれぞれリンクCを介して結合されていることが示
される。
しかして語(句)に対応する第2のノードBは、その語
iの選択の適確性を現す値0,(例えばスカラー値)を
それぞれ持つ。このノード値OLは、基本的には同音異
義語選択された時、その値Olが高められるもので、ま
たリンクCを介して結合された第2のノードBの値O,
が更新されたとき、これに伴って後述するように更新さ
れるようになっている。この第2のノードBの10,の
更新は前記ネットワーク管理部7の管理の下で連鎖的に
行われる。
また複数の第2のノードBを相互に結合するリンクCは
、これらの第2のノードB(語iと語j)間の意味的な
距離を示すl!(重み)w.を持つものである。このリ
ンクCの値W.は、例えば[O≦Wll≦1.0]とし
て与えられ、W,,#0,w , 1 w w 1 ,
として定義される。このリンクCの値(重み)w.は、
第2のノードBに示される語iと語jと間の意味的な距
離が近い程、つまり共起関係にある等、語間の関連性が
強い程、大きな値として与えられる。
尚、上記[wtt−o1は表現ノード(語)iにおいて
自らの結合がないことを示しており、また[w,1−w
l,]は表現ノード(語)iと表現ノード(語)jとの
間のリンク値に方向性がないことを示している。
しかして語iを示す第2のノードBにリンクCを介して
結合された語jを示す第2のノードBの値OIは、前記
ネットワーク管理部7の制御にょり Qlil.f (net!”) netj”一δ netj  +  (1−δ)ΣwI
+Of+N*fは上限・下限を持つ単調1曽加関数*δ
は[0≦δ≦1]の定数 *I1は語jが選択された時に1’(>Q),選択され
ない時に10 (<0)なる値をとる制御値 なる処理により更新される。
上記第1式における有界な単調増加関数fは、ノードの
値O,を或る範囲内に抑えておく為のものであり、また
第2式における第1項はノード値O,の急激な出力変化
を抑える慣性モーメントである。そして第2式における
第2項は隣接ノードの出力値(ノード値)が大きいとき
、自らの出力値(ノード値)を大きくする為の項であり
、また第3項は語が選ばれたとき、その語に対応する第
2のノードの値を大きくし、選択されなかった場合には
そのノード値を徐々に小さくする為の項である。
ネットワーク菅理部7ほこのような更新処理を逐次実行
し、語ネットワークにおける第2のノードの値をそのリ
ンク構造に従って連鎖的に更新する。このノード値の更
新処理は、語ネットワーク装置6を用いた仮名漢字変換
処理とは独立に遷次連鎖的に実行され、また語の選択が
なされる都度、その選択情報に従ってノード値を修正し
ながら実行される。そして仮名漢字変換処理は、その時
点での語ネットワークの状態に応じて進められる。
このような語ネットワークを用いた仮名漢字変換処理は
、前記形態素解析部5によって解析された語の読み情報
が与えられたとき、その読みを示す第1のノードAによ
り管理されている第2のノ−ドBの各値を調べ、例えば
ノード値の最も大きいノードBに示される語(句)を前
記読みに対する漢字変換候補として出力することにより
行われる。このようにして出力した漢字変換候補に対し
て次候補の出力要求がなされた場合には、その次にノー
ド値の大きい語(句)が漢字変換候補として出力される
尚、ノード値を直接的に比較することに変えて、例えば
各ノード値に所定の評価値を作用させ、この評価値を作
用させた値を比較して漢字変換候補の選択を行うように
しても良い。このような所定の評価値を作用させること
は、例えば各ノード値がベクトルで示されるような場合
、その値を相互に比較するのに有用である。具体的には
ベクトルで示されるノード値に評価関数を作用させて各
ノードの距離値を求めれば、その1目互比較を容易に行
うことが可能となる。
またノード値がスカラー値として与えられる場合であっ
ても、所定の評価関数を作用させることによって各ノー
ド値の差異を明確にすることができるので、同音異義語
選択の判定を簡易に確実に行わせることが可能となる。
かくしてこのような語ネットワークを用いて仮名漢字変
換処理を実行する本装置によれば、既に選択された語(
句)に関連してその他の語(句)のノード値が連鎖的に
更新されるので、選択された語(句)に対する選択性を
高めると共に、共起関係にある語(句)に対する選択性
を高めることのみならず、選択された語(句)に関連の
在る語(句)についての選択性をも効果的に高めること
ができる。そして関連性の低い語(句)についての選択
性が徐々に低減されていく。この結果、初めて出現した
読みに対しても、また共起関係にない読みが与えられた
場合にであっても、既に選択されている語(句)の情報
に関連して適切な語(句)を漢字変換候補として選択す
ることが可能となり、その仮名漢字変換処理効率の向上
を図ることが可能となる。
具体的には、第2図において「公布」や「選挙法」と.
いった語(句)が既に選択されている場合には、これら
の語(句)についてのノード値がそれぞれ高められ、こ
れに関連し゛てこれらの語(句)に近い概念のA5(句
)である「法律」や「施行」についてのノード値も高め
られているので、「シこう」なる読み情報が初めて与え
られ、且つこれに共起関係にある語(句)が出現してい
ない場合であっても、「施行」なる漢字変換候補を適確
に選択して変換候補出ノノすることが可能となる。
またこのような語ネットワークを構築しておくことによ
り、従来のような共起関係テーブルをイ〕ざわざ作成し
ておく必要がなくなる。しかも共起関係にない語(句)
間についても、例えば複数のリンクCを介して結合され
る関連性のある語・とじてその意味的な距離関係を示す
ことができるので、複雑な関係構造を持つ語(句)の構
造的な情報を効果的に示し、同音異義語選択の適確性を
高めることが可能となる。これ故、同音異義語選択を容
易化し、仮名漢字変換処理の効率を大幅に向上させるこ
とが可能となる。
尚、本発明は上述した実施例に限定されるものではない
。例えば語ネットワークの構成は日本語処理システムの
仕様に応じて構築すれば良いものであり、ノード値の設
定やリンク値の設定、およびノード値の更新処理手続き
等もその仕様に応じて定めれば良い。またノード値に従
う変換候補の出力制御についても、そこで用いる評価関
数等は仕様に応じて定めれば良いものである。その他、
本発明はその要旨を逸脱しない範囲で種々変形して実施
することができる。
[発明の効果] 以上説明したように本発明によれば、語ネットワークに
おける語(句)のノード値に従って同音異義語選択を行
うので、初めて出現した読みや、共起関係にある語を持
たない読みが与えられた場合であっても、既に選択され
た語(句)の情報に従って適切な語(句)を効果的に変
換候補として求めていくことができ、その漢字変換効率
の向上を図ることができる。しかも従来の仮名漢字変換
処理における不具合を解消した効率的な仮名漢字変換処
理を実現し得る等の実用上多大なる効果が奏せられる。
【図面の簡単な説明】
第1図は本発明の一実施例に係る仮名漢字変換装置の要
部概略構成図、第2図は実施例装置で用いられる語ネッ
トワークの構或例を示す図である。 l・・・仮名漢字変換処理部本体、2・・・入力装置、
3・・・出力装置、5・・・形態素解析部、6・・・語
ネットワーク装置、7・・・ネットワーク管理部、A・
・・第1のノード(読みノード)、B・・・第2のノー
ド(表現ノード)、C・・・リンク。

Claims (4)

    【特許請求の範囲】
  1. (1)読みを表す第1のノードと、これらの第1のノー
    ドにより管理されてその読みに対応する単語または句を
    それぞれ示す値付きの第2のノードと、これらの第2の
    ノードを相互に結合し、これらの第2のノード間の意味
    的な距離を示す値を持つリンクとにより構成された語ネ
    ットワークを備え、 上記第2のノードの値を単語または句に対する選択結果
    に従って更新すると共に、値が更新された第2のノード
    に前記リンクを介して接続されている第2のノードの値
    を上記更新されたノードの値と前記リンクの値とに基づ
    いて順次更新して前記語ネットワークを管理し、 同じ読みの語句の選択時には、その読みを示す第1のノ
    ードにより管理されている第2のノードの値が大きい順
    に、その第2のノードが示す単語または句を当該読みに
    対する変換候補として出力することを特徴とする仮名漢
    字変換装置。
  2. (2)同じ読みの語句の選択時には、その読みを示す第
    1のノードにより管理されている第2のノードの値にそ
    れぞれ所定の評価関数を作用させ、この評価関数を作用
    させた値が大きい順に、その第2のノードが示す単語ま
    たは句を当該読みに対する変換候補として出力すること
    を特徴とする請求項(1)に記載の仮名漢字変換装置。
  3. (3)ノード値がベクトルとして与えられるとき、所定
    の評価関数はノード値を入力してスカラー値を出力する
    関数として与えられることを特徴とする請求項(2)に
    記載の仮名漢字変換装置。
  4. (4)リンクの値は、複数の単語または句の意味的な関
    係に従って予め与えられるものである請求項(1)に記
    載の仮名漢字変換装置。
JP1157159A 1989-06-20 1989-06-20 仮名漢字変換装置 Expired - Lifetime JP2783597B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1157159A JP2783597B2 (ja) 1989-06-20 1989-06-20 仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1157159A JP2783597B2 (ja) 1989-06-20 1989-06-20 仮名漢字変換装置

Publications (2)

Publication Number Publication Date
JPH0322167A true JPH0322167A (ja) 1991-01-30
JP2783597B2 JP2783597B2 (ja) 1998-08-06

Family

ID=15643474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1157159A Expired - Lifetime JP2783597B2 (ja) 1989-06-20 1989-06-20 仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JP2783597B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5524177A (en) * 1992-07-03 1996-06-04 Kabushiki Kaisha Toshiba Learning of associative memory in form of neural network suitable for connectionist model
WO2006085565A1 (ja) * 2005-02-08 2006-08-17 Nippon Telegraph And Telephone Corporation 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5524177A (en) * 1992-07-03 1996-06-04 Kabushiki Kaisha Toshiba Learning of associative memory in form of neural network suitable for connectionist model
WO2006085565A1 (ja) * 2005-02-08 2006-08-17 Nippon Telegraph And Telephone Corporation 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体
US8126712B2 (en) 2005-02-08 2012-02-28 Nippon Telegraph And Telephone Corporation Information communication terminal, information communication system, information communication method, and storage medium for storing an information communication program thereof for recognizing speech information

Also Published As

Publication number Publication date
JP2783597B2 (ja) 1998-08-06

Similar Documents

Publication Publication Date Title
JP3009215B2 (ja) 自然語処理方法および自然語処理システム
US4829423A (en) Menu-based natural language understanding system
KR900005899B1 (ko) 문장작성장치
EP0180888A2 (en) Method and apparatus for natural language processing
JP2004139427A (ja) コミュニケーション支援システム及びコミュニケーション支援システム、並びにコンピュータ・プログラム
EP0118187B1 (en) Menu-based natural language understanding system
JPH09198395A (ja) 文書検索装置
JPH0261763A (ja) 機械翻訳装置
JPH0322167A (ja) 仮名漢字変換装置
KR101593214B1 (ko) 논리적 물리적 2중 구조를 이용한 자연어 질의 검색 방법 및 시스템
JP2994681B2 (ja) 仮名漢字変換装置
JPS6190272A (ja) 辞書機能を用いた翻訳方式
JPH01307865A (ja) 文字列検索方式
JPH01126767A (ja) 辞書参照装置
JPH04290158A (ja) 文書作成装置
JPS63136264A (ja) 機械翻訳装置
JPH1125083A (ja) かな漢字変換装置及びコンピュータ読取可能な記憶媒体
JPH04305769A (ja) 機械翻訳装置
JPH0467227B2 (ja)
JPH0668160A (ja) 情報検索方式
JPH07306859A (ja) 機械翻訳装置
JPH0468466A (ja) かな漢字変換装置
JPH01185766A (ja) かな漢字変換装置
JPH04167064A (ja) 言語解析処理装置
Molukanele et al. Developing & using ontologies for the semantic web: An inspirational and a synthetic approach to ontological engineering & utilizing wordnet in information retrieval