JPH03268161A - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JPH03268161A
JPH03268161A JP2067185A JP6718590A JPH03268161A JP H03268161 A JPH03268161 A JP H03268161A JP 2067185 A JP2067185 A JP 2067185A JP 6718590 A JP6718590 A JP 6718590A JP H03268161 A JPH03268161 A JP H03268161A
Authority
JP
Japan
Prior art keywords
node
value
word
kana
kanji conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2067185A
Other languages
English (en)
Other versions
JP2994681B2 (ja
Inventor
Setsu Suzuoka
節 鈴岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2067185A priority Critical patent/JP2994681B2/ja
Publication of JPH03268161A publication Critical patent/JPH03268161A/ja
Application granted granted Critical
Publication of JP2994681B2 publication Critical patent/JP2994681B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、同音異義語選択を効率的に行い得る仮名漢字
変換装置に関する。
(従来の技術) 近時、1本語処理技術の発展が目ざましく、人力された
読み情報を適宜漢字変換して仮名漢字まじりの日本語文
章を作成していく日本語ワードプロセッサか種々開発さ
れ、オフィス業務のみならすパーソナル分野にも幅広く
普及している。
このような11本語ワードブロセッザにおける重要な技
術に同音異義語選択がある。この同音異義語選択は、読
みを同じくする語9句が多く存在するという日本語特有
の性質に対処するため、同じ読みに対して複数の漢字変
換候補が有る場合、優先度の高い順に提示し、ユーザに
選択させようとするものである。
従来、−船釣には変換候補提示のための優先順位の決定
手法には、短期学習という手法が多く用いられている。
この方式は、同音異義語の中でも最も最近選択された語
(句)が次の選択時にも選択される可能性が高いとl−
で、これを最優先の漢字変換候補として提示するもので
ある。具体例を示すと、例えば「法律を施行する」なる
文占情報が人力確定された後、「しこうびは・・」なる
文章情報を与えて仮名漢字変換をするとき、「しこう」
なる読みに対して最も最近選択された語が1施行」であ
ることから、「シこうびは」の「しこう」について「施
行Jを第1位に選択するというこ吉である。このような
短期学習による同音異義語選択は、その選択アルゴリス
ムが単純であり、かつインブリメントの効率も良いとい
う利点を持つ。
しかしながら、このような短期学習方式にあっては、同
一の読みに対し前に現われた漢字変換候補を第1位に選
択するため、同一文章中に異なる意味の同音異義語が複
数存在するような場合、正しく機能しないという問題を
有している。例えば、「試行錯誤的に法律を定めること
は人々を徒に混乱させるだけである。」なる文章情報の
入力後に「はうりつをしこうするには・・」なる文章情
報を入力した場合、「しこう」なる読みに対して最も最
近選択された語(句)が「試行」であるこきがら、本来
「施行」なる仮名漢字変換結果を得たいにも拘らず「試
行」なる語(句)を第一候補として提示してしまう。
このような短期学習が持つ欠点を補うものとして、例え
ば第3図に示すような語の間の関係を表わすネットワー
クを用い、今までに入力された語からの連想によって仮
名漢字変換する仮名漢字変換か提案(例えば特願平]、
 −1,571−59> されている。
具体的に示すと、第3図に示すような語ネットワークは
、語句に対応するノードと、これらのノードを相互に結
合するリンクとにより構成されている。ノードiとノー
I−jとを相互に結合するリンクは、これらのノードの
間の意味的な距剤を示す重みW5.(但し、W+、=W
、l、W、、=O)を持ち、このリンクの値は結合して
いるノードに対応する語句が同一の文脈において同時に
使われる度合が高い程、つまり共起関係にある程、大き
な値となる。
そこで、ユーザによりある語句が選択されると選択され
た語句に対応するノードの出力値01は高められ、また
リンクを介して結合された別のノードの出力値も連鎖的
に更新され、漢字変換候補のうち、最も活性度の高い語
句が第1候補として挙げられる。
しかして、ノードJの時刻tにおける出力0゜は次のよ
うにして定められる。
Q、  =f  (netl  ) ・・・(1) netl+−δ (ΣW7,0 +1゜ ) + (1−δ)net)   ・・・(2)ここに、f
は上限下限を持つ単調増加関数、δは[0〈δく1]の
定数、■、′は語jが選択された時に正のある値となり
、選択されない時は0となる関数である。上記(1)式
における単調増加関数「は、ノードの出力値0」をある
範囲内に抑えておくためのものであり、(2)式の定数
δはノードの出力値の急激な変化を抑えるためのもので
ある。δが小さい程、変化を抑える働きが大きくなる。
よって、第3図に示す語ネットワークを用いた仮名漢字
変換装置では、ユーザがある仮名を漢字変換しようする
と、その仮名の同音異義語のうち最も活性値の高い語が
第1候補に採択され提示される。このとき、各語句に対
応するノードは上記語ネットワークにより語間の連想で
その出力値を定めるので、単なる短期学習とは異なり、
文章の流れに応じたより好ましい変換候補が得られる。
(発明が解決しようとする課題) しかしながら、」二記の如く既に提案されている語ネッ
トワークを用いた仮名漢字変換装置にあっても、新規文
章の入力し始めにおいては効率良い仮名漢字変換ができ
ないという問題点があった。
その理由は、語ネットワークは、正しい連想を行わせる
ため、初期においては虚の状態、すなわち全てのノード
の値を0とする状態にしておがねばならず、文章を始め
て入力した時には、まだどの語句も選択されていないの
で、ノードの値は全てOである。従って、新規文書の最
初の方ではノードの出力値が大きな値を持たず、ノード
間の優位性が明確でないので適切な仮名漢字変換を行う
ことができず、しばらく語選択を行っていくと徐々にノ
ードの出力値が大きくなり正しい仮名漢字変換が行われ
るようになる。
本発明は、かかる事情を考慮してなされたもので、その
目的とするところは、新規文章作成の初期段階において
も効率良く仮名漢字変換を行うことができる語ネットワ
ークを用いた仮名漢字変換装置を提供することにある。
[発明の構成] (課題を解決するための手段) 」二記課題を解決する本発明は、一つのノードに一つの
語または句を対応させ各ノードを語間の意味的な距離を
示す重み例のリンクで相互に結合して構成された語ネッ
トワークを備え、該語ネットワークでは各ノード活性値
をそのノードに対応する語または句の選択の有無と前記
リンクを介して結合させる他のノードの活性値及びリン
ク重みとに応じて連鎖的に更新して定め、前記語ネット
ワークの各ノードの活性値に応じて同音語に関する漢字
変換候補の提示順位を決定するようにした仮名漢字変換
装置において、 前記語ネットワークの各ノードに対応するエリアを有し
、各エリアに前記語ネットワークの各ノードが取り得る
値の絶対値よりも十分小さい範囲で各ノードに対する固
有値を記憶させたノード固有値記憶手段を設け、 前記語ネットワークの各ノードの活性値に前記ノード固
有値記憶手段の各エリアに記憶された固有値を加えた値
で同音語に関する漢字変換候補の提示順位を決定するこ
とを特徴とする。
また、前記語ネットワーク中のノードの活性値の絶対値
の平均値がある値よりも大きくなるが、または語選択の
回数がある一定回数よりも大きくなるか、あるいは両方
の条件を満した場合には、前記ノード固有値を0とする
か、もしくはノード固有値を加えないことを特徴とする
さらに、前記ノード固有値は語句の選ばれ易さを表わす
値とされ、ユーザ選択率の高い語句はど大きな値とされ
ることを特徴とする。
また、前記ノード固有値は以前に仮名漢字変換を行った
ときの語ネットワークのノードの値を用いて自動的に作
成されることを特徴とする。
また、この場合、前記ノード固有値は以前に仮名漢字変
換を行ったときの語ネットワークのノードの値に1より
小さい正の値を掛けて小さくし、その値がある基準値以
下の場合にはその基準値に−0 変更し、かく算出された値に一般的な語句の選択の程度
を表わす値を加えて作成することを特徴とする。
(作用) 本発明によれば、語ネットワークのノードの活性値の出
力に各ノードに固有の値を加えた値によって、同じ読み
対する漢字変換候補の提示順序を決定する。従って、文
章の作成の初期段階で語ネットワークのノードの出力値
が非常に小さい時には、ノード固有の値によって語句の
選択され易さが決まる。これにより、文章作成の初期段
階においても、同音語の中から無作為に語句が選ばれる
のではなく、ノード固有値記憶手段が記憶するノード固
有値により定まる優先度によって語句が選ばれる。
次に、語ネットワークが連想によって活性化して来た場
合には、ノード固有の値は無視されることが望ましい。
そこで、本発明では、ノード固有の値の絶対値はノード
の取り得る値の絶対値よりも小さくしておく。これによ
り、語ネットワークが連想によって活性化してくると、
ノードの出力値の絶対値がノード固有の値の絶対値より
大きくなり、ノード固有の値は無視される。また、ある
程度語ネットワークが連想によって活性化17て来た場
合には、ノード固有の値をOとするか、加えないことに
より無視できる。
さらに、ノード固有値は、語ネットワークは別途のノー
ド固有値記憶手段に記憶されており、ネットワークの値
には影響を及はさないので、語ネットワークによる人力
文章の話題の把握には何等悪影響を与えない。
(実施例) 以下、図面を参照して本発明の一実施例に係わる仮名漢
字変換装置について説明する。
第1図は本発明の一実施例に係る仮名漢字変換装置の要
部概略構成図で、1はCPUや種々のメモリ等によって
構成される仮名漢字変換装置の本体である。仮名漢字変
換による日本語文章作成は、この本体]に対して、キー
ボード等の人力装置2を介して読みの文章情報や語選択
の指示情報等の] 1 2 制御情報を入力しながら、デイスプレィ等の出力装置3
にて上記本体1による変換候補の提示等の処理結果を出
力しながら行われる。
前記本体1の内部には、文法、辞書、共起テブル情報を
有して文法的構造を解析する形態素解析装置4と、従来
例で示した第3図のような語ネットワークを管理する語
ネットワーク装置5と、本実施例で特に設けられたノー
ド固有値メモリ6と、前記語ネットワーク装置5の出力
値及び前記ノード固有値メモリ6の出力値を加算し形態
素解析装置4に出力する加算器7が設けられる。
前記ノード固有値メモリ6は、前記語ネットワーク装置
5が有する第3図に示すような語ネットワークの各ノー
ドに対応するエリアを有し、各エリアに対応するノード
に対する固有値を記憶する。
このメモリは、読み書き可能の記憶装置で構成される。
ノード固有値メモリ6は、例えば第2図のステップ20
1〜204に示すように、語ネットワークを用いての仮
名漢字変換処理の終了後、語ネットワークの状態より、
例えばノード活性値に1より小さな正の数を乗じてノー
ド固有値を作成し、これを各ノードに対応するエリアに
それぞれ格納して作られる。
前記語ネットワーク装置5及びノード固有値メモリ6は
、前記形態素解析装置4が出力したノード番号及び出力
値要求に基いて、語ネットワークのノード活性値及び各
エリアに記憶されたノード固有値をそれぞれ出力する。
また、前記語ネットワーク装置5は、形態素解析装置4
が出力したノード番号及び語選択情報に基いて語ネット
ワークの各ノードの活性値を更新する。この更新方式は
、選択された語または句に対応するノードの活性値を高
めると共に、このノードと接続されたノードの活性値を
、リンク重みに応じて連鎖的に高めるような方式である
よって、前記形態素解析装置4は、前記加算器7より入
力される語ネットワーク装置の出力値及びノード固有値
メモリ6の和である優位度情報に基いて同音語に関する
漢字変換候補の提示順位を 3 4 定め、第1位の優先順位の漢字候補から前記出力装置3
に対して順次変換候補を提示する。
しかして、この実施例における仮名漢字変換装置の特徴
とするところは、前記人力装置2から与えられる読ろの
文章情報を形態素解析してその文法構造を求める形態素
解析部4等の一般的な日本語処理機能を備えると共に、
語ネットワーク装置5とノード固有値メモリ6を備えて
いる点にある。
すなわち、仮名漢字変換装置本体1は入力文章情報に対
する前記形態素解析部4による解析結果に従い、語ネッ
トワーク装置5に対して語句に対するノードの識別番号
を与え、その出力値を得る。
ところが、一般に解析には曖昧性を伴うので、それぞれ
の可能性に含まれる語句について問い合わせを語ネット
ワーク装置5のみならずノード固有値メモリ6に対して
も行う。
そして、問い合わせた可能性の中でそれらの出力値の和
である優位度が最も高い絹合わせを第一候補として出力
装置3に提示する。もしユーザが別の候補を要求した場
合には、優位度の高い組合わせの順に順次出力装置3に
提示する。
そして、ユーザが、提示された語句を選択すると、形態
素解析部4を介して語ネットワーク装置5に選択された
語句に対応するノード番号と語選択である旨とが伝えら
れる。
例えば、第3図の語ネットワークに対して、「かんじ・
・・」で始まりる文章を新規に入力すると、「かんし」
なる読みに対して「感じ」、「漢字」、「幹事」、「監
事」なる漢字変換候補がある。ところが、この時点では
、まだ、語ネットワーク中のノードの出力値は全て0で
あるので、従来方式ではこの中から無作為に一つの語が
候補として選ばれることになる。しかし、本例では、各
ノードの取り得る値の範囲を−1,0〜]−80とし、
ノード固有値として、 感じ:屹] 漢字二〇、05 幹事:屹 0 監事ニー0.05 と与えているとすると、文章作成の始めでもノー 5 6 ド固有値が最も高い「感じ」が第一候補に選択され、最
も使用頻度の低い「監事」が最も最後の候補となり、例
えば前に入力された文章に対して統一か取れることにな
る。
一方、ノード固有値の絶対値は、語ネットワタのノード
の取り得る値の絶対値]よりも小さくしているので、実
は財務関係の文章をユーザが入力している場合で有れば
、時間の経過と共に「監事」に対応する語ネットワーク
のノードの出力値が、メモリ6のノード固有値−〇、0
5を無視てきる程度に十分大きくなり得る。従って、ノ
ード固有値は語ネットワークの連想の妨げにはならない
ノード固有値メモリ6に記憶させるノード固有値は次の
ように定めることかできる。
■ ノード固有値は短期学習の初期情報から決めること
ができる。例えば、「かんし」について、「感じ」、「
漢字」、「幹事」、「監事」の順に選ばれるようにする
ならば、例えば上のようにO1]、0.05.0.0.
−0.05と定めてノード固有値を順に小さくしていけ
ば良い。
■ しかし、■の方法ではノード固有値の学習が行われ
ず、文章の始まりの「かんじ」は常に「感じ」になる。
そこで第2図で例示したように以前に仮名漢字変換に用
いた語ネットワークのノードの活性値を保持しておき、
この値に1より小さい値(例えば0.1)を掛けた値を
ノード固有の値にする方法がある。これにより前回の変
換結果を尊重したノード固有の値が学習される。
■ ところが、語ネットワークでは、話題と関係のない
語に対応するノードの値が非常に低い値となっている。
このため■の方法を用いると、一つの同音語に属する全
ての語句が以前に人力17た文章の話題に関係かない場
合には、それらの語句に対応するノードのノード固有値
は全て同じような小さな値となり、優位性がない。そこ
で、」二記の■■を融合した方法を提案する。具体的に
は、■の方法によるノード固有値か非負であればその値
、負であれば0とした値に、■の方法により得られるノ
ード固有値を加えて2て割ったものをノード 7 8 固有値とする。
以上により、本実施例に係る仮名漢字変換装置では、語
ネットワークによる話題に関係の有る語が選択され易い
という連想型の特徴と、ノード固有値メモリ6による従
来の優先辞書と類似した特定の語を優先させる特徴とを
兼ね備え、新規文章の作成では初期の段階において特定
の語を優先させ、その後は連想による語を優先させるこ
とができる。
しかも、特定の語を優先させるためノードの固有値メモ
リ6に記憶させる値は上記の如く種々設定できので、ユ
ーザをして最も使い易い形の仮名漢字変換装置を設計す
ることができる。
」1記実施例では、ノード固有値メモリ6の出力を文章
入力の始めから終りまで語ネットワーク装置5の出力に
加える例を示したが、語選択回数を計数し、ある一定値
以上となったらノード固有値メモリ6の出力を加えない
ようにしてもよい。
また、ノード固有値メモリ6と加算器8との間に定数乗
算器を設け、語選択回数に応してその定数を変化させる
ようにしてもよい。
本発明は」二連した実施例に限定されるものではなく、
本発明の主旨を逸脱しない範囲で種々変形して実施する
ことができる。
[発明の効果] 以上詳細に説明したように、本発明によれば、連想によ
る語ネットワークと特定語の選択され易さを示すノード
固有値記憶手段とを融合させ、両者の出力値の和で同音
語に関する漢字変換候補の提示順序を定めるので、新規
文章を作成し始めた場合においても仮名漢字変換が適切
に行われ、実用」二多大なる効果が奏せられる。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる仮名漢字変換装置の
要部概略構成図、第2図はノード固有値の記憶方式の1
例を示すフローチャーI・、対3図は語ネットワークの
構成例を示す説明図である。 5・・・語ネットワーク装置 6・・・ノード固有値メモリ  9 0

Claims (5)

    【特許請求の範囲】
  1. (1)一つのノードに一つの語または句を対応させ各ノ
    ードを語間の意味的な距離を示す重み付のリンクで相互
    に結合して構成された語ネットワークを備え、該語ネッ
    トワークでは、各ノードの活性値をそのノードに対応す
    る語または句の選択の有無と前記リンクを介して結合さ
    せる他のノードの活性値及びリンク重みとに応じて連鎖
    的に更新して定め、前記語ネットワークの各ノードの活
    性値に応じて同音語に関する漢字変換候補の提示順位を
    決定するようにした仮名漢字変換装置において、 前記語ネットワークの各ノードに対応するエリアを有し
    、各エリアに前記語ネットワークの各ノードが取り得る
    値の絶対値よりも十分小さい範囲で各ノードに対する固
    有値を記憶させたノード固有値記憶手段を設け、 前記語ネットワークの各ノードの活性値に前記ノード固
    有値記憶手段の各エリアに記憶された固有値を加えた値
    で同音語に関する漢字変換候補の提示順位を決定するこ
    とを特徴とする仮名漢字変換装置。
  2. (2)前記語ネットワーク中のノードの活性値の絶対値
    の平均値がある値よりも大きくなるか、または語選択の
    回数がある一定回数よりも大きくなるか、あるいは両方
    の条件を満した場合には、前記ノード固有値を0とする
    か、もしくはノード固有値を加えないことを特徴とする
    請求項1に記載の仮名漢字変換装置。
  3. (3)前記ノード固有値は、語句の選ばれ易さを表わす
    値とされ、ユーザ選択率の高い語句ほど大きな値とされ
    ることを特徴とする請求項1に記載の仮名漢字変換装置
  4. (4)前記ノード固有値は、以前に仮名漢字変換を行っ
    たときの語ネットワークのノードの値を用いて自動的に
    作成されることを特徴とする請求項1に記載の仮名漢字
    変換装置。
  5. (5)前記ノード固有値は、以前に仮名漢字変換を行っ
    たときの語ネットワークのノードの値に1より小さい正
    の値を掛けて小さくし、その値がある基準値以下の場合
    にはその基準値に変更し、かく算出された値に一般的な
    語句の選択の程度を表わす値を加えて作成することを特
    徴とする請求項4に記載の仮名漢字変換装置。
JP2067185A 1990-03-19 1990-03-19 仮名漢字変換装置 Expired - Fee Related JP2994681B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2067185A JP2994681B2 (ja) 1990-03-19 1990-03-19 仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2067185A JP2994681B2 (ja) 1990-03-19 1990-03-19 仮名漢字変換装置

Publications (2)

Publication Number Publication Date
JPH03268161A true JPH03268161A (ja) 1991-11-28
JP2994681B2 JP2994681B2 (ja) 1999-12-27

Family

ID=13337587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2067185A Expired - Fee Related JP2994681B2 (ja) 1990-03-19 1990-03-19 仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JP2994681B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8126712B2 (en) 2005-02-08 2012-02-28 Nippon Telegraph And Telephone Corporation Information communication terminal, information communication system, information communication method, and storage medium for storing an information communication program thereof for recognizing speech information

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8126712B2 (en) 2005-02-08 2012-02-28 Nippon Telegraph And Telephone Corporation Information communication terminal, information communication system, information communication method, and storage medium for storing an information communication program thereof for recognizing speech information

Also Published As

Publication number Publication date
JP2994681B2 (ja) 1999-12-27

Similar Documents

Publication Publication Date Title
CN108363697A (zh) 文本信息生成方法、装置、存储介质及设备
US5369574A (en) Sentence generating system
WO2007049890A1 (en) Character input device for terminal and method of processing character string
JPH03268161A (ja) 仮名漢字変換装置
JPH09245038A (ja) 文章作成装置
JPH07191687A (ja) 自然言語処理装置及びその方法
JPH0612537B2 (ja) かな漢字変換装置
JPH0981184A (ja) 対話支援装置
JP2783597B2 (ja) 仮名漢字変換装置
JP3622841B2 (ja) かな漢字変換装置およびかな漢字変換方法
Lieberman et al. Common sense on the go: Giving mobile applications an understanding of everyday life
JPH09179859A (ja) 文字列変換装置および文字列変換方法
JPH04290158A (ja) 文書作成装置
JPH0528129A (ja) 文書作成装置
JPS60140460A (ja) カナ漢字変換装置における短縮変換方式
JPS61260367A (ja) 機械翻訳システム
JP3084864B2 (ja) 文章入力装置
JPH03198147A (ja) 仮名漢字変換装置
JP3438913B2 (ja) 文書処理装置
JP2000048018A (ja) 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
JPH0271362A (ja) 仮名漢字変換装置
JPH02257257A (ja) 連想記憶を可能とするかな漢字変換用の辞書データ管理方式
JPS63136266A (ja) 機械翻訳装置
JPH07306859A (ja) 機械翻訳装置
JP2002351869A (ja) 文書処理装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees