JP2994681B2 - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JP2994681B2
JP2994681B2 JP2067185A JP6718590A JP2994681B2 JP 2994681 B2 JP2994681 B2 JP 2994681B2 JP 2067185 A JP2067185 A JP 2067185A JP 6718590 A JP6718590 A JP 6718590A JP 2994681 B2 JP2994681 B2 JP 2994681B2
Authority
JP
Japan
Prior art keywords
value
node
kanji conversion
word
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2067185A
Other languages
English (en)
Other versions
JPH03268161A (ja
Inventor
節 鈴岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2067185A priority Critical patent/JP2994681B2/ja
Publication of JPH03268161A publication Critical patent/JPH03268161A/ja
Application granted granted Critical
Publication of JP2994681B2 publication Critical patent/JP2994681B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、同音異義語選択を効率的に行い得る仮名漢
字変換装置に関する。
(従来の技術) 近時、日本語処理技術の発展が目ざましく、入力され
た読み情報を適宜漢字変換して仮名漢字まじりの日本語
文章を作成していく日本語ワードプロセッサが種々開発
され、オフィス業務のみならずパーソナル分野にも幅広
く普及している。
このような日本語ワードプロセッサにおける重要な技
術に同音異義語選択がある。この同音異義語選択は、読
みを同じくする語や句が多く存在するという日本語特有
の性質に対処するため、同じ読みに対して複数の漢字変
換候補が有る場合、優先度の高い順に提示し、ユーザに
選択させようとするものである。
従来、一般的には変換候補提示のための優先順位の決
定手法には、短期学習という手法が多く用いられてい
る。この方式は、同音異義語の中でも最も最近選択され
た語(句)が次の選択時にも選択される可能性が高いと
して、これを最優先の漢字変換候補として提示するもの
である。具体例を示すと、例えば「法律を施行する」な
る文書情報が入力確定された後、「しこうびは…」なる
文章情報を与えて仮名漢字変換をするとき、「しこう」
なる読みに対して最も最近選択された語が「施行」であ
ることから、「しこうびは」の「しこう」について「施
行」を第1位に選択するということである。このような
短期学習による同音異義語選択は、その選択アルゴリズ
ムが単純であり、かつインプリメントの効率も良いとい
う利点を持つ。
しかしながら、このような短期学習方式にあっては、
同一の読みに対し前に現われた漢字変換候補を第1位に
選択するため、同一文書中に異なる意味の同音異義語が
複数存在するような場合、正しく機能しないという問題
を有している。例えば、「試行錯誤的に法律を定めるこ
とは人々を徒に混乱させるだけである。」なる文章情報
の入力後に「ほうりつをしこうするには…」なる文章情
報を入力した場合、「しこう」なる読みに対して最も最
近選択された語(句)が「試行」であることから、本来
「施行」なる仮名漢字変換結果を得たいにも拘らず「試
行」なる語(句)を第一候補として提示してしまう。
このような短期学習が持つ欠点を補うものとして、例
えば第3図に示すような語の間の関係を表わすネットワ
ークを用い、今までに入力された語からの連想によって
仮名漢字変換する仮名漢字変換が提案(例えば特願平1
−157159)されている。
具体的に示すと、第3図に示すような語ネットワーク
は、語句に対応するノードと、これらのノードを相互に
結合するリンクとにより構成されている。ノードiとノ
ードjとを相互に結合するリンクは、これらのノードの
間の意味的な距離を示す重みWij(但し、Wij=Wji、Wii
=0)を持ち、このリンクの値は結合しているノードに
対応する語句が同一の文脈において同時に使われる度合
が高い程、つまり共起関係にある程、大きな値となる。
そこで、ユーザによりある語句が選択されると選択さ
れた語句に対応するノードの出力値Oiは高められ、また
リンクを介して結合された別のノードの出力値も連鎖的
に更新され、漢字変換候補のうち、最も活性度の高い語
句が第1候補として挙げられる。
しかして、ノードjの時刻tにおける出力Oi tは次の
ようにして定められる。
Oi t=f(neti t) …(1) neti t=δ(ΣWjiOi t-1+Ii t-1) +(1−δ)neti t-1 …(2) ここに、fは上限下限を持つ単調増加関数、δは[0
<δ<1]の定数、Ii tは語jが選択された時に正のあ
る値となり、選択されない時は0となる関数である。上
記(1)式における単調増加関数fは、ノードの出力値
Oi tをある範囲内に抑えておくためのものであり、
(2)式の定数δはノードの出力値の急激な変化を抑え
るためのものである。δが小さい程、変化を抑える働き
が大きくなる。
よって、第3図に示す語ネットワークを用いた仮名漢
字変換装置では、ユーザがある仮名を漢字変換しようと
すると、その仮名の同音異義語のうち最も活性値の高い
語が第1候補に採択され提示される。このとき、各語句
に対応するノードは上記語ネットワークにより語間の連
想でその出力値を定めるので、単なる短期学習とは異な
り、文章の流れに応じたより好ましい変換候補が得られ
る。
(発明が解決しようとする課題) しかしながら、上記の如く既に提案されている語ネッ
トワークを用いた仮名漢字変換装置にあっても、新規文
章の入力し始めにおいては効率良い仮名漢字変換ができ
ないという問題点があった。
その理由は、語ネットワークは、正しい連想を行わせ
るため、初期においては虚の状態、すなわち全てのノー
ドの値を0とする状態にしておかねばならず、文章を始
めて入力した時には、まだどの語句も選択されていない
ので、ノードの値は全て0である。従って、新規文書の
最初の方ではノードの出力値が大きな値を持たず、ノー
ド間の優位性が明確でないので適切な仮名漢字変換を行
うことができず、しばらく語選択を行っていくと徐々に
ノードの出力値が大きくなり正しいい仮名漢字変換が行
われるようになる。
本発明は、かかる事情を考慮してなされたもので、そ
の目的とするところは、新規文章作成の初期段階におい
ても効率良く仮名漢字変換を行うことができる語ネット
ワークを用いた仮名漢字変換装置を提供することにあ
る。
[発明の構成] (課題を解決するための手段) 上記課題を解決するため本発明は、語または句を対応
させたノードをリンクで結合して語ネットワークを構成
し、前記各ノードの活性値をその語または句の選択の有
無と他のノードの活性値及びリンク重みとに応じて定
め、かつ前記各ノードの活性値に応じて漢字変換候補の
提示順位を決定する仮名漢字変換装置であって、前記語
ネットワークの各ノードに対応させて該ノードが取り得
る値の絶対値よりも絶対値が小さい値の固定値を記憶さ
せた記憶手段を設け、前記各ノードの活性値と各ノード
に対応する前記固有値とに基づいて漢字変換候補の提示
順位を決定することを特徴とする。
(作用) 本発明によれば、語ネットワークのノードの活性値の
出力と各ノードに固有の値(固有値)との加算によっ
て、同じ読みに対する漢字変換候補の提示順序を決定す
る。従って、文章の作成の初期段階で語ネットワークの
ノードの出力値が非常に小さいときには、固有値によっ
て語句の選択され易さが決まる。
これにより、文書作成の初期段階においても、同音語
の中から無作為に語句が選ばれるのではなく、ノード固
有値により定まる優先度によって語句が選ばれる。
また、語ネットワークが連想によって活性化してきた
場合には、ノード固有値は無視されることが望ましい。
そこで、本発明では、ノード固有値の絶対値はノードの
取り得る値の絶対値よりも小さくしておく。これによ
り、語ネットワークが連想によって活性化してくると、
ノードの出力値の絶対値がノード固有値の絶対値の絶対
値より大きくなり、ノード固有値は無視されるようにな
る。
さらに、ノード固有値は、語ネットワークとは別途の
記憶手段に記憶されており、ネットワークの値には影響
を及ぼさないので、語ネットワークによる入力文章の話
題の把握には何等影響を与えない。
(実施例) 以下、図面を参照して本発明の一実施例に係わる仮名
漢字変換装置について説明する。
第1図は本発明の一実施例に係る仮名漢字変換装置の
要部概略構成図で、1はCPUや種々のメモリ等によって
構成される仮名漢字変換装置の本体である。仮名漢字変
換による日本語文章作成は、この本体1に対して、キー
ボード等の入力装置2を介して読みの文章情報や語選択
の指示情報等の制御情報を入力しながら、ディスプレイ
等の出力装置3にて上記本体1による変換候補の提示等
の処理結果を出力しながら行われる。
前記本体1の内部には、文法、辞書、共起テーブル情
報を有して文法的構造を解析する形態素解析装置4と、
従来例で示した第3図のような語ネットワークを管理す
る語ネットワーク装置5と、本実施例で特に設けられた
ノード固有値メモリ6と、前記語ネットワーク装置5の
出力値及び前記ノード固有値メモリ6の出力値を加算し
形態素解析装置4に出力する加算器7が設けられる。
前記ノード固有値メモリ6は、前記語ネットワーク装
置5が有する第3図に示すような語ネットワークの各ノ
ードに対応するエリアを有し、各エリアに対応するノー
ドに対する固有値を記憶する。このメモリは、読み書き
可能の記憶装置で構成される。
ノード固有値メモリ6は、例えば第2図のステップ20
1〜204に示すように、語ネットワークを用いての仮名漢
字変換処理の終了後、語ネットワークの状態より、例え
ばノード活性値に1より小さな正の数を乗じてノード固
有値を作成し、これを各ノードに対応するエリアにそれ
ぞれ格納して作られる。
前記語ネットワーク装置5及びノード固有値メモリ6
は、前記形態素解析装置4が出力したノード番号及び出
力値要求に基いて、語ネットワークのノード活性値及び
各エリアに記憶されたノード固有値をそれぞれ出力す
る。
また、前記語ネットワーク装置5は、形態素解析装置
4が出力したノード番号及び語選択情報に基いて語ネッ
トワークの各ノードの活性値を更新する。この更新方式
は、選択された語または句に対応するノードの活性値を
高めると共に、このノードと接続されたノードの活性値
を、リンク重みに応じて連鎖的に高めるような方式であ
る。
よって、前記形態素解析装置4は、前記加算器7より
入力される語ネットワーク装置の出力値及びノード固有
値メモリ6の和である優位度情報に基いて同音語に関す
る漢字変換候補の提示順位を定め、第1位の優先順位の
漢字候補から前記出力装置3に対して順次変換候補を提
示する。
しかして、この実施例における仮名漢字変換装置の特
徴とするところは、前記入力装置2から与えられる読み
の文章情報を形態素解析してその文法構造を求める形態
素解析部4等の一般的な日本語処理機能を備えると共
に、語ネットワーク装置5とノード固有値メモリ6を備
えている点にある。
すなわち、仮名漢字変換装置本体1は入力文章情報に
対する前記形態素解析部4による解析結果に従い、語ネ
ットワーク装置5に対して語句に対するノードの識別番
号を与え、その出力値を得る。
ところが、一般に解析には曖昧性を伴うので、それぞ
れの可能性に含まれる語句について問い合わせを語ネッ
トワーク装置5のみならずノード固有値メモリ6に対し
ても行う。
そして、問い合わせた可能性の中でそれらの出力値の
和である優位度が最も高い組合わせを第一候補として出
力装置3に提示する。もしユーザが別の候補を要求した
場合には、優位度の高い組合わせの順に順次出力装置3
に提示する。
そして、ユーザが、提示された語句を選択すると、形
態素解析部4を介して語ネットワーク装置5に選択され
た語句に対応するノード番号と語選択である旨とが伝え
られる。
例えば、第3図の語ネットワークに対して、「かんじ
…」で始まりる文章を新規に入力すると、「かんじ」な
る読みに対して「感じ」、「漢字」、「幹事」、「監
事」なる漢字変換候補がある。ところが、この時点で
は、まだ、語ネットワーク中のノードの出力値は全て0
であるので、従来方式ではこの中から無作為に一つの語
が候補として選ばれることになる。しかし、本例では、
各ノードの取り得る値の範囲を−1.0〜1.0とし、ノード
固有値として、 感じ:0.1 漢字:0.05 幹事:0.0 監事:−0.05 と与えているとすると、文章作成の始めでもノード固有
値が最も高い「感じ」が第一候補に選択され、最も使用
頻度の低い「監事」が最も最後の候補となり、例えば前
に入力された文章に対して統一が取れることになる。
一方、ノード固有値の絶対値は、語ネットワークのノ
ードの取り得る値の絶対値1よりも小さくしているの
で、実は財務関係の文章をユーザが入力している場合で
有れば、時間の経過と共に「監事」に対応する語ネット
ワークのノードの出力値が、メモリ6のノード固有値−
0.05を無視できる程度に十分大きくなり得る。従って、
ノード固有値は語ネットワークの連想の妨げにはならな
い。
ノード固有値メモリ6に記憶させるノード固有値は次
のように定めることができる。
ノード固有値は短期学習の初期情報から決めること
ができる。例えば、「かんじ」について、「感じ」、
「漢字」、「幹事」、「監事」の順に選ばれるようにす
るならば、例えば上のように0.1,0.05,0.0,−0.05と定
めてノード固有値を順に小さくしていけば良い。
しかし、の方法ではノード固有値の学習が行われ
ず、文章の始まりの「かんじ」は常に「感じ」になる。
そこで第2図で例示したように以前に仮名漢字変換に用
いた語ネットワークのノードの活性値を保持しておき、
この値に1より小さい値(例えば0.1)を掛けた値をノ
ード固有の値にする方法がある。これにより前回の変換
結果を尊重したノード固有の値が学習される。
ところが、語ネットワークでは、話題と関係のない
語に対応するノードの値が非常に低い値となっている。
このための方法を用いると、一つの同音語に属する全
ての語句が以前に入力した文章の話題に関係がない場合
には、それらの語句に対応するノードのノード固有値は
全て同じような小さな値となり、優位性がない。そこ
で、上記のを融合した方法を提案する。具体的に
は、の方法によるノード固有値が非負であればその
値、負であれば0とした値に、の方法により得られる
ノード固有値を加えて2で割ったものをノード固有値と
する。
以上により、本実施例に係る仮名漢字変換装置では、
語ネットワークによる話題に関係の有る語が選択され易
いという連想型の特徴と、ノード固有値メモリ6による
従来の優先辞書と類似した特定の語を優先させる特徴と
を兼ね備え、新規文章の作成では初期の段階において特
定の語を優先させ、その後は連想による語を優先させる
ことができる。
しかも、特定の語を優先させるためノードの固有値メ
モリ6に記憶させる値は上記の如く種々設定できので、
ユーザをして最も使い易い形の仮名漢字変換装置を設計
することができる。
上記実施例では、ノード固有値メモリ6の出力を文章
入力の始めから終りまで語ネットワーク装置5の出力に
加える例を示したが、語選択回数を計数し、ある一定値
以上となったらノード固有値メモリ6の出力を加えない
ようにしてもよい。
また、ノード固有値メモリ6と加算器7との間に定数
乗算器を設け、語選択回数に応じてその定数を変化させ
るようにしてもよい。
本発明は上述した実施例に限定されるものではなく、
本発明の主旨を逸脱しない範囲で種々変形して実施する
ことができる。
[発明の効果] 以上詳細に説明したように、本発明によれば、連想に
よる語ネットワークと特定語の選択され易さを示すノー
ド固有値記憶手段とを融合させ、両者の出力値の和で同
音語に関する漢字変換候補の提示順序を定めるので、新
規文章を作成し始めた場合においても仮名漢字変換が適
切に行われ、実用上多大なる効果が奏せられる。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる仮名漢字変換装置の
要部概略構成図、第2図はノード固有値の記憶方式の1
例を示すフローチャート、対3図は語ネットワークの構
成例を示す説明図である。 5……語ネットワーク装置 6……ノード固有値メモリ 7……加算器

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】語または句を対応させたノードをリンクで
    結合して語ネットワークを構成し、前記各ノードの活性
    値をその語または句の選択の有無と他のノードの活性値
    及びリンク重みとに応じて定め、かつ前記各ノードの活
    性値に応じて漢字変換候補の提示順位を決定する仮名漢
    字変換装置であって、 前記語ネットワークの各ノードに対応させて該ノードが
    取り得る値の絶対値よりも絶対値が小さい値の固有値を
    記憶させた記憶手段を設け、 前記各ノードの活性値と各ノードに対応する前記固有値
    とに基づいて漢字変換候補の提示順位を決定することを
    特徴とする仮名漢字変換装置。
  2. 【請求項2】前記語ネットワーク中のノードの活性値の
    絶対値の平均値がある値よりも大きくなるか、または語
    若しくは句選択の回数がある一定回数よりも大きくなる
    か、の少なくとも一方の条件を満たした場合には、前記
    各ノードの活性値のみに基づいて、漢字変換候補の提示
    順位を決定することを特徴とする請求項1に記載の仮名
    漢字変換装置。
  3. 【請求項3】前記ノード固有値は、語または句の選ばれ
    易さを表わす値とされ、ユーザ選択率の高い語または句
    であるほど大きな値とされることを特徴とする請求項1
    に記載の仮名漢字変換装置。
  4. 【請求項4】前記ノード固有値は、以前に仮名漢字変換
    を行ったときの語ネットワークのノードの値を用いて作
    成されることを特徴とする請求項1に記載の仮名漢字変
    換装置。
  5. 【請求項5】前記ノード固有値は、以前に仮名漢字変換
    を行ったときの語ネットワークのノードの値に1より小
    さい正の値を掛けて、その値がある基準値以下の場合に
    はその基準値に変更し、各算出された値と語または句の
    選択の程度を表わす値とを加えて作成することを特徴と
    する請求項4に記載の仮名漢字変換装置。
JP2067185A 1990-03-19 1990-03-19 仮名漢字変換装置 Expired - Fee Related JP2994681B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2067185A JP2994681B2 (ja) 1990-03-19 1990-03-19 仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2067185A JP2994681B2 (ja) 1990-03-19 1990-03-19 仮名漢字変換装置

Publications (2)

Publication Number Publication Date
JPH03268161A JPH03268161A (ja) 1991-11-28
JP2994681B2 true JP2994681B2 (ja) 1999-12-27

Family

ID=13337587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2067185A Expired - Fee Related JP2994681B2 (ja) 1990-03-19 1990-03-19 仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JP2994681B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006085565A1 (ja) * 2005-02-08 2006-08-17 Nippon Telegraph And Telephone Corporation 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006085565A1 (ja) * 2005-02-08 2006-08-17 Nippon Telegraph And Telephone Corporation 情報通信端末、情報通信システム、情報通信方法、情報通信プログラムおよびそれを記録した記録媒体

Also Published As

Publication number Publication date
JPH03268161A (ja) 1991-11-28

Similar Documents

Publication Publication Date Title
EP0720106A2 (en) System for generating natural language information from information expressed by concept and method therefor
JP6676109B2 (ja) 発話文生成装置とその方法とプログラム
WO2008098507A1 (fr) Méthode de saisie permettant de combiner des mots de façon intelligente, système associé à la méthode de saisie et méthode de renouvellement
CN110083681A (zh) 基于数据分析的搜索方法、装置及终端
CN112185361B (zh) 一种语音识别模型训练方法、装置、电子设备及存储介质
TW200415573A (en) Adaptive context sensitive analysis
JP2020135135A (ja) 対話コンテンツ作成支援方法およびシステム
JP4967037B2 (ja) 情報検索装置、情報検索方法、端末装置、およびプログラム
JP2022076439A (ja) 対話管理
JP4499179B1 (ja) 端末装置
JP2994681B2 (ja) 仮名漢字変換装置
JP3566977B2 (ja) 自然言語処理装置及びその方法
JP3499658B2 (ja) 対話支援装置
JP3123836B2 (ja) テキスト型データベース装置
GB2503223A (en) Redrafting text strings using a vocabulary
Lee N-Gram Language Model
JP5439028B2 (ja) 情報検索装置、情報検索方法、およびプログラム
JP2783597B2 (ja) 仮名漢字変換装置
JP5860861B2 (ja) 焦点推定装置、モデル学習装置、方法、及びプログラム
JP2000259627A (ja) 自然言語文関係判定装置、自然言語文関係判定方法およびこれを用いた検索装置、検索方法ならびに記録媒体
Nalbandian et al. A Speech Interface to the PENG^ ASP ASP System
JP2765618B2 (ja) 言語解析装置
JP3622841B2 (ja) かな漢字変換装置およびかな漢字変換方法
Guta INSTITUTE OF TECHNOLOGY SCHOOL OF COMPUTING
JP3358100B2 (ja) 日本語質問メッセージ解析方法及び装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees