JP3049502B2 - かな漢字変換装置 - Google Patents
かな漢字変換装置Info
- Publication number
- JP3049502B2 JP3049502B2 JP63304655A JP30465588A JP3049502B2 JP 3049502 B2 JP3049502 B2 JP 3049502B2 JP 63304655 A JP63304655 A JP 63304655A JP 30465588 A JP30465588 A JP 30465588A JP 3049502 B2 JP3049502 B2 JP 3049502B2
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- kana
- combination
- candidates
- kanji conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は、かな文字列を受け取り、かな漢字混り文に
変換するかな漢字変換装置に関する。
変換するかな漢字変換装置に関する。
[従来の技術] 従来の技術では、かな漢字変換を行ない、文節候補を
選択し確定した結果を学習する場合、文節単位に自立語
の使用頻度情報を積算し、この頻度の高い単語を優先的
に候補とするか、あるいは最も最近使用した単語を最初
の候補とするという単語学習は一般に行なわれている。
選択し確定した結果を学習する場合、文節単位に自立語
の使用頻度情報を積算し、この頻度の高い単語を優先的
に候補とするか、あるいは最も最近使用した単語を最初
の候補とするという単語学習は一般に行なわれている。
さらに、文節区切りを学習するため2文節を対にして
見出しを付け、文節学習辞書とし、かな漢字変換の際こ
れを自立語辞書と同様に参照し、文節学習辞書の内容を
優先して文節区切りを行っていた。
見出しを付け、文節学習辞書とし、かな漢字変換の際こ
れを自立語辞書と同様に参照し、文節学習辞書の内容を
優先して文節区切りを行っていた。
例えば、かな文字列「こくりつのだいがく」の文節区
切りの候補が「国立の/大学」「国立のだ/医学」と2
通り存在し、かな漢字変換装置が何の文節学習情報がな
ければ後者を採用する場合で、オペレータが文節区切り
を変更し「国立の/大学」を選択し確定すると文節学習
辞書に「こくりつのだいがく=国立の/大学」と登録
し、次に「こくりつのだいがく」と入力されたならば、
かな漢字変換装置は文節学習辞書を参照し「国立の/大
学」という文節区切りを採択するという方法である。
切りの候補が「国立の/大学」「国立のだ/医学」と2
通り存在し、かな漢字変換装置が何の文節学習情報がな
ければ後者を採用する場合で、オペレータが文節区切り
を変更し「国立の/大学」を選択し確定すると文節学習
辞書に「こくりつのだいがく=国立の/大学」と登録
し、次に「こくりつのだいがく」と入力されたならば、
かな漢字変換装置は文節学習辞書を参照し「国立の/大
学」という文節区切りを採択するという方法である。
[発明が解決しようとする課題] 従来の技術では、2文節をそのまま登録するため、こ
れに何らかの付属語の結合は許されず、前の例をとれ
ば、「こくりつのだいがく=国立の/大学」が登録され
た場合、次に「こくりつのだいがくにゆく」と入力され
た場合、文節学習辞書の内容を優先に採択すれば「国立
の/大学/荷/行く」となり、そうでなければ「国立の
だ/医学に/行く」とまったく文節学習辞書の内容が反
映されない結果となってしまう。
れに何らかの付属語の結合は許されず、前の例をとれ
ば、「こくりつのだいがく=国立の/大学」が登録され
た場合、次に「こくりつのだいがくにゆく」と入力され
た場合、文節学習辞書の内容を優先に採択すれば「国立
の/大学/荷/行く」となり、そうでなければ「国立の
だ/医学に/行く」とまったく文節学習辞書の内容が反
映されない結果となってしまう。
また「こくりつのだいがく=国立の/大学」は学習さ
れていても、自立語が同一で付属語の違う組み合わせ例
えば「こくりつもだいがく」を変換する場合には全く適
用できず「国立もだ/医学」と変換されてしまうという
問題点があった。
れていても、自立語が同一で付属語の違う組み合わせ例
えば「こくりつもだいがく」を変換する場合には全く適
用できず「国立もだ/医学」と変換されてしまうという
問題点があった。
本発明は、上記欠点を解消し、変換効率の良いかな漢
字変換装置を提供する事を目的とする。
字変換装置を提供する事を目的とする。
[課題を解決する為の手段] これらの問題を解決するためになされた本発明のかな
漢字変換装置は、キーボード等の入力装置より入力され
たかな文字列をかな漢字混じり文に変換し、出力部に出
力するかな漢字変換装置において、 入力されたかな文字列を受け取るかな受取部と、 自立語および付属語について、その読み,変換文字列
および語相互間の連結のしやすさを数値化した値とを記
憶する辞書と、 前記辞書を参照しつつ、該受け取ったかな文字列を文
節に分かち書きして複数の文節候補を生成し、該複数の
文節候補の組み合わせについて、前記数値化された値を
用いて求めた評価値に基づいて、前記文節候補のうち最
も確からしい文節候補の組み合わせを表示する文節候補
表示手段と、 前記文節候補の組み合わせの一つが選ばれたとき、該
組み合わされた文節候補について、該文節を構成する自
立語同士の組み合わせを記憶する記憶手段と、 前記文節候補表示手段による文節候補の組み合わせの
表示に際して、前記記憶手段により記憶された自立語同
士の組み合わせが該文節候補の組み合わせに存在する場
合には、前記評価値の演算に付加的な演算を行なって、
該記憶された自立語同士の組み合わせを含む文節の組み
合わせを生じやすくする文節候補表示補助手段と を備えたことを特徴とする。
漢字変換装置は、キーボード等の入力装置より入力され
たかな文字列をかな漢字混じり文に変換し、出力部に出
力するかな漢字変換装置において、 入力されたかな文字列を受け取るかな受取部と、 自立語および付属語について、その読み,変換文字列
および語相互間の連結のしやすさを数値化した値とを記
憶する辞書と、 前記辞書を参照しつつ、該受け取ったかな文字列を文
節に分かち書きして複数の文節候補を生成し、該複数の
文節候補の組み合わせについて、前記数値化された値を
用いて求めた評価値に基づいて、前記文節候補のうち最
も確からしい文節候補の組み合わせを表示する文節候補
表示手段と、 前記文節候補の組み合わせの一つが選ばれたとき、該
組み合わされた文節候補について、該文節を構成する自
立語同士の組み合わせを記憶する記憶手段と、 前記文節候補表示手段による文節候補の組み合わせの
表示に際して、前記記憶手段により記憶された自立語同
士の組み合わせが該文節候補の組み合わせに存在する場
合には、前記評価値の演算に付加的な演算を行なって、
該記憶された自立語同士の組み合わせを含む文節の組み
合わせを生じやすくする文節候補表示補助手段と を備えたことを特徴とする。
特に、前記文節候補表示手段および文節候補表示補助
手段により行われる前記評価値の演算は、加減算とする
ことができる。
手段により行われる前記評価値の演算は、加減算とする
ことができる。
また、本発明の他のかな漢字変換装置は、上記構成に
おいて、更に、 前記文節候補表示手段が生成した複数の文節候補のう
ち、前記加減算して得られた値が等しい組み合わせが複
数得られた場合には、前記記憶された自立語同士の組み
合わせが存在する文節候補の組み合わせを優先する文節
優先手段を備えることを特徴とする。
おいて、更に、 前記文節候補表示手段が生成した複数の文節候補のう
ち、前記加減算して得られた値が等しい組み合わせが複
数得られた場合には、前記記憶された自立語同士の組み
合わせが存在する文節候補の組み合わせを優先する文節
優先手段を備えることを特徴とする。
[作用] 本発明の場合、キーボード等の入力装置より入力され
た、べた書きかな文字列をかな漢字混り文に変換し、出
力部に出力するかな漢字変換装置において、まずかな受
取部がかな文字列を受け取る。
た、べた書きかな文字列をかな漢字混り文に変換し、出
力部に出力するかな漢字変換装置において、まずかな受
取部がかな文字列を受け取る。
かな受取部が受け取ったかな文字列について、文節候
補表示手段が、文節分かち書きを行なって、文節候補の
うち最も確からしい文節候補の組み合わせを表示する
が、この処理は次にように行なわれる。まず、予め、辞
書に、自立語および付属語について、その読み,変換文
字列および語相互間の連結のしやすさを数値化した値と
を記憶しておく。数値化されたこの値は、例えば「形容
詞」+「名詞」ならば接続する可能性が高いといった品
詞情報間の結合コストとして用意しても良いし、2文節
間の結合の強度を共起性(2文節が同時に用いられる用
いられやすさ)により数値化して用意しても良い。ある
いは両方を用意する事も可能である。文節候補表示手段
は、辞書に登録してあるこれらの数値を参照しつつ、最
も確からしい文節候補の組み合わせを表示する。
補表示手段が、文節分かち書きを行なって、文節候補の
うち最も確からしい文節候補の組み合わせを表示する
が、この処理は次にように行なわれる。まず、予め、辞
書に、自立語および付属語について、その読み,変換文
字列および語相互間の連結のしやすさを数値化した値と
を記憶しておく。数値化されたこの値は、例えば「形容
詞」+「名詞」ならば接続する可能性が高いといった品
詞情報間の結合コストとして用意しても良いし、2文節
間の結合の強度を共起性(2文節が同時に用いられる用
いられやすさ)により数値化して用意しても良い。ある
いは両方を用意する事も可能である。文節候補表示手段
は、辞書に登録してあるこれらの数値を参照しつつ、最
も確からしい文節候補の組み合わせを表示する。
ここで、表示された候補が所望のものでない場合など
で、使用者により他の文節が選択されたり文節長の変更
などが行なわれるなどして、その後文節候補の組み合わ
せの一つが選ばれると、選ばれた文節候補の組み合わせ
について、その文節を構成する自立語同士の組み合わせ
を、記憶手段が記憶する。こうして一旦共に用いられた
自立語同士が記憶されると、文節候補表示手段が、文節
候補の組み合わせの表示に際して、この情報を評価値の
演算に利用するのである。即ち、文節候補表示手段によ
って文節候補の組み合わせについて数値化された値を用
いて評価値を求めるのに際して、記憶された自立語同士
の組み合わせが存在する文節候補について、文節候補表
示補助手段が、文節候補表示手段による評価値の演算に
付加的な演算を行なって、この自立語同士の組み合わせ
が存在する文節候補の組み合わせを生じやすくするので
ある。
で、使用者により他の文節が選択されたり文節長の変更
などが行なわれるなどして、その後文節候補の組み合わ
せの一つが選ばれると、選ばれた文節候補の組み合わせ
について、その文節を構成する自立語同士の組み合わせ
を、記憶手段が記憶する。こうして一旦共に用いられた
自立語同士が記憶されると、文節候補表示手段が、文節
候補の組み合わせの表示に際して、この情報を評価値の
演算に利用するのである。即ち、文節候補表示手段によ
って文節候補の組み合わせについて数値化された値を用
いて評価値を求めるのに際して、記憶された自立語同士
の組み合わせが存在する文節候補について、文節候補表
示補助手段が、文節候補表示手段による評価値の演算に
付加的な演算を行なって、この自立語同士の組み合わせ
が存在する文節候補の組み合わせを生じやすくするので
ある。
例えば、評価値のこうした演算に最も簡便な加減算を
採用し、ある自立語を含む文節とこれに続く自立語を含
む文節の結合コストを、結合しやすい組み合わせほど小
さな値に設定しておき、更に記憶手段に記憶された自立
語同士の組み合わせが存在する場合については、付加的
な加減算として一定の数値を減算するものとし、複数の
文節候補の組み合わせのうち、加減算した値が最も小さ
いものを最も確からしい文節候補の組み合わせとして表
示するものとすることができる。かかる構成によれば、
記憶手段に記憶された自立語同士の組み合わせが含まれ
る文節候補の組み合わせが選ばれやすくなる。もとよ
り、記憶手段に記憶された自立語同士の組み合わせが含
まれない文節候補の組み合わせであっても、加減算した
結果が、記憶手段に記憶された自立語同士の組み合わせ
が含まれる文節候補の組み合わせについて付加的な加減
算も行なった結果より小さな値となっていれば、記憶手
段に記憶された自立語同士の組み合わせが含まれない文
節候補の組み合わせの方が優先的に表示されることにな
る。この点をもう少し具体的に、例を挙げて説明する。
まず、文節間の結合のし易さを文節コストテーブルの形
を予め記憶しておく。
採用し、ある自立語を含む文節とこれに続く自立語を含
む文節の結合コストを、結合しやすい組み合わせほど小
さな値に設定しておき、更に記憶手段に記憶された自立
語同士の組み合わせが存在する場合については、付加的
な加減算として一定の数値を減算するものとし、複数の
文節候補の組み合わせのうち、加減算した値が最も小さ
いものを最も確からしい文節候補の組み合わせとして表
示するものとすることができる。かかる構成によれば、
記憶手段に記憶された自立語同士の組み合わせが含まれ
る文節候補の組み合わせが選ばれやすくなる。もとよ
り、記憶手段に記憶された自立語同士の組み合わせが含
まれない文節候補の組み合わせであっても、加減算した
結果が、記憶手段に記憶された自立語同士の組み合わせ
が含まれる文節候補の組み合わせについて付加的な加減
算も行なった結果より小さな値となっていれば、記憶手
段に記憶された自立語同士の組み合わせが含まれない文
節候補の組み合わせの方が優先的に表示されることにな
る。この点をもう少し具体的に、例を挙げて説明する。
まず、文節間の結合のし易さを文節コストテーブルの形
を予め記憶しておく。
文節コストテーブルには2文節間の結合の強度を指定
するため共起性に基づく接合コスト(例えば0〜2)が
登録されている。文節候補は自文節コスト(例えば2)
と先頭文節から自文節までの文節コストの和より接合コ
ストの和を引いた最小の値(以降総コストという)とを
持っている。総コストは、当該文節の前に付く文節に自
文節コストを加え、接合コストを引くと共に、単語間学
習辞書を検索し、連接する2文節の自立語が一致した場
合は、最も接合しやすいと判断し、さらに学習コスト
(例えば2)を引いた最少の値を総コストとする。また
ここで学習コストを引いた文節候補には、学習マークを
付ける。
するため共起性に基づく接合コスト(例えば0〜2)が
登録されている。文節候補は自文節コスト(例えば2)
と先頭文節から自文節までの文節コストの和より接合コ
ストの和を引いた最小の値(以降総コストという)とを
持っている。総コストは、当該文節の前に付く文節に自
文節コストを加え、接合コストを引くと共に、単語間学
習辞書を検索し、連接する2文節の自立語が一致した場
合は、最も接合しやすいと判断し、さらに学習コスト
(例えば2)を引いた最少の値を総コストとする。また
ここで学習コストを引いた文節候補には、学習マークを
付ける。
かな漢字変換部は、文節候補をすべて作成し終わる
と、最終文節の総コストが最少の文節を最終文節とする
接合可能な文節列の文節区切りをかな漢字変換の結果と
して認識する。ここで同一コストで複数の文節区切りが
存在した場合は、学習マークの付いた文節を含む文節区
切りを採用する。これでも特定できない場合は、最初に
作成された文節区切りを採用する。
と、最終文節の総コストが最少の文節を最終文節とする
接合可能な文節列の文節区切りをかな漢字変換の結果と
して認識する。ここで同一コストで複数の文節区切りが
存在した場合は、学習マークの付いた文節を含む文節区
切りを採用する。これでも特定できない場合は、最初に
作成された文節区切りを採用する。
こうして得られた文節区切りを用いて文節分かち書き
をして、文節候補を表示するが、表示された文節候補が
非所望なものであったり、文節長が間違っていたりした
場合には、オペレータによる訂正が行なわれ、最終的に
は所望の文節の組み合わせが表示される。ここで、所望
の文節候補が得られたならば確定し、これを出力する。
このとき、選ばれた文節候補の組み合わせについて、そ
の文節を構成する自立語同士の組み合わせに学習マーク
を付けて学習する。学習された自立語同士の組み合わせ
は、上述したように、それ以後の変換において参照され
る。例えば、上述した評価値の演算として極めて単純な
加減算を採用する場合には、連接する2文節の自立語が
一致すると、学習コスト(例えば2)を減算するという
形で、文節候補の組み合わせの確からしさを決定する総
コストを低減するのである。記憶手段によるこれら自立
語同士の組み合わせは、例えば、[前文節自立語見出
し]+[後文節自立語見出し]+[前文節自立語]+
[後文節自立語]という形式で登録する([ ]で区切
られる部分はセパレータなどで完全に区切れるものとす
る。) [実施例] ここで、以下に本発明の詳細を示した実施例に基づい
て、説明する。
をして、文節候補を表示するが、表示された文節候補が
非所望なものであったり、文節長が間違っていたりした
場合には、オペレータによる訂正が行なわれ、最終的に
は所望の文節の組み合わせが表示される。ここで、所望
の文節候補が得られたならば確定し、これを出力する。
このとき、選ばれた文節候補の組み合わせについて、そ
の文節を構成する自立語同士の組み合わせに学習マーク
を付けて学習する。学習された自立語同士の組み合わせ
は、上述したように、それ以後の変換において参照され
る。例えば、上述した評価値の演算として極めて単純な
加減算を採用する場合には、連接する2文節の自立語が
一致すると、学習コスト(例えば2)を減算するという
形で、文節候補の組み合わせの確からしさを決定する総
コストを低減するのである。記憶手段によるこれら自立
語同士の組み合わせは、例えば、[前文節自立語見出
し]+[後文節自立語見出し]+[前文節自立語]+
[後文節自立語]という形式で登録する([ ]で区切
られる部分はセパレータなどで完全に区切れるものとす
る。) [実施例] ここで、以下に本発明の詳細を示した実施例に基づい
て、説明する。
第1図は、本発明のかな漢字変換装置を示す図であ
る。図中符号1は入力部2より入力されたデータに基づ
きシステム全体の制御を行う中央処理装置(CPU)であ
る。このCPUにより総ての装置の制御がおこなわれ、入
力部2と出力部3はCPU1と入出力制御部5により段階的
に制御される。
る。図中符号1は入力部2より入力されたデータに基づ
きシステム全体の制御を行う中央処理装置(CPU)であ
る。このCPUにより総ての装置の制御がおこなわれ、入
力部2と出力部3はCPU1と入出力制御部5により段階的
に制御される。
入力部2で入力された仮名文字列はべた書きで変換部
6に送られ、変換部6では、まず、かな受取部9により
入力部2から入力されたかな文字を受け取り、かな漢字
変換部8に送る。
6に送られ、変換部6では、まず、かな受取部9により
入力部2から入力されたかな文字を受け取り、かな漢字
変換部8に送る。
かな漢字変換部8はこのかな文字列に基づき、自立語
辞書12と付属語辞書11を検索しながら、単語候補を単語
候補格納部10に格納し、これを基に自立語と付属語が結
合するか否かを単語結合レーブル14により検定し、自立
語に対し結合するすべての付属語、ならびに、その付属
語に結合しうる付属語にいたるまで自立語+付属語群を
形成し文節に組み上げ文節候補格納部9に格納する。
辞書12と付属語辞書11を検索しながら、単語候補を単語
候補格納部10に格納し、これを基に自立語と付属語が結
合するか否かを単語結合レーブル14により検定し、自立
語に対し結合するすべての付属語、ならびに、その付属
語に結合しうる付属語にいたるまで自立語+付属語群を
形成し文節に組み上げ文節候補格納部9に格納する。
文節コストテーブル15には2文節間の結合の強度を指
定するため共起性に基づく接合コスト(あらかじめ0〜
2に分類しておく。)が登録されている。文節候補は自
文節コスト(2とする。)と先頭文節から自文節までの
文節コストの和より接合コストの和を引いた最少の値
(以降総コストという)とを持っている。総コストは、
当該文節の前に付く文節に自文節コストを加え、接合コ
ストを引くと共に、単語間学習辞書13を検索し、連接す
る2文節の自立語が一致した場合は、最も接合しやすい
と判断し、さらに学習コスト(2とする。)を引いた最
少の値を総コストとする。またここで学習コストを引い
た文節候補には、学習マークを付ける。
定するため共起性に基づく接合コスト(あらかじめ0〜
2に分類しておく。)が登録されている。文節候補は自
文節コスト(2とする。)と先頭文節から自文節までの
文節コストの和より接合コストの和を引いた最少の値
(以降総コストという)とを持っている。総コストは、
当該文節の前に付く文節に自文節コストを加え、接合コ
ストを引くと共に、単語間学習辞書13を検索し、連接す
る2文節の自立語が一致した場合は、最も接合しやすい
と判断し、さらに学習コスト(2とする。)を引いた最
少の値を総コストとする。またここで学習コストを引い
た文節候補には、学習マークを付ける。
かな漢字変換部8は、文節候補をすべて作成し終わる
と、最終文節の総コストが最少の文節を最終文節とする
接合可能な文節列の文節区切りをかな漢字変換の結果と
して認識する。ここで同一コストで複数の文節区切りが
存在した場合は、学習マークの付いた文節を含む文節区
切りを採用する。これでも特定できない場合は、最初に
作成された文節区切りを採用する。
と、最終文節の総コストが最少の文節を最終文節とする
接合可能な文節列の文節区切りをかな漢字変換の結果と
して認識する。ここで同一コストで複数の文節区切りが
存在した場合は、学習マークの付いた文節を含む文節区
切りを採用する。これでも特定できない場合は、最初に
作成された文節区切りを採用する。
文節区切りができあがったら、文節区切り単位に同音
異字語を選択するため候補選択部18は、当該文節区切り
に基づき第1文節候補群を表示部4に表示し、オペレー
タの指示に従い文節候補格納部9から当該文節の前候補
・次候補を表示する。オペレータは、これにより文節単
位に同音異字語を選択し、所望のかな漢字文字列を確定
するが、文節区切りそのものが所望のものでない場合
は、オペレータは文節区切り変更部17により文節区切り
位置を変更する。文節区切り変更部17は文節区切りが変
更されると、位置の修正情報をかな漢字変換8に通知す
る。
異字語を選択するため候補選択部18は、当該文節区切り
に基づき第1文節候補群を表示部4に表示し、オペレー
タの指示に従い文節候補格納部9から当該文節の前候補
・次候補を表示する。オペレータは、これにより文節単
位に同音異字語を選択し、所望のかな漢字文字列を確定
するが、文節区切りそのものが所望のものでない場合
は、オペレータは文節区切り変更部17により文節区切り
位置を変更する。文節区切り変更部17は文節区切りが変
更されると、位置の修正情報をかな漢字変換8に通知す
る。
かな漢字変換部8は、文節候補格納部9より、これに
適合する文節候補を検索し、再度文節区切りを作成する
が、存在しない場合は、当該文節区切りを1文節とする
よう自立語辞書12と付属語辞書11を検索し、最初の変換
と同様に単語結合テーブル14を用いて文節候補を作成
し、再度文節区切りを作成し、候補選択部18に新たな文
節区切りによる文節候補を選択せしめるよう指示を与
え、候補選択部18により、オペレータは新たな文節候補
による文節候補選択を行うことになる。
適合する文節候補を検索し、再度文節区切りを作成する
が、存在しない場合は、当該文節区切りを1文節とする
よう自立語辞書12と付属語辞書11を検索し、最初の変換
と同様に単語結合テーブル14を用いて文節候補を作成
し、再度文節区切りを作成し、候補選択部18に新たな文
節区切りによる文節候補を選択せしめるよう指示を与
え、候補選択部18により、オペレータは新たな文節候補
による文節候補選択を行うことになる。
ここで所望の文節候補を得たならば確定し、漢字出力
部19は、指定された文節候補を1文章として出力部3に
出力する。この時、変換結果学習部16は確定された文節
候補群をかな漢字変換部8より受け取り、2文節単位に
前文節の自立語と後文節の自立語をセットにして、各々
の自立語の見出しをもつ状態、すなわち[前文節自立語
見出し][かな区切りマーク][後文節自立語見出し]
[見出し終了マーク][前文節自立語][漢字区切りマ
ーク][後文節自立語][1単語間学習データ終了マー
ク]というレコード形式で単語間学習辞書13に登録す
る。
部19は、指定された文節候補を1文章として出力部3に
出力する。この時、変換結果学習部16は確定された文節
候補群をかな漢字変換部8より受け取り、2文節単位に
前文節の自立語と後文節の自立語をセットにして、各々
の自立語の見出しをもつ状態、すなわち[前文節自立語
見出し][かな区切りマーク][後文節自立語見出し]
[見出し終了マーク][前文節自立語][漢字区切りマ
ーク][後文節自立語][1単語間学習データ終了マー
ク]というレコード形式で単語間学習辞書13に登録す
る。
第2図は、本発明のかな漢字変換装置の単語間学習辞
書に何も登録されていない場合の変換例である。図中20
は入力かな文字列であり、21はその桁位置、22は自文節
コスト、23は総コスト、24は文節候補文字列とする。
書に何も登録されていない場合の変換例である。図中20
は入力かな文字列であり、21はその桁位置、22は自文節
コスト、23は総コスト、24は文節候補文字列とする。
かな第1桁より自立語辞書、付属語辞書を検索し順次
文節候補を作成してゆくと図のようなコスト付けがなさ
れる。また、ここでは当該桁位置の文節候補の前候補と
なる文節でかつ結合可能で最少コストとなるものと当該
位置の文節候補との連接を行い、それ以外の文節とは連
接させない。したがって、当該桁位置の文節候補の前候
補となる文節でかつ結合可能で最少コストとなるもの以
外の文節は、当該文節の次文節には何ら影響を与えない
ことになる。
文節候補を作成してゆくと図のようなコスト付けがなさ
れる。また、ここでは当該桁位置の文節候補の前候補と
なる文節でかつ結合可能で最少コストとなるものと当該
位置の文節候補との連接を行い、それ以外の文節とは連
接させない。したがって、当該桁位置の文節候補の前候
補となる文節でかつ結合可能で最少コストとなるもの以
外の文節は、当該文節の次文節には何ら影響を与えない
ことになる。
第2図によれば、最終文節の最低コストの文節候補を
採用するため「本屋がよ/異本を」が採択される。ここ
でオペレータが文節区切り変更を行い「本屋が/良い/
本を」という文節区切りを得、この文節候補で確定した
とする。この場合、文節間学習辞書には、「本屋−良
い」「良い−本」とが共起しやすいとの情報が記憶され
る。
採用するため「本屋がよ/異本を」が採択される。ここ
でオペレータが文節区切り変更を行い「本屋が/良い/
本を」という文節区切りを得、この文節候補で確定した
とする。この場合、文節間学習辞書には、「本屋−良
い」「良い−本」とが共起しやすいとの情報が記憶され
る。
第3図は、本発明のかな漢字変換装置の単語間学習辞
書に図中31,32の情報が登録されている場合の変換例で
ある。
書に図中31,32の情報が登録されている場合の変換例で
ある。
この場合、33の「本屋が−良い」の結合時の総コスト
計算と、34の「良い−本」の結合時の総コスト計算で各
々学習コスト2が引かれ総コストが低くなっている。こ
れにより最終文節の最低コストの文節候補を採用するた
め「本屋が/良い/本を」が採択される。
計算と、34の「良い−本」の結合時の総コスト計算で各
々学習コスト2が引かれ総コストが低くなっている。こ
れにより最終文節の最低コストの文節候補を採用するた
め「本屋が/良い/本を」が採択される。
第4図は、本発明のかな漢字変換装置の単語間学習辞
書に、第3図の31,32と同じ図中41,42の情報が登録され
ており、入力文字列の4桁目が異なる場合の変換例であ
る。
書に、第3図の31,32と同じ図中41,42の情報が登録され
ており、入力文字列の4桁目が異なる場合の変換例であ
る。
この場合、図3と同様に43の「本屋は−良い」の結合
時の総コスト計算と、44の「良い−本」の結合時の総コ
スト計算で各々学習コスト2が引かれ総コストが低くな
っている。これにより最終文節の最低コストの文節候補
を採用するため「本屋は/良い/本を」が採択され、単
語間学習辞書に登録する元になった文章と異なる文章に
対しても単語間学習辞書の内容が効力を発している事を
示す。
時の総コスト計算と、44の「良い−本」の結合時の総コ
スト計算で各々学習コスト2が引かれ総コストが低くな
っている。これにより最終文節の最低コストの文節候補
を採用するため「本屋は/良い/本を」が採択され、単
語間学習辞書に登録する元になった文章と異なる文章に
対しても単語間学習辞書の内容が効力を発している事を
示す。
[発明の効果] 本発明は、次のような効果がある。
(1)文節候補の組み合わせの生じやすさを、その後の
かな漢字変換に反映させる上で、2文節間の自立語のみ
に着目しているため、付属語の変化にも耐え得る文節学
習を行える。
かな漢字変換に反映させる上で、2文節間の自立語のみ
に着目しているため、付属語の変化にも耐え得る文節学
習を行える。
(2)文節の組み合わせの確からしさを求めるために行
なわれる語相互間の連結のしやすさを決定する評価値の
演算に、記憶された自立語同士の組み合わせの生じやす
さを反映させる演算を付加的に行っているため、これら
の処理を高速に行うことが出来る。
なわれる語相互間の連結のしやすさを決定する評価値の
演算に、記憶された自立語同士の組み合わせの生じやす
さを反映させる演算を付加的に行っているため、これら
の処理を高速に行うことが出来る。
(3)しかも、上記評価値の演算として極めて単純な加
減算を採用すれば、文節候補の選択と学習結果の反映と
を高速に達成することが出来る。
減算を採用すれば、文節候補の選択と学習結果の反映と
を高速に達成することが出来る。
(4)更に、付加的に行なわれる演算結果により、優先
される文節候補の組み合わせが決まるから、記憶された
自立語同士の組み合わせが常に最優先される訳ではな
く、文節候補の表示に柔軟性がある。
される文節候補の組み合わせが決まるから、記憶された
自立語同士の組み合わせが常に最優先される訳ではな
く、文節候補の表示に柔軟性がある。
第1図は、本発明の文節変換装置を示すブロック図であ
る。 第2図は、本発明のかな漢字変換装置の単語間学習辞書
に何も登録されていない場合の変換例を示す図である。 第3図は、本発明のかな漢字変換装置の単語間学習辞書
に有効な情報が登録されている場合の変換例を示す図で
ある。 第4図は、第3図の単語間学習辞書と同じ情報で、第3
図の入力文字列と若干異なる文字列を入力した場合の変
換例を示す図である。 13……単語間学習辞書 16……変換結果学習部
る。 第2図は、本発明のかな漢字変換装置の単語間学習辞書
に何も登録されていない場合の変換例を示す図である。 第3図は、本発明のかな漢字変換装置の単語間学習辞書
に有効な情報が登録されている場合の変換例を示す図で
ある。 第4図は、第3図の単語間学習辞書と同じ情報で、第3
図の入力文字列と若干異なる文字列を入力した場合の変
換例を示す図である。 13……単語間学習辞書 16……変換結果学習部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭60−235271(JP,A) 特開 昭62−121570(JP,A) 特開 昭58−166435(JP,A) 特開 昭60−189069(JP,A) 特開 昭56−145459(JP,A) 特開 昭58−82368(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 15/20 G06F 15/38
Claims (3)
- 【請求項1】キーボード等の入力装置より入力されたか
な文字列をかな漢字混じり文に変換し、出力部に出力す
るかな漢字変換装置において、 入力されたかな文字列を受け取るかな受取部と、 自立語および付属語について、その読み,変換文字列お
よび語相互間の連結のしやすさを数値化した値とを記憶
する辞書と、 前記辞書を参照しつつ、該受け取ったかな文字列を文節
に分かち書きして複数の文節候補を生成し、該複数の文
節候補の組み合わせについて、前記数値化された値を用
いて求めた評価値に基づいて、前記文節候補のうち最も
確からしい文節候補の組み合わせを表示する文節候補表
示手段と、 前記文節候補の組み合わせの一つが選ばれたとき、該組
み合わされた文節候補について、該文節を構成する自立
語同士の組み合わせを記憶する記憶手段と、 前記文節候補表示手段による文節候補の組み合わせの表
示に際して、前記記憶手段により記憶された自立語同士
の組み合わせが該文節候補の組み合わせに存在する場合
には、前記評価値の演算に付加的な演算を行なって、該
記憶された自立語同士の組み合わせを含む文節の組み合
わせを生じやすくする文節候補表示補助手段と を備えたかな漢字変換装置。 - 【請求項2】請求項1記載に記載のかな漢字変換装置で
あって、 前記文節候補表示手段および文節候補表示補助手段によ
り行われる評価値の演算は、加減算であるかな漢字変換
装置。 - 【請求項3】請求項2に記載のかな漢字変換装置であっ
て、 前記文節候補表示手段が生成した複数の文節候補のう
ち、前記加減算して得られた値が等しい組み合わせが複
数得られた場合には、前記記憶された自立語同士の組み
合わせが存在する文節候補の組み合わせを優先する文節
優先手段を備えるかな漢字変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63304655A JP3049502B2 (ja) | 1988-12-01 | 1988-12-01 | かな漢字変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63304655A JP3049502B2 (ja) | 1988-12-01 | 1988-12-01 | かな漢字変換装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02150956A JPH02150956A (ja) | 1990-06-11 |
JP3049502B2 true JP3049502B2 (ja) | 2000-06-05 |
Family
ID=17935639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63304655A Expired - Lifetime JP3049502B2 (ja) | 1988-12-01 | 1988-12-01 | かな漢字変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3049502B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS58166435A (ja) * | 1982-03-29 | 1983-10-01 | Fujitsu Ltd | 確率マトリツクスを用いたカナ漢字変換方式 |
JPS60189069A (ja) * | 1984-03-08 | 1985-09-26 | Matsushita Electric Ind Co Ltd | かな漢字変換装置 |
JPS60235271A (ja) * | 1984-05-08 | 1985-11-21 | Toshiba Corp | かな漢字変換装置 |
JPS62121570A (ja) * | 1985-11-22 | 1987-06-02 | Fujitsu Ltd | 接続確率に基づく連文節変換処理方式 |
-
1988
- 1988-12-01 JP JP63304655A patent/JP3049502B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH02150956A (ja) | 1990-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH096787A (ja) | 訳振り機械翻訳装置 | |
JPH07114558A (ja) | 漢字変換訂正処理方式 | |
JP3049502B2 (ja) | かな漢字変換装置 | |
JP2595934B2 (ja) | 仮名漢字変換処理装置 | |
JPH11238051A (ja) | 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体 | |
JPH07104861B2 (ja) | かな漢字変換装置及びその方法 | |
JP3438913B2 (ja) | 文書処理装置 | |
JPH06168230A (ja) | 対話型単語登録方式 | |
JP3118880B2 (ja) | 日本語文章処理装置 | |
JPS60112175A (ja) | 仮名漢字変換装置における略称語変換方式 | |
JP2000330998A (ja) | 発音電子辞書 | |
JPH06208559A (ja) | 中国語漢字変換装置 | |
JPH01185766A (ja) | かな漢字変換装置 | |
JPH07129577A (ja) | 文書校正支援装置 | |
JPH05242074A (ja) | 仮名漢字変換処理装置 | |
JPH0267676A (ja) | 漢数字変換処理装置 | |
JPH0719254B2 (ja) | カナ漢字変換装置 | |
JPH0831098B2 (ja) | 文書作成装置 | |
JPS60140460A (ja) | カナ漢字変換装置における短縮変換方式 | |
JPH04280369A (ja) | 機械翻訳装置 | |
JPH04256159A (ja) | かな漢字変換装置 | |
JPS6210762A (ja) | 仮名漢字変換方式 | |
JPH08287058A (ja) | かな漢字変換装置 | |
JPH05174018A (ja) | かな漢字変換装置 | |
JPS61282966A (ja) | 仮名漢字変換方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080331 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090331 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090331 Year of fee payment: 9 |