JP2899087B2 - 文字処理装置 - Google Patents
文字処理装置Info
- Publication number
- JP2899087B2 JP2899087B2 JP2229672A JP22967290A JP2899087B2 JP 2899087 B2 JP2899087 B2 JP 2899087B2 JP 2229672 A JP2229672 A JP 2229672A JP 22967290 A JP22967290 A JP 22967290A JP 2899087 B2 JP2899087 B2 JP 2899087B2
- Authority
- JP
- Japan
- Prior art keywords
- candidate
- word
- phrase
- learning
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は、仮名漢字変換により漢字仮名混り文を入力
する文字処理装置に関する。
する文字処理装置に関する。
[従来の技術] 現在、日本ワードプロセッサなどの文字処理装置は漢
字仮名混り文の入力を仮名漢字変換を使って行なうこと
が一般的である。
字仮名混り文の入力を仮名漢字変換を使って行なうこと
が一般的である。
仮名漢字変換は辞書を参照することにより、入力され
た読み列を漢字に変換するものである。辞書においては
各単語に対して名詞、サ変名詞、副詞、形容詞、形容動
詞等の品詞情報が記述されており、仮名漢字変換は読み
列を解析して可能な文節候補を作成し、それらを組み合
わせて変換候補を決定し、尤もらしい順に提示する。そ
して、提示された変換候補の中からオペレータが望む候
補を選択する。
た読み列を漢字に変換するものである。辞書においては
各単語に対して名詞、サ変名詞、副詞、形容詞、形容動
詞等の品詞情報が記述されており、仮名漢字変換は読み
列を解析して可能な文節候補を作成し、それらを組み合
わせて変換候補を決定し、尤もらしい順に提示する。そ
して、提示された変換候補の中からオペレータが望む候
補を選択する。
例えば、読み列「しようがわるい」に対しては「使用
が」「仕様が」「使用」「仕様」「死」「悪い」「和」
「類」「側」「面」「用が」「用」などの文節候補が作
成され、これらを組み合わせた「使用が悪い」「仕様が
悪い」「使用側類」「使用が和類」などが変換候補とし
て出力表示される。オペレータはこのように提示された
変換候補の中から自分の望む「仕様が悪い」を選択確定
することになるわけである。
が」「仕様が」「使用」「仕様」「死」「悪い」「和」
「類」「側」「面」「用が」「用」などの文節候補が作
成され、これらを組み合わせた「使用が悪い」「仕様が
悪い」「使用側類」「使用が和類」などが変換候補とし
て出力表示される。オペレータはこのように提示された
変換候補の中から自分の望む「仕様が悪い」を選択確定
することになるわけである。
ところで、「しようがわるい」と入力する度に毎回
「仕様が悪い」を選択させるのでは操作が煩雑に過ぎる
ので、一度選択操作を行なうと次回からはその通りに変
換される学習機能というものが提供されるのが一般的で
ある。
「仕様が悪い」を選択させるのでは操作が煩雑に過ぎる
ので、一度選択操作を行なうと次回からはその通りに変
換される学習機能というものが提供されるのが一般的で
ある。
この学習機能の最も単純なものは各単語に学習フラグ
を1ビット用意し、単語が選択されたときに学習フラグ
をONし、仮名漢字変換時には学習フラグがONになってい
る単語を優先的に変換するという仕掛により実現でき
る。ただし、これだけでは、変換候補の中の2つの単語
を交互に使用した場合、両方の単語の学習フラグがONに
なってしまう。その結果、片方の単語だけが常に第1位
に変換され、他方の単語については学習効果が得られな
くなるので、ある単語の学習フラグをONすると同時に対
立候補(選択単語よりも高い優先度で変換された候補)
の学習フラグをOFFするという処理も一般に行なわれて
いる。
を1ビット用意し、単語が選択されたときに学習フラグ
をONし、仮名漢字変換時には学習フラグがONになってい
る単語を優先的に変換するという仕掛により実現でき
る。ただし、これだけでは、変換候補の中の2つの単語
を交互に使用した場合、両方の単語の学習フラグがONに
なってしまう。その結果、片方の単語だけが常に第1位
に変換され、他方の単語については学習効果が得られな
くなるので、ある単語の学習フラグをONすると同時に対
立候補(選択単語よりも高い優先度で変換された候補)
の学習フラグをOFFするという処理も一般に行なわれて
いる。
[発明が解決しようとしている課題] ところが、選択単語と対立候補の特性が異なる場合、
対立候補の学習OFFが不必要な場合もある。従来は一律
に対立候補の学習をOFFするので、もし学習OFFが不必要
な状況においては、その対立候補の学習を不必要に消し
てしまったことになる。
対立候補の学習OFFが不必要な場合もある。従来は一律
に対立候補の学習をOFFするので、もし学習OFFが不必要
な状況においては、その対立候補の学習を不必要に消し
てしまったことになる。
例えば、「そうさしよう」と入力した場合を考える。
「操作しよう」「操作仕様」などの変換候補があり、
「操作しよう」は自立語+付属語のパターンとして変換
され、「操作仕様」は自立語+自立語のパターン(すな
わち、複合語)として変換されている。一般に付属語は
自立語よりも優先的に変換されるので、学習が何もされ
ていない状態では「操作しよう」が第1候補として変換
される。しかし、何らかの事情で(恐らく、「仕様」に
ついて述べた文章を入力して)、「仕様」の学習フラグ
がONであれば「操作仕様」が優先的に変換される。この
とき「仕様」を「しよう」に変更すると、「しよう」の
学習フラグがONになると同時に「仕様」の学習フラグが
OFFとなってしまう。これにより、次回から「そうさし
よう」と入力した場合は期待通りに「操作しよう」と変
換できるが、単に「しよう」と入力した場合には、学習
フラグがOFFされているため、「仕様」が第1候補では
変換されなくなってしまう。通常はより標準頻度の高い
「使用」が変換される。なお、付属語の「しよう」は単
独文節としては変換されない。
「操作しよう」「操作仕様」などの変換候補があり、
「操作しよう」は自立語+付属語のパターンとして変換
され、「操作仕様」は自立語+自立語のパターン(すな
わち、複合語)として変換されている。一般に付属語は
自立語よりも優先的に変換されるので、学習が何もされ
ていない状態では「操作しよう」が第1候補として変換
される。しかし、何らかの事情で(恐らく、「仕様」に
ついて述べた文章を入力して)、「仕様」の学習フラグ
がONであれば「操作仕様」が優先的に変換される。この
とき「仕様」を「しよう」に変更すると、「しよう」の
学習フラグがONになると同時に「仕様」の学習フラグが
OFFとなってしまう。これにより、次回から「そうさし
よう」と入力した場合は期待通りに「操作しよう」と変
換できるが、単に「しよう」と入力した場合には、学習
フラグがOFFされているため、「仕様」が第1候補では
変換されなくなってしまう。通常はより標準頻度の高い
「使用」が変換される。なお、付属語の「しよう」は単
独文節としては変換されない。
[課題を解決するための手段(及び作用)] 本発明によれば、文字処理装置に、読みを入力する入
力手段と、単語の読みと、表記と、品詞と、学習データ
とを対応づけて記憶する記憶手段と、文節の組み合わせ
に対する優先度を記憶する優先度記憶手段と、前記入力
手段より入力された文の読みに対して、前記記憶手段を
参照し、複数の文節候補からなる文候補を作成する文候
補作成手段と、該文候補作成手段により作成された各文
候補より、前記記憶手段及び前記優先度記憶手段を参照
して、各文候補中の各文節候補内の単語の学習データの
表わす優先度と各文節候補の組み合わせに対する優先度
とに基づいて、第1候補となる文候補を決定し、当該文
候補の表記を表示する第1候補表示手段と、該第1候補
表示手段により表示された各文節候補について、下位の
候補の表記を表示する次候補表示手段と、該次候補表示
手段または前記第1候補表示手段により表記が表示され
た文節候補より1つの候補を選択する選択手段と、該選
択手段により選択された文節候補中の単語の優先度を向
上させるように、当該単語の学習データを更新する学習
手段と、前記選択された文節候補と当該選択された文節
候補より上位の各候補とを比較して、当該上位の各候補
が、前記学習手段による更新後の学習データに基づく前
記選択された候補より優先されるかを判定する判定手段
と、該判定手段による判定の結果に基づいて、優先され
ると判定された候補中の単語の学習データを、当該単語
の優先度を低下させるように更新し、優先されないと判
定された候補中の単語の学習データを不変とするように
制御する抑制手段とを有することにより、選択候補中の
単語の学習データを向上させるとともに、選択候補と選
択候補より上位の候補とを比較して、選択候補より上位
の候補中の単語のうち、学習データ向上後の選択候補よ
り優先される候補中の単語の優先度を低下させ、優先さ
れない候補中の単語の学習データを不変とし、選択され
た候補以外の候補中の単語の学習データを不必要に変更
することを防止する。
力手段と、単語の読みと、表記と、品詞と、学習データ
とを対応づけて記憶する記憶手段と、文節の組み合わせ
に対する優先度を記憶する優先度記憶手段と、前記入力
手段より入力された文の読みに対して、前記記憶手段を
参照し、複数の文節候補からなる文候補を作成する文候
補作成手段と、該文候補作成手段により作成された各文
候補より、前記記憶手段及び前記優先度記憶手段を参照
して、各文候補中の各文節候補内の単語の学習データの
表わす優先度と各文節候補の組み合わせに対する優先度
とに基づいて、第1候補となる文候補を決定し、当該文
候補の表記を表示する第1候補表示手段と、該第1候補
表示手段により表示された各文節候補について、下位の
候補の表記を表示する次候補表示手段と、該次候補表示
手段または前記第1候補表示手段により表記が表示され
た文節候補より1つの候補を選択する選択手段と、該選
択手段により選択された文節候補中の単語の優先度を向
上させるように、当該単語の学習データを更新する学習
手段と、前記選択された文節候補と当該選択された文節
候補より上位の各候補とを比較して、当該上位の各候補
が、前記学習手段による更新後の学習データに基づく前
記選択された候補より優先されるかを判定する判定手段
と、該判定手段による判定の結果に基づいて、優先され
ると判定された候補中の単語の学習データを、当該単語
の優先度を低下させるように更新し、優先されないと判
定された候補中の単語の学習データを不変とするように
制御する抑制手段とを有することにより、選択候補中の
単語の学習データを向上させるとともに、選択候補と選
択候補より上位の候補とを比較して、選択候補より上位
の候補中の単語のうち、学習データ向上後の選択候補よ
り優先される候補中の単語の優先度を低下させ、優先さ
れない候補中の単語の学習データを不変とし、選択され
た候補以外の候補中の単語の学習データを不必要に変更
することを防止する。
[実施例] 以下図面を参照しながら本発明を詳細に説明する。
第1図は本発明に係る文字処理装置の全体構成の一例
である。
である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスDBを介
して、それらのバスに接続された各構成要素を制御す
る。
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスDBを介
して、それらのバスに接続された各構成要素を制御す
る。
アドレスバスABはマイクロプロセッサCPUの制御の対
象とする構成要素を指示するアドレス信号を転送する。
コントロールバスCBはマイクロプロセッサCPUの制御の
対象とする各構成要素のコントロール信号を転送して印
加する。データバスDBは各構成機器相互間のデータの転
送を行なう。
象とする構成要素を指示するアドレス信号を転送する。
コントロールバスCBはマイクロプロセッサCPUの制御の
対象とする各構成要素のコントロール信号を転送して印
加する。データバスDBは各構成機器相互間のデータの転
送を行なう。
つぎにROMは、読出し専用の固定メモリであり、第20
図〜第27図につき後述するマイクロプロセッサCPUによ
る制御の手順を記憶させておく。
図〜第27図につき後述するマイクロプロセッサCPUによ
る制御の手順を記憶させておく。
また、RAMは、1ワード16ビットの構成の書込み可能
のランダムアクセスメモリであって、各構成要素からの
各種データの一時記憶に用いる。IBUFはキー入力された
キーデータを記憶する入力バッファであり、OBUFは仮名
漢字変換された結果を一時的に記憶する出力バッファで
ある。DICは仮名漢字変換を行なうための辞書である。Y
DICは単語間の共起関係を記述した用例辞書である。BCT
BLは変換途中の文節候補を記憶する文節候補テーブルで
ある。CTBL1は文節とそれに接続する付属語間の接続規
則を記憶した文節接続マトリックスである。CTBL2は文
節とそれに接続する接尾語間の接続規則を記憶した文節
接続マトリックスである。CTBL3は接頭語とそれに接続
する文節間の接続規則を記憶した文節接続マトリックス
である。TBUFはテキストバッファであり、入力編集中の
テキストデータが記憶される。DOBUFは同音語バッファ
であり、テキストバッファTBUFに記憶される文字に同音
語候補が存在するときはその候補が記憶される。
のランダムアクセスメモリであって、各構成要素からの
各種データの一時記憶に用いる。IBUFはキー入力された
キーデータを記憶する入力バッファであり、OBUFは仮名
漢字変換された結果を一時的に記憶する出力バッファで
ある。DICは仮名漢字変換を行なうための辞書である。Y
DICは単語間の共起関係を記述した用例辞書である。BCT
BLは変換途中の文節候補を記憶する文節候補テーブルで
ある。CTBL1は文節とそれに接続する付属語間の接続規
則を記憶した文節接続マトリックスである。CTBL2は文
節とそれに接続する接尾語間の接続規則を記憶した文節
接続マトリックスである。CTBL3は接頭語とそれに接続
する文節間の接続規則を記憶した文節接続マトリックス
である。TBUFはテキストバッファであり、入力編集中の
テキストデータが記憶される。DOBUFは同音語バッファ
であり、テキストバッファTBUFに記憶される文字に同音
語候補が存在するときはその候補が記憶される。
KBはキーボードであって、アルファベットキー、ひら
がなキー、カタカナキー等の文字記号入力キー、及び、
変換キー、次候補キー、選択キー等の本文字処理装置に
対する各種機能を指示するための各種のファンクション
キーを備えている。
がなキー、カタカナキー等の文字記号入力キー、及び、
変換キー、次候補キー、選択キー等の本文字処理装置に
対する各種機能を指示するための各種のファンクション
キーを備えている。
DISKは文書データを記憶するための外部記憶部であ
り、テキストバッファTBUF上に作成された文書の保管を
行ない、保管された文書はキーボードの指示により、必
要な時呼び出される。
り、テキストバッファTBUF上に作成された文書の保管を
行ない、保管された文書はキーボードの指示により、必
要な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソル
レジスタの内容を読み書きできる。後述するCRTコント
ローラCRTCは、ここに蓄えられたアドレスに対応する表
示装置CRT上の位置にカーソルを表示する。
レジスタの内容を読み書きできる。後述するCRTコント
ローラCRTCは、ここに蓄えられたアドレスに対応する表
示装置CRT上の位置にカーソルを表示する。
DBUFは表示用バッファメモリで、表示すべきデータの
パターンを蓄える。テキストの内容を表示するときはテ
キストバッファTBUFの内容に応じて表示パターンがDBUF
に作成されることにより、表示されることになる。
パターンを蓄える。テキストの内容を表示するときはテ
キストバッファTBUFの内容に応じて表示パターンがDBUF
に作成されることにより、表示されることになる。
CRTCはカーソルレジスタCR及びバッファDBUFに蓄えら
れた内容を表示器CRTに表示する役割を担う。
れた内容を表示器CRTに表示する役割を担う。
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドット構成の表示パターンおよび
カーソルの表示をCRTコントローラで制御する。
表示装置CRTにおけるドット構成の表示パターンおよび
カーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶するも
のである。
装置CRTに表示する文字、記号のパターンを記憶するも
のである。
かかる各構成要素からなる本発明に係る文字処理装置
においては、キーボードKBからの各種の入力に応じて作
動するものであって、キーボードKBからの入力が供給さ
れると、まず、インタラプト信号がマイクロプロセッサ
CPUに送られ、そのマイクロプロセッサCPUがROM内に記
憶してある各種の制御信号を読出し、それらの制御信号
に従って各種の制御が行なわれる。
においては、キーボードKBからの各種の入力に応じて作
動するものであって、キーボードKBからの入力が供給さ
れると、まず、インタラプト信号がマイクロプロセッサ
CPUに送られ、そのマイクロプロセッサCPUがROM内に記
憶してある各種の制御信号を読出し、それらの制御信号
に従って各種の制御が行なわれる。
第2図は従来の文字処理装置による変換選択操作の例
を示した図である。2−1はまず初期画面を示したもの
である。画面上部はテキスト及び入力中の読みが表示さ
れる画面であり、下部は候補一覧が表示される画面であ
る。カーソルはアンダラインで示される。2−2は読み
列「しようがわるい」を入力した時の画面を示してい
る。入力読み列はアンダラインが付いて表示され、カー
ソルは入力読み列の次に表示されている。ここで変換キ
ーを打鍵すると2−3の画面になり、読み列「しようが
わるい」が「使用が悪い」と変換されている。「しよ
う」には「使用」「仕様」などの候補があるが、一般に
「使用」の方が頻度の高いので第1候補に変換される。
オペレータは「仕様が悪い」という変換を望んだとし
て、次候補キーを打鍵すると2−4の画面になる。ここ
で「しよう」の変換候補が表示される。第1候補は「使
用」であり、第2候補は「仕様」である。現在の候補は
第2候補の「仕様」であり、2が反転表示している。こ
こで選択キーを打鍵すると、2−5の画面になる。第2
候補の「仕様」が確定してテキストデータの中に格納さ
れ、同時に「仕様」の学習フラグがONとなり、優先度が
向上する。次に「そうさしよう」と入力すると2−6の
画面になり、更に変換キーを打鍵すると2−7の画面に
なる。「仕様」が学習されているので、「操作仕様」が
第1候補として表示されている。ここで次候補キーを打
鍵すると2−8の画面になり、「しよう」の第2候補と
して付属語「しよう」が表示される。ここで選択キーを
打鍵すると2−9の画面となり、「しよう」が確定して
テキストデータに格納される。同時に付属語「しよう」
の学習フラグがONとなり、自立語「仕様」の学習フラグ
はOFFとなる。次にもう一度「しようがわるい」と入力
すると2−10の画面になり、更に変換キーを打鍵すると
2−11の画面の様に変換結果が表示される。「仕様」の
学習フラグがOFFとなっているので、この変換結果は2
−3の画面と全く同じである。「仕様が悪い」を入力す
るには更に次候補キーを打鍵して2−12の画面の様に変
換候補を表示する必要がある。以上の様に「仕様が悪
い」と「操作しよう」を交互に入力しているかぎり、必
ず候補一覧から目的の候補を選択する作業が必要であ
る。
を示した図である。2−1はまず初期画面を示したもの
である。画面上部はテキスト及び入力中の読みが表示さ
れる画面であり、下部は候補一覧が表示される画面であ
る。カーソルはアンダラインで示される。2−2は読み
列「しようがわるい」を入力した時の画面を示してい
る。入力読み列はアンダラインが付いて表示され、カー
ソルは入力読み列の次に表示されている。ここで変換キ
ーを打鍵すると2−3の画面になり、読み列「しようが
わるい」が「使用が悪い」と変換されている。「しよ
う」には「使用」「仕様」などの候補があるが、一般に
「使用」の方が頻度の高いので第1候補に変換される。
オペレータは「仕様が悪い」という変換を望んだとし
て、次候補キーを打鍵すると2−4の画面になる。ここ
で「しよう」の変換候補が表示される。第1候補は「使
用」であり、第2候補は「仕様」である。現在の候補は
第2候補の「仕様」であり、2が反転表示している。こ
こで選択キーを打鍵すると、2−5の画面になる。第2
候補の「仕様」が確定してテキストデータの中に格納さ
れ、同時に「仕様」の学習フラグがONとなり、優先度が
向上する。次に「そうさしよう」と入力すると2−6の
画面になり、更に変換キーを打鍵すると2−7の画面に
なる。「仕様」が学習されているので、「操作仕様」が
第1候補として表示されている。ここで次候補キーを打
鍵すると2−8の画面になり、「しよう」の第2候補と
して付属語「しよう」が表示される。ここで選択キーを
打鍵すると2−9の画面となり、「しよう」が確定して
テキストデータに格納される。同時に付属語「しよう」
の学習フラグがONとなり、自立語「仕様」の学習フラグ
はOFFとなる。次にもう一度「しようがわるい」と入力
すると2−10の画面になり、更に変換キーを打鍵すると
2−11の画面の様に変換結果が表示される。「仕様」の
学習フラグがOFFとなっているので、この変換結果は2
−3の画面と全く同じである。「仕様が悪い」を入力す
るには更に次候補キーを打鍵して2−12の画面の様に変
換候補を表示する必要がある。以上の様に「仕様が悪
い」と「操作しよう」を交互に入力しているかぎり、必
ず候補一覧から目的の候補を選択する作業が必要であ
る。
第3図は従来の文字処理装置による変換選択操作の別
の例を示した図である。3−1は初期画面である。3−
2は読み列「ごはたのしい」を入力した時の画面を示し
ている。ここで変換キーを打鍵すると3−3の画面にな
り、読み列「ごはたのしい」が「五は楽しい」と変換さ
れている。「ご」には「五」「碁」などの候補がある
が、一般に「五」の方が頻度が高いので第1候補に変換
される。オペレータは「碁は楽しい」という変換を望ん
だとして、次候補キーを打鍵すると3−4の画面にな
る。ここで「ご」の変換候補が表示される。第1候補は
「五」であり、第2候補は「碁」である。ここで選択キ
ーを打鍵すると、3−5の画面になる。第2候補の
「碁」が確定してテキストデータの中に格納され、同時
に「碁」の学習フラグがONとなり、優先度が向上する。
次に「スペインごでは」と入力すると3−6の画面にな
り、更に変換キーを打鍵すると3−7の画面になる。
「碁」が学習されているので、「(スペイン語では)碁
では」が第1候補として表示されている。ここで次候補
キーを打鍵すると3−8の画面になり、「ごでは」の第
2候補として接尾語「語では」が表示される。ここで選
択キーを打鍵すると3−9の画面となり、「語では」が
確定してテキストデータに格納される。同時に接尾語
「語では」の学習フラグがONとなり、名詞「碁」の学習
フラグはOFFとなる。次にもう一度「ごは」と入力する
と3−10の画面になり、更に変換キーを打鍵すると3−
11の画面の様に変換結果が表示される。「碁」の学習フ
ラグがOFFとなっているので、この変換結果は3−3の
画面と全く同じである。「碁は楽しい」を入力するには
更に次候補キーを打鍵して3−12の画面の様に変換候補
を表示する必要がある。以上の様に「碁は楽しい」と
「スペイン語では」を交互に入力しているかぎり、必ず
候補一覧から目的の候補を選択する作業が必要である。
の例を示した図である。3−1は初期画面である。3−
2は読み列「ごはたのしい」を入力した時の画面を示し
ている。ここで変換キーを打鍵すると3−3の画面にな
り、読み列「ごはたのしい」が「五は楽しい」と変換さ
れている。「ご」には「五」「碁」などの候補がある
が、一般に「五」の方が頻度が高いので第1候補に変換
される。オペレータは「碁は楽しい」という変換を望ん
だとして、次候補キーを打鍵すると3−4の画面にな
る。ここで「ご」の変換候補が表示される。第1候補は
「五」であり、第2候補は「碁」である。ここで選択キ
ーを打鍵すると、3−5の画面になる。第2候補の
「碁」が確定してテキストデータの中に格納され、同時
に「碁」の学習フラグがONとなり、優先度が向上する。
次に「スペインごでは」と入力すると3−6の画面にな
り、更に変換キーを打鍵すると3−7の画面になる。
「碁」が学習されているので、「(スペイン語では)碁
では」が第1候補として表示されている。ここで次候補
キーを打鍵すると3−8の画面になり、「ごでは」の第
2候補として接尾語「語では」が表示される。ここで選
択キーを打鍵すると3−9の画面となり、「語では」が
確定してテキストデータに格納される。同時に接尾語
「語では」の学習フラグがONとなり、名詞「碁」の学習
フラグはOFFとなる。次にもう一度「ごは」と入力する
と3−10の画面になり、更に変換キーを打鍵すると3−
11の画面の様に変換結果が表示される。「碁」の学習フ
ラグがOFFとなっているので、この変換結果は3−3の
画面と全く同じである。「碁は楽しい」を入力するには
更に次候補キーを打鍵して3−12の画面の様に変換候補
を表示する必要がある。以上の様に「碁は楽しい」と
「スペイン語では」を交互に入力しているかぎり、必ず
候補一覧から目的の候補を選択する作業が必要である。
第4図は従来の文字処理装置による変換選択操作の3
番目の例を示した図である。4−1は初期画面である。
4−2は読み列「はかる」を入力した時の画面を示して
いる。ここで変換キーを打鍵すると4−3の画面にな
り、読み列「はかる」が「計る」と変換されている。
「はかる」には「計る」「測る」「謀る」などの候補が
あるが、一般に「計る」の方が頻度が高いので第1候補
に変換される。オペレータは「謀る」という変換を望ん
だとして、次候補キーを2回打鍵すると4−4の画面に
なる。ここで「はかる」の変換候補が表示される。第1
候補は「計る」、第2候補は「測る」、第3候補は「謀
る」である。ここで選択キーを打鍵すると、4−5の画
面になる。第3候補の「謀る」が確定してテキストデー
タの中に格納され、同時に「謀る」の学習フラグがONと
なり、優先度が向上する。次に「しんちょうをはかる」
と入力すると4−6の画面になり、更に変換キーを打鍵
すると4−7の画面になる。「身長を計る」「身長を測
る」という用例が用例辞書中に存在するので、「謀る」
が学習されているにもかかわらず、「身長を計る」が第
1候補として表示されている。なお、「計る」が「測
る」よりも優先して変換されるのは「計る」の頻度の方
が一般に高いからである。ここで次候補キーを打鍵する
と4−8の画面になり、「はかる」の第2候補として同
じく用例の存在する「測る」が表示される。ここで選択
キーを打鍵すると4−9の画面となり、「測る」が確定
してテキストデータに格納される。同時に「測る」の学
習フラグがONとなり、「謀る」の学習フラグはOFFとな
る。次にもう一度「はかる」と入力すると4−10の画面
になり、更に変換キーを打鍵すると4−11の画面の様に
変換結果が表示される。「謀る」の学習フラグがOFFと
なっているので、「謀る」は第1候補としては変換され
ず、先程学習された「測る」が第1候補として変換され
ている。「謀る」を入力するには更に次候補キーを2回
打鍵して4−12の画面の様に変換候補を表示する必要が
ある。もしここで「謀る」を選択すると、「測る」の学
習フラグも同時にOFFとなり、「しんちょうをはかる」
は「身長を計る」と変換される様になる。以上の様に
「謀る」と「身長を測る」を交互に入力しているかぎ
り、必ず候補一覧から目的の候補を選択する作業が必要
である。
番目の例を示した図である。4−1は初期画面である。
4−2は読み列「はかる」を入力した時の画面を示して
いる。ここで変換キーを打鍵すると4−3の画面にな
り、読み列「はかる」が「計る」と変換されている。
「はかる」には「計る」「測る」「謀る」などの候補が
あるが、一般に「計る」の方が頻度が高いので第1候補
に変換される。オペレータは「謀る」という変換を望ん
だとして、次候補キーを2回打鍵すると4−4の画面に
なる。ここで「はかる」の変換候補が表示される。第1
候補は「計る」、第2候補は「測る」、第3候補は「謀
る」である。ここで選択キーを打鍵すると、4−5の画
面になる。第3候補の「謀る」が確定してテキストデー
タの中に格納され、同時に「謀る」の学習フラグがONと
なり、優先度が向上する。次に「しんちょうをはかる」
と入力すると4−6の画面になり、更に変換キーを打鍵
すると4−7の画面になる。「身長を計る」「身長を測
る」という用例が用例辞書中に存在するので、「謀る」
が学習されているにもかかわらず、「身長を計る」が第
1候補として表示されている。なお、「計る」が「測
る」よりも優先して変換されるのは「計る」の頻度の方
が一般に高いからである。ここで次候補キーを打鍵する
と4−8の画面になり、「はかる」の第2候補として同
じく用例の存在する「測る」が表示される。ここで選択
キーを打鍵すると4−9の画面となり、「測る」が確定
してテキストデータに格納される。同時に「測る」の学
習フラグがONとなり、「謀る」の学習フラグはOFFとな
る。次にもう一度「はかる」と入力すると4−10の画面
になり、更に変換キーを打鍵すると4−11の画面の様に
変換結果が表示される。「謀る」の学習フラグがOFFと
なっているので、「謀る」は第1候補としては変換され
ず、先程学習された「測る」が第1候補として変換され
ている。「謀る」を入力するには更に次候補キーを2回
打鍵して4−12の画面の様に変換候補を表示する必要が
ある。もしここで「謀る」を選択すると、「測る」の学
習フラグも同時にOFFとなり、「しんちょうをはかる」
は「身長を計る」と変換される様になる。以上の様に
「謀る」と「身長を測る」を交互に入力しているかぎ
り、必ず候補一覧から目的の候補を選択する作業が必要
である。
第5図は本発明に係る文字処理装置による変換選択操
作の例を示した図である。5−1は初期画面である。5
−2は読み列「しようがわるい」を入力した時の画面を
示している。ここで変換キーを打鍵すると5−3の画面
になり、読み列「しようがわるい」が「使用が悪い」と
変換されている。「しよう」には「使用」「仕様」など
の候補があるが、一般に「使用」の方が頻度が高いので
第1候補に変換される。オペレータは「仕様が悪い」と
いう変換を望んだとして、次候補キーを打鍵すると5−
4の画面になる。ここで「しよう」の変換候補が表示さ
れる。第1候補は「使用」であり、第2候補は「仕様」
である。現在の候補は第2候補の「仕様」である。ここ
で選択キーを打鍵すると、5−5の画面になる。第2候
補の「仕様」が確定してテキストデータの中に格納さ
れ、同時に「仕様」の学習フラグがONとなり、優先度が
向上する。次に「そうさしよう」と入力すると5−6の
画面になり、更に変換キーを打鍵すると5−7の画面に
なる。「仕様」が学習されているので、「操作仕様」が
第1候補として表示されている。ここで次候補キーを打
鍵すると5−8の画面になり、「しよう」の第2候補と
して付属語「しよう」が表示される。ここで選択キーを
打鍵すると5−9の画面となり、「しよう」が確定して
テキストデータに格納される。同時に付属語「しよう」
の学習フラグがONとなるが、第2図と異なり、自立語
「仕様」の学習フラグはOFFとはならず、ONのままであ
る。次にもう一度「しようがわるい」と入力すると5−
10の画面になり、更に変換キーを打鍵すると5−11の画
面の様に変換結果が表示される。「仕様」の学習フラグ
がONのままなので、この変換結果は以前のオペレータの
選択操作通りである。更に読み列「そうさしよう」を入
力すると、5−12の画面になり、変換キーを打鍵すると
5−13の画面の様に、以前の選択通りに「操作しよう」
が第1候補で変換される。これ以降は「仕様が悪い」と
「操作しよう」を繰り返して入力してももはや選択操作
を行なう必要はなくなる。
作の例を示した図である。5−1は初期画面である。5
−2は読み列「しようがわるい」を入力した時の画面を
示している。ここで変換キーを打鍵すると5−3の画面
になり、読み列「しようがわるい」が「使用が悪い」と
変換されている。「しよう」には「使用」「仕様」など
の候補があるが、一般に「使用」の方が頻度が高いので
第1候補に変換される。オペレータは「仕様が悪い」と
いう変換を望んだとして、次候補キーを打鍵すると5−
4の画面になる。ここで「しよう」の変換候補が表示さ
れる。第1候補は「使用」であり、第2候補は「仕様」
である。現在の候補は第2候補の「仕様」である。ここ
で選択キーを打鍵すると、5−5の画面になる。第2候
補の「仕様」が確定してテキストデータの中に格納さ
れ、同時に「仕様」の学習フラグがONとなり、優先度が
向上する。次に「そうさしよう」と入力すると5−6の
画面になり、更に変換キーを打鍵すると5−7の画面に
なる。「仕様」が学習されているので、「操作仕様」が
第1候補として表示されている。ここで次候補キーを打
鍵すると5−8の画面になり、「しよう」の第2候補と
して付属語「しよう」が表示される。ここで選択キーを
打鍵すると5−9の画面となり、「しよう」が確定して
テキストデータに格納される。同時に付属語「しよう」
の学習フラグがONとなるが、第2図と異なり、自立語
「仕様」の学習フラグはOFFとはならず、ONのままであ
る。次にもう一度「しようがわるい」と入力すると5−
10の画面になり、更に変換キーを打鍵すると5−11の画
面の様に変換結果が表示される。「仕様」の学習フラグ
がONのままなので、この変換結果は以前のオペレータの
選択操作通りである。更に読み列「そうさしよう」を入
力すると、5−12の画面になり、変換キーを打鍵すると
5−13の画面の様に、以前の選択通りに「操作しよう」
が第1候補で変換される。これ以降は「仕様が悪い」と
「操作しよう」を繰り返して入力してももはや選択操作
を行なう必要はなくなる。
第6図は本発明に係る文字処理装置による変換選択操
作の別の例を示した図である。6−1は初期画面であ
る。6−2は読み列「ごはたのしい」を入力した時の画
面を示している。ここで変換キーを打鍵すると6−3の
画面になり、読み列「ごはたのしい」が「五は楽しい」
と変換されている。「ご」には「五」「碁」などの候補
があるが、一般に「五」の方が頻度が高いので第1候補
に変換される。オペレータは「碁は楽しい」という変換
を望んだとして、次候補キーを打鍵すると6−4の画面
になる。ここで「ご」の変換候補が表示される。第1候
補は「五」であり、第2候補は「碁」である。ここで選
択キーを打鍵すると、6−5の画面になる。第2候補の
「碁」が確定してテキストデータの中に格納され、同時
に「碁」の学習フラグがONとなり、優先度が向上する。
次に「スペインごでは」と入力すると6−6の画面にな
り、更に変換キーを打鍵すると6−7の画面になる。
「碁」が学習されているので、「(スペイン語では)碁
では」が第1候補として表示されている。ここで次候補
キーを打鍵すると6−8の画面になり、「ごでは」の第
2候補として接尾語「語では」が表示される。ここで選
択キーを打鍵すると6−9の画面となり、「語では」が
確定してテキストデータに格納される。同時に接尾語
「語では」の学習フラグがONとなるが、第3図と異な
り、名詞「五」の学習フラグはONのままである。次にも
う一度「ごは」と入力すると6−10の画面になり、更に
変換キーを打鍵すると6−11の画面の様に変換結果が表
示される。「碁」の学習フラグがONのままなので、この
変換結果は以前のオペレータの選択操作通りである。更
に読み列「スペインごでは」を入力すると、6−12の画
面になり、変換キーを打鍵すると6−13の画面の様に、
以前の選択通りに「スペイン語では」が第1候補で変換
される。これ以降は「碁は楽しい」と「スペイン語で
は」を繰り返して入力してももはや選択操作を行なう必
要はなくなる。
作の別の例を示した図である。6−1は初期画面であ
る。6−2は読み列「ごはたのしい」を入力した時の画
面を示している。ここで変換キーを打鍵すると6−3の
画面になり、読み列「ごはたのしい」が「五は楽しい」
と変換されている。「ご」には「五」「碁」などの候補
があるが、一般に「五」の方が頻度が高いので第1候補
に変換される。オペレータは「碁は楽しい」という変換
を望んだとして、次候補キーを打鍵すると6−4の画面
になる。ここで「ご」の変換候補が表示される。第1候
補は「五」であり、第2候補は「碁」である。ここで選
択キーを打鍵すると、6−5の画面になる。第2候補の
「碁」が確定してテキストデータの中に格納され、同時
に「碁」の学習フラグがONとなり、優先度が向上する。
次に「スペインごでは」と入力すると6−6の画面にな
り、更に変換キーを打鍵すると6−7の画面になる。
「碁」が学習されているので、「(スペイン語では)碁
では」が第1候補として表示されている。ここで次候補
キーを打鍵すると6−8の画面になり、「ごでは」の第
2候補として接尾語「語では」が表示される。ここで選
択キーを打鍵すると6−9の画面となり、「語では」が
確定してテキストデータに格納される。同時に接尾語
「語では」の学習フラグがONとなるが、第3図と異な
り、名詞「五」の学習フラグはONのままである。次にも
う一度「ごは」と入力すると6−10の画面になり、更に
変換キーを打鍵すると6−11の画面の様に変換結果が表
示される。「碁」の学習フラグがONのままなので、この
変換結果は以前のオペレータの選択操作通りである。更
に読み列「スペインごでは」を入力すると、6−12の画
面になり、変換キーを打鍵すると6−13の画面の様に、
以前の選択通りに「スペイン語では」が第1候補で変換
される。これ以降は「碁は楽しい」と「スペイン語で
は」を繰り返して入力してももはや選択操作を行なう必
要はなくなる。
第7図は本発明に係る文字処理装置による変換選択操
作の3番目の例を示した図である。7−1は初期画面で
ある。7−2は読み列「はかる」を入力した時の画面を
示している。ここで変換キーを打鍵すると7−3の画面
になり、読み列「はかる」が「計る」と変換されてい
る。「はかる」には「計る」「測る」「謀る」などの候
補があるが、一般に「計る」の方が頻度が高いので第1
候補に変換される。オペレータは「謀る」という変換を
望んだとして、次候補キーを2回打鍵すると7−4の画
面になる。ここで「はかる」の変換候補が表示される。
第1候補は「計る」、第2候補は「測る」、第3候補は
「謀る」である。ここで選択キーを打鍵すると、7−5
の画面になる。第3候補の「謀る」が確定してテキスト
データの中に格納され、同時に「謀る」の学習フラグが
ONとなり、優先度が向上する。次に「しんちょうをはか
る」と入力すると7−6の画面になり、更に変換キーを
打鍵すると7−7の画面になる。「身長を計る」「身長
を測る」という用例が用例辞書中に存在するので、「謀
る」が学習されているにもかかわらず、「身長を計る」
が第1候補として表示されている。ここで次候補キーを
打鍵すると7−8の画面になり、「はかる」の第2候補
として同じく用例の存在する「測る」が表示される。こ
こで選択キーを打鍵すると7−9の画面となり、「測
る」が確定してテキストデータに格納される。同時に
「測る」の学習フラグがONとなるが、第4図と異なり、
「謀る」の学習フラグはONのままである。同時に用例
「身長を計る」が抑制され、これ以降は「身長を計る」
という用例は使用されなくなる。次にもう一度「はか
る」と入力すると7−10の画面になり、更に変換キーを
打鍵すると7−11の画面の様に変換結果が表示される。
「謀る」の学習フラグがONのままなので、この変換結果
は以前のオペレータの選択操作通りである。更に読み列
「しんちょうをはかる」を入力すると、7−12の画面に
なり、変換キーを打鍵すると7−13の画面の様に、以前
の選択通りに「身長を測る」が第1候補で変換される。
これ以降は「謀る」と「身長を測る」を繰り返して入力
してももはや選択操作を行なう必要はなくなる。
作の3番目の例を示した図である。7−1は初期画面で
ある。7−2は読み列「はかる」を入力した時の画面を
示している。ここで変換キーを打鍵すると7−3の画面
になり、読み列「はかる」が「計る」と変換されてい
る。「はかる」には「計る」「測る」「謀る」などの候
補があるが、一般に「計る」の方が頻度が高いので第1
候補に変換される。オペレータは「謀る」という変換を
望んだとして、次候補キーを2回打鍵すると7−4の画
面になる。ここで「はかる」の変換候補が表示される。
第1候補は「計る」、第2候補は「測る」、第3候補は
「謀る」である。ここで選択キーを打鍵すると、7−5
の画面になる。第3候補の「謀る」が確定してテキスト
データの中に格納され、同時に「謀る」の学習フラグが
ONとなり、優先度が向上する。次に「しんちょうをはか
る」と入力すると7−6の画面になり、更に変換キーを
打鍵すると7−7の画面になる。「身長を計る」「身長
を測る」という用例が用例辞書中に存在するので、「謀
る」が学習されているにもかかわらず、「身長を計る」
が第1候補として表示されている。ここで次候補キーを
打鍵すると7−8の画面になり、「はかる」の第2候補
として同じく用例の存在する「測る」が表示される。こ
こで選択キーを打鍵すると7−9の画面となり、「測
る」が確定してテキストデータに格納される。同時に
「測る」の学習フラグがONとなるが、第4図と異なり、
「謀る」の学習フラグはONのままである。同時に用例
「身長を計る」が抑制され、これ以降は「身長を計る」
という用例は使用されなくなる。次にもう一度「はか
る」と入力すると7−10の画面になり、更に変換キーを
打鍵すると7−11の画面の様に変換結果が表示される。
「謀る」の学習フラグがONのままなので、この変換結果
は以前のオペレータの選択操作通りである。更に読み列
「しんちょうをはかる」を入力すると、7−12の画面に
なり、変換キーを打鍵すると7−13の画面の様に、以前
の選択通りに「身長を測る」が第1候補で変換される。
これ以降は「謀る」と「身長を測る」を繰り返して入力
してももはや選択操作を行なう必要はなくなる。
第8図は入力バッファIBUF、出力バッファOBUFの構成
を示した図である。
を示した図である。
IBUF、OBUFともに同じ構成である。最初の2バイトは
各バッファのサイズ情報であり、バッファに格納されて
いる文字数から1を減じたものを2倍した数値が入る。
入力バッファの末尾にある「 」はそこで変換キーが打
鍵されたことを意味する。各文字は1文字2バイトで構
成され、JIS X 0208コード等で格納される。
各バッファのサイズ情報であり、バッファに格納されて
いる文字数から1を減じたものを2倍した数値が入る。
入力バッファの末尾にある「 」はそこで変換キーが打
鍵されたことを意味する。各文字は1文字2バイトで構
成され、JIS X 0208コード等で格納される。
第9図は辞書DICの構成を示した図である。「読み」
「表記」「品詞」「標準頻度」「品詞細分類」「学習」
のフィールドから構成される。
「表記」「品詞」「標準頻度」「品詞細分類」「学習」
のフィールドから構成される。
「読み」には単語の読み、「表記」には単語の表記、
「品詞」には単語の品詞が格納される。
「品詞」には単語の品詞が格納される。
「標準頻度」は頻度情報等のその単語自体の尤もらし
さを示す情報が1〜5の値で格納される。尤度値5は最
も尤もらしいという意味であり、値が小さくなるにつれ
疑わしいと解釈される。尤度値0は全く考えられないと
いうことを意味するので単語尤度の値としては存在しな
い。
さを示す情報が1〜5の値で格納される。尤度値5は最
も尤もらしいという意味であり、値が小さくなるにつれ
疑わしいと解釈される。尤度値0は全く考えられないと
いうことを意味するので単語尤度の値としては存在しな
い。
「品詞細分類」にはその単語の品詞を更に細分類した
情報が格納される。例えば、接頭語は更に何種類かに細
分類され、品詞フィールドに接頭語と記入した場合には
接頭語の細分類情報を品詞細分類に記述する。接頭語
「逆」に対しては「接頭語23」という細分類コードを割
り振っている。名詞の場合には「抽象概念」「物品」
「行動」などの細分類情報が格納される。特に細分類情
報が存在しない品詞の場合(例えば、ラ行5段)には値
は入らない。
情報が格納される。例えば、接頭語は更に何種類かに細
分類され、品詞フィールドに接頭語と記入した場合には
接頭語の細分類情報を品詞細分類に記述する。接頭語
「逆」に対しては「接頭語23」という細分類コードを割
り振っている。名詞の場合には「抽象概念」「物品」
「行動」などの細分類情報が格納される。特に細分類情
報が存在しない品詞の場合(例えば、ラ行5段)には値
は入らない。
「学習」は学習フラグであり、その単語が学習されて
いるかどうかを1ビットで示す。学習フラグがONになっ
ている単語は優先的に変換されることになる。ある単語
の状態は学習されていると、あるいは学習されていない
かの2状態しか存在しないので、これはすなわち、短期
学習方式である。
いるかどうかを1ビットで示す。学習フラグがONになっ
ている単語は優先的に変換されることになる。ある単語
の状態は学習されていると、あるいは学習されていない
かの2状態しか存在しないので、これはすなわち、短期
学習方式である。
第10図は用例辞書YDICの構成を示した図である。「第
1単語」「第2単語」「助詞」「用例抑制」のフィール
ドから構成される。
1単語」「第2単語」「助詞」「用例抑制」のフィール
ドから構成される。
「第1単語」「第2単語」には共起する単語のペアを
記述する。
記述する。
「助詞」には単語のペアを結び付ける助詞を記述す
る。
る。
「用例抑制」にはその用例を使用して良いかどうかを
示す情報が1ビットで格納される。0は抑制されないこ
とを意味し、1は抑制されることを意味する。初期状態
は0であり、その用例を使用しても構わないことを意味
する。
示す情報が1ビットで格納される。0は抑制されないこ
とを意味し、1は抑制されることを意味する。初期状態
は0であり、その用例を使用しても構わないことを意味
する。
図中に示される用例は「身長を/計る」「水深を/計
る」「身長を/測る」「委員会に/諮る」「推進を/図
る」となり、このパターンと一致した読み列が入力され
たときは、この用例辞書に示される表記が優先的に変換
される。
る」「身長を/測る」「委員会に/諮る」「推進を/図
る」となり、このパターンと一致した読み列が入力され
たときは、この用例辞書に示される表記が優先的に変換
される。
第11図は文節候補テーブルBCTBLの概念を示した図で
ある。文節候補テーブルは入力読みの解析の結果、考え
られる文節候補をバイナリートリーで表現したものであ
る。図中、横線は子ポインタを意味し、縦線は弟ポイン
タを意味する。弟ポインタはある読み位置から始まる他
の文節候補(通常はより短い候補)をリンクし、子ポイ
ンタはその文節に引き続く文節候補をリンクする。
ある。文節候補テーブルは入力読みの解析の結果、考え
られる文節候補をバイナリートリーで表現したものであ
る。図中、横線は子ポインタを意味し、縦線は弟ポイン
タを意味する。弟ポインタはある読み位置から始まる他
の文節候補(通常はより短い候補)をリンクし、子ポイ
ンタはその文節に引き続く文節候補をリンクする。
入力読み列「しようがわるい」の先頭部分は「使用
が」「仕様が」「使用」「仕様」「死」などの解釈が存
在し、これらは順に弟ポインタ(縦線)でリンクされて
いる。
が」「仕様が」「使用」「仕様」「死」などの解釈が存
在し、これらは順に弟ポインタ(縦線)でリンクされて
いる。
「使用が」に引き続く文節は「悪い」が考えられ、子
ポインタでリンクされている。
ポインタでリンクされている。
この様な文節候補テーブルができ上がると、「使用が
悪い」「仕様が悪い」「使用側類」「使用が和類」など
と文節候補列を作成することは容易である。
悪い」「仕様が悪い」「使用側類」「使用が和類」など
と文節候補列を作成することは容易である。
第12図は文節候補テーブルBCTBLの具体的構成を示し
た図である。
た図である。
「自立語」は文節候補の自立語が存在する辞書上の先
頭位置へポインタを格納する。
頭位置へポインタを格納する。
「付属語列」は2バイトで構成され、文節候補の自立
語に引き続く付属語列を特定する領域である。先頭1バ
イトが入力バッファ上の付属語列先頭文字をインデック
スし、次の1バイトが入力バッファ上の付属語列の末尾
文字をインデックスする。例えば、第8図に示す入力バ
ッファのとき、「が」を表現するには第1バイトに6、
第2バイトに6を設定する。付属語列が存在しないとき
は図中で「φ」で示している。
語に引き続く付属語列を特定する領域である。先頭1バ
イトが入力バッファ上の付属語列先頭文字をインデック
スし、次の1バイトが入力バッファ上の付属語列の末尾
文字をインデックスする。例えば、第8図に示す入力バ
ッファのとき、「が」を表現するには第1バイトに6、
第2バイトに6を設定する。付属語列が存在しないとき
は図中で「φ」で示している。
「弟リンク」はその文節候補と同じ読み位置から始ま
る別の文節候補をリンクする。
る別の文節候補をリンクする。
「子リンク」はその文節候補に引き続く文節候補をリ
ンクする。
ンクする。
なお、リンクは値0のときに終端することを意味す
る。
る。
例えば、文節候補0(使用が)の弟リンクは1であ
り、文節候補1(仕様が)をリンクする。文節候補0
(新聞屋に)の子リンクは100であり、文節候補100(悪
い)をリンクする。文節候補100の子リンクは0であ
り、そこで入力読みが終端していることが分かる。
り、文節候補1(仕様が)をリンクする。文節候補0
(新聞屋に)の子リンクは100であり、文節候補100(悪
い)をリンクする。文節候補100の子リンクは0であ
り、そこで入力読みが終端していることが分かる。
「自立部タイプ」はその文節の自立部のタイプを記述
する。これは隣接文節間の接続可能性を判定するときに
使用される。例えば、0:抽象概念を示す名詞、1:人間を
示す名詞、2:サ変名詞、3:地名語幹、4:形容詞、などと
記述される。
する。これは隣接文節間の接続可能性を判定するときに
使用される。例えば、0:抽象概念を示す名詞、1:人間を
示す名詞、2:サ変名詞、3:地名語幹、4:形容詞、などと
記述される。
「文節タイプ」はその文節のタイプを記述する。これ
は隣接文節間の接続可能性を判定するともに使用され
る。例えば、0:抽象概念を示す名詞で終了する文節、1:
人間を示す名詞で終了する文節、2:サ変語幹で終了する
文節、3:地名語幹で終了する文節、4:形容詞終止形で終
了する文節、5:格助詞「に」で終了する文節、6:格助詞
「が」で終了する文節、などと記述される。
は隣接文節間の接続可能性を判定するともに使用され
る。例えば、0:抽象概念を示す名詞で終了する文節、1:
人間を示す名詞で終了する文節、2:サ変語幹で終了する
文節、3:地名語幹で終了する文節、4:形容詞終止形で終
了する文節、5:格助詞「に」で終了する文節、6:格助詞
「が」で終了する文節、などと記述される。
第13図は文節間の接続可能性を判定する文節接続マト
リックスの構成を示した図である。
リックスの構成を示した図である。
第13図の(1)は文節とそれに後続する付属語の接続
可能性を判定するCTBL1である。1は接続可を意味し、
0は接続不可を意味する。例えば、文節タイプ=2の文
節の後に付属語125の文節は後続し得るが、文節タイプ
=3の文節の後に付属語125の文節は後続し得ないこと
がこれで分かる。
可能性を判定するCTBL1である。1は接続可を意味し、
0は接続不可を意味する。例えば、文節タイプ=2の文
節の後に付属語125の文節は後続し得るが、文節タイプ
=3の文節の後に付属語125の文節は後続し得ないこと
がこれで分かる。
(2)は文節とそれに後続する接尾語の接続可能性を
判定するCTBL2である。1は接続可を意味し、0は接続
不可を意味する。例えば、文節タイプ=3の文節の後に
接尾語15の文節は後続し得るが、文節タイプ=2の文節
の後に接尾語15の文節は後続し得ないことがこれで分か
る。
判定するCTBL2である。1は接続可を意味し、0は接続
不可を意味する。例えば、文節タイプ=3の文節の後に
接尾語15の文節は後続し得るが、文節タイプ=2の文節
の後に接尾語15の文節は後続し得ないことがこれで分か
る。
(3)は接頭語とそれに後続する文節の接続可能性を
判定するCTBL3である。1は接続可を意味し、0は接続
不可を意味する。例えば、接頭語23の文節の後に自立部
タイプ=2の文節は後続し得るが、接頭語23の文節の文
節の後に自立部タイプ=3の文節は後続し得ないことが
これで分かる。
判定するCTBL3である。1は接続可を意味し、0は接続
不可を意味する。例えば、接頭語23の文節の後に自立部
タイプ=2の文節は後続し得るが、接頭語23の文節の文
節の後に自立部タイプ=3の文節は後続し得ないことが
これで分かる。
第14図はテキストバッファTBUFの構成を示した図であ
る。
る。
テキストバッファは文字の羅列から構成され、各文字
は2バイトで構成される。各文字のMSBは同音語フラグ
であり、0は通常文字、1が同音語を意味する。残りの
15ビットは通常文字のときは文字コードを表現し、同音
語のときは同音語番号を表現する。文字コードは例え
ば、JIS X 0208コードを使用する。同音語番号は第15図
に示す同音語バッファDOBUF上のどの同音語であるかを
示す番号である。
は2バイトで構成される。各文字のMSBは同音語フラグ
であり、0は通常文字、1が同音語を意味する。残りの
15ビットは通常文字のときは文字コードを表現し、同音
語のときは同音語番号を表現する。文字コードは例え
ば、JIS X 0208コードを使用する。同音語番号は第15図
に示す同音語バッファDOBUF上のどの同音語であるかを
示す番号である。
第15図は同音語バッファDOBUFの構成を示した図であ
る。各同音語には同音語番号が付いており、それによっ
て識別される。
る。各同音語には同音語番号が付いており、それによっ
て識別される。
各同音語は「読み」「候補総数」「現候補番号」「第
i候補情報」からなる。
i候補情報」からなる。
「読み」はその同音語の読みを格納する。
「候補総数」はその同音に含まれる候補の総数を格納
する。
する。
「現候補番号」はその同音語の現在表示されている候
補番号が格納される。変換直後初値に第1候補が表示さ
れるから「1」が格納される。
補番号が格納される。変換直後初値に第1候補が表示さ
れるから「1」が格納される。
「第i候補情報」は各候補の「表記」「単語アドレ
ス」「適用意味分類」が格納される。
ス」「適用意味分類」が格納される。
「表記」にはその候補の表記が格納される。
「単語アドレス」にはその単語候補が辞書DIC上に存
在するアドレスを格納する。
在するアドレスを格納する。
「適用可能用例番号」には、その候補に適用され得る
用例の用例番号を格納する。ここには、抑制されている
用例の番号も同様に記述する。一般には、その候補に適
用され得る用例は複数個存在するので、「適用可能用例
番号」は1候補につき複数個存在することもある。ま
た、全く存在しないときもある。
用例の用例番号を格納する。ここには、抑制されている
用例の番号も同様に記述する。一般には、その候補に適
用され得る用例は複数個存在するので、「適用可能用例
番号」は1候補につき複数個存在することもある。ま
た、全く存在しないときもある。
第16図は文尤度の計算例を示した図である。文尤度は
文節候補列である文の尤もらしさを表現するものであ
り、値が大きいほど尤もらしいことを意味する。
文節候補列である文の尤もらしさを表現するものであ
り、値が大きいほど尤もらしいことを意味する。
文尤度は、文節尤度の和、文節間尤度の和、用例尤度
の和を全て加算することにより計算される。
の和を全て加算することにより計算される。
文節尤度は各文節候補の尤もらしさを表現するもので
あり、値が大きいほど尤もらしいことを意味する。文節
尤度はその文節の自立語の辞書DICに記載されている標
準頻度が使用される。もし、学習フラグがONのときは更
に26が加算される。
あり、値が大きいほど尤もらしいことを意味する。文節
尤度はその文節の自立語の辞書DICに記載されている標
準頻度が使用される。もし、学習フラグがONのときは更
に26が加算される。
文節間尤度は隣接する文節候補間の接続の尤もらしさ
を表現するものであり、本実施例では後続文節が付属語
のとき0、先行文節が接頭語のとき−10、後続文節が接
尾語のとき−10、その他のとき−20とする。このように
定めることにより、付属語は自立語より優先的に変換さ
れ、接頭語、接尾語は名詞より優先的に変換されること
になる。例えば、その文がn文節で構成されていたと
し、その全てが上記のその他の場合であれば、文節間は
(n−1)あるので、文節間尤度の和は−20(n−1)
となる。
を表現するものであり、本実施例では後続文節が付属語
のとき0、先行文節が接頭語のとき−10、後続文節が接
尾語のとき−10、その他のとき−20とする。このように
定めることにより、付属語は自立語より優先的に変換さ
れ、接頭語、接尾語は名詞より優先的に変換されること
になる。例えば、その文がn文節で構成されていたと
し、その全てが上記のその他の場合であれば、文節間は
(n−1)あるので、文節間尤度の和は−20(n−1)
となる。
用例尤度は各文節間に適用されている、用例の一つ一
つについて文尤度に加算される。30からその用例を適用
する際に飛び越す文節の数の10倍を減じたものが用例尤
度となる。
つについて文尤度に加算される。30からその用例を適用
する際に飛び越す文節の数の10倍を減じたものが用例尤
度となる。
第17図は、第16図の文尤度の計算例を読み列「そうさ
しよう」について状況別に説明した図である。
しよう」について状況別に説明した図である。
第17図の(1)は特に学習がされていない場合の「操
作/しよう」の計算例であり、文尤度は8である。
作/しよう」の計算例であり、文尤度は8である。
(2)は特に学習がされていない場合の「操作/仕
様」の計算例であり、文尤度は−12である。
様」の計算例であり、文尤度は−12である。
(3)は付属語「しよう」だけが学習がされている場
合の「操作/しよう」の計算例であり、文尤度は34であ
る。
合の「操作/しよう」の計算例であり、文尤度は34であ
る。
(4)は自立語「仕様」だけが学習がされている場合
の「操作/仕様」の計算例であり、文尤度は14である。
の「操作/仕様」の計算例であり、文尤度は14である。
すなわち、学習が何もない状態では「操作しよう」と
変換され、「仕様」のみが学習されている状態では「操
作仕様」と変換され、「しよう」のみが学習されている
状態では「操作しよう」と変換され、「しよう」と「仕
様」が両方学習されている状態では「操作しよう」と変
換されることが分かる。
変換され、「仕様」のみが学習されている状態では「操
作仕様」と変換され、「しよう」のみが学習されている
状態では「操作しよう」と変換され、「しよう」と「仕
様」が両方学習されている状態では「操作しよう」と変
換されることが分かる。
第18図は、第16図の文尤度の計算例を読み列「スペイ
ンご」について状況別に説明した図である。
ンご」について状況別に説明した図である。
第18図の(1)は特に学習がされていない場合の「ス
ペイン/語」の計算例であり、文尤度は−2である。
ペイン/語」の計算例であり、文尤度は−2である。
(2)は特に学習がされていない場合の「スペイン/
碁」の計算例であり、文尤度は−14である。
碁」の計算例であり、文尤度は−14である。
(3)は接尾語「語」だけが学習がされている場合の
「スペイン/語」の計算例であり、文尤度は24である。
「スペイン/語」の計算例であり、文尤度は24である。
(4)は自立語「碁」だけが学習がされている場合の
「スペイン/碁」の計算例であり、文尤度は15である。
「スペイン/碁」の計算例であり、文尤度は15である。
すなわち、学習が何もない状態では「スペイン語」と
変換され、「碁」のみが学習されている状態では「スペ
イン碁」と変換され、「語」のみが学習されている状態
では「スペイン語」と変換され、「碁」と「語」が両方
学習されている状態では「スペイン語」と変換されるこ
とが分かる。
変換され、「碁」のみが学習されている状態では「スペ
イン碁」と変換され、「語」のみが学習されている状態
では「スペイン語」と変換され、「碁」と「語」が両方
学習されている状態では「スペイン語」と変換されるこ
とが分かる。
第19図は、第16図の文尤度の計算例を読み列「しんち
ょうをはかる」について状況別に説明した図である。な
お、用例として「身長を測る」が登録されているものと
する。
ょうをはかる」について状況別に説明した図である。な
お、用例として「身長を測る」が登録されているものと
する。
第19図の(1)は特に学習がされていない場合の「身
長を/測る」の計算例であり、文尤度は18である。
長を/測る」の計算例であり、文尤度は18である。
(2)は特に学習がされていない場合の「身長を/謀
る」の計算例であり、文尤度は−15である。
る」の計算例であり、文尤度は−15である。
(3)は「測る」だけが学習がされている場合の「身
長を/測る」の計算例であり、文尤度は44である。
長を/測る」の計算例であり、文尤度は44である。
(4)は「謀る」だけが学習がされている場合の「身
長を/謀る」の計算例であり、文尤度は11である。
長を/謀る」の計算例であり、文尤度は11である。
すなわち、学習が何もない状態では「身長を/測る」
と変換され、「謀る」のみが学習されている状態では
「身長を/測る」と変換され、「測る」のみが学習され
ている状態では「身長を/測る」と変換され、「謀る」
と「測る」が両方学習されている状態では「身長を/測
る」と変換されることが分かる。
と変換され、「謀る」のみが学習されている状態では
「身長を/測る」と変換され、「測る」のみが学習され
ている状態では「身長を/測る」と変換され、「謀る」
と「測る」が両方学習されている状態では「身長を/測
る」と変換されることが分かる。
上述の実施例の動作を第20図〜第27図に示すフローチ
ャートに従って説明する。
ャートに従って説明する。
第20図はキー入力を取り込み、処理を行なう部分のフ
ローチャートである。
ローチャートである。
ステップ20−1はキーボードからのデータを取り込む
処理である。ステップ20−2で取り込まれたキーの種別
を判定し、各キーの処理ルーチンに分岐する。
処理である。ステップ20−2で取り込まれたキーの種別
を判定し、各キーの処理ルーチンに分岐する。
変換キーであったときはステップ20−3に分岐し、ス
テップ20−3において第21図に詳述するように仮名漢字
変換の変換処理が行なわれる。次候補キーであったとき
はステップ20−4において、第26図に詳述する次候補処
理を行なう。選択キーであったときはステップ20−5に
おいて第27図に詳述する選択処理を行なう。その他のキ
ーのときはステップ20−6に分岐し、挿入、削除等の通
常の文字処理装置において行なわれるその他の処理が行
なわれる。その後ステップ20−1にループする。
テップ20−3において第21図に詳述するように仮名漢字
変換の変換処理が行なわれる。次候補キーであったとき
はステップ20−4において、第26図に詳述する次候補処
理を行なう。選択キーであったときはステップ20−5に
おいて第27図に詳述する選択処理を行なう。その他のキ
ーのときはステップ20−6に分岐し、挿入、削除等の通
常の文字処理装置において行なわれるその他の処理が行
なわれる。その後ステップ20−1にループする。
第21図はステップ20−3の「変換処理」を詳細化した
フローチャートである。
フローチャートである。
ステップ21−1において、第22図に詳述する文節候補
作成処理を行ない、文節候補テーブルBCTBLを作成す
る。
作成処理を行ない、文節候補テーブルBCTBLを作成す
る。
ステップ21−2において、第23図に詳述する第1候補
決定処理を行なう。
決定処理を行なう。
ステップ21−3において、決定された第1候補に基づ
いて同音語バッファ及び変換結果を作成し、出力する。
いて同音語バッファ及び変換結果を作成し、出力する。
第22図はステップ21−1の「文節候補作成処理」を詳
細化したフローチャートである。
細化したフローチャートである。
ステップ22−1において、入力バッファインデックス
i、文節候補テーブルインデックスjを0に初期設定す
る。
i、文節候補テーブルインデックスjを0に初期設定す
る。
ステップ22−2においてiの示す入力バッファ中の読
みに基づき、辞書をサーチし、単語候補を求める。
みに基づき、辞書をサーチし、単語候補を求める。
ステップ22−3において、見つかった単語候補に対し
て接続する付属語列を解析する形態素解析処理を行な
う。この結果、文節候補が得られる。
て接続する付属語列を解析する形態素解析処理を行な
う。この結果、文節候補が得られる。
ステップ22−4において、形態素解析の結果に基づ
き、その文節の自立部タイプ、文節タイプを決定する。
き、その文節の自立部タイプ、文節タイプを決定する。
ステップ22−5において、文節接続マトリックスを参
照し、隣接文節の接続可能性を調べる。隣接文節と接続
し得る文節のみを残す。また、文節候補テーブル上での
子リンク、弟リンクを決定する。
照し、隣接文節の接続可能性を調べる。隣接文節と接続
し得る文節のみを残す。また、文節候補テーブル上での
子リンク、弟リンクを決定する。
ステップ22−6において得られた文節候補を文節候補
テーブルに格納する。格納する時はj+1番目のエント
リーに格納する。また、必要な情報を設定する。例え
ば、この文節候補を子、あるいは弟とする文節候補につ
いては、子リンク、弟リンクを設定する。格納後jの値
をカウントアップする。
テーブルに格納する。格納する時はj+1番目のエント
リーに格納する。また、必要な情報を設定する。例え
ば、この文節候補を子、あるいは弟とする文節候補につ
いては、子リンク、弟リンクを設定する。格納後jの値
をカウントアップする。
ステップ22−7において文節候補テーブルからターミ
ネートしていない文節候補、すなわち、子リンクがまだ
決まっていない文節候補を見つけその次の読み位置をi
に代入する。
ネートしていない文節候補、すなわち、子リンクがまだ
決まっていない文節候補を見つけその次の読み位置をi
に代入する。
ステップ22−8において、全ての文節候補の子リンク
が決定しているかどうか判定し、決定していないものが
あればステップ22−2に分岐する。そうでなければリタ
ーンする。
が決定しているかどうか判定し、決定していないものが
あればステップ22−2に分岐する。そうでなければリタ
ーンする。
第23図はステップ21−2の「第1候補決定処理」を詳
細化したフローチャートである。
細化したフローチャートである。
ステップ23−1において、最尤文尤度を処理上許され
る最小値、例えば、−32767に初期設定する。
る最小値、例えば、−32767に初期設定する。
ステップ23−2において文節候補テーブルより文節候
補列を1つ取り出す。
補列を1つ取り出す。
ステップ23−3において、第24図に詳述するようにそ
の取り出された文節候補列に適用可能な用例を検索し、
用例尤度の和である「用例尤度和」を算出する。
の取り出された文節候補列に適用可能な用例を検索し、
用例尤度の和である「用例尤度和」を算出する。
ステップ23−4において、文節候補列の文尤度を第16
図に示す様に算出する。
図に示す様に算出する。
ステップ23−5において、算出された文尤度が最尤文
尤度より尤もらしいか、具体的には大きいかを判定し、
大きいときはステップ23−6において最尤文尤度を算出
された文尤度に更新する。また、ステップ23−7におい
て現在の文節候補列を最尤文尤度に対応した文節候補列
として記憶する。
尤度より尤もらしいか、具体的には大きいかを判定し、
大きいときはステップ23−6において最尤文尤度を算出
された文尤度に更新する。また、ステップ23−7におい
て現在の文節候補列を最尤文尤度に対応した文節候補列
として記憶する。
ステップ23−8において文節候補テーブルから別の文
節候補列が取り出せるかどうかを判定し、取り出せると
きはステップ23−2に分岐する。そうでないときはリタ
ーンする。
節候補列が取り出せるかどうかを判定し、取り出せると
きはステップ23−2に分岐する。そうでないときはリタ
ーンする。
これにより、最尤文尤度を算出するもとになった文節
候補列が第1候補として決定される。
候補列が第1候補として決定される。
第24図はステップ23−3の「用例尤度和の算出」を詳
細化したフローチャートである。
細化したフローチャートである。
ステップ24−1において、用例尤度和をまず0に初期
設定する。
設定する。
ステップ24−2において、文節候補列から1文節を基
準文節として取り出す。以下の処理ではこの基準文節に
関係する用例の尤度を求めることになる。
準文節として取り出す。以下の処理ではこの基準文節に
関係する用例の尤度を求めることになる。
ステップ24−3において基準文節を取り出せたかどう
か判定し、取り出せなかったときはリターンする。
か判定し、取り出せなかったときはリターンする。
ステップ24−4において最尤用例尤度を0に初期設定
する。
する。
ステップ24−5において、基準文節とペアになる文節
を文節候補列から取り出す。
を文節候補列から取り出す。
ステップ24−6において、基準文節のペア文節を取り
出すことができなかったときは、それ以上の基準文節の
処理を諦め、ステップ24−9に分岐する。
出すことができなかったときは、それ以上の基準文節の
処理を諦め、ステップ24−9に分岐する。
ステップ24−7において、第25図に詳述するように、
基準文節とペア文節の間の用例が適用されているかどう
かを調べ、その適用状況に応じて用例尤度を設定する。
基準文節とペア文節の間の用例が適用されているかどう
かを調べ、その適用状況に応じて用例尤度を設定する。
ステップ24−8において、求まった用例尤度が最尤用
例尤度より尤もらしい(すなわち大きいか)かどうかを
調べ、尤もらしければ(すなわち大きければ)、用例尤
度の値を最尤用例尤度に代入する。その後ステップ24−
5に分岐し、別のペアについて用例尤度を求める。
例尤度より尤もらしい(すなわち大きいか)かどうかを
調べ、尤もらしければ(すなわち大きければ)、用例尤
度の値を最尤用例尤度に代入する。その後ステップ24−
5に分岐し、別のペアについて用例尤度を求める。
ステップ24−9において、基準文節の処理が終ったの
で、次の基準文節の処理に移るか、未処理の文節が残っ
ているかどうか判定する。残っていないときはそのまま
リターンするが、残っているときはステップ24−10に分
岐し、前回求まった最尤用例尤度を用例尤度和に加算す
る。その後、ステップ24−2にループし、次の基準文節
を取り出す。
で、次の基準文節の処理に移るか、未処理の文節が残っ
ているかどうか判定する。残っていないときはそのまま
リターンするが、残っているときはステップ24−10に分
岐し、前回求まった最尤用例尤度を用例尤度和に加算す
る。その後、ステップ24−2にループし、次の基準文節
を取り出す。
第25図はステップ24−7の「用例尤度の値設定」を詳
細化したフローチャートである。
細化したフローチャートである。
ステップ25−1において、基準文節とペア文節の2文
節間に適用される用例があるかどうか、を判断する。こ
のときは、抑制されている用例は適用しないよう処理す
る。
節間に適用される用例があるかどうか、を判断する。こ
のときは、抑制されている用例は適用しないよう処理す
る。
適用用例がないときはステップ25−2に分岐し、用例
尤度に0を代入し、リターンする。
尤度に0を代入し、リターンする。
適用用例があるときはステップ25−3に分岐し、用例
尤度として30を代入する。
尤度として30を代入する。
ステップ25−4において2文節間の距離、すなわち、
飛び越す文節の数を求め、その値に10を乗じて用例尤度
から減算する。もし、隣接する2文節であれば、飛び越
す文節は0であるので、用例尤度から0を減じることに
なる。
飛び越す文節の数を求め、その値に10を乗じて用例尤度
から減算する。もし、隣接する2文節であれば、飛び越
す文節は0であるので、用例尤度から0を減じることに
なる。
ステップ25−5において上記計算された用例尤度の値
が負になっていないかどうか判定し、負のときはステッ
プ25−6において0になるように補正し、リターンす
る。負でないときは値をいじらずにそのままリターンす
る。
が負になっていないかどうか判定し、負のときはステッ
プ25−6において0になるように補正し、リターンす
る。負でないときは値をいじらずにそのままリターンす
る。
第26図はステップ20−4の「次候補処理」を詳細化し
たフローチャートである。
たフローチャートである。
ステップ26−1において、次候補を見るべき同音語の
同音語番号をテキストバッファTBUFより求める。
同音語番号をテキストバッファTBUFより求める。
ステップ26−2において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号をカウントアップす
る。
ファの位置を求めて、現候補番号をカウントアップす
る。
ステップ26−3において、候補一覧を表示する。
第27図はステップ20−5の「選択処理」を詳細化した
フローチャートである。
フローチャートである。
ステップ27−1において、選択すべき同音語の同音語
番号をテキストバッファTBUFより求める。
番号をテキストバッファTBUFより求める。
ステップ27−2において、同音語番号から同音語バッ
ファの位置を求めて、現候補番号の示す候補情報から表
記を取り出し、テキストバッファTBUFに確定文字として
設定する。
ファの位置を求めて、現候補番号の示す候補情報から表
記を取り出し、テキストバッファTBUFに確定文字として
設定する。
ステップ27−3において、同様に、現候補番号の示す
候補情報から単語アドレスを求め、その示された単語の
学習フラグをONする。
候補情報から単語アドレスを求め、その示された単語の
学習フラグをONする。
ステップ27−4において、同様に、現候補番号の示す
候補情報から適用可能用例番号を求め、その示された用
例の用例抑制フラグをOFFにする。
候補情報から適用可能用例番号を求め、その示された用
例の用例抑制フラグをOFFにする。
ステップ27−5において、選択された候補と対立する
候補、すなわち、候補一覧上で選択候補よりも上位に表
示される候補を1つずつ取り出す。
候補、すなわち、候補一覧上で選択候補よりも上位に表
示される候補を1つずつ取り出す。
ステップ27−6において、全ての対立候補について処
理が終り、これ以上取り出せなくなれば、リターンす
る。
理が終り、これ以上取り出せなくなれば、リターンす
る。
ステップ27−7において、選択候補及び対立候補の属
するカテゴリーすなわち品詞を調べ、対立候補のカテゴ
リーが選択候補のカテゴリーよりも優先度の低いカテゴ
リーであれば、対立候補の学習フラグを操作せずにその
ままステップ27−5にループする。例えば、選択候補が
接頭語で対立候補が名詞のときはステップ27−5にルー
プする。また、選択候補が付属語で対立候補が名詞、動
詞などの自立語であればステップ27−5にループする。
するカテゴリーすなわち品詞を調べ、対立候補のカテゴ
リーが選択候補のカテゴリーよりも優先度の低いカテゴ
リーであれば、対立候補の学習フラグを操作せずにその
ままステップ27−5にループする。例えば、選択候補が
接頭語で対立候補が名詞のときはステップ27−5にルー
プする。また、選択候補が付属語で対立候補が名詞、動
詞などの自立語であればステップ27−5にループする。
ステップ27−8において、選択候補に用例が適用され
ているかどうかを判定し、用例が適用されていないとき
はステップ27−10に分岐する。
ているかどうかを判定し、用例が適用されていないとき
はステップ27−10に分岐する。
選択候補に用例が適用されているとき、ステップ27−
9において、対立候補に用例が適用されているかどうか
を判定し、用例が適用されているときはステップ27−10
に分岐する。選択候補に用例が適用されているが、対立
候補には用例が適用されていないとき、対立候補の学習
フラグを操作せずにそのままステップ27−5にループす
る。
9において、対立候補に用例が適用されているかどうか
を判定し、用例が適用されているときはステップ27−10
に分岐する。選択候補に用例が適用されているが、対立
候補には用例が適用されていないとき、対立候補の学習
フラグを操作せずにそのままステップ27−5にループす
る。
選択候補に用例が適用されないとき、或いは、選択候
補、対立候補の両方に用例が適用されているとき、ステ
ップ27−10において、まず、対立候補に適用される用例
の用例抑制フラグをON氏、その用例が今後使用されない
様にする。
補、対立候補の両方に用例が適用されているとき、ステ
ップ27−10において、まず、対立候補に適用される用例
の用例抑制フラグをON氏、その用例が今後使用されない
様にする。
次にステップ27−11において、対立候補の学習フラグ
をOFFする。その後、ステップ27−5にループする。
をOFFする。その後、ステップ27−5にループする。
[他の実施例] 以上の説明において、付属語と自立語が対立する場
合、名詞と接尾語或いは接頭語が対立する場合、用例の
適用されている候補と用例の適用されていない候補が対
立する場合、の3つの場合について、対立候補の短期学
習OFF処理を説明した。
合、名詞と接尾語或いは接頭語が対立する場合、用例の
適用されている候補と用例の適用されていない候補が対
立する場合、の3つの場合について、対立候補の短期学
習OFF処理を説明した。
本発明の本質は、選択単語の学習の際に補正される情
報(学習情報)の範囲を最小限にとどめようというもの
である。従って、本発明は短期学習に限定されず、他の
学習に対しても容易に適用でき、顕著な効果を期待でき
る。
報(学習情報)の範囲を最小限にとどめようというもの
である。従って、本発明は短期学習に限定されず、他の
学習に対しても容易に適用でき、顕著な効果を期待でき
る。
例えば、学習方式が頻度学習方式の場合にも、本発明
は適用可能である。このときは、選択単語の頻度がカウ
ントアップされ、その頻度値が最大値に達したとき、対
立する単語の頻度をカウントダウンすることになるが、
カウントダウンするまでもなく選択単語が第1候補で変
換できるかどうか判定(具体的には、両者の頻度値を比
較)し、変換できるときは対立単語を頻度カウントダウ
ン処理を行なわないよう構成すれば良い。
は適用可能である。このときは、選択単語の頻度がカウ
ントアップされ、その頻度値が最大値に達したとき、対
立する単語の頻度をカウントダウンすることになるが、
カウントダウンするまでもなく選択単語が第1候補で変
換できるかどうか判定(具体的には、両者の頻度値を比
較)し、変換できるときは対立単語を頻度カウントダウ
ン処理を行なわないよう構成すれば良い。
例えば、学習方式が、学習された単語を辞書の形式で
登録していく方式(学習辞書方式)のときも、本発明は
適用可能である。このときは、選択単語を学習辞書に登
録し、同時に対立する単語を学習辞書から追い出すこと
になるが、追い出す必要性があるかどうかを判定してか
ら、対立単語の追い出し処理を行なうよう構成すれば良
い。
登録していく方式(学習辞書方式)のときも、本発明は
適用可能である。このときは、選択単語を学習辞書に登
録し、同時に対立する単語を学習辞書から追い出すこと
になるが、追い出す必要性があるかどうかを判定してか
ら、対立単語の追い出し処理を行なうよう構成すれば良
い。
また、学習した単語の辞書上でのアドレスを記憶する
方式(学習単語アドレス記憶方式)も考えられる。この
ときは、選択単語のアドレスを学習データとして記憶
し、対立する単語のアドレスを削除することになるが、
削除する必要性があるかどうかを判定してから、対立単
語アドレスの削除処理を行なうよう構成すれば良い。
方式(学習単語アドレス記憶方式)も考えられる。この
ときは、選択単語のアドレスを学習データとして記憶
し、対立する単語のアドレスを削除することになるが、
削除する必要性があるかどうかを判定してから、対立単
語アドレスの削除処理を行なうよう構成すれば良い。
[発明の効果] 以上説明したように、本発明によれば、選択された候
補の学習データを向上させるとともに、選択候補と選択
候補より上位の候補とを比較して、選択候補より上位の
候補中の単語のうち、学習データ向上後の選択候補より
優先される候補中の単語の優先度を低下させ、優先され
ない候補中の単語の学習データを不変とし、選択された
候補以外の候補中の単語の学習データを不必要に変更す
ることを防止でき、ある単語に対して設定されていた学
習データによる学習効果が、不必要に消去されることが
防止できるという効果がある。
補の学習データを向上させるとともに、選択候補と選択
候補より上位の候補とを比較して、選択候補より上位の
候補中の単語のうち、学習データ向上後の選択候補より
優先される候補中の単語の優先度を低下させ、優先され
ない候補中の単語の学習データを不変とし、選択された
候補以外の候補中の単語の学習データを不必要に変更す
ることを防止でき、ある単語に対して設定されていた学
習データによる学習効果が、不必要に消去されることが
防止できるという効果がある。
これにより変換率の高い、快適な文字処理装置を実現
することができる。
することができる。
第1図は本発明に係る文字処理装置の全体構成のブロッ
ク図、 第2図〜第4図は従来装置における変換・学習の操作例
を示した図、 第5図〜第7図は本発明における変換・学習の操作例を
示した図、 第8図は本発明における入力バッファIBUFと出力バッフ
ァOBUFの構成を示した図、 第9図は本発明における仮名漢字変換用辞書DICの構成
を示した図、 第10図は本発明における用例辞書YDICの構成を示した
図、 第11図は本発明における文節候補テーブルBCTBLの記憶
内容を概念的に示した図、 第12図は本発明における文節候補テーブルBCTBLの構成
を示した図、 第13図は本発明における文節接続マトリックスCTBL1、C
TBL2、CTBL3の構成を示した図、 第14図は本発明におけるテキストバッファTBUFの構成を
示した図、 第15図は本発明における同音語バッファDOBUFの構成を
示した図、 第16図は本発明における尤度計算の方式を示した図、 第17図〜第19図は本発明における尤度計算の例を示した
図、 第20図〜第27図は本発明文字処理装置の動作を示すフロ
ーチャート。 DISK……外部記憶部 CPU……マイクロプロセッサ ROM……読出し専用メモリ RAM……ランダムアクセスメモリ IBUF……入力バッファ OBUF……出力バッファ DIC……仮名漢字変換用辞書 YDIC……用例辞書 BCTBL……文節候補テーブル CBUF1……文節接続マトリックス1(文節×付属語用) CBUF2……テキストバッファ2(文節×接尾語用) CBUF3……テキストバッファ3(接頭語×文節用) TBUF……テキストバッファ DOBUF……同音語バッファ
ク図、 第2図〜第4図は従来装置における変換・学習の操作例
を示した図、 第5図〜第7図は本発明における変換・学習の操作例を
示した図、 第8図は本発明における入力バッファIBUFと出力バッフ
ァOBUFの構成を示した図、 第9図は本発明における仮名漢字変換用辞書DICの構成
を示した図、 第10図は本発明における用例辞書YDICの構成を示した
図、 第11図は本発明における文節候補テーブルBCTBLの記憶
内容を概念的に示した図、 第12図は本発明における文節候補テーブルBCTBLの構成
を示した図、 第13図は本発明における文節接続マトリックスCTBL1、C
TBL2、CTBL3の構成を示した図、 第14図は本発明におけるテキストバッファTBUFの構成を
示した図、 第15図は本発明における同音語バッファDOBUFの構成を
示した図、 第16図は本発明における尤度計算の方式を示した図、 第17図〜第19図は本発明における尤度計算の例を示した
図、 第20図〜第27図は本発明文字処理装置の動作を示すフロ
ーチャート。 DISK……外部記憶部 CPU……マイクロプロセッサ ROM……読出し専用メモリ RAM……ランダムアクセスメモリ IBUF……入力バッファ OBUF……出力バッファ DIC……仮名漢字変換用辞書 YDIC……用例辞書 BCTBL……文節候補テーブル CBUF1……文節接続マトリックス1(文節×付属語用) CBUF2……テキストバッファ2(文節×接尾語用) CBUF3……テキストバッファ3(接頭語×文節用) TBUF……テキストバッファ DOBUF……同音語バッファ
フロントページの続き (72)発明者 池田 和世 東京都大田区下丸子3丁目30番2号 キ ヤノン株式会社内 (72)発明者 鈴木 大記 東京都大田区下丸子3丁目30番2号 キ ヤノン株式会社内 (56)参考文献 特開 昭63−136252(JP,A) 特開 昭62−233880(JP,A) 特開 昭62−267862(JP,A)
Claims (2)
- 【請求項1】読みを入力する入力手段と、 単語の読みと、表記と、品詞と、学習データとを対応づ
けて記憶する記憶手段と、 文節の組み合わせに対する優先度を記憶する優先度記憶
手段と、 前記入力手段より入力された文の読みに対して、前記記
憶手段を参照し、複数の文節候補からなる文候補を作成
する文候補作成手段と、 該文候補作成手段により作成された各文候補より、前記
記憶手段及び前記優先度記憶手段を参照して、各文候補
中の各文節候補内の単語の学習データの表わす優先度と
各文節候補の組み合わせに対する優先度とに基づいて、
第1候補となる文候補を決定し、当該文候補の表記を表
示する第1候補表示手段と、 該第1候補表示手段により表示された各文節候補につい
て、下位の候補の表記を表示する次候補表示手段と、 該次候補表示手段または前記第1候補表示手段により表
記が表示された文節候補より1つの候補を選択する選択
手段と、 該選択手段により選択された文節候補中の単語の優先度
を向上させるように、当該単語の学習データを更新する
学習手段と、 前記選択された文節候補と当該選択された文節候補より
上位の各候補とを比較して、当該上位の各候補が、前記
学習手段による更新後の学習データに基づく前記選択さ
れた候補より優先されるかを判定する判定手段と、 該判定手段による判定の結果に基づいて、優先されると
判定された候補中の単語の学習データを、当該単語の優
先度を低下させるように更新し、優先されないと判定さ
れた候補中の単語の学習データを不変とするように制御
する抑制手段とを具備したことを特徴とする文字処理装
置。 - 【請求項2】前記学習データは、各単語において他の単
語と独立な状態を取り得る1ビットの学習フラグであ
り、前記第1候補表示手段は、学習フラグがオンである
とき高い優先度とし、前記学習手段は、選択された単語
の学習フラグをオンし、前記抑制手段は、単語の学習フ
ラグをオフすることにより当該単語の優先度を低下させ
ることを特徴とする請求項1に記載の文字処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2229672A JP2899087B2 (ja) | 1990-08-30 | 1990-08-30 | 文字処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2229672A JP2899087B2 (ja) | 1990-08-30 | 1990-08-30 | 文字処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04111043A JPH04111043A (ja) | 1992-04-13 |
JP2899087B2 true JP2899087B2 (ja) | 1999-06-02 |
Family
ID=16895875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2229672A Expired - Fee Related JP2899087B2 (ja) | 1990-08-30 | 1990-08-30 | 文字処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2899087B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62233880A (ja) * | 1986-04-04 | 1987-10-14 | Hitachi Ltd | 文章入力装置 |
JPS63136252A (ja) * | 1986-11-28 | 1988-06-08 | Hitachi Ltd | 文書作成装置 |
-
1990
- 1990-08-30 JP JP2229672A patent/JP2899087B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04111043A (ja) | 1992-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5257186A (en) | Digital computing apparatus for preparing document text | |
JP2899087B2 (ja) | 文字処理装置 | |
JP2675912B2 (ja) | 文字処理装置 | |
JP2714239B2 (ja) | 文字処理装置 | |
JP2621999B2 (ja) | 文書処理装置 | |
JP2714238B2 (ja) | 文字処理装置 | |
JP3847801B2 (ja) | 文字処理装置及びその処理方法 | |
JPS59100941A (ja) | 仮名漢字変換装置 | |
JP3278148B2 (ja) | 文字処理装置及びその方法 | |
JPH0410052A (ja) | 外国語電子辞書検索方法及び装置 | |
JP2698458B2 (ja) | 文字処理装置 | |
JPH08241315A (ja) | 文書処理装置の単語登録機構 | |
JPH0962667A (ja) | 仮名漢字変換装置および仮名漢字変換方法 | |
JPH0638260B2 (ja) | 文字処理装置及びその方法 | |
JPH1097536A (ja) | 機械翻訳におけるユーザー辞書登録システム | |
JPH04160668A (ja) | 文字処理装置 | |
JPH0447443A (ja) | 文字処理装置 | |
JPH0638261B2 (ja) | 文字処理装置及びその方法 | |
JPH0447451A (ja) | 文字処理装置 | |
JPH0877159A (ja) | 学習方法 | |
JPH0628064B2 (ja) | 文字処理装置 | |
JPH03116361A (ja) | 文字処理装置 | |
JPH052263U (ja) | かな漢字変換装置 | |
JPH05181854A (ja) | 文章校正装置および文章処理装置、ならびに漢字仮名変換装置 | |
JPH07141353A (ja) | 文字処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |