JPS61188658A - 文字処理装置 - Google Patents
文字処理装置Info
- Publication number
- JPS61188658A JPS61188658A JP60028764A JP2876485A JPS61188658A JP S61188658 A JPS61188658 A JP S61188658A JP 60028764 A JP60028764 A JP 60028764A JP 2876485 A JP2876485 A JP 2876485A JP S61188658 A JPS61188658 A JP S61188658A
- Authority
- JP
- Japan
- Prior art keywords
- word
- conversion
- dictionary
- candidate
- homophone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
分野の説明
本発明は仮名漢字変換を行なうことにより日本文を入力
する文字処理装置に関する。
する文字処理装置に関する。
従来技術
日本文、特に漢字を入力する文字処理装置においては、
オペレータがキーボードより入力したい漢字に対応する
読みを入力して変換指示を与えることにより読みを漢字
に変換して入力するいわゆるかな漢字変換により漢字入
力を実現する方法が広く行なわれている。
オペレータがキーボードより入力したい漢字に対応する
読みを入力して変換指示を与えることにより読みを漢字
に変換して入力するいわゆるかな漢字変換により漢字入
力を実現する方法が広く行なわれている。
上記の方法において一つの読みに対して複数の漢字列が
存在する場合優先度の高い候補から表示され、オペレー
タは、もし望む候補が表示されていなかったときは更に
下位の優先度の候補の表示を指示する次候補指示を行な
い1表示されている候補が望む漢字列であったときはそ
の漢゛字列を確定する選択指示を行なう必要がある。し
かし、個人の使用する単語数は著しく制限されているの
が普通であるため、一度選択された単語は次回の変換か
らは最も優先度の高い候補として表示し、次候補指示を
行なわずに選択指示を行なえる様にする。いわゆる学習
処理が行なわれている。
存在する場合優先度の高い候補から表示され、オペレー
タは、もし望む候補が表示されていなかったときは更に
下位の優先度の候補の表示を指示する次候補指示を行な
い1表示されている候補が望む漢字列であったときはそ
の漢゛字列を確定する選択指示を行なう必要がある。し
かし、個人の使用する単語数は著しく制限されているの
が普通であるため、一度選択された単語は次回の変換か
らは最も優先度の高い候補として表示し、次候補指示を
行なわずに選択指示を行なえる様にする。いわゆる学習
処理が行なわれている。
上記学習処理については従来種々の方法が考案されてい
る。
る。
一つの方法は、学習データとして各単語に対応して1ビ
ツトのフラグを設け、もしその単語が選択されればフラ
グをONL、変換候補中に挙がっていたにもかかわらず
、別の単語が選択されたときはOFFすることにし、変
換時に候補中にフラグがONになっている単語があれば
、その単語を優先して変換するという方式である。上記
の方法では辞書の単語数に応じた量の学習データが必要
であるという欠点を持っている。例えば、辞書単語数が
20万語であれば、20万ビツト=25000バイトも
の学習データが必要である。
ツトのフラグを設け、もしその単語が選択されればフラ
グをONL、変換候補中に挙がっていたにもかかわらず
、別の単語が選択されたときはOFFすることにし、変
換時に候補中にフラグがONになっている単語があれば
、その単語を優先して変換するという方式である。上記
の方法では辞書の単語数に応じた量の学習データが必要
であるという欠点を持っている。例えば、辞書単語数が
20万語であれば、20万ビツト=25000バイトも
の学習データが必要である。
1つの方法は学習データとして各単語の辞書上での順位
を利用し、選択するたびに辞書上の単語を並べ換えると
いう方式である。この方式では辞書上で各単語を読みと
漢字のペアとして、辞書式配列のllli番で登、録し
・同−読みの単:lit±1ケ所にまとまって配置す、
ることにする0選択された単語は前記の同−読みの単語
群の先頭に配置されるよう、に並べ換え、変換する際に
は先頭の単語を優先的に変換するようにする。
を利用し、選択するたびに辞書上の単語を並べ換えると
いう方式である。この方式では辞書上で各単語を読みと
漢字のペアとして、辞書式配列のllli番で登、録し
・同−読みの単:lit±1ケ所にまとまって配置す、
ることにする0選択された単語は前記の同−読みの単語
群の先頭に配置されるよう、に並べ換え、変換する際に
は先頭の単語を優先的に変換するようにする。
上記の方式の欠点は同−読みの単語間でのみ学習効果が
得られ、異なる読みの単語間では学習効果が得られない
という点である0例えば、「かいては」という入力に対
しては「買手は」 「書いては」という2つの入力が考
えられるが、辞書中での読みはそれぞれ「かいて」、「
か」となっているため、双方共に同−読みの単語群で最
上位の優先度を持っているとどちらの優先度を高くして
変換すれば良いかを判断できない。従ってどちらか片方
を第1位として変換するわけであるが、もしごそれが自
分の望む変換結果と異なる場合であって学習を行なうこ
とはできない。
得られ、異なる読みの単語間では学習効果が得られない
という点である0例えば、「かいては」という入力に対
しては「買手は」 「書いては」という2つの入力が考
えられるが、辞書中での読みはそれぞれ「かいて」、「
か」となっているため、双方共に同−読みの単語群で最
上位の優先度を持っているとどちらの優先度を高くして
変換すれば良いかを判断できない。従ってどちらか片方
を第1位として変換するわけであるが、もしごそれが自
分の望む変換結果と異なる場合であって学習を行なうこ
とはできない。
1また一つの方法として、選択が行なわれるたびに選択
された単語のアドレスを最新使用単語リストに記憶し、
変換するときにもし変換候補の単語の中に最新使用単語
リスト上にアドレスが記載されている単語があればそめ
単語を上位に変換するという学習方式も°ある。この方
式の欠点は最新使用単語リストがオーバフローしたとき
に学習結果が失われるという点である。すなわち、最新
使用単語リストの容量はアドレスを記憶するという制限
上、全単語の容量に比べはるかに少ないので、選択され
る単語が最新使用単語リストの容量を超えると、昔選択
された単語の情報が失われるのである。
された単語のアドレスを最新使用単語リストに記憶し、
変換するときにもし変換候補の単語の中に最新使用単語
リスト上にアドレスが記載されている単語があればそめ
単語を上位に変換するという学習方式も°ある。この方
式の欠点は最新使用単語リストがオーバフローしたとき
に学習結果が失われるという点である。すなわち、最新
使用単語リストの容量はアドレスを記憶するという制限
上、全単語の容量に比べはるかに少ないので、選択され
る単語が最新使用単語リストの容量を超えると、昔選択
された単語の情報が失われるのである。
第1図は従来の方式では学習ができないことを示した図
である。
である。
(&)は単語「書く」の辞書中での格納方式を示した図
である。「書く」は読みが「か」として辞書中に格納さ
れており、同じ「か」という読みを持つ別の単語(「描
<」「掻<」「欠<」)と並んで格納されている。今の
場合、「書く」は第1位に格納されている。
である。「書く」は読みが「か」として辞書中に格納さ
れており、同じ「か」という読みを持つ別の単語(「描
<」「掻<」「欠<」)と並んで格納されている。今の
場合、「書く」は第1位に格納されている。
(b)は単語「買手」の辞書中での格納方式を示した図
である。「買手」は読みが「かいて」として辞−中に格
納されており、その読みでは第1位として格納されてい
る。
である。「買手」は読みが「かいて」として辞−中に格
納されており、その読みでは第1位として格納されてい
る。
すなわち、「書く」もゴ買手」も共に辞書中での順位が
第1位であるために、従来方式ではもうこれ以上学習を
行なうことができないのである。
第1位であるために、従来方式ではもうこれ以上学習を
行なうことができないのである。
もともと、辞書内の順位の並び換えによる学習方式は同
−読みの単語間での学習のためのものであるので、この
入力のように異なる読みの単語間での学習はできないの
である。
−読みの単語間での学習のためのものであるので、この
入力のように異なる読みの単語間での学習はできないの
である。
発明の目的
本発明の目的は上記の欠点を除去することにある。
すなわち、異なる読みをもつ単語間であっても優先度を
差別化できるように、従来の辞書的順位並べ換え方式の
学習に加えて最新使用単語リストの概念を導入し、異な
る読みの単56間での学習効果をもったかな漢字変換入
力ができる文字処理装置を提供することにある。
差別化できるように、従来の辞書的順位並べ換え方式の
学習に加えて最新使用単語リストの概念を導入し、異な
る読みの単56間での学習効果をもったかな漢字変換入
力ができる文字処理装置を提供することにある。
第2図は未発明による学習を示した図である。
(a)は画面の初期状態を示す図であり、CMはカーソ
ル、CRTは画面を意味する。この状態で「かいては、
」を入力すると、(b)のようになり、次いで変換キー
を4打鍵すると(C,)のように「書いては」が変換さ
れる。ここで、0印は画面上で文字が白黒反転して表示
されることを意味しており、表示されている候補以外に
変換候補が存在することを意味している。
ル、CRTは画面を意味する。この状態で「かいては、
」を入力すると、(b)のようになり、次いで変換キー
を4打鍵すると(C,)のように「書いては」が変換さ
れる。ここで、0印は画面上で文字が白黒反転して表示
されることを意味しており、表示されている候補以外に
変換候補が存在することを意味している。
「書いては」は望む候補でないので次候補キーを入力す
ると(d)のように「買手は」が次候補として表示され
る。
ると(d)のように「買手は」が次候補として表示され
る。
選択キーを押すと(e)のように「買手は」が確定し、
学習処理が行なわれる。
学習処理が行なわれる。
もう一度「かいては、」を入力すると(f)のようにな
り、更に変換キーを押すと従来の方式では(g)のよう
に「書いては」が依然として第1候補として表示される
。
り、更に変換キーを押すと従来の方式では(g)のよう
に「書いては」が依然として第1候補として表示される
。
これに対して本発明の場合には(h)に示すように「買
手は」が第1候補として表示され、る。
手は」が第1候補として表示され、る。
以下図面を参照して本発明の詳細な説明する。
第3図は本発明による1実施例を説明する図である。
入力装置により入力された読み列は変換装置によって辞
書を検索することにより単語の表記に変換され、更に辞
書上での物理的順位、最新使用単語リストを参照するこ
とにより優先度がつけられ、同音語バッファ上に変換候
補、優先度、アドレス情報が登録される。同音語バッフ
ァの内容は表示装置によって表示され、次候補指示装置
により次候補が指示されると表示装置により同音語バッ
ファ中の更に下位の優先度の候補が表示される0選択装
置により選択が指示されると現在表示されている同音語
バ、−/ファ中の候補が確定し、選択されると共に辞書
上の単語の順位が更新され。
書を検索することにより単語の表記に変換され、更に辞
書上での物理的順位、最新使用単語リストを参照するこ
とにより優先度がつけられ、同音語バッファ上に変換候
補、優先度、アドレス情報が登録される。同音語バッフ
ァの内容は表示装置によって表示され、次候補指示装置
により次候補が指示されると表示装置により同音語バッ
ファ中の更に下位の優先度の候補が表示される0選択装
置により選択が指示されると現在表示されている同音語
バ、−/ファ中の候補が確定し、選択されると共に辞書
上の単語の順位が更新され。
更に選択された候補に対応するアドレス情報が最新使用
単語リストに登録される。
単語リストに登録される。
第4図は本発明の実施例をさらに説明するものである。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセンサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセンサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。
つぎにROMは、読出し専用の固定メモリであり、第1
1図〜第18図につき後述するマイクロプロセッサCP
Uによる制御の手順等を記憶している。
1図〜第18図につき後述するマイクロプロセッサCP
Uによる制御の手順等を記憶している。
また、RAMは、lワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。
I BUFは入力バッファで、キーボードより人力され
た文字等が入る。
た文字等が入る。
TBUFは文書バッファであり、キーボードKBより入
力された文書情報を蓄えるためのメモリである。
力された文書情報を蓄えるためのメモリである。
DICはかな漢字変換を行なうための辞書である。
MRLは最新使用単語リストであり、選択された単語に
対応する単語コードを記憶する。
対応する単語コードを記憶する。
DOBUFは同音語バッファであり一意に変換できなか
った漢字候補を記憶する。
った漢字候補を記憶する。
CTRLは単語コード変換テーブルである。
KBはキーボードであって、アルファベ−/ トキー、
ひらかなキー、カタカナキー等の文字記号入カキ−1及
び、変換キー、選択キー、次候補キー等の本文字処理装
置に対する各種機能を指示するための各種のファンクシ
ョンキーを備えそいる。
ひらかなキー、カタカナキー等の文字記号入カキ−1及
び、変換キー、選択キー、次候補キー等の本文字処理装
置に対する各種機能を指示するための各種のファンクシ
ョンキーを備えそいる。
DISKは定型文書を記憶するためのメモリで作成され
た文書の保管を行ない、保管された文書はキーボードの
指示により、必要な時呼び出される。
た文書の保管を行ない、保管された文書はキーボードの
指示により、必要な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。
ルレジスタの内容を読み書きできる。
後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対応する表示装置CRT上の位置にカー
ソルを表示する。
れたアドレスに対応する表示装置CRT上の位置にカー
ソルを表示する。
DBUFは表示用バッファメモリで、TBUFに蓄えら
れ゛た文書情報等のパターンをキャラクタジェネレータ
によりパターン花して蓄える。
れ゛た文書情報等のパターンをキャラクタジェネレータ
によりパターン花して蓄える。
CRTCはカーソルレジス□りCR及びバッファDBU
Fに蓄え°られた内容を表示装置CRTに表示する役割
を担う。
Fに蓄え°られた内容を表示装置CRTに表示する役割
を担う。
−またCRTは陰極線管等を用いた表示装置であり、そ
の表示装mcRTにおけるドツト構成の表示パターンお
よびカーソルの表示をCRTコントローラで制御する。
の表示装mcRTにおけるドツト構成の表示パターンお
よびカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパ□ターンを記憶す
るものである。
装置CRTに表示する文字、記号のパ□ターンを記憶す
るものである。
かかる各構成要素からなる本発明文字処理装置において
は、キ」ボードKBからの各種の入力に応じて作動する
ものであって゛、キーボードKBからの入力が供給され
゛ると、まず、インタラブド信号がマイクロプロセッサ
CPUに送られ、そのマイクロプロセッサC’PUが固
定メモリROM内に記憶しである各種の制御信号を読出
し、それらの制御信号に従って各種の制御が行なわれる
。
は、キ」ボードKBからの各種の入力に応じて作動する
ものであって゛、キーボードKBからの入力が供給され
゛ると、まず、インタラブド信号がマイクロプロセッサ
CPUに送られ、そのマイクロプロセッサC’PUが固
定メモリROM内に記憶しである各種の制御信号を読出
し、それらの制御信号に従って各種の制御が行なわれる
。
第5図は本発明における辞書(DIC)の構成を示した
図である。′ YFは読み部であり、単語の読みを1文字1バ□イトで
最高8文字まで格納する。コードはJISC−6226
コードの下位バイトを使用し、余った領域には0を埋め
る。
図である。′ YFは読み部であり、単語の読みを1文字1バ□イトで
最高8文字まで格納する。コードはJISC−6226
コードの下位バイトを使用し、余った領域には0を埋め
る。
KFは漢字部であり、単語の表iを1文字2八イトで最
高3文字まで格納する。コードはJISC−6226コ
ードを使゛用゛し、余った領域には0を埋める。
高3文字まで格納する。コードはJISC−6226コ
ードを使゛用゛し、余った領域には0を埋める。
GFI′ま文法情報部であり、その単語の品詞等の文法
情報を格納する。
情報を格納する。
各単語はすべて16バイトで構成され、辞書先頭から単
語を識別する単語コードが割り付けられる。例えば、単
語コードiの単語というのは辞書先頭から(i+1)番
目の単語を意味する。
語を識別する単語コードが割り付けられる。例えば、単
語コードiの単語というのは辞書先頭から(i+1)番
目の単語を意味する。
同−読みの単語の中では順位の順番に並んでおり1例え
ば同−読みで2番目にある単語は順位=2とする。
ば同−読みで2番目にある単語は順位=2とする。
第6図は最新使用単語リスト(MRL)の構成を示した
図である。
図である。
MRLは最近選択された単語の単語コードを記tαする
ためのリストで、2バイトの単語コードを100“単語
分記憶し、200バイトで構成される。
ためのリストで、2バイトの単語コードを100“単語
分記憶し、200バイトで構成される。
変換を行なう際に、変換候補となる単語の単語コニドが
このMRL中辷登録されているかどうかサーチを行ない
、もし1′登録されているときは優先度を高くして変換
するようにする。
このMRL中辷登録されているかどうかサーチを行ない
、もし1′登録されているときは優先度を高くして変換
するようにする。
選択が余り行なわれず領域が余っていると゛きは存在し
がい′単語コード(例えば−1)が入っている。
がい′単語コード(例えば−1)が入っている。
第7図はRAM中の文書データ(TB U F)、同音
語)くツファプール(DOBUF)の構成を示す図であ
る。
語)くツファプール(DOBUF)の構成を示す図であ
る。
文書データは1行128バイトから成る行データに分割
される。同:音語バッファプールは128バイトで構成
される同音語゛バッファに分割される。各同音語バッフ
ァには先頭から−に同音語バッファ゛コードが割り゛付
けられる。(先頭の同音語八ツファ=0,2番゛目の同
音語バ′ツファ=1、・・・) 第8図は同音語バッツ讐の構成を示した図である。
される。同:音語バッファプールは128バイトで構成
される同音語゛バッファに分割される。各同音語バッフ
ァには先頭から−に同音語バッファ゛コードが割り゛付
けられる。(先頭の同音語八ツファ=0,2番゛目の同
音語バ′ツファ=1、・・・) 第8図は同音語バッツ讐の構成を示した図である。
DNOは表示□番号であり、現在表示中の候補が何番目
であるか□を示す。
であるか□を示す。
IKLは読み□長を示jし、読み部が何バイト存在する
かを示す。
かを示す。
ICLは漢字部を示し、漢字部が何バイト存在するかを
示す。
示す。
IUNは単語コード長を示し、単語コードが何バイト存
在するかを示す。
在するかを示す。
゛読み部には入力読み列を格納する。コードはJIS
C−6226コードを使用し、1文字当り2バイトの
エリアを使用する。
C−6226コードを使用し、1文字当り2バイトの
エリアを使用する。
漢字部には変換候補の漢字列をJIS C−6226
コードを使用して1文字2バイトで格納する。変換候補
は優先度の高いものから順番に格納する。すなわち優先
度情報が変換候補の順番で記憶されることになる。
コードを使用して1文字2バイトで格納する。変換候補
は優先度の高いものから順番に格納する。すなわち優先
度情報が変換候補の順番で記憶されることになる。
単語コードには変換候補に対応する単語の単語コードを
1コード2バイトを使用して格納する。
1コード2バイトを使用して格納する。
FLGはその同音語バッファが使用中か未使用かを示す
フラグであり、「1」は使用中、「0、」は未使用を意
味する。
フラグであり、「1」は使用中、「0、」は未使用を意
味する。
第9図は文書データの各行デ、−夕の構成を示す図であ
る。
る。
(a)は行データ全体の構成であり、1行当り64文字
分のデータが格納される (b)は文字データとして同音語でない通常の文字が格
納される場合の構成であり、1文字2バイトで構成され
る。先頭の1ビツトは同音語フラグであり、通常文字ま
た同音語が確定した場合では0となっている0文字デー
タにはJIS C−6226コードを使用する。
分のデータが格納される (b)は文字データとして同音語でない通常の文字が格
納される場合の構成であり、1文字2バイトで構成され
る。先頭の1ビツトは同音語フラグであり、通常文字ま
た同音語が確定した場合では0となっている0文字デー
タにはJIS C−6226コードを使用する。
(’c)は同音語である場合の文字データを示し。
先頭の同音語フラグは「1」になっている、同音語バッ
ファへのポインタ(アドレス)が2バイトで格納される
。ポインタとしては同音語バッフアコ−Fを使用する。
ファへのポインタ(アドレス)が2バイトで格納される
。ポインタとしては同音語バッフアコ−Fを使用する。
何番目の候補を表示中であるかは同音語バッファ中の表
示番号DNOで決定される。変換候補の何文字目である
かは文書データ中で同音語の何文字目に位置しているか
に従う。
示番号DNOで決定される。変換候補の何文字目である
かは文書データ中で同音語の何文字目に位置しているか
に従う。
第10図は単語コード変換用の変換テーブルCTRLで
ある。
ある。
単語コードに修正が必要になったときに、変換前のコー
ドを旧コードに、変換後のコードを新コードに格納する
。
ドを旧コードに、変換後のコードを新コードに格納する
。
上述の構成から成る実施例の作動を第11図〜第18図
のフローをも参照して説明する。
のフローをも参照して説明する。
第11図は本発明文字処理装置の動作を示すフローチャ
ートである。
ートである。
ステップ−11−1においてキーボードKBよりキーが
押下され、割込が発生するのを待つ、キーが入力される
とキーの種類に応じて11−2゜11−3.11−4.
−11−5のいずれかのステップに分岐する。
押下され、割込が発生するのを待つ、キーが入力される
とキーの種類に応じて11−2゜11−3.11−4.
−11−5のいずれかのステップに分岐する。
ステップ11−2は変換キーが押下されたときの処理で
あり、入力された読み列を漢字列に変換して候補が複数
個あ・れば、同音語バッファを作成する。
あり、入力された読み列を漢字列に変換して候補が複数
個あ・れば、同音語バッファを作成する。
ステップ11−3は次候補キーが入力されたときの処理
であり、表示されている同音語の次候補を表示するよう
にする。
であり、表示されている同音語の次候補を表示するよう
にする。
ステップ11−4は選択、キーが入力されたときの処理
であり、現在表示中の同音M#補を確定し、学習処理を
行なう。
であり、現在表示中の同音M#補を確定し、学習処理を
行なう。
ステップ11−5は変換キー、次候補キー、選択キー以
外の通常のキー(例えばかなキー、カーソル移動キー)
を入力した場合の処理であり、同種の文字処理装置にお
いて一般に行なわれている処理であり、公知であるので
、特に記述しない。
外の通常のキー(例えばかなキー、カーソル移動キー)
を入力した場合の処理であり、同種の文字処理装置にお
いて一般に行なわれている処理であり、公知であるので
、特に記述しない。
ステップ11−6は上記の編集処理の結果、変更された
部分を表示する表示処理である0文書中のデータを1文
字読んではパターンに展開し、表示バッファに出力する
。
部分を表示する表示処理である0文書中のデータを1文
字読んではパターンに展開し、表示バッファに出力する
。
また同音語ポインタであったときは、指定された同音語
バッファ中の表示番号DNOで示される文字パターンを
表示バー、ファに展開する。
バッファ中の表示番号DNOで示される文字パターンを
表示バー、ファに展開する。
第1.2図はステップ11−2の処理を詳細化したフロ
ーチャートである。” ステップ12−1において入力読み列に従って辞書サー
チを行なう。
ーチャートである。” ステップ12−1において入力読み列に従って辞書サー
チを行なう。
ステップ12−2において辞書サーチの結果、入力読み
列に対応する単語があったかどうかを判断し、もし見つ
かれば以下の処理を行なうが、見つからなければ、ステ
ップ12−11に移り、文書メモリに同音語バッファの
ポインタをセットする。
列に対応する単語があったかどうかを判断し、もし見つ
かれば以下の処理を行なうが、見つからなければ、ステ
ップ12−11に移り、文書メモリに同音語バッファの
ポインタをセットする。
入力読み列に対応する単語が見つかるとステップ12−
4において同音語バッファをアロケートする。すなわち
同音語バッファプールDOBUF中に未使用である同音
語バッファをサーチし、その同音語バッファを使用中の
状態に変更し。
4において同音語バッファをアロケートする。すなわち
同音語バッファプールDOBUF中に未使用である同音
語バッファをサーチし、その同音語バッファを使用中の
状態に変更し。
DNOを1にし、IKI、、ICL、IUNの値を入力
読み列、変換結果に従ってセットする。
読み列、変換結果に従ってセットする。
ステップ12−4において見つかった単語の辞書中での
順位を求め、256−(順位)を優先度とする。例えば
辞書中で同−読みの単語群の中で2番目の単語は順位=
2であるから 優先度=258−2=254 となる
。
順位を求め、256−(順位)を優先度とする。例えば
辞書中で同−読みの単語群の中で2番目の単語は順位=
2であるから 優先度=258−2=254 となる
。
ステップ12−5において見つかった単語の単語コード
が最新使用単語リストMRL中にないかをサーチする。
が最新使用単語リストMRL中にないかをサーチする。
ステップ12−6においてMRL中にあったかどうかを
判定し、もしあれば、ステップ12−7に進んで優先度
に256を加える。もしなければステップ12−8にス
キップする。
判定し、もしあれば、ステップ12−7に進んで優先度
に256を加える。もしなければステップ12−8にス
キップする。
ステップ12−8において読み列を漢字列に変換して同
音語バッファ上に単語コードと共に登録する。漢字列を
同音語バッファに登録する際には同時にその優先度をも
別領域に記憶しておくようにし、同音語バッファ上で漢
字列が優先度の高い(大きい)ものから順番に並ぶよう
にする。もし登録したい漢字列より優先度の低い(小さ
い)ものが既に登録されていれば、その手前に目的の漢
字列を登録するようにし、もし登録したい漢字列より優
先度の高い(大きい)ものが既に登録されていれば、そ
の後ろに目的の漢字列を登録するようにする。
音語バッファ上に単語コードと共に登録する。漢字列を
同音語バッファに登録する際には同時にその優先度をも
別領域に記憶しておくようにし、同音語バッファ上で漢
字列が優先度の高い(大きい)ものから順番に並ぶよう
にする。もし登録したい漢字列より優先度の低い(小さ
い)ものが既に登録されていれば、その手前に目的の漢
字列を登録するようにし、もし登録したい漢字列より優
先度の高い(大きい)ものが既に登録されていれば、そ
の後ろに目的の漢字列を登録するようにする。
ステップ12−9において現在の単語の次の単語を辞書
をサーチして求め、ステップ12−10において見つか
ったかどうか判定し、もし見つかれば12−4にループ
する。見つからなければ、ステップ12−11に移り、
同音語バッファのポインタを文書メモリにセットする。
をサーチして求め、ステップ12−10において見つか
ったかどうか判定し、もし見つかれば12−4にループ
する。見つからなければ、ステップ12−11に移り、
同音語バッファのポインタを文書メモリにセットする。
第13図はステップ11−3を詳細化したものである。
ステー/7’13−1において同音語バッファプール内
で「使用中」となっている同音語バッファを先頭からサ
ーチする。
で「使用中」となっている同音語バッファを先頭からサ
ーチする。
ステップ13−2において、上記見つかった同音語バッ
ファの表示番号をカウントアツプして、次候補が表示さ
れるようにしてリターンする。
ファの表示番号をカウントアツプして、次候補が表示さ
れるようにしてリターンする。
第14図はステップ11−4を詳細化したフローチャー
トである。
トである。
ステン7’l 4−1において同音語バッファプールを
先頭よりサーチし、「使用中」である同音語バッファを
見つけ、更にその同音語バッファコートをもつ文字を文
書バッファ中より求める。上記同音語バッファ中のDN
O番目の変換候補の漢字コードを文書バッファの上記見
つかった文字の部分に埋めフラッグをOにし、同音語バ
ッファノソの同音語をr未使用」状態とする。上記変換
候補の単語コードは記憶しておく。
先頭よりサーチし、「使用中」である同音語バッファを
見つけ、更にその同音語バッファコートをもつ文字を文
書バッファ中より求める。上記同音語バッファ中のDN
O番目の変換候補の漢字コードを文書バッファの上記見
つかった文字の部分に埋めフラッグをOにし、同音語バ
ッファノソの同音語をr未使用」状態とする。上記変換
候補の単語コードは記憶しておく。
ステップ14−2において前記単語コード・をMRLに
登録する。(第15図に詳述)ステップl 4−3にお
いて同音語バッファ上の前記単語コードの単語の順位を
変更する。(第16図に詳述) ステップ14−4においてステップ14−3の順位変更
の結果生じる単語コードの修正を同音語バッファに施す
、(第17図に詳述) ステップ14−5においてステップ14−3の順位変更
の結果生じる単語コードの修正をMRLに施す、(第1
8図に詳述) 第15図はステップ14−2を詳細化したものである。
登録する。(第15図に詳述)ステップl 4−3にお
いて同音語バッファ上の前記単語コードの単語の順位を
変更する。(第16図に詳述) ステップ14−4においてステップ14−3の順位変更
の結果生じる単語コードの修正を同音語バッファに施す
、(第17図に詳述) ステップ14−5においてステップ14−3の順位変更
の結果生じる単語コードの修正をMRLに施す、(第1
8図に詳述) 第15図はステップ14−2を詳細化したものである。
ステップ15−1においてMRLの最後の一つを除く全
単語コードを一つ下にシフトする。すなわち最後尾の単
語コードは失われることになる。
単語コードを一つ下にシフトする。すなわち最後尾の単
語コードは失われることになる。
ステップ15−2において、MRLのトップに選択され
た単語の単語コードをセットする。
た単語の単語コードをセットする。
第16図はステップ14−3を詳細化したものである。
ステップ16−1において現在の単語(選択された単語
)の辞書上での一つ前の単語が選択単語と同じ読みを持
っているかどうかをチェックし、もし異なればリターン
する。もし同じであれば以下のステップを実行する。
)の辞書上での一つ前の単語が選択単語と同じ読みを持
っているかどうかをチェックし、もし異なればリターン
する。もし同じであれば以下のステップを実行する。
ステップ16−2において辞書上の選択単語のデータを
すべて別領域・に退避する。
すべて別領域・に退避する。
ステラ7’l 6−3にお、いて選択単語の一つ前の単
語のデータを選択単語の位置にコピーする。
語のデータを選択単語の位置にコピーする。
ステップ16−4においてステップ16−2で退避した
選択単語のデータを選択単語の一つ前の単語の位置に回
復させる。この結果、辞書上では選択単語と選択単語の
一つ前の単語が入れ換することになる0、 ステップ16−5においてステップ16−2〜l・6−
4において単語を入れ換えた結果生じる単語コードの修
正のためのテーブルである単語コード変換テーブルCT
RLを作成す、る、すなわち選択単語と選択単語の一つ
前の単語の入れ換わる前の単語コードを旧コードの欄に
登録し、入れ換え後の単語コードを新コードの欄に登録
する。
選択単語のデータを選択単語の一つ前の単語の位置に回
復させる。この結果、辞書上では選択単語と選択単語の
一つ前の単語が入れ換することになる0、 ステップ16−5においてステップ16−2〜l・6−
4において単語を入れ換えた結果生じる単語コードの修
正のためのテーブルである単語コード変換テーブルCT
RLを作成す、る、すなわち選択単語と選択単語の一つ
前の単語の入れ換わる前の単語コードを旧コードの欄に
登録し、入れ換え後の単語コードを新コードの欄に登録
する。
第17図はステップ14−4を詳細化したものである。
゛ステップ17−1において同音語バッファコードを示
す一時変数iの値を0にクリアする。
す一時変数iの値を0にクリアする。
伐テップ17−2において1の値が同音語バッファプー
ルの上限を超えたかどうかチェックし。
ルの上限を超えたかどうかチェックし。
超えていればリターンする。
ステラ7’l 7−3において同音語バッファiの先頭
アドレスを求める。すなわちiの値に128を乗じて同
音語バッファプールの先頭アドレスを加える。 ′ ステップ17−4においてその同音語バッファlが使用
中であるかどうかをチェックし、使用中でなければステ
ップ17−10に進み、使用中であればステップ1−7
・−5に進む。
アドレスを求める。すなわちiの値に128を乗じて同
音語バッファプールの先頭アドレスを加える。 ′ ステップ17−4においてその同音語バッファlが使用
中であるかどうかをチェックし、使用中でなければステ
ップ17−10に進み、使用中であればステップ1−7
・−5に進む。
ステップ17−5において同音語バッファiから単語コ
ードを一つ取り出す、もし取り出せなかったときはステ
ップ17−10に分岐する。取り出せたときは以下に進
む。
ードを一つ取り出す、もし取り出せなかったときはステ
ップ17−10に分岐する。取り出せたときは以下に進
む。
ステップ17−7において取り出した単語コードが単語
コード変換テーブル2.の旧コードの欄に記載されてい
るかどうかサーチによりチェックし。
コード変換テーブル2.の旧コードの欄に記載されてい
るかどうかサーチによりチェックし。
ステップ17−8において見つかったかどうかを判定す
る。見つからなかったときはステップ17−5にループ
し、見つかったときはステップ17−9において見つか
った旧コードに対応する新コードの値に同音語バック・
ア中の単語コードに修正する。しかるのちステップ゛1
7−5に分岐し、次の単語コードを同音語バッファより
取り出す。
る。見つからなかったときはステップ17−5にループ
し、見つかったときはステップ17−9において見つか
った旧コードに対応する新コードの値に同音語バック・
ア中の単語コードに修正する。しかるのちステップ゛1
7−5に分岐し、次の単語コードを同音語バッファより
取り出す。
ステップ17−10においViの値を増加し、次の同音
語バッファを指示するようにする。
語バッファを指示するようにする。
第18図はステップ14−5を詳細化したものである。
ステラ7’l 8−1においてMRLのインデックスi
を初期化する。
を初期化する。
ステップ18−2においてiの値が上限200を超えた
かどうかをチェックし、オーバーしておれば、リターン
する。
かどうかをチェックし、オーバーしておれば、リターン
する。
ステップ18−3において単語コード変換テーブル=旧
コー下にMRL (i)に示す単語コードが存在するか
サーチする。
コー下にMRL (i)に示す単語コードが存在するか
サーチする。
ステップ18−4において旧コードとして見つかったか
どうか判定し、見つからなかったときはステップ18−
5に進む。
どうか判定し、見つからなかったときはステップ18−
5に進む。
ステップ18−5においてMRL(i)を見つかった旧
コードに対応する新コードに修正する。
コードに対応する新コードに修正する。
ステップ18−6においてiを更新し、次のMRLを指
示するようにする。
示するようにする。
他の実施例
以上の説明において、辞書構造としては単語長が固定長
の辞書を想定しているが、可変長の単語長で構成した、
より圧縮された辞書構造であっても同様に処理を行なう
ことができる。また、最新使用単語リストに格納される
データとして辞書先頭から何番目の単語であるかという
単語コードを記憶することにしているが、それ以外にも
各単語の実際のメモリ上のアドレスに関する情報を用い
てもよい。
の辞書を想定しているが、可変長の単語長で構成した、
より圧縮された辞書構造であっても同様に処理を行なう
ことができる。また、最新使用単語リストに格納される
データとして辞書先頭から何番目の単語であるかという
単語コードを記憶することにしているが、それ以外にも
各単語の実際のメモリ上のアドレスに関する情報を用い
てもよい。
また最新使用単語リストにアドレスに関する情報でなく
辞書データそのものを記憶するようにすることも可能で
ある。そのようにすれば、メモリは多く必要であるが、
単語登録、単語削除の際のように、辞書の構成に変化が
生じた場合であっても、最新使用単語リストの内容を修
正するという厄介な作業が不要となる。
辞書データそのものを記憶するようにすることも可能で
ある。そのようにすれば、メモリは多く必要であるが、
単語登録、単語削除の際のように、辞書の構成に変化が
生じた場合であっても、最新使用単語リストの内容を修
正するという厄介な作業が不要となる。
効果の説明
以上の説明から明らかなように本発明によれ1f、学習
データとして辞書内での単語の順位と。
データとして辞書内での単語の順位と。
最新使用単語リストを使用しているために、異なる読み
の単語間でも学習を行なうことが可能であり、かつ、最
新使用単語リストのみを使用した場合と異なり、学習デ
ータがオーバフローして失われるということもなく、し
かも、各単語に対して学習のためのビットを持つ方式に
比べより少ないメモリ容量で学習処理を行なうことがで
きるので低価格で操作性の優れた文字処理装置を実現す
ることができる。
の単語間でも学習を行なうことが可能であり、かつ、最
新使用単語リストのみを使用した場合と異なり、学習デ
ータがオーバフローして失われるということもなく、し
かも、各単語に対して学習のためのビットを持つ方式に
比べより少ないメモリ容量で学習処理を行なうことがで
きるので低価格で操作性の優れた文字処理装置を実現す
ることができる。
第1図は従来例の構成を示す図、
第2図は本発明を説明する為の概念図、第3図は本発明
による実施例のブロー、り図、第4wJは実施例の詳細
図。 第5図は本発明゛の辞書構成を説明する図。 第6図は本発明の最新使用単語リストを説明する図、 第7図は本発明の文書データと同音語バッファを示す図
。 第8図は本発明の同音語バッファを示す図、第9図は本
発明の各行の構成を示す図、第10図は本発明の単語コ
ード変換テーブルを示す図、 第11図〜第18図は本発明文字処理装置の動作を示す
フローチャート。 M RL−−−一最新使用単語リスト D OB U F−−−一同音語パッファDIC−−−
−辞書
による実施例のブロー、り図、第4wJは実施例の詳細
図。 第5図は本発明゛の辞書構成を説明する図。 第6図は本発明の最新使用単語リストを説明する図、 第7図は本発明の文書データと同音語バッファを示す図
。 第8図は本発明の同音語バッファを示す図、第9図は本
発明の各行の構成を示す図、第10図は本発明の単語コ
ード変換テーブルを示す図、 第11図〜第18図は本発明文字処理装置の動作を示す
フローチャート。 M RL−−−一最新使用単語リスト D OB U F−−−一同音語パッファDIC−−−
−辞書
Claims (1)
- 単語の読みを入力する読み入力手段と、単語をその読み
と表記との対応をとって収容した辞書と、前記入力読み
に対して前記辞書を検索し、単語の表記に変換する変換
手段と、前記変換手段により変換される単語の表記の候
補である変換候補が複数個生じた場合、同音語として優
先度が1位のものから表示する表示手段と、表示されて
いる変換候補が目的の表記でなかったときに更に下位の
優先度の変換候補の表示を指示する次候補指示手段と、
前記変換候補の一つを確定的に選択する選択手段と、前
記選択手段により選択された変換候補に対応する単語の
アドレス情報を記憶する最新使用単語リストとを具え、
前記変換手段において変換候補のうち対応する単語が最
新使用単語リスト上に登録されていれば、その変換候補
の優先度を第1位として変換し、他の候補については対
応する単語の辞書上での物理的順位に従って優先度を割
付けて変換し、前記選択手段において選択された変換候
補に対応する単語の辞書上での物理的順位を更新すると
共に、該単語のアドレス情報を前記最新使用単語リスト
に登録することを特徴とする文字処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60028764A JPS61188658A (ja) | 1985-02-15 | 1985-02-15 | 文字処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60028764A JPS61188658A (ja) | 1985-02-15 | 1985-02-15 | 文字処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61188658A true JPS61188658A (ja) | 1986-08-22 |
Family
ID=12257471
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60028764A Pending JPS61188658A (ja) | 1985-02-15 | 1985-02-15 | 文字処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61188658A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02297669A (ja) * | 1989-05-11 | 1990-12-10 | Fuji Electric Co Ltd | 索引付順編成ファイルの管理方法 |
-
1985
- 1985-02-15 JP JP60028764A patent/JPS61188658A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02297669A (ja) * | 1989-05-11 | 1990-12-10 | Fuji Electric Co Ltd | 索引付順編成ファイルの管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4579533A (en) | Method of teaching a subject including use of a dictionary and translator | |
JPS61188658A (ja) | 文字処理装置 | |
JPH0117185B2 (ja) | ||
JP2592793B2 (ja) | 文字処理方法 | |
JPS61188657A (ja) | 文字処理装置 | |
WO1983003914A1 (en) | Electronic dictionary with speech synthesis | |
JP2744241B2 (ja) | 文字処理装置 | |
JPS5951015B2 (ja) | 文書作成装置 | |
JP2771020B2 (ja) | 文字処理装置 | |
JPS63106070A (ja) | 中文入力方式 | |
JP5460343B2 (ja) | 学習装置、学習帳表示方法及び学習帳表示プログラム | |
JPS62263570A (ja) | 文書作成装置 | |
JP5357066B2 (ja) | 学習装置、学習帳登録方法及び学習帳登録プログラム | |
JPS59140541A (ja) | 文字処理装置 | |
JPH0623973B2 (ja) | 文字処理装置の頻度変更方式 | |
JPS62198953A (ja) | 文字処理装置 | |
JPS60110075A (ja) | 文字処理方法 | |
JPS62198952A (ja) | 文字処理装置 | |
JPS61285573A (ja) | 仮名漢字変換装置 | |
JPS62198957A (ja) | 文字処理装置 | |
JPS63155262A (ja) | 日本語処理方法および装置 | |
JPS646498B2 (ja) | ||
JPH0442350A (ja) | 文字処理装置 | |
JPH03176759A (ja) | 文字処理装置及びその方法 | |
JPH0452853A (ja) | 文字処理装置 |