JPH0769907B2 - 文字処理装置 - Google Patents
文字処理装置Info
- Publication number
- JPH0769907B2 JPH0769907B2 JP62055860A JP5586087A JPH0769907B2 JP H0769907 B2 JPH0769907 B2 JP H0769907B2 JP 62055860 A JP62055860 A JP 62055860A JP 5586087 A JP5586087 A JP 5586087A JP H0769907 B2 JPH0769907 B2 JP H0769907B2
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- reading
- conversion
- input
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】 〔産業上の利用分野〕 本発明は仮名漢字変換により読みを漢字に変換しながら
文書を作成していく文字処理装置、特に複数文節仮名漢
字変換により入力ができる文字処理装置に関する。
文書を作成していく文字処理装置、特に複数文節仮名漢
字変換により入力ができる文字処理装置に関する。
文節の区切りを指定せずにかな漢字変換が可能な複数文
節かな漢字変換による入力、いわゆる複数文節入力を実
現した装置は従来から存在している。このような複数文
節入力においては辞書サーチが頻繁に行われるため、変
換時間が長くかかるという問題があった。
節かな漢字変換による入力、いわゆる複数文節入力を実
現した装置は従来から存在している。このような複数文
節入力においては辞書サーチが頻繁に行われるため、変
換時間が長くかかるという問題があった。
この問題を解決するために従来装置には2つのタイプが
存在する。第1のタイプは高速アクセス可能なメモリを
使用するこにより上記問題を解決した装置であり、辞書
を高速アクセス可能なメモリにロードしておくことによ
り、頻繁に辞書サーチを行ってもリアルタイムで変換で
きるようにした装置である。かかる装置の欠点は高速で
あるために高価なメモリを大量に使用するため、装置自
体が高価なものとなってしまうという点である。第2の
タイプの装置は低速かつ安価なメモリを使用して装置自
体は低価格に構成し、そのかわり辞書のサーチ回数をで
きるだけ少なくするように工夫した装置である。かかる
装置の欠点は辞書サーチ回数を無理に少なくしているた
め思うように変換精度を上げることができず、変換率が
悪いという点である。
存在する。第1のタイプは高速アクセス可能なメモリを
使用するこにより上記問題を解決した装置であり、辞書
を高速アクセス可能なメモリにロードしておくことによ
り、頻繁に辞書サーチを行ってもリアルタイムで変換で
きるようにした装置である。かかる装置の欠点は高速で
あるために高価なメモリを大量に使用するため、装置自
体が高価なものとなってしまうという点である。第2の
タイプの装置は低速かつ安価なメモリを使用して装置自
体は低価格に構成し、そのかわり辞書のサーチ回数をで
きるだけ少なくするように工夫した装置である。かかる
装置の欠点は辞書サーチ回数を無理に少なくしているた
め思うように変換精度を上げることができず、変換率が
悪いという点である。
本発明は上述の点に鑑み、変換精度を上げ安い文字処理
装置を提供する。
装置を提供する。
本発明は、文書を作成する文字処理装置において読み列
を入力する読み列入力手段と、単語を読みと表記の対応
をとって記憶した第1の辞書手段と、前記第1の辞書の
情報のうち少なくとも読みに関する情報を記憶した第2
の辞書手段と、前記入力された読み列を前記第2の辞書
を参照することにより変換単位に分割する読み列分割手
段と、前記分割された読み列を前記第1の辞書を参照す
ることにより前記表記に変換する読み列変換手段と、前
記第1の辞書より前記第2の辞書を再生成する辞書再構
成手段とを具備することにより実現するものである。
を入力する読み列入力手段と、単語を読みと表記の対応
をとって記憶した第1の辞書手段と、前記第1の辞書の
情報のうち少なくとも読みに関する情報を記憶した第2
の辞書手段と、前記入力された読み列を前記第2の辞書
を参照することにより変換単位に分割する読み列分割手
段と、前記分割された読み列を前記第1の辞書を参照す
ることにより前記表記に変換する読み列変換手段と、前
記第1の辞書より前記第2の辞書を再生成する辞書再構
成手段とを具備することにより実現するものである。
以下図面を参照して本発明を詳細に説明する。
第1図は本発明による文字処理装置の概略図である。
読み列入力手段より入力された読み列を読み列分割手段
が第2の辞書を参照しつつ変換単位に分割し、分割され
た読み列を読み列変換手段が第1の辞書を参照しつつ漢
字かな混じり文に変換する。他方、辞書再構成手段によ
り第1の辞書から読み情報を抽出した第2の辞書を再生
成する。
が第2の辞書を参照しつつ変換単位に分割し、分割され
た読み列を読み列変換手段が第1の辞書を参照しつつ漢
字かな混じり文に変換する。他方、辞書再構成手段によ
り第1の辞書から読み情報を抽出した第2の辞書を再生
成する。
第2図は本発明の全体構成の一例である。
図示の構成においてCPUはマイクロプロセッサであり、
文字処理のための演算,論理判断等を行い、アドレスバ
スAB,コントロールバスCB,データバスDBを介してそれら
のバスに接続された各構成要素を制御する。
文字処理のための演算,論理判断等を行い、アドレスバ
スAB,コントロールバスCB,データバスDBを介してそれら
のバスに接続された各構成要素を制御する。
アドレスバスABはマイクロプロセッサCPUの制御の対象
とする構成要素を指示するアドレス信号を転送する。コ
ントロールバスCBはマイクロプロセッサCPUの制御の対
象とする各構成要素のコントロール信号を転送して印加
する。データバスDBは各構成機器相互間のデータの転送
を行う。
とする構成要素を指示するアドレス信号を転送する。コ
ントロールバスCBはマイクロプロセッサCPUの制御の対
象とする各構成要素のコントロール信号を転送して印加
する。データバスDBは各構成機器相互間のデータの転送
を行う。
つぎにROMは読出し専用の固定メモリであり、第6図〜
第10図につき後述するマイクロプロセッサCPUによる制
御の手順等を記憶させておく。
第10図につき後述するマイクロプロセッサCPUによる制
御の手順等を記憶させておく。
また、RAMは1ワード16ビツトの構成の書込み可能のラ
ンダムアクセスメモリであって、バツフアYDC,i,L,IB,
F,TBUFを有し、各構成要素からの各種データの一時記憶
に用いる。
ンダムアクセスメモリであって、バツフアYDC,i,L,IB,
F,TBUFを有し、各構成要素からの各種データの一時記憶
に用いる。
TBUFはメモリRAM内に設けられる文書バツフアであり、
キーボードKBより入力された文書情報を蓄える。
キーボードKBより入力された文書情報を蓄える。
YDCはメモリRAM内に設けられ、入力読み列を変換単位に
分割するための読み辞書である。
分割するための読み辞書である。
第3図は読み辞書YDCの構成を示した図である。YMFは読
み部、GIFは文法情報部を示す。読み部,文法情報部の
構成は辞書の構成と同一である。最後尾には「んんん」
が入ってエンドマークとなっている。
み部、GIFは文法情報部を示す。読み部,文法情報部の
構成は辞書の構成と同一である。最後尾には「んんん」
が入ってエンドマークとなっている。
KBはキーボードであって、アルフアベツトキー,ひらが
なキー,カタカナキー等の文字記号入力キー及び変換キ
ー,単語登録キー等の本文字処理装置に対する各種機能
を指示するための各種のフアンクシヨンキーを備えてい
る。
なキー,カタカナキー等の文字記号入力キー及び変換キ
ー,単語登録キー等の本文字処理装置に対する各種機能
を指示するための各種のフアンクシヨンキーを備えてい
る。
DISKは磁気デイスク等の低速である安価なメモリであ
り、かな漢字変換を行うための辞書および文書,読み辞
書,その他の保管が必要なデータを記憶するために使用
される。作成された読み辞書はDISKに保管され更に保管
された読み辞書はキーボードの指示により必要な時呼び
出される。
り、かな漢字変換を行うための辞書および文書,読み辞
書,その他の保管が必要なデータを記憶するために使用
される。作成された読み辞書はDISKに保管され更に保管
された読み辞書はキーボードの指示により必要な時呼び
出される。
DICはかな漢字変換用の辞書であり、メモリDISK上に存
在する。
在する。
第4図は辞書DICの構成を示した図である。各単語は1
単語18バイトで構成される。YMFは読み部であり、各単
語の読みを1読み1バイトでJISC-6226コードの下位バ
イトで表現する。KJFは漢字部であり、JISC-6226コード
を用い1文字2バイトで表現する。GIFは文法情報部で
あり各単語の品詞情報を2バイトで表現する。各単語は
読みの昇順にソートされている。
単語18バイトで構成される。YMFは読み部であり、各単
語の読みを1読み1バイトでJISC-6226コードの下位バ
イトで表現する。KJFは漢字部であり、JISC-6226コード
を用い1文字2バイトで表現する。GIFは文法情報部で
あり各単語の品詞情報を2バイトで表現する。各単語は
読みの昇順にソートされている。
YDCSVはDISK上に存在する読み辞書退避用ワークエリア
である。
である。
CRはカーソルレジスタである。CPUによりカーソルレジ
スタの内容を読み書きできる。後述するCRTコントロー
ラCRTCは、ここに蓄えられたアドレスに対応する表示装
置CRT上の位置にカーソルを表示する。
スタの内容を読み書きできる。後述するCRTコントロー
ラCRTCは、ここに蓄えられたアドレスに対応する表示装
置CRT上の位置にカーソルを表示する。
DBUFは表示バツフアメモリでTBUFに蓄えられた文書情報
等のパターンを蓄える。
等のパターンを蓄える。
CRTCはカーソルレジスタCR及びバツフアDBUFに蓄えられ
た内容を表示器CRTに表示する役割を担う。
た内容を表示器CRTに表示する役割を担う。
またCRTは陰極線管等を用いた表示装置であり、その表
示装置CRTにおけるドツト構成の表示パターンおよびカ
ーソルの表示をCRTコントローラで制御する。
示装置CRTにおけるドツト構成の表示パターンおよびカ
ーソルの表示をCRTコントローラで制御する。
さらに、CGはキヤラクタジエネレータであって表示装置
CRTに表示する文字,記号のパターンを記憶するもので
ある。
CRTに表示する文字,記号のパターンを記憶するもので
ある。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動するも
のであってキーボードKBからの入力が供給されると、ま
ずインタラプト信号がマイクロプロセツサCPUに送ら
れ、そのマイクロプロセツサCPUがROM内に記憶してある
各種の制御信号を読出し、それらの制御信号に従って各
種の制御が行われる。
は、キーボードKBからの各種の入力に応じて作動するも
のであってキーボードKBからの入力が供給されると、ま
ずインタラプト信号がマイクロプロセツサCPUに送ら
れ、そのマイクロプロセツサCPUがROM内に記憶してある
各種の制御信号を読出し、それらの制御信号に従って各
種の制御が行われる。
上述の構成より成る実施例の作動を説明する。
第5図は複数文節入力の概念を示した図である。
(5−1)はオペレータの入力した例文の1つである。
矢印に示すように単語がサーチされる。次にサーチ結果
に基づき(5−2)のように文節単位に入力読み列が分
割され、(5−3)に示すような漢字かな混じり文にな
る。
矢印に示すように単語がサーチされる。次にサーチ結果
に基づき(5−2)のように文節単位に入力読み列が分
割され、(5−3)に示すような漢字かな混じり文にな
る。
すなわち、複数文節入力では辞書サーチが処理時間のネ
ツクとなるため、高速メモリに辞書を持たなければなら
ない。
ツクとなるため、高速メモリに辞書を持たなければなら
ない。
第6図は本発明文字処理装置の動作を示すフローチヤー
トである。
トである。
ステツプ6−1においてシステム動作に必要な各種変数
の初期化を行う。例えば、辞書変更フラグFはこのとき
リセツトされる。
の初期化を行う。例えば、辞書変更フラグFはこのとき
リセツトされる。
ステツプ6−2においてキー入力の受付を行い、キーが
入力されるとキーの種類に応じて各処理に分岐する。
入力されるとキーの種類に応じて各処理に分岐する。
ステツプ6−3は単語登録キーが入力された場合であ
り、第7図に詳述する単語登録の処理を行う。
り、第7図に詳述する単語登録の処理を行う。
ステツプ6−4は変換キーが入力された場合であり、第
8図に詳述する変換の処理を行う。
8図に詳述する変換の処理を行う。
ステツプ6−5は文字キー,挿入キー,削除キー等の他
のキーが入力された場合の処理である。
のキーが入力された場合の処理である。
ステツプ6−6はバツフアIB,TBUFの内容を表示する為
にDBUFに移すステツプである。
にDBUFに移すステツプである。
第7図は単語登録を行う場合の処理である。ステツプ7
−1は単語登録処理である。オペレータの指定した読
み、漢字を持つ単語を新たに辞書に登録する処理であ
る。ステツプ7−2は単語登録終了後、辞書変更フラグ
FをONする処理である。
−1は単語登録処理である。オペレータの指定した読
み、漢字を持つ単語を新たに辞書に登録する処理であ
る。ステツプ7−2は単語登録終了後、辞書変更フラグ
FをONする処理である。
第8図は変換処理の詳細を記述した図である。
ステツプ8−1は第9図に詳述する入力読み列を変換単
位(文節)に分割する処理である。ステツプ8−2は文
節単位に分割された読み列を漢字に変換する処理であり
第11図に詳述する。
位(文節)に分割する処理である。ステツプ8−2は文
節単位に分割された読み列を漢字に変換する処理であり
第11図に詳述する。
第9図は読み列分割処理の詳細を記述したフローであ
る。
る。
ステツプ9−1において辞書変更フラグFをチエツク
し、もしOFFであれば辞書は変更されていないのでステ
ツプ9−2においてDISK上のYDCSVより読み辞書をYDCに
ロードしステツプ9−5に分岐する。DISKよりロードを
実行する処理は通常の文字処理装置において、例えば文
書呼出等を実行するときに公知の技術であるので特に説
明は行わない。
し、もしOFFであれば辞書は変更されていないのでステ
ツプ9−2においてDISK上のYDCSVより読み辞書をYDCに
ロードしステツプ9−5に分岐する。DISKよりロードを
実行する処理は通常の文字処理装置において、例えば文
書呼出等を実行するときに公知の技術であるので特に説
明は行わない。
もし、辞書変更フラグFがONならステツプ9−3に進み
第10図に詳述する読み辞書YDCの作成処理を行い、ステ
ツプ9−4において作成された読み辞書YDCをDISK上のY
DCSVにセーブしステツプ9−5に分岐する。
第10図に詳述する読み辞書YDCの作成処理を行い、ステ
ツプ9−4において作成された読み辞書YDCをDISK上のY
DCSVにセーブしステツプ9−5に分岐する。
ステツプ9−5において読み辞書YDCをサーチし、どの
ような文節が可能であるかをメモリRAMのレジスタLに
リストアツプする。
ような文節が可能であるかをメモリRAMのレジスタLに
リストアツプする。
ステツプ9−6において上記リストアツプされた文節を
組み合せて入力バツフアIBの読み列を変換単位に分割す
る。このときの分割の方法に関しては、最長一致法,2文
節最長一致法,文節数最小法等の各種の方式が用いられ
る。
組み合せて入力バツフアIBの読み列を変換単位に分割す
る。このときの分割の方法に関しては、最長一致法,2文
節最長一致法,文節数最小法等の各種の方式が用いられ
る。
第10図は読み辞書作成を詳細化したフローである。
ステツプ10−1において行カウンタiをクリアする。
ステツプ10−2において行カウンタiが辞書単語数を超
えているかチエツクし、もし超えていれば10−8に分岐
する。
えているかチエツクし、もし超えていれば10−8に分岐
する。
ステツプ10−3において辞書よりi番目の単語の読み情
報を取り出し、ステツプ10−4で読み辞書のi番目にセ
ツトする。
報を取り出し、ステツプ10−4で読み辞書のi番目にセ
ツトする。
ステツプ10−5において辞書i番目の単語の文法情報を
取り出し、ステツプ10−6において読み辞書i番目にセ
ツトする。
取り出し、ステツプ10−6において読み辞書i番目にセ
ツトする。
ステツプ10−7において行カウンタiを更新しステツプ
10−2に戻る。
10−2に戻る。
ステツプ10−8において読み辞書のエンドマーカのセツ
トを行う。
トを行う。
ステツプ10−9において辞書変更フラグFをOFFする。
第11図は文節変換の処理を詳細化したフローである。
ステツプ11−1においてバツフアIBの分割された変換単
位(文節)と一致する単語が存在するかどうか調べるた
めに辞書DICをサーチする。
位(文節)と一致する単語が存在するかどうか調べるた
めに辞書DICをサーチする。
ステツプ11−2において一致する単語が見つかったかど
うかを判定し、見つかったときはステツプ11−3に分岐
し辞書DIC中に記載されている通りに漢字列に変換す
る。もし見つからなかったときはステツプ11−4に分岐
し、ひらがなのままを変換結果とする。
うかを判定し、見つかったときはステツプ11−3に分岐
し辞書DIC中に記載されている通りに漢字列に変換す
る。もし見つからなかったときはステツプ11−4に分岐
し、ひらがなのままを変換結果とする。
ステツプ11−5において上記の変換結果をメモリTBUF文
書中に出力しリターンする。
書中に出力しリターンする。
以上の実施例におていは読み列を変換単位に分割するた
めの辞書としては読みのみを持つ辞書を想定している
が、読み以外にも変換率を上げるために必要な情報がも
っても何ら本発明の趣旨を損なうものではない。要は、
変換に必要な辞書のうち変換単位に分割するために必要
な情報のみを分離して高速メモリ上に持つことを特徴と
している。
めの辞書としては読みのみを持つ辞書を想定している
が、読み以外にも変換率を上げるために必要な情報がも
っても何ら本発明の趣旨を損なうものではない。要は、
変換に必要な辞書のうち変換単位に分割するために必要
な情報のみを分離して高速メモリ上に持つことを特徴と
している。
また、仮名を漢字に変換する日本文作成装置を実施例と
して説明しているが、本発明の成果は、他のもの、例え
ばローマ字表記を漢字仮名混じり文に変換する装置、発
音記号を英文に変換する装置などにも応用が可能であ
る。
して説明しているが、本発明の成果は、他のもの、例え
ばローマ字表記を漢字仮名混じり文に変換する装置、発
音記号を英文に変換する装置などにも応用が可能であ
る。
以上述べたことから明らかなように、本発明によれば辞
書は低速メモリ上にあるので装置自体は安価であり、し
かも読み情報のみは高速メモリ上に持つので変換時間も
速く、しかも変換率の高い文字処理装置を実現すること
ができる。
書は低速メモリ上にあるので装置自体は安価であり、し
かも読み情報のみは高速メモリ上に持つので変換時間も
速く、しかも変換率の高い文字処理装置を実現すること
ができる。
また、読み辞書のはオリジナルの辞書より再生成する手
段があるため、辞書本体と読み辞書の内容が食い違って
変換結果に悪影響を及ぼすこともなく首尾一貫した変換
を行う文字処理装置を実現できる。
段があるため、辞書本体と読み辞書の内容が食い違って
変換結果に悪影響を及ぼすこともなく首尾一貫した変換
を行う文字処理装置を実現できる。
第1図は本発明による文字処理装置の概略図、 第2図は本発明の全体構成の一例を示す図、 第3図は読み辞書YDCの構成の例を示す図、 第4図は辞書DICの構成の例を示す図、 第5図は複数文節入力の例を示す図、 第6図〜第11図は本発明文字処理装置の動作を示すフロ
ーチヤートの例を示す図。 CPUはマイクロプロセツサ、ABはアドレスバス、CBはコ
ントロールバス、DBはデータバス、ROMは固定メモリ、R
AMはランダムアクセスメモリ、TBUFは文書バツフア、YD
Cは読み辞書、KBはキーボード、DISKは磁気デイスク、D
ICは辞書、YDCSVは読み辞書退避エリア、CRはカーソル
レジスタ、CRTCはCRTコントローラ、DBUFは表示用バツ
フアメモリ、CGはキヤラクタジエネレータ。
ーチヤートの例を示す図。 CPUはマイクロプロセツサ、ABはアドレスバス、CBはコ
ントロールバス、DBはデータバス、ROMは固定メモリ、R
AMはランダムアクセスメモリ、TBUFは文書バツフア、YD
Cは読み辞書、KBはキーボード、DISKは磁気デイスク、D
ICは辞書、YDCSVは読み辞書退避エリア、CRはカーソル
レジスタ、CRTCはCRTコントローラ、DBUFは表示用バツ
フアメモリ、CGはキヤラクタジエネレータ。
Claims (1)
- 【請求項1】文書を作成する文字処理装置において、読
み列を入力する読み列入力手段と、単語を読みと表記の
対応をとって記憶した第1の辞書手段と、前記第1の辞
書の情報のうち少なくとも読みに関する情報を記憶した
第2の辞書手段と、前記入力された読み列を前記第2の
辞書を参照することにより変換単位に分割する読み列分
割手段と、前記分割された読み列を前記第1の辞書を参
照することにより前記表記に変換する読み列変換手段
と、前記第1の辞書より前記第2の辞書を再生成する辞
書再構成手段とを具備することを特徴とする文字処理装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62055860A JPH0769907B2 (ja) | 1987-03-11 | 1987-03-11 | 文字処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62055860A JPH0769907B2 (ja) | 1987-03-11 | 1987-03-11 | 文字処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63221470A JPS63221470A (ja) | 1988-09-14 |
JPH0769907B2 true JPH0769907B2 (ja) | 1995-07-31 |
Family
ID=13010816
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62055860A Expired - Lifetime JPH0769907B2 (ja) | 1987-03-11 | 1987-03-11 | 文字処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0769907B2 (ja) |
-
1987
- 1987-03-11 JP JP62055860A patent/JPH0769907B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPS63221470A (ja) | 1988-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH0769907B2 (ja) | 文字処理装置 | |
JPH0769906B2 (ja) | 文字処理装置 | |
JPS63221469A (ja) | 文字処理装置 | |
JPS63221467A (ja) | 文字処理装置 | |
JPS6010348B2 (ja) | 半角・全角文字の自動変換方式 | |
JP2862236B2 (ja) | 文字処理装置 | |
JPS63221468A (ja) | 文字処理装置 | |
JPS62198952A (ja) | 文字処理装置 | |
JP3058181B2 (ja) | 文字処理装置及びその方法 | |
JPS63221465A (ja) | 文字処理装置 | |
JP2744241B2 (ja) | 文字処理装置 | |
JPS62198955A (ja) | 文字処理装置 | |
JP2771020B2 (ja) | 文字処理装置 | |
JP3278148B2 (ja) | 文字処理装置及びその方法 | |
JPS63259763A (ja) | 文字処理装置 | |
JPS62198957A (ja) | 文字処理装置 | |
JPH0628060B2 (ja) | 文字処理装置 | |
JPS62198954A (ja) | 文字処理装置 | |
JPS62198953A (ja) | 文字処理装置 | |
JPH03116367A (ja) | 文字処理装置 | |
JPH03116366A (ja) | 文字処理装置 | |
JPH0630104B2 (ja) | 文字処理装置 | |
JPS62198956A (ja) | 文字処理装置 | |
JPH01204174A (ja) | 文字処理装置 | |
JPH03176759A (ja) | 文字処理装置及びその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |