JPS63221470A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPS63221470A
JPS63221470A JP62055860A JP5586087A JPS63221470A JP S63221470 A JPS63221470 A JP S63221470A JP 62055860 A JP62055860 A JP 62055860A JP 5586087 A JP5586087 A JP 5586087A JP S63221470 A JPS63221470 A JP S63221470A
Authority
JP
Japan
Prior art keywords
dictionary
reading
conversion
character
reading sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62055860A
Other languages
English (en)
Other versions
JPH0769907B2 (ja
Inventor
Eiichiro Toshima
英一朗 戸島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP62055860A priority Critical patent/JPH0769907B2/ja
Publication of JPS63221470A publication Critical patent/JPS63221470A/ja
Publication of JPH0769907B2 publication Critical patent/JPH0769907B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は仮名漢字変換により読みを漢字に変換しながら
文書を作成していく文字処理装置、特に複数文節仮名漢
字変換により入力ができる文字処理装置に関する。
〔従来の技術〕
文節の区切りを指定せずにかな漢字変換が可能な複数文
節かな漢字変換による入力、いわゆる複数文節入力を実
現した装置は従来から存在している。このような複数文
節入力においては辞書サーチが頻繁に行われるため、変
換時間が長(かかるという問題があった。
この問題を解決するために従来装置には2つのタイプが
存在する。第1のタイプは高速アクセス可能なメモリを
使用するこにより上記問題を解決した装置であり、辞書
を高速アクセス可能なメモリにロードしてお(ことによ
り、頻繁に辞書サーチを行ってもリアルタイムで変換で
きるようにした装置である。かかる装置の欠点は高速で
あるために高価なメモリを大量に使用するため、装置自
体が高価なものとなってしまうという点である。
第2のタイプの装置は低速かつ安価なメモリを使用して
装置自体は低価格に構成し、そのかわり辞書のサーチ回
数をできるだけ少なくするように工夫した装置である。
かかる装置の欠点は辞書サーチ回数を無理に少な(して
いるため思うように変換精度を上げることができず、変
換率が悪いという点である。
〔発明が解決しようとしている問題点〕本発明は上述の
点に鑑み、変換精度を上げ安い文字処理装置を提供する
〔問題点を解決するための手段〕
本発明は、文書を作成する文字処理装置において読み列
を入力する読み列入力手段と、単語を読みと表記の対応
をとって記憶した第1の辞書手段と、前記第1の辞書の
情報のうち少な(とも読みに関する情報を記憶した第2
の辞書手段と、前記入力された読み列を前記第2の辞書
を参照することにより変換単位に分割する読み列分割手
段と、前記分割された読み列を前記第1の辞書を参照す
ることにより前記表記に変換する読み列変換手段と、前
記第1の辞書より前記第2の辞書を再生成する辞書再構
成手段とを具備することにより実現するものである。
〔実施例〕
以下図面を参照して本発明の詳細な説明する。
第1図は本発明による文字処理装置の概略図である。
読み列入力手段より入力された読み列を読み列分割手段
が第2の辞書を参照しつつ変換単位に分割し、分割され
た読み列を読み列変換手段が第1の辞書を参照しつつ漢
字かな混じり文に変換する。他方、辞書再構成手段によ
り第1の辞書から読み情報を抽出した第2の辞書を再生
成する。
第2図は本発明の全体構成の一例である。
図示の構成においてCPUはマイクロプロセッサであり
、文字処理のための演算、論理判断等を行い、アドレス
バスAB、コントロールバスCB、データバスDBを介
してそれらのバスに接続された各構成要素を制御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行う。
つぎにROMは読出し専用の固定メモリであり、第6図
〜第10図につき後述するマイクロプロセッサCPUに
よる制御の手順等を記憶させておく。
また、RAMはlワード16ビツトの構成の書込み可能
のランダムアクセスメモリであって、バッファYDC,
i、L、IB、F、TBUFを有し、各構成要素からの
各種データの一時記憶に用いる。
TBUFはメモリRAM内に設けられる文書バッファで
あり、キーボードKBより入力された文書情報を蓄える
YDCはメモリRAM内に設けられ、入力読み列を変換
単位に分割するための読み辞書である。
第3図は読み辞書YDCの構成を示した図である。
YMFは読み部、GIFは文法情報部を示す。読み部2
文法情報部の構成は辞書DICの構成と同一である。最
後尾には「んんん」が入ってエンドマークとなっている
KBはキーボードであって、アルファベットキー。
ひらがなキー、カタカナキー等の文字記号入カキ−及び
変換キー、単語登録キー等の本文字処理装置に対する各
種機能を指示するための各種のファンクションキーを備
えている。
DISKは磁気ディスク等の低速である安価なメモリで
あり、かな漢字変換を行うための辞書および文書、読み
辞書、その他の保管が必要なデータを記憶するために使
用される。作成された読み辞書はDISKに保管され更
に保管された読み辞書はキーボードの指示により必要な
時呼び出される。
DICはかな漢字変換用の辞書であり、メモリDISK
上に存在する。
第4図は辞書DECの構成を示した図である。各単語は
1単語18バイトで構成される。YMFは読み部であり
、各単語の読みを1読み1バイトでJ I S C−6
226コードの下位バイトで表現する。KJFは漢字部
であり、JISC−6226コードを用い1文字2バイ
トで表現する。GIFは文法情報部であり各単語の品詞
情報を2バイトで表現する。各単語は読みの昇順にソー
トされている。
YDC5VはDISK上に存在する読み辞書退避用ワー
クエリアである。
CRはカーソルレジスタである。CPUによりカーソル
レジスタの内容を読み書きできる。後述するCRTコン
トローラCRTCは、ここに蓄えられたアドレスに対応
する表示装置CRT上の位置にカーソルを表示する。
DBUFは表示用バッファメモリでTBUFに蓄えられ
た文書情報等のパターンを蓄える。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドツト構成の表示ノ々ターンお
よびカーソルの表示をCRTコントローラで制御する。
さらに、CGはキャラクタジェネレータでありて表示装
置CRTに表示する文字、記号のパターンを記憶するも
のである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであってキーボードKBからの入力が供給されると
、まずインタラブド信号がマイクロプロセッサCPUに
送られ、そのマイクロプロセッサCPUがROM内に記
憶しである各種の制御信号を読出し、それらの制御信号
に従って各種の制御が行われる。
上述の構成より成る実施例の作動を説明する。
第5図は複数文節入力の概念を示した図である。
(5−1)はオペレータの入力した例文の1つである。
矢印に示すように単語がサーチされる。次にサーチ結果
に基づき(5−2)のように文節単位に入力読み列が分
割され、(5−3)に示すような漢字かな混じり文にな
る。
すなわち、複数文節入力では辞書サーチが処理時間のネ
ックとなるため、高速メモリに辞書を持たなければなら
ない。
第6図は本発明文字処理装置の動作を示すフローチャー
トである。
ステップ6−1においてシステム動作に必要な各種変数
の初期化を行う。例えば、辞書変更フラグFはこのとき
リセットされる。
ステップ6−2においてキー人力の受付を行い、キーが
入力されるとキーの種類に応じて各処理に分岐する。
ステップ6−3は単語登録キーが入力された場合であり
、第7図に詳述する単語登録の処理を行う。
ステップ6−4は変換キーが入力された場合であり、第
8図に詳述する変換の処理を行う。
ステップ6−5は文字キー、挿入キー、削除キー等の他
のキーが入力された場合の処理である。
ステップ6−6はバッファIB、TBUFの内容を表示
する為にDBUFに移すステップである。
第7図は単語登録を行う場合の処理である。ステップ7
〜1は単語登録処理である。オペレータの指定した読み
、漢字を持つ単語を新たに辞書に登録する処理である。
ステップ7−2は単語登録終了後、辞書変更フラグFを
ONする処理である。
第8図は変換処理の詳細を記述した図である。
ステップ8−1は第9図に詳述する入力読み列を変換単
位(文節)に分割する処理である。ステップ8−2は文
節単位に分割された読み列を漢字に変換する処理であり
第11図に詳述される。
第9図は読み列分割処理の詳細を記述したフローである
ステップ9−1において辞書変更フラグFをチェックし
、もしOFFであれば辞書は変更されていないのでステ
ップ9−2においてDISK上のYDC5Vより読み辞
書をYDCにロードしステップ9−5に分岐する。DI
SKよりロードを実行する処理は通常の文字処理装置に
おいて、例えば文書呼出等を実行するときに公知の技術
であるので特に説明は行わない。
もし、辞書変更フラグFがONならステップ9−3に進
み第10図に詳述する読み辞書YDCの作成処理を行い
、ステップ9−4において作成された読み辞書YDCを
DISK上(7)YDC3Vi、:セーブシステップ9
−5に分岐する。
ステップ9−5において読み辞書YDCをサーチし、ど
のような文節が可能であるかをメモリRAMのレジスタ
Lにリストアツブする。
ステップ9−6において上記リストアツブされた文節を
組み合せてバッファIB内の読み列を変換単位に分割す
る。このときの分割の方法に関しては、最長一致法、2
文節最長一致法2文節数最小法等の各種の方式が使用で
きる。
第10図は読み辞書作成を詳細化したフローである。
ステップ10−1において行カウンタiをクリアする。
ステップ10−2において行カウンタiが辞書単語数を
超えているかチェックし、もし超えていれば10−8に
分岐する。
ステップ1O−3において辞書よりi番目の単語の読み
情報を取り出し、ステップ10−4で読み辞書のi番目
にセットする。
ステップ10−5において辞書i番目の単語の文法情報
を取り出し、ステップ1o−6において読み辞書i番目
にセットする。
ステップ1O−7において行カウンタiを更新しステッ
プ10−2に戻る。
ステップl0−8において読み辞書のエンドマーカのセ
ットを行う。
ステップl0−9において辞書変更フラグFをOFFす
る。
第11図は文節変換の処理を詳細化したフローである。
ステップ11−1においてバッファIBの分割された変
換単位(文節)と一致する単語が存在するがどうか調べ
るために辞書DICをサーチする。
ステップ11−2において一致する単語が見つかったか
どうかを判定し、見つかったときはステップ11−3に
分岐し辞書DIC中に記載されている通りに漢字列に変
換する。もし見っからながったときはステップ11−4
に分岐し、ひらがなのままを変換結果とする。
ステップ11−5において上記の変換結果をメモリTB
UF文書中に出力しリターンする。
〔他の実施例〕
以上の実施例におていは読み列を変換単位に分割するた
めの辞書としては読みのみを持つ辞書を想定しているが
、読み以外にも変換率を上げるために必要な情報がもっ
ても何ら本発明の趣旨を損なうものではない。要は、変
換に必要な辞書のうち変換単位に分割するために必要な
情報のみを分離して高速メモリ上に持つことを特徴とし
ている。
また、仮名を漢字に変換する日本文作成装置を実施例と
して説明しているが、本発明の成果は、他のもの、例え
ばローマ字表記を漢字仮名混じり文に変換する装置、発
音記号を英文に変換する装置などにも応用が可能である
〔効 果〕
以上述べたことから明らかなように、本発明によれば辞
書は低速メモリ上にあるので装置自体は安価であり、し
かも読み情報のみは高速メモリ上に持つので変換時間も
速く、しかも変換率の高い文字処理装置を実現すること
ができる。
また、読み辞書のはオリジナルの辞書より再生成する手
段があるため、辞書本体と読み辞書の内容が食い違って
変換結果に悪影響を及ぼすこともなく首尾一貫した変換
を行う文字処理装置を実現できる。
【図面の簡単な説明】
第1図は本発明による文字処理装置の概略図、第2図は
本発明の全体構成の一例を示す図、第3図は読み辞書Y
DCの構成の例を示す図、第4図は辞書DICの構成の
例を示す図、第5図は複数文節入力の例を示す図、 第6図〜第11図は本発明文字処理装置の動作を示すフ
ローチャートの例を示す図。 CPUはマイクロプロセッサ、ABはアドレスバス、C
Bはコントロールバス、DBはデータバス、ROMは固
定メモリ、RAMはランダムアクセスメモリ、TBUF
は文書バッファ、YDCは読み辞書、KBはキーボード
、DISKは磁気ディスク、DICは辞書、YDC5V
は読み辞書退避エリア、CRはカーソルレジスタ、CR
TCはCRTコントローラ、DBUFは表示用バッファ
メモリ、CGはキャラクタジェネレータ。 Yl’lF       Cr1F 1も− 8ハイド       2ハイド (8文哨i)                  (
9タモグ宇ジ第5図 <5−0    さのう し力ゝ(ゴしく=ましj=J
J/

Claims (1)

    【特許請求の範囲】
  1. 文書を作成する文字処理装置において、読み列を入力す
    る読み列入力手段と、単語を読みと表記の対応をとって
    記憶した第1の辞書手段と、前記第1の辞書の情報のう
    ち少なくとも読みに関する情報を記憶した第2の辞書手
    段と、前記入力された読み列を前記第2の辞書を参照す
    ることにより変換単位に分割する読み列分割手段と、前
    記分割された読み列を前記第1の辞書を参照することに
    より前記表記に変換する読み列変換手段と、前記第1の
    辞書より前記第2の辞書を再生成する辞書再構成手段と
    を具備することを特徴とする文字処理装置。
JP62055860A 1987-03-11 1987-03-11 文字処理装置 Expired - Lifetime JPH0769907B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62055860A JPH0769907B2 (ja) 1987-03-11 1987-03-11 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62055860A JPH0769907B2 (ja) 1987-03-11 1987-03-11 文字処理装置

Publications (2)

Publication Number Publication Date
JPS63221470A true JPS63221470A (ja) 1988-09-14
JPH0769907B2 JPH0769907B2 (ja) 1995-07-31

Family

ID=13010816

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62055860A Expired - Lifetime JPH0769907B2 (ja) 1987-03-11 1987-03-11 文字処理装置

Country Status (1)

Country Link
JP (1) JPH0769907B2 (ja)

Also Published As

Publication number Publication date
JPH0769907B2 (ja) 1995-07-31

Similar Documents

Publication Publication Date Title
US5418718A (en) Method for providing linguistic functions of English text in a mixed document of single-byte characters and double-byte characters
JP3337161B2 (ja) 構造化文書を編集するための方法
JPS63221470A (ja) 文字処理装置
JPS63221466A (ja) 文字処理装置
JPS63221469A (ja) 文字処理装置
JPS63221467A (ja) 文字処理装置
JPS63221468A (ja) 文字処理装置
JPS63221465A (ja) 文字処理装置
JP2862236B2 (ja) 文字処理装置
JP2744241B2 (ja) 文字処理装置
JP3278148B2 (ja) 文字処理装置及びその方法
JPH03116367A (ja) 文字処理装置
JPH03116366A (ja) 文字処理装置
JPS62198952A (ja) 文字処理装置
JPH01204174A (ja) 文字処理装置
JPS62198953A (ja) 文字処理装置
JPS63259763A (ja) 文字処理装置
JPS60110074A (ja) 文字処理装置
JPH03116369A (ja) 文字処理装置
CN1037602A (zh) 中文文书作成装置
JPH03116368A (ja) 文字処理装置
JPH01214967A (ja) 文字処理装置及びその方法
JPH10187705A (ja) 文書処理方法及びその装置
JPS62198957A (ja) 文字処理装置
JPS63255768A (ja) 文字処理装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term