JPS63221470A

JPS63221470A - 文字処理装置

Info

Publication number: JPS63221470A
Application number: JP62055860A
Authority: JP
Inventors: Eiichiro Toshima; 英一朗戸島
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1987-03-11
Filing date: 1987-03-11
Publication date: 1988-09-14
Anticipated expiration: 2010-07-31
Also published as: JPH0769907B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は仮名漢字変換により読みを漢字に変換しながら
文書を作成していく文字処理装置、特に複数文節仮名漢
字変換により入力ができる文字処理装置に関する。

〔従来の技術〕

文節の区切りを指定せずにかな漢字変換が可能な複数文
節かな漢字変換による入力、いわゆる複数文節入力を実
現した装置は従来から存在している。このような複数文
節入力においては辞書サーチが頻繁に行われるため、変
換時間が長（かかるという問題があった。

この問題を解決するために従来装置には２つのタイプが
存在する。第１のタイプは高速アクセス可能なメモリを
使用するこにより上記問題を解決した装置であり、辞書
を高速アクセス可能なメモリにロードしてお（ことによ
り、頻繁に辞書サーチを行ってもリアルタイムで変換で
きるようにした装置である。かかる装置の欠点は高速で
あるために高価なメモリを大量に使用するため、装置自
体が高価なものとなってしまうという点である。

第２のタイプの装置は低速かつ安価なメモリを使用して
装置自体は低価格に構成し、そのかわり辞書のサーチ回
数をできるだけ少なくするように工夫した装置である。

かかる装置の欠点は辞書サーチ回数を無理に少な（して
いるため思うように変換精度を上げることができず、変
換率が悪いという点である。

〔発明が解決しようとしている問題点〕本発明は上述の
点に鑑み、変換精度を上げ安い文字処理装置を提供する
。

〔問題点を解決するための手段〕

本発明は、文書を作成する文字処理装置において読み列
を入力する読み列入力手段と、単語を読みと表記の対応
をとって記憶した第１の辞書手段と、前記第１の辞書の
情報のうち少な（とも読みに関する情報を記憶した第２
の辞書手段と、前記入力された読み列を前記第２の辞書
を参照することにより変換単位に分割する読み列分割手
段と、前記分割された読み列を前記第１の辞書を参照す
ることにより前記表記に変換する読み列変換手段と、前
記第１の辞書より前記第２の辞書を再生成する辞書再構
成手段とを具備することにより実現するものである。

〔実施例〕

以下図面を参照して本発明の詳細な説明する。

第１図は本発明による文字処理装置の概略図である。

読み列入力手段より入力された読み列を読み列分割手段
が第２の辞書を参照しつつ変換単位に分割し、分割され
た読み列を読み列変換手段が第１の辞書を参照しつつ漢
字かな混じり文に変換する。他方、辞書再構成手段によ
り第１の辞書から読み情報を抽出した第２の辞書を再生
成する。

第２図は本発明の全体構成の一例である。

図示の構成においてＣＰＵはマイクロプロセッサであり
、文字処理のための演算、論理判断等を行い、アドレス
バスＡＢ、コントロールバスＣＢ、データバスＤＢを介
してそれらのバスに接続された各構成要素を制御する。

アドレスバスＡＢはマイクロプロセッサＣＰＵの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスＣＢはマイクロプロセッサＣＰＵの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスＤＢは各構成機器相互間のデ
ータの転送を行う。

つぎにＲＯＭは読出し専用の固定メモリであり、第６図
〜第１０図につき後述するマイクロプロセッサＣＰＵに
よる制御の手順等を記憶させておく。

また、ＲＡＭはｌワード１６ビツトの構成の書込み可能
のランダムアクセスメモリであって、バッファＹＤＣ，
ｉ、Ｌ、ＩＢ、Ｆ、ＴＢＵＦを有し、各構成要素からの
各種データの一時記憶に用いる。

ＴＢＵＦはメモリＲＡＭ内に設けられる文書バッファで
あり、キーボードＫＢより入力された文書情報を蓄える
。

ＹＤＣはメモリＲＡＭ内に設けられ、入力読み列を変換
単位に分割するための読み辞書である。

第３図は読み辞書ＹＤＣの構成を示した図である。

ＹＭＦは読み部、ＧＩＦは文法情報部を示す。読み部２
文法情報部の構成は辞書ＤＩＣの構成と同一である。最
後尾には「んんん」が入ってエンドマークとなっている
。

ＫＢはキーボードであって、アルファベットキー。

ひらがなキー、カタカナキー等の文字記号入カキ−及び
変換キー、単語登録キー等の本文字処理装置に対する各
種機能を指示するための各種のファンクションキーを備
えている。

ＤＩＳＫは磁気ディスク等の低速である安価なメモリで
あり、かな漢字変換を行うための辞書および文書、読み
辞書、その他の保管が必要なデータを記憶するために使
用される。作成された読み辞書はＤＩＳＫに保管され更
に保管された読み辞書はキーボードの指示により必要な
時呼び出される。

ＤＩＣはかな漢字変換用の辞書であり、メモリＤＩＳＫ
上に存在する。

第４図は辞書ＤＥＣの構成を示した図である。各単語は
１単語１８バイトで構成される。ＹＭＦは読み部であり
、各単語の読みを１読み１バイトでＪ　Ｉ　Ｓ　Ｃ−６
２２６コードの下位バイトで表現する。ＫＪＦは漢字部
であり、ＪＩＳＣ−６２２６コードを用い１文字２バイ
トで表現する。ＧＩＦは文法情報部であり各単語の品詞
情報を２バイトで表現する。各単語は読みの昇順にソー
トされている。

ＹＤＣ５ＶはＤＩＳＫ上に存在する読み辞書退避用ワー
クエリアである。

ＣＲはカーソルレジスタである。ＣＰＵによりカーソル
レジスタの内容を読み書きできる。後述するＣＲＴコン
トローラＣＲＴＣは、ここに蓄えられたアドレスに対応
する表示装置ＣＲＴ上の位置にカーソルを表示する。

ＤＢＵＦは表示用バッファメモリでＴＢＵＦに蓄えられ
た文書情報等のパターンを蓄える。

ＣＲＴＣはカーソルレジスタＣＲ及びバッファＤＢＵＦ
に蓄えられた内容を表示器ＣＲＴに表示する役割を担う
。

またＣＲＴは陰極線管等を用いた表示装置であり、その
表示装置ＣＲＴにおけるドツト構成の表示ノ々ターンお
よびカーソルの表示をＣＲＴコントローラで制御する。

さらに、ＣＧはキャラクタジェネレータでありて表示装
置ＣＲＴに表示する文字、記号のパターンを記憶するも
のである。

かかる各構成要素からなる本発明文字処理装置において
は、キーボードＫＢからの各種の入力に応じて作動する
ものであってキーボードＫＢからの入力が供給されると
、まずインタラブド信号がマイクロプロセッサＣＰＵに
送られ、そのマイクロプロセッサＣＰＵがＲＯＭ内に記
憶しである各種の制御信号を読出し、それらの制御信号
に従って各種の制御が行われる。

上述の構成より成る実施例の作動を説明する。

第５図は複数文節入力の概念を示した図である。

（５−１）はオペレータの入力した例文の１つである。

矢印に示すように単語がサーチされる。次にサーチ結果
に基づき（５−２）のように文節単位に入力読み列が分
割され、（５−３）に示すような漢字かな混じり文にな
る。

すなわち、複数文節入力では辞書サーチが処理時間のネ
ックとなるため、高速メモリに辞書を持たなければなら
ない。

第６図は本発明文字処理装置の動作を示すフローチャー
トである。

ステップ６−１においてシステム動作に必要な各種変数
の初期化を行う。例えば、辞書変更フラグＦはこのとき
リセットされる。

ステップ６−２においてキー人力の受付を行い、キーが
入力されるとキーの種類に応じて各処理に分岐する。

ステップ６−３は単語登録キーが入力された場合であり
、第７図に詳述する単語登録の処理を行う。

ステップ６−４は変換キーが入力された場合であり、第
８図に詳述する変換の処理を行う。

ステップ６−５は文字キー、挿入キー、削除キー等の他
のキーが入力された場合の処理である。

ステップ６−６はバッファＩＢ、ＴＢＵＦの内容を表示
する為にＤＢＵＦに移すステップである。

第７図は単語登録を行う場合の処理である。ステップ７
〜１は単語登録処理である。オペレータの指定した読み
、漢字を持つ単語を新たに辞書に登録する処理である。

ステップ７−２は単語登録終了後、辞書変更フラグＦを
ＯＮする処理である。

第８図は変換処理の詳細を記述した図である。

ステップ８−１は第９図に詳述する入力読み列を変換単
位（文節）に分割する処理である。ステップ８−２は文
節単位に分割された読み列を漢字に変換する処理であり
第１１図に詳述される。

第９図は読み列分割処理の詳細を記述したフローである
。

ステップ９−１において辞書変更フラグＦをチェックし
、もしＯＦＦであれば辞書は変更されていないのでステ
ップ９−２においてＤＩＳＫ上のＹＤＣ５Ｖより読み辞
書をＹＤＣにロードしステップ９−５に分岐する。ＤＩ
ＳＫよりロードを実行する処理は通常の文字処理装置に
おいて、例えば文書呼出等を実行するときに公知の技術
であるので特に説明は行わない。

もし、辞書変更フラグＦがＯＮならステップ９−３に進
み第１０図に詳述する読み辞書ＹＤＣの作成処理を行い
、ステップ９−４において作成された読み辞書ＹＤＣを
ＤＩＳＫ上（７）ＹＤＣ３Ｖｉ、：セーブシステップ９
−５に分岐する。

ステップ９−５において読み辞書ＹＤＣをサーチし、ど
のような文節が可能であるかをメモリＲＡＭのレジスタ
Ｌにリストアツブする。

ステップ９−６において上記リストアツブされた文節を
組み合せてバッファＩＢ内の読み列を変換単位に分割す
る。このときの分割の方法に関しては、最長一致法、２
文節最長一致法２文節数最小法等の各種の方式が使用で
きる。

第１０図は読み辞書作成を詳細化したフローである。

ステップ１０−１において行カウンタｉをクリアする。

ステップ１０−２において行カウンタｉが辞書単語数を
超えているかチェックし、もし超えていれば１０−８に
分岐する。

ステップ１Ｏ−３において辞書よりｉ番目の単語の読み
情報を取り出し、ステップ１０−４で読み辞書のｉ番目
にセットする。

ステップ１０−５において辞書ｉ番目の単語の文法情報
を取り出し、ステップ１ｏ−６において読み辞書ｉ番目
にセットする。

ステップ１Ｏ−７において行カウンタｉを更新しステッ
プ１０−２に戻る。

ステップｌ０−８において読み辞書のエンドマーカのセ
ットを行う。

ステップｌ０−９において辞書変更フラグＦをＯＦＦす
る。

第１１図は文節変換の処理を詳細化したフローである。

ステップ１１−１においてバッファＩＢの分割された変
換単位（文節）と一致する単語が存在するがどうか調べ
るために辞書ＤＩＣをサーチする。

ステップ１１−２において一致する単語が見つかったか
どうかを判定し、見つかったときはステップ１１−３に
分岐し辞書ＤＩＣ中に記載されている通りに漢字列に変
換する。もし見っからながったときはステップ１１−４
に分岐し、ひらがなのままを変換結果とする。

ステップ１１−５において上記の変換結果をメモリＴＢ
ＵＦ文書中に出力しリターンする。

〔他の実施例〕

以上の実施例におていは読み列を変換単位に分割するた
めの辞書としては読みのみを持つ辞書を想定しているが
、読み以外にも変換率を上げるために必要な情報がもっ
ても何ら本発明の趣旨を損なうものではない。要は、変
換に必要な辞書のうち変換単位に分割するために必要な
情報のみを分離して高速メモリ上に持つことを特徴とし
ている。

また、仮名を漢字に変換する日本文作成装置を実施例と
して説明しているが、本発明の成果は、他のもの、例え
ばローマ字表記を漢字仮名混じり文に変換する装置、発
音記号を英文に変換する装置などにも応用が可能である
。

〔効　果〕

以上述べたことから明らかなように、本発明によれば辞
書は低速メモリ上にあるので装置自体は安価であり、し
かも読み情報のみは高速メモリ上に持つので変換時間も
速く、しかも変換率の高い文字処理装置を実現すること
ができる。

また、読み辞書のはオリジナルの辞書より再生成する手
段があるため、辞書本体と読み辞書の内容が食い違って
変換結果に悪影響を及ぼすこともなく首尾一貫した変換
を行う文字処理装置を実現できる。

【図面の簡単な説明】

第１図は本発明による文字処理装置の概略図、第２図は
本発明の全体構成の一例を示す図、第３図は読み辞書Ｙ
ＤＣの構成の例を示す図、第４図は辞書ＤＩＣの構成の
例を示す図、第５図は複数文節入力の例を示す図、第６図〜第１１図は本発明文字処理装置の動作を示すフ
ローチャートの例を示す図。ＣＰＵはマイクロプロセッサ、ＡＢはアドレスバス、Ｃ
Ｂはコントロールバス、ＤＢはデータバス、ＲＯＭは固
定メモリ、ＲＡＭはランダムアクセスメモリ、ＴＢＵＦ
は文書バッファ、ＹＤＣは読み辞書、ＫＢはキーボード
、ＤＩＳＫは磁気ディスク、ＤＩＣは辞書、ＹＤＣ５Ｖ
は読み辞書退避エリア、ＣＲはカーソルレジスタ、ＣＲ
ＴＣはＣＲＴコントローラ、ＤＢＵＦは表示用バッファ
メモリ、ＣＧはキャラクタジェネレータ。Ｙｌ’ｌＦ　　　　　　　Ｃｒ１Ｆ１も− ８ハイド　　　　　　　２ハイド（８文哨ｉ）　　　　　　　　　　　　　　　　　　（
９タモグ宇ジ第５図＜５−０　　　　さのう　し力ゝ（ゴしく＝ましｊ＝Ｊ
Ｊ／

Claims

【特許請求の範囲】

文書を作成する文字処理装置において、読み列を入力す
る読み列入力手段と、単語を読みと表記の対応をとって
記憶した第１の辞書手段と、前記第１の辞書の情報のう
ち少なくとも読みに関する情報を記憶した第２の辞書手
段と、前記入力された読み列を前記第２の辞書を参照す
ることにより変換単位に分割する読み列分割手段と、前
記分割された読み列を前記第１の辞書を参照することに
より前記表記に変換する読み列変換手段と、前記第１の
辞書より前記第２の辞書を再生成する辞書再構成手段と
を具備することを特徴とする文字処理装置。