JPS62198957A

JPS62198957A - 文字処理装置

Info

Publication number: JPS62198957A
Application number: JP61041280A
Authority: JP
Inventors: Kazuyo Ikeda; 和世池田
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1986-02-26
Filing date: 1986-02-26
Publication date: 1987-09-02

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（発明の属する分野〕本発明はかな漢字変換を行なうことにより日本文を入力
する文字処理装置における辞書ガ管理方式に関係する。

（従来の技術）日本文、特に漢字を入力する文字処理装置においては、
オペレータがキーボードより入力したい漢字に対応する
読みを入力して変換指示を与えることにより読みを漢字
に変換して入力するいわゆるかな漢字変換により漢字入
力を実現する方法が広く行なわれている。

上記の方法においては、通常、漢字の読みと表記を対応
づけて収容した辞書を用いて、読みから漢字に変換され
る。辞書の容量は有限であり、全ての日本語の単語を収
容することは不可能に近い。また、１個人が使用する単
語数は限られており、たかだか数万語程度である。そこ
で、上記のような文字処理装置においては、数万語程度
収容で診る辞書を備えたものが主流を占めている。

〔発明が解決しようとする問題点〕

しかし、数万語の容ｔの辞書では誰もが使う、ごく一般
的な単語しか収容できず、特定の人々が使用する専門語
やあまり使われない単語は収容出来ない。

そこで、上記のような文字処理装置においては、オペレ
ータが必要な単語を辞書に登録したり、必要でない単語
を辞書から削除したりする辞書管理の方法が考案されて
いる。

必要な単語をオペレータが登録できる単語登録の方法は
従来から種々の方法が考案されている。

しかし、今までに考案されてきた単語登録の方法は、登
録する単語１単語ごとに単語登録する指示を与えてやら
なければならず、特定の分野の専門用語等、登録しなけ
ればならない単語が多数存在する場合は、単語を登録す
る作業が非常に繁雑であった。また、１単語ごとに登録
していくために、単語登録のための入力のミスを確認す
る作業を登録するたびに行なわなければならないという
緊雑さもあった。さらに、登録するために入力した情報
が単語を登録したのちには失われてしまい、多数の単語
を登録したときに、正しく登録されているかどうかを確
認する作業が容易ではなかった。

（問題点を解決する為の手段）すなわち、登録ずべぎ単語リストを予め登録単語リスト
記憶手段に記憶しておき単語を登録するための指示を一
括単語登録手段手段によって与え、単語リストの−Ｑｊ
−語を一括単語登録手段によって辞書手段に登録する構
成でなる。

〔作　用〕

登録単語リスト記憶手段に記憶された単語を一括して辞
書手段に登寥蘂するので多数の単語を登録する際の手間
を簡略化し、オペレータの単語登録の際に生じるミスを
軽減し、登録した単語を確認しやすくできる。

（実施例）以下図面を参照して本発明の詳細な説明する。

第１図は本発明の詳細な説明する図である。

登録単語リスト入力手段によって入力された登録する単
語の読みや表記のリストは登録単語リスト記憶手段によ
って記憶される。一括車語登録指示手段によって一括単
語登録の指示が与えられると、一括Ａ１語登録手段によ
って登録単語リストに記載されている単語を辞書中に一
括して登録する。

第２図は本発明の全体構成の一例である。

図示の構成において、ＣＰＵは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスＡＢ、コントロールバスＣＢ、データバスＤ
Ｂを介して、それらのバスに接続された各構成要素を制
御する。

アドレスバスＡＢはマイクロプロセッサＣＰＵの制御の
対象とする構成要素を指示するアドレス（３号を転送す
る。コントロールバスＣＢはマイクロプロセッサＣＰＵ
の制御の対象とする各構成要素のコントロール信号を転
送して印加する。データバスＤＢは各構成機器相互間の
データの転送を行なう。

次にＲＯＭは、読出し専用の固定メモリであり、第６図
〜第１２図につき後述するマイクロプロセッサＣＰＵに
よる制御の手順等を記憶させておく。

また、ＲＡＭは、ｌワード１６ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。

ＴＢＵＦは文書バッファであり、キーボードＫＢより入
力された文書データを蓄えるためのメモ。

りである。

ＤＩＣはかな漢字変）梃を行なうための辞書である。

ＤＩＣＥＮＤは辞書ＤＩＣに格納されている単語数を格
納する変数である。

Ｘは文書データの文書座標のＸ座標、ｙは文書データの
文書座標のＹ座標である。

ＹＯＭ　Ｉは登録するｌ単語の読みを格納するバッファ
、ＫＡＮＪＩは登録する１単語の漢字を格納するバッフ
ァ、Ｇｌは登録するｌ単語の読みを格納するバッファ、
ＨＩＮＤＯは登録する１単語の読みを格納するバッファ
である。

ｉは単語の読みＹＯＭ　＋や漢字ＫＡＮＪ　Ｉの１文字
分の文字データを示すポインタである。

ＫＢはキーボードであって、アルファベットキー、ひら
がなキー、カタカナキー等の文字記号人カキ−１及び、
変換キー、一括単語登録キー等の本文字処理装置に対す
る各種機能を指示するための各種のファンクションキー
を備えている。

ＤＩＳＫは定型文書を記憶するためのメモリで作成され
た文書の保管を行ない、保管された文書はキーボードの
指示により、必要な時呼び出される。

ＣＲはカーソルレジスタである。ＣＰＵにより、カーソ
ルレジスタの内容を読み書きできる。

後述するＣＲＴコントローラＣＲＴＣは、ここに蓄えら
れたアドレスに対する表示装置ＣＲＴ上の位置にカーソ
ルを表示する。

ＤＢＵＦは表示用バッファメモリで、ＴＢＵＦに蓄えら
れた文書情報等のパターンを蓄える。

ＣＲＴＣはカーソルレジスタＣＲ及びバッファＤＢＵＦ
に蓄えられた内容を表示器ＣＲＴに表示する役割を担う
。

また、ＣＲＴは陰極線管等を用いた表示装置であり、そ
の表示装置ＣＲＴにおけるドツト構成のパターンおよび
カーソルの表示をＣＲＴコントローラて制御する。

さらに、ＣＧはキャラクタジェネレータであって、表示
装置ＣＲＴに表示する文字、記号のパターンを記憶する
ものである。

かかる各構成要素からなる本発明文字処理装置において
は、キーボードＫＢからの各種の入力に応じて作動する
ものであって、キーボードＫＢからの入力が供給される
と、まず、インタラブド信号がマイクロプロセッサＣＰ
Ｕに送られ、そのマイクロプロセッサＣＰＵがＲＯＭ内
に記憶しである各種の制御信号を読出し、それらの制御
信号に従って、各種の制御が行なわれる。

第３図は一括単語登録を行なう文書データに格納される
登録単語リストのフォーマットを示す図である。

１行に１単語ずつ、登録する単語の情報を記述していぎ
、各行の１文字１］から単語の読みを記述し、１０文字
目から単語の表記を記述し、１５文字目から単語の文法
情報を記述し、２０文字目から単語の頻度情報を記述す
る。

第４図は本発明における文書バッファＴＢＵＦに格納さ
れる文書データの構成を示す図である。

（ａ）はＴＢＵＦがいくつかの行データに区分されて格
納されていることを示す。各行データに対して文書座標
が割り付けられ、例えば、！行目のデータを指示すると
きは文書座標のＹ座標、ｙ＝１と設定するものとする。

各行データの長さは固定であり、各行１２８バイトで構
成される。

（ｂ）は各行データの構造を示す図である。行データは
６４個の文字データより構成される。各文字データに対
して文書座標が割り付けられ、例えば、１文字目のデー
タを指示するときは文書座標のＸ座標ｘ＝１と設定する
ものとする。各文字データの長さは固定であり、各文字
２バイトで構成される。

文字データにはＪＩＳ　　Ｃ−６２２６コードを使用し
、文書データで文字が格納されていない領域にはＯか埋
められている。

第５図は本発明における辞書（Ｄ　Ｉ　Ｃ）の構成を示
した図である。

ＹＦは読み部であり、単語の読みを１文字２バイトで最
高８文字まで格納する。コードはＪＩＳＣ−６２２６コ
ードを使用し、余った領域には０を埋める。ＹＦ　（ｉ
）は辞書ＤＩＣの先頭からｉ番目の単語の読み部である
。

ＫＦは漠字部であり、単語の表記を１文字２バイトで最
高３文字まで格納する。コードはＪＩＳＣ−６２２６コ
ードを使用し、余った領域には０を埋める。ＫＦ　（ｉ
）は辞書ＤＫＣの先頭からｉ番目の単語の表記部である
。

ＧＦは文法情報部であり、その単語の品詞等の文法情報
を格納する。ＧＦ　（ｉ）は辞書ＤＩＣの先頭からｉ番
目の単語の文法情報部である。

ＨＦは頻度情報部であり、その単語の頻度を１から２５
６の数値で格納する。Ｉ（Ｆ　（ｉ）は辞書ＤＩＣの先
頭からｉ番目の単語の頻度情報部である。

各単語はすべて２６バイトで構成される。

ＤＩＣＥＮＤは辞書ＤＩＣに格納されている単語数であ
る。

上述の実施例の作動をフローに従って説明する。

第６図は本発明文字処理装置の動作を示すフローチャー
トである。

ステップ６−１においてキーホードよりキーが押下され
、割り込みが発生するのを待つ。キーが入力されるとス
テップ６−６においてキー判別しキーの種類に応じて６
−２．６−３．６−４のいずれかのステップに分岐する
。

ステップ６−２は変換キーが押下されたときの処理であ
り、入力された読み列を漢字列に変換する処理であり、
同種の文字処理装置において一般に行なわれている処理
であり、公知であるので、特に詳細な記述はしない。

ステップ６−３は一括単語登録キーが入力されたときの
処理であり、文書データに格納されている登録単語リス
トを辞書ＤＩＣに登録する。

ステップ６−４は変換キー、一括ｉ…語登録キー以外の
キーの通常のキーが（例えばカーソルわ動キー）を入力
した場合の処理であり、同種の文字処理装置において一
般に行なわれている処理であり、公知であるので、特に
記述しない。

ステップ６−５は上記の編集処理の結果、変更された部
分を表示する表示処理である。文書中のデータを１文字
読んではパターンに展開し、表示バッファに出力すると
いう通常広く行なわれている処理である。

第７図はステップ６−３の処理を詳細化したフローチャ
ートである。

ステップ７−１において文書データの１行目のデータ（
すなわち、登録単語リストの最初の単語のデータ）を取
り込むために、文書座標のＹ座標ｙに１を代入する。

ステップ７−２において文書データのｙ行目にデータが
存在するかどうかを、ｙ行目の１文字目の文字データを
０と比較することによってチェックし、もし存在ずれば
ステップ７−３に進み、存在しなければ一括単語登録処
理が終了したものとみなし、リターンする。

ステップ７−３において、文書データのｙ行目に格納さ
れている単語（すなわち単語リストのｙ番目の単語）の
読みを取り込む。

ステップ７−４において、文書データのｙ行目に格納さ
れている単語（すなわち単語リストのｙ番目の単語）の
漢字を取り込む。

ステ・ツブ７−５において、文書データのｙ行目に格納
されている単語（すなわち単語リストのｙ番目の単語）
の文法情報を取り込む。

ステップ７−６において、文書データのｙ行目に格納さ
れている単語（すなわち単語リストのｙ番目の単語）の
頻度を取り込む。

ステップ７−７において、ステップ７−３．ステップ７
−４．ステップ７−５．ステップ７−６において取り込
んだ単語の情報（読み、漢字１文法情報、頻度）を辞書
１）ＩＣに登録する。

ステップ７−８において、次の行に格納されている単語
のデータを取り込むために、文書データの配列の行使数
ｙの値を１だけインクリメントし、ステップ７−２へ進
む。

第８図はステップ７−３の処理を詳細化したフローチャ
ートである。

ステップ８−１において、登録する単語の読みバッファ
ＹＯＭ　ＩをＯクリアし、読みバッファへのポインタｉ
に１を代入する。

ステップ８−２において、文書データのｙ行目の１文字
目から格納されている単語の読みの１文字目を取り込む
ために、文書座標のＸ座標Ｘに１を代入する。

ステップ８−３において、単語の読みが終ったかどうか
をチェックするために、ｙ行目のＸ桁目の（文書座標の
Ｘ座標ｘ、Ｙ座標ｙで指定される）文字データを０と比
較し、等しければ、単語の読みが終ったものとしてリタ
ーンする。等しくなければ、ステップ８−４に進む。

ステップ８−４において、文書座標のＸ座標ｘ、Ｙ座標
ｙで指定される単語の読みのｉ文字目の文字データを、
登録する単語の読みバッファＹＯＭＩのポインタｉで指
定される位置に取り込む。

ステップ８−５において、文書データ中の次の文字を取
り込むために文書座標のＸ座標Ｘと読みバッファへのポ
インタｉの値を１だけインクリメントする。

ステップ８−６において、登録単語リストの単語°の読
みが８文字を越えたかどうかをｉを８と、比較すること
によってチェックし、越えていたらリターンする。越え
ていなければステップ８−３に進む。

第９図はステップ７−４の処理を詳細化したフローチャ
ートである。

ステップ９−１において、登録する単語の漢字バッファ
ＫＡＮＪＩをＯクリアし、漢字バッファへのポインタｉ
に１を代入する。

ステップ９−２において、文書データのｙ行目の１０文
字目から格納されている単語の漢字の１文字目を取り込
むために、文書座標のＸ座標Ｘに１０を代入する。

ステップ９−３において、単語の漢字が終ったかどうか
をチェックするために、ｙ行目のＸ桁目の（文書座標の
Ｘ座標ｘ、Ｙ座標ｙで指定される）文字データを０と比
較し、等しければ、単語の漢字が終ったものとしてリタ
ーンする。等しくなければ、ステップ９−４に進む。

ステップ９−４において、文書座標のＸ座標ｘ、Ｙ座標
ｙで指定される単語の漢字のｉ文字目の文字データを、
登録する単語の漢字バッファＫＡＮＪＩのポインタｉで
指定される位置に取り込む。

ステップ９−５において、文書データ中の次の文字を取
り込むために文書座標のＸ座標Ｘと読みバッファへのポ
インタｉの値を１だけインクリメントする。

ステップ９−６において、登録単語リストの単語の漢字
−が３文字を越えたかどうかをｉを３と比較することに
よってチェックし、越えていたらリターンする。越えて
いなければステップ９−３に進む。

第１０図はステップ７−５の処理を詳細化したフローチ
ャートである。

ステップ１０−１において、単語の文法情報バッファＧ
ｌを０クリアする。

ステップ１０−２において、文書データのｙ行目の１５
文字目から格納されている単語の文法情報を取り込むた
めに、文書座標のＸ座標Ｘに１５を代入する。

ステップ１Ｏ−３において、単語の文法情報を単語の文
法情報バッファＧｌに取り込み、リターンする。

第１１図はステップ７−６の処理を詳細化したフローチ
ャートである。

ステップ１１−１において、単語の頻度情報バッファＨ
ＩＮＤＯを０クリアする。

ステップ１１−２において、文書データのｙ行目の２０
文字目から格納されている単語の頻度情報を取り込むた
めに、文書座標のＸ座標Ｘに２０を代入する。

ステップ１１−３において、単語の頻度情報を単語の頻
度情報バッファＨＴＮＤＯに取り込み、リターンする。

第１２図はステップ７−７の処理を詳細化したフローチ
ャートである。

ステップ１２−１において、辞書ＤＩＣの格納されてい
る最後の単語情報領域の次の単語情報領域の読み部ＹＦ
　（ＤＩＣＥＮＤ＋１）に単語の読みバッファＹＯＭ　
Ｉの内容を格納する。

ステップ１２−２において、辞書ＤＩＣＩの格納されて
いる最後の単語情報領域の次の単語情報領域の浅学部Ｋ
Ｆ　（Ｄ　Ｉ　ＣＥＮＤ＋　１　）に単語の漢字バッフ
ァＫＡＮＪＩの内容を格納する。

ステップ１２−３において、辞書ＤＩＣの格納されてい
る最後の単語情報領域の次の単語情報領域の文法情報部
ＧＦ　（ＤＩＣＥＮＤ＋１）に単語の文法情報バッファ
Ｇｌの内容を格納する。

ステップ１２−４において、辞書ＤＩＣの格納されてい
る最後の単語情報領域の次の単語情報領域の頻度情報部
ＨＦ　（ＤＩＣＥＮＤ＋１）にＡ８−語の頻度情報バッ
ファＨＩＮＤＯの内容を格納する。

ステップ１２−５において、辞書ＤＩＣに格納されてい
る単語数ＤＩＣＥＮＤを１だけインクリメントする。

以上の説明において、辞書構造としてはＡ１語長が固定
長の辞書を想定しているが、可変長の単語長で構成した
、より圧縮された辞書構造であっても同様に処理を行な
うことができる。また、辞書に登録されている単語は辞
書の読みによってソートされていなかったが、単語の読
みによってソートされた辞書構造であっても同様に処理
できる。

また、登録単語リストは定められた位置から単語の読み
や表記などが記述するフォーマットであったが、単語の
読みや表記などが識別できるものであれば、どのような
フォーマットを用いてもよい。

また、以上の実施例においては登録単語リストの入力を
キーボードから行なっていたが、フロッピーディスクな
どの外部記憶装置から入力してもよい。

以上の説明からも明らかなように、本発明によれば、複
数の単語を一括して辞書に登録できるために、単語を多
数登録するときに、オペレータの操作の負担が軽減され
、単語を登録する際の操作ミスが減少し、また、登録さ
れた単語の確認が容易である、操作性の優れた文字処理
装置を実現できた。

【図面の簡単な説明】

第１図は本発明の概念を示す図、第２図は本発明の全体構成のブロック図、第３図は登録
単語リストのフォーマット例を説明した図、第４図は本発明の文書データの構造の例を示す図、第５図は本発明の辞書構成の例を示す図、第６図〜第１
２図は本発明文字処理装置の動作を示すフローヂャート
。

Claims

【特許請求の範囲】複数の単語をその読みと表記との対応をとって収容する
辞書手段と、前記辞書手段に登録する単語の読みと表記を入力する登
録単語リスト入力手段と、前記入力された登録単語リストを記憶する登録単語リス
ト記憶手段と、前記登録単語リストに記載されている単語を順次前記辞
書手段に登録することを指示する一括単語登録指示手段
と、前記一括単語登録指示手段に従って、登録単語リストに
記載されている単語を順次前記辞書手段に登録する一括
単語登録手段とを有することを特徴とする文字処理装置