JPS62198957A - 文字処理装置 - Google Patents

文字処理装置

Info

Publication number
JPS62198957A
JPS62198957A JP61041280A JP4128086A JPS62198957A JP S62198957 A JPS62198957 A JP S62198957A JP 61041280 A JP61041280 A JP 61041280A JP 4128086 A JP4128086 A JP 4128086A JP S62198957 A JPS62198957 A JP S62198957A
Authority
JP
Japan
Prior art keywords
word
registered
words
dictionary
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61041280A
Other languages
English (en)
Inventor
Kazuyo Ikeda
和世 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61041280A priority Critical patent/JPS62198957A/ja
Publication of JPS62198957A publication Critical patent/JPS62198957A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (発明の属する分野〕 本発明はかな漢字変換を行なうことにより日本文を入力
する文字処理装置における辞書ガ管理方式に関係する。
(従来の技術) 日本文、特に漢字を入力する文字処理装置においては、
オペレータがキーボードより入力したい漢字に対応する
読みを入力して変換指示を与えることにより読みを漢字
に変換して入力するいわゆるかな漢字変換により漢字入
力を実現する方法が広く行なわれている。
上記の方法においては、通常、漢字の読みと表記を対応
づけて収容した辞書を用いて、読みから漢字に変換され
る。辞書の容量は有限であり、全ての日本語の単語を収
容することは不可能に近い。また、1個人が使用する単
語数は限られており、たかだか数万語程度である。そこ
で、上記のような文字処理装置においては、数万語程度
収容で診る辞書を備えたものが主流を占めている。
〔発明が解決しようとする問題点〕
しかし、数万語の容tの辞書では誰もが使う、ごく一般
的な単語しか収容できず、特定の人々が使用する専門語
やあまり使われない単語は収容出来ない。
そこで、上記のような文字処理装置においては、オペレ
ータが必要な単語を辞書に登録したり、必要でない単語
を辞書から削除したりする辞書管理の方法が考案されて
いる。
必要な単語をオペレータが登録できる単語登録の方法は
従来から種々の方法が考案されている。
しかし、今までに考案されてきた単語登録の方法は、登
録する単語1単語ごとに単語登録する指示を与えてやら
なければならず、特定の分野の専門用語等、登録しなけ
ればならない単語が多数存在する場合は、単語を登録す
る作業が非常に繁雑であった。また、1単語ごとに登録
していくために、単語登録のための入力のミスを確認す
る作業を登録するたびに行なわなければならないという
緊雑さもあった。さらに、登録するために入力した情報
が単語を登録したのちには失われてしまい、多数の単語
を登録したときに、正しく登録されているかどうかを確
認する作業が容易ではなかった。
(問題点を解決する為の手段) すなわち、登録ずべぎ単語リストを予め登録単語リスト
記憶手段に記憶しておき単語を登録するための指示を一
括単語登録手段手段によって与え、単語リストの−Qj
−語を一括単語登録手段によって辞書手段に登録する構
成でなる。
〔作 用〕
登録単語リスト記憶手段に記憶された単語を一括して辞
書手段に登寥蘂するので多数の単語を登録する際の手間
を簡略化し、オペレータの単語登録の際に生じるミスを
軽減し、登録した単語を確認しやすくできる。
(実施例) 以下図面を参照して本発明の詳細な説明する。
第1図は本発明の詳細な説明する図である。
登録単語リスト入力手段によって入力された登録する単
語の読みや表記のリストは登録単語リスト記憶手段によ
って記憶される。一括車語登録指示手段によって一括単
語登録の指示が与えられると、一括A1語登録手段によ
って登録単語リストに記載されている単語を辞書中に一
括して登録する。
第2図は本発明の全体構成の一例である。
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス(3号を転送す
る。コントロールバスCBはマイクロプロセッサCPU
の制御の対象とする各構成要素のコントロール信号を転
送して印加する。データバスDBは各構成機器相互間の
データの転送を行なう。
次にROMは、読出し専用の固定メモリであり、第6図
〜第12図につき後述するマイクロプロセッサCPUに
よる制御の手順等を記憶させておく。
また、RAMは、lワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。
TBUFは文書バッファであり、キーボードKBより入
力された文書データを蓄えるためのメモ。
りである。
DICはかな漢字変)梃を行なうための辞書である。
DICENDは辞書DICに格納されている単語数を格
納する変数である。
Xは文書データの文書座標のX座標、yは文書データの
文書座標のY座標である。
YOM Iは登録するl単語の読みを格納するバッファ
、KANJIは登録する1単語の漢字を格納するバッフ
ァ、Glは登録するl単語の読みを格納するバッファ、
HINDOは登録する1単語の読みを格納するバッファ
である。
iは単語の読みYOM +や漢字KANJ Iの1文字
分の文字データを示すポインタである。
KBはキーボードであって、アルファベットキー、ひら
がなキー、カタカナキー等の文字記号人カキ−1及び、
変換キー、一括単語登録キー等の本文字処理装置に対す
る各種機能を指示するための各種のファンクションキー
を備えている。
DISKは定型文書を記憶するためのメモリで作成され
た文書の保管を行ない、保管された文書はキーボードの
指示により、必要な時呼び出される。
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。
後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対する表示装置CRT上の位置にカーソ
ルを表示する。
DBUFは表示用バッファメモリで、TBUFに蓄えら
れた文書情報等のパターンを蓄える。
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
また、CRTは陰極線管等を用いた表示装置であり、そ
の表示装置CRTにおけるドツト構成のパターンおよび
カーソルの表示をCRTコントローラて制御する。
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インタラブド信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶しである各種の制御信号を読出し、それらの制御
信号に従って、各種の制御が行なわれる。
第3図は一括単語登録を行なう文書データに格納される
登録単語リストのフォーマットを示す図である。
1行に1単語ずつ、登録する単語の情報を記述していぎ
、各行の1文字1]から単語の読みを記述し、10文字
目から単語の表記を記述し、15文字目から単語の文法
情報を記述し、20文字目から単語の頻度情報を記述す
る。
第4図は本発明における文書バッファTBUFに格納さ
れる文書データの構成を示す図である。
(a)はTBUFがいくつかの行データに区分されて格
納されていることを示す。各行データに対して文書座標
が割り付けられ、例えば、!行目のデータを指示すると
きは文書座標のY座標、y=1と設定するものとする。
各行データの長さは固定であり、各行128バイトで構
成される。
(b)は各行データの構造を示す図である。行データは
64個の文字データより構成される。各文字データに対
して文書座標が割り付けられ、例えば、1文字目のデー
タを指示するときは文書座標のX座標x=1と設定する
ものとする。各文字データの長さは固定であり、各文字
2バイトで構成される。
文字データにはJIS  C−6226コードを使用し
、文書データで文字が格納されていない領域にはOか埋
められている。
第5図は本発明における辞書(D I C)の構成を示
した図である。
YFは読み部であり、単語の読みを1文字2バイトで最
高8文字まで格納する。コードはJISC−6226コ
ードを使用し、余った領域には0を埋める。YF (i
)は辞書DICの先頭からi番目の単語の読み部である
KFは漠字部であり、単語の表記を1文字2バイトで最
高3文字まで格納する。コードはJISC−6226コ
ードを使用し、余った領域には0を埋める。KF (i
)は辞書DKCの先頭からi番目の単語の表記部である
GFは文法情報部であり、その単語の品詞等の文法情報
を格納する。GF (i)は辞書DICの先頭からi番
目の単語の文法情報部である。
HFは頻度情報部であり、その単語の頻度を1から25
6の数値で格納する。I(F (i)は辞書DICの先
頭からi番目の単語の頻度情報部である。
各単語はすべて26バイトで構成される。
DICENDは辞書DICに格納されている単語数であ
る。
上述の実施例の作動をフローに従って説明する。
第6図は本発明文字処理装置の動作を示すフローチャー
トである。
ステップ6−1においてキーホードよりキーが押下され
、割り込みが発生するのを待つ。キーが入力されるとス
テップ6−6においてキー判別しキーの種類に応じて6
−2.6−3.6−4のいずれかのステップに分岐する
ステップ6−2は変換キーが押下されたときの処理であ
り、入力された読み列を漢字列に変換する処理であり、
同種の文字処理装置において一般に行なわれている処理
であり、公知であるので、特に詳細な記述はしない。
ステップ6−3は一括単語登録キーが入力されたときの
処理であり、文書データに格納されている登録単語リス
トを辞書DICに登録する。
ステップ6−4は変換キー、一括i…語登録キー以外の
キーの通常のキーが(例えばカーソルわ動キー)を入力
した場合の処理であり、同種の文字処理装置において一
般に行なわれている処理であり、公知であるので、特に
記述しない。
ステップ6−5は上記の編集処理の結果、変更された部
分を表示する表示処理である。文書中のデータを1文字
読んではパターンに展開し、表示バッファに出力すると
いう通常広く行なわれている処理である。
第7図はステップ6−3の処理を詳細化したフローチャ
ートである。
ステップ7−1において文書データの1行目のデータ(
すなわち、登録単語リストの最初の単語のデータ)を取
り込むために、文書座標のY座標yに1を代入する。
ステップ7−2において文書データのy行目にデータが
存在するかどうかを、y行目の1文字目の文字データを
0と比較することによってチェックし、もし存在ずれば
ステップ7−3に進み、存在しなければ一括単語登録処
理が終了したものとみなし、リターンする。
ステップ7−3において、文書データのy行目に格納さ
れている単語(すなわち単語リストのy番目の単語)の
読みを取り込む。
ステップ7−4において、文書データのy行目に格納さ
れている単語(すなわち単語リストのy番目の単語)の
漢字を取り込む。
ステ・ツブ7−5において、文書データのy行目に格納
されている単語(すなわち単語リストのy番目の単語)
の文法情報を取り込む。
ステップ7−6において、文書データのy行目に格納さ
れている単語(すなわち単語リストのy番目の単語)の
頻度を取り込む。
ステップ7−7において、ステップ7−3.ステップ7
−4.ステップ7−5.ステップ7−6において取り込
んだ単語の情報(読み、漢字1文法情報、頻度)を辞書
1)ICに登録する。
ステップ7−8において、次の行に格納されている単語
のデータを取り込むために、文書データの配列の行使数
yの値を1だけインクリメントし、ステップ7−2へ進
む。
第8図はステップ7−3の処理を詳細化したフローチャ
ートである。
ステップ8−1において、登録する単語の読みバッファ
YOM IをOクリアし、読みバッファへのポインタi
に1を代入する。
ステップ8−2において、文書データのy行目の1文字
目から格納されている単語の読みの1文字目を取り込む
ために、文書座標のX座標Xに1を代入する。
ステップ8−3において、単語の読みが終ったかどうか
をチェックするために、y行目のX桁目の(文書座標の
X座標x、Y座標yで指定される)文字データを0と比
較し、等しければ、単語の読みが終ったものとしてリタ
ーンする。等しくなければ、ステップ8−4に進む。
ステップ8−4において、文書座標のX座標x、Y座標
yで指定される単語の読みのi文字目の文字データを、
登録する単語の読みバッファYOMIのポインタiで指
定される位置に取り込む。
ステップ8−5において、文書データ中の次の文字を取
り込むために文書座標のX座標Xと読みバッファへのポ
インタiの値を1だけインクリメントする。
ステップ8−6において、登録単語リストの単語°の読
みが8文字を越えたかどうかをiを8と、比較すること
によってチェックし、越えていたらリターンする。越え
ていなければステップ8−3に進む。
第9図はステップ7−4の処理を詳細化したフローチャ
ートである。
ステップ9−1において、登録する単語の漢字バッファ
KANJIをOクリアし、漢字バッファへのポインタi
に1を代入する。
ステップ9−2において、文書データのy行目の10文
字目から格納されている単語の漢字の1文字目を取り込
むために、文書座標のX座標Xに10を代入する。
ステップ9−3において、単語の漢字が終ったかどうか
をチェックするために、y行目のX桁目の(文書座標の
X座標x、Y座標yで指定される)文字データを0と比
較し、等しければ、単語の漢字が終ったものとしてリタ
ーンする。等しくなければ、ステップ9−4に進む。
ステップ9−4において、文書座標のX座標x、Y座標
yで指定される単語の漢字のi文字目の文字データを、
登録する単語の漢字バッファKANJIのポインタiで
指定される位置に取り込む。
ステップ9−5において、文書データ中の次の文字を取
り込むために文書座標のX座標Xと読みバッファへのポ
インタiの値を1だけインクリメントする。
ステップ9−6において、登録単語リストの単語の漢字
−が3文字を越えたかどうかをiを3と比較することに
よってチェックし、越えていたらリターンする。越えて
いなければステップ9−3に進む。
第10図はステップ7−5の処理を詳細化したフローチ
ャートである。
ステップ10−1において、単語の文法情報バッファG
lを0クリアする。
ステップ10−2において、文書データのy行目の15
文字目から格納されている単語の文法情報を取り込むた
めに、文書座標のX座標Xに15を代入する。
ステップ1O−3において、単語の文法情報を単語の文
法情報バッファGlに取り込み、リターンする。
第11図はステップ7−6の処理を詳細化したフローチ
ャートである。
ステップ11−1において、単語の頻度情報バッファH
INDOを0クリアする。
ステップ11−2において、文書データのy行目の20
文字目から格納されている単語の頻度情報を取り込むた
めに、文書座標のX座標Xに20を代入する。
ステップ11−3において、単語の頻度情報を単語の頻
度情報バッファHTNDOに取り込み、リターンする。
第12図はステップ7−7の処理を詳細化したフローチ
ャートである。
ステップ12−1において、辞書DICの格納されてい
る最後の単語情報領域の次の単語情報領域の読み部YF
 (DICEND+1)に単語の読みバッファYOM 
Iの内容を格納する。
ステップ12−2において、辞書DICIの格納されて
いる最後の単語情報領域の次の単語情報領域の浅学部K
F (D I CEND+ 1 )に単語の漢字バッフ
ァKANJIの内容を格納する。
ステップ12−3において、辞書DICの格納されてい
る最後の単語情報領域の次の単語情報領域の文法情報部
GF (DICEND+1)に単語の文法情報バッファ
Glの内容を格納する。
ステップ12−4において、辞書DICの格納されてい
る最後の単語情報領域の次の単語情報領域の頻度情報部
HF (DICEND+1)にA8−語の頻度情報バッ
ファHINDOの内容を格納する。
ステップ12−5において、辞書DICに格納されてい
る単語数DICENDを1だけインクリメントする。
以上の説明において、辞書構造としてはA1語長が固定
長の辞書を想定しているが、可変長の単語長で構成した
、より圧縮された辞書構造であっても同様に処理を行な
うことができる。また、辞書に登録されている単語は辞
書の読みによってソートされていなかったが、単語の読
みによってソートされた辞書構造であっても同様に処理
できる。
また、登録単語リストは定められた位置から単語の読み
や表記などが記述するフォーマットであったが、単語の
読みや表記などが識別できるものであれば、どのような
フォーマットを用いてもよい。
また、以上の実施例においては登録単語リストの入力を
キーボードから行なっていたが、フロッピーディスクな
どの外部記憶装置から入力してもよい。
以上の説明からも明らかなように、本発明によれば、複
数の単語を一括して辞書に登録できるために、単語を多
数登録するときに、オペレータの操作の負担が軽減され
、単語を登録する際の操作ミスが減少し、また、登録さ
れた単語の確認が容易である、操作性の優れた文字処理
装置を実現できた。
【図面の簡単な説明】
第1図は本発明の概念を示す図、 第2図は本発明の全体構成のブロック図、第3図は登録
単語リストのフォーマット例を説明した図、 第4図は本発明の文書データの構造の例を示す図、 第5図は本発明の辞書構成の例を示す図、第6図〜第1
2図は本発明文字処理装置の動作を示すフローヂャート

Claims (1)

  1. 【特許請求の範囲】 複数の単語をその読みと表記との対応をとって収容する
    辞書手段と、 前記辞書手段に登録する単語の読みと表記を入力する登
    録単語リスト入力手段と、 前記入力された登録単語リストを記憶する登録単語リス
    ト記憶手段と、 前記登録単語リストに記載されている単語を順次前記辞
    書手段に登録することを指示する一括単語登録指示手段
    と、 前記一括単語登録指示手段に従って、登録単語リストに
    記載されている単語を順次前記辞書手段に登録する一括
    単語登録手段とを有することを特徴とする文字処理装置
JP61041280A 1986-02-26 1986-02-26 文字処理装置 Pending JPS62198957A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61041280A JPS62198957A (ja) 1986-02-26 1986-02-26 文字処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61041280A JPS62198957A (ja) 1986-02-26 1986-02-26 文字処理装置

Publications (1)

Publication Number Publication Date
JPS62198957A true JPS62198957A (ja) 1987-09-02

Family

ID=12604033

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61041280A Pending JPS62198957A (ja) 1986-02-26 1986-02-26 文字処理装置

Country Status (1)

Country Link
JP (1) JPS62198957A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0926961A (ja) * 1996-08-02 1997-01-28 Toshiba Corp 辞書登録方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0926961A (ja) * 1996-08-02 1997-01-28 Toshiba Corp 辞書登録方法

Similar Documents

Publication Publication Date Title
JPS62198957A (ja) 文字処理装置
JPS62198954A (ja) 文字処理装置
JPS6010348B2 (ja) 半角・全角文字の自動変換方式
JPS62198956A (ja) 文字処理装置
JP3382257B2 (ja) 文字処理装置及びその方法
JPS62198953A (ja) 文字処理装置
JPS62198955A (ja) 文字処理装置
JPS62198952A (ja) 文字処理装置
JPS59180625A (ja) 中国漢字入力システム
JPH0697455B2 (ja) 仮名漢字変換装置
JP2744241B2 (ja) 文字処理装置
JP2603269B2 (ja) 文字処理装置
JP2688651B2 (ja) 文字列変換装置
JP2688652B2 (ja) 文字列変換装置
JPH0677252B2 (ja) 和文データ入力処理装置
JPH027161A (ja) 文字処理装置
JPH0410105B2 (ja)
JPH0385670A (ja) 二段階表示方式文書処理装置
JPS63263564A (ja) 文字処理装置
JPH08287060A (ja) 文字処理装置および文字処理方法
JPH0816908B2 (ja) 文字処理装置及び文字処理方法
JPH03116363A (ja) 文字処理装置
JPH0769907B2 (ja) 文字処理装置
JPH0520316A (ja) 文字処理装置
JPS60110074A (ja) 文字処理装置