JPS5856067A

JPS5856067A - 文書処理装置

Info

Publication number: JPS5856067A
Application number: JP56154098A
Authority: JP
Inventors: Shuji Shimakage; 島影　修二; Tomonori Suda; 須田　智紀
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1981-09-29
Filing date: 1981-09-29
Publication date: 1983-04-02

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は、計算機に接続されてデータ授受を行なう文書
処理装置に関する。

ワードプロセ、すには第１図に示す本うにその本体部Ｗ
Ｐ、ＣＲＴディスプレイＤＰ、キーボードＫＢ。

メモリとしてのフロッピーディスクＦＰ、およびプリン
クＰＲを備えてこれらＫよ）文書作成する、例えばフロ
ッピーＦＰから所望の書式を画面メモリへ読出してディ
スプレイＤＰに現示し、キーホードＫＢｔ−操作して文
字を入力して該文字をディスプレイの該書式内折定位置
に表示すると共に画面メモリへ書込み、該メモリを読出
してプリンタによシブリントアウトして所望の文書を得
る。ワードプ四セッサにはこのようなローカルな使用態
様の他に通信回線ｔｔ−通してホスト計算機ＣＰＵと結
び、該ＣＰＵ０大容量７アイルを利用してｌａ集、翻訳
などを行ない或いは使用が稀な書式、文字情報の提供を
求めるものがある。翻訳などの場合はワードプ四セッサ
側から回線ｔ２通して文書をＣＰＵへ送〕、そこで翻訳
して翻訳済みのものを再び回線ｔを通してワードグロセ
、サヘ送るということになる。ところで文書は１〜２頁
のものもあるが、１０頁、２０７ｉｔあるいけそれ以上
になるものもあシ、情報量は相当に多い。ワードプロセ
。

すでは文字単位で扱うものが多く、１文字ｔバイトまた
は２バイトのコードで表わすから、１ワードは平均４〜
６文字からなるとすると１ワード当り４〜６バイト又は
８〜１２バイト必要になる。

従って１０〜２０頁にもなる文書金通信回Ｈｔ全通して
伝送するとなると、所要時間は相当に大になる。

またワード（単語）をその各文字のコードの集シで表わ
すと、単語昭ｔｓｔｒｔｃは辞書を使って語尾変化を調
べる必要があシ、また単語の中からキーワードとすべき
ものを選び出すために品詞分解などが必要になり、処理
に時間がか＼る。

本発明はこれらの点に鑑みてなされたもので、単語毎に
コードを割当てることを第１の特徴とする。２バイトの
コードでは６５５５６種を扱えるから１単語には２バイ
トのコードを割当て、他に品詞及び語尾変化用に１パイ
）１−用い、計３バイトで１単語を表わす。これで、通
常使用する単語は充分処理できる。単語とその３バイト
コードとは辞書にしておくが、このコード割当て済み単
語は５０００〜１へ０００語程度としておき、残）はユ
ーザが登録して使用するのに供する。文字別コードを使
用する方式ではスペースコードを使用してそのスペース
コード間の文字群が単語を表わすとするから、該スペー
スコードの１バイトが余分に必要になる。また１文字１
〜２バイト、１ワード当り４〜６文字として、１ワード
当りのコードピット数は４〜１２バイトとなシ、それに
スペースコードが加わるから、本発明方式よシ倍の伝送
量が必要である。換言すれば、本発明では所要伝送量を
半減できる。

ＣＲＴディスプレイに文書全表示するには画面バッファ
が必要であるが、この画面バッファは従来と同様に文字
別とし、各文字コードを読出して文字発生器（ｃａ）ｔ
アクセスし、ビデオ信号を出力させてこれをディスプレ
イＤＰＥ加える。プロセ、すＷＰには別に単語コードバ
ッファを設け、５バイト単語コードは該バッファに記憶
させる。

これは、キーボードを操作して文字単位で入力し、１単
語となったとき辞書を索引してコードを求め、該コード
を単語コードバッファに格納して行なう。

コードが用意されていない単語（固有名詞の多くはこれ
に該当しよう）の場合は従来通シ各文字別のコード群と
し、単曙別コードか文字別コードかを示すコード（ヒス
トコード）を付加する。

単語コードを収録する辞書としては磁気ディスクまたは
フロッピーディスクを用いる。配列順は通常の辞書と同
様にアルファベット類とし、この順序で並べられた文字
コード群からなる各単語（こ＼ではこれを辞書単語と呼
ぶ）と、それに対する３バイト単語コードがその内容で
ある。文字コード群からなる単語がキーボード操作で入
力され入力単語と呼ぶ）、該入力単語に対するコート°
ｔ（求められるときは、辞書単語と入力単語を比較し、
一致した辞書単語の３バイト単飴コードを取出すという
ことになるが、入力単語全全辞書単語と比較するのは厄
介であるからアドレステーブルを用意する。このアドレ
ステーブルは、単語の第１文字がり、ｙａ’、ｃ・・・
・・・・・・の単語群が収容されている辞書メモリ内記
憶領域の始、終端アドレスをアルファベット類に収録し
ているもので、入力単語のイニシャルが例えばＨならア
ドレステーブルよシＨの部の始、終端アドレスを求め、
該アドレスの範囲内の辞書単語及びコード群を辞書メモ
リから読出してプロセ、す本体部の主記憶に書込み、該
主記憶を逐次読出してその辞書単語部と入力単語とを比
較し、一致した辞書単語のコードを、求める単語コード
とする。アドレステーブルは更に細分して単語の最初の
複数文字をアルファベット類に配列し、それに該当単語
の辞書メモリ内記憶領域の始終端アドレスを付属させ次
ものとしてもよい。

この場合は入力単語の最初の複数文字を求め、それらを
持つ辞書単語の辞書メモリ内アドレスをアドレステーブ
ルよシ求め、・・・・・・・・・といりた操作になシ、
辞書メモリよシ取出す単＠数、入力単語との比較回数が
イニシャルのみの場合よシ小となシ、ジスタ、ＡＴはア
ドレステーブル、ＦＡ、、ＥＡはイニシャルＡ、Ｂ、Ｃ
・・−・−・・の単語の辞書自記憶領域の始、終端アド
レス、ＤＩＣは辞書メモリ、ＤＷは辞書単語、ＤＷＣは
そのコードである。ＭＳは主記憶で、アドレステーブル
ＡＴで指定された領蛾内の辞書単語ＤＷおよびそのコー
ドＤＷＣがローディングされ、アドレスカウンタＡＣＫ
より逐次読出され、その読出された辞書単語が比較器Ｃ
ＯＭＰで入力単語Ｗ１と比較される。アドレスカウンタ
ＡＣは比較器ＣＯＭＰが一致出力を生じる迄＋１を続け
、一致出力が入ると＋１金停止しかつゲートＧｔｌ−ア
けてそのとき読出されている辞書単語コードＤＷＣを単
語バッファＷＢへ送る。なお辞書単語ＤＷ、！−しては
原形と共Ｋｉ尾変化も併記したものを用いる。従って単
語コードＤＷＣには語尾変化情報も含まれる。また不規
則変化動詞のように原形が変るものは独立した単語のよ
うに扱われて辞書自記憶位置はそのスペリングのアルフ
ァベット順トする。単語コードは原形と同じである。

＠３図はキーボード入力から単語コード送出までのハー
ドウェア要部を示す。キーボードＫＢから入力した文字
コードは画面バッファＰＨに格納され、文字発生器ＣＧ
ｔ−介してディスプレイＤＰに文字（文書）を表示する
一方、第２図に示した単語コード変換部ＣＴＶｃ加えら
れる。ＳＤはスペース検出器で、文字コード群中のスペ
ースコードを検出して単語を判別し、前述の要領で変換
部ＣＴＫ単語コード全出力させる。出力された単語コー
ドは単語バッファＷＢＫ格°納され、マルチプレクサＭ
ＰＸおよび通信制御装置ＣＣＵｉ介してホス）ＣＰＵへ
送出される。ＭＤは磁気ディスクプ、ホストＣＰＵから
のデータ等を記憶する。

辞書を索引して単語コードを求めるＫは、２分探査法な
どの既知の手法を用いてもよ−。

英文（勿論独文、仏文でも同じ）ワードプロセッサでは
辞書を備えてスペリングチェ、り、ハイ７ネーシ、ンチ
ェ、りをしている。この辞書に前記文字コードを併記す
ると特別の辞書を設ける必要がなく、コスト低減などに
有効である。　　゛単語コードによる伝送はワードプロ
セ、すと計算機との間で行なうので、ワードプロセ、す
には逆変換りまシ単語コードから文字コード群への変換
機能も持たせる。これは単純には逆変換用の辞書を設け
、単語コードを辞書メモリのアドレスとしてそのアドレ
スに当該単語の文字コード群を書込んでおけばよく、こ
の場合は伝送されてきた単語コードをデコードして辞書
メモリをアクセスして簡単に対応文字コード群を読出す
ことができる。

順変換用の辞書ＤＩＣ内の単語コードのアドレステーブ
ルを作成しておけば、該辞書ＤＩＣ？利用することもで
きる。

以上説明したように本発明では単語を文字別コードでは
なく単語コードでホストＣＰＵヘデータ伝送できるので
、伝送量を大幅に低減でき、ＣＰＵなどにおけるファイ
ルのスペースを削減できる。

また単語コードとして原形を示すコードおよび品詞、語
尾変化などを示すコードの２つよシなる屯のを用いるの
で、翻訳などに際し有利である。

【図面の簡単な説明】

第１図は計算機と接続される文書処理装置の概要を示す
ブロック図、第２図および第３図は本発明の実施例を示
すブロック図である。図面でＫＢはキーボード、ＤＰはディスプレイ、ｐＢは
ｍ面バッファ、ＰＲはプリンタ、ｔは通信回線、ＣＰＵ
は計算機、ＤＩＣは辞書、ＣＴはコード変換部である。出願人　富士通株式会社

Claims

【特許請求の範囲】

キーボード、ディスプレイ、その画面パ、ファおよびプ
リンタを備え、通信回線を介して肚、算機と接続される
文書処理装置にお込て、文字コード群で表わされる単語
とそれに対応する、原形を示すコードおよび品詞、語尾
変化を示すコードの２種よシなる単語コードを収容した
辞書を備え、前記キーボードから入力される文字コード
群で該辞書を索引して単語コードを求め、それを計算機
へ前記通信回線を介して伝送するようＫしてなる仁とを
特徴とする文書処理装置。