JPS5856067A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPS5856067A
JPS5856067A JP56154098A JP15409881A JPS5856067A JP S5856067 A JPS5856067 A JP S5856067A JP 56154098 A JP56154098 A JP 56154098A JP 15409881 A JP15409881 A JP 15409881A JP S5856067 A JPS5856067 A JP S5856067A
Authority
JP
Japan
Prior art keywords
word
code
dictionary
codes
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56154098A
Other languages
English (en)
Inventor
Shuji Shimakage
島影 修二
Tomonori Suda
須田 智紀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56154098A priority Critical patent/JPS5856067A/ja
Publication of JPS5856067A publication Critical patent/JPS5856067A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、計算機に接続されてデータ授受を行なう文書
処理装置に関する。
ワードプロセ、すには第1図に示す本うにその本体部W
P、CRTディスプレイDP、キーボードKB。
メモリとしてのフロッピーディスクFP、およびプリン
クPRを備えてこれらKよ)文書作成する、例えばフロ
ッピーFPから所望の書式を画面メモリへ読出してディ
スプレイDPに現示し、キーホードKBt−操作して文
字を入力して該文字をディスプレイの該書式内折定位置
に表示すると共に画面メモリへ書込み、該メモリを読出
してプリンタによシブリントアウトして所望の文書を得
る。ワードプ四セッサにはこのようなローカルな使用態
様の他に通信回線tt−通してホスト計算機CPUと結
び、該CPU0大容量7アイルを利用してla集、翻訳
などを行ない或いは使用が稀な書式、文字情報の提供を
求めるものがある。翻訳などの場合はワードプ四セッサ
側から回線t2通して文書をCPUへ送〕、そこで翻訳
して翻訳済みのものを再び回線tを通してワードグロセ
、サヘ送るということになる。ところで文書は1〜2頁
のものもあるが、10頁、207itあるいけそれ以上
になるものもあシ、情報量は相当に多い。ワードプロセ
すでは文字単位で扱うものが多く、1文字tバイトまた
は2バイトのコードで表わすから、1ワードは平均4〜
6文字からなるとすると1ワード当り4〜6バイト又は
8〜12バイト必要になる。
従って10〜20頁にもなる文書金通信回Ht全通して
伝送するとなると、所要時間は相当に大になる。
またワード(単語)をその各文字のコードの集シで表わ
すと、単語昭tstrtcは辞書を使って語尾変化を調
べる必要があシ、また単語の中からキーワードとすべき
ものを選び出すために品詞分解などが必要になり、処理
に時間がか\る。
本発明はこれらの点に鑑みてなされたもので、単語毎に
コードを割当てることを第1の特徴とする。2バイトの
コードでは65556種を扱えるから1単語には2バイ
トのコードを割当て、他に品詞及び語尾変化用に1パイ
)1−用い、計3バイトで1単語を表わす。これで、通
常使用する単語は充分処理できる。単語とその3バイト
コードとは辞書にしておくが、このコード割当て済み単
語は5000〜1へ000語程度としておき、残)はユ
ーザが登録して使用するのに供する。文字別コードを使
用する方式ではスペースコードを使用してそのスペース
コード間の文字群が単語を表わすとするから、該スペー
スコードの1バイトが余分に必要になる。また1文字1
〜2バイト、1ワード当り4〜6文字として、1ワード
当りのコードピット数は4〜12バイトとなシ、それに
スペースコードが加わるから、本発明方式よシ倍の伝送
量が必要である。換言すれば、本発明では所要伝送量を
半減できる。
CRTディスプレイに文書全表示するには画面バッファ
が必要であるが、この画面バッファは従来と同様に文字
別とし、各文字コードを読出して文字発生器(ca)t
アクセスし、ビデオ信号を出力させてこれをディスプレ
イDPE加える。プロセ、すWPには別に単語コードバ
ッファを設け、5バイト単語コードは該バッファに記憶
させる。
これは、キーボードを操作して文字単位で入力し、1単
語となったとき辞書を索引してコードを求め、該コード
を単語コードバッファに格納して行なう。
コードが用意されていない単語(固有名詞の多くはこれ
に該当しよう)の場合は従来通シ各文字別のコード群と
し、単曙別コードか文字別コードかを示すコード(ヒス
トコード)を付加する。
単語コードを収録する辞書としては磁気ディスクまたは
フロッピーディスクを用いる。配列順は通常の辞書と同
様にアルファベット類とし、この順序で並べられた文字
コード群からなる各単語(こ\ではこれを辞書単語と呼
ぶ)と、それに対する3バイト単語コードがその内容で
ある。文字コード群からなる単語がキーボード操作で入
力され入力単語と呼ぶ)、該入力単語に対するコート°
t(求められるときは、辞書単語と入力単語を比較し、
一致した辞書単語の3バイト単飴コードを取出すという
ことになるが、入力単語全全辞書単語と比較するのは厄
介であるからアドレステーブルを用意する。このアドレ
ステーブルは、単語の第1文字がり、ya’、c・・・
・・・・・・の単語群が収容されている辞書メモリ内記
憶領域の始、終端アドレスをアルファベット類に収録し
ているもので、入力単語のイニシャルが例えばHならア
ドレステーブルよシHの部の始、終端アドレスを求め、
該アドレスの範囲内の辞書単語及びコード群を辞書メモ
リから読出してプロセ、す本体部の主記憶に書込み、該
主記憶を逐次読出してその辞書単語部と入力単語とを比
較し、一致した辞書単語のコードを、求める単語コード
とする。アドレステーブルは更に細分して単語の最初の
複数文字をアルファベット類に配列し、それに該当単語
の辞書メモリ内記憶領域の始終端アドレスを付属させ次
ものとしてもよい。
この場合は入力単語の最初の複数文字を求め、それらを
持つ辞書単語の辞書メモリ内アドレスをアドレステーブ
ルよシ求め、・・・・・・・・・といりた操作になシ、
辞書メモリよシ取出す単@数、入力単語との比較回数が
イニシャルのみの場合よシ小となシ、ジスタ、ATはア
ドレステーブル、FA、、EAはイニシャルA、B、C
・・−・−・・の単語の辞書自記憶領域の始、終端アド
レス、DICは辞書メモリ、DWは辞書単語、DWCは
そのコードである。MSは主記憶で、アドレステーブル
ATで指定された領蛾内の辞書単語DWおよびそのコー
ドDWCがローディングされ、アドレスカウンタACK
より逐次読出され、その読出された辞書単語が比較器C
OMPで入力単語W1と比較される。アドレスカウンタ
ACは比較器COMPが一致出力を生じる迄+1を続け
、一致出力が入ると+1金停止しかつゲートGtl−ア
けてそのとき読出されている辞書単語コードDWCを単
語バッファWBへ送る。なお辞書単語DW、!−しては
原形と共Ki尾変化も併記したものを用いる。従って単
語コードDWCには語尾変化情報も含まれる。また不規
則変化動詞のように原形が変るものは独立した単語のよ
うに扱われて辞書自記憶位置はそのスペリングのアルフ
ァベット順トする。単語コードは原形と同じである。
@3図はキーボード入力から単語コード送出までのハー
ドウェア要部を示す。キーボードKBから入力した文字
コードは画面バッファPHに格納され、文字発生器CG
t−介してディスプレイDPに文字(文書)を表示する
一方、第2図に示した単語コード変換部CTVc加えら
れる。SDはスペース検出器で、文字コード群中のスペ
ースコードを検出して単語を判別し、前述の要領で変換
部CTK単語コード全出力させる。出力された単語コー
ドは単語バッファWBK格°納され、マルチプレクサM
PXおよび通信制御装置CCUi介してホス)CPUへ
送出される。MDは磁気ディスクプ、ホストCPUから
のデータ等を記憶する。
辞書を索引して単語コードを求めるKは、2分探査法な
どの既知の手法を用いてもよ−。
英文(勿論独文、仏文でも同じ)ワードプロセッサでは
辞書を備えてスペリングチェ、り、ハイ7ネーシ、ンチ
ェ、りをしている。この辞書に前記文字コードを併記す
ると特別の辞書を設ける必要がなく、コスト低減などに
有効である。  ゛単語コードによる伝送はワードプロ
セ、すと計算機との間で行なうので、ワードプロセ、す
には逆変換りまシ単語コードから文字コード群への変換
機能も持たせる。これは単純には逆変換用の辞書を設け
、単語コードを辞書メモリのアドレスとしてそのアドレ
スに当該単語の文字コード群を書込んでおけばよく、こ
の場合は伝送されてきた単語コードをデコードして辞書
メモリをアクセスして簡単に対応文字コード群を読出す
ことができる。
順変換用の辞書DIC内の単語コードのアドレステーブ
ルを作成しておけば、該辞書DIC?利用することもで
きる。
以上説明したように本発明では単語を文字別コードでは
なく単語コードでホストCPUヘデータ伝送できるので
、伝送量を大幅に低減でき、CPUなどにおけるファイ
ルのスペースを削減できる。
また単語コードとして原形を示すコードおよび品詞、語
尾変化などを示すコードの2つよシなる屯のを用いるの
で、翻訳などに際し有利である。
【図面の簡単な説明】
第1図は計算機と接続される文書処理装置の概要を示す
ブロック図、第2図および第3図は本発明の実施例を示
すブロック図である。 図面でKBはキーボード、DPはディスプレイ、pBは
m面バッファ、PRはプリンタ、tは通信回線、CPU
は計算機、DICは辞書、CTはコード変換部である。 出願人 富士通株式会社

Claims (1)

    【特許請求の範囲】
  1. キーボード、ディスプレイ、その画面パ、ファおよびプ
    リンタを備え、通信回線を介して肚、算機と接続される
    文書処理装置にお込て、文字コード群で表わされる単語
    とそれに対応する、原形を示すコードおよび品詞、語尾
    変化を示すコードの2種よシなる単語コードを収容した
    辞書を備え、前記キーボードから入力される文字コード
    群で該辞書を索引して単語コードを求め、それを計算機
    へ前記通信回線を介して伝送するようKしてなる仁とを
    特徴とする文書処理装置。
JP56154098A 1981-09-29 1981-09-29 文書処理装置 Pending JPS5856067A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56154098A JPS5856067A (ja) 1981-09-29 1981-09-29 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56154098A JPS5856067A (ja) 1981-09-29 1981-09-29 文書処理装置

Publications (1)

Publication Number Publication Date
JPS5856067A true JPS5856067A (ja) 1983-04-02

Family

ID=15576864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56154098A Pending JPS5856067A (ja) 1981-09-29 1981-09-29 文書処理装置

Country Status (1)

Country Link
JP (1) JPS5856067A (ja)

Similar Documents

Publication Publication Date Title
EP0378848A2 (en) Method for use of morphological information to cross reference keywords used for information retrieval
JPH026252B2 (ja)
JPH0689304A (ja) テキスト処理システムにより使用されるテキストを準備する方法及び装置
US6470334B1 (en) Document retrieval apparatus
JPS5856067A (ja) 文書処理装置
JPS5942347B2 (ja) 電子翻訳機
JPH06301713A (ja) 対訳表示方法及び文書表示装置並びにディジタル複写装置
JPH06149881A (ja) 辞書引き装置及び文書処理装置並びにディジタル複写装置
JP2634926B2 (ja) かな漢字変換装置
JPH0215903B2 (ja)
JPH0159614B2 (ja)
JP2995783B2 (ja) カタカナ語の訳語推定装置
JPH06187371A (ja) 圧縮地名データの格納方法及び読み出し方法
JPH0352102B2 (ja)
JPH0756924A (ja) 対訳装置
JPS6116117B2 (ja)
JPH0140371B2 (ja)
JPS60207948A (ja) カナ漢字変換処理装置
JPS619755A (ja) かな漢字変換方式
JPS61180360A (ja) 文書編集装置
JPH0113579B2 (ja)
JPS5896376A (ja) 日本語入力装置
JPH0721798B2 (ja) 言語処理装置
JPS6275761A (ja) 文字列処理装置
JPS6175471A (ja) 連字学習方式