JPS6273370A - 文書格納・転送方式 - Google Patents

文書格納・転送方式

Info

Publication number
JPS6273370A
JPS6273370A JP60212381A JP21238185A JPS6273370A JP S6273370 A JPS6273370 A JP S6273370A JP 60212381 A JP60212381 A JP 60212381A JP 21238185 A JP21238185 A JP 21238185A JP S6273370 A JPS6273370 A JP S6273370A
Authority
JP
Japan
Prior art keywords
data
document data
dictionary
document
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60212381A
Other languages
English (en)
Inventor
Masamichi Kato
加藤 正道
Tsutomu Kaneko
勉 金子
Hiroyuki Okuda
奥田 弘幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60212381A priority Critical patent/JPS6273370A/ja
Publication of JPS6273370A publication Critical patent/JPS6273370A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Computer And Data Communications (AREA)
  • Document Processing Apparatus (AREA)
  • Communication Control (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、計算機システムに於いて文書データの取扱い
に係り、特に文書データを格納や計算機間でネットワー
ク、バス等を経由して転送するのに好適な、文書格納・
転送方式に関する。
〔発明の背景〕
文書データを作成する際の熟語や文節等を格納した辞書
は1日本語文字特有の仮名漢字変換に用いられており、
文書データそのものを辞書へのインデックスで構成し、
文書データを圧縮したり、ネットワーク、回線で送受信
されるデータ量を削減することを考慮しておらず、特開
昭59−2125に示されるような方式の文書データ構
成方法ではデータ量の削減を実現することができない。
〔発明の目的〕
本発明の目的は、計算機システム(ワープロ等の機器も
含む)に於いて文書用データをフロッピーディスク、ハ
ードディスク、磁気テープ等の二次記憶装置に格納した
り、計算機システム間でネットワーク、バス等を経由し
て転送する時、二次記憶装置上の占有領域を削減したり
、転送データ量を削減する手段を提供することにある。
〔発明の概要〕
文書は、テキスト、図、イメージ、表などのデータ要素
で構成されている0文書中でこれらのデータ要素は、文
書中で複数回参照されることがある。例えば、文書中の
文(テキスト)は、同じ文節、熟語など複数回使用され
るのでそれを辞書として格納しておき2文書中で辞書へ
のインデックスである印と辞書中の対応するテキストへ
のポインタで参照すると二次記憶装置中に格納されるデ
ータ量を少なくすることができる。また、ネットワーク
やバス等を経由して計算機システム間でデータを転送す
る際、辞書を各々の計算機に用意し、辞書のインデック
スを含んだ文書データを送受信すればデータ転送量を減
少させることができる。
本発明では、文書データを文字列やビットパターンで送
受信した従来技術に比べて、高速にデータを転送でき1
回線料2回線の有効利用、高速処理を実現できろ。
〔発明の実施例〕
以下、本発明の実施例を第1図により説明する。
第1図は1本発明を適用する計算機システムの一構成例
でありバス5で結合された半導体メモリ装置1.データ
の比較、演算等を実行・制御する演算処理装置2.コマ
ンド、データ入力を行うキーボード4.結果や入力デー
タの表示を行うディスプレイ装置3.ホストの大型計算
機や他の計算機システムと通信を行うための通信制御装
置89通信網9.プログラムやデータを格納する2次記
憶装置のディスク6とそれを制御するディスク制御装置
7から構成される。
この計算機システムで扱う文書データは、一般には文字
列2図、帳表、グラフ、写真などのイメージデータから
構成されている。ここでは、説明のため文字列を例に用
いて説明する。
第2図の(A)は文書10を示しておりこれを第1図の
計算機システムで第2図の(B)のような文書用データ
11として扱う。この文書用データは、第2図の(C)
の熟語用辞書データ12を参照する形で構成される。辞
書データ12は、辞書の中に登録された熟語18を指定
するインデックス17(ポインタ: abc・・・)か
ら構成されている。例えばインデックスbは、“される
″という熟語を指示している。
第2図(R)の文書データ11は、文字列か、辞書デー
タ参照かを示す制御コード13.15と、14.16で
示すような文字列を示す文字コードや辞書のインデック
スを示すデータが、構成されている。辞書中の熟語が、
何回も参照されたり、熟語が長いと文書用データのデー
タ量を削減することができる。
第3図は複数計算機システムを回線やネットワークで接
続したシステムの構成例を示す図であり、接続された計
算機システム同志は、相互に文書データを送受イdする
第3図(A、)は、大計算算機20と文書データやプロ
グラム等を格納する大容量ディスク23から構成される
システムを回線25により、ワークステーションやパソ
コン21とハードディスクやフロッピーディスク24の
小型計算機システムを接続したもので、一般には、小型
計算機システムは、複数接続される。
一方、第3図(B)は、LAN (ローカル・エリア・
ネットワーク: Local Area Networ
k) 32上に接続されたファイル(データベース)サ
ーバ30とディスク31をワークステーション33゜3
5(各々ローカルファイルとしてディスク34゜35を
装着)で利用したり、ワークステーション同志でデータ
を交信するシステムの構成図である。
これらのシステムに於いて文書データをLANや回線を
経由して計算機システム同志で交信する際、従来は、文
字列から構成されるデータそのものを送信していた。こ
れに対して、本発明の方式では、計算機システ11」;
に同じデータ(あるいは共通データ)を有する辞書をデ
ィスク」二に用意することにより1文字データは、文字
データと辞書へのインデックスを含んだ形で構成し、そ
れを相手側に送る。受信した方では、ナイスプレイやプ
リンクに文書データを表示、印刷する際に文書データを
辞書データと組合せて文字データのみから構成される文
書データに変換する。この方式により、第3図(A)、
(B)のように回線25やLAN32上を送受信するデ
ータ量を削減し、ディスク23.24.31,34,3
6へ格納するデータ量を削減することができる。
文書データを構成するイメージ、図形、グラフ。
帳表なとも同じものや良く使用されろデータを辞書デー
タとして格納しておき、そのインデックスを文字データ
中に制御データと関係づけて入れておくことで同じよう
に扱える。
第4図は、文書入力のとき、ヒ述の文シ)データを作成
する手順を示す流れ図である6文11Fを構成する熟語
や文節単位のデータを40で取り出す。
41は、辞書を探すか判断をして、探す場合には41で
取り出した一区切りの文書データが辞書に登録されてい
るかを42で探す。4;3の判定で。
辞書にないときその文書データの一部を辞1Fに登録す
るか44で判断する。登録する場合は、45で入力され
た文書データの一部を辞書に登録する。
46では、登録された辞書データの印を示す制御コード
とインデックスを文書データ中に出力する。
一方、41の処理で辞書を探さない場合は、処理44に
制御を移し辞書に登録するが判定する。
判定処理44で辞書中にあるときは、処理46に制御を
移し、辞書のインデックスと制御コードを文書データ中
に出力する。
判定処理44で辞書に登録しない場合は、処理47で文
字コードという制御コードとコード列を文書コード中に
出力する。
第5図(A)は5文書データ、同図(11)は一時的辞
書、同図(C)は標準辞書を示すものである。一時的辞
書は1文書データ中の熟語1文節の文字データのうち標
準辞書にないものを(1録したものである。上記一時的
辞書の構造は、熟語9文節の文字データのデータ実体6
2とそれを指示するインデックス61が構成されている
文書データ60は1文字コードの始まりを示す制御コー
ド50.54と文字列コード列51゜55一時的辞書を
示す制御コード52とそのインデックスを示すデータ5
3、標準辞書を示す制御コード56とそのインデックス
を示すデータ57から構成される。文書中の固有の熟語
1文節用の一時的辞書を作成することで、標準辞書に登
録されていなくても文書データを圧縮することができる
第6図は一時的辞書71と文書データ70で構成した、
ネットワーク、回線間を送受信するデータであり、一時
的辞書は、受信側にないので文書データと同時に送信す
る。
〔発明の効果〕
本発明によれば、文書データを文字コードと辞書の登録
場所を示すインデックスと文書データの中でそれらの区
別を示す制御コードで構成する。
ネットワークや回路を通して文書データを送受信する際
、その計算機システムに辞書データを用意することで、
上記圧縮された形で文書データを送信できるので通信時
間2回線コストの削減ができる上に2次メモリに格納す
る際データ量を削減でき、同一ディスク装置でより多く
の情報を格納できる。
【図面の簡単な説明】
第1図は本発明を適用する計算機システムの一構成例、
第2図は本発明の実況対象である文書データ、第3図は
本発明のデータが交信されるシステムの構成例、第4図
は文書データを作成処理する流れ図、第5図は一時的辞
書を使用した文書データの構成図、第6図はネットワー
ク、回線を経由して装置される一時的辞書を使用した文
書データとill’データの構成図である。 10・・・文書、11・・・計算機システムで扱う文書
用データ、13.15・・・文書データ中の文字コード
。 辞書を指示するインデックスの区別を示す制御コード、
14.16・・・文字コード列、辞書のインデックスを
示す、12・・・辞書データであり、17・・・登録さ
れた熟語9文節データを指示するインデックス、18・
・・登録されたデータを各々示す、−1′

Claims (1)

    【特許請求の範囲】
  1. 演算処理装置、プログラムやデータの記憶装置、ディス
    プレイ、キーボード、ディスクや磁気テープの二次記憶
    装置、ラインプリンタより構成されるワードプロセッサ
    や計算機システムに於いて、テキスト、図形、イメージ
    、表などから構成される文書データを二次記憶装置に格
    納したり、上記ワードプロセッサや計算機システムをネ
    ットワークで結合して互に文書データを交信するシステ
    ムにおいて、文書データを熟語、文節、図形、イメージ
    、表などを示す実データとそれらを辞書化してそれを指
    示するインデックスとインデックスが実データかを区別
    する制御用コードで構成して標準文書データ辞書をワー
    ドプロセッサや計算機システムに具備して、文書データ
    交信の際に、その文書データと新らたに追加した辞書デ
    ータのみを送信転送したり、二次メモリに格納すること
    を特徴とする文書格納・転送方式。
JP60212381A 1985-09-27 1985-09-27 文書格納・転送方式 Pending JPS6273370A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60212381A JPS6273370A (ja) 1985-09-27 1985-09-27 文書格納・転送方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60212381A JPS6273370A (ja) 1985-09-27 1985-09-27 文書格納・転送方式

Publications (1)

Publication Number Publication Date
JPS6273370A true JPS6273370A (ja) 1987-04-04

Family

ID=16621629

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60212381A Pending JPS6273370A (ja) 1985-09-27 1985-09-27 文書格納・転送方式

Country Status (1)

Country Link
JP (1) JPS6273370A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0340171A (ja) * 1989-07-07 1991-02-20 Matsushita Electric Ind Co Ltd 文書編集方法およびその装置
JPH07191972A (ja) * 1991-11-20 1995-07-28 Sharp Corp 文章圧縮方法
JPH08227422A (ja) * 1994-12-20 1996-09-03 Tamotsu Tonegawa 文字−図形パターン変換システム及び翻訳システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0340171A (ja) * 1989-07-07 1991-02-20 Matsushita Electric Ind Co Ltd 文書編集方法およびその装置
JPH07191972A (ja) * 1991-11-20 1995-07-28 Sharp Corp 文章圧縮方法
JPH08227422A (ja) * 1994-12-20 1996-09-03 Tamotsu Tonegawa 文字−図形パターン変換システム及び翻訳システム

Similar Documents

Publication Publication Date Title
JPH0531787B2 (ja)
CN111950301A (zh) 一种中译英的英语译文质量分析方法及系统
US5781897A (en) Method and system for performing record searches in a database within a computer peripheral storage device
JPS6273370A (ja) 文書格納・転送方式
CN1290886B (zh) 优化单字节字符处理的方法和系统
JPS62209615A (ja) デ−タベ−ス処理システム
Slonim et al. NDX-100: An electronic filing machine for the office of the future
JPH07271822A (ja) 情報検索装置
Kaufman The IBM information retrieval center-(ITIRC) system techniques and applications
Iwai et al. A document layout system using automatic document architecture extraction
Little et al. Standards for user procedures and data formats in automated information systems and networks
JPH01194063A (ja) 文書ファイル目次作成方式
JPS63201867A (ja) 文書画像自動要約方式
JPH10301940A (ja) 情報処理装置及びその方法
JPH039472A (ja) 原文イメージ保存装置
Miller et al. A general purpose set of statistical programs for smaller computers with an emphasis on data manipulation
JP2692114B2 (ja) 文書変換装置
JPS59123061A (ja) デ−タの変換方式
FI103156B (fi) Menetelmä ja järjestely informaation kääntämiseksi
Aladesulu Improvement of automatic indexing through recognition of semantically equivalent syntactically different phrases
JPH07192001A (ja) 自然言語処理装置
JPH0567146A (ja) データ編集装置
JPH02239368A (ja) 機械翻訳装置
JP3644765B2 (ja) 文書管理方式および文書管理方法
JPH10320394A (ja) 自然言語処理装置