JPH0498359A - 文書変換装置 - Google Patents
文書変換装置Info
- Publication number
- JPH0498359A JPH0498359A JP2212088A JP21208890A JPH0498359A JP H0498359 A JPH0498359 A JP H0498359A JP 2212088 A JP2212088 A JP 2212088A JP 21208890 A JP21208890 A JP 21208890A JP H0498359 A JPH0498359 A JP H0498359A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- data
- attribute data
- document
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims description 19
- 238000013500 data storage Methods 0.000 abstract description 12
- 238000000034 method Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008094 contradictory effect Effects 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、文書作成編集装置において、当該文書データ
の形式を蓄積し、交換に適した形式に変換する文書変換
装置に関する。
の形式を蓄積し、交換に適した形式に変換する文書変換
装置に関する。
文書を作成・編集する装置としては、ワードプロセッサ
、ワークステーション等が知られている。
、ワークステーション等が知られている。
また、作成・編集された文書を前記ワードプロセッサ、
ワークステーション等の間で送信あるいは受信するなど
により文書を共存資源として交換。
ワークステーション等の間で送信あるいは受信するなど
により文書を共存資源として交換。
蓄積するなどの利用形態が広まって来ている。
この場合、文書を表現するデータの量を可能な限り少な
くした方が、文書データの蓄積、交換における効率が上
がることは明らかである。
くした方が、文書データの蓄積、交換における効率が上
がることは明らかである。
この目的のために、特開平1−134661号公報に開
示されるような文書交換装置の技術が提案されている。
示されるような文書交換装置の技術が提案されている。
すなわち、文字1図形を含む文書において、文字情報は
文字コードと文字サイズや字体等の文字属性とから構成
されており、また、図形情報ならば、図形の種類や座標
と線種や線幅等の図形属性とから構成されている。
文字コードと文字サイズや字体等の文字属性とから構成
されており、また、図形情報ならば、図形の種類や座標
と線種や線幅等の図形属性とから構成されている。
たとえば、文字情報の蓄積、交換のだと1従来は、個々
の文字コードに当該文字の文字サイズや字体等の文字属
性を付加していたが、上記公報に記載の文書交換装置に
おいては、2種類の文書交換方式が開示されている。
の文字コードに当該文字の文字サイズや字体等の文字属
性を付加していたが、上記公報に記載の文書交換装置に
おいては、2種類の文書交換方式が開示されている。
第1の方式は、文字属性の別毎に1〜Nの属性番号を付
与し、文字を属性番号と文字コードで表現することによ
り文書を表現するデータの削減を行おうとするものであ
る。
与し、文字を属性番号と文字コードで表現することによ
り文書を表現するデータの削減を行おうとするものであ
る。
また、第2の方式は、文字属性に変化が発生したときに
限り、変化した文字属性情報を付加するものであり、文
字属性に変化が発生しない限り、何ら属性情報を付加し
ないというものである。このため、第1の方式では必ず
1〜Nの属性番号が付加されていたのに対し、より効率
を高めることが可能となる。
限り、変化した文字属性情報を付加するものであり、文
字属性に変化が発生しない限り、何ら属性情報を付加し
ないというものである。このため、第1の方式では必ず
1〜Nの属性番号が付加されていたのに対し、より効率
を高めることが可能となる。
上述の公報に記載の第1の方式にあっては、その属性情
報の組が用いられる発生頻度に拘わらず、属性情報の組
が増加するに従って属性番号を表現するために使用され
るデータ長が増加するという問題点を有する。たとえば
、1バイト(8ビツト)で表現可能な属性番号は256
種類であり、固定的に2バイト使用するならば、655
36種類となるが、先行するバイトデータが16進表示
でFFのとき、直後のバイトも属性番号と見なす可変長
データの場合、すなわち、00.01. ・・・、
FB、 FF0O,FF0I。
報の組が用いられる発生頻度に拘わらず、属性情報の組
が増加するに従って属性番号を表現するために使用され
るデータ長が増加するという問題点を有する。たとえば
、1バイト(8ビツト)で表現可能な属性番号は256
種類であり、固定的に2バイト使用するならば、655
36種類となるが、先行するバイトデータが16進表示
でFFのとき、直後のバイトも属性番号と見なす可変長
データの場合、すなわち、00.01. ・・・、
FB、 FF0O,FF0I。
、 、 ・、FFFE、 FF0OOO,・・の場合に
は、nハイドで255 X n種類が表現可能な最大属
性番号となる。
は、nハイドで255 X n種類が表現可能な最大属
性番号となる。
すなわち、当該文書に唯−度しか出現しない属性情報の
組にも属性番号が利用され、付加される属性番号を表現
するデータ長の増加を招くのみならず、当該文書を表現
するデータを交換1I積する際に、当該データに先行し
て交換、蓄積されるべき属性番号と属性情報の組のデー
タから構成される共通情報の増加を招くことになる。
組にも属性番号が利用され、付加される属性番号を表現
するデータ長の増加を招くのみならず、当該文書を表現
するデータを交換1I積する際に、当該データに先行し
て交換、蓄積されるべき属性番号と属性情報の組のデー
タから構成される共通情報の増加を招くことになる。
また、第2の方式にあっては、付加されるべき属性情報
が頻繁に変化するような場合には、その効果は大幅に減
少する。たとえば、全く属性情報が異なる2種類の属性
が交互に発生する文書においては、付加すべき属性情報
が常に先行する属性と異なるため、その都度属性情報を
1組付加することになり、データ量の減少効果は期待で
きない。
が頻繁に変化するような場合には、その効果は大幅に減
少する。たとえば、全く属性情報が異なる2種類の属性
が交互に発生する文書においては、付加すべき属性情報
が常に先行する属性と異なるため、その都度属性情報を
1組付加することになり、データ量の減少効果は期待で
きない。
そこで木登胡は、これらの第1の方式及び第2の方式の
互いに相反する問題点を解決することを目的とする。
互いに相反する問題点を解決することを目的とする。
木登胡の文書変換装置は、前記目的を達成するため、文
書作成編集装置から文書データとともに送られた文字1
図形等の属性を表す属性データを属性番号及び発生頻度
を付して記憶する記憶手段と、前記文書作成編集装置か
ら新たに送られてくるデータに含まれる属性データが前
記記憶手段に記憶されている属性データの組の中にある
かどうかを判断する手段と、#J言己属性データが前記
J己憶手段に記憶されている組の中にある場合には前記
記憶手段の当該属性データの組の発生頻度に1を加え、
前記属性データが前記記憶手段に記憶されている組の中
にない場合には前記8己憶手段に発生頻度lとして当該
属性データの組を属性番号を付して登録する1次属性デ
ータ変換手段と、属性データを@δ己属性番号に置き換
えて文書データを記憶する中間メモリ手段と、前記1次
属性データ変換手段に記憶された属性データを発生頻度
の高い順に使用可能ブ;最大属性数まで出力する2次属
性データ変換手段と、前記中間メモリ手段に記憶された
文書データを前記2次属性データ変換手段により付与さ
れた属性番号を付して出力するとともに、前記2次属性
データ変換手段で最大属性数に満たない属性データにつ
いては当該属性データを付して文書データを出力する手
段とを備えたことを特徴とする。
書作成編集装置から文書データとともに送られた文字1
図形等の属性を表す属性データを属性番号及び発生頻度
を付して記憶する記憶手段と、前記文書作成編集装置か
ら新たに送られてくるデータに含まれる属性データが前
記記憶手段に記憶されている属性データの組の中にある
かどうかを判断する手段と、#J言己属性データが前記
J己憶手段に記憶されている組の中にある場合には前記
記憶手段の当該属性データの組の発生頻度に1を加え、
前記属性データが前記記憶手段に記憶されている組の中
にない場合には前記8己憶手段に発生頻度lとして当該
属性データの組を属性番号を付して登録する1次属性デ
ータ変換手段と、属性データを@δ己属性番号に置き換
えて文書データを記憶する中間メモリ手段と、前記1次
属性データ変換手段に記憶された属性データを発生頻度
の高い順に使用可能ブ;最大属性数まで出力する2次属
性データ変換手段と、前記中間メモリ手段に記憶された
文書データを前記2次属性データ変換手段により付与さ
れた属性番号を付して出力するとともに、前記2次属性
データ変換手段で最大属性数に満たない属性データにつ
いては当該属性データを付して文書データを出力する手
段とを備えたことを特徴とする。
本発明では、当該文書における属性情報の組の発生頻度
に着目し、発生傾度の高いものは第1の文書交換方式を
採用して属性番号を用いることとし、それ以外のものに
は、第2の文書交換方式を採用して先行する属性情報と
の差分のみを付加するものである。
に着目し、発生傾度の高いものは第1の文書交換方式を
採用して属性番号を用いることとし、それ以外のものに
は、第2の文書交換方式を採用して先行する属性情報と
の差分のみを付加するものである。
本発明による文書変換装置は、第1図に示すように、文
書作成編集装置1から文書データを受は取り、属性デー
タと属性番号の対応とその発生頻度を共通属性データ記
憶部2に記録するとともに、この文書データの属性デー
タを属性番号に書き直して文書中間メモリ4に記憶させ
る1次属性データ変換部3と、文書中間メモリ4にある
文書データ中の属性番号のうち、発生頻度の低いものに
ついては、先行する属性データとの差分の属性情報に置
き換える2次属性データ変換部5と、これらを制御する
制御部6とををする。
書作成編集装置1から文書データを受は取り、属性デー
タと属性番号の対応とその発生頻度を共通属性データ記
憶部2に記録するとともに、この文書データの属性デー
タを属性番号に書き直して文書中間メモリ4に記憶させ
る1次属性データ変換部3と、文書中間メモリ4にある
文書データ中の属性番号のうち、発生頻度の低いものに
ついては、先行する属性データとの差分の属性情報に置
き換える2次属性データ変換部5と、これらを制御する
制御部6とををする。
以下、図面を参照しながら実施例に基づいて本発明の特
徴を具体的に説明する。
徴を具体的に説明する。
第1図のブロック図において、文書データの変換に先立
って、制御部6により、文書中間メモリ4と共通属性デ
ータ記憶部2が初期化されるとともに、変換済み文書デ
ータ内で使用可能な最大属性番号Mが与えられる。
って、制御部6により、文書中間メモリ4と共通属性デ
ータ記憶部2が初期化されるとともに、変換済み文書デ
ータ内で使用可能な最大属性番号Mが与えられる。
1次属性データ変換部3は、制御部6を介して、文書作
成編集装置1から文書データを受は取ると(第2図ステ
ップ100) 、属性データを含んでいないか調べな
がら(同ステップ110)文書中間メモリ4へ転送する
(ステップ120)。このとき、属性データを検知する
と、1次属性データ変換部3は、属性共通データ記憶部
2に登録されている属性データの組を検索しくステップ
130)、既に同一の属性データの紐が登録されていれ
ば、対応する属性番号を文書データ中の当該属性データ
と置き換えて文書中間メモリ4へ送るとともに、共通属
性データ記憶部2内の該属性データの組の発生頻度に1
を加える(ステップ140)。また、もし同一の属性デ
ータの組が登録されていなければ、共通属性データ記憶
部2に当該属性データの組を使用頻度lとして新規登録
する(ステップ150)とともに、文書データ中の属性
データを登録した属性番号と置き換えて文書中間メモリ
4へ送る(ステップ160.170)。
成編集装置1から文書データを受は取ると(第2図ステ
ップ100) 、属性データを含んでいないか調べな
がら(同ステップ110)文書中間メモリ4へ転送する
(ステップ120)。このとき、属性データを検知する
と、1次属性データ変換部3は、属性共通データ記憶部
2に登録されている属性データの組を検索しくステップ
130)、既に同一の属性データの紐が登録されていれ
ば、対応する属性番号を文書データ中の当該属性データ
と置き換えて文書中間メモリ4へ送るとともに、共通属
性データ記憶部2内の該属性データの組の発生頻度に1
を加える(ステップ140)。また、もし同一の属性デ
ータの組が登録されていなければ、共通属性データ記憶
部2に当該属性データの組を使用頻度lとして新規登録
する(ステップ150)とともに、文書データ中の属性
データを登録した属性番号と置き換えて文書中間メモリ
4へ送る(ステップ160.170)。
ここまでの処理で、文書中間メモリ4には、属性データ
が全て番号に置き換えられた文書データがあり、共通属
性データ記憶部2には、それらの属性データの組と属性
番号並びに発生頻度の対応リストができることになる。
が全て番号に置き換えられた文書データがあり、共通属
性データ記憶部2には、それらの属性データの組と属性
番号並びに発生頻度の対応リストができることになる。
このリストの例を第4図に示す。
次に、2次属性データ変換部5により共通属性データ記
憶部2の属性データの組のうち、発生頻度の高いものか
ら順に使用可能な最大属性番号であるM番目の組までは
属性データが共通属性データとして先ず出力され(第3
図ステップ200)、続いて文書中間メモリ4内のデー
タが適当な変換を加えられながら出力されていく。すな
わち、文書中間メモリ4内の文書データを順次、属性番
号を含んでいないか調べながら(同ステップ210)出
力していく (ステップ220)。このとき、属性番号
を検知すると、共通属性データ記憶部2からその属性番
号に対応する属性データの組りとその発生頻度Pを取り
出す(ステップ230)。2次属性データ変換邪5は、
共通属性データ記憶部2を調べ(ステップ240ン、そ
の発生頻度Pが1位からM位であれば、属性番号を発生
頻度順位で置き換えて出力しくステップ250)、M−
1位以下の発生頻度のものに対しては属性番号ではなく
、先行する属性データの組と差のある属性データを出力
する(ステップ260)。このようにして取り出された
属性データの組りを先行属性データの組D′ とする(
ステップ270)。
憶部2の属性データの組のうち、発生頻度の高いものか
ら順に使用可能な最大属性番号であるM番目の組までは
属性データが共通属性データとして先ず出力され(第3
図ステップ200)、続いて文書中間メモリ4内のデー
タが適当な変換を加えられながら出力されていく。すな
わち、文書中間メモリ4内の文書データを順次、属性番
号を含んでいないか調べながら(同ステップ210)出
力していく (ステップ220)。このとき、属性番号
を検知すると、共通属性データ記憶部2からその属性番
号に対応する属性データの組りとその発生頻度Pを取り
出す(ステップ230)。2次属性データ変換邪5は、
共通属性データ記憶部2を調べ(ステップ240ン、そ
の発生頻度Pが1位からM位であれば、属性番号を発生
頻度順位で置き換えて出力しくステップ250)、M−
1位以下の発生頻度のものに対しては属性番号ではなく
、先行する属性データの組と差のある属性データを出力
する(ステップ260)。このようにして取り出された
属性データの組りを先行属性データの組D′ とする(
ステップ270)。
例えば、文字情報において、その属性データが文字のサ
イズとフォント種類からなる場合を考える。もし、ある
時点での先行属性データの組D′が15ポイント明朝体
で、取り出された属性データの組りが15ポイントゴシ
ック体であったとすると、差異のある属性データである
フォント種類つまりゴシック体だけを出力し、先行属性
データの組D′を15ポイントゴシック体に変更するこ
ととなる。
イズとフォント種類からなる場合を考える。もし、ある
時点での先行属性データの組D′が15ポイント明朝体
で、取り出された属性データの組りが15ポイントゴシ
ック体であったとすると、差異のある属性データである
フォント種類つまりゴシック体だけを出力し、先行属性
データの組D′を15ポイントゴシック体に変更するこ
ととなる。
以上に述べたように、本発明によれば、当該文書におけ
る属性情報の紐の発生頻度に着目し、発生頻度の高いも
のは属性番号を用いることとし、それ以外のものには、
先行する属性情報との差分のみを付加することにより、
属性情報の変化の状態に関わらず、属性情報を表すため
のデータ量を減らすことができる。
る属性情報の紐の発生頻度に着目し、発生頻度の高いも
のは属性番号を用いることとし、それ以外のものには、
先行する属性情報との差分のみを付加することにより、
属性情報の変化の状態に関わらず、属性情報を表すため
のデータ量を減らすことができる。
第1図は本発明による文書変換装置の構成図、gJ2図
は1次属性データ変換部における前変換の手順を示す流
れ図、第3図は2次属性データ変換部における変換の手
順を示す流れ図、第4図は共通属性データ記憶部に作成
される属性データの組と属性番号および発生頻度の対応
リスト例を示す図である。 1:文書作成編集データ 2:共通属性データ記憶部 3:1次属性データ変換部 4:文書中間メモリ 5:2次属性データ変換部 6:制御部
は1次属性データ変換部における前変換の手順を示す流
れ図、第3図は2次属性データ変換部における変換の手
順を示す流れ図、第4図は共通属性データ記憶部に作成
される属性データの組と属性番号および発生頻度の対応
リスト例を示す図である。 1:文書作成編集データ 2:共通属性データ記憶部 3:1次属性データ変換部 4:文書中間メモリ 5:2次属性データ変換部 6:制御部
Claims (1)
- 【特許請求の範囲】 1、文書作成編集装置から文書データとともに送られた
文字、図形等の属性を表す属性データを属性番号及び発
生頻度を付して記憶する記憶手段と、 前記文書作成編集装置から新たに送られてくるデータに
含まれる属性データが前記記憶手段に記憶されている属
性データの組の中にあるかどうかを判断する手段と、 前記属性データが前記記憶手段に記憶されている組の中
にある場合には前記記憶手段の当該属性データの組の発
生頻度に1を加え、前記属性データが前記記憶手段に記
憶されている組の中にない場合には前記記憶手段に発生
頻度1として当該属性データの組を属性番号を付して登
録する1次属性データ変換手段と、 属性データを前記属性番号に置き換えて文書データを記
憶する中間メモリ手段と、 前記1次属性データ変換手段に記憶された属性データを
発生頻度の高い順に使用可能な最大属性数まで出力する
2次属性データ変換手段と、前記中間メモリ手段に記憶
された文書データを前記2次属性データ変換手段により
付与された属性番号を付して出力するとともに、前記2
次属性データ変換手段で最大属性数に満たない属性デー
タについては当該属性データを付して文書データを出力
する手段と を備えた文書変換装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2212088A JPH0498359A (ja) | 1990-08-10 | 1990-08-10 | 文書変換装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2212088A JPH0498359A (ja) | 1990-08-10 | 1990-08-10 | 文書変換装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0498359A true JPH0498359A (ja) | 1992-03-31 |
Family
ID=16616679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2212088A Pending JPH0498359A (ja) | 1990-08-10 | 1990-08-10 | 文書変換装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0498359A (ja) |
-
1990
- 1990-08-10 JP JP2212088A patent/JPH0498359A/ja active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5442350A (en) | Method and means providing static dictionary structures for compressing character data and expanding compressed data | |
JP2006209745A (ja) | 文書のバイナリシリアライゼーションの方法およびシステム | |
KR0147355B1 (ko) | 그래픽 영상 데이타 압축 방법 | |
EP0237745A2 (en) | Coding of acyclic list data structures for information retrieval | |
JP2968112B2 (ja) | 符号変換方法 | |
JP2006216024A (ja) | 交換フォーマットメッセージの効率的な変換 | |
CN105793842B (zh) | 序列化消息之间的转换方法和装置 | |
JPH0498359A (ja) | 文書変換装置 | |
US20090083267A1 (en) | Method and System for Compressing Data | |
JP3725443B2 (ja) | Unicodeテキストを混合コードページに変換する方法およびシステム | |
US6118391A (en) | Compression into arbitrary character sets | |
JP2008108266A (ja) | 2レベル形態規則をコンパイルするための方法及びその装置 | |
US6373409B1 (en) | Method and computer program product for implementing text conversion table compression | |
JPH05216799A (ja) | 名前管理方式 | |
JPH0420095A (ja) | データ変換方式 | |
JP2672497B2 (ja) | データ処理装置 | |
JPH1091557A (ja) | 可変長メッセージファイル構造と処理方法及びシステム | |
JPH11296510A (ja) | データ変換装置 | |
JPS6250924A (ja) | メモリダンプ用16進変換方式 | |
JPH03144735A (ja) | インタプリタの言語処理方式 | |
JPH09114720A (ja) | クライアント・サ−バシステムにおけるファイル名称変換方法 | |
JPH038062A (ja) | 文書変換装置 | |
JPH01274271A (ja) | 漢字コード変換方式 | |
JPH0796639A (ja) | プリンタ装置 | |
JPH07160512A (ja) | コンパイル方式 |