JP2840355B2 - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JP2840355B2
JP2840355B2 JP2019724A JP1972490A JP2840355B2 JP 2840355 B2 JP2840355 B2 JP 2840355B2 JP 2019724 A JP2019724 A JP 2019724A JP 1972490 A JP1972490 A JP 1972490A JP 2840355 B2 JP2840355 B2 JP 2840355B2
Authority
JP
Japan
Prior art keywords
data
text
graphic
image data
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2019724A
Other languages
English (en)
Other versions
JPH03224056A (ja
Inventor
秀夫 池野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019724A priority Critical patent/JP2840355B2/ja
Publication of JPH03224056A publication Critical patent/JPH03224056A/ja
Application granted granted Critical
Publication of JP2840355B2 publication Critical patent/JP2840355B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明はテキストデータと図形・イメージデータをオ
ーバーラツプした文書を表示愛編集することのできる文
書処理装置に関するものである。
〔従来の技術〕 従来、文字と制御コードから成るテキストデータと図
形・イメージデータとをオーバーラツプさせた文書をテ
キストデータと図形・イメージデータとを分割した文書
に変換し、表示・編集する装置においては、処理するた
めのデータが図形・イメージデータを含むページはテキ
ストデータも含めて全て2値化されていた。
〔発明が解決しようとしている課題〕
しかしながら、上記従来例では図形・イメージが含ま
れるページのテキストデータはコード情報から2値情報
に変換されてしまうため、変換後はテキストデータをコ
ード情報として編集できず、大変不便であった。
[課題を解決するための手段] 本発明によれば、文字と制御コードから成るテキスト
データと図形及び/またはイメージデータとを含む文書
から図形及び/またはイメージデータを前記テキストデ
ータと分割して表示すべく、文書変換を行う変換手段、
前記変換後のテキストデータはコード情報、図形及び/
またはイメージデータは2値化した情報により保持する
保持手段を有することを特徴とする文書処理装置を提供
する。
〔実施例〕
<構成概略の説明> 第1図に本実施例における文書処理装置のシステム構
成を示す。
図中1はシステム全体を制御するCPUである。2はメ
モリであってCPU1の制御処理に係るプログラムを格納し
ているプログラムエリア2aと各種処理におけるワークエ
リア2bとで構成されている。尚、このプログラムエリア
2aには各種処理に係るプログラムも格納されている。3
はフロツピーデイスク、4はハードデイクスであって、
フロツピーデイスク3は主として個人用、又は共通なデ
ータのバツクアツプに使用し、ハードデイスク装置は共
通なデータを処理するときに使用する。5はフロツピー
デイスク3及びハードデイスク4を制御して、データの
授受を行うFD/HDコントローラである。また、6は像を
形成するプリンタ、7は原稿画像を読み取るスキヤナで
ある。そして、8はS/Pインタフエースであって、これ
らプリンタ6への印刷データの出力及びスキヤナ7から
の画像の入力は、ここを介して行われる。9は汎用のイ
ンタフエースであるSCSIインタフエースである。10は各
種文字や指示情報を入力するためのキーボードであっ
て、ポインテイングバイス11が接続されている。そし
て、入力されたキー情報やポインテイングバイス11から
の移動情報は合せて、シリアルデータとして出力する。
12はこのシリアルデータを入力し、対応するパラレルデ
ータに変換するシリアルインタフエースである。13はイ
メージデータの転送、或いは回転等ビツト制御を行うビ
ツトムーブユニツト(BMU)、14は文字記号コードに対
応したパターンを記憶している文字フオント記憶部、15
は表示画像をイメージデータとして展開するVRAM、16は
VRAM15に展開されたイメージデータを可視化して表示す
るCRT、そして17はイメージ画像の圧縮、或いは圧縮さ
れたデータを伸張する圧縮部である。
尚、これらの各種構成要素はバス(アドレスバス、デ
ータバス及びコントロールバスを含む)100を介して電
気的に接続されている。
<文書データの形式> 本実施例で説明する文書データの変換は、テキストデ
ータと図形・イメージデータをオーバーラツプさせて表
示・編集できる第1図の装置上の文書データを、テキス
トデータと図形・イメージデータとを分割して表示・編
集できる装置の文書データとして利用するためにフロツ
ピーデイスクに保存する過程で行われるものである。
第2図に上記2つの装置上の文書データの形式を示
す。
図中23は、第1図の装置上の文書データである。これ
は、文字コードと文字制御コードとから成るテキストレ
イヤー20と、図形(図形として付加された文字も含む)
データから成る図形レイヤー21と、イメージデータから
成るイメージレイヤー22とをオーバーラツプさせたもの
である。
次に24は、変換によって得られる文書データである。
これは2値化されたデータの部分A1、A2とテキストデー
タの部分B1、B2が行単位で区切られ連結されたもので、
オーバーラウプしている部分はない。
<文書データの交換方法> 第3図に変換処理のフローチヤートを示し、第4図を
参照して説明する。
まず、S1で第1図の装置上の文書データの図形レイヤ
ーまたはイメージレイヤーから一番最初に出現する図形
またはイメージE1の最上部の縦方向の座標Z1と、E1の縦
方向の大きさL1を求め、Z1が含まれるテキストレイヤー
上の行K1を得る。S2でテキストレイヤーの最初からK1の
直前の行までを出力する。S3で出力したテキストレイヤ
ーの後、ページの終わりまでの余白の大きさN1を求め
る。S4で余白の大きさN1と図形の大きさL1を比べる。N1
≧L1の時、即ち、図形が現在のページに収まる時にはS5
で図形を2値化して出力する。N1<L1の時は、S6で出力
先のページを次のテキストデータを出力することによっ
て埋め、S7で次のページの先頭に図形データE1を2値化
して出力する。S8で図形またはイメージがあるかないか
判断し、図形またはイメージがない時はS9で残りのテキ
ストデータを出力して処理を終了する。図形またはイメ
ージが見つかった時にはS1に戻り、出現する図形・イメ
ージE2の位置Z2と大きさL2を検出し、Z2に対応するテキ
ストデータの行K2までを出力する。そして、S8までの処
理を繰り返す。
このような変換を行なっても、テキストデータはコー
ド情報、図形・イメージデータは2値情報のまま保持さ
れているため、テキストの編集はコード情報で行なわれ
る。
次に、上記の処理において、どのようなものを1図形
と認識するかという事に関して第5図を参照して説明す
る。ただし、第5図では、説明の便宜上、イメージレイ
ヤーを除いて、テキストレイヤーと図形レイヤーの2枚
のレイヤーだけを示してある。
まず、図形レイヤー上で最初に出現する図形M1の最上
部の点の縦方向の座標P1を求める。次に図形M1の最下部
の点の縦方向の座標P2を求め、P2がテキストレイヤー上
の行G4に含まれていることを得る。次に図形レイヤー上
で出現する図形M2の最上部の点の縦方向の座標P3を求
め、P3がテキストレイヤー上の行G6に含まれていること
を得る。そして図形M1とM2の間にはテキストレイヤー上
の行G5が1行存在することを得る。このように1つの図
形と次に出現する図形との間に、テキストレイヤー上の
行が1行以上存在する時には、比較した2つの図形のう
ち先に出現した図形を、独立した1つの図形と認識す
る。よって、図形M1は独立した1つの図形であると認識
される。
次は、図形レイヤー上の図形M2の最下部の点の縦方向
の座標P4を求め、P4がテキストレイヤー上の行G8に含ま
れていることを得る。次に図形レイヤー上で次に出現す
る図形M3の最上部の点の縦方向の座標P5を求め、P5がテ
キストレイヤー上の行G9に含まれていることを得る。そ
して図形M2とM3の間にはテキストレイヤー上に行が存在
しないことを得る。このように1つの図形と次に出現す
る図形との間にテキストレイヤー上の行が1行以上存在
しない時には、比較した2つの図形は連続した1つの図
形データと認識する。よって図形M2とM3は、まとめて1
つの図形であると認識する。
次に図形の強制的な分割方法について、図面レイヤー
上の図形M4とM5に基づいて説明する。図形M4の最下部の
点の縦方向の座標P8は、テキストレイヤー上の行G16に
含まれている。また図形レイヤー上の図形M4の次に出現
する図形M5の最上部の点の縦方向の座標P9はテキストレ
イヤー上の行G17に含まれている。ここで、図形M4とM5
の間にはテキストレイヤー上に行が存在しないのて、本
来ならばM4とM5はまとめて1つの図形として認識され
る。しかし、この場合、図形M4の最下部の点の縦方向の
座標P8が含まれるテキストレイヤー上の行G16に前もっ
て特に定めた分割記号“#”が存在する。このように比
較した2つの図形のうち先に出現した図形の最下部の点
の縦方向の座標が含まれるテキストレイヤー上の行、ま
たは、後の図形の最上部の点の縦方向の座標が含まれる
テキストレイヤー上の行に分割記号がある場合は、2つ
の図形の間にテキストレイヤー上の行が存在しなくて
も、その2つの図形はそれぞれ独立した図形であると認
識される。よって、図形M4とM5は、それぞれ独立した図
形であると認識される。
また。第3図のS6と2回目の通過以後のS2において
は、不用な空白行を削除している。この処理を第5図を
参照して以下に説明する。なお、空白行とはテキストレ
イヤー上で改行コードのみの行のことをいう。
まず、図中のテキストレイヤー上で不用と認識される
空白行は行G3、G14、G15、G17である。これらの行は、
対応する図形レイヤー上に図形を含む行である。例えば
行G3には図M1、行G14とG15には図M4、行G17には図M5を
含んでいる。
また、対応する図形レイヤー上に図形を含む行に、強
制的に見かけ上の空白行を作りたい時には、図中のテキ
ストレイヤー上の行G7のように、スペースを入れること
によって、空白行と認識されないようにする。
なお、空白行ではないが、図中のテキストレイヤーの
行G16のように、分割記号の行は不用と認識される。
〔他の実施例〕 前記実施例では、テキストデータと図形・イメージデ
ータが行単位の領域で分割して表わされている文書デー
タに直接変換したが、変換を以下のように2段階に分け
ることもできる。
まず、第6図のように、変換前のデータの形式でテキ
スト・図形・イメージデータを位置だけずらして中間フ
アイルを作る。第6図において40〜42は変換前の文書デ
ータの各レイヤー、43〜45は中間フアイルの各レイヤー
である。なお、この中間フアイルの出力は、変換後のデ
ータの出力と同じになる。これによって変換結果を第1
図の装置におけるCRT16上で確認でき、なおかつ編集も
できる。
前記実施例では、図形・イメージデータと重っている
部分のテキストデータを全て、その図形・イメージの後
に移動する方法だったが、他に、図形・イメージデータ
と重っている部分のテキストデータを全て、その図形・
イメージの前に移動する方法、また、図形・イメージデ
ータと重っている部分のテキストデータの文脈を解釈し
て、その図形・イメージの前後に適当に振り分ける方法
がある。
また、切り出した図形・インジデータは第7図のよう
に全てのテキストデータの後に1図形1ページで移動す
ることもできる。第7図の30はテキスト、図形・イメー
ジの各レイヤーが重った変換後の文書データ、31〜33は
変換後の文書データの1〜3ページであり、31はコード
情報、32と33は2値化情報よりなるページである。この
変換処理のフローチヤートを第8図に示す。
まず、S30でテキストレイヤーのデータを全て出力す
る。この時、実施例1と同様に不用な空白行の削除を行
う。S31でテキストレイヤー上のデータの終わりを判断
する。次に図形レイヤーとイメージレイヤー上のデータ
を1ページ1図形または1イメージとしてデータの終わ
りまで2値化して出力する。S33で図形データの終わり
を判断する。また、1図形の判断方法は実施例と同様で
ある。さらに、図形またはイメージの出力においては、
出力先のページ内でセンタリングをすることもできる。
以上説明したように、文字と制御コードから成るテキ
ストデータと図形及び/またはイメージデータとを含む
文書から図形及び/またはイメージデータを前記テキス
トデータと分割して表示すべく、文書変換を行う変換手
段、前記変換後のテキストデータはコード情報、図形及
び/またはイメージデータは2値化した情報により保持
する保持手段を有することにより、変換後のテキストデ
ータをコード情報として編集でき、処理が簡単になると
いう効果がある。
また、前記変換手段は図形及び/またはイメージの大
きさとページの余白を比較することにより、図形及び/
またはイメージがページの境界にまたがらないという効
果がある。
また、前記重ね合わせ文書データにおける図形及び/
またはイメージデータとテキストデータの位置を検出
し、該位置関係に対応させて変換させることにより、テ
キストデータと図形及び/またはイメージデータの位置
関係を重ね合わせた時と分割した時で変化しないように
する効果がある。
また、前記変換手段はテキストデータ中の不用な空白
行を判断し、削除することにより、テキストと図形・イ
メージデータの位置関係を適したものとする効果があ
る。
[発明の効果] 以上、詳述した様に本発明により、文字を表わすテキ
ストデータた図形及び/またはイメージデータとを1頁
を表わすデータ空なる文書について、前記図形及び/ま
たはイメージデータと前記テキストデータとを識別する
識別手段と、前記識別手段によって識別された前記図形
及び/またはイメージデータの位置を判別する判別手段
と、前記判別手段によって判別により前記図形及び/ま
たはイメージデータと前記テキストデータとが重なる場
合に、その重なりを解除する解除手段と、前記識別手段
によって識別された前記図形及び/またはイメージデー
タを2値化する2値化手段と、前記2値化手段によって
2値化された前記図形及び/またはイメージデータと前
記テキストデータを1頁上の位置の重なの無い状態で保
持する保持手段と有した文書処理装置を提供することが
可能となった。
【図面の簡単な説明】
第1図は本発明の装置の構成図、 第2図は本発明の変換前後のデータ形式を示す図、 第3図は実施例のフローチヤート、 第4図は実施例の変換前後のデータ形式を示す図、 第5図は実施例の説明を補促する説明図、 第6図は他の実施例の特徴を示す図、 第7図は他の実施例の変換前後のデータ形式を示す
図、 第8図は他の実施例のフローチヤートである。 1はCPU、2はメモリ、3はフロツピーデイスク、4は
ハードデイスク、5はFD/HDコントローラ、6はプリン
タ、7はスキヤナ、8はS/Pインタフエース、9は汎用
のSCSIインタフエース、10はキーボード、11はマウス、
12はシリアルインタフエース、13はビツトムーブユニツ
ト、14は文字フオント記憶部、15はVRAM、16はCRTであ
る。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】文字を表わすテキストデータと図形及び/
    またはイメージデータとを1頁を表わすデータとして有
    している文書について、前記図形及び/またはイメージ
    データと前記テキストデータとを識別する識別手段と、 前記識別手段によって識別された前記図形及び/または
    イメージデータの位置を判別する判別手段と、 前記判別手段によって判別により前記図形及び/または
    イメージデータと前記テキストデータとが重なる場合
    に、その重なりを解除する解除手段と、 前記識別手段によって識別された前記図形及び/または
    イメージデータを2値化する2値化手段と、 前記2値化手段によって2値化された前記図形及び/ま
    たはイメージデータと前記テキストデータを1頁上の位
    置の重なりの無い状態で保持する保持手段と有すること
    を特徴とする文書処理装置。
  2. 【請求項2】前記判別手段は、前記図形及び/またはイ
    メージデータの大きさとページの余白を比較することに
    より、1つの前記図形及び/またイメージデータページ
    の境界にまたがらない様に制御することを特徴とする請
    求項1に記載の文書処理装置。
  3. 【請求項3】前記判別手段は、テキストデータ中の不用
    な空白行を判断し、削除することを特徴とする請求項1
    に記載の文書処理装置。
JP2019724A 1990-01-30 1990-01-30 文書処理装置 Expired - Fee Related JP2840355B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019724A JP2840355B2 (ja) 1990-01-30 1990-01-30 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019724A JP2840355B2 (ja) 1990-01-30 1990-01-30 文書処理装置

Publications (2)

Publication Number Publication Date
JPH03224056A JPH03224056A (ja) 1991-10-03
JP2840355B2 true JP2840355B2 (ja) 1998-12-24

Family

ID=12007257

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019724A Expired - Fee Related JP2840355B2 (ja) 1990-01-30 1990-01-30 文書処理装置

Country Status (1)

Country Link
JP (1) JP2840355B2 (ja)

Also Published As

Publication number Publication date
JPH03224056A (ja) 1991-10-03

Similar Documents

Publication Publication Date Title
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
JP2010020468A (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
US5878198A (en) Information processing apparatus and method and memory medium storing information processing program
JP5033277B2 (ja) 画像処理装置および画像処理方法並びにコンピュータ読み取り可能な記録媒体
JP3178483B2 (ja) 文書処理装置
JP2010123002A (ja) 文書画像レイアウト装置
JPH0221024B2 (ja)
JPH032979A (ja) 画像修正方法及び装置
JP2840355B2 (ja) 文書処理装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPS58208865A (ja) 文書作成装置
US5345518A (en) Pattern generator
JP2588914B2 (ja) 文書処理装置
JP2783601B2 (ja) 情報処理装置
JP4213558B2 (ja) 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置
JP2763042B2 (ja) 画像処理方法
JP3823005B2 (ja) ビットマップフォント作成装置および文書復元装置
JP4334987B2 (ja) 領域指定機能およびデータ切り出し機能を備えたdtp編集装置
JP4297815B2 (ja) 情報処理装置および処理方法およびプログラムおよび記録媒体
JP2854344B2 (ja) ミクストモード文書の表示方法
JP2614339B2 (ja) 帳票出力編集装置
JP2728669B2 (ja) 外字編集装置
JP2800254B2 (ja) 画像一文字処理装置
JP3306969B2 (ja) 文書編集装置
JP5390880B2 (ja) 外字ビットマップデータ抽出方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees