JP2698345B2 - 文書処理方法 - Google Patents

文書処理方法

Info

Publication number
JP2698345B2
JP2698345B2 JP61165996A JP16599686A JP2698345B2 JP 2698345 B2 JP2698345 B2 JP 2698345B2 JP 61165996 A JP61165996 A JP 61165996A JP 16599686 A JP16599686 A JP 16599686A JP 2698345 B2 JP2698345 B2 JP 2698345B2
Authority
JP
Japan
Prior art keywords
ruled line
line segment
document
code
ruled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61165996A
Other languages
English (en)
Other versions
JPS6321170A (ja
Inventor
高裕 加藤
正基 浜田
洋 高倉
ゆかり 谷口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP61165996A priority Critical patent/JP2698345B2/ja
Priority to US07/072,634 priority patent/US4953108A/en
Publication of JPS6321170A publication Critical patent/JPS6321170A/ja
Application granted granted Critical
Publication of JP2698345B2 publication Critical patent/JP2698345B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字コードおよび罫線素片コードの混在す
る文書情報を処理可能な文書処理方法に関するものであ
る。 [従来の技術] 従来、ワードプロセツサといわれる簡易文書処理装置
は、どのような文字でも固定ピツチで処理されていたの
で、アルフアベツトの文字列も、仮名漢字文字列も同一
文字ピツチで処理される。 一方、組版機能を有する高級文字処理装置では、各文
字毎に文字ピツチを可変設定、又枠組処理もできるの
で、先にワードプロセツサで作成した文書をこの種の文
字処理装置で印字出力するということができた。 [発明が解決しようとする問題点] しかし、従来は第9図のようなワードプロセツサの文
書をこの種の装置に入力すると第10図のようになり、表
の体裁がくずれてしまっていた。これは英字のINITIAL
の部分が各文字の字幅は可変なものとしてプロポーシヨ
ナルに組版されるため、固定ピツチの場合とは各行に入
る文字数や、各文字の位置が異るためである。 このようなことが発生する原因としては、その他に数字
や約物等があるときに同様に固定ピツチの場合とは扱い
が異ってくることや、禁則処理の機能に差があること等
がある。このため従来のように単純に文字コードのみを
処理する方法では、ワードプロセツサ等で作成された表
を含む文書はすぐには利用し難い欠点があった。 またこれを防ぐためにはワードプロセツサで入力すると
きに専用の制御情報を付加して文書を作成し、この種の
装置に入力したときにその制御情報を解釈して組版する
方法があるが、そのためには入力時にワードプロセツサ
以外の操作を修得しなければならないという欠点があっ
た。 [問題点を解決するための手段] 上記従来技術の欠点に鑑み、本発明は文字コードおよ
び罫線素片コードが混在する文書情報から罫線素片コー
ドを検索し、前記検索される罫線素片コードが表を構成
するものか否か判断し、表を構成するものであると判断
される複数の罫線素片コードの位置から、該表を構成す
る罫線を表すベクトル罫線データを生成し、 前記罫線データを生成した複数の罫線素片コードに対
応する複数の罫線素片パターンに代えて、前記ベクトル
罫線データに基いて生成される罫線を、前記文書情報に
含まれる文字コードに対応する文字パターンと共に出力
する文書処理方法を提供する。 また、上記従来技術の欠点に鑑み、本発明は、好まし
くは前記検索される罫線素片コードが表を構成するもの
であるとの判断は、連続する罫線素片コードにより矩形
の外枠が成立する場合とする。 [作用] 文字コードおよび罫線素片コードが混在する文書情報か
ら罫線素片コードを検索し、罫線素片コードが表を構成
するものか否か判断し、表を構成するものであると判断
される複数の罫線素片コードの位置から、該表を構成す
る罫線を表すベクトル罫線データを生成し、前記罫線デ
ータを生成した複数の罫線素片コードに対応する複数の
罫線素片パターンに代えて、前記ベクトル罫線データに
基いて生成される罫線を、前記文書情報に含まれる文字
コードに対応する文字パターンと共に出力する。 [実施例] 以下、図面に従って本発明に好適な一実施例を詳細に
説明する。 第1図は本発明に係る一実施例の文書処理装置のシス
テムブロツク図である。 図において1はラスタスキヤン表示方式で使用されるCR
T表示部、2は一画面分の表示パターン情報を記憶する
ビデオRAM(VRAM)、3はVRAM2に対するパターン情報の
書き込み、CRTへの読み出しの制御をする表示制御部で
ある。5は第4図のフローチヤートに従った制御プログ
ラムを格納したプログラムエリアPAや、文書データを記
憶エリアTXT、表に関するデータを格納するテーブルエ
リア、CTB,RTB,CELLを有する主メモリで、4はマイクロ
プロセツサ(MPU)で、この装置の主制御を行う。MPU4
には文字データ等の入力を行うキーボード8、及びCRT
上の位置の指定等を行うポインテイングデバイス(PD)
9が接続されている。6はハードデイスク装置でこの中
に文書フアイルや文字フオントが格納される。10は作成
された文書を出力するプリンタで、11はワードプロセツ
サで作成された文書フロツピーを入力するフロツピーデ
イスク装置である。これらの各構成ブロツクはI/Oバス
7で接続されている。 以下、ワードプロセツサで作成された第9図のような
表のある文書を扱う場合を説明する。ワードプロセツサ
で入力された文書は1頁づつフロツピーデイスク装置11
より主メモリ5の文書記憶エリアTXTに読み込まれる。
このとき、第9図のような文章の罫線部分は一般には第
2図に示したようなJISC6226の罫線素片コードによって
表わされている。第3図は第9図の罫線部分を対応する
罫線素片コードの種類がわかるように分解したものであ
る。 次に第4図に従って表の部分に関する処理を説明す
る。 まずステツプ6−1で表の枠の検索を行う。これは表
の部分を判別する最初の処理で、表の一番外の枠を検索
する。具体的には頁の先頭より順に のコードを頁の最後まで検索し見つからなかった場合に
は、その頁には表はないものとして第4図の処理は終了
する。 見つかった場合は(第3図では5−1)そこから順に1
文字づつチエツクしていく。 許されるコードは のみで、それ以外のコードがきた場合は現在見ている部
分は表ではないとして、その部分から再度の検索を開始する。 のコードが見つかったときは(第3図では5−2)そこ
から頁の下方向に順に1文字づつチエツクしていく。許
されるコードは でそれ以外のコードがきた場合は の部分からステツプ6−1の検索を再開始する。以降同
様にして第3図の5−3.5−4を経て5−1に戻るチエ
ツクを行う。このチエツクが終了するとチエツクした領
域に囲まれる部分は表の枠の候補として認識され、ステ
ツプ6−2の処理に移る。 ステツプ6−2では表の枠の候補に含まれる縦の罫線
を主メモリ5中の縦罫線テーブルCTBに登録する。この
縦罫線テーブルCTBの詳細を第5図に示す。登録の方法
は原則としてつながった縦の罫線を1本と考えるが、横
の罫線と交わっている場合はそこで切って上下を別の罫
線と考え登録する。第3図でいえば、5−aから5−h
の9本が登録されることになる。具体的には最初に のあったところから頁の下方向に順に1文字づつチエツ
クしていき、縦の罫線を含む罫線素片コードがあれば、
それをテーブルに登録する。このとき があったときは、そこで縦罫線は終了しているため、x
座標と、上端,下端のy座標も登録するが、 の場合は未だ罫線が続いている場合があるため、下端の
y座標はここでは登録しない。 の場合は1本の縦罫線が登録され、さらに下端の未だ定
まらない罫線が登録されることになる。)下端の定まら
ない罫線が登録されたときは、文字が である間は順にチエツクを進め、それ以外のコードがき
たら下端の登録を行う。このとき の場合はさらに再度下端の定まらない罫線が登録され
る。以上のようにしてチエツクを行いながら縦罫線テー
ブルに罫線を登録していき、 の列まできたらこの列の処理を終了する。以下同様にし
の右の列のチエツクと登録を行い、順にの列まで同じ処理を行ってステツプ6−2の縦罫線の処
理を終了する。 ステツプ6−3では同様の処理を横罫線に対して行
い、主メモリ5中の横罫線テーブルRTBに登録する。 以上ステツプ6−2,6−3の処理で罫線テーブル内の
罫線の属性はここでは全て表罫であるが、当然第2図以
外の罫線素片コードが使用されていれば、それに従った
罫線の属性が登録されることになる。 ステツプ6−4ではこのようにして登録された罫線テ
ーブルCTB,RTBをもとに表の枠内の罫線で区切られる領
域が全て矩形であるかチエツクを行う。最初に縦罫線テ
ーブルCTBより順に縦の罫線を1本づつもってきて他の
縦罫線とのつながりを調べつながっているものはここで
は1本と考えるようにして縦罫線の両端を見つける。次
にこの両方の端点についてそれぞれその端点を端点とす
る横の罫線が2本づつあるか否かを横罫線テーブルRTB
で調べる。2本ない場合はそれが第3図でいえば5−1,
5−2,5−3,5−4の点であるかを調べ、そうでなければ
矩形でない領域があるので、この表の枠の候補に関して
はここでは表ではないとして第6図の処理を終了する。
同様にして縦罫線テーブルCTBに登録されている全ての
罫線についてチエツクを行い、終了したら次に横罫線テ
ーブルRTBより順に罫線を1本づつもってきて同様のチ
エツクを行う。以上のチエツクが終了すれば、この表の
枠内の罫線で区切られる部分は全て矩形と考えることが
できる。 最後にステツプ6−5のセルデータの登録を行う。こ
の処理は横罫線テーブルRTBより順に罫線を1本づつも
って来て、その両端のそれぞれについてそこより下に伸
びる縦罫線がないか縦罫線テーブルCTB内を検索し、な
ければその接点につながる横罫線があるはずであり、そ
れを横罫線テーブルRTBより検索し、もとの罫線と合わ
せ1本と考え、再度端点より下に伸びる縦罫線を検索す
る。縦罫線があった場合はそこがセルの端となる。この
ようにしてセルの左右の端を定め、次に左右の端のどち
らか1方の縦罫線をもとにセルの下端を定める処理を行
う。これはその縦罫線の下端を端点とし、もとの横罫線
方向に伸びる横罫線を横罫線テーブルRTBより検索し、
あればその位置がそのセルの下端である。なければその
端点を上端の点とする縦罫線があるはずであり、それを
縦罫線テーブルCTBより検索し、その下端の点に関し、
同様に横罫線テーブルRTBを検索する。以上の繰り返し
によりセルの下端が定められる。 セルの範囲が決定したらそれを主メモリ5中のセルテー
ブルCELLの左上x座標、y座標,右下x座標,y座標に登
録し、さらにその範囲もとにして、そのセル内に含まれ
る文字列を決定し、その文字列を別途記憶するととも
に、その文字列へのポインタをセルテーブルCELLに登録
する。セルテーブルCELLの詳細を第5図(b)に示す。
以上の処理を横罫線テーブルRTB内の5−4より5−3
の部分を構成する横罫線以外に対して行うことにより、
この表の全てのセルが第5図(b)の如くセルテーブル
CELLに登録され、そのセル内に含まれる文字列も決定さ
れる。 以上で第4図の処理が終了し、第9図の文書の表の部
分は表として認識され、その罫線に関する情報とセルに
関する情報は全て第5図のテーブルCTB,RTB,CELLに登録
された。 従って、この文書は以降本文の部分は表の枠の部分を禁
止領域として字詰め組版を行い、表の部分は第5図のテ
ーブルCTB,RTBより罫線を作成し、各セル内の文字はセ
ルテーブルCELLの情報をもとにセル内での字詰め組版を
行えば、第6図に示すような表の体裁が保たれたまま組
版された状態で出力されることになる。 このようにして、第9図のような表の外枠が矩形であ
り、内部の罫線で区切られた領域も全て矩形であるよう
に形成された文書はそのままで利用できることになる。 次に第7図に示すような不完全な形で作成された表を
扱う場合を説明する。このような文書は第4図の処理に
おいてステツプ6−4の罫線で構成される領域が全て矩
形であることのチエツクを行っているとき、完全な表で
はないことが判別できる。このような場合は、その時点
で文書のその頁をワードプロセツサでの表示と同様に固
定ピツチでCRT1上に表示する。そして操作者はポインテ
イングデバイス9を操作してCRT1上で罫線の追加や削除
を行い完全な表を作成するようにする。具体的には罫線
の追加の場合は、追加する罫線の両端の指示を行い、そ
の指示がなされたら装置はまずそれらの座標から縦罫線
の追加か横罫線か判断する。縦罫線の追加であれば縦罫
線テーブルCTB上からそれとつながる縦罫線を全てとり
出してきて1本とし次にその罫線と交わる横罫線を横罫
線テーブルRTBより検索し、それにより作成した縦罫線
を分割して縦罫線テーブルCTBに登録する。横罫線の追
加も同様に行う。罫線の削除は削除する罫線上の点を指
示し、装置はその座標から指示された罫線を罫線テーブ
ルCTB,RTBより検索し削除する。削除されたのが縦罫線
であれば横罫線テーブルRTBよりその縦罫線と交わって
いた横罫線を全て取り出し、つながっているものは一本
化したのち、再度縦罫線テーブルCTBを検索して分割す
る処理を行いテーブルに登録しなおす。以上のようにし
て罫線の追加削除が終了したら再度第4図のステツプ6
−4より処理を行えば第7図のような表を持つ文書も第
6図のようにして出力できるようになる。 更に第8図のような罫線を持たない表を持つ文書を扱
う場合を説明する。 このような文書は第4図の処理ではステツプ6−1の処
理で表はないものとして処理されてしまう。 従ってこの場合は操作者はこの頁をワードプロセツサと
同様に表示するように指示を行い、ポインテイングデバ
イス9により表の枠をその左上と右下の点を指示するこ
とにより指定する。以下は第7図の場合と同様に罫線の
追加削除の処理を行えば良い。このようにすれば第8図
のように罫線を持たない表も第6図のようにして出力で
きる。 そして、第5図のようなテーブルCTB,RTBになってい
るため、第6図のような出力を得るほかに、罫線の属性
を指定して裏罫等に罫線の種類を変更したり、また罫線
は印刷しないようにしたり、あるセル内の文字の大きさ
や書体を変更したり、縦組にしたりすることは簡単に指
定でき、またその状態のまま保存もできることになる。 つまり、セルテーブルCELLによって定義される枠を一
つの欄として取り扱うことで、ワードプロセツサ等の固
定ピツチで作成された文書の表の体裁を保つたまま、文
書の編集、組版処理をすることができる。 [発明の効果] 以上説明したように、本発明によれば、文字コードお
よび罫線素片コードが混在する文書情報から罫線素片コ
ードを検索し、前記検索される罫線素片コードが表を構
成するものか否か判断し、表を構成するものであると判
断される複数の罫線素片コードの位置から、該表を構成
する罫線を表すベクトル罫線データを生成し、前記罫線
データを生成した複数の罫線素片コードに対応する複数
の罫線素片パターンに代えて、前記ベクトル罫線データ
に基いて生成される罫線を、前記文書情報に含まれる文
字コードに対応する文字パターンと共に出力することに
より、複数の罫線素片コードにより表現される罫線の組
み合わせにより表が構成されている文書情報であって
も、罫線素片コードを適切なベクトル罫線データに変換
するので、変換後の文書情報においても、変換前と同様
の態様に表と文字とを組み版することができる。 また、前記検索される罫線素片コードが表を構成する
ものであるとの判断は、連続する罫線素片コードにより
矩形の外枠が成立する場合とすることにより、複数の罫
線素片コードで表が表現されている文書情報から、表を
正しく抽出することができる。
【図面の簡単な説明】 第1図は本発明に係る1実施例である文書処理装置のブ
ロツク図、第2図はJISC6226コードの罫線素片コードの
1部を示す図、第3図は第9図の罫線部分を罫線素片コ
ードに分解した図、第4図は表の判別を行い処理用のテ
ーブルを作成する処理の流れを示すフローチヤート、第
5図は罫線テーブルとセルテーブルのフオーマツトを示
す図、第6図は第9図の文書が表の体裁を保ったまま組
版された出力例、第7図、第8図はワードプロセツサで
作成された表を含む文書の例を示す図、第9図はワード
プロセツサの文書の例を示す図、第10図は第9図の文書
をそのままプロポーシヨナルに組版した例を示す図であ
る。 1……CRT表示部 2……ビデオRAM 3……表示制御部 4……マイクロプロセツサ 5……主メモリ 6……ハードデイスク装置 7……I/Oバス 8……キーボード 9……ポインテイングデバイス 10……プリンタ 11……フロツピーデイスク装置

Claims (1)

  1. (57)【特許請求の範囲】 1.文字コードおよび罫線素片コードが混在する文書情
    報から罫線素片コードを検索し、 前記検索される罫線素片コードが表を構成するものか否
    か判断し、 表を構成するものであると判断される複数の罫線素片コ
    ードの位置から、該表を構成する罫線を表すベクトル罫
    線データを生成し、 前記罫線データを生成した複数の罫線素片コードに対応
    する複数の罫線素片パターンに代えて、前記ベクトル罫
    線データに基いて生成される罫線を、前記文書情報に含
    まれる文字コードに対応する文字パターンと共に出力す
    ることを特徴とする文書処理方法。 2.前記検索される罫線素片コードが表を構成するもの
    であるとの判断は、連続する罫線素片コードにより矩形
    の外枠が成立する場合とすることを特徴とする特許請求
    の範囲第1項記載の文書処理方法。
JP61165996A 1986-07-15 1986-07-15 文書処理方法 Expired - Lifetime JP2698345B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP61165996A JP2698345B2 (ja) 1986-07-15 1986-07-15 文書処理方法
US07/072,634 US4953108A (en) 1986-07-15 1987-07-13 Document processor having a document composition function

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61165996A JP2698345B2 (ja) 1986-07-15 1986-07-15 文書処理方法

Publications (2)

Publication Number Publication Date
JPS6321170A JPS6321170A (ja) 1988-01-28
JP2698345B2 true JP2698345B2 (ja) 1998-01-19

Family

ID=15822932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61165996A Expired - Lifetime JP2698345B2 (ja) 1986-07-15 1986-07-15 文書処理方法

Country Status (1)

Country Link
JP (1) JP2698345B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7407193B2 (en) 2004-03-18 2008-08-05 Takata Corporation Seat belt buckle

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5846427A (ja) * 1981-09-11 1983-03-17 Toshiba Corp 文書編集装置
JPS5866148A (ja) * 1981-10-16 1983-04-20 Casio Comput Co Ltd 文書処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5846427A (ja) * 1981-09-11 1983-03-17 Toshiba Corp 文書編集装置
JPS5866148A (ja) * 1981-10-16 1983-04-20 Casio Comput Co Ltd 文書処理装置

Also Published As

Publication number Publication date
JPS6321170A (ja) 1988-01-28

Similar Documents

Publication Publication Date Title
EP0439951B1 (en) Data processing
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
JPH04343190A (ja) 文字データ入力方式
US4953108A (en) Document processor having a document composition function
JPS6289989A (ja) 文書作成装置
JP2698345B2 (ja) 文書処理方法
JPH0831092B2 (ja) 文書処理装置
JP3029822B2 (ja) 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2810368B2 (ja) 画像処理方法
JPH0816904B2 (ja) 文書処理方法
JPS6320673A (ja) 文書処理装置
JP2682873B2 (ja) 表形式文書の認識装置
JP2834882B2 (ja) 文書作成装置
JPH08293033A (ja) 情報処理装置
JPH04303273A (ja) 図形作成装置
JPH0678119A (ja) 画像ファイリング装置および画像読取処理装置
JP2547799B2 (ja) 文書処理方法
JPH11316792A (ja) 情報処理装置及び帳表作成方法
JPH08123801A (ja) 文書作成装置及び枠編集方法
JPH0782488B2 (ja) 文書編集装置
JPH0769898B2 (ja) 文書処理装置
JPS61296388A (ja) 罫線削除方法
JPH04128963A (ja) 本文外領域印刷方式
JPH09128390A (ja) 文書編集装置
JPH0820863B2 (ja) 表示制御方法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term