JP3203749B2 - 文書処理装置 - Google Patents
文書処理装置Info
- Publication number
- JP3203749B2 JP3203749B2 JP09014692A JP9014692A JP3203749B2 JP 3203749 B2 JP3203749 B2 JP 3203749B2 JP 09014692 A JP09014692 A JP 09014692A JP 9014692 A JP9014692 A JP 9014692A JP 3203749 B2 JP3203749 B2 JP 3203749B2
- Authority
- JP
- Japan
- Prior art keywords
- sub
- character pattern
- character
- document
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
- Character Input (AREA)
Description
【0001】
【産業上の利用分野】本発明はイメージ情報(ビットマ
ップ情報)形式の文書における文字領域の編集を行うこ
とのできる文書処理装置に関し、特にサブ文字パターン
の再配置を行うことのできる文書処理装置に関する。な
お、この明細書でサブ文字パターンとは、文字パターン
および部分文字パターンの両者を言う。このサブ文字パ
ターンには、例えば、アルファベットの各文字、各漢
字、漢字の篇や旁、片仮名や平仮名の各文字または文字
が2以上の部分に分かれる「い」や「こ」の左右や上下
の半分のパターン、句読点…などがある。
ップ情報)形式の文書における文字領域の編集を行うこ
とのできる文書処理装置に関し、特にサブ文字パターン
の再配置を行うことのできる文書処理装置に関する。な
お、この明細書でサブ文字パターンとは、文字パターン
および部分文字パターンの両者を言う。このサブ文字パ
ターンには、例えば、アルファベットの各文字、各漢
字、漢字の篇や旁、片仮名や平仮名の各文字または文字
が2以上の部分に分かれる「い」や「こ」の左右や上下
の半分のパターン、句読点…などがある。
【0002】
【従来の技術】従来、既存文書をイメージとして入力
し、そのテキスト部分を再編集する場合は、文字認識を
行ってコード化してから編集するか、文字切り出しの
後、部分文字パターンを文字パターンにまとめてから再
配置することが提案されている(例えば特開昭62−1
69285公報参照)。この文字パターンにまとめる方
法については、文字幅の小さい特殊文字についてだけ認
識を行うことにより、処理を高速化する方法が上記公報
に記載されている。
し、そのテキスト部分を再編集する場合は、文字認識を
行ってコード化してから編集するか、文字切り出しの
後、部分文字パターンを文字パターンにまとめてから再
配置することが提案されている(例えば特開昭62−1
69285公報参照)。この文字パターンにまとめる方
法については、文字幅の小さい特殊文字についてだけ認
識を行うことにより、処理を高速化する方法が上記公報
に記載されている。
【0003】
【発明が解決しようとする課題】テキスト部分をすべて
文字認識によりコード化してから文書の編集を行う従来
技術においては、誤認識の問題があり、その誤りを修正
するのに時間を要していた。また、文字パターンの再配
置によって編集を行う従来技術においては、一つの文字
パターンの一部分に相当するサブ文字パターンを、すべ
て完全な文字パターンにまとめる処理が必要であり、さ
らに特殊文字の処理をするためには一部文字認識技術を
応用する必要があり、処理時間がかかっていた。本発明
は、このような従来技術の問題点を解決することを目的
とするものである。すなわち、文字認識を行うことな
く、文字パターンの再配置を行うことができ、文書編集
の処理の簡素化と高速化を行うことを目的とする。
文字認識によりコード化してから文書の編集を行う従来
技術においては、誤認識の問題があり、その誤りを修正
するのに時間を要していた。また、文字パターンの再配
置によって編集を行う従来技術においては、一つの文字
パターンの一部分に相当するサブ文字パターンを、すべ
て完全な文字パターンにまとめる処理が必要であり、さ
らに特殊文字の処理をするためには一部文字認識技術を
応用する必要があり、処理時間がかかっていた。本発明
は、このような従来技術の問題点を解決することを目的
とするものである。すなわち、文字認識を行うことな
く、文字パターンの再配置を行うことができ、文書編集
の処理の簡素化と高速化を行うことを目的とする。
【0004】
【課題を解決するための手段】この問題を解決するため
本発明の文書処理装置は、図1に示すように、文書をイ
メージ情報で保存する文書イメージ記憶手段11と、前
記イメージ情報から、サブ文字パターンを抽出するサブ
文字パターン抽出手段12と、前記抽出の結果得られた
サブ文字パターンに関する情報を記憶するサブ文字パタ
ーン情報記憶手段13と、サブ文字パターン情報記憶手
段13に記憶されたサブ文字パターン情報をもとに、前
記文書イメージ記憶手段11に記憶されたイメージ情報
における各サブ文字パターンを切り出し、所望の領域内
に配置ルールに従って再配置することにより、前記イメ
ージ情報で保存された文字ブロックを編集する編集処理
手段14とを有する。
本発明の文書処理装置は、図1に示すように、文書をイ
メージ情報で保存する文書イメージ記憶手段11と、前
記イメージ情報から、サブ文字パターンを抽出するサブ
文字パターン抽出手段12と、前記抽出の結果得られた
サブ文字パターンに関する情報を記憶するサブ文字パタ
ーン情報記憶手段13と、サブ文字パターン情報記憶手
段13に記憶されたサブ文字パターン情報をもとに、前
記文書イメージ記憶手段11に記憶されたイメージ情報
における各サブ文字パターンを切り出し、所望の領域内
に配置ルールに従って再配置することにより、前記イメ
ージ情報で保存された文字ブロックを編集する編集処理
手段14とを有する。
【0005】また、本発明の一態様によれば、前記編集
処理手段14は、サブ文字パターンの配置に関する配置
ルールを格納する配置ルール記憶手段143と、サブ文
字パターン情報記憶手段13に記憶されたサブ文字パタ
ーン情報と配置ルール記憶手段143に記憶された配置
ルールをもとに行末行頭の配置の是非を判定する配置判
定手段142と、その配置判定手段142の判定結果と
前記サブ文字パターン情報記憶手段13の記憶するサブ
文字パターン情報に基づき、前記文書イメージ記憶手段
11に記憶された文書イメージ情報からサブ文字パター
ンを切り出して所望の領域内に配置する配置処理手段1
41とを有する。
処理手段14は、サブ文字パターンの配置に関する配置
ルールを格納する配置ルール記憶手段143と、サブ文
字パターン情報記憶手段13に記憶されたサブ文字パタ
ーン情報と配置ルール記憶手段143に記憶された配置
ルールをもとに行末行頭の配置の是非を判定する配置判
定手段142と、その配置判定手段142の判定結果と
前記サブ文字パターン情報記憶手段13の記憶するサブ
文字パターン情報に基づき、前記文書イメージ記憶手段
11に記憶された文書イメージ情報からサブ文字パター
ンを切り出して所望の領域内に配置する配置処理手段1
41とを有する。
【0006】
【作用】文書イメージ記憶手段11は、文字、図形、画
像(中間調画像)など複数の属性を含む文書をイメージ
情報として記憶する。サブ文字パターン抽出手段12
は、前記イメージ情報に対して、例えば黒画素塊に外接
する矩形領域を求め、一定の条件を満たすものを抽出す
るなどしてサブ文字パターンを抽出する。サブ文字パタ
ーン情報記憶手段13は、前記抽出したサブ文字パター
ンに関する情報、例えば前記外接矩形領域の位置、範
囲、行の高さに対する相対位置等の情報、を記憶する。
編集処理手段14は、サブ文字パターン情報をもとに、
前記文書イメージ記憶手段11から各サブ文字パターン
を切り出し、これを所望の領域内に配置ルールに従って
流し込む。配置ルールは、例えば改行する際に行末、行
頭へ配置してはならないサブ文字パターンの条件を定め
るものである。
像(中間調画像)など複数の属性を含む文書をイメージ
情報として記憶する。サブ文字パターン抽出手段12
は、前記イメージ情報に対して、例えば黒画素塊に外接
する矩形領域を求め、一定の条件を満たすものを抽出す
るなどしてサブ文字パターンを抽出する。サブ文字パタ
ーン情報記憶手段13は、前記抽出したサブ文字パター
ンに関する情報、例えば前記外接矩形領域の位置、範
囲、行の高さに対する相対位置等の情報、を記憶する。
編集処理手段14は、サブ文字パターン情報をもとに、
前記文書イメージ記憶手段11から各サブ文字パターン
を切り出し、これを所望の領域内に配置ルールに従って
流し込む。配置ルールは、例えば改行する際に行末、行
頭へ配置してはならないサブ文字パターンの条件を定め
るものである。
【0007】編集処理手段14の配置ルール記憶手段1
43は、前記配置ルールを記憶しており、配置判定手段
142は、サブ文字パターン情報記憶手段13に記憶さ
れた外接矩形情報等のサブ文字パターンの属性情報を配
置ルールと照合して、改行可能性、サブ文字パターン間
へのスペース挿入の要否などを判定する。配置処理手段
141は、サブ文字パターン情報における位置、範囲情
報により文書イメージ記憶手段11からサブ文字パター
ンを読み出して、配置判定手段142の判定結果に応じ
た再配置処理を行う。
43は、前記配置ルールを記憶しており、配置判定手段
142は、サブ文字パターン情報記憶手段13に記憶さ
れた外接矩形情報等のサブ文字パターンの属性情報を配
置ルールと照合して、改行可能性、サブ文字パターン間
へのスペース挿入の要否などを判定する。配置処理手段
141は、サブ文字パターン情報における位置、範囲情
報により文書イメージ記憶手段11からサブ文字パター
ンを読み出して、配置判定手段142の判定結果に応じ
た再配置処理を行う。
【0008】本発明では、イメージ処理による文書編集
におけるサブ文字パターンの流し込み処理の際、サブ文
字パターンに関する情報と配置ルールのみにより配置処
理を行うので、文字認識を必要とせず、処理の簡素化お
よび高速化が図れる。
におけるサブ文字パターンの流し込み処理の際、サブ文
字パターンに関する情報と配置ルールのみにより配置処
理を行うので、文字認識を必要とせず、処理の簡素化お
よび高速化が図れる。
【0009】
【実施例】以下、添付図面に従って本発明の実施例を説
明する。第2図は、本発明の一実施例である文書処理装
置の全体構成を示す図である。この文書処理装置は、可
視的な記録媒体の文書情報をイメージ情報として入力す
るためのイメージスキャナ等の入力装置21と、入力装
置21により入力されたイメージ情報を記憶する文書メ
モリ22と、文書メモリ22内のイメージ文書情報を、
文字領域、図形領域、画像領域などの異なる属性の領域
に識別分離し、文字領域に対してはサブ文字パターンを
抽出する領域分離処理部23と、その領域分離処理部2
3により分離された領域の属性、位置、範囲等の領域情
報を記憶する領域情報メモリ24と、領域情報メモリ2
4に記憶された文字領域の情報すなわちサブ文字パター
ンに関する属性情報である、黒画素塊に外接する矩形領
域の幅や高さや位置などの情報をもとに、配置規則処理
を行う配置規則処理部25と、文書メモリ22に格納さ
れた文書情報を、各属性ごとに編集処理し、出力文書を
作成する文書編集処理部26と、編集した出力文書を出
力する出力装置27とを備えている。
明する。第2図は、本発明の一実施例である文書処理装
置の全体構成を示す図である。この文書処理装置は、可
視的な記録媒体の文書情報をイメージ情報として入力す
るためのイメージスキャナ等の入力装置21と、入力装
置21により入力されたイメージ情報を記憶する文書メ
モリ22と、文書メモリ22内のイメージ文書情報を、
文字領域、図形領域、画像領域などの異なる属性の領域
に識別分離し、文字領域に対してはサブ文字パターンを
抽出する領域分離処理部23と、その領域分離処理部2
3により分離された領域の属性、位置、範囲等の領域情
報を記憶する領域情報メモリ24と、領域情報メモリ2
4に記憶された文字領域の情報すなわちサブ文字パター
ンに関する属性情報である、黒画素塊に外接する矩形領
域の幅や高さや位置などの情報をもとに、配置規則処理
を行う配置規則処理部25と、文書メモリ22に格納さ
れた文書情報を、各属性ごとに編集処理し、出力文書を
作成する文書編集処理部26と、編集した出力文書を出
力する出力装置27とを備えている。
【0010】配置規則処理部25は、領域情報メモリ2
4から転送されたサブ文字パターン情報を記憶するサブ
文字パターン情報記憶部251と、サブ文字パターンを
一行に配置する際に一つの文字が複数のサブ文字パター
ンからなる場合に、複数の行にまたがって配置されない
ようにするための規則や、行頭に句読点が来ないように
するいわゆる禁則処理のための規則などの配置処理に関
する規則を記憶する配置ルール記憶部253と、サブ文
字パターン情報と配置ルールに基づいて、サブ文字パタ
ーンをどの行に配置するかを判定する配置判定部252
とから成っている。文書編集処理部26は、サブ文字パ
ターン情報を基に文書メモリ22からサブ文字パターン
のイメージ情報を切り出すサブ文字パターン切り出し部
261と、配置判定部252で判定された配置に従っ
て、サブ文字パターン切り出し部261により切り出し
たサブ文字パターンを指定の領域に配置する文字配置処
理部262を備えている。なお、図示されてはいない
が、文書編集処理部26は領域分離処理部23により分
離された文字ブロック以外の領域、すなわち図形領域
や、中間調領域などについてもそれぞれに適した編集処
理を行うことのできる機能を有し、出力装置27へはこ
れらの編集処理を含む結果の文書が出力される。
4から転送されたサブ文字パターン情報を記憶するサブ
文字パターン情報記憶部251と、サブ文字パターンを
一行に配置する際に一つの文字が複数のサブ文字パター
ンからなる場合に、複数の行にまたがって配置されない
ようにするための規則や、行頭に句読点が来ないように
するいわゆる禁則処理のための規則などの配置処理に関
する規則を記憶する配置ルール記憶部253と、サブ文
字パターン情報と配置ルールに基づいて、サブ文字パタ
ーンをどの行に配置するかを判定する配置判定部252
とから成っている。文書編集処理部26は、サブ文字パ
ターン情報を基に文書メモリ22からサブ文字パターン
のイメージ情報を切り出すサブ文字パターン切り出し部
261と、配置判定部252で判定された配置に従っ
て、サブ文字パターン切り出し部261により切り出し
たサブ文字パターンを指定の領域に配置する文字配置処
理部262を備えている。なお、図示されてはいない
が、文書編集処理部26は領域分離処理部23により分
離された文字ブロック以外の領域、すなわち図形領域
や、中間調領域などについてもそれぞれに適した編集処
理を行うことのできる機能を有し、出力装置27へはこ
れらの編集処理を含む結果の文書が出力される。
【0011】以上のように構成された本実施例の文書処
理装置において、入力装置21から入力された文書イメ
ージ情報は、文書メモリ22に格納され、領域分離処理
部23によって、文字、図形、画像などの文書要素に分
割され、その属性と位置情報等の領域情報が領域情報メ
モリ24に格納される。なお、領域分離処理は公知の任
意の技術手段を用いることができる。サブ文字パターン
の抽出は、文書メモリ22に格納されたイメージ情報を
もとに各黒画素塊に外接する矩形領域を求めることによ
り行う。これによりサブ文字パターンの外接矩形領域の
範囲や位置の情報を得る。この外接矩形領域の情報は領
域情報メモリ24に格納され、その後、編集処理時にサ
ブ文字パターン情報記憶部26に転送され格納される。
配置判定部252によって、サブ文字パターンについ
て、改行および行末位置揃え(justificati
on)のためのスペース挿入について、配置ルール記憶
部253に記憶された配置ルールに従って改行の可否や
スペース挿入の要否など配置に関する判定を行い、その
判定結果に基づき文字配置処理部262によりサブ文字
パターンの配置処理が行われる。これらの情報をもとに
再編集された文書イメージは、出力装置27から出力さ
れる。
理装置において、入力装置21から入力された文書イメ
ージ情報は、文書メモリ22に格納され、領域分離処理
部23によって、文字、図形、画像などの文書要素に分
割され、その属性と位置情報等の領域情報が領域情報メ
モリ24に格納される。なお、領域分離処理は公知の任
意の技術手段を用いることができる。サブ文字パターン
の抽出は、文書メモリ22に格納されたイメージ情報を
もとに各黒画素塊に外接する矩形領域を求めることによ
り行う。これによりサブ文字パターンの外接矩形領域の
範囲や位置の情報を得る。この外接矩形領域の情報は領
域情報メモリ24に格納され、その後、編集処理時にサ
ブ文字パターン情報記憶部26に転送され格納される。
配置判定部252によって、サブ文字パターンについ
て、改行および行末位置揃え(justificati
on)のためのスペース挿入について、配置ルール記憶
部253に記憶された配置ルールに従って改行の可否や
スペース挿入の要否など配置に関する判定を行い、その
判定結果に基づき文字配置処理部262によりサブ文字
パターンの配置処理が行われる。これらの情報をもとに
再編集された文書イメージは、出力装置27から出力さ
れる。
【0012】図3は、文書編集処理部26において行わ
れる処理のうち、文字領域の編集を、配置規則処理部2
5の処理とともに示したフローチャートである。サブ文
字パターン情報記憶部251に格納されているテキスト
領域、行、サブ文字パターンの外接矩形情報をもとに、
文書メモリ22からサブ文字パターンのイメージを切り
出し、テキストの流し込み処理を行う(ステップ3
1)。その後、行末位置揃え処理(justifica
tion処理)を行い(ステップ32)、以上の結果を
もとに最終的なテキストイメージを生成する(ステップ
33)。
れる処理のうち、文字領域の編集を、配置規則処理部2
5の処理とともに示したフローチャートである。サブ文
字パターン情報記憶部251に格納されているテキスト
領域、行、サブ文字パターンの外接矩形情報をもとに、
文書メモリ22からサブ文字パターンのイメージを切り
出し、テキストの流し込み処理を行う(ステップ3
1)。その後、行末位置揃え処理(justifica
tion処理)を行い(ステップ32)、以上の結果を
もとに最終的なテキストイメージを生成する(ステップ
33)。
【0013】図4は、テキストの流し込み処理のフロー
チャートである。まず、文書編集処理部26によって予
め指定された行の幅をもとに、改行する位置にあるサブ
文字パターンを捜す(ステップ41)。この時、もし流
し込む対象であるテキストブロックが終了した時は、処
理が終わる(ステップ42)。選択されたサブ文字パタ
ーンは、配置判定部252によって、配置ルールによる
禁止された配置処理の対象かどうかを判断する(ステッ
プ43)。この時、禁止された配置処理に該当する場合
は、一つ前のサブ文字パターンに対して、同様の処理を
行う(ステップ44)。このようにして、禁止配置処理
対象でないサブ文字パターンを選択し、この後で改行処
理を行う(ステップ45)。
チャートである。まず、文書編集処理部26によって予
め指定された行の幅をもとに、改行する位置にあるサブ
文字パターンを捜す(ステップ41)。この時、もし流
し込む対象であるテキストブロックが終了した時は、処
理が終わる(ステップ42)。選択されたサブ文字パタ
ーンは、配置判定部252によって、配置ルールによる
禁止された配置処理の対象かどうかを判断する(ステッ
プ43)。この時、禁止された配置処理に該当する場合
は、一つ前のサブ文字パターンに対して、同様の処理を
行う(ステップ44)。このようにして、禁止配置処理
対象でないサブ文字パターンを選択し、この後で改行処
理を行う(ステップ45)。
【0014】図5は、justification処理
についてのフローチャートである。サブ文字パターン
は、その前後にスペースを入れることができるかどうか
を配置判定部252で判断し、その結果を保存する。保
存された結果は、テキストイメージを生成する際に利用
される。すなわち、サブ文字パターンを取り出し(ステ
ップ51)、行の終了か否かを判定する(ステップ5
2)。行の終了でない場合は、スペースを入れることが
できるかを判断し(ステップ53)、その判断結果を保
存し(ステップ54)、次のサブ文字パターンを取り出
す(ステップ51)。ステップ52の判定が行の終了で
ある場合は、次行のサブ文字パターンを取出し(ステッ
プ55)、次の行について処理を続行するが、テキスト
ブロック(文字領域)の終了かどうかを判定し(ステッ
プ56)、終了位置になった場合は処理を終了する。
についてのフローチャートである。サブ文字パターン
は、その前後にスペースを入れることができるかどうか
を配置判定部252で判断し、その結果を保存する。保
存された結果は、テキストイメージを生成する際に利用
される。すなわち、サブ文字パターンを取り出し(ステ
ップ51)、行の終了か否かを判定する(ステップ5
2)。行の終了でない場合は、スペースを入れることが
できるかを判断し(ステップ53)、その判断結果を保
存し(ステップ54)、次のサブ文字パターンを取り出
す(ステップ51)。ステップ52の判定が行の終了で
ある場合は、次行のサブ文字パターンを取出し(ステッ
プ55)、次の行について処理を続行するが、テキスト
ブロック(文字領域)の終了かどうかを判定し(ステッ
プ56)、終了位置になった場合は処理を終了する。
【0015】次に、配置ルール記憶部253に格納され
た配置ルールの一例を説明するである。本実施例では、
処理を簡素化するために、justification
においてサブ文字パターンにスペースを入れることがで
きるのは、改行可能な位置と同じであると判断してい
る。なお、下の記述において、インデントの深さおよび
番号付けは、ルールの包含関係を示している。例えば、
2−2−1)は、2−2)の条件の下でのルールで、2
−2)は、2)の条件下でのルールである。また、ここ
で判定に利用している閾値は、行の高さより計算されて
いる。 1) 文字間のスペースが、行の高さより計算された閾
値よりも大きい時改行可能。 1−1) ただし、句読点が後ろにくる場合は、改行不
可。句読点の判断は、行の高さより計算された閾値をも
とに、 文字上部のスペースが大きい 文字の幅が小さい で判断する。(図6) 2) 文字の幅が行の高さより計算した閾値より広い
時、全角文字と判断。この場合、英大文字である可能性
もある。 2−1) ただし、文字上部のスペースが行の高さより
計算した閾値より大きい場合、英小文字(wなど)の可
能性があるのでこの文字の前後で改行不可。(図7) 2−2) 文字の形が正方形に近く、 2−2−1) 後ろに幅が狭い文字が接近して付いてい
る場合は、文字の後ろで改行不可。(英小文字 l な
どの可能性有。図8(a)) 2−2−2) 後ろの文字の上部のスペースが行の高さ
より計算した閾値より大きい場合、英小文字の可能性が
あり、文字の後ろで改行不可。(図8(b)) 2−2−3) 前後に、半角の文字が、接近して付いて
いる場合は、それぞれ漢字の一部である可能性があるの
で、それぞれ前後に改行不可。(図9) 2−2−4) 上記以外の場合は、前後に改行可能。 2−3) 上記以外は、改行不可。 3) 上記以外は、改行不可。
た配置ルールの一例を説明するである。本実施例では、
処理を簡素化するために、justification
においてサブ文字パターンにスペースを入れることがで
きるのは、改行可能な位置と同じであると判断してい
る。なお、下の記述において、インデントの深さおよび
番号付けは、ルールの包含関係を示している。例えば、
2−2−1)は、2−2)の条件の下でのルールで、2
−2)は、2)の条件下でのルールである。また、ここ
で判定に利用している閾値は、行の高さより計算されて
いる。 1) 文字間のスペースが、行の高さより計算された閾
値よりも大きい時改行可能。 1−1) ただし、句読点が後ろにくる場合は、改行不
可。句読点の判断は、行の高さより計算された閾値をも
とに、 文字上部のスペースが大きい 文字の幅が小さい で判断する。(図6) 2) 文字の幅が行の高さより計算した閾値より広い
時、全角文字と判断。この場合、英大文字である可能性
もある。 2−1) ただし、文字上部のスペースが行の高さより
計算した閾値より大きい場合、英小文字(wなど)の可
能性があるのでこの文字の前後で改行不可。(図7) 2−2) 文字の形が正方形に近く、 2−2−1) 後ろに幅が狭い文字が接近して付いてい
る場合は、文字の後ろで改行不可。(英小文字 l な
どの可能性有。図8(a)) 2−2−2) 後ろの文字の上部のスペースが行の高さ
より計算した閾値より大きい場合、英小文字の可能性が
あり、文字の後ろで改行不可。(図8(b)) 2−2−3) 前後に、半角の文字が、接近して付いて
いる場合は、それぞれ漢字の一部である可能性があるの
で、それぞれ前後に改行不可。(図9) 2−2−4) 上記以外の場合は、前後に改行可能。 2−3) 上記以外は、改行不可。 3) 上記以外は、改行不可。
【0016】図10ないし図12はこの実施例により編
集処理を行った結果の実例を示すもので、図10は文書
メモリ中に格納された文字領域の一部を示し、図11お
よび図12はそれぞれ指定の書式に編集した結果を示し
ている。図11および図12から明らかなように、指定
の書式の枠に文字の流し込みが誤りなく行われている。
集処理を行った結果の実例を示すもので、図10は文書
メモリ中に格納された文字領域の一部を示し、図11お
よび図12はそれぞれ指定の書式に編集した結果を示し
ている。図11および図12から明らかなように、指定
の書式の枠に文字の流し込みが誤りなく行われている。
【0017】
【発明の効果】以上に述べた如く本発明によれば、サブ
文字パターンに対して文字認識を行う必要がないため、
処理の簡易化および高速化を図ることができる。
文字パターンに対して文字認識を行う必要がないため、
処理の簡易化および高速化を図ることができる。
【図1】 本発明の構成を示すブロック図
【図2】 本発明の文書処理装置の実施例の構成を示す
図
図
【図3】 文字領域の編集処理のフローチャート
【図4】 文字領域の流し込み処理のフローチャート
【図5】 行末揃え(justification)処
理のフローチャート
理のフローチャート
【図6】 句読点の判定を説明するための図
【図7】 幅の広い英小文字の判定を説明するための図
【図8】 英小文字の判定を説明するための図
【図9】 偏と旁の判定を説明するための図
【図10】 文書メモリ中に格納された文字領域の一部
のイメージ情報を示す図
のイメージ情報を示す図
【図11】 図10のイメージ情報をある指定の書式に
編集した結果のイメージ情報を示す図
編集した結果のイメージ情報を示す図
【図12】 図10のイメージ情報を他の指定の書式に
編集した結果のイメージ情報を示す図
編集した結果のイメージ情報を示す図
11・・・文書イメージ記憶手段、12・・・サブ文字
パターン抽出手段、13・・・サブ文字パターン情報記
憶手段、14・・・編集処理手段、141・・・配置処
理手段、142・・・配置判定手段、143・・・配置
ルール記憶手段、21・・・入力装置、22・・・文書
メモリ、23・・・領域分離処理部、24・・・領域情
報メモリ、25・・・配置規則処理部、251・・・サ
ブ文字パターン情報記憶部、252・・・配置判定部、
253・・・26・・・文書編集処理部、261・・・
サブ文字パターン切出し部、262・・・文字配置処理
部、263・・・配置ルール記憶部、27・・・出力装
置。
パターン抽出手段、13・・・サブ文字パターン情報記
憶手段、14・・・編集処理手段、141・・・配置処
理手段、142・・・配置判定手段、143・・・配置
ルール記憶手段、21・・・入力装置、22・・・文書
メモリ、23・・・領域分離処理部、24・・・領域情
報メモリ、25・・・配置規則処理部、251・・・サ
ブ文字パターン情報記憶部、252・・・配置判定部、
253・・・26・・・文書編集処理部、261・・・
サブ文字パターン切出し部、262・・・文字配置処理
部、263・・・配置ルール記憶部、27・・・出力装
置。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06T 11/60 G06F 17/21 G06K 9/20 G06K 9/34
Claims (2)
- 【請求項1】 文書をイメージ情報で保存する文書イメ
ージ記憶手段と、 前記イメージ情報から、サブ文字パターンを抽出するサ
ブ文字パターン抽出手段と、 前記抽出の結果得られたサブ文字パターンに関する情報
を記憶するサブ文字パターン情報記憶手段と、 前記サブ文字パターン情報記憶手段に記憶されたサブ文
字パターン情報をもとに、前記文書イメージ記憶手段に
記憶されたイメージ情報における各サブ文字パターンを
切り出し、所望の領域内に配置ルールに従って再配置す
ることにより、前記イメージ情報で保存された文字ブロ
ックを編集する編集処理手段とを備えたことを特徴とす
る文書処理装置。 - 【請求項2】 前記編集処理手段は、 サブ文字パターンの配置に関する配置ルールを格納する
配置ルール記憶手段と、 前記サブ文字パターン情報記憶手段に記憶されたサブ文
字パターン情報と配置ルール記憶手段に記憶された配置
ルールをもとに行末行頭の配置の是非を判定する配置判
定手段と、 その配置判定手段の判定結果と前記サブ文字パターン情
報記憶手段の記憶するサブ文字パターン情報に基づき、
前記文書イメージ記憶手段に記憶された文書イメージ情
報からサブ文字パターンを切り出して所望の領域内に配
置する配置処理手段とを有することを特徴とする請求項
1記載の文書処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09014692A JP3203749B2 (ja) | 1992-03-17 | 1992-03-17 | 文書処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09014692A JP3203749B2 (ja) | 1992-03-17 | 1992-03-17 | 文書処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH05266168A JPH05266168A (ja) | 1993-10-15 |
JP3203749B2 true JP3203749B2 (ja) | 2001-08-27 |
Family
ID=13990365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09014692A Expired - Fee Related JP3203749B2 (ja) | 1992-03-17 | 1992-03-17 | 文書処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3203749B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5352754A (en) * | 1992-10-26 | 1994-10-04 | Becton, Dickinson And Company | High impact polyurethane |
WO2014050480A1 (ja) * | 2012-09-26 | 2014-04-03 | 富士フイルム株式会社 | 文書画像処理装置ならびにその動作制御方法およびその動作制御プログラム |
-
1992
- 1992-03-17 JP JP09014692A patent/JP3203749B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH05266168A (ja) | 1993-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0543598B1 (en) | Method and apparatus for document image processing | |
EP0690415A2 (en) | Editing scanned document images using simple interpretations | |
US5502777A (en) | Method and apparatus for recognizing table and figure having many lateral and longitudinal lines | |
JPH04195692A (ja) | 文書読取装置 | |
JP2002203207A (ja) | 文字認識方法,プログラム及び記録媒体 | |
JP3203749B2 (ja) | 文書処理装置 | |
JP3215176B2 (ja) | 文書画像処理装置及び文書画像処理方法 | |
JPH0612540B2 (ja) | 文書作成支援装置 | |
JP4281236B2 (ja) | 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体 | |
JPH07121734A (ja) | 文字画像編集装置 | |
JPH07262317A (ja) | 文書処理装置 | |
JP2558668B2 (ja) | 文字パタ−ン抽出方法 | |
JP2569134B2 (ja) | 文字列抽出方法 | |
JP3379663B2 (ja) | 文字認識装置 | |
JP2003256772A (ja) | 文字認識装置及び記録媒体 | |
Kopec et al. | Editing images of text | |
Chao | Graphics extraction in a PDF document | |
JP2993533B2 (ja) | 情報処理装置及び文字認識装置 | |
JP2000067158A (ja) | 文書画像処理方法および文書画像処理方法をコンピュータに実行させるプログラムを記録した機械読み取り可能な記録媒体 | |
JPH0728934A (ja) | 文書画像処理装置 | |
JPH04130979A (ja) | 文字画像切出し方法 | |
JPH0713996A (ja) | 文字認識装置 | |
JP2933947B2 (ja) | 画像処理方法及び装置 | |
JPH09212580A (ja) | 文書画像処理装置 | |
JPH01300385A (ja) | 空白文字の切出し方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |