JP2000293521A - 画像処理方法、装置及び記憶媒体 - Google Patents

画像処理方法、装置及び記憶媒体

Info

Publication number
JP2000293521A
JP2000293521A JP11101982A JP10198299A JP2000293521A JP 2000293521 A JP2000293521 A JP 2000293521A JP 11101982 A JP11101982 A JP 11101982A JP 10198299 A JP10198299 A JP 10198299A JP 2000293521 A JP2000293521 A JP 2000293521A
Authority
JP
Japan
Prior art keywords
character string
block
text
area
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11101982A
Other languages
English (en)
Inventor
Shigeo Nara
茂雄 奈良
Junichiro Kizaki
純一郎 木▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP11101982A priority Critical patent/JP2000293521A/ja
Publication of JP2000293521A publication Critical patent/JP2000293521A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 入力画像から別ブロックとして抽出された文
字列領域のつながりを形態素解析により判断し、内容的
につながりのあるブロックの識別を可能とする。 【解決手段】 連続するブロックのデータを取得し(ス
テップ30−4、30−6)、それらのブロック内の文
字列のつながりを形態素解析により判断し(ステップ3
0−7)、つながっていると判断された場合は一つの文
字格納領域に続けて格納する(ステップ30−9)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力した画像を解
析して文書編集に用い得る情報を取得する技術に関する
ものである。
【0002】本発明は、画像からテキストへの変換に関
する技術である。
【0003】
【従来の技術】近年、画像読み取り装置、OCR(光学
的文字認識。Optical Character R
ecognition)などの普及により、紙の原稿か
ら文字を読み取って文字コード化して文書ファイルを作
成し、さらにその文書ファイルを編集するという機会が
増えてきた。
【0004】
【発明が解決しようとしている課題】しかし、画像読み
取り装置から読み込まれた画像データが、領域分割さ
れ、OCRされて作成された文書ファイルは、 分割された領域が、それぞれ枠に変換されてしまって
いる。 枠と枠の間で、文書としてのつながりがない。 というものであった。従って、編集を行う際には、各領
域単位に領域内のみで編集を行わなければならず、非常
に効率が悪かった。
【0005】
【課題を解決するための手段】上記従来技術の課題を解
決する為に、本発明は、入力した画像情報から複数の文
字列領域を抽出し、前記抽出した複数の文字列領域のつ
ながりを形態素解析によって判断し、前記形態素解析に
よりつながると判断された複数の文字列領域に含まれる
文字を続けて一つの文字格納領域に格納する画像処理方
法、装置及び記憶媒体を提供する。
【0006】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によるつながりの判断
を、連続して位置している複数の文字列領域に対して行
なう。
【0007】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によるつながりの判断
を、連続する二つの文字列領域間で行なう。
【0008】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によるつながりの判断
は、各文字列領域に含まれる文字列をつなげて得た文字
列に対して行なう。
【0009】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によるつながりの判断
は、同じ種類に分類された文字列領域に対して行なう。
【0010】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によるつながりの判断
は、本文に分類された文字列領域に対して選択的に行な
う。
【0011】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によりつながらないと
判断された場合に、当該判断された複数の文字列領域の
先方の文字列領域内の文字列の後に改行コードを挿入し
て当該判断された複数の文字列領域内の文字列を格納す
る。
【0012】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によりつながらないと
判断された場合に、当該判断された複数の文字列領域の
後方の文字列領域が段で最初の文字列領域であるか否か
を更に判断し、前記判断により当該後方の文字列領域が
段で最初の文字列領域であると判断された場合に、その
前の文字列領域内の文字列の後に改段コードを挿入して
当該判断された複数の文字列領域内の文字列を格納す
る。
【0013】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記画像情報はスキャナより入力した
画像情報とする。
【0014】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記一つの文字格納領域に格納された
文字列を、一つの書式に従って出力する。
【0015】
【発明の実施の形態】図1は本発明に係る装置のシステ
ムブロック図である。
【0016】システムバス1は、後述する各構成間での
データの授受を可能にするものである。CPU(Cen
tral Processing Unit)2は、後
述するPMEM3に格納されている制御プログラムに従
って、本発明に係る各種処理を実行するものである。後
述するフローチャートに示す処理も、CPU2により実
行される。PMEM(メモリ)3は、本発明に係る各種
処理の制御プログラムを、適宜ハードディスク10から
選択して読み込み、格納するメモリである。後述するフ
ローチャートに示す処理の制御プログラムもこのPME
M3に格納される。また、PMEM3はテキストメモリ
としても機能し、キーボード12から入力されたテキスト
データや、外部記憶制御部8の制御により外部記憶媒体
9やハードディスク10から読み取ったテキストデータ
も格納する。通信制御部4は、通信ポート5における入
出力データの制御を行なう。通信ポート5は、通信制御
部4による制御の基、LANやWAN等の通信回線6を
介してネットワーク上の他の装置の通信ポート7と接続
し、データの送信及び受信を行なう。ネットワークに接
続されているプリンタへの印字データの送出や、同じく
ネットワークに接続されているスキャナからのデータの
入力も、この通信ポート5を介して行なう。
【0017】外部記憶制御部8は、データファイル用の
メモリ、例えばハードディスク(HD)10や本装置に
着脱可能な外部記憶媒体(例えばフロッピーディスクや
MO、CD−R等)9からのデータの読み込み及びデー
タの書きこみを制御する。入力制御部11は、キーボー
ド12やマウス13等の入力装置からのデータの入力を
せいぎょする。ここで、マウス13はCRT16の表示
画面上で指示される位置の座標を入力する座標入力手段
として機能するものであれば良く、タブレットやタッチ
パネル等であっても良い。更に、指示した座標位置で、
ボタンの押下やタップ等により、選択指示を可能とする
ものであれば良い。マウスを操作することによって、マ
ウスカーソルで表示される指示位置を所望の位置とし、
例えばコマンドメニュー上のコマンドアイコン上に位置
させて、ボタンを押下することによって、そのコマンド
アイコンで表されているコマンドを入力することもでき
る。また、編集対象の指示及び描画位置の指示もマウス
13により可能である。操作者はキーボード12を操作す
ることにより、文字コードの入力及び各種動作命令の入
力を行なう。
【0018】ビデオイメージメモリ(VRAM)14
は、例えばCRT等の表示器に表示する画像を保持する
メモリであり、表示出力制御部15の制御により、表示
データがビットマップデータに展開して書きこまれ、C
RT16に表示される。表示器は、CRTに限定するも
のではなく、液晶表示器であっても良い。プリンタ制御
部17は、接続されているプリンタ18に対するデータ
の出力制御を行なう。プリンタ18は、画像を印字する
手段として機能するものであって、LBP、インクジェ
ットプリンタ等である。画像入力機器制御部1Aは、接
続されている画像入力機器1Bの制御を行なう。画像入
力機器1Bは、載置した原稿を光学的に読みこむスキャ
ナであっても、或はフィルムスキャナであっても良い。
或は画像データを記憶したメモリから読み込む機能を実
行するものであっても良い。図1においては、プリンタ
制御部17とプリンタ18、及び画像入力機器1Bと画
像入力機器制御部1Aとを別の構成として記載したが、
これらは物理的に別々のコンポーネントであっても、一
つのコンポーネントであっても良いことは勿論である。
【0019】尚、本発明は、単体で構成される装置によ
り実現されても良いし、或はネットワークを介して接続
される複数の装置からなるシステムで構成されても良い
ことは勿論である。このネットワークのシステムの一例
を図28に示し、以下説明する。
【0020】図28は、プリンタをネットワークに接続
するためのネットワークボード(NB)101を、開放
型アーキテクチャをも持つプリンタ102へつなげた場
合のネットワークシステム構成図である。NB101は
ローカルエリアネットワーク(LAN)100へ、例え
ば同軸コネクタをもつEthernetインタフェース
10Base−2や、RJ−45を持つ10Base−
T等のLANインタフェースを介して接続されている。
【0021】PC103、PC104、PC111、P
C112やPC115等の複数のパーソナルコンピュー
タ(PC)がLANに接続されており、ネットワークオ
ペレーティングシステムの制御の下、これらのPCはN
B101と通信し、ネットワークに接続された各デバイ
スとして機能するようにすることができる。また、例え
ばPC103を、ネットワークデバイス管理用PCとし
て使用するように指定することができ、このPC103
によってプリンタ102やPC104にローカル接続さ
れたプリンタ105におけるプリント処理を制御しても
良い。
【0022】また、LAN100にファイルサーバPC
104を接続し、このPC104の表示画面上で入力さ
れた指示に応じてLAN100を介してファイルサーバ
106にアクセスし、大容量(例えば100億バイト)
のネットワークディスク107に記憶されたファイルか
らのデータの読み込み及びデータの書き込み、記憶を管
理する。ファイルサーバPC104は、ファイル管理部
として、LANメンバ間でデータのファイルの受信や、
記憶、キューイング、キャッシング、及び送信を行な
う。例えば、PC104自身やPC103によって作ら
れたデータファイルは、ファイルサーバPC104の制
御のもとファイルサーバ106へ送られ、ファイルサー
バ106はこれらのデータファイルを順に並べ、そして
プリントサーバ104からのコマンドに従って、並べら
れたデータファイルをプリンタ110へ送信する。
【0023】スキャナサーバ115は、ローカル接続さ
れたスキャナ117や、遠隔にあるスキャナ110を制
御して画像の入力を行なわせる。複写機118は、イメ
ージプロセッシングユニット119を介してLAN11
0につながり、ネットワーク110を介して接続される
PCの制御のもと、スキャナやプリンタとしても機能す
る。
【0024】またPC103とPC104はそれぞれ、
データファイルの生成や、生成したデータファイルのL
AN100への送信や、また、LAN100からのファ
イルの受信や、更にそのようなファイルの表示及び処理
を行なうことのできる通常のPCで構成される。尚、図
28ではパーソナルコンピュータ機器を図示したが、ネ
ットワークソフトウェアを実行するのに適切であるよう
な、他のコンピュータ機器であっても良い。通常、LA
N100やLAN110などのLANは、一つの建物内
の一つの階又は接続した複数の階でのユーザグループ等
の、幾分ローカルなユーザグループにサービスを提供す
るが、例えば、ユーザが他の建物や他県にいるなど、あ
るユーザが他のユーザから離れるに従って、ワイドエリ
アネットワーク(WAN)を作っても良い。WANは、
基本的には、いくつかのLANを高速度サービス総合デ
ジタルネットワーク(ISDN)電話線等の高速度デジ
タルラインで接続して形成された集合体である。従っ
て、図**に示すように、LAN100と、LAN110
と、LAN120とはバックボーン140を介して接続
されてWANを形成する。これらの接続は、数本のバス
による単純な電気的接続である。それぞれのLANは専
用のPCを含み、また、必ずしも必要なわけではない
が、通常はファイルサーバ及びプリントサーバを含む。
LAN100と、LAN110と、LAN120とに接
続されている機器は、WAN接続を介して、他のLAN
の機器の機能にアクセスすることができる。
【0025】図2は、装置(2−1)に画像入力機器1
Bの一例である画像読み取り装置(2−2)をつなげた
システムの斜視図である。
【0026】次に、後述する「本文領域と他の領域との
分別方法」に重要な役割を果たすファイル形式であるPA
F(Page Analysis Format)について説明する。
【0027】PAFとは、画像データをその画像データを
解析して得られる画像特徴に従い、同一の属性を有する
ひとかたまりの領域を一つの矩形として領域分割し、そ
の分割されたブロック(矩形領域)毎にデータ(ブロッ
ク領域を特定する為のデータと、そのブロックの画像の
特徴を表すデータとを含む)を保持する形式のファイル
フォーマットであり、ブロックの種類(テキストブロッ
ク、画像ブロック、ラインブロック、テーブルブロッ
ク)が異なれば、それぞれの種類に適した必要なデータ
を保持している。例えば、図3に示す画像データを画像
入力機器1Bから入力すると、図4に示すような領域分
割が行われる。例えば、4−1、4−2に示すようなテ
キストブロック(全てがテキストと判断されたブロッ
ク)、4−3に示すような画像ブロック、4−4に示す
ようなラインブロック、4−5に示すようなテーブルブ
ロック(表ブロック)等に領域分割され、各ブロックの
種類が判定される。
【0028】図5を用いて、PAFの構造を更に詳細に説
明する。このPAFのデータは、画像入力機器1Bから
入力した画像データをCPU2により解析してHD10
に格納されるものである。5−1がPAFの全体であっ
て、先頭に「ヘッダ」領域を持ち、次に「ブロック管理
データ」、そしてブロック管理データによって管理され
る「ブロック内データ」とメモリ領域が続く。5−2に
示すように、「ヘッダ」領域には、ファイル全体のファ
イルサイズ、ファイル全体から抽出されたブロックの総
数を表わすブロック保有数、そして読み込まれた画像
(イメージ)の幅/高さをピクセル数で保持し、さらに
どのようなDPI(dot/inch)サイズで読み込ま
れた画像データであったかも保持している。
【0029】「ブロック管理データ」領域には、各ブロ
ックごとにそのブロックの読み込まれたイメージにおけ
る位置を表わすレイアウト情報や、そのブロックの画像
の属性情報を格納する。即ち、PAFデータはヘッダ5
−1内のブロック数に相当する数のブロック管理データ
領域を有する。用紙左からの距離、用紙上からの距離、
及びそれぞれのブロックの領域の横/縦サイズをピクセ
ル数で保持し、さらにブロックがどのような種類のデー
タを保持しているかを示すテーブルも持っている。ここ
までがどの種類のブロックでも共通に格納しているデー
タであり、以降がブロックの種類によって異なる。例え
ば、5−3に示す「テキストブロック管理データ」の場
合は、ブロック内データの存在位置を示すオフセットを
持ち、さらにそのテキストの言語情報(ブロック内のテ
キストは、日本語主体なのか英語主体なのか)、テキス
トの組方向(横書きなのか縦書きなのか)を持ってい
る。5−4に示す「画像ブロック管理データ」の場合
は、ブロック内画像データの存在位置を示すオフセット
を持ち、5−5に示す「ラインブロック管理データ」の
場合は、ラインのスタートとエンド位置を示すそれぞれ
の(X、Y)ポジション、及びラインの種類や太さを示す
テーブルを持っている。
【0030】「ブロック内データ」領域は、それぞれの
ブロック内データの種類により異なっている。例えば
「テキストブロック内データ」領域の場合は、対応づけ
られているブロック解離データにより規定されているブ
ロックの画像データを文字認識した結果のテキストデー
タを格納する領域であって、文字コード列と、各文字画
像を抽出した時に得た文字や行等の配置を表わすレイア
ウト情報とを含むものである。5−6に示すように、先
頭にOCR管理データを持ち、次に1行目から最終行まで
の行情報領域、さらに1行目の先頭文字から最終行の最
終文字までの文字情報領域を保持している。OCR管理デ
ータ5−7は、ブロック内の全行数、平均された行間値
(それぞれの行間隔を足して、行間数で割ったもの)、
及びブロックの横/縦サイズをピクセル数で保持してい
る。行情報5−8は、各行ごとの文字のレイアウト情報
等を格納する領域であって、行内に存在する全文字数、
先頭文字までのインデント値、さらに平均された文字間
値(それぞれの文字間隔を足して、文字間数で割ったも
の)、及び行末に改行が存在しているか否かを示すフラ
グを保持している。この改行が存在しているか否かの判
定は、その行の末尾からブロック領域の端までの距離に
よって行なう。文字情報5−9は、それぞれの文字毎
に、その文字の文字画像を抽出した位置(ブロックの左
/上からの距離)、文字幅、文字高、フォントタイプ、
フォントスタイル、フォントサイズ、そしてOCRした結
果の文字コードを保持している。この結果の文字コード
は、認識処理時の類似度が最高のものを1つのみでも良
いし、或は複数の候補文字のコードであっても良い。
【0031】次に原稿を画像読み取り装置2−2から読
み込んだ画像データをどのように本文領域と他の領域と
に分別するかの処理を図11、図12、図13、図1
4、図15、図16のフローチャートに従って説明す
る。
【0032】まず、ステップ11−1において、画像読
み取り装置2−2から画像データを読み込む。さらにス
テップ11−2において、読み込んだ画像データをOCR
エンジンを用いてPAF(Page Analysis Format)に変換す
る。例えば、図6に示すような原稿を画像読み取り装置
2−2に載置して読み取った場合の画像データは、領域
分割が行われて図7に矩形枠で示すようなブロックが抽
出される。7−1、7−2、7−3、7−4、7−5に
示すブロックは、テキストブロック、即ち文字列のみを
含む領域であり、組方向は、横書きである。7−6に示
すブロックもテキストブロックであるが、組方向は縦書
きである。7−7、7−8に示すのが、ラインブロック
であると、領域分割処理において判定が行なわれ、図5
に示したようなPAFデータを作成してHD10に格納
される。
【0033】PAFに変換後、ステップ11−3におい
て、本文領域用のブロックと他の領域ブロックの分別処
理を行うために「本文用ブロックと他のブロックの分別
処理」を実行する。
【0034】図12に示すフローチャートは、「本文用
ブロックと他のブロックの分別処理」(ステップ11−
3)の詳細な処理を示すものである。ステップ12−1
において、まず全テキストブロックの全てのフォントサ
イズ(5−9に示す文字情報のフォントサイズ)を調査
し、最も数の多いフォントサイズを求め、HD10に最
多フォントサイズ情報としてそのフォントサイズを記憶
する。そして、ステップ12−2において、ヘッダ領域
用のテキストブロックを抽出するために「ヘッダ領域用
テキストブロックの抽出処理」を実行する。
【0035】図13に示すフローチャートが、「ヘッダ
領域用テキストブロックの抽出処理」(ステップ12−
2)の詳細な処理を示すものであり、ステップ13−1
において、PAF内のブロックのうち、Yポジション(5
−3に示す「テキストブロック管理データ」の用紙上か
らの距離)の最も小さなテキストブロックを取得する。
同じYポジションのテキストブロックが存在する場合
は、Xポジション(5−3に示す「テキストブロック管
理データ」の用紙左からの距離)の小さなブロックを取
得する。さらにステップ13−2において、そのテキス
トブロックの組方向(5−3に示す「テキストブロック
管理データ」の組方向)を調査し、横書きかどうかを判
断する。横書きでなかった場合は、ヘッダ領域用ブロッ
クではないと判断し、「ヘッダ領域用テキストブロック
の抽出処理」を終了する。横書きであった場合は、ステ
ップ13−3において、ブロック内の行数(5−7に示
すOCR管理データの行数)を調査し、1行のみのブロッ
クか否かを判断する。2行以上のブロックであった場合
は、ヘッダ領域用ブロックではないと判断し、「ヘッダ
領域用テキストブロックの抽出処理」を終了する。1行
のみのブロックであった場合は、ステップ13−4にお
いて、図12のステップ12−1で求め記憶した最多フ
ォントサイズと比較し、そのブロックの平均フォントサ
イズが、全テキストブロックの最多フォントサイズの
1.5倍以下かどうかを判断する。1.5倍以下でなか
った場合は、ヘッダ領域用ブロックではないと判断し、
「ヘッダ領域用テキストブロックの抽出処理」を終了す
る。1.5倍以下であった場合は、そのテキストブロッ
クは、ヘッダ領域用テキストブロックであると判断し、
HD10にヘッダ領域用テキストブロックとしてそのブ
ロックの識別情報を記憶する。これで、最初のヘッダ領
域用テキストブロック(ヘッダ領域用テキストブロック
の第1要素とする)が求められた。次にステップ13−
6において、Yポジション(5−3に示す「テキストブ
ロック管理データ」の用紙上からの距離)の次に小さな
テキストブロック(同じYポジションのブロックが存在
した場合は、Xポジションの小さなブロック)を取得
し、ステップ13−7において、そのブロックが、ステ
ップ13−5で記憶したテキストブロックの2行分の範
囲に存在しているブロックかを判断する。例えば、図8
の8−1に示すテキストブロックが、ヘッダ領域用テキ
ストブロックの第1要素であるとしてステップ13−5
で記憶された場合、その2行分の範囲とは、テキストブ
ロック8−1のブロック縦サイズ5−7を2倍したサイ
ズをテキストブロック8−1の用紙上からの距離5−4
を起点にして定めた範囲であって、8−2と8−3に示
す線分間の範囲である。従って、8−4に示すテキスト
ブロックは、範囲内であり、8−5に示すテキストブロ
ックは、範囲外となる。即ち、ステップ13−7では、
定めた範囲内にステップ13−6で取得したブロックが
完全に含まれるものを「範囲内である」と判定するもの
である。ステップ13−6において、取得したテキスト
ブロックが範囲外と判断された場合は、ヘッダ領域用の
テキストブロックであって、未判定のブロックはもう存
在しないと判断し、「ヘッダ領域用テキストブロックの
抽出処理」を終了する。ステップ13−7において、ヘ
ッダ領域用テキストブロックの第1要素の2行分の範囲
内と判断された場合は、ステップ13−8において、そ
のテキストブロックの組方向(5−3に示す「テキスト
ブロック管理データ」の組方向)を調査し、横書きかど
うかを判断する。横書きでなかった場合は、ヘッダ領域
用ブロックではないと判断し、再びステップ13−6に
戻り、次に対象となるテキストブロックを取得する。横
書きであった場合は、ステップ13−9において、ブロ
ック内の行数(5−7に示すOCR管理データの行数)を
調査し、1行のみのブロックかを判断する。2行以上の
ブロックであった場合は、ヘッダ領域用ブロックではな
いと判断し、再びステップ13−6に戻り、次に対象と
なるテキストブロックを取得する。1行のみのブロック
であった場合は、ステップ13−10において、ステッ
プ13−5にて記憶したヘッダ領域用テキストブロック
の平均フォントサイズと当テキストブロックの平均フォ
ントサイズを比較し、サイズの差が20%以内かどうか
を判断する。サイズの差が20%以内でなかった場合
は、再びステップ13−6に戻り、次に対象となるテキ
ストブロックを取得する。サイズの差が20%以内であ
った場合は、ステップ13−11において、そのテキス
トブロックをヘッダ領域用テキストブロックとして、H
D10にそのブロックの識別情報を記憶する。
【0036】上記処理により、1つあるいは複数のヘッ
ダ領域用テキストブロックが求められるヘッダ領域用テ
キストブロックの抽出処理(ステップ12−2)が完了
する。
【0037】次に図12のステップ12−3において、
フッタ領域用のテキストブロックを抽出するための「フ
ッタ領域用テキストブロックの抽出処理」を実行する。
【0038】図14に示すフローチャートが、「フッタ
領域用テキストブロックの抽出処理」(ステップ12−
3)の詳細な処理を示すものであり、ステップ14−1
において、PAF内のブロックのうち、Yポジション(5
−3に示す「テキストブロック管理データ」の用紙上か
らの距離)の最も大きなテキストブロックを取得する。
同じYポジションのテキストブロックが存在する場合
は、Xポジション(5−3に示す「テキストブロック管
理データ」の用紙左からの距離)の小さなブロックを取
得する。さらにステップ14−2において、そのテキス
トブロックの組方向(5−3に示す「テキストブロック
管理データ」の組方向)を調査し、横書きかどうかを判
断する。横書きでなかった場合は、フッタ領域用ブロッ
クではないと判断し、「フッタ領域用テキストブロック
の抽出処理」を終了する。横書きであった場合は、ステ
ップ14−3において、ブロック内の行数(5−7に示
すOCR管理データの行数)を調査し、1行のみのブロッ
クかを判断する。2行以上のブロックであった場合は、
フッタ領域用ブロックではないと判断し、「フッタ領域
用テキストブロックの抽出処理」を終了する。1行のみ
のブロックであった場合は、ステップ14−4におい
て、図12のステップ12−1で求め記憶した最多フォ
ントサイズと比較し、そのブロックの平均フォントサイ
ズが、全テキストブロックの最多フォントサイズの1.
5倍以下かどうかを判断する。1.5倍以下でなかった
場合は、フッタ領域用ブロックではないと判断し、「フ
ッタ領域用テキストブロックの抽出処理」を終了する。
1.5倍以下であった場合は、そのテキストブロック
は、フッタ領域用テキストブロックであると判断し、H
D10にフッタ領域用テキストブロックとしてそのブロ
ックの識別情報を記憶する。これで、最初のフッタ領域
用テキストブロック(フッタ領域用テキストブロックの
第1要素とする)が求められた。次にステップ14−6
において、Yポジション(5−3に示す「テキストブロ
ック管理データ」の用紙上からの距離)の次に大きなテ
キストブロック(同じYポジションのブロックが存在し
た場合は、Xポジションの小さなブロック)を取得す
る。ただし、ステップ14−1或は以前のステップ14
−6においてYポジションが同じで処理が保留されてい
るブロックがある場合は、そのブロックのを取得する。
ステップ14−7において、そのブロックが、ステップ
14−6で記憶したテキストブロックの2行分の範囲に
存在しているブロックかを判断する。この2行分の範囲
の求め方はステップ13−7に準ずるものであるが、範
囲を定める起点を第1の要素のブロックの用紙上からの
距離にブロック縦サイズを加算した距離とする点が異な
る。例えば、図8の8−6に示すテキストブロックが、
フッタ領域用テキストブロックの第1要素であった場
合、その2行分の範囲とは、8−7と8−8に示す線分
間である。従って、8−9、8−10に示すテキストブ
ロックは、範囲内であり、8−11に示すテキストブロ
ックは、範囲外となる。ステップ14−6において、取
得したテキストブロックが範囲外と判断された場合は、
フッタ領域用のテキストブロックであって、未判定のブ
ロックはもう存在しないと判断し、「フッタ領域用テキ
ストブロックの抽出処理」を終了する。ステップ14−
7において、フッタ領域用テキストブロックの第1要素
の2行分の範囲内と判断された場合は、ステップ14−
8において、そのテキストブロックの組方向(5−3に
示す「テキストブロック管理データ」の組方向)を調査
し、横書きかどうかを判断する。横書きでなかった場合
は、フッタ領域用ブロックではないと判断し、再びステ
ップ14−6に戻り、次に対象となるテキストブロック
を取得する。横書きであった場合は、ステップ14−9
において、ブロック内の行数(5−7に示すOCR管理デ
ータの行数)を調査し、1行のみのブロックか否かを判
断する。2行以上のブロックであった場合は、フッタ領
域用ブロックではないと判断し、再びステップ14−6
に戻り、次に対象となるテキストブロックを取得する。
1行のみのブロックであった場合は、ステップ14−1
0において、ステップ14−5にて記憶したフッタ領域
用テキストブロックの平均フォントサイズと当テキスト
ブロックの平均フォントサイズを比較し、サイズの差が
20%以内かどうかを判断する。サイズの差が20%以
内でなかった場合は、再びステップ14−6に戻り、次
に対象となるテキストブロックを取得する。サイズの差
が20%以内であった場合は、ステップ14−11にお
いて、そのテキストブロックをフッタ領域用テキストブ
ロックとして、HD10にそのブロックの識別情報を記
憶する。上記処理により、1つあるいは複数のフッタ領
域用テキストブロックが求めるフッタ領域用テキストブ
ロックの抽出処理(ステップ12−3)が完了する。
【0039】次に図12のステップ12−4において、
枠領域用のブロックを抽出するための「枠領域用ブロッ
クの抽出処理」を実行する。図15に示すフローチャー
トが、「枠領域用ブロックの抽出処理」(ステップ12
−4)の詳細な処理を示すものである。
【0040】ステップ15−1において、既に求めて記
憶したヘッダ領域用テキストブロック及びフッタ領域用
テキストブロック以外の全テキストブロックから、主と
なる組方向を求め、本文領域用の組方向とする。主とな
る組方向は、以下のようにして求める。ヘッダ領域用テ
キストブロック及びフッタ領域用テキストブロック以外
の全テキストブロックのそれぞれの面積(5−3に示す
テキストブロック管理データのブロック横/縦サイズか
ら求める)をそれぞれの組方向(5−3に示すテキスト
ブロック管理データの組方向)別に合計し、面積の大き
い方を主となる組方向とする。
【0041】次にステップ15−2において、PAF内の
ブロックのうち、既に求めて記憶したヘッダ領域用テキ
ストブロック及びフッタ領域用テキストブロック以外の
全テキストブロックの中で、Yポジション(5−3に示
す「テキストブロック管理データ」の用紙上からの距
離)の最も小さなブロックを取得する。同じYポジショ
ンのブロックが存在する場合は、Xポジション(5−
3、5−4、5−5に示す「ブロック管理データ」の用
紙左からの距離)の小さなブロックを取得する。もう該
当するブロックが存在しないのであれば、ステップ15
−3においてそれを判断し、「枠領域用ブロックの抽出
処理」を終了する。該当するブロックが存在する場合
は、ステップ15−4において、そのブロックの種類
(5−3、5−4、5−5に示す「ブロック管理デー
タ」のブロックの種類)が画像であるか否かを判定し、
画像ブロックであった場合は、ステップ15−5におい
て、画像枠として抽出してHD10にそのブロックの識
別情報と記憶する。画像ブロックでないと判定された場
合は、ステップ15−6において、さらにブロックの種
類(5−3、5−4、5−5に示す「ブロック管理デー
タ」のブロックの種類)がテーブルであるか否かを判定
し、テーブルブロックであった場合は、ステップ15−
7において、テーブル枠として抽出してHD10にその
ブロックの識別情報と記憶する。テーブルブロックでな
いと判定された場合は、ステップ15−8において、さ
らにブロックの種類(5−3、5−4、5−5に示す
「ブロック管理データ」のブロックの種類)がラインで
あるか否かを判定し、ラインブロックであった場合は、
ステップ15−9において、ラインデータとして抽出し
てHD10にそのブロックの識別情報と記憶する。ライ
ンブロックでないと判定された場合は、ステップ15−
10において、さらにブロックの種類(5−3、5−
4、5−5に示す「ブロック管理データ」のブロックの
種類)がテキストであるか否かを判定し、テキストブロ
ックであった場合は、ステップ15−11において、
「テキストブロックチェック処理」を実行する。
【0042】図16に示すフローチャートが「テキスト
ブロックチェック処理」(ステップ15−12)の詳細
な処理を示すものである。
【0043】ステップ16−1において、ブロック管理
データを用いてそのテキストブロックは、ヘッダ領域に
跨っているかどうかを判断し、跨っている場合は本文領
域になり得ないので、テキスト枠として抽出した旨をリ
ターンする(ステップ16−6)。ヘッダ領域に跨って
いない場合は、ステップ16−2において、フッタ領域
に跨っているかどうかを判断し、跨っている場合は、本
文領域になり得ないので、テキスト枠として抽出した旨
をリターンする(ステップ16−6)。フッタ領域にも
跨っていない場合は、ステップ16−3において、ステ
ップ15−1で求め記憶した組方向と当テキストブロッ
クの組方向とを比較し、異なっている場合は、本文領域
になり得ないので、テキスト枠として抽出した旨をリタ
ーンする(ステップ16−6)。同じ組方向であった場
合は、ステップ16−4において、そのテキストブロッ
クの最も多いフォントサイズが、ステップ12−1にお
いて求め記憶した全体のテキストブロックの最多フォン
トサイズの2倍以上かを判断し、2倍以上であった場合
は、テキスト枠として抽出した旨をリターンする(ステ
ップ16−6)。2倍以上でなかった場合は、本文領域
として抽出した旨をリターンする(ステップ16−
5)。
【0044】ステップ15−12において、「テキスト
ブロックチェック処理」におけるステップ16−5或は
ステップ16−6でリターンされたデータを判断し、テ
キスト枠である旨を示すデータならば、ステップ15−
13において、ステップ15−2で取得したテキストブ
ロックをテキスト枠として抽出してHD10にそのブロ
ックの識別情報と記憶する。
【0045】上記の処理により、各ブロックを分類して
本文領域用と他の領域用のブロックに分別した記憶が完
了し、図11のステップ11−4における、本文書式の
作成を開始する。
【0046】図12〜図16のフローチャートに沿って
説明してきた「本文領域と他の領域との分別処理」(ス
テップ11−3)を図6に示す画像データに対して実行
した場合の結果を具体的に説明する。
【0047】ステップ11−2において読み取った画像
データをOCRエンジンを用いてPAFに変換した結果の各ブ
ロック(図7)に対して「本文用ブロックと他のブロッ
クの分別処理」を実行すると、まずステップ12−2に
おいて、ヘッダ領域用テキストブロックとして、図7の
7−1、7−2に示すテキストブロックが分別される。
続いてステップ12−3において、フッタ領域用テキス
トブロックとして、図7の7−3、7−4、7−5に示
すテキストブロックが分別される。そして、ステップ1
2−4において、枠領域用ブロックとして、図7の7−
6に示すテキストブロック、7−7、7−8に示すライ
ンブロックが分別され、これらの分別されたブロック以
外の図9に示すテキストブロックが、本文領域用として
分別される。この結果、図9に示す18個の各領域が本
文領域用ブロックとして分別された領域である。
【0048】尚、図13のフローチャートに示したヘッ
ダ領域用テキストブロックの抽出処理では、判定対象と
しているブロックがヘッダ領域用テキストであるか否か
を判定する基準の一つとして、ステップ13−4におい
てそのブロックの平均フォントサイズが全テキストブロ
ックの最多フォントサイズの1.5倍以下か否かという
判断を行なったが、そのブロックの平均フォントサイズ
をユーザにより指定された数値と比較するようにしても
良い。この場合のヘッダ領域用テキストブロックの抽出
処理のフローチャートを図17に示す。ステップ13−
4に替えて、ステップ17−4において、そのブロック
の平均フォントサイズがユーザによって指定されたポイ
ントサイズ以下か否かを判断する。指定されたポイント
サイズ以下でなかった場合は、ヘッダ領域用ブロックで
ないと判断し、「ヘッダ領域用テキストブロックの抽出
処理」を終了する。指定されたポイントサイズ以下であ
ると判断された場合は、そのテキストブロックはヘッダ
領域用テキストブロックであると判断し、HD10にヘ
ッダ領域用テキストブロックとしてそのブロックの識別
情報を記憶する。図17のフローチャートにおいて、ス
テップ17−4以外の処理は図13のフローチャートに
示した処理と同じであり、同ステップには同ステップ番
号を付した。
【0049】また、ヘッダ領域用テキストブロックの抽
出処理に合わせ、フッタ領域用テキストブロックの抽出
においてもユーザにより指定された数値との比較ステッ
プに置き替える。この処理を示すのが図18のフローチ
ャートであって、図14のフローチャートにおけるステ
ップ14−4に替えてステップ18−4を実行する。ス
テップ18−4において、そのブロックの平均フォント
サイズが、ユーザによって指定されたポイントサイズ以
下か否かを判断する。ユーザによって指定されたポイン
トサイズ以下でなかった場合は、フッタ領域用ブロック
ではないと判断し、「フッタ領域用テキストブロックの
抽出処理」を終了する。ユーザによって指定されたポイ
ントサイズ以下であった場合は、そのテキストブロック
は、フッタ領域用ブロックであると判断し、HD10に
フッタ領域用テキストブロックとしてそのブロックの識
別情報を記憶する。図18のフローチャートにおいて、
ステップ18−4以外の処理は図14のフローチャート
に示した処理と同じであり、同ステップには同ステップ
番号を付した。尚、ステップ17−4及びステップ18
−4で用いるユーザにより指定されたポイントサイズと
は、これらの処理が実行される以前にHD10にユーザ
指定ポイントサイズのパラメータとして予め記憶された
データであって、キーボード12或はマウス13より入
力された数値である。
【0050】次に、図16のフローチャートに示した
「テキストブロックチェック処理」におけるステップ1
6−4において、本文領域として抽出するか否かを判定
する基準の一つとして2倍というパラメータを用いた処
理に替えて、ユーザにより指定された数値を用いる処理
について説明する。その処理を示すのが図19のフロー
チャートであって、ステップ19−4においてそのテキ
ストブロックの最多フォントサイズが、ステップ12−
1において求めて記憶した全体のテキストブロックの最
多フォントサイズにユーザが指定した倍率をかけた値以
上か否かを判断する。ここで指定倍以上であると判断さ
れた場合は、テキスト領域として抽出した旨をリターン
し(ステップ16−6)、指定倍以上でないと判断され
た場合は、本文領域として抽出した旨をリターンする
(ステップ16−5)。
【0051】図19のフローチャートにおいて、ステッ
プ19−4以外の処理は図16のフローチャートに示し
た処理と同じであり、同ステップには同ステップ番号を
付した。ステップ19−4で用いるユーザにより指定さ
れた倍率とは、これらの処理が実行される前にHD10
にユーザ指定倍率のパラメータとして予め記憶されたデ
ータであって、キーボード12或はマウス13より入力
された数値である。
【0052】ここで、ステップ11−4における本文書
式の作成処理について説明する。尚、ここで作成される
書式とは、通常のワープロソフト等で作成される文書の
書式と同様のものであって、その設定された位置から先
の文書のレイアウトを定めるものであり、後の編集作業
において改頁が挿入された場合には、次頁のレイアウト
も同じにするものである。即ち、その書式が作成された
時の領域サイズに関わらず、その後の文字の挿入や削除
に合わせて制御対象領域が伸縮するものである。
【0053】図20に示すフローチャートが、ステップ
11−4における「本文書式の作成処理」の詳細な処理
ステップである。
【0054】ステップ20−1において、図5のPAFの
ヘッダ領域5−2のイメージ幅情報及びイメージ高さ情
報により表わされる処理対象としてスキャナより入力し
たイメージより大きくかつ最も近い定型用紙サイズ(A
3、A4、A5、B4、B5等であって、用紙の種類の識
別情報と各用紙の縦横サイズとを対応づけて予めHD1
0に登録しておいたものとする。)を本文書式の用紙サ
イズに決定し、HD10に記憶する。その際、イメージ
幅と決定した定型用紙の幅との差、及びイメージ高と定
型用紙の高さとの差も算出してHD10に記憶してお
く。
【0055】次にステップ20−2において、本文領域
用として残ったテキストブロック群(図9)を包み込む
最小矩形を(図10、枠9−1)本文領域として、左右
上下余白を決定する。この時、ステップ20−1におい
て記憶したイメージ幅と決定した定型用紙幅との差、及
びイメージ高と決定した定型用紙高との差を考慮し、左
右上下余白値を算出し、HD10に記憶する。例えば、
図10の9−1に示す矩形が、本文領域用のテキストブ
ロック群を包み込む最小矩形であるので、この矩形領域
を本文領域とする。そして、9−2、9−3、9−4、
9−5に示すのが、それぞれ左右上下余白となるので、
本文書式として決定する左余白値には、9−2に示す入
力イメージにおける左端から、本文領域までの巾である
左余白+(定型用紙幅−イメージ幅)/2を設定する。
同様に右余白値にも、9−3に示す入力イメージにおけ
る右端から本文領域までの巾である右余白+(定型用紙
幅−イメージ幅)/2を設定する。また、上余白値に
は、9−4に示す入力イメージにおける上端から本文領
域までの高さである上余白+(定型用紙高−イメージ
高)/2を設定する。同様に下余白値にも、9−5に示
す入力イメージにおける下端から本文領域までの高さで
ある下余白+(定型用紙高−イメージ高)/2を設定す
る。
【0056】次にステップ20−3において、図15の
ステップ15−1で記憶した主となる組方向を本文書式
の組方向としてHD10に記憶する。さらに、ステップ
20−4において、本文領域用のテキストブロック全て
のフォントサイズ(5−9に示す文字情報のフォントサ
イズ)を調査し、最も数の多いフォントサイズを求め、
本文書式の文字サイズとしてHD10に記憶する。そし
て、ステップ20−5において、本文領域用のテキスト
ブロック全ての平均文字間(5−8に示す行情報の平均
文字間)を調査し、最も数の多い平均文字間を求め、求
めた平均文字間と本文書式の文字サイズ(ステップ20
−4においてHD10に記憶)とを足した値で本文領域
の幅を割った商を文字数/行に設定し、HD10に記憶
する。さらに、ステップ20−6において、書体に明朝
体を設定してHD10に記憶し、ステップ20−7にお
いて、本文領域用のテキストブロック全ての平均行間
(5−7に示すOCR管理データの平均行間)を調査し、
最も数の多い平均行間を求め、求めた平均行間と本文書
式の文字サイズ(ステップ20−4においてHD10に
記憶)を足した値で本文領域の高さを割った商を行数/
頁に設定し、HD10に記憶する。
【0057】次にステップ20−8において、本文書式
の段組関係の設定を行う。まず段数の決定方法は、本文
領域用のテキストブロック群をどのテキストブロックも
分割せずに、かつ他の矩形を重ならずに最多のテキスト
ブロックを含むことのできる矩形で分割した時、各矩形
の最小Y座標値を示すYポジションの最も小さな矩形が
いくつ存在するかを求め、それを本文書式の段数として
DH10に記憶する。また、複数段の場合には、それぞ
れの矩形の幅を段幅に、矩形間を段間に設定する。矩形
間にラインデータが存在すれば、段間罫線として設定す
る。例えば、図22において点線枠で示す10−3、1
0−4、10−5の3つの矩形内に存在し、各矩形によ
り分割されているのが、先に説明した処理により判別し
た本文領域用のテキストブロック群である。10−3に
示す矩形が、Yポジションの最も小さな矩形であるの
で、この場合は、1段組が設定される。また、この場合
は、1段組であるので、段幅には本文領域の幅と同じ値
が設定される。
【0058】次に、ステップ17−9において、途中段
組変更の設定を行う。ステップ20−8で設定された矩
形を除いた矩形の中でステップ20−8で行なったと同
じYポジションの判定を行なって頁の途中から段組が変
わると判断された場合は、段組変更が生じるYポジショ
ン、新たな段数、段幅、段間を設定する。例えば、図2
2の場合、ステップ20−8で矩形10−3が段組設定
されたので残りの10−4、10−5に示す矩形のYポ
ジションを判定すると、この2つの矩形のYポジション
が同じであると判定できることにより、この2つの矩形
から、頁の途中から変更になる段組の書式を設定すべき
であると判断し、10−4に示す矩形のYポジションを
変更ポジションに設定し、このYポジションに矩形が2
つあることから段数には2段組、段幅にはそれぞれの矩
形の幅、段間には矩形間を設定する。また、10−6、
10−7に示すラインデータは、図15のステップ15
−9において、メモリに記憶されているもので、10−
6、10−7に示すラインデータのラインブロック管理
データ(図5の5−5に示す)を調査すると、それぞれ
のスタートポジションX/エンドポジションXの値が同
じであり、線種も太さも同じことから、1本の段間罫線
として設定する。
【0059】以上図20のフローチャートに従って述べ
た本文領域テキストブロック群からの本文書式作成処理
は、例えば、ヘッダ/フッタ領域用のテキストブロック
からヘッダ/フッタ書式を決定し、本文書式へ含めても
良いし、ヘッダ/フッタ領域用のテキストブロック内の
ひげ付き数字から頁番号を本文書式に設定しても良い。
以下、図21に示す「本文書式の作成処理」の第二例の
フローチャートに従い、これらのヘッダ、フッタ及び頁
番号を本文書式に設定する処理について説明する。
【0060】ただし、ステップ20−1から20−9ま
での各処理ステップは図20のフローチャートにおいて
説明した処理ステップと同様なので、図21のフローチ
ャートにおいても同じステップ番号を付し、ここでの説
明を省略する。
【0061】次にステップ21−10において、図13
に示す「ヘッダ領域用テキストブロックの抽出処理」で
抽出しHD10に記憶したヘッダ領域用テキストブロッ
ク群を包み込む最小の矩形をヘッダ領域とし、ヘッダ書
式を決定する。この時、ステップ20−1において記憶
したイメージ幅と決定した定型用紙幅との差、及びイメ
ージ高と決定した定型用紙高との差を考慮し、ヘッダ領
域の左上余白値を決定し、HD10に記憶する。例え
ば、図22の10−1に点線枠で示す矩形が、ヘッダ領
域用のテキストブロック群を包み込む最小矩形であるの
で、この矩形領域をヘッダ領域とする。そして、10−
8、10−9に示すのが、それぞれ左上余白となるの
で、左余白値には、10−8に示す左余白+(定型用紙
幅−イメージ幅)/2を設定し、上余白値には、10−
9に示す上余白+(定型用紙高−イメージ高)/2を設
定する。また、ヘッダ領域のサイズには、ヘッダ領域用
テキストブロックを包み込む最小矩形の幅と高さを設定
し、HD10に記憶する。
【0062】ヘッダ書式の文字サイズは、ヘッダ領域内
のテキストブロック全てのフォントサイズ(5−9に示
す文字情報のフォントサイズ)を調査し、最も数の多い
フォントサイズを求め、ヘッダ書式の文字サイズとして
HD10に記憶する。また、文字数/行には、ヘッダ領
域用のテキストブロック全ての平均文字間(5−8に示
す行情報の平均文字間)を調査し、最も数の多い平均文
字間を求め、求めた平均文字間とヘッダ書式の文字サイ
ズを足した値でヘッダ領域の幅を割った商を文字数/行
に設定し、HD10に記憶する。
【0063】次にステップ21−11において、図14
に示す「フッタ領域用テキストブロックの抽出処理」で
抽出し記憶したフッタ領域用テキストブロック群を包み
込む最小の矩形をフッタ領域とし、フッタ書式を決定す
る。この時、ステップ20−1において記憶したイメー
ジ幅と決定した定型用紙幅との差、及びイメージ高と決
定した定型用紙高との差を考慮し、フッタ領域の左上余
白値を決定し、HD10に記憶する。例えば、図22の
10−2に点線枠で示す矩形が、フッタ領域用のテキス
トブロック群を包み込む最小矩形であるので、この矩形
領域をフッタ領域とする。そして、10−10、10−
11に示すのが、それぞれ左余白及び下余白となるの
で、左余白値には、10−10に示す左余白+(定型用
紙幅−イメージ幅)/2を設定し、下余白値には、10
−11に示す下余白+(定型用紙高−イメージ高)/2
を設定する。また、フッタ領域のサイズには、フッタ領
域用テキストブロックを包み込む最小矩形の幅と高さを
設定し、HD10に記憶する。
【0064】フッタ書式の文字サイズは、フッタ領域内
のテキストブロック全てのフォントサイズ(5−9に示
す文字情報のフォントサイズ)を調査し、最も数の多い
フォントサイズを求め、フッタ書式の文字サイズとして
HD10に記憶する。また、文字数/行には、フッタ領
域用のテキストブロック全ての平均文字間(5−8に示
す行情報の平均文字間)を調査し、最も数の多い平均文
字間を求め、求めた平均文字間とフッタ書式の文字サイ
ズを足した値でフッタ領域の幅を割った商を文字数/行
に設定し、HD10に記憶する。
【0065】次にステップ21−12において、ヘッダ
領域内とフッタ領域内に”ひげ”付き数字が存在するか
を調査する。すなわち、”−1−”、”(1)”、”<
1>”等、ひげに挟まれた数字が存在した場合、その”
ひげ”の種類、存在した領域(ヘッダ領域かフッタ領
域)、存在した位置(各領域の左上からのポジション)
を本文書式の頁番号に設定し、HD10に記憶する。
【0066】以上、図20或は図21のフローチャート
に示す処理により作成された各書式データは、一つの原
稿画像から抽出されたものをまとめて、その画像と関連
づけてHD10に記憶する。これは、その画像から得た
PAF内に記憶しても良いし、或は、PAF内に書式デ
ータを記憶しているHD10内の位置を示すアドレスを
記憶させても良い。
【0067】図16のステップ16−6においてテキス
ト枠として抽出すべきと判断されたテキストブロックの
各々について、テキスト枠書式を作成する。
【0068】図23に示すフローチャートが、「テキス
ト枠書式の作成処理」である。
【0069】ステップ23−1において、図5の5−3
に示す「テキストブロック管理データ」のブロック横/
縦サイズから、テキスト枠のサイズを決定し、HD10
に記憶する。次にステップ23−2において、テキスト
枠書式の左右上下余白を以下のように求め、HD10に
記憶する。まず、左余白は、図5の5−8に示す行情報
のインデントを調査し、そのテキストブロック内の全て
の行の中で最も小さなインデントを左余白とする。右余
白は、図5の5−9に示す文字情報のブロック左からの
距離と文字幅を調査し、そのテキストブロック内全ての
行の最終文字の右端を比べ、最も大きな値とブロックの
右端との距離の差を右余白とする。上余白は、図5の5
−9に示す文字情報のブロック上からの距離を調査し、
そのテキスト内の1行目内全ての文字の中の最も大きな
値を上余白とする。下余白は、図5の5−9に示す文字
情報のブロック上からの距離と文字高を調査し、そのテ
キストブロック内の最終行の全ての文字の下端を比べ、
最も大きな値とブロックの下端との距離の差を下余白と
する。
【0070】次にステップ23−3において、図5の5
−3に示すテキストブロック管理データの組方向をテキ
スト枠書式の組方向としてHD10に記憶する。さら
に、ステップ23−4において、そのテキストブロック
全てのフォントサイズ(5−9に示す文字情報のフォン
トサイズ)を調査し、最も数の多いフォントサイズを求
め、テキスト枠書式の文字サイズとしてHD10に記憶
する。そして、ステップ23−5において、そのテキス
トブロック全ての平均文字間(5−8に示す行情報の平
均文字間)を調査し、最も数の多い平均文字間を求め、
求めた平均文字間とテキスト枠書式の文字サイズ(ステ
ップ18−4においてHD10に記憶)を足した値でテ
キスト領域の横(枠の横サイズから左右余白を引いた
値)を割った商を文字数/行に設定し、HD10に記憶
する。さらに、ステップ23−6において、書体に明朝
体を設定しHD10に記憶し、ステップ23−7におい
て、そのテキストブロック全ての平均行間(5−7に示
すOCR管理データの平均行間)を調査し、最も数の多い
平均行間を求め、求めた平均行間とテキスト枠書式の文
字サイズ(ステップ18−4においてHD10に記憶)
を足した値でテキスト領域の縦(枠の縦サイズから上下
余白を引いた値)を割った商を行数/頁に設定し、HD
10に記憶する。
【0071】以上図23のフローチャートに従って述べ
たテキスト枠として抽出したテキストブロックからのテ
キスト枠書式作成処理はテキスト枠であると判断したテ
キストブロック内の文字についてのみ書式を作成するも
のであったが、例えば、そのテキスト枠内の元画像の中
の枠(罫線)の線種や太さまで抽出し、枠書式として設
定しても良い。この場合、図5で説明したPAF(Page Ana
lysis Format)の「ブロック管理データ」5−3に、も
う一つ、「フレームブロック管理データ」を加える。
【0072】「フレームブロック管理データ」とは、図
24の19−2に示す構造体で、他のブロック管理デー
タ(テキスト、画像、ライン等)と同様に、用紙左から
の距離、用紙上からの距離、及びそれぞれのブロックの
横/縦サイズをピクセル数で保持し、さらにブロックが
どのような種類のデータを保持しているかを示すテーブ
ルも持っている。そして、「フレームブロック管理デー
タ」固有のデータとして、矩形の線種と太さを持ってい
る。例えば、図6に示す画像データをOCRエンジンによ
り領域分割すると、図7に示すような領域分割が行われ
る。この中で、7−9で示すのが、テキスト枠であると
ステップ16−6で判断されたブロック内の文字群を囲
む枠であり、7−10で示すのが、フレームブロックで
ある。このように元画像の中の矩形イメージ部分が領域
分割された際に抽出されるブロックをフレームブロック
とする。
【0073】次に図12のステップ12−4における、
「枠領域用ブロックの抽出処理」において、枠データを
も識別するステップを含む場合の詳細処理を図25の
「枠領域用ブロックの抽出処理」のフローチャートに従
って説明する。ただし、ステップ15−1から15−9
及びステップ15−10から15−13の各処理ステッ
プは図15のフローチャートに従って説明した処理と同
様なので、同じステップ番号を付し、ここでの説明は省
略する。
【0074】ステップ15−8においてラインブロック
でないと判断された場合は、ステップ25−1におい
て、さらにブロックの種類(5−3、5−4、5−5、
19−2に示す「ブロック管理データ」のブロックの種
類)を調査し、フレームブロックであった場合は、ステ
ップ25−2において、枠データとして抽出し、HD1
0に記憶する。ステップ25−1においてフレームブロ
ックでないと判断された場合は、ステップ15−11に
進む。ステップ15−11における「テキストブロック
チェック処理」においてリターンされた値を判断し、テ
キスト枠であると判断されたならば、ステップ15−1
3において、そのテキストブロックをテキスト枠として
抽出し、HD10に記憶し、ステップ25−3におい
て、そのテキストブロックの書式を作成するために、
「テキスト枠書式の作成処理」を呼び出す。図26がス
テップ25−3で実行される「テキスト枠書式の作成処
理」の詳細を示すフローチャートである。
【0075】ステップ26−1において、当テキストブ
ロックを包含するフレームブロック(図25のステップ
25−2において、枠データとしてHD10に記憶した
ブロック)が存在するかを調査する(例えば、図7の7
−9の示すテキストブロックは、7−10の示すフレー
ムブロックに包含されている)。当テキストブロックを
包含するフレームブロックが存在するとステップ26−
1において判断された場合は、ステップ26−3におい
て、図24の19−2に示す「フレームブロック管理デ
ータ」のブロック横/縦サイズから、テキスト枠のサイ
ズを決定し、かつ「フレームブロック管理データ」の線
種/太さから枠線種と枠線の太さを決定し、HD10に
記憶する。
【0076】次にステップ26−4において、当テキス
トブロックとこれを包含するフレームブロックの管理デ
ータからテキスト枠書式の左右上下余白を以下のように
求め、HD10に記憶する。まず、左余白は、図24の
19−2に示す「フレームブロック管理データ」の用紙
左からの距離と図5の5−3に示す「テキストブロック
管理データ」の用紙左からの距離との差を左余白とす
る。右余白は、図24の19−2に示す「フレームブロ
ック管理データ」の用紙左からの距離にブロック横サイ
ズを加えた値と図5の5−3に示す「テキストブロック
管理データ」の用紙左からの距離にブロック横サイズを
加えた値との差を右余白とする。上余白は、図24の1
9−2に示す「フレームブロック管理データ」の用紙上
からの距離と図5の5−3に示す「テキストブロック管
理データ」の用紙上からの距離との差を上余白とする。
下余白は、図24の19−2に示す「フレームブロック
管理データ」の用紙上からの距離にブロック縦サイズを
加えた値と図5の5−3に示す「テキストブロック管理
データ」の用紙上からの距離にブロック縦サイズを加え
た値との差を下余白とする。
【0077】次にステップ26−5において、図5の5
−3に示すテキストブロック管理データの組方向をテキ
スト枠書式の組方向としてHD10に記憶する。さら
に、ステップ26−6において、そのテキストブロック
全てのフォントサイズ(5−9に示す文字情報のフォン
トサイズ)を調査し、最も数の多いフォントサイズを求
め、テキスト枠書式の文字サイズとしてHD10に記憶
する。そして、ステップ26−7において、そのテキス
トブロック全ての平均文字間(5−8に示す行情報の平
均文字間)を調査し、最も数の多い平均文字間を求め、
求めた平均文字間とテキスト枠書式の文字サイズ(ステ
ップ22−6においてHD10に記憶した文字サイズ)
を足した値でテキストブロックのブロック横サイズ(5
−3に示すテキストブロック管理データのブロック横サ
イズ)を割った商を文字数/行に設定し、はHD10に
記憶する。さらに、ステップ26−8において、書体に
明朝体を設定しHD10に記憶し、ステップ26−9に
おいて、そのテキストブロック全ての平均行間(5−7
に示すOCR管理データの平均行間)を調査し、最も数の
多い平均行間を求め、求めた平均行間とテキスト枠書式
の文字サイズ(ステップ26−6においてHD10に記
憶した文字サイズ)を足した値でテキストブロックのブ
ロック縦サイズ(5−3に示すテキストブロック管理デ
ータのブロック縦サイズ)を割った商を行数/頁に設定
し、HD10に記憶する。
【0078】ステップ26−1において、当テキストブ
ロックを包含するフレームブロック(図26のステップ
25−2において、枠データとしてメモリに記憶したブ
ロック)が存在しなかった場合は、ステップ23−1に
進む。ステップ23−1から23−7に示す各処理ステ
ップは図23のフローチャートの各処理と同様なので同
じステップ番号を付し、ここでの説明は省略する。ただ
し、ステップ23−1において、この場合は当テキスト
ブロックを包含するフレームブロックがないことから、
枠線は”なし”として、HD10に記憶する。
【0079】以上述べたように各ブロックの抽出処理
(図12のフローチャートに示す各処理ステップ)を図
3に示した画像サンプルに施し、終了した結果の各領域
の大きさや位置を示したものが図27である。27−1
に示す領域がヘッダ領域であり、27−2に示す領域が
フッタ領域である。27−3に示す領域がテキスト枠領
域であり、27−4に示す領域がライン領域である。2
7−5、27−6、27−7に示す各領域が本文領域で
ある。
【0080】ここで、枠とは、図27に示すように、本
文領域に重ねて設定し得る領域であって(図27の場
合、テキスト枠領域27−3は本文領域27−6及び本
文領域27−7に一部重なって設定されている。)、本
文領域に入力される文章(本文)は枠を避けて配置され
る。即ち、本文領域のうち、枠領域として定められてい
る領域以外に順に文字を配置するものである。
【0081】また、各々作成された書式は、先に述べた
ようにPAFと関連づけて記憶し、キーボード12或は
マウス13の呼び出し指示に応じて表示器16に表示或
はプリンタ18から印字する時にはその書式に応じてテ
キストブロック内データ5−6の文字コードに対応する
フォントを配置、或はラインブロック管理データ5−5
のデータに従ってラインを描画して出力する。これによ
り、スキャナ1Bより入力した画像データと同じレイア
ウトで、しかし文字や図形は清書した状態の文書を出力
し、更に表示器16上でキーボード12やマウス13の
指示により編集することが可能となる。ここでテキスト
ブロックに新たに文字が挿入された場合にも、書式とし
て定められている態様で文字を再配列するので、オペレ
ータの望む文書が入力画像と同じレイアウト、書式で配
置されたものを得ることができる。
【0082】ここから、OCRした結果(PAF)のデ
ータを形態素解析してブロック間の文字列のつながりを
判断する処理について説明する。
【0083】この処理は、図29のステップ29−5で
行なうが、このステップ以前に実行する処理は図11の
フローチャートで説明したステップ11−1から11−
4の処理と同様であるので、同じステップ番号を付し、
ここでの説明は省略する。ステップ29−5において、
「文書データ作成処理」を実行する。図30に示すフロ
ーチャートが、「文書データ作成処理」の詳細ステップ
を示すものであって、ここでテキストブロック間のつな
がりを判断する。
【0084】図30のステップ30−1において、図1
5のステップ15−13においてHD10にテキスト枠
として記憶したテキストブロックを1つづつ取得する。
そして、ステップ30−2において、ステップ30−2
でテキストブロックを抽出することができたか、即ち、
HD10に記憶されている現在処理中のファイルのPA
Fデータに本処理が未処理のテキスト枠としてのテキス
トブロックが存在するか否かを判断し、存在すると判断
された場合は、ステップ30−3において、そのテキス
トブロックを文書のテキスト枠へ変換する。ここで、ス
テップ30−3で実行する変換処理とは、光学的読み取
りにより入力した原稿画像の画像的特徴により導出した
ブロックごとのデータから、ワープロアプリケーション
等により作成する文書データフォーマットへの変換であ
って、一頁内に分散しているブロックをヘッダ、フッ
タ、本文等のデータ種ごとにまとめて出力位置と属性を
定める管理情報と、その中に配置する文字コードや書式
とを定める内部データとで構成するものである。本文中
に任意に配置され得る枠データはまとめずに枠毎の管理
情報と内部データを有する。管理情報は図5のブロック
管理データ5−3から、内部データは図5の文字情報5
−9とステップ91−4で作成される本文書式及びステ
ップ25−3で作成されるテキスト枠書式に従って求め
る。テキストブロックを文書のテキスト枠へ変換した
後、再びステップ30−1に戻り、テキスト枠として抽
出したテキストブロックの取得処理を行うのだが、ステ
ップ30−2でもはや存在しないと判断されのであれ
ば、ステップ30−4において、本文領域用のテキスト
ブロックのHD10からの取得を行う。
【0085】ステップ30−4において、取得する本文
領域用テキストブロックの順番は、図11のステップ1
1−4で作成した本文書式の段数を元に決定する。ステ
ップ20−8及びステップ20−9で1段組であると判
断され、段組情報としてHD10に「1段組」と格納さ
れていた場合は、本文領域内のテキストブロックの中
で、Yポジション(5−3に示す「テキストブロック管
理データ」の用紙上からの距離)の最も小さなテキスト
ブロックから順に取得する。同じYポジションのテキス
トブロックが複数ある場合は、Xポジション(5−3に
示す「テキストブロック管理データ」の用紙左からの距
離)の小さなテキストブロックから順に取得する。複数
段であれば、1段目から順に、その段の領域内に存在す
るテキストブロックの中で、Yポジション(5−3に示
す「テキストブロック管理データ」の用紙上からの距
離)の最も小さなテキストブロックから順に取得する。
そして、1段目のテキストブロックの取得が終了した
ら、次は2段目、3段目と処理する段番号を進め、テキ
ストブロックを取得する。
【0086】ステップ30−5において、本文領域用テ
キストブロックが存在するか否か、即ち、HD10に記
憶されている現在処理中のファイルのPAFデータの最
後のテキストブロックまで本処理を行ったか否かを判断
し、未処理のブロックが存在しないと判断されたなら
ば、この文書データ作成処理を終了する。ステップ30
−5において、未処理のブロックを取得できたと判断さ
れる場合、ステップ30−6において、ステップ30−
4で取得したブロックよりひとつ後のテキストブロック
の有無を調査し(ステップ30−6)有る場合はそのブ
ロックを取得する。ステップ23−7で取得するブロッ
クとは、その前にステップ30−6で取得すべきと判断
されたブロックであって、そのブロックのテキストブロ
ック内データ5−6を取得することである。また、ステ
ップ30−6で調査するブロックは、ステップ30−4
で取得する順番におけるひとつ後ということである。
【0087】後のテキストブロックがあると判断された
場合、二つのテキストブロック内の文字列のつながりを
形態素解析(文章の流れを言語的につながりがあるか否
かを解析する)により、判別する(ステップ30−
7)。この、ステップ30−7で実行する判別処理は、
ステップ30−4とステップ30−6で取得したテキス
トブロック内データの文字列をブロックを取得した順で
接続し、その中で単語辞書及び文法辞書を用いて文章の
つながりがあるか否かを判別するものである。または、
ステップ30−4で取得した文字列の最後が句点やピリ
オド等の文末を表わす文字であるか否かを判定し、文末
を表わす文字だった場合には、つながりがないと判別す
るようにしても良い。つながりがあると判別された場合
(ステップ30−8)、ステップ30−4とステップ3
0−6で取得した二つのテキストブロックの文字列をひ
とつのパラグラフ(段落)に設定し、2つのテキストブ
ロックの文字列を続けて文書データフォーマットの本文
テキストデータとしてHD10に記憶する。ここで、本
文テキストデータはHD10内の本文テキストデータ格
納領域にひとまとめに格納されるものであり、図20の
フローチャートに示した処理により求めた本文書式に従
って出力し、キーボード12等の操作により本文文字列
の編集が行なわれた場合は編集後の本文文字列を同じ書
式の中で再配列して表示(出力)を更新する。それと同
時に、ステップ30−6で取得した後続のテキストブロ
ックのYポジションと、ステップ30−4で取得した本
テキストブロックのYポジションが、同一か、または、
差が微少であると判定される場合、そのパラグラフの先
頭文字修飾(ドロップキャップ、または、イニシャルギ
ャップという)を行うべきであると判断し(ステップ2
3−11)、ステップ30−12に進んでそのパラグラ
フに先頭文字修飾の書式を設定する。先頭文字修飾の書
式とは、先頭文字(この場合は本テキストブロック内の
文字)が、そのパラグラフの標準行ピッチに対して、何
倍の行数分領域を確保するかを表すものであるので、本
テキストブロックの高さを、ステップ20−7で求め、
HD10に格納してある標準書式の文字列の行ピッチで
除算することにより求める。
【0088】そして、再度ステップ30−4において、
本文領域用のテキストブロックを取得し、ステップ23
−5から23−12までの処理を繰り返す。ただし、こ
れらの処理の2回目以降は、ステップ23−4で取得す
るブロックはその前の処理ループのステップ30−6で
取得したブロックであり(ステップ30−8でYes判
定した場合のみ。No判定の場合は、前の処理ループの
ステップ30−6で取得したブロックの次のブロックを
ステップ30−4で取得する。)、この場合、ステップ
30−9でHD10の本文テキストデータとして格納す
るのはステップ30−6で取得した後続のテキストブロ
ックの文字列のみであり、その前の処理ループで既に格
納済みの文字列に続けて格納する。最後のテキストブロ
ックまで処理を行ったと判断した場合は、「文書データ
作成処理」を終了する。
【0089】図30のフローチャートに示した「文書デ
ータ作成処理」を実行した結果を、具体的に説明する。
【0090】例えば、ステップ11−1において図31
に示す画像データを入力した場合、この画像をステップ
11−2において領域分割し、PAFに変換されるブロ
ックが、図32に示す図であり、この図32に示した各
ブロックについてステップ11−3、11−4、29−
5の処理を行った後の文書が図33に示す図である。ス
テップ30−11及び30−12における先頭文字修飾
解析を行うことにより、ブロック22−1の中の先頭文
字をそれに続く文字列と同じブロックとして扱いつつ複
数行抜きに修飾して出力することができる。ステップ3
0−7のチェックにより、図32の20−2に示すテキ
ストブロック内の文字コードと20−3に示すテキスト
ブロック内の文字コードとが言語的に文字のつながりが
あると判定され、ひとつの段落となる。20−3に示す
テキストブロック内の文字コードと、20−4に示すテ
キストブロック内の文字コードとでは、言語的に文字の
つながりがないため、21−3に示すテキストブロック
内の文字コードの後に改行を挿入する。
【0091】同様に20−5、20−6、20−7には
つながりがあるため、20−5と20−6には改行は挿
入しないが、20−7の後にはデータがないため、20
−7に示すテキストブロック内の文字コードの後に改行
を挿入する。
【0092】図30のフローチャートに示したような処
理を行なうことによって、入力画像を画像的特徴に従っ
て解析した結果別ブロックとして抽出された文字列領域
のつながりを内容的に判断することができ、かつ段落の
先頭文字に文字サイズ変更などの修飾が行われている場
合、その文字の位置と大きさを検知して、段落書式に先
頭文字修飾を設定することによって、本文領域から文章
の流れに沿った形式で文書の本文データが作成でき、か
つ、紙の元原稿に近い文書の再現を可能とすることがで
きる。
【0093】また、文書処理装置において入力画像の画
像的特徴に従って得られるブロックではなく、その画像
の元原稿作成時の書式を再現して文書編集が行えるの
で、ユーザの編集後も体裁を崩すことがなくなる。
【0094】次に、図29のステップ29−5で行なう
文書データ作成処理の第二例を図34のフローチャート
に示し、以下説明する。ステップ30−5までは図30
のフローチャートに示したステップ30−1から30−
5までの処理ステップと同様であるので、同じステップ
番号を付し、ここでの説明は省略する。ステップ30−
4で取得したテキストブロック内の文字コードと、その
時点で即に本文テキストデータとしてHD10に格納さ
れている文字コードとのつながりを形態素解析により判
別する(ステップ34−6)。このステップ34−6で
行なう判別方法は、ステップ30−7での判別方法と同
様である。ステップ34−7において、ステップ34−
6でつながっているとの判別が行われたと判断した場合
は、ステップ34−8に進み、ステップ30−4で取得
したテキストブロック内の文字コードをHD10に格納
されている本文テキストデータに続けて格納する。ステ
ップ34−7において、ステップ34−6でつながって
いないとの判別が行われたと判断した場合は、ステップ
34−9に進み、HD10に格納されている本文テキス
トデータに続けてまず改行コードを格納し、その後にス
テップ22−4で取得したテキストブロック内の文字コ
ードを格納する。
【0095】次に、図29のステップ29−5で行なう
文書データ作成処理において改段をする位置の判別をも
行なう例について、図35のフローチャートに従って説
明する。このフローチャートにおいて、ステップ30−
1からステップ34−8までは図34のフローチャート
の各処理ステップと同様なので同じステップ番号を付
し、ここでの説明は省略する。
【0096】ステップ34−7において、ステップ34
−6でつながっていないとの判別が行なわれたと判断し
た場合は、ステップ35−9に進み、ステップ30−4
で取得した現在処理中のテキストブロックが段の最初、
即ち段内でYポジションが最小のテキストブロックであ
るか否かを判定し、段の最初のテキストブロックと判定
された場合はHD10に格納されている本文テキストデ
ータに続けてまず改段コードを格納し、その後にステッ
プ30−4で取得したテキストブロック内の文字コード
を格納する(ステップ35−10)。また、ステップ3
5−9で段の最初のテキストブロックでないと判定され
た場合はHD10に格納されている本文テキストデータ
に続けて改行コードを格納し、その後にステップ30−
4で取得したテキストブロック内の文字コードを格納す
る(ステップ35−11)。
【0097】図35のフローチャートに示した処理によ
り、入力画像の画像的登頂に従って抽出した各テキスト
ブロック内の文字列を前のテキストブロック内の文字列
とつなげて処理すべきか、段を改めて出力すべきかを判
断し、必要に応じて改段コードを挿入して文字列を格納
するので、その後の編集処理にも段区切りの設定を生か
し、出力態様を維持することができる。
【図面の簡単な説明】
【図1】本発明の一実施例による文字認識文書処理装置
の概略構成を示すブロック図である。
【図2】本発明の一実施例による文字認識文書処理装置
と画像読み取り装置をつなげた図である。
【図3】画像イメージを表した図である。
【図4】画像イメージを領域分割した図である。
【図5】Page Analysis Format(PAF)のファイルフォー
マットを表した図である。
【図6】画像イメージを表した図である。
【図7】画像イメージを領域分割した図である。
【図8】ヘッダ及びフッタ領域付近のテキストブロック
を表した図である。
【図9】本文領域内のテキストブロックを表した図であ
る。
【図10】本文領域と他の領域に分割された状態を表し
た図である。
【図11】「本文領域と他の領域の分別処理」を示すフ
ローチャートである。
【図12】「本文用ブロックと他のブロックの分別処
理」を示すフローチャートである。
【図13】「ヘッダ領域用テキストブロックの抽出処
理」を示すフローチャートである。
【図14】「フッタ領域用テキストブロックの抽出処
理」を示すフローチャートである。
【図15】「枠領域用ブロックの抽出処理」を示すフロ
ーチャートである。
【図16】「テキストブロックチェック処理」を示すフ
ローチャートである。
【図17】「ヘッダ領域用テキストブロックの抽出処
理」を示すフローチャートである。
【図18】「フッタ領域用テキストブロックの抽出処
理」を示すフローチャートである。
【図19】「テキストブロックチェック処理」を示すフ
ローチャートである。
【図20】「本文書式の作成処理」の第一例を示すフロ
ーチャートである。
【図21】「本文書式の作成処理」の第二例を示すフロ
ーチャートである。
【図22】本文書式作成時のブロック分割を説明する図
ある。
【図23】「テキスト枠書式の作成処理」を示すフロー
チャートである。
【図24】PAFのデータ構造の第二例を示す図であ
る。
【図25】「枠領域用ブロックの抽出処理」の第二例を
示すフローチャートである。
【図26】「テキスト枠書式の作成処理」の第二例を示
すフローチャートである。
【図27】分別された各領域を例示する図である。
【図28】ネットワークシステム図である。
【図29】「文書データ作成処理」を加えた「本文領域
と他の領域の分別処理」のフローチャートである。
【図30】「文書データ作成処理」のフローチャートで
ある。
【図31】入力画像例示図である。
【図32】入力画像から抽出したブロックの説明図であ
る。
【図33】形態素解析により改行コードを挿入した結果
の図である。
【図34】第二の「文書データ作成処理」のフローチャ
ートである。
【図35】第三の「文書データ作成処理」のフローチャ
ートである。
【図36】形態素解析とブロックの配置により階段コー
ドを挿入した結果の図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) // G06F 17/27 G06F 15/38 E 9A001 Fターム(参考) 5B009 LA01 NC06 QA03 QA09 5B050 BA16 EA03 EA07 5B064 AA01 BA01 CA08 5B091 AA11 CA02 CB01 DA02 5L096 BA18 EA35 FA16 FA43 FA44 FA45 FA64 FA67 FA72 9A001 HH22 HH23 JJ07

Claims (29)

    【特許請求の範囲】
  1. 【請求項1】 入力した画像情報から複数の文字列領域
    を抽出し、 前記抽出した複数の文字列領域のつながりを形態素解析
    によって判断し、 前記形態素解析によりつながると判断された複数の文字
    列領域に含まれる文字を続けて一つの文字格納領域に格
    納することを特徴とする画像処理方法。
  2. 【請求項2】 前記形態素解析によるつながりの判断
    を、連続して位置している複数の文字列領域に対して行
    なうことを特徴とする請求項1に記載の画像処理方法。
  3. 【請求項3】 前記形態素解析によるつながりの判断
    を、連続する二つの文字列領域間で行なうことを特徴と
    する請求項1に記載の画像処理方法。
  4. 【請求項4】 前記形態素解析によるつながりの判断
    は、各文字列領域に含まれる文字列をつなげて得た文字
    列に対して行なうことを特徴とする請求項1に記載の画
    像処理方法。
  5. 【請求項5】 前記形態素解析によるつながりの判断
    は、同じ種類に分類された文字列領域に対して行なうこ
    とを特徴とする請求項1に記載の画像処理方法。
  6. 【請求項6】 前記形態素解析によるつながりの判断
    は、本文に分類された文字列領域に対して選択的に行な
    うことを特徴とする請求項1に記載の画像処理方法。
  7. 【請求項7】 前記形態素解析によりつながらないと判
    断された場合に、当該判断された複数の文字列領域の先
    方の文字列領域内の文字列の後に改行コードを挿入して
    当該判断された複数の文字列領域内の文字列を格納する
    ことを特徴とする請求項1に記載の画像処理方法。
  8. 【請求項8】 前記形態素解析によりつながらないと判
    断された場合に、当該判断された複数の文字列領域の後
    方の文字列領域が段で最初の文字列領域であるか否かを
    更に判断し、 前記判断により当該後方の文字列領域が段で最初の文字
    列領域であると判断された場合に、その前の文字列領域
    内の文字列の後に改段コードを挿入して当該判断された
    複数の文字列領域内の文字列を格納することを特徴とす
    る請求項1に記載の画像処理方法。
  9. 【請求項9】 前記画像情報はスキャナより入力した画
    像情報とすることを特徴とする請求項1に記載の画像処
    理方法。
  10. 【請求項10】 前記一つの文字格納領域に格納された
    文字列を、一つの書式に従って出力することを特徴とす
    る請求項1に記載の画像処理方法。
  11. 【請求項11】 入力した画像情報から複数の文字列領
    域を抽出する文字列領域抽出手段と、 前記抽出した複数の文字列領域のつながりを形態素解析
    によって判断する判断手段と、 前記形態素解析によりつながると判断された複数の文字
    列領域に含まれる文字を続けて一つの文字格納領域に格
    納する格納手段とを有することを特徴とする画像処理装
    置。
  12. 【請求項12】 前記判断手段は、連続して位置してい
    る複数の文字列領域に対して前記形態素解析によるつな
    がりを判断することを特徴とする請求項1に記載の画像
    処理方法。
  13. 【請求項13】 前記判断手段は、連続する二つの文字
    列領域間で前記形態素解析によるつながりを判断するこ
    とを特徴とする請求項11に記載の画像処理方法。
  14. 【請求項14】 前記判断手段は、各文字列領域に含ま
    れる文字列をつなげて得た文字列に対して前記形態素解
    析によるつながりを判断することを特徴とする請求項1
    1に記載の画像処理方法。
  15. 【請求項15】 前記判断手段は、同じ種類に分類され
    た文字列領域に対して前記形態素解析によるつながりを
    判断することを特徴とする請求項11に記載の画像処理
    方法。
  16. 【請求項16】 前記判断手段は、本文に分類された文
    字列領域に対して選択的に前記形態素解析によるつなが
    りを判断することを特徴とする請求項11に記載の画像
    処理方法。
  17. 【請求項17】 前記判断手段がつながらないと判断し
    た場合に、前記格納手段は、当該判断された複数の文字
    列領域の先方の文字列領域内の文字列の後に改行コード
    を挿入して当該判断された複数の文字列領域内の文字列
    を格納することを特徴とする請求項11に記載の画像処
    理方法。
  18. 【請求項18】 前記判断手段がつながらないと判断し
    た場合に、当該判断された複数の文字列領域の後方の文
    字列領域が段で最初の文字列領域であるか否かを更に判
    断する段判断手段を有し、 前記段判断手段により当該後方の文字列領域が段で最初
    の文字列領域であると判断された場合に、前記格納手段
    は、その前の文字列領域内の文字列の後に改段コードを
    挿入して当該判断された複数の文字列領域内の文字列を
    格納することを特徴とする請求項11に記載の画像処理
    方法。
  19. 【請求項19】 前記画像情報はスキャナより入力した
    画像情報とすることを特徴とする請求項11に記載の画
    像処理方法。
  20. 【請求項20】 前記一つの文字格納領域に格納された
    文字列を、一つの書式に従って出力する出力手段を有す
    ることを特徴とする請求項11に記載の画像処理方法。
  21. 【請求項21】 コンピュータにより読み取り可能な記
    憶媒体であって、 入力した画像情報から複数の文字列領域を抽出する為の
    制御プログラムと、 前記抽出した複数の文字列領域のつながりを形態素解析
    によって判断する為の制御プログラムと、 前記形態素解析によりつながると判断された複数の文字
    列領域に含まれる文字を続けて一つの文字格納領域に格
    納する為の制御プログラムとを記憶したことを特徴とす
    る記憶媒体。
  22. 【請求項22】 前記形態素解析によるつながりの判断
    を、連続して位置している複数の文字列領域に対して行
    なう為の制御プログラムを記憶したことを特徴とする請
    求項21に記載の記憶媒体。
  23. 【請求項23】 前記形態素解析によるつながりの判断
    を、連続する二つの文字列領域間で行なう為の制御プロ
    グラムを記憶したことを特徴とする請求項21に記載の
    記憶媒体。
  24. 【請求項24】 前記形態素解析によるつながりの判断
    を、各文字列領域に含まれる文字列をつなげて得た文字
    列に対して行なう為の制御プログラムを記憶したことを
    特徴とする請求項21に記載の記憶媒体。
  25. 【請求項25】 前記形態素解析によるつながりの判断
    を、同じ種類に分類された文字列領域に対して行なう為
    の制御プログラムを記憶したことを特徴とする請求項2
    1に記載の記憶媒体。
  26. 【請求項26】 前記形態素解析によるつながりの判断
    を、本文に分類された文字列領域に対して選択的に行な
    う為の制御プログラムを記憶したことを特徴とする請求
    項21に記載の記憶媒体。
  27. 【請求項27】 前記形態素解析によりつながらないと
    判断された場合に、当該判断された複数の文字列領域の
    先方の文字列領域内の文字列の後に改行コードを挿入し
    て当該判断された複数の文字列領域内の文字列を格納す
    る為の制御プログラムを記憶したことを特徴とする請求
    項21に記載の記憶媒体。
  28. 【請求項28】 前記形態素解析によりつながらないと
    判断された場合に、当該判断された複数の文字列領域の
    後方の文字列領域が段で最初の文字列領域であるか否か
    を更に判断する為の制御プログラムと、 前記判断により当該後方の文字列領域が段で最初の文字
    列領域であると判断された場合に、その前の文字列領域
    内の文字列の後に改段コードを挿入して当該判断された
    複数の文字列領域内の文字列を格納する為の制御プログ
    ラムを記憶したことを特徴とする請求項21に記載の記
    憶媒体。
  29. 【請求項29】 前記一つの文字格納領域に格納された
    文字列を、一つの書式に従って出力する為の制御プログ
    ラムを記憶したことを特徴とする請求項21に記載の記
    憶媒体。
JP11101982A 1999-04-09 1999-04-09 画像処理方法、装置及び記憶媒体 Withdrawn JP2000293521A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11101982A JP2000293521A (ja) 1999-04-09 1999-04-09 画像処理方法、装置及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11101982A JP2000293521A (ja) 1999-04-09 1999-04-09 画像処理方法、装置及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2000293521A true JP2000293521A (ja) 2000-10-20

Family

ID=14315070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11101982A Withdrawn JP2000293521A (ja) 1999-04-09 1999-04-09 画像処理方法、装置及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2000293521A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004053724A1 (ja) * 2002-12-06 2004-06-24 Sharp Kabushiki Kaisha データ変換装置、データ変換方法、および、データ変換プログラムを記録した記録媒体
JP2005338337A (ja) * 2004-05-26 2005-12-08 Toppan Printing Co Ltd 確定掲載内容レイアウト作成システム
JP2010108208A (ja) * 2008-10-30 2010-05-13 Hitachi Software Eng Co Ltd 文書処理装置
JP2011081516A (ja) * 2009-10-05 2011-04-21 Ns Solutions Corp 情報処理装置、情報処理方法、及びプログラム
JP2018019300A (ja) * 2016-07-28 2018-02-01 京セラドキュメントソリューションズ株式会社 画像形成装置、文書電子化プログラムおよび文書電子化方法
JP2019125353A (ja) * 2017-12-29 2019-07-25 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 電子文書中の文字列塊を推測する方法
WO2021172699A1 (ko) * 2020-02-27 2021-09-02 주식회사 와들 이미지로부터 추출한 텍스트 블록의 중요도 판단 시스템 및 그 방법

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004053724A1 (ja) * 2002-12-06 2004-06-24 Sharp Kabushiki Kaisha データ変換装置、データ変換方法、および、データ変換プログラムを記録した記録媒体
JP2005338337A (ja) * 2004-05-26 2005-12-08 Toppan Printing Co Ltd 確定掲載内容レイアウト作成システム
JP2010108208A (ja) * 2008-10-30 2010-05-13 Hitachi Software Eng Co Ltd 文書処理装置
JP2011081516A (ja) * 2009-10-05 2011-04-21 Ns Solutions Corp 情報処理装置、情報処理方法、及びプログラム
JP2018019300A (ja) * 2016-07-28 2018-02-01 京セラドキュメントソリューションズ株式会社 画像形成装置、文書電子化プログラムおよび文書電子化方法
JP2019125353A (ja) * 2017-12-29 2019-07-25 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 電子文書中の文字列塊を推測する方法
JP7186075B2 (ja) 2017-12-29 2022-12-08 コニカ ミノルタ ラボラトリー ユー.エス.エー.,インコーポレイテッド 電子文書中の文字列塊を推測する方法
WO2021172699A1 (ko) * 2020-02-27 2021-09-02 주식회사 와들 이미지로부터 추출한 텍스트 블록의 중요도 판단 시스템 및 그 방법

Similar Documents

Publication Publication Date Title
US7409089B2 (en) Writing guide for a free-form document editor
US5953735A (en) Script character processing method and system with bit-mapped document editing
US6434581B1 (en) Script character processing method for interactively adjusting space between writing element
US7735007B2 (en) Adding and removing white space from a document
JP4916237B2 (ja) 画像表示装置、画像表示方法、その方法をコンピュータに実行させるプログラム、および画像表示システム
CN100454293C (zh) 文档编辑方法和文档编辑设备
JP3734852B2 (ja) 画像編集方法及び編集システム
JP5252933B2 (ja) 文書処理装置、文書処理方法、及びプログラム
JPH09505422A (ja) テキストドキュメント及びイメージドキュメントを同期化、ディスプレイ、及び操作するための方法及び装置
WO1992016900A1 (en) Script/binary-encoded-character processing method and system with moving space insertion mode
JP2007328029A (ja) 情報処理装置および情報処理方法および情報処理プログラム
JP2003308310A (ja) 表示方法、表示装置、表示プログラム、および表示プログラムを記録した記録媒体
JP2000293521A (ja) 画像処理方法、装置及び記憶媒体
US6189020B1 (en) Document processing method and apparatus using batch process
JPH06251007A (ja) 表データ入力装置
JP2000293671A (ja) 画像処理方法、装置及び記憶媒体
JP2000293624A (ja) 画像処理方法、装置及び記憶媒体
JP2000076226A (ja) 文書データの編集システム
JP3076348B2 (ja) 文書整形装置及び文書整形方法
JP4441966B2 (ja) 手書き文字入力装置及びそれを実現するためのプログラムを記録した記録媒体
JPH1166065A (ja) 画像配置装置およびそのプログラム記録媒体
JP3352709B2 (ja) 文書整形装置および文書整形装置の処理方法
JP4062332B2 (ja) 罫線の処理方法およびその装置
JPH0969098A (ja) 文書作成装置
JP2005258589A (ja) 文字表示装置および文字表示方法ならびにプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060704