JP2000293521A

JP2000293521A - 画像処理方法、装置及び記憶媒体

Info

Publication number: JP2000293521A
Application number: JP11101982A
Authority: JP
Inventors: Shigeo Nara; 茂雄奈良; Junichiro Kizaki; 純一郎木▲崎▼
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1999-04-09
Filing date: 1999-04-09
Publication date: 2000-10-20

Abstract

(57)【要約】【課題】入力画像から別ブロックとして抽出された文
字列領域のつながりを形態素解析により判断し、内容的
につながりのあるブロックの識別を可能とする。【解決手段】連続するブロックのデータを取得し（ス
テップ３０−４、３０−６）、それらのブロック内の文
字列のつながりを形態素解析により判断し（ステップ３
０−７）、つながっていると判断された場合は一つの文
字格納領域に続けて格納する（ステップ３０−９）。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、入力した画像を解
析して文書編集に用い得る情報を取得する技術に関する
ものである。

【０００２】本発明は、画像からテキストへの変換に関
する技術である。

【０００３】

【従来の技術】近年、画像読み取り装置、ＯＣＲ（光学
的文字認識。ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲ
ｅｃｏｇｎｉｔｉｏｎ）などの普及により、紙の原稿か
ら文字を読み取って文字コード化して文書ファイルを作
成し、さらにその文書ファイルを編集するという機会が
増えてきた。

【０００４】

【発明が解決しようとしている課題】しかし、画像読み
取り装置から読み込まれた画像データが、領域分割さ
れ、OCRされて作成された文書ファイルは、分割された領域が、それぞれ枠に変換されてしまって
いる。枠と枠の間で、文書としてのつながりがない。というものであった。従って、編集を行う際には、各領
域単位に領域内のみで編集を行わなければならず、非常
に効率が悪かった。

【０００５】

【課題を解決するための手段】上記従来技術の課題を解
決する為に、本発明は、入力した画像情報から複数の文
字列領域を抽出し、前記抽出した複数の文字列領域のつ
ながりを形態素解析によって判断し、前記形態素解析に
よりつながると判断された複数の文字列領域に含まれる
文字を続けて一つの文字格納領域に格納する画像処理方
法、装置及び記憶媒体を提供する。

【０００６】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によるつながりの判断
を、連続して位置している複数の文字列領域に対して行
なう。

【０００７】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によるつながりの判断
を、連続する二つの文字列領域間で行なう。

【０００８】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によるつながりの判断
は、各文字列領域に含まれる文字列をつなげて得た文字
列に対して行なう。

【０００９】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によるつながりの判断
は、同じ種類に分類された文字列領域に対して行なう。

【００１０】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によるつながりの判断
は、本文に分類された文字列領域に対して選択的に行な
う。

【００１１】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によりつながらないと
判断された場合に、当該判断された複数の文字列領域の
先方の文字列領域内の文字列の後に改行コードを挿入し
て当該判断された複数の文字列領域内の文字列を格納す
る。

【００１２】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記形態素解析によりつながらないと
判断された場合に、当該判断された複数の文字列領域の
後方の文字列領域が段で最初の文字列領域であるか否か
を更に判断し、前記判断により当該後方の文字列領域が
段で最初の文字列領域であると判断された場合に、その
前の文字列領域内の文字列の後に改段コードを挿入して
当該判断された複数の文字列領域内の文字列を格納す
る。

【００１３】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記画像情報はスキャナより入力した
画像情報とする。

【００１４】上記従来技術の課題を解決する為に、本発
明は、好ましくは前記一つの文字格納領域に格納された
文字列を、一つの書式に従って出力する。

【００１５】

【発明の実施の形態】図1は本発明に係る装置のシステ
ムブロック図である。

【００１６】システムバス１は、後述する各構成間での
データの授受を可能にするものである。ＣＰＵ（Ｃｅｎ
ｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）２は、後
述するＰＭＥＭ３に格納されている制御プログラムに従
って、本発明に係る各種処理を実行するものである。後
述するフローチャートに示す処理も、ＣＰＵ２により実
行される。ＰＭＥＭ（メモリ）３は、本発明に係る各種
処理の制御プログラムを、適宜ハードディスク１０から
選択して読み込み、格納するメモリである。後述するフ
ローチャートに示す処理の制御プログラムもこのＰＭＥ
Ｍ３に格納される。また、ＰＭＥＭ３はテキストメモリ
としても機能し、キーボード12から入力されたテキスト
データや、外部記憶制御部８の制御により外部記憶媒体
９やハードディスク１０から読み取ったテキストデータ
も格納する。通信制御部４は、通信ポート５における入
出力データの制御を行なう。通信ポート５は、通信制御
部４による制御の基、ＬＡＮやＷＡＮ等の通信回線６を
介してネットワーク上の他の装置の通信ポート７と接続
し、データの送信及び受信を行なう。ネットワークに接
続されているプリンタへの印字データの送出や、同じく
ネットワークに接続されているスキャナからのデータの
入力も、この通信ポート５を介して行なう。

【００１７】外部記憶制御部８は、データファイル用の
メモリ、例えばハードディスク（ＨＤ）１０や本装置に
着脱可能な外部記憶媒体（例えばフロッピーディスクや
ＭＯ、ＣＤ−Ｒ等）９からのデータの読み込み及びデー
タの書きこみを制御する。入力制御部１１は、キーボー
ド１２やマウス１３等の入力装置からのデータの入力を
せいぎょする。ここで、マウス１３はＣＲＴ１６の表示
画面上で指示される位置の座標を入力する座標入力手段
として機能するものであれば良く、タブレットやタッチ
パネル等であっても良い。更に、指示した座標位置で、
ボタンの押下やタップ等により、選択指示を可能とする
ものであれば良い。マウスを操作することによって、マ
ウスカーソルで表示される指示位置を所望の位置とし、
例えばコマンドメニュー上のコマンドアイコン上に位置
させて、ボタンを押下することによって、そのコマンド
アイコンで表されているコマンドを入力することもでき
る。また、編集対象の指示及び描画位置の指示もマウス
13により可能である。操作者はキーボード１２を操作す
ることにより、文字コードの入力及び各種動作命令の入
力を行なう。

【００１８】ビデオイメージメモリ（ＶＲＡＭ）１４
は、例えばＣＲＴ等の表示器に表示する画像を保持する
メモリであり、表示出力制御部１５の制御により、表示
データがビットマップデータに展開して書きこまれ、Ｃ
ＲＴ１６に表示される。表示器は、ＣＲＴに限定するも
のではなく、液晶表示器であっても良い。プリンタ制御
部１７は、接続されているプリンタ１８に対するデータ
の出力制御を行なう。プリンタ１８は、画像を印字する
手段として機能するものであって、ＬＢＰ、インクジェ
ットプリンタ等である。画像入力機器制御部１Ａは、接
続されている画像入力機器１Ｂの制御を行なう。画像入
力機器１Ｂは、載置した原稿を光学的に読みこむスキャ
ナであっても、或はフィルムスキャナであっても良い。
或は画像データを記憶したメモリから読み込む機能を実
行するものであっても良い。図1においては、プリンタ
制御部１７とプリンタ１８、及び画像入力機器１Ｂと画
像入力機器制御部１Ａとを別の構成として記載したが、
これらは物理的に別々のコンポーネントであっても、一
つのコンポーネントであっても良いことは勿論である。

【００１９】尚、本発明は、単体で構成される装置によ
り実現されても良いし、或はネットワークを介して接続
される複数の装置からなるシステムで構成されても良い
ことは勿論である。このネットワークのシステムの一例
を図２８に示し、以下説明する。

【００２０】図２８は、プリンタをネットワークに接続
するためのネットワークボード（ＮＢ）１０１を、開放
型アーキテクチャをも持つプリンタ１０２へつなげた場
合のネットワークシステム構成図である。ＮＢ１０１は
ローカルエリアネットワーク（ＬＡＮ）１００へ、例え
ば同軸コネクタをもつＥｔｈｅｒｎｅｔインタフェース
１０Ｂａｓｅ−２や、ＲＪ−４５を持つ１０Ｂａｓｅ−
Ｔ等のＬＡＮインタフェースを介して接続されている。

【００２１】ＰＣ１０３、ＰＣ１０４、ＰＣ１１１、Ｐ
Ｃ１１２やＰＣ１１５等の複数のパーソナルコンピュー
タ（ＰＣ）がＬＡＮに接続されており、ネットワークオ
ペレーティングシステムの制御の下、これらのＰＣはＮ
Ｂ１０１と通信し、ネットワークに接続された各デバイ
スとして機能するようにすることができる。また、例え
ばＰＣ１０３を、ネットワークデバイス管理用ＰＣとし
て使用するように指定することができ、このＰＣ１０３
によってプリンタ１０２やＰＣ１０４にローカル接続さ
れたプリンタ１０５におけるプリント処理を制御しても
良い。

【００２２】また、ＬＡＮ１００にファイルサーバＰＣ
１０４を接続し、このＰＣ１０４の表示画面上で入力さ
れた指示に応じてＬＡＮ１００を介してファイルサーバ
１０６にアクセスし、大容量（例えば１００億バイト）
のネットワークディスク１０７に記憶されたファイルか
らのデータの読み込み及びデータの書き込み、記憶を管
理する。ファイルサーバＰＣ１０４は、ファイル管理部
として、ＬＡＮメンバ間でデータのファイルの受信や、
記憶、キューイング、キャッシング、及び送信を行な
う。例えば、ＰＣ１０４自身やＰＣ１０３によって作ら
れたデータファイルは、ファイルサーバＰＣ１０４の制
御のもとファイルサーバ１０６へ送られ、ファイルサー
バ１０６はこれらのデータファイルを順に並べ、そして
プリントサーバ１０４からのコマンドに従って、並べら
れたデータファイルをプリンタ１１０へ送信する。

【００２３】スキャナサーバ１１５は、ローカル接続さ
れたスキャナ１１７や、遠隔にあるスキャナ１１０を制
御して画像の入力を行なわせる。複写機１１８は、イメ
ージプロセッシングユニット１１９を介してＬＡＮ１１
０につながり、ネットワーク１１０を介して接続される
ＰＣの制御のもと、スキャナやプリンタとしても機能す
る。

【００２４】またＰＣ１０３とＰＣ１０４はそれぞれ、
データファイルの生成や、生成したデータファイルのＬ
ＡＮ１００への送信や、また、ＬＡＮ１００からのファ
イルの受信や、更にそのようなファイルの表示及び処理
を行なうことのできる通常のＰＣで構成される。尚、図
２８ではパーソナルコンピュータ機器を図示したが、ネ
ットワークソフトウェアを実行するのに適切であるよう
な、他のコンピュータ機器であっても良い。通常、ＬＡ
Ｎ１００やＬＡＮ１１０などのＬＡＮは、一つの建物内
の一つの階又は接続した複数の階でのユーザグループ等
の、幾分ローカルなユーザグループにサービスを提供す
るが、例えば、ユーザが他の建物や他県にいるなど、あ
るユーザが他のユーザから離れるに従って、ワイドエリ
アネットワーク（ＷＡＮ）を作っても良い。ＷＡＮは、
基本的には、いくつかのＬＡＮを高速度サービス総合デ
ジタルネットワーク（ＩＳＤＮ）電話線等の高速度デジ
タルラインで接続して形成された集合体である。従っ
て、図**に示すように、ＬＡＮ１００と、ＬＡＮ１１０
と、ＬＡＮ１２０とはバックボーン１４０を介して接続
されてＷＡＮを形成する。これらの接続は、数本のバス
による単純な電気的接続である。それぞれのＬＡＮは専
用のＰＣを含み、また、必ずしも必要なわけではない
が、通常はファイルサーバ及びプリントサーバを含む。
ＬＡＮ１００と、ＬＡＮ１１０と、ＬＡＮ１２０とに接
続されている機器は、ＷＡＮ接続を介して、他のＬＡＮ
の機器の機能にアクセスすることができる。

【００２５】図２は、装置（２−１）に画像入力機器１
Ｂの一例である画像読み取り装置（２−２）をつなげた
システムの斜視図である。

【００２６】次に、後述する「本文領域と他の領域との
分別方法」に重要な役割を果たすファイル形式であるPA
F（Page Analysis Format）について説明する。

【００２７】PAFとは、画像データをその画像データを
解析して得られる画像特徴に従い、同一の属性を有する
ひとかたまりの領域を一つの矩形として領域分割し、そ
の分割されたブロック（矩形領域）毎にデータ（ブロッ
ク領域を特定する為のデータと、そのブロックの画像の
特徴を表すデータとを含む）を保持する形式のファイル
フォーマットであり、ブロックの種類（テキストブロッ
ク、画像ブロック、ラインブロック、テーブルブロッ
ク）が異なれば、それぞれの種類に適した必要なデータ
を保持している。例えば、図３に示す画像データを画像
入力機器１Ｂから入力すると、図４に示すような領域分
割が行われる。例えば、４−１、４−２に示すようなテ
キストブロック（全てがテキストと判断されたブロッ
ク）、４−３に示すような画像ブロック、４−４に示す
ようなラインブロック、４−５に示すようなテーブルブ
ロック（表ブロック）等に領域分割され、各ブロックの
種類が判定される。

【００２８】図５を用いて、PAFの構造を更に詳細に説
明する。このＰＡＦのデータは、画像入力機器１Ｂから
入力した画像データをＣＰＵ２により解析してＨＤ１０
に格納されるものである。５−１がＰＡＦの全体であっ
て、先頭に「ヘッダ」領域を持ち、次に「ブロック管理
データ」、そしてブロック管理データによって管理され
る「ブロック内データ」とメモリ領域が続く。５−２に
示すように、「ヘッダ」領域には、ファイル全体のファ
イルサイズ、ファイル全体から抽出されたブロックの総
数を表わすブロック保有数、そして読み込まれた画像
（イメージ）の幅／高さをピクセル数で保持し、さらに
どのようなDPI（ｄｏｔ／ｉｎｃｈ）サイズで読み込ま
れた画像データであったかも保持している。

【００２９】「ブロック管理データ」領域には、各ブロ
ックごとにそのブロックの読み込まれたイメージにおけ
る位置を表わすレイアウト情報や、そのブロックの画像
の属性情報を格納する。即ち、ＰＡＦデータはヘッダ５
−１内のブロック数に相当する数のブロック管理データ
領域を有する。用紙左からの距離、用紙上からの距離、
及びそれぞれのブロックの領域の横／縦サイズをピクセ
ル数で保持し、さらにブロックがどのような種類のデー
タを保持しているかを示すテーブルも持っている。ここ
までがどの種類のブロックでも共通に格納しているデー
タであり、以降がブロックの種類によって異なる。例え
ば、５−３に示す「テキストブロック管理データ」の場
合は、ブロック内データの存在位置を示すオフセットを
持ち、さらにそのテキストの言語情報（ブロック内のテ
キストは、日本語主体なのか英語主体なのか）、テキス
トの組方向（横書きなのか縦書きなのか）を持ってい
る。５−４に示す「画像ブロック管理データ」の場合
は、ブロック内画像データの存在位置を示すオフセット
を持ち、５−５に示す「ラインブロック管理データ」の
場合は、ラインのスタートとエンド位置を示すそれぞれ
の（X、Y）ポジション、及びラインの種類や太さを示す
テーブルを持っている。

【００３０】「ブロック内データ」領域は、それぞれの
ブロック内データの種類により異なっている。例えば
「テキストブロック内データ」領域の場合は、対応づけ
られているブロック解離データにより規定されているブ
ロックの画像データを文字認識した結果のテキストデー
タを格納する領域であって、文字コード列と、各文字画
像を抽出した時に得た文字や行等の配置を表わすレイア
ウト情報とを含むものである。５−６に示すように、先
頭にOCR管理データを持ち、次に１行目から最終行まで
の行情報領域、さらに１行目の先頭文字から最終行の最
終文字までの文字情報領域を保持している。OCR管理デ
ータ５−７は、ブロック内の全行数、平均された行間値
（それぞれの行間隔を足して、行間数で割ったもの）、
及びブロックの横／縦サイズをピクセル数で保持してい
る。行情報５−８は、各行ごとの文字のレイアウト情報
等を格納する領域であって、行内に存在する全文字数、
先頭文字までのインデント値、さらに平均された文字間
値（それぞれの文字間隔を足して、文字間数で割ったも
の）、及び行末に改行が存在しているか否かを示すフラ
グを保持している。この改行が存在しているか否かの判
定は、その行の末尾からブロック領域の端までの距離に
よって行なう。文字情報５−９は、それぞれの文字毎
に、その文字の文字画像を抽出した位置（ブロックの左
／上からの距離）、文字幅、文字高、フォントタイプ、
フォントスタイル、フォントサイズ、そしてOCRした結
果の文字コードを保持している。この結果の文字コード
は、認識処理時の類似度が最高のものを１つのみでも良
いし、或は複数の候補文字のコードであっても良い。

【００３１】次に原稿を画像読み取り装置２−２から読
み込んだ画像データをどのように本文領域と他の領域と
に分別するかの処理を図１１、図１２、図１３、図１
４、図１５、図１６のフローチャートに従って説明す
る。

【００３２】まず、ステップ１１−１において、画像読
み取り装置２−２から画像データを読み込む。さらにス
テップ１１−２において、読み込んだ画像データをOCR
エンジンを用いてPAF(Page Analysis Format)に変換す
る。例えば、図６に示すような原稿を画像読み取り装置
２−２に載置して読み取った場合の画像データは、領域
分割が行われて図７に矩形枠で示すようなブロックが抽
出される。７−１、７−２、７−３、７−４、７−５に
示すブロックは、テキストブロック、即ち文字列のみを
含む領域であり、組方向は、横書きである。７−６に示
すブロックもテキストブロックであるが、組方向は縦書
きである。７−７、７−８に示すのが、ラインブロック
であると、領域分割処理において判定が行なわれ、図５
に示したようなＰＡＦデータを作成してＨＤ１０に格納
される。

【００３３】PAFに変換後、ステップ１１−３におい
て、本文領域用のブロックと他の領域ブロックの分別処
理を行うために「本文用ブロックと他のブロックの分別
処理」を実行する。

【００３４】図１２に示すフローチャートは、「本文用
ブロックと他のブロックの分別処理」（ステップ１１−
３）の詳細な処理を示すものである。ステップ１２−１
において、まず全テキストブロックの全てのフォントサ
イズ（５−９に示す文字情報のフォントサイズ）を調査
し、最も数の多いフォントサイズを求め、ＨＤ１０に最
多フォントサイズ情報としてそのフォントサイズを記憶
する。そして、ステップ１２−２において、ヘッダ領域
用のテキストブロックを抽出するために「ヘッダ領域用
テキストブロックの抽出処理」を実行する。

【００３５】図１３に示すフローチャートが、「ヘッダ
領域用テキストブロックの抽出処理」（ステップ１２−
２）の詳細な処理を示すものであり、ステップ１３−１
において、PAF内のブロックのうち、Ｙポジション（５
−３に示す「テキストブロック管理データ」の用紙上か
らの距離）の最も小さなテキストブロックを取得する。
同じＹポジションのテキストブロックが存在する場合
は、Ｘポジション（５−３に示す「テキストブロック管
理データ」の用紙左からの距離）の小さなブロックを取
得する。さらにステップ１３−２において、そのテキス
トブロックの組方向（５−３に示す「テキストブロック
管理データ」の組方向）を調査し、横書きかどうかを判
断する。横書きでなかった場合は、ヘッダ領域用ブロッ
クではないと判断し、「ヘッダ領域用テキストブロック
の抽出処理」を終了する。横書きであった場合は、ステ
ップ１３−３において、ブロック内の行数（５−７に示
すOCR管理データの行数）を調査し、１行のみのブロッ
クか否かを判断する。２行以上のブロックであった場合
は、ヘッダ領域用ブロックではないと判断し、「ヘッダ
領域用テキストブロックの抽出処理」を終了する。１行
のみのブロックであった場合は、ステップ１３−４にお
いて、図１２のステップ１２−１で求め記憶した最多フ
ォントサイズと比較し、そのブロックの平均フォントサ
イズが、全テキストブロックの最多フォントサイズの
１．５倍以下かどうかを判断する。１．５倍以下でなか
った場合は、ヘッダ領域用ブロックではないと判断し、
「ヘッダ領域用テキストブロックの抽出処理」を終了す
る。１．５倍以下であった場合は、そのテキストブロッ
クは、ヘッダ領域用テキストブロックであると判断し、
ＨＤ１０にヘッダ領域用テキストブロックとしてそのブ
ロックの識別情報を記憶する。これで、最初のヘッダ領
域用テキストブロック（ヘッダ領域用テキストブロック
の第１要素とする）が求められた。次にステップ１３−
６において、Ｙポジション（５−３に示す「テキストブ
ロック管理データ」の用紙上からの距離）の次に小さな
テキストブロック（同じＹポジションのブロックが存在
した場合は、Ｘポジションの小さなブロック）を取得
し、ステップ１３−７において、そのブロックが、ステ
ップ１３−５で記憶したテキストブロックの２行分の範
囲に存在しているブロックかを判断する。例えば、図８
の８−１に示すテキストブロックが、ヘッダ領域用テキ
ストブロックの第１要素であるとしてステップ１３−５
で記憶された場合、その２行分の範囲とは、テキストブ
ロック８−１のブロック縦サイズ５−７を２倍したサイ
ズをテキストブロック８−１の用紙上からの距離５−４
を起点にして定めた範囲であって、８−２と８−３に示
す線分間の範囲である。従って、８−４に示すテキスト
ブロックは、範囲内であり、８−５に示すテキストブロ
ックは、範囲外となる。即ち、ステップ１３−７では、
定めた範囲内にステップ１３−６で取得したブロックが
完全に含まれるものを「範囲内である」と判定するもの
である。ステップ１３−６において、取得したテキスト
ブロックが範囲外と判断された場合は、ヘッダ領域用の
テキストブロックであって、未判定のブロックはもう存
在しないと判断し、「ヘッダ領域用テキストブロックの
抽出処理」を終了する。ステップ１３−７において、ヘ
ッダ領域用テキストブロックの第１要素の２行分の範囲
内と判断された場合は、ステップ１３−８において、そ
のテキストブロックの組方向（５−３に示す「テキスト
ブロック管理データ」の組方向）を調査し、横書きかど
うかを判断する。横書きでなかった場合は、ヘッダ領域
用ブロックではないと判断し、再びステップ１３−６に
戻り、次に対象となるテキストブロックを取得する。横
書きであった場合は、ステップ１３−９において、ブロ
ック内の行数（５−７に示すOCR管理データの行数）を
調査し、１行のみのブロックかを判断する。２行以上の
ブロックであった場合は、ヘッダ領域用ブロックではな
いと判断し、再びステップ１３−６に戻り、次に対象と
なるテキストブロックを取得する。１行のみのブロック
であった場合は、ステップ１３−１０において、ステッ
プ１３−５にて記憶したヘッダ領域用テキストブロック
の平均フォントサイズと当テキストブロックの平均フォ
ントサイズを比較し、サイズの差が２０％以内かどうか
を判断する。サイズの差が２０％以内でなかった場合
は、再びステップ１３−６に戻り、次に対象となるテキ
ストブロックを取得する。サイズの差が２０％以内であ
った場合は、ステップ１３−１１において、そのテキス
トブロックをヘッダ領域用テキストブロックとして、Ｈ
Ｄ１０にそのブロックの識別情報を記憶する。

【００３６】上記処理により、１つあるいは複数のヘッ
ダ領域用テキストブロックが求められるヘッダ領域用テ
キストブロックの抽出処理（ステップ１２−２）が完了
する。

【００３７】次に図１２のステップ１２−３において、
フッタ領域用のテキストブロックを抽出するための「フ
ッタ領域用テキストブロックの抽出処理」を実行する。

【００３８】図１４に示すフローチャートが、「フッタ
領域用テキストブロックの抽出処理」（ステップ１２−
３）の詳細な処理を示すものであり、ステップ１４−１
において、PAF内のブロックのうち、Ｙポジション（５
−３に示す「テキストブロック管理データ」の用紙上か
らの距離）の最も大きなテキストブロックを取得する。
同じＹポジションのテキストブロックが存在する場合
は、Ｘポジション（５−３に示す「テキストブロック管
理データ」の用紙左からの距離）の小さなブロックを取
得する。さらにステップ１４−２において、そのテキス
トブロックの組方向（５−３に示す「テキストブロック
管理データ」の組方向）を調査し、横書きかどうかを判
断する。横書きでなかった場合は、フッタ領域用ブロッ
クではないと判断し、「フッタ領域用テキストブロック
の抽出処理」を終了する。横書きであった場合は、ステ
ップ１４−３において、ブロック内の行数（５−７に示
すOCR管理データの行数）を調査し、１行のみのブロッ
クかを判断する。２行以上のブロックであった場合は、
フッタ領域用ブロックではないと判断し、「フッタ領域
用テキストブロックの抽出処理」を終了する。１行のみ
のブロックであった場合は、ステップ１４−４におい
て、図１２のステップ１２−１で求め記憶した最多フォ
ントサイズと比較し、そのブロックの平均フォントサイ
ズが、全テキストブロックの最多フォントサイズの１．
５倍以下かどうかを判断する。１．５倍以下でなかった
場合は、フッタ領域用ブロックではないと判断し、「フ
ッタ領域用テキストブロックの抽出処理」を終了する。
１．５倍以下であった場合は、そのテキストブロック
は、フッタ領域用テキストブロックであると判断し、Ｈ
Ｄ１０にフッタ領域用テキストブロックとしてそのブロ
ックの識別情報を記憶する。これで、最初のフッタ領域
用テキストブロック（フッタ領域用テキストブロックの
第１要素とする）が求められた。次にステップ１４−６
において、Ｙポジション（５−３に示す「テキストブロ
ック管理データ」の用紙上からの距離）の次に大きなテ
キストブロック（同じＹポジションのブロックが存在し
た場合は、Ｘポジションの小さなブロック）を取得す
る。ただし、ステップ１４−１或は以前のステップ１４
−６においてＹポジションが同じで処理が保留されてい
るブロックがある場合は、そのブロックのを取得する。
ステップ１４−７において、そのブロックが、ステップ
１４−６で記憶したテキストブロックの２行分の範囲に
存在しているブロックかを判断する。この２行分の範囲
の求め方はステップ１３−７に準ずるものであるが、範
囲を定める起点を第１の要素のブロックの用紙上からの
距離にブロック縦サイズを加算した距離とする点が異な
る。例えば、図８の８−６に示すテキストブロックが、
フッタ領域用テキストブロックの第１要素であった場
合、その２行分の範囲とは、８−７と８−８に示す線分
間である。従って、８−９、８−１０に示すテキストブ
ロックは、範囲内であり、８−１１に示すテキストブロ
ックは、範囲外となる。ステップ１４−６において、取
得したテキストブロックが範囲外と判断された場合は、
フッタ領域用のテキストブロックであって、未判定のブ
ロックはもう存在しないと判断し、「フッタ領域用テキ
ストブロックの抽出処理」を終了する。ステップ１４−
７において、フッタ領域用テキストブロックの第１要素
の２行分の範囲内と判断された場合は、ステップ１４−
８において、そのテキストブロックの組方向（５−３に
示す「テキストブロック管理データ」の組方向）を調査
し、横書きかどうかを判断する。横書きでなかった場合
は、フッタ領域用ブロックではないと判断し、再びステ
ップ１４−６に戻り、次に対象となるテキストブロック
を取得する。横書きであった場合は、ステップ１４−９
において、ブロック内の行数（５−７に示すOCR管理デ
ータの行数）を調査し、１行のみのブロックか否かを判
断する。２行以上のブロックであった場合は、フッタ領
域用ブロックではないと判断し、再びステップ１４−６
に戻り、次に対象となるテキストブロックを取得する。
１行のみのブロックであった場合は、ステップ１４−１
０において、ステップ１４−５にて記憶したフッタ領域
用テキストブロックの平均フォントサイズと当テキスト
ブロックの平均フォントサイズを比較し、サイズの差が
２０％以内かどうかを判断する。サイズの差が２０％以
内でなかった場合は、再びステップ１４−６に戻り、次
に対象となるテキストブロックを取得する。サイズの差
が２０％以内であった場合は、ステップ１４−１１にお
いて、そのテキストブロックをフッタ領域用テキストブ
ロックとして、ＨＤ１０にそのブロックの識別情報を記
憶する。上記処理により、１つあるいは複数のフッタ領
域用テキストブロックが求めるフッタ領域用テキストブ
ロックの抽出処理（ステップ１２−３）が完了する。

【００３９】次に図１２のステップ１２−４において、
枠領域用のブロックを抽出するための「枠領域用ブロッ
クの抽出処理」を実行する。図１５に示すフローチャー
トが、「枠領域用ブロックの抽出処理」（ステップ１２
−４）の詳細な処理を示すものである。

【００４０】ステップ１５−１において、既に求めて記
憶したヘッダ領域用テキストブロック及びフッタ領域用
テキストブロック以外の全テキストブロックから、主と
なる組方向を求め、本文領域用の組方向とする。主とな
る組方向は、以下のようにして求める。ヘッダ領域用テ
キストブロック及びフッタ領域用テキストブロック以外
の全テキストブロックのそれぞれの面積（５−３に示す
テキストブロック管理データのブロック横／縦サイズか
ら求める）をそれぞれの組方向（５−３に示すテキスト
ブロック管理データの組方向）別に合計し、面積の大き
い方を主となる組方向とする。

【００４１】次にステップ１５−２において、PAF内の
ブロックのうち、既に求めて記憶したヘッダ領域用テキ
ストブロック及びフッタ領域用テキストブロック以外の
全テキストブロックの中で、Ｙポジション（５−３に示
す「テキストブロック管理データ」の用紙上からの距
離）の最も小さなブロックを取得する。同じＹポジショ
ンのブロックが存在する場合は、Ｘポジション（５−
３、５−４、５−５に示す「ブロック管理データ」の用
紙左からの距離）の小さなブロックを取得する。もう該
当するブロックが存在しないのであれば、ステップ１５
−３においてそれを判断し、「枠領域用ブロックの抽出
処理」を終了する。該当するブロックが存在する場合
は、ステップ１５−４において、そのブロックの種類
（５−３、５−４、５−５に示す「ブロック管理デー
タ」のブロックの種類）が画像であるか否かを判定し、
画像ブロックであった場合は、ステップ１５−５におい
て、画像枠として抽出してＨＤ１０にそのブロックの識
別情報と記憶する。画像ブロックでないと判定された場
合は、ステップ１５−６において、さらにブロックの種
類（５−３、５−４、５−５に示す「ブロック管理デー
タ」のブロックの種類）がテーブルであるか否かを判定
し、テーブルブロックであった場合は、ステップ１５−
７において、テーブル枠として抽出してＨＤ１０にその
ブロックの識別情報と記憶する。テーブルブロックでな
いと判定された場合は、ステップ１５−８において、さ
らにブロックの種類（５−３、５−４、５−５に示す
「ブロック管理データ」のブロックの種類）がラインで
あるか否かを判定し、ラインブロックであった場合は、
ステップ１５−９において、ラインデータとして抽出し
てＨＤ１０にそのブロックの識別情報と記憶する。ライ
ンブロックでないと判定された場合は、ステップ１５−
１０において、さらにブロックの種類（５−３、５−
４、５−５に示す「ブロック管理データ」のブロックの
種類）がテキストであるか否かを判定し、テキストブロ
ックであった場合は、ステップ１５−１１において、
「テキストブロックチェック処理」を実行する。

【００４２】図１６に示すフローチャートが「テキスト
ブロックチェック処理」（ステップ１５−１２）の詳細
な処理を示すものである。

【００４３】ステップ１６−１において、ブロック管理
データを用いてそのテキストブロックは、ヘッダ領域に
跨っているかどうかを判断し、跨っている場合は本文領
域になり得ないので、テキスト枠として抽出した旨をリ
ターンする（ステップ１６−６）。ヘッダ領域に跨って
いない場合は、ステップ１６−２において、フッタ領域
に跨っているかどうかを判断し、跨っている場合は、本
文領域になり得ないので、テキスト枠として抽出した旨
をリターンする（ステップ１６−６）。フッタ領域にも
跨っていない場合は、ステップ１６−３において、ステ
ップ１５−１で求め記憶した組方向と当テキストブロッ
クの組方向とを比較し、異なっている場合は、本文領域
になり得ないので、テキスト枠として抽出した旨をリタ
ーンする（ステップ１６−６）。同じ組方向であった場
合は、ステップ１６−４において、そのテキストブロッ
クの最も多いフォントサイズが、ステップ１２−１にお
いて求め記憶した全体のテキストブロックの最多フォン
トサイズの２倍以上かを判断し、２倍以上であった場合
は、テキスト枠として抽出した旨をリターンする（ステ
ップ１６−６）。２倍以上でなかった場合は、本文領域
として抽出した旨をリターンする（ステップ１６−
５）。

【００４４】ステップ１５−１２において、「テキスト
ブロックチェック処理」におけるステップ１６−５或は
ステップ１６−６でリターンされたデータを判断し、テ
キスト枠である旨を示すデータならば、ステップ１５−
１３において、ステップ１５−２で取得したテキストブ
ロックをテキスト枠として抽出してＨＤ１０にそのブロ
ックの識別情報と記憶する。

【００４５】上記の処理により、各ブロックを分類して
本文領域用と他の領域用のブロックに分別した記憶が完
了し、図１１のステップ１１−４における、本文書式の
作成を開始する。

【００４６】図１２〜図１６のフローチャートに沿って
説明してきた「本文領域と他の領域との分別処理」（ス
テップ１１−３）を図６に示す画像データに対して実行
した場合の結果を具体的に説明する。

【００４７】ステップ１１−２において読み取った画像
データをOCRエンジンを用いてPAFに変換した結果の各ブ
ロック（図７）に対して「本文用ブロックと他のブロッ
クの分別処理」を実行すると、まずステップ１２−２に
おいて、ヘッダ領域用テキストブロックとして、図７の
７−１、７−２に示すテキストブロックが分別される。
続いてステップ１２−３において、フッタ領域用テキス
トブロックとして、図７の７−３、７−４、７−５に示
すテキストブロックが分別される。そして、ステップ１
２−４において、枠領域用ブロックとして、図７の７−
６に示すテキストブロック、７−７、７−８に示すライ
ンブロックが分別され、これらの分別されたブロック以
外の図９に示すテキストブロックが、本文領域用として
分別される。この結果、図９に示す１８個の各領域が本
文領域用ブロックとして分別された領域である。

【００４８】尚、図１３のフローチャートに示したヘッ
ダ領域用テキストブロックの抽出処理では、判定対象と
しているブロックがヘッダ領域用テキストであるか否か
を判定する基準の一つとして、ステップ１３−４におい
てそのブロックの平均フォントサイズが全テキストブロ
ックの最多フォントサイズの１．５倍以下か否かという
判断を行なったが、そのブロックの平均フォントサイズ
をユーザにより指定された数値と比較するようにしても
良い。この場合のヘッダ領域用テキストブロックの抽出
処理のフローチャートを図１７に示す。ステップ１３−
４に替えて、ステップ１７−４において、そのブロック
の平均フォントサイズがユーザによって指定されたポイ
ントサイズ以下か否かを判断する。指定されたポイント
サイズ以下でなかった場合は、ヘッダ領域用ブロックで
ないと判断し、「ヘッダ領域用テキストブロックの抽出
処理」を終了する。指定されたポイントサイズ以下であ
ると判断された場合は、そのテキストブロックはヘッダ
領域用テキストブロックであると判断し、ＨＤ１０にヘ
ッダ領域用テキストブロックとしてそのブロックの識別
情報を記憶する。図１７のフローチャートにおいて、ス
テップ１７−４以外の処理は図１３のフローチャートに
示した処理と同じであり、同ステップには同ステップ番
号を付した。

【００４９】また、ヘッダ領域用テキストブロックの抽
出処理に合わせ、フッタ領域用テキストブロックの抽出
においてもユーザにより指定された数値との比較ステッ
プに置き替える。この処理を示すのが図１８のフローチ
ャートであって、図１４のフローチャートにおけるステ
ップ１４−４に替えてステップ１８−４を実行する。ス
テップ１８−４において、そのブロックの平均フォント
サイズが、ユーザによって指定されたポイントサイズ以
下か否かを判断する。ユーザによって指定されたポイン
トサイズ以下でなかった場合は、フッタ領域用ブロック
ではないと判断し、「フッタ領域用テキストブロックの
抽出処理」を終了する。ユーザによって指定されたポイ
ントサイズ以下であった場合は、そのテキストブロック
は、フッタ領域用ブロックであると判断し、ＨＤ１０に
フッタ領域用テキストブロックとしてそのブロックの識
別情報を記憶する。図１８のフローチャートにおいて、
ステップ１８−４以外の処理は図１４のフローチャート
に示した処理と同じであり、同ステップには同ステップ
番号を付した。尚、ステップ１７−４及びステップ１８
−４で用いるユーザにより指定されたポイントサイズと
は、これらの処理が実行される以前にＨＤ１０にユーザ
指定ポイントサイズのパラメータとして予め記憶された
データであって、キーボード１２或はマウス１３より入
力された数値である。

【００５０】次に、図１６のフローチャートに示した
「テキストブロックチェック処理」におけるステップ１
６−４において、本文領域として抽出するか否かを判定
する基準の一つとして２倍というパラメータを用いた処
理に替えて、ユーザにより指定された数値を用いる処理
について説明する。その処理を示すのが図１９のフロー
チャートであって、ステップ１９−４においてそのテキ
ストブロックの最多フォントサイズが、ステップ１２−
１において求めて記憶した全体のテキストブロックの最
多フォントサイズにユーザが指定した倍率をかけた値以
上か否かを判断する。ここで指定倍以上であると判断さ
れた場合は、テキスト領域として抽出した旨をリターン
し（ステップ１６−６）、指定倍以上でないと判断され
た場合は、本文領域として抽出した旨をリターンする
（ステップ１６−５）。

【００５１】図１９のフローチャートにおいて、ステッ
プ１９−４以外の処理は図１６のフローチャートに示し
た処理と同じであり、同ステップには同ステップ番号を
付した。ステップ１９−４で用いるユーザにより指定さ
れた倍率とは、これらの処理が実行される前にＨＤ１０
にユーザ指定倍率のパラメータとして予め記憶されたデ
ータであって、キーボード１２或はマウス１３より入力
された数値である。

【００５２】ここで、ステップ１１−４における本文書
式の作成処理について説明する。尚、ここで作成される
書式とは、通常のワープロソフト等で作成される文書の
書式と同様のものであって、その設定された位置から先
の文書のレイアウトを定めるものであり、後の編集作業
において改頁が挿入された場合には、次頁のレイアウト
も同じにするものである。即ち、その書式が作成された
時の領域サイズに関わらず、その後の文字の挿入や削除
に合わせて制御対象領域が伸縮するものである。

【００５３】図２０に示すフローチャートが、ステップ
１１−４における「本文書式の作成処理」の詳細な処理
ステップである。

【００５４】ステップ２０−１において、図５のPAFの
ヘッダ領域５−２のイメージ幅情報及びイメージ高さ情
報により表わされる処理対象としてスキャナより入力し
たイメージより大きくかつ最も近い定型用紙サイズ（A
３、A４、A５、Ｂ４、Ｂ５等であって、用紙の種類の識
別情報と各用紙の縦横サイズとを対応づけて予めＨＤ１
０に登録しておいたものとする。）を本文書式の用紙サ
イズに決定し、ＨＤ１０に記憶する。その際、イメージ
幅と決定した定型用紙の幅との差、及びイメージ高と定
型用紙の高さとの差も算出してＨＤ１０に記憶してお
く。

【００５５】次にステップ２０−２において、本文領域
用として残ったテキストブロック群（図９）を包み込む
最小矩形を（図１０、枠９−１）本文領域として、左右
上下余白を決定する。この時、ステップ２０−１におい
て記憶したイメージ幅と決定した定型用紙幅との差、及
びイメージ高と決定した定型用紙高との差を考慮し、左
右上下余白値を算出し、ＨＤ１０に記憶する。例えば、
図１０の９−１に示す矩形が、本文領域用のテキストブ
ロック群を包み込む最小矩形であるので、この矩形領域
を本文領域とする。そして、９−２、９−３、９−４、
９−５に示すのが、それぞれ左右上下余白となるので、
本文書式として決定する左余白値には、９−２に示す入
力イメージにおける左端から、本文領域までの巾である
左余白＋（定型用紙幅−イメージ幅）／２を設定する。
同様に右余白値にも、９−３に示す入力イメージにおけ
る右端から本文領域までの巾である右余白＋（定型用紙
幅−イメージ幅）／２を設定する。また、上余白値に
は、９−４に示す入力イメージにおける上端から本文領
域までの高さである上余白＋（定型用紙高−イメージ
高）／２を設定する。同様に下余白値にも、９−５に示
す入力イメージにおける下端から本文領域までの高さで
ある下余白＋（定型用紙高−イメージ高）／２を設定す
る。

【００５６】次にステップ２０−３において、図１５の
ステップ１５−１で記憶した主となる組方向を本文書式
の組方向としてＨＤ１０に記憶する。さらに、ステップ
２０−４において、本文領域用のテキストブロック全て
のフォントサイズ（５−９に示す文字情報のフォントサ
イズ）を調査し、最も数の多いフォントサイズを求め、
本文書式の文字サイズとしてＨＤ１０に記憶する。そし
て、ステップ２０−５において、本文領域用のテキスト
ブロック全ての平均文字間（５−８に示す行情報の平均
文字間）を調査し、最も数の多い平均文字間を求め、求
めた平均文字間と本文書式の文字サイズ（ステップ２０
−４においてＨＤ１０に記憶）とを足した値で本文領域
の幅を割った商を文字数／行に設定し、ＨＤ１０に記憶
する。さらに、ステップ２０−６において、書体に明朝
体を設定してＨＤ１０に記憶し、ステップ２０−７にお
いて、本文領域用のテキストブロック全ての平均行間
（５−７に示すOCR管理データの平均行間）を調査し、
最も数の多い平均行間を求め、求めた平均行間と本文書
式の文字サイズ（ステップ２０−４においてＨＤ１０に
記憶）を足した値で本文領域の高さを割った商を行数／
頁に設定し、ＨＤ１０に記憶する。

【００５７】次にステップ２０−８において、本文書式
の段組関係の設定を行う。まず段数の決定方法は、本文
領域用のテキストブロック群をどのテキストブロックも
分割せずに、かつ他の矩形を重ならずに最多のテキスト
ブロックを含むことのできる矩形で分割した時、各矩形
の最小Ｙ座標値を示すＹポジションの最も小さな矩形が
いくつ存在するかを求め、それを本文書式の段数として
ＤＨ１０に記憶する。また、複数段の場合には、それぞ
れの矩形の幅を段幅に、矩形間を段間に設定する。矩形
間にラインデータが存在すれば、段間罫線として設定す
る。例えば、図２２において点線枠で示す１０−３、１
０−４、１０−５の３つの矩形内に存在し、各矩形によ
り分割されているのが、先に説明した処理により判別し
た本文領域用のテキストブロック群である。１０−３に
示す矩形が、Ｙポジションの最も小さな矩形であるの
で、この場合は、１段組が設定される。また、この場合
は、１段組であるので、段幅には本文領域の幅と同じ値
が設定される。

【００５８】次に、ステップ１７−９において、途中段
組変更の設定を行う。ステップ２０−８で設定された矩
形を除いた矩形の中でステップ２０−８で行なったと同
じＹポジションの判定を行なって頁の途中から段組が変
わると判断された場合は、段組変更が生じるＹポジショ
ン、新たな段数、段幅、段間を設定する。例えば、図２
２の場合、ステップ２０−８で矩形１０−３が段組設定
されたので残りの１０−４、１０−５に示す矩形のＹポ
ジションを判定すると、この２つの矩形のＹポジション
が同じであると判定できることにより、この２つの矩形
から、頁の途中から変更になる段組の書式を設定すべき
であると判断し、１０−４に示す矩形のＹポジションを
変更ポジションに設定し、このＹポジションに矩形が２
つあることから段数には２段組、段幅にはそれぞれの矩
形の幅、段間には矩形間を設定する。また、１０−６、
１０−７に示すラインデータは、図１５のステップ１５
−９において、メモリに記憶されているもので、１０−
６、１０−７に示すラインデータのラインブロック管理
データ（図５の５−５に示す）を調査すると、それぞれ
のスタートポジションＸ／エンドポジションＸの値が同
じであり、線種も太さも同じことから、１本の段間罫線
として設定する。

【００５９】以上図２０のフローチャートに従って述べ
た本文領域テキストブロック群からの本文書式作成処理
は、例えば、ヘッダ／フッタ領域用のテキストブロック
からヘッダ／フッタ書式を決定し、本文書式へ含めても
良いし、ヘッダ／フッタ領域用のテキストブロック内の
ひげ付き数字から頁番号を本文書式に設定しても良い。
以下、図２１に示す「本文書式の作成処理」の第二例の
フローチャートに従い、これらのヘッダ、フッタ及び頁
番号を本文書式に設定する処理について説明する。

【００６０】ただし、ステップ２０−１から２０−９ま
での各処理ステップは図２０のフローチャートにおいて
説明した処理ステップと同様なので、図２１のフローチ
ャートにおいても同じステップ番号を付し、ここでの説
明を省略する。

【００６１】次にステップ２１−１０において、図１３
に示す「ヘッダ領域用テキストブロックの抽出処理」で
抽出しＨＤ１０に記憶したヘッダ領域用テキストブロッ
ク群を包み込む最小の矩形をヘッダ領域とし、ヘッダ書
式を決定する。この時、ステップ２０−１において記憶
したイメージ幅と決定した定型用紙幅との差、及びイメ
ージ高と決定した定型用紙高との差を考慮し、ヘッダ領
域の左上余白値を決定し、ＨＤ１０に記憶する。例え
ば、図２２の１０−１に点線枠で示す矩形が、ヘッダ領
域用のテキストブロック群を包み込む最小矩形であるの
で、この矩形領域をヘッダ領域とする。そして、１０−
８、１０−９に示すのが、それぞれ左上余白となるの
で、左余白値には、１０−８に示す左余白＋（定型用紙
幅−イメージ幅）／２を設定し、上余白値には、１０−
９に示す上余白＋（定型用紙高−イメージ高）／２を設
定する。また、ヘッダ領域のサイズには、ヘッダ領域用
テキストブロックを包み込む最小矩形の幅と高さを設定
し、ＨＤ１０に記憶する。

【００６２】ヘッダ書式の文字サイズは、ヘッダ領域内
のテキストブロック全てのフォントサイズ（５−９に示
す文字情報のフォントサイズ）を調査し、最も数の多い
フォントサイズを求め、ヘッダ書式の文字サイズとして
ＨＤ１０に記憶する。また、文字数／行には、ヘッダ領
域用のテキストブロック全ての平均文字間（５−８に示
す行情報の平均文字間）を調査し、最も数の多い平均文
字間を求め、求めた平均文字間とヘッダ書式の文字サイ
ズを足した値でヘッダ領域の幅を割った商を文字数／行
に設定し、ＨＤ１０に記憶する。

【００６３】次にステップ２１−１１において、図１４
に示す「フッタ領域用テキストブロックの抽出処理」で
抽出し記憶したフッタ領域用テキストブロック群を包み
込む最小の矩形をフッタ領域とし、フッタ書式を決定す
る。この時、ステップ２０−１において記憶したイメー
ジ幅と決定した定型用紙幅との差、及びイメージ高と決
定した定型用紙高との差を考慮し、フッタ領域の左上余
白値を決定し、ＨＤ１０に記憶する。例えば、図２２の
１０−２に点線枠で示す矩形が、フッタ領域用のテキス
トブロック群を包み込む最小矩形であるので、この矩形
領域をフッタ領域とする。そして、１０−１０、１０−
１１に示すのが、それぞれ左余白及び下余白となるの
で、左余白値には、１０−１０に示す左余白＋（定型用
紙幅−イメージ幅）／２を設定し、下余白値には、１０
−１１に示す下余白＋（定型用紙高−イメージ高）／２
を設定する。また、フッタ領域のサイズには、フッタ領
域用テキストブロックを包み込む最小矩形の幅と高さを
設定し、ＨＤ１０に記憶する。

【００６４】フッタ書式の文字サイズは、フッタ領域内
のテキストブロック全てのフォントサイズ（５−９に示
す文字情報のフォントサイズ）を調査し、最も数の多い
フォントサイズを求め、フッタ書式の文字サイズとして
ＨＤ１０に記憶する。また、文字数／行には、フッタ領
域用のテキストブロック全ての平均文字間（５−８に示
す行情報の平均文字間）を調査し、最も数の多い平均文
字間を求め、求めた平均文字間とフッタ書式の文字サイ
ズを足した値でフッタ領域の幅を割った商を文字数／行
に設定し、ＨＤ１０に記憶する。

【００６５】次にステップ２１−１２において、ヘッダ
領域内とフッタ領域内に”ひげ”付き数字が存在するか
を調査する。すなわち、”−１−”、”（１）”、”＜
１＞”等、ひげに挟まれた数字が存在した場合、その”
ひげ”の種類、存在した領域（ヘッダ領域かフッタ領
域）、存在した位置（各領域の左上からのポジション）
を本文書式の頁番号に設定し、ＨＤ１０に記憶する。

【００６６】以上、図２０或は図２１のフローチャート
に示す処理により作成された各書式データは、一つの原
稿画像から抽出されたものをまとめて、その画像と関連
づけてＨＤ１０に記憶する。これは、その画像から得た
ＰＡＦ内に記憶しても良いし、或は、ＰＡＦ内に書式デ
ータを記憶しているＨＤ１０内の位置を示すアドレスを
記憶させても良い。

【００６７】図１６のステップ１６−６においてテキス
ト枠として抽出すべきと判断されたテキストブロックの
各々について、テキスト枠書式を作成する。

【００６８】図２３に示すフローチャートが、「テキス
ト枠書式の作成処理」である。

【００６９】ステップ２３−１において、図５の５−３
に示す「テキストブロック管理データ」のブロック横／
縦サイズから、テキスト枠のサイズを決定し、ＨＤ１０
に記憶する。次にステップ２３−２において、テキスト
枠書式の左右上下余白を以下のように求め、ＨＤ１０に
記憶する。まず、左余白は、図５の５−８に示す行情報
のインデントを調査し、そのテキストブロック内の全て
の行の中で最も小さなインデントを左余白とする。右余
白は、図５の５−９に示す文字情報のブロック左からの
距離と文字幅を調査し、そのテキストブロック内全ての
行の最終文字の右端を比べ、最も大きな値とブロックの
右端との距離の差を右余白とする。上余白は、図５の５
−９に示す文字情報のブロック上からの距離を調査し、
そのテキスト内の１行目内全ての文字の中の最も大きな
値を上余白とする。下余白は、図５の５−９に示す文字
情報のブロック上からの距離と文字高を調査し、そのテ
キストブロック内の最終行の全ての文字の下端を比べ、
最も大きな値とブロックの下端との距離の差を下余白と
する。

【００７０】次にステップ２３−３において、図５の５
−３に示すテキストブロック管理データの組方向をテキ
スト枠書式の組方向としてＨＤ１０に記憶する。さら
に、ステップ２３−４において、そのテキストブロック
全てのフォントサイズ（５−９に示す文字情報のフォン
トサイズ）を調査し、最も数の多いフォントサイズを求
め、テキスト枠書式の文字サイズとしてＨＤ１０に記憶
する。そして、ステップ２３−５において、そのテキス
トブロック全ての平均文字間（５−８に示す行情報の平
均文字間）を調査し、最も数の多い平均文字間を求め、
求めた平均文字間とテキスト枠書式の文字サイズ（ステ
ップ１８−４においてＨＤ１０に記憶）を足した値でテ
キスト領域の横（枠の横サイズから左右余白を引いた
値）を割った商を文字数／行に設定し、ＨＤ１０に記憶
する。さらに、ステップ２３−６において、書体に明朝
体を設定しＨＤ１０に記憶し、ステップ２３−７におい
て、そのテキストブロック全ての平均行間（５−７に示
すOCR管理データの平均行間）を調査し、最も数の多い
平均行間を求め、求めた平均行間とテキスト枠書式の文
字サイズ（ステップ１８−４においてＨＤ１０に記憶）
を足した値でテキスト領域の縦（枠の縦サイズから上下
余白を引いた値）を割った商を行数／頁に設定し、ＨＤ
１０に記憶する。

【００７１】以上図２３のフローチャートに従って述べ
たテキスト枠として抽出したテキストブロックからのテ
キスト枠書式作成処理はテキスト枠であると判断したテ
キストブロック内の文字についてのみ書式を作成するも
のであったが、例えば、そのテキスト枠内の元画像の中
の枠（罫線）の線種や太さまで抽出し、枠書式として設
定しても良い。この場合、図５で説明したPAF(Page Ana
lysis Format)の「ブロック管理データ」５−３に、も
う一つ、「フレームブロック管理データ」を加える。

【００７２】「フレームブロック管理データ」とは、図
２４の１９−２に示す構造体で、他のブロック管理デー
タ（テキスト、画像、ライン等）と同様に、用紙左から
の距離、用紙上からの距離、及びそれぞれのブロックの
横／縦サイズをピクセル数で保持し、さらにブロックが
どのような種類のデータを保持しているかを示すテーブ
ルも持っている。そして、「フレームブロック管理デー
タ」固有のデータとして、矩形の線種と太さを持ってい
る。例えば、図６に示す画像データをOCRエンジンによ
り領域分割すると、図７に示すような領域分割が行われ
る。この中で、７−９で示すのが、テキスト枠であると
ステップ１６−６で判断されたブロック内の文字群を囲
む枠であり、７−１０で示すのが、フレームブロックで
ある。このように元画像の中の矩形イメージ部分が領域
分割された際に抽出されるブロックをフレームブロック
とする。

【００７３】次に図１２のステップ１２−４における、
「枠領域用ブロックの抽出処理」において、枠データを
も識別するステップを含む場合の詳細処理を図２５の
「枠領域用ブロックの抽出処理」のフローチャートに従
って説明する。ただし、ステップ１５−１から１５−９
及びステップ１５−１０から１５−１３の各処理ステッ
プは図１５のフローチャートに従って説明した処理と同
様なので、同じステップ番号を付し、ここでの説明は省
略する。

【００７４】ステップ１５−８においてラインブロック
でないと判断された場合は、ステップ２５−１におい
て、さらにブロックの種類（５−３、５−４、５−５、
１９−２に示す「ブロック管理データ」のブロックの種
類）を調査し、フレームブロックであった場合は、ステ
ップ２５−２において、枠データとして抽出し、ＨＤ１
０に記憶する。ステップ２５−１においてフレームブロ
ックでないと判断された場合は、ステップ１５−１１に
進む。ステップ１５−１１における「テキストブロック
チェック処理」においてリターンされた値を判断し、テ
キスト枠であると判断されたならば、ステップ１５−１
３において、そのテキストブロックをテキスト枠として
抽出し、ＨＤ１０に記憶し、ステップ２５−３におい
て、そのテキストブロックの書式を作成するために、
「テキスト枠書式の作成処理」を呼び出す。図２６がス
テップ２５−３で実行される「テキスト枠書式の作成処
理」の詳細を示すフローチャートである。

【００７５】ステップ２６−１において、当テキストブ
ロックを包含するフレームブロック（図２５のステップ
２５−２において、枠データとしてＨＤ１０に記憶した
ブロック）が存在するかを調査する（例えば、図７の７
−９の示すテキストブロックは、７−１０の示すフレー
ムブロックに包含されている）。当テキストブロックを
包含するフレームブロックが存在するとステップ２６−
１において判断された場合は、ステップ２６−３におい
て、図２４の１９−２に示す「フレームブロック管理デ
ータ」のブロック横／縦サイズから、テキスト枠のサイ
ズを決定し、かつ「フレームブロック管理データ」の線
種／太さから枠線種と枠線の太さを決定し、ＨＤ１０に
記憶する。

【００７６】次にステップ２６−４において、当テキス
トブロックとこれを包含するフレームブロックの管理デ
ータからテキスト枠書式の左右上下余白を以下のように
求め、ＨＤ１０に記憶する。まず、左余白は、図２４の
１９−２に示す「フレームブロック管理データ」の用紙
左からの距離と図５の５−３に示す「テキストブロック
管理データ」の用紙左からの距離との差を左余白とす
る。右余白は、図２４の１９−２に示す「フレームブロ
ック管理データ」の用紙左からの距離にブロック横サイ
ズを加えた値と図５の５−３に示す「テキストブロック
管理データ」の用紙左からの距離にブロック横サイズを
加えた値との差を右余白とする。上余白は、図２４の１
９−２に示す「フレームブロック管理データ」の用紙上
からの距離と図５の５−３に示す「テキストブロック管
理データ」の用紙上からの距離との差を上余白とする。
下余白は、図２４の１９−２に示す「フレームブロック
管理データ」の用紙上からの距離にブロック縦サイズを
加えた値と図５の５−３に示す「テキストブロック管理
データ」の用紙上からの距離にブロック縦サイズを加え
た値との差を下余白とする。

【００７７】次にステップ２６−５において、図５の５
−３に示すテキストブロック管理データの組方向をテキ
スト枠書式の組方向としてＨＤ１０に記憶する。さら
に、ステップ２６−６において、そのテキストブロック
全てのフォントサイズ（５−９に示す文字情報のフォン
トサイズ）を調査し、最も数の多いフォントサイズを求
め、テキスト枠書式の文字サイズとしてＨＤ１０に記憶
する。そして、ステップ２６−７において、そのテキス
トブロック全ての平均文字間（５−８に示す行情報の平
均文字間）を調査し、最も数の多い平均文字間を求め、
求めた平均文字間とテキスト枠書式の文字サイズ（ステ
ップ２２−６においてＨＤ１０に記憶した文字サイズ）
を足した値でテキストブロックのブロック横サイズ（５
−３に示すテキストブロック管理データのブロック横サ
イズ）を割った商を文字数／行に設定し、はＨＤ１０に
記憶する。さらに、ステップ２６−８において、書体に
明朝体を設定しＨＤ１０に記憶し、ステップ２６−９に
おいて、そのテキストブロック全ての平均行間（５−７
に示すOCR管理データの平均行間）を調査し、最も数の
多い平均行間を求め、求めた平均行間とテキスト枠書式
の文字サイズ（ステップ２６−６においてＨＤ１０に記
憶した文字サイズ）を足した値でテキストブロックのブ
ロック縦サイズ（５−３に示すテキストブロック管理デ
ータのブロック縦サイズ）を割った商を行数／頁に設定
し、ＨＤ１０に記憶する。

【００７８】ステップ２６−１において、当テキストブ
ロックを包含するフレームブロック（図２６のステップ
２５−２において、枠データとしてメモリに記憶したブ
ロック）が存在しなかった場合は、ステップ２３−１に
進む。ステップ２３−１から２３−７に示す各処理ステ
ップは図２３のフローチャートの各処理と同様なので同
じステップ番号を付し、ここでの説明は省略する。ただ
し、ステップ２３−１において、この場合は当テキスト
ブロックを包含するフレームブロックがないことから、
枠線は”なし”として、ＨＤ１０に記憶する。

【００７９】以上述べたように各ブロックの抽出処理
（図１２のフローチャートに示す各処理ステップ）を図
３に示した画像サンプルに施し、終了した結果の各領域
の大きさや位置を示したものが図２７である。２７−１
に示す領域がヘッダ領域であり、２７−２に示す領域が
フッタ領域である。２７−３に示す領域がテキスト枠領
域であり、２７−４に示す領域がライン領域である。２
７−５、２７−６、２７−７に示す各領域が本文領域で
ある。

【００８０】ここで、枠とは、図２７に示すように、本
文領域に重ねて設定し得る領域であって（図２７の場
合、テキスト枠領域２７−３は本文領域２７−６及び本
文領域２７−７に一部重なって設定されている。）、本
文領域に入力される文章（本文）は枠を避けて配置され
る。即ち、本文領域のうち、枠領域として定められてい
る領域以外に順に文字を配置するものである。

【００８１】また、各々作成された書式は、先に述べた
ようにＰＡＦと関連づけて記憶し、キーボード１２或は
マウス１３の呼び出し指示に応じて表示器１６に表示或
はプリンタ１８から印字する時にはその書式に応じてテ
キストブロック内データ５−６の文字コードに対応する
フォントを配置、或はラインブロック管理データ５−５
のデータに従ってラインを描画して出力する。これによ
り、スキャナ１Ｂより入力した画像データと同じレイア
ウトで、しかし文字や図形は清書した状態の文書を出力
し、更に表示器１６上でキーボード１２やマウス１３の
指示により編集することが可能となる。ここでテキスト
ブロックに新たに文字が挿入された場合にも、書式とし
て定められている態様で文字を再配列するので、オペレ
ータの望む文書が入力画像と同じレイアウト、書式で配
置されたものを得ることができる。

【００８２】ここから、ＯＣＲした結果（ＰＡＦ）のデ
ータを形態素解析してブロック間の文字列のつながりを
判断する処理について説明する。

【００８３】この処理は、図２９のステップ２９−５で
行なうが、このステップ以前に実行する処理は図１１の
フローチャートで説明したステップ１１−１から１１−
４の処理と同様であるので、同じステップ番号を付し、
ここでの説明は省略する。ステップ２９−５において、
「文書データ作成処理」を実行する。図３０に示すフロ
ーチャートが、「文書データ作成処理」の詳細ステップ
を示すものであって、ここでテキストブロック間のつな
がりを判断する。

【００８４】図３０のステップ３０−１において、図１
５のステップ１５−１３においてＨＤ１０にテキスト枠
として記憶したテキストブロックを１つづつ取得する。
そして、ステップ３０−２において、ステップ３０−２
でテキストブロックを抽出することができたか、即ち、
ＨＤ１０に記憶されている現在処理中のファイルのＰＡ
Ｆデータに本処理が未処理のテキスト枠としてのテキス
トブロックが存在するか否かを判断し、存在すると判断
された場合は、ステップ３０−３において、そのテキス
トブロックを文書のテキスト枠へ変換する。ここで、ス
テップ３０−３で実行する変換処理とは、光学的読み取
りにより入力した原稿画像の画像的特徴により導出した
ブロックごとのデータから、ワープロアプリケーション
等により作成する文書データフォーマットへの変換であ
って、一頁内に分散しているブロックをヘッダ、フッ
タ、本文等のデータ種ごとにまとめて出力位置と属性を
定める管理情報と、その中に配置する文字コードや書式
とを定める内部データとで構成するものである。本文中
に任意に配置され得る枠データはまとめずに枠毎の管理
情報と内部データを有する。管理情報は図５のブロック
管理データ５−３から、内部データは図５の文字情報５
−９とステップ９１−４で作成される本文書式及びステ
ップ２５−３で作成されるテキスト枠書式に従って求め
る。テキストブロックを文書のテキスト枠へ変換した
後、再びステップ３０−１に戻り、テキスト枠として抽
出したテキストブロックの取得処理を行うのだが、ステ
ップ３０−２でもはや存在しないと判断されのであれ
ば、ステップ３０−４において、本文領域用のテキスト
ブロックのＨＤ１０からの取得を行う。

【００８５】ステップ３０−４において、取得する本文
領域用テキストブロックの順番は、図１１のステップ１
１−４で作成した本文書式の段数を元に決定する。ステ
ップ２０−８及びステップ２０−９で１段組であると判
断され、段組情報としてＨＤ１０に「１段組」と格納さ
れていた場合は、本文領域内のテキストブロックの中
で、Ｙポジション（５−３に示す「テキストブロック管
理データ」の用紙上からの距離）の最も小さなテキスト
ブロックから順に取得する。同じＹポジションのテキス
トブロックが複数ある場合は、Ｘポジション（５−３に
示す「テキストブロック管理データ」の用紙左からの距
離）の小さなテキストブロックから順に取得する。複数
段であれば、１段目から順に、その段の領域内に存在す
るテキストブロックの中で、Ｙポジション（５−３に示
す「テキストブロック管理データ」の用紙上からの距
離）の最も小さなテキストブロックから順に取得する。
そして、１段目のテキストブロックの取得が終了した
ら、次は２段目、３段目と処理する段番号を進め、テキ
ストブロックを取得する。

【００８６】ステップ３０−５において、本文領域用テ
キストブロックが存在するか否か、即ち、ＨＤ１０に記
憶されている現在処理中のファイルのＰＡＦデータの最
後のテキストブロックまで本処理を行ったか否かを判断
し、未処理のブロックが存在しないと判断されたなら
ば、この文書データ作成処理を終了する。ステップ３０
−５において、未処理のブロックを取得できたと判断さ
れる場合、ステップ３０−６において、ステップ３０−
４で取得したブロックよりひとつ後のテキストブロック
の有無を調査し（ステップ３０−６）有る場合はそのブ
ロックを取得する。ステップ２３−７で取得するブロッ
クとは、その前にステップ３０−６で取得すべきと判断
されたブロックであって、そのブロックのテキストブロ
ック内データ５−６を取得することである。また、ステ
ップ３０−６で調査するブロックは、ステップ３０−４
で取得する順番におけるひとつ後ということである。

【００８７】後のテキストブロックがあると判断された
場合、二つのテキストブロック内の文字列のつながりを
形態素解析（文章の流れを言語的につながりがあるか否
かを解析する）により、判別する（ステップ３０−
７）。この、ステップ３０−７で実行する判別処理は、
ステップ３０−４とステップ３０−６で取得したテキス
トブロック内データの文字列をブロックを取得した順で
接続し、その中で単語辞書及び文法辞書を用いて文章の
つながりがあるか否かを判別するものである。または、
ステップ３０−４で取得した文字列の最後が句点やピリ
オド等の文末を表わす文字であるか否かを判定し、文末
を表わす文字だった場合には、つながりがないと判別す
るようにしても良い。つながりがあると判別された場合
（ステップ３０−８）、ステップ３０−４とステップ３
０−６で取得した二つのテキストブロックの文字列をひ
とつのパラグラフ（段落）に設定し、２つのテキストブ
ロックの文字列を続けて文書データフォーマットの本文
テキストデータとしてＨＤ１０に記憶する。ここで、本
文テキストデータはＨＤ１０内の本文テキストデータ格
納領域にひとまとめに格納されるものであり、図２０の
フローチャートに示した処理により求めた本文書式に従
って出力し、キーボード１２等の操作により本文文字列
の編集が行なわれた場合は編集後の本文文字列を同じ書
式の中で再配列して表示（出力）を更新する。それと同
時に、ステップ３０−６で取得した後続のテキストブロ
ックのＹポジションと、ステップ３０−４で取得した本
テキストブロックのＹポジションが、同一か、または、
差が微少であると判定される場合、そのパラグラフの先
頭文字修飾（ドロップキャップ、または、イニシャルギ
ャップという）を行うべきであると判断し（ステップ２
３−１１）、ステップ３０−１２に進んでそのパラグラ
フに先頭文字修飾の書式を設定する。先頭文字修飾の書
式とは、先頭文字（この場合は本テキストブロック内の
文字）が、そのパラグラフの標準行ピッチに対して、何
倍の行数分領域を確保するかを表すものであるので、本
テキストブロックの高さを、ステップ２０−７で求め、
ＨＤ１０に格納してある標準書式の文字列の行ピッチで
除算することにより求める。

【００８８】そして、再度ステップ３０−４において、
本文領域用のテキストブロックを取得し、ステップ２３
−５から２３−１２までの処理を繰り返す。ただし、こ
れらの処理の２回目以降は、ステップ２３−４で取得す
るブロックはその前の処理ループのステップ３０−６で
取得したブロックであり（ステップ３０−８でＹｅｓ判
定した場合のみ。Ｎｏ判定の場合は、前の処理ループの
ステップ３０−６で取得したブロックの次のブロックを
ステップ３０−４で取得する。）、この場合、ステップ
３０−９でＨＤ１０の本文テキストデータとして格納す
るのはステップ３０−６で取得した後続のテキストブロ
ックの文字列のみであり、その前の処理ループで既に格
納済みの文字列に続けて格納する。最後のテキストブロ
ックまで処理を行ったと判断した場合は、「文書データ
作成処理」を終了する。

【００８９】図３０のフローチャートに示した「文書デ
ータ作成処理」を実行した結果を、具体的に説明する。

【００９０】例えば、ステップ１１−１において図３１
に示す画像データを入力した場合、この画像をステップ
１１−２において領域分割し、ＰＡＦに変換されるブロ
ックが、図３２に示す図であり、この図３２に示した各
ブロックについてステップ１１−３、１１−４、２９−
５の処理を行った後の文書が図３３に示す図である。ス
テップ３０−１１及び３０−１２における先頭文字修飾
解析を行うことにより、ブロック２２−１の中の先頭文
字をそれに続く文字列と同じブロックとして扱いつつ複
数行抜きに修飾して出力することができる。ステップ３
０−７のチェックにより、図３２の２０−２に示すテキ
ストブロック内の文字コードと２０−３に示すテキスト
ブロック内の文字コードとが言語的に文字のつながりが
あると判定され、ひとつの段落となる。２０−３に示す
テキストブロック内の文字コードと、２０−４に示すテ
キストブロック内の文字コードとでは、言語的に文字の
つながりがないため、２１−３に示すテキストブロック
内の文字コードの後に改行を挿入する。

【００９１】同様に２０−５、２０−６、２０−７には
つながりがあるため、２０−５と２０−６には改行は挿
入しないが、２０−７の後にはデータがないため、２０
−７に示すテキストブロック内の文字コードの後に改行
を挿入する。

【００９２】図３０のフローチャートに示したような処
理を行なうことによって、入力画像を画像的特徴に従っ
て解析した結果別ブロックとして抽出された文字列領域
のつながりを内容的に判断することができ、かつ段落の
先頭文字に文字サイズ変更などの修飾が行われている場
合、その文字の位置と大きさを検知して、段落書式に先
頭文字修飾を設定することによって、本文領域から文章
の流れに沿った形式で文書の本文データが作成でき、か
つ、紙の元原稿に近い文書の再現を可能とすることがで
きる。

【００９３】また、文書処理装置において入力画像の画
像的特徴に従って得られるブロックではなく、その画像
の元原稿作成時の書式を再現して文書編集が行えるの
で、ユーザの編集後も体裁を崩すことがなくなる。

【００９４】次に、図２９のステップ２９−５で行なう
文書データ作成処理の第二例を図３４のフローチャート
に示し、以下説明する。ステップ３０−５までは図３０
のフローチャートに示したステップ３０−１から３０−
５までの処理ステップと同様であるので、同じステップ
番号を付し、ここでの説明は省略する。ステップ３０−
４で取得したテキストブロック内の文字コードと、その
時点で即に本文テキストデータとしてＨＤ１０に格納さ
れている文字コードとのつながりを形態素解析により判
別する（ステップ３４−６）。このステップ３４−６で
行なう判別方法は、ステップ３０−７での判別方法と同
様である。ステップ３４−７において、ステップ３４−
６でつながっているとの判別が行われたと判断した場合
は、ステップ３４−８に進み、ステップ３０−４で取得
したテキストブロック内の文字コードをＨＤ１０に格納
されている本文テキストデータに続けて格納する。ステ
ップ３４−７において、ステップ３４−６でつながって
いないとの判別が行われたと判断した場合は、ステップ
３４−９に進み、ＨＤ１０に格納されている本文テキス
トデータに続けてまず改行コードを格納し、その後にス
テップ２２−４で取得したテキストブロック内の文字コ
ードを格納する。

【００９５】次に、図２９のステップ２９−５で行なう
文書データ作成処理において改段をする位置の判別をも
行なう例について、図３５のフローチャートに従って説
明する。このフローチャートにおいて、ステップ３０−
１からステップ３４−８までは図３４のフローチャート
の各処理ステップと同様なので同じステップ番号を付
し、ここでの説明は省略する。

【００９６】ステップ３４−７において、ステップ３４
−６でつながっていないとの判別が行なわれたと判断し
た場合は、ステップ３５−９に進み、ステップ３０−４
で取得した現在処理中のテキストブロックが段の最初、
即ち段内でＹポジションが最小のテキストブロックであ
るか否かを判定し、段の最初のテキストブロックと判定
された場合はＨＤ１０に格納されている本文テキストデ
ータに続けてまず改段コードを格納し、その後にステッ
プ３０−４で取得したテキストブロック内の文字コード
を格納する（ステップ３５−１０）。また、ステップ３
５−９で段の最初のテキストブロックでないと判定され
た場合はＨＤ１０に格納されている本文テキストデータ
に続けて改行コードを格納し、その後にステップ３０−
４で取得したテキストブロック内の文字コードを格納す
る（ステップ３５−１１）。

【００９７】図３５のフローチャートに示した処理によ
り、入力画像の画像的登頂に従って抽出した各テキスト
ブロック内の文字列を前のテキストブロック内の文字列
とつなげて処理すべきか、段を改めて出力すべきかを判
断し、必要に応じて改段コードを挿入して文字列を格納
するので、その後の編集処理にも段区切りの設定を生か
し、出力態様を維持することができる。

【図面の簡単な説明】

【図１】本発明の一実施例による文字認識文書処理装置
の概略構成を示すブロック図である。

【図２】本発明の一実施例による文字認識文書処理装置
と画像読み取り装置をつなげた図である。

【図３】画像イメージを表した図である。

【図４】画像イメージを領域分割した図である。

【図５】Page Analysis Format(PAF)のファイルフォー
マットを表した図である。

【図６】画像イメージを表した図である。

【図７】画像イメージを領域分割した図である。

【図８】ヘッダ及びフッタ領域付近のテキストブロック
を表した図である。

【図９】本文領域内のテキストブロックを表した図であ
る。

【図１０】本文領域と他の領域に分割された状態を表し
た図である。

【図１１】「本文領域と他の領域の分別処理」を示すフ
ローチャートである。

【図１２】「本文用ブロックと他のブロックの分別処
理」を示すフローチャートである。

【図１３】「ヘッダ領域用テキストブロックの抽出処
理」を示すフローチャートである。

【図１４】「フッタ領域用テキストブロックの抽出処
理」を示すフローチャートである。

【図１５】「枠領域用ブロックの抽出処理」を示すフロ
ーチャートである。

【図１６】「テキストブロックチェック処理」を示すフ
ローチャートである。

【図１７】「ヘッダ領域用テキストブロックの抽出処
理」を示すフローチャートである。

【図１８】「フッタ領域用テキストブロックの抽出処
理」を示すフローチャートである。

【図１９】「テキストブロックチェック処理」を示すフ
ローチャートである。

【図２０】「本文書式の作成処理」の第一例を示すフロ
ーチャートである。

【図２１】「本文書式の作成処理」の第二例を示すフロ
ーチャートである。

【図２２】本文書式作成時のブロック分割を説明する図
ある。

【図２３】「テキスト枠書式の作成処理」を示すフロー
チャートである。

【図２４】ＰＡＦのデータ構造の第二例を示す図であ
る。

【図２５】「枠領域用ブロックの抽出処理」の第二例を
示すフローチャートである。

【図２６】「テキスト枠書式の作成処理」の第二例を示
すフローチャートである。

【図２７】分別された各領域を例示する図である。

【図２８】ネットワークシステム図である。

【図２９】「文書データ作成処理」を加えた「本文領域
と他の領域の分別処理」のフローチャートである。

【図３０】「文書データ作成処理」のフローチャートで
ある。

【図３１】入力画像例示図である。

【図３２】入力画像から抽出したブロックの説明図であ
る。

【図３３】形態素解析により改行コードを挿入した結果
の図である。

【図３４】第二の「文書データ作成処理」のフローチャ
ートである。

【図３５】第三の「文書データ作成処理」のフローチャ
ートである。

【図３６】形態素解析とブロックの配置により階段コー
ドを挿入した結果の図である。

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.⁷ 識別記号ＦＩテーマコート゛(参考） // Ｇ０６Ｆ 17/27 Ｇ０６Ｆ 15/38 Ｅ９Ａ００１Ｆターム(参考） 5B009 LA01 NC06 QA03 QA09 5B050 BA16 EA03 EA07 5B064 AA01 BA01 CA08 5B091 AA11 CA02 CB01 DA02 5L096 BA18 EA35 FA16 FA43 FA44 FA45 FA64 FA67 FA72 9A001 HH22 HH23 JJ07

Claims

【特許請求の範囲】

【請求項１】入力した画像情報から複数の文字列領域
を抽出し、前記抽出した複数の文字列領域のつながりを形態素解析
によって判断し、前記形態素解析によりつながると判断された複数の文字
列領域に含まれる文字を続けて一つの文字格納領域に格
納することを特徴とする画像処理方法。
【請求項２】前記形態素解析によるつながりの判断
を、連続して位置している複数の文字列領域に対して行
なうことを特徴とする請求項１に記載の画像処理方法。
【請求項３】前記形態素解析によるつながりの判断
を、連続する二つの文字列領域間で行なうことを特徴と
する請求項１に記載の画像処理方法。
【請求項４】前記形態素解析によるつながりの判断
は、各文字列領域に含まれる文字列をつなげて得た文字
列に対して行なうことを特徴とする請求項１に記載の画
像処理方法。
【請求項５】前記形態素解析によるつながりの判断
は、同じ種類に分類された文字列領域に対して行なうこ
とを特徴とする請求項１に記載の画像処理方法。
【請求項６】前記形態素解析によるつながりの判断
は、本文に分類された文字列領域に対して選択的に行な
うことを特徴とする請求項１に記載の画像処理方法。
【請求項７】前記形態素解析によりつながらないと判
断された場合に、当該判断された複数の文字列領域の先
方の文字列領域内の文字列の後に改行コードを挿入して
当該判断された複数の文字列領域内の文字列を格納する
ことを特徴とする請求項１に記載の画像処理方法。
【請求項８】前記形態素解析によりつながらないと判
断された場合に、当該判断された複数の文字列領域の後
方の文字列領域が段で最初の文字列領域であるか否かを
更に判断し、前記判断により当該後方の文字列領域が段で最初の文字
列領域であると判断された場合に、その前の文字列領域
内の文字列の後に改段コードを挿入して当該判断された
複数の文字列領域内の文字列を格納することを特徴とす
る請求項１に記載の画像処理方法。
【請求項９】前記画像情報はスキャナより入力した画
像情報とすることを特徴とする請求項１に記載の画像処
理方法。
【請求項１０】前記一つの文字格納領域に格納された
文字列を、一つの書式に従って出力することを特徴とす
る請求項１に記載の画像処理方法。
【請求項１１】入力した画像情報から複数の文字列領
域を抽出する文字列領域抽出手段と、前記抽出した複数の文字列領域のつながりを形態素解析
によって判断する判断手段と、前記形態素解析によりつながると判断された複数の文字
列領域に含まれる文字を続けて一つの文字格納領域に格
納する格納手段とを有することを特徴とする画像処理装
置。
【請求項１２】前記判断手段は、連続して位置してい
る複数の文字列領域に対して前記形態素解析によるつな
がりを判断することを特徴とする請求項１に記載の画像
処理方法。
【請求項１３】前記判断手段は、連続する二つの文字
列領域間で前記形態素解析によるつながりを判断するこ
とを特徴とする請求項１１に記載の画像処理方法。
【請求項１４】前記判断手段は、各文字列領域に含ま
れる文字列をつなげて得た文字列に対して前記形態素解
析によるつながりを判断することを特徴とする請求項１
１に記載の画像処理方法。
【請求項１５】前記判断手段は、同じ種類に分類され
た文字列領域に対して前記形態素解析によるつながりを
判断することを特徴とする請求項１１に記載の画像処理
方法。
【請求項１６】前記判断手段は、本文に分類された文
字列領域に対して選択的に前記形態素解析によるつなが
りを判断することを特徴とする請求項１１に記載の画像
処理方法。
【請求項１７】前記判断手段がつながらないと判断し
た場合に、前記格納手段は、当該判断された複数の文字
列領域の先方の文字列領域内の文字列の後に改行コード
を挿入して当該判断された複数の文字列領域内の文字列
を格納することを特徴とする請求項１１に記載の画像処
理方法。
【請求項１８】前記判断手段がつながらないと判断し
た場合に、当該判断された複数の文字列領域の後方の文
字列領域が段で最初の文字列領域であるか否かを更に判
断する段判断手段を有し、前記段判断手段により当該後方の文字列領域が段で最初
の文字列領域であると判断された場合に、前記格納手段
は、その前の文字列領域内の文字列の後に改段コードを
挿入して当該判断された複数の文字列領域内の文字列を
格納することを特徴とする請求項１１に記載の画像処理
方法。
【請求項１９】前記画像情報はスキャナより入力した
画像情報とすることを特徴とする請求項１１に記載の画
像処理方法。
【請求項２０】前記一つの文字格納領域に格納された
文字列を、一つの書式に従って出力する出力手段を有す
ることを特徴とする請求項１１に記載の画像処理方法。
【請求項２１】コンピュータにより読み取り可能な記
憶媒体であって、入力した画像情報から複数の文字列領域を抽出する為の
制御プログラムと、前記抽出した複数の文字列領域のつながりを形態素解析
によって判断する為の制御プログラムと、前記形態素解析によりつながると判断された複数の文字
列領域に含まれる文字を続けて一つの文字格納領域に格
納する為の制御プログラムとを記憶したことを特徴とす
る記憶媒体。
【請求項２２】前記形態素解析によるつながりの判断
を、連続して位置している複数の文字列領域に対して行
なう為の制御プログラムを記憶したことを特徴とする請
求項２１に記載の記憶媒体。
【請求項２３】前記形態素解析によるつながりの判断
を、連続する二つの文字列領域間で行なう為の制御プロ
グラムを記憶したことを特徴とする請求項２１に記載の
記憶媒体。
【請求項２４】前記形態素解析によるつながりの判断
を、各文字列領域に含まれる文字列をつなげて得た文字
列に対して行なう為の制御プログラムを記憶したことを
特徴とする請求項２１に記載の記憶媒体。
【請求項２５】前記形態素解析によるつながりの判断
を、同じ種類に分類された文字列領域に対して行なう為
の制御プログラムを記憶したことを特徴とする請求項２
１に記載の記憶媒体。
【請求項２６】前記形態素解析によるつながりの判断
を、本文に分類された文字列領域に対して選択的に行な
う為の制御プログラムを記憶したことを特徴とする請求
項２１に記載の記憶媒体。
【請求項２７】前記形態素解析によりつながらないと
判断された場合に、当該判断された複数の文字列領域の
先方の文字列領域内の文字列の後に改行コードを挿入し
て当該判断された複数の文字列領域内の文字列を格納す
る為の制御プログラムを記憶したことを特徴とする請求
項２１に記載の記憶媒体。
【請求項２８】前記形態素解析によりつながらないと
判断された場合に、当該判断された複数の文字列領域の
後方の文字列領域が段で最初の文字列領域であるか否か
を更に判断する為の制御プログラムと、前記判断により当該後方の文字列領域が段で最初の文字
列領域であると判断された場合に、その前の文字列領域
内の文字列の後に改段コードを挿入して当該判断された
複数の文字列領域内の文字列を格納する為の制御プログ
ラムを記憶したことを特徴とする請求項２１に記載の記
憶媒体。
【請求項２９】前記一つの文字格納領域に格納された
文字列を、一つの書式に従って出力する為の制御プログ
ラムを記憶したことを特徴とする請求項２１に記載の記
憶媒体。