JP2002024796A - 文字認識装置および方法 - Google Patents

文字認識装置および方法

Info

Publication number
JP2002024796A
JP2002024796A JP2000205480A JP2000205480A JP2002024796A JP 2002024796 A JP2002024796 A JP 2002024796A JP 2000205480 A JP2000205480 A JP 2000205480A JP 2000205480 A JP2000205480 A JP 2000205480A JP 2002024796 A JP2002024796 A JP 2002024796A
Authority
JP
Japan
Prior art keywords
heading
page
character recognition
item
contents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000205480A
Other languages
English (en)
Inventor
Junichi Nagano
淳一 長野
Tamotsu Maeda
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2000205480A priority Critical patent/JP2002024796A/ja
Publication of JP2002024796A publication Critical patent/JP2002024796A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 スキャナーなどで取り込んだ複数ページから
なる画像データから、簡単な操作によって目的のページ
を容易に探し出す。 【解決手段】 複数のページのうち、見出し項目と見出
し項目の対応ページ番号とが記される見出しページか
ら、見出し項目および対応ページ番号をそれぞれ文字認
識により抽出する手段と、複数のページのそれぞれの画
像ページ番号を文字認識により抽出する手段と、抽出し
た対応ページ番号および画像ページ番号の対応関係に基
づいて、見出し項目を複数のページに対応する画像デー
タにそれぞれ関連付けるための関連付け情報を生成する
手段と、見出し項目を表示する手段と、表示された見出
し項目のいずれかを指定する手段と、関連付け情報を参
照して指定された見出し項目に対応する画像データを出
力する手段とを備える。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置およ
び方法に関し、より特定的には、複数のページからなる
画像データに対して文字認識を行う文字認識装置および
方法に関する。
【0002】
【従来の技術】近年、インターネットやイントラネット
が普及してきたことに伴ってオフィスで各々にパーソナ
ルコンピュータ(PC)が導入されるようになり、既存
の紙で保管していた文書を画像データとして電子化して
保存してPC上で活用するようになってきた。例えば、
社内資料をスキャナーで取り込み、イントラネット上で
全社員に公開し、社員はイントラネットを通じて文書画
像を共有し閲覧することができるようになった。
【0003】
【発明が解決しようとする課題】しかしながら、既存の
紙で作成していた大量の社内資料や文献などをスキャナ
ーで読み取って画像データに変換しただけでは、文書画
像の中から所望の画像を探し出すことは容易ではない。
そこで目的の文書画像をすばやく検索できるようにする
ために、従来では文献を画像データに変換する際に、目
次を作成し、さらに目次の各項目と該当ページとの関連
づけをキーボードからの入力により設定しておくこと
で、目次の各項目を指定するだけで対応する画像データ
を探し出せるようにしていた。しかしながら、目次を作
成して画像ページとの関連づけを設定する際、キーボー
ドから一つ一つ手作業で入力していたため、かなりの時
間と労力を要するという問題があった。
【0004】それ故に、本発明の目的は、スキャナーで
読み取るなどして得られた複数ページからなる画像デー
タから、見出し項目とそれに対応する画像ページとの関
連づけを自動的に設定でき、見出し項目を指定するだけ
で目的のページの画像を容易に探し出すことができる文
字認識装置および方法を提供することである。
【0005】
【課題を解決するための手段および発明の効果】第1の
発明は、複数のページからなる画像データに対して文字
認識を行う文字認識装置であって、複数のページのう
ち、見出し項目と見出し項目の対応ページ番号とが記さ
れる見出しページから、見出し項目および対応ページ番
号をそれぞれ文字認識により抽出する手段と、複数のペ
ージのそれぞれの画像ページ番号を文字認識により抽出
する手段と、抽出した対応ページ番号および画像ページ
番号の対応関係に基づいて、見出し項目を複数のページ
に対応する画像データにそれぞれ関連付けるための関連
付け情報を生成する手段と、見出し項目を表示する手段
と、表示された見出し項目のいずれかを指定する手段
と、関連付け情報を参照して指定された見出し項目に対
応する画像データを出力する手段とを備える。
【0006】上記のように、第1の発明によれば、複数
ページからなる画像データから、見出しページに見出し
項目毎に記される対応ページ番号と各ページの画像ペー
ジ番号とをそれぞれ抽出し、それらページ番号の対応を
判別することによって、それぞれの見出し項目を各ペー
ジの画像データに関連付けて記憶する。よって、いずれ
かの見出し項目を選択するだけで、容易にその見出し項
目に対応するページの画像を表示することができるの
で、複数ページからなる画像データから目的のページの
画像を容易に探し出して表示させることが可能である。
【0007】第2の発明は、第1の発明において、見出
しページは、目次ページおよび索引ページのいずれかを
含む。
【0008】上記のように、第2の発明によれば、複数
ページからなる画像データから、目次ページないし索引
ページに目次項目毎ないし索引項目毎に記される対応ペ
ージ番号と各ページの画像ページ番号とをそれぞれ抽出
し、それらページ番号の対応を判別することによって、
それぞれの目次項目ないし索引項目を各ページの画像デ
ータに関連付けて記憶する。よって、いずれかの目次項
目ないし索引項目を選択するだけで、容易にその目次項
目ないし索引項目に対応するページの画像を表示するこ
とができるので、複数ページからなる画像データから目
的のページの画像を容易に探し出して表示させることが
可能である。
【0009】第3の発明は、第1の発明において、見出
し項目の階層構成を判別する手段をさらに備え、見出し
項目を表示する手段は、判別した階層構成に基づいて、
見出し項目を階層的に表示することを特徴とする。
【0010】上記のように、第3の発明によれば、見出
し項目の階層構成を判別し、見出し項目を表示する際
に、この判別した階層構成に基づいて見出し項目を階層
的に表示することが可能であるので、ユーザは階層構成
に基づいて表示された見出し項目を参照して目的の見出
し項目を選択をすることができるので、目的の見出し項
目が探しやすくなる。また判別した階層構成に基づい
て、例えば、最初は大見出しのみを提示して、それら大
見出しに従属する中見出しないし小見出しについては必
要に応じてユーザの入力に応じて表示したり非表示した
りすることも可能となるので、見出し項目が多数ある場
合であっても表示画面をスクロールしたりすることなし
に、多数の見出し項目の中から目的の見出し項目を容易
にすばやく選択することが可能となる。
【0011】第4の発明は、第3の発明において、見出
し項目の階層構成を判別する手段は、見出しページにお
ける見出し項目の位置を互いに比較することによって階
層構成を判別することを特徴とする。
【0012】上記のように、第4の発明によれば、見出
しページにおける見出し項目の位置に基づいて見出し項
目の階層構成を判別することができるので、例えば大見
出し、中見出しおよび小見出しのそれぞれが、見出しの
頭の位置をずらして記されているような一般的な見出し
ページにおいて、それら見出しの位置から容易に自動的
に階層構成を判別することができる。
【0013】第5の発明は、複数のページからなる画像
データに対して文字認識を行う文字認識方法であって、
複数のページのうち、見出し項目と見出し項目の対応ペ
ージ番号とが記される見出しページから、見出し項目お
よび対応ページ番号をそれぞれ文字認識により抽出する
ステップと、複数のページのそれぞれの画像ページ番号
を文字認識により抽出するステップと、抽出した対応ペ
ージ番号および画像ページ番号の対応関係に基づいて、
見出し項目を複数のページに対応する画像データにそれ
ぞれ関連付ける関連付け情報を生成するステップと、見
出し項目を表示するステップと、表示された見出し項目
のいずれかを指定する手段と、関連付け情報を参照して
指定された見出し項目に対応する画像データを出力する
ステップとを備える。
【0014】第6の発明は、第5の発明において、見出
しページは、目次ページおよび索引ページのいずれかを
含む。
【0015】第7の発明は、第5の発明において、見出
し項目の階層構成を判別するステップをさらに備え、見
出し項目を表示するステップは、判別した階層構成に基
づいて、見出し項目を階層的に表示することを特徴とす
る。
【0016】第8の発明は、第7の発明において、見出
し項目の階層構成を判別するステップは、見出しページ
における見出し項目の位置を互いに比較することによっ
て階層構成を判別することを特徴とする。
【0017】第9の発明は、コンピュータに複数のペー
ジからなる画像データに対して文字認識を行わせるプロ
グラムを記録したコンピュータ読み取り可能な記録媒体
であって、複数のページのうち、見出し項目と見出し項
目の対応ページ番号とが記される見出しページから、見
出し項目および対応ページ番号をそれぞれ文字認識によ
り抽出するステップと、複数のページのそれぞれの画像
ページ番号を文字認識により抽出するステップと、抽出
した対応ページ番号および画像ページ番号の対応関係に
基づいて、見出し項目を複数のページに対応する画像デ
ータにそれぞれ関連付ける関連付け情報を生成するステ
ップと、見出し項目を表示するステップと、表示された
見出し項目のいずれかを指定するステップと、関連付け
情報を参照して指定された見出し項目に対応する画像デ
ータを出力するステップと、をコンピュータに実行させ
るプログラムを記録したコンピュータ読み取り可能な記
録媒体
【0018】第10の発明は、第9の発明において、見
出しページは、目次ページおよび索引ページのいずれか
を含む。
【0019】第11の発明は、第9の発明において、見
出し項目の階層構成を判別するステップをさらにコンピ
ュータに実行させ、見出し項目を表示するステップは、
判別した階層構成に基づいて、見出し項目を階層的に表
示することを特徴とする。
【0020】第12の発明は、第11の発明において、
見出し項目の階層構成を判別するステップは、見出しペ
ージにおける見出し項目の位置を互いに比較することに
よって階層構成を判別することを特徴とする。
【0021】
【発明の実施の形態】以下に、図1から図9を参照し
て、本発明の実施の形態について説明する。図1は、本
発明の一実施形態に係る文字認識装置のハードウェアの
構成を示すブロック図である。図1において、文字認識
装置は、CPU(中央処理装置)10と、CRT(カソ
ード・レイ・チューブ)11と、マウス12と、キーボ
ード13と、画像入力装置14と、RAM(ランダム・
アクセス・メモリ)15と、ハードディスク19と、R
OM(リード・オンリ・メモリ)23とを備えており、
これら全てはバスを介して接続される。RAM15は、
画像データを一時的に保存する画像記憶領域16と、文
字認識処理の結果を保存する文字コード領域17と、目
次項目等からなる目次情報を保存する目次情報領域18
とを有する。ハードディスク19は、後述する文字認識
プログラムを記憶するプログラム記憶領域20と、文字
認識の際に参照する文字認識辞書記憶領域21と、オペ
レーティングシステムを記憶するOS記憶領域22とを
有する。ROM23は、起動プログラム記憶領域24を
有する。
【0022】本実施形態において、プログラム記憶領域
20に記憶されている文字認識プログラムは、OS記憶
領域22に記憶されているのオペレーティングシステム
上で動作し、このオペレーティングシステムは、起動プ
ログラム記憶領域24に記憶されている起動プログラム
によって起動されて動作する。なお、本発明が以上のよ
うな構成に限定されないことは言うまでもない。
【0023】図2は、画像記憶領域16に格納される画
像データの各ページの構成の一例を示す図である。図2
において、目次ページには、図中に“第1章○○○”や
“1.△△△”や“a.×××”で示す複数の目次項目
と、図中に“□”で示す対応ページ番号が記され、そし
て、目次ページも含め全ての画像ページには、図中に
“−◎−”で示す画像ページ番号が記される。
【0024】次に、本実施形態の動作について説明す
る。図3は、本発明の一実施形態において、プログラム
記憶領域20に記憶されている文字認識プログラムに基
づいたCPU10の動作を示すフローチャートである。
【0025】ハードディスク19のプログラム記憶領域
20に記憶されている文字認識プログラムが開始される
と、まず、画像入力装置14によって取り込んだ書類等
の画像データをRAM15の画像記憶領域16に蓄積す
る(S100)。全てのページに対応する画像データが
取り込まれて蓄積されると、蓄積した画像データのうち
の目次ページに対応する画像データに対して文字認識処
理を行い、文字認識処理によって得られた文字コードを
RAM15の文字コード領域17に格納する(S20
0)。次に、このようにして文字コード領域17に格納
された目次ページの文字コードから、目次項目および各
目次項目に対応する対応ページ番号をそれぞれ判別し、
これら目次項目および対応ページ番号を目次情報として
RAM15の目次情報領域18に格納する(S30
0)。そして、目次情報領域18に格納した各目次項目
を参照して、目次の階層構成を判別し、階層構成の情報
を目次情報に追加して目次情報領域18に格納する(S
400)。
【0026】次に、画像記憶領域16に蓄積された各ペ
ージの画像データの画像ページ番号印字領域に対して文
字認識処理を行い、文字認識処理によって得られた各ペ
ージのページ番号を文字コード領域17に格納する(S
500)。そして、目次情報領域18に格納した目次情
報に含まれる対応ページ番号と、文字コード領域17に
格納した画像ページ番号とを照合することにより、各目
次項目と画像データを関連づけ、その関連付け情報を目
次情報に追加して目次情報領域18に格納する(S60
0)。このステップS600を、各目次項目に対して繰
り返し実行し(S700)、全ての目次項目に対する画
像データとの関連付け情報を目次情報に追加し終わると
プログラムを終了する。
【0027】以下に、上記のステップS200〜S60
0の各ステップにおけるCPU10の動作について、よ
り詳細なフローチャートを参照して説明する。
【0028】図4は、図3に示すステップS200の詳
細を示すフローチャートである。ず3において、目次ペ
ージの文字認識を開始すると、まず、画像記憶領域16
に蓄積した画像データのうちの目次ページに対応する画
像データから、画像を領域毎に分けて各領域の属性を抽
出することによって、画像のレイアウト情報を抽出する
(S201)。そして、抽出したレイアウト情報に基づ
いて、各領域毎に、その領域が余白にあるブロックかど
うかを判定し(S203)、余白ではないと判断した領
域についてはさらに画像の領域かどうかを判定し(S2
04)、画像でもないと判断した領域については文字領
域であると判断して、その領域に対して文字認識処理
(OCR)を実行し(S205)、文字認識処理によっ
て得られた文字コードを文字コード領域17に格納する
(S206)。これらのステップS203〜S206
を、各領域に対して順次実行し、全ての領域に対する判
定および文字認識処理を実行し終わると(S202)、
目次ページの文字認識を終了する。
【0029】図5は、図3に示すステップS300の詳
細を示すフローチャートである。図5において、目次見
出し抽出を開始すると、まず、文字コード領域17から
文字コードを読み出す(S301)。そして、読み出し
た文字コードが“・”の連続であるかどうかを判断し
(S303)、“・”の連続ではないと判断すると、目
次項目文字列の格納終了を示すフラグを参照することに
より目次項目文字列の格納が終了しているか否かを判断
する(S305)。フラグが立っておらず目次項目文字
列の格納が終了していない場合には、この文字コードを
目次項目文字列として格納する(S306)。このと
き、目次項目文字列の先頭からの空白文字数をカウント
していき、目次項目の画像先頭位置情報として格納する
(S307)。このようなステップS301〜S307
を繰り返し実行して、文字コードを順番に目次項目文字
列に加えていき、文字コードが“・”の連続になったと
判断すると(S303)、目次項目文字列の格納を終了
し、目次項目文字列格納終了フラグを立てる(S30
4)。その後も文字コードを順番に読み出していき、
“・”の連続が終わって数値文字になったと判断すると
(S308)、その文字コードを対応ページ番号文字列
として格納する(S309)。このようなステップS3
01〜S309を繰り返し実行して、文字コードを順番
に対応ページ数文字列に加えていき、文字コードが数値
文字ではなくなったと判断すると(S308)、対応ペ
ージ数文字列の格納を終了し、次の目次項目文字列の格
納を開始すべく目次項目文字列格納終了フラグを元に戻
す(S310)。以上のステップS301〜S310
を、各文字コードに対して順次実行し(S302)、全
ての文字コードに対して処理が実行されて目次項目、目
次項目位置情報および対応ページ番号の抽出が完了する
と、目次見出し抽出を終了する。このようにして、目次
項目、目次項目位置情報および対応ページ番号が抽出さ
れて、目次情報に追加されて目次情報領域18に格納さ
れる。
【0030】図6は、図3に示すステップS400の詳
細を示すフローチャートである。図6において、目次階
層構成の作成を開始すると、まず、一番先頭の目次項目
の階層を適当な値に設定する(S401)。そして、現
在の目次項目の位置と一つ前の目次項目の位置とを、目
次情報領域18に格納されている目次項目位置情報を参
照することによって比較し(S403)、現在の目次項
目の位置が一つ前の目次項目の位置よりも後ろである場
合には、その現在の目次項目の階層を一つ前の目次項目
の階層+1に設定する(S404)。同様に、同じであ
る場合には同じ階層に設定し(S405)、前である場
合には一つ前の目次項目の階層−1に設定する(S40
6)。このようなステップS403〜S406を順次実
行して各目次項目の階層を順次設定していき、全ての目
次項目に対する階層の設定が完了すると(S402)、
目次階層構成の作成を終了する。このようにして、目次
項目の階層構成情報が作成されて、目次情報として目次
情報領域18に格納される。
【0031】図7は、図3に示すステップS500の詳
細を示すフローチャートである。図7において、画像ペ
ージの文字認識を開始すると、まず、画像ページにおい
て画像ページ番号として認識する領域を、例えばマウス
12からの入力等に応じて指定する(S501)。これ
は、画像ページ番号が記される位置は取り込んだ画像に
よって異なり、図2においては画像ページ番号は画像ペ
ージの一番下の真ん中に記されているが、その他にもペ
ージの上端の中央に記される場合や、ページの中央に記
されているような場合もあり得るので、そのようなペー
ジの構成に応じて画像ページ番号領域を、例えば“ペー
ジ上部中央”のように予め指定しておけば文字認識の精
度が向上するので好ましい。また見開きページの場合に
は偶数ページと奇数ページとで画像ページ番号領域が異
なる位置にあることが多いので、そのような場合には、
偶数ページと奇数ページとに分けて画像ページ番号領域
を別々に設定することが好ましい。次に、各画像ページ
において、ステップS501で予め指定された領域に対
して文字認識処理を行って画像ページ番号を抽出し(S
503)、文字認識結果を文字コード領域17に格納す
る。このようなステップS503〜S504を各画像ペ
ージに対して順次実行して画像ページ番号を順次格納し
ていき、全ての画像ページ番号の格納が完了すると(S
502)、画像ページの文字認識を終了する。
【0032】図8は、図3に示すステップS600の詳
細を示すフローチャートである。図8において、目次と
ページの関連づけを開始すると、まず、目次情報として
各目次項目に対応して目次情報領域18に格納されてい
る対応ページ番号を取得し(S602)、次に、この対
応ページ番号と、文字コード領域17に格納されている
画像ページ番号とを比較し(S604)、一致しない場
合には次の画像のページ番号に対して再び比較し、一致
する場合にはこの画像ページ番号を関連付け情報として
目次情報に追加して目次情報領域18に格納する(S6
05)。ステップS604〜S605を各画像のページ
番号に対して順次実行していき、ステップS602にお
いて取得した対応ページ番号と全ての画像のページ番号
との比較を完了すると(S603)、さらに次の対応ペ
ージ番号について、同様の処理を実行する。このような
ステップS602〜S605を各対応ページ番号につい
て順次実行して関連付け情報を格納していき、全ての対
応ページ番号について関連付け情報の格納を完了すると
(S601)、画像ページの文字認識処理を終了する。
【0033】以上の処理によって、本実施形態では、複
数のページからなる画像データから、目次項目、目次項
目の階層構成情報、および目次項目と画像記憶領域16
に格納される画像データとの関連付け情報を抽出し、そ
れらが目次情報として目次情報領域18に格納される。
【0034】次に、図9を参照して上述のようにして格
納された目次情報を利用した画像データの表示方法の一
例について説明する。図9は、画像ページを表示する際
のCPU10の動作を示すフローチャートである。図9
において、画像ページの表示を開始すると、まず、目次
情報として目次情報領域18に目次情報として格納され
ている目次項目および階層構成情報を参照して(S70
1)、CRT11に目次項目を階層的に表示する(S7
02)。このとき、単に目次項目を階層に応じて位置を
ずらして表示するようにしても構わないが、例えば、最
初に最も上位の階層の目次項目のみを一覧表示するよう
にし、例えばマウス12からの入力に応じて、上位の目
次項目に従属する目次項目を順次表示させたり、または
非表示にしたりすることも可能である。この場合、多数
の目次項目がある場合であっても、表示画面をスクロー
ルさせることなく目的の目次項目をすばやく探して指定
できるので好ましい。このようにして目次項目を表示し
た後、マウス12等からの入力によって目次項目のいず
れかが選択されると(S703)、目次情報の関連付け
情報を参照して(S704)、選択された目次項目に対
応する画像ページをCRT11に表示する(S70
5)。
【0035】以上のように、本実施形態によれば、画像
入力装置14等から読み取った複数ページからなる画像
データから目次ページの目次項目と、目次項目の階層構
成情報と、目次項目に対応する対応ページ番号を抽出
し、さらに各ページの画像ページ番号を抽出して、目次
項目と画像データとの関連付け情報を自動的に作成する
ので、関連付け情報を手作業で入力する手間を必要とせ
ず、目次項目を指定するだけで容易に対応ページの画像
を表示させることが可能である。また、目次項目の階層
構成情報を利用して目次項目の一覧の表示を目次項目の
階層にしたがって階層的に表示するため、目次項目の数
が多い場合であっても容易に目的の目次項目を探して選
択することが可能である。
【0036】なお本実施形態では、画像入力装置14か
ら読み取った画像データを利用したが、その他にも、例
えば記憶装置等にすでに格納されている画像データを利
用しても構わない。また、目次項目の位置情報を、文字
認識された目次項目の空白文字の数から得ているが、そ
の他にも、例えば文字認識の際に目次項目の画像内の座
標情報を取得して、この座標情報を位置情報として利用
しても構わない。また、目次の階層構成を目次項目の位
置情報に基づいて判別しているが、その他にも、目次ペ
ージの構成に応じて、例えば目次項目の文字の大きさ
や、種類や、特定の飾り文字の有無などを判別すること
によって目次の階層構成を判別しても構わない。
【0037】また本実施形態では、目次ページにおい
て、目次項目と対応ページ番号とが“・”の連続によっ
て互いに対応付けられて記されている場合について説明
したが、それ以外の場合であっても、目次ページの構成
に応じた適宜の方法によって自動判別すればよいし、自
動判別が困難である場合には、対応ページ番号が記され
ている領域をユーザが指定するようにしても良い。ま
た、目次項目の階層構成を判別する際に、前後の目次項
目の位置情報の大小を比較して階層を設定するようにし
たが、これに限らず、例えば位置情報の絶対値などに基
づいて階層を設定するようにしても構わない。
【0038】さらに、本実施形態では目次ページの目次
項目と関連するページの画像データとを関連付けるよう
にしたが、本実施形態と同様の処理によって、例えば索
引ページの索引項目を関連ページの画像データに関連付
けることが可能であることは言うまでもない。また、本
実施形態において、目次ページ以外の各ページの画像デ
ータに関しては特に文字認識処理を行わずにイメージデ
ータとして保存および表示しているが、当然ながら、そ
れらに関しても文字認識処理を行い、各ページの内容を
テキストデータとして保存および表示するようにしても
構わない。
【0039】また本実施形態では、一覧表示された目次
項目から所定の目次項目を選択して画像を表示させてい
たが、他にも、例えば所定の文字列を入力して、目次情
報からこの文字列を含む目次項目を検索して表示し、こ
うして表示された目次項目から所定の目次項目を選択し
て画像を表示させるようにしてもよい。このような方法
を応用すれば、例えば画像データが複数セット存在する
場合であっても、その複数セットのそれぞれの目次項目
を一つ一つ確認することなしに目的の文字列を含んだ目
次項目を一括して検索して目的の画像をすばやく探し出
すことができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る文字認識装置のハー
ドウェアの構成を示すブロック図である。
【図2】本発明の一実施形態において、画像記憶領域1
6に格納される画像データの各ページの構成の一例を示
す図である。
【図3】本発明の一実施形態において、プログラム記憶
領域20に記憶されている文字認識プログラムに基づい
たCPU10の動作を示すフローチャートである。
【図4】図3に示すステップS200の詳細を示すフロ
ーチャートである。
【図5】図3に示すステップS300の詳細を示すフロ
ーチャートである。
【図6】図3に示すステップS400の詳細を示すフロ
ーチャートである。
【図7】図3に示すステップS500の詳細を示すフロ
ーチャートである。
【図8】図3に示すステップS600の詳細を示すフロ
ーチャートである。
【図9】画像ページを表示する際のCPU10の動作を
示すフローチャートである。
【符号の説明】
10…CPU 11…CRT 12…マウス 13…キーボード 14…画像入力装置 15…RAM 16…画像記憶領域 17…文字コード領域 18…目次情報領域 19…ハードディスク 20…プログラム記憶領域 21…文字認識辞書記憶領域 22…OS記憶領域 23…ROM 24…起動プログラム記憶領域
フロントページの続き Fターム(参考) 5B050 BA10 BA16 GA08 5B064 AA01 BA01 5B075 ND07 NK04 NK21 NK43 PP04 PP13 PQ02

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 複数のページからなる画像データに対し
    て文字認識を行う文字認識装置であって、 前記複数のページのうち、見出し項目と当該見出し項目
    の対応ページ番号とが記される見出しページから、見出
    し項目および対応ページ番号をそれぞれ文字認識により
    抽出する手段と、 前記複数のページのそれぞれの画像ページ番号を文字認
    識により抽出する手段と、 前記抽出した対応ページ番号および画像ページ番号の対
    応関係に基づいて、前記見出し項目を前記複数のページ
    に対応する画像データにそれぞれ関連付けるための関連
    付け情報を生成する手段と、 前記見出し項目を表示する手段と、 前記表示された見出し項目のいずれかを指定する手段
    と、 前記関連付け情報を参照して前記指定された見出し項目
    に対応する画像データを出力する手段とを備える、文字
    認識装置。
  2. 【請求項2】 前記見出しページは、目次ページおよび
    索引ページのいずれかを含む、請求項1記載の文字認識
    装置。
  3. 【請求項3】 前記見出し項目の階層構成を判別する手
    段をさらに備え、 前記見出し項目を表示する手段は、前記判別した階層構
    成に基づいて、見出し項目を階層的に表示することを特
    徴とする、請求項1記載の文字認識装置。
  4. 【請求項4】 前記見出し項目の階層構成を判別する手
    段は、見出しページにおける見出し項目の位置を互いに
    比較することによって階層構成を判別することを特徴と
    する、請求項3記載の文字認識装置。
  5. 【請求項5】 複数のページからなる画像データに対し
    て文字認識を行う文字認識方法であって、 前記複数のページのうち、見出し項目と当該見出し項目
    の対応ページ番号とが記される見出しページから、見出
    し項目および対応ページ番号をそれぞれ文字認識により
    抽出するステップと、 前記複数のページのそれぞれの画像ページ番号を文字認
    識により抽出するステップと、 前記抽出した対応ページ番号および画像ページ番号の対
    応関係に基づいて、見出し項目を複数のページに対応す
    る画像データにそれぞれ関連付ける関連付け情報を生成
    するステップと、 見出し項目を表示するステップと、 前記表示された見出し項目のいずれかを指定する手段
    と、 前記関連付け情報を参照して前記指定された見出し項目
    に対応する画像データを出力するステップとを備える、
    文字認識方法。
  6. 【請求項6】 前記見出しページは、目次ページおよび
    索引ページのいずれかを含む、請求項5記載の文字認識
    方法。
  7. 【請求項7】 前記見出し項目の階層構成を判別するス
    テップをさらに備え、 前記見出し項目を表示するステップは、前記判別した階
    層構成に基づいて、見出し項目を階層的に表示すること
    を特徴とする、請求項5記載の文字認識方法。
  8. 【請求項8】 前記見出し項目の階層構成を判別するス
    テップは、見出しページにおける見出し項目の位置を互
    いに比較することによって階層構成を判別することを特
    徴とする、請求項7記載の文字認識方法。
  9. 【請求項9】 コンピュータに複数のページからなる画
    像データに対して文字認識を行わせるプログラムを記録
    したコンピュータ読み取り可能な記録媒体であって、 前記複数のページのうち、見出し項目と当該見出し項目
    の対応ページ番号とが記される見出しページから、見出
    し項目および対応ページ番号をそれぞれ文字認識により
    抽出するステップと、 前記複数のページのそれぞれの画像ページ番号を文字認
    識により抽出するステップと、 前記抽出した対応ページ番号および画像ページ番号の対
    応関係に基づいて、見出し項目を複数のページに対応す
    る画像データにそれぞれ関連付ける関連付け情報を生成
    するステップと、 見出し項目を表示するステップと、 前記表示された見出し項目のいずれかを指定するステッ
    プと、 前記関連付け情報を参照して前記指定された見出し項目
    に対応する画像データを出力するステップと、 をコンピュータに実行させるプログラムを記録したコン
    ピュータ読み取り可能な記録媒体。
  10. 【請求項10】 前記見出しページは、目次ページおよ
    び索引ページのいずれかを含む、請求項9記載のコンピ
    ュータ読み取り可能な記録媒体。
  11. 【請求項11】 前記見出し項目の階層構成を判別する
    ステップをさらにコンピュータに実行させ、 前記見出し項目を表示するステップは、前記判別した階
    層構成に基づいて、見出し項目を階層的に表示すること
    を特徴とする、請求項9記載のコンピュータ読み取り可
    能な記録媒体。
  12. 【請求項12】 前記見出し項目の階層構成を判別する
    ステップは、見出しページにおける見出し項目の位置を
    互いに比較することによって階層構成を判別することを
    特徴とする、請求項11記載のコンピュータ読み取り可
    能な記録媒体。
JP2000205480A 2000-07-06 2000-07-06 文字認識装置および方法 Pending JP2002024796A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000205480A JP2002024796A (ja) 2000-07-06 2000-07-06 文字認識装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000205480A JP2002024796A (ja) 2000-07-06 2000-07-06 文字認識装置および方法

Publications (1)

Publication Number Publication Date
JP2002024796A true JP2002024796A (ja) 2002-01-25

Family

ID=18702558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000205480A Pending JP2002024796A (ja) 2000-07-06 2000-07-06 文字認識装置および方法

Country Status (1)

Country Link
JP (1) JP2002024796A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014164384A (ja) * 2013-02-22 2014-09-08 Fuji Xerox Co Ltd 画像処理装置及びプログラム
US9465986B2 (en) 2012-10-04 2016-10-11 Fuji Xerox Co., Ltd. Information processing apparatus, method, and non-transitory computer readable medium for creating electronic bookmarked information
CN116092108A (zh) * 2023-03-20 2023-05-09 四川竺信档案数字科技有限责任公司 一种实体文档扫描生成pdf文件的方法、系统及存储介质
CN117493712A (zh) * 2023-12-29 2024-02-02 浙江华东工程数字技术有限公司 Pdf文档可导航目录提取方法、装置、电子设备及存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9465986B2 (en) 2012-10-04 2016-10-11 Fuji Xerox Co., Ltd. Information processing apparatus, method, and non-transitory computer readable medium for creating electronic bookmarked information
JP2014164384A (ja) * 2013-02-22 2014-09-08 Fuji Xerox Co Ltd 画像処理装置及びプログラム
CN116092108A (zh) * 2023-03-20 2023-05-09 四川竺信档案数字科技有限责任公司 一种实体文档扫描生成pdf文件的方法、系统及存储介质
CN117493712A (zh) * 2023-12-29 2024-02-02 浙江华东工程数字技术有限公司 Pdf文档可导航目录提取方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
US20040194021A1 (en) Systems and methods for sharing high value annotations
JP2001337994A (ja) サムネイル表示システムと方法およびその処理プログラムを記録した記録媒体
JP5446877B2 (ja) 目次構造特定装置
JP2002024796A (ja) 文字認識装置および方法
JPH11120191A (ja) 文書管理システム、方法および記録媒体
JP4521218B2 (ja) 画像形成システム、情報処理装置、画像形成装置、画像形成方法、および画像形成用プログラム
JPH03276260A (ja) 文字コードのタイトル処理機能を備えた電子フアイリング装置
JPH0236478A (ja) 情報処理システム
JPH0764979A (ja) 文書情報処理装置
US20230385540A1 (en) Information processing method, information processing apparatus, and storage medium
JP2013012084A (ja) 文書処理装置、文書処理システムおよびプログラム
JP2001051771A (ja) 画像処理システム及び方法
JP2009157470A (ja) 電子文書処理装置及びプログラム
JPH0962659A (ja) 印刷装置
JP3313483B2 (ja) キーワード作成装置
JPH11272708A (ja) 文書作成支援システム
JP2002366880A (ja) フォーム編集装置及び方法及びコンピュータ読取り可能なプログラムが格納された記憶媒体
JP2002297574A (ja) ルビ付与システムおよびプログラム
JP3313482B2 (ja) キーワード作成装置
JPH08202859A (ja) 電子ファイリング装置及びその方法
JP2978178B2 (ja) 文書作成装置及びその制御方法
JPH08185507A (ja) ファイリング機能付き文書処理装置
JP2006184939A (ja) 分類情報作成装置、分類情報作成プログラム
JPH05314108A (ja) 文書編集装置
JP2003316628A (ja) 文書管理システム、方法、プログラム及び記憶媒体