JPH0444185A - 文書読取装置 - Google Patents

文書読取装置

Info

Publication number
JPH0444185A
JPH0444185A JP2151661A JP15166190A JPH0444185A JP H0444185 A JPH0444185 A JP H0444185A JP 2151661 A JP2151661 A JP 2151661A JP 15166190 A JP15166190 A JP 15166190A JP H0444185 A JPH0444185 A JP H0444185A
Authority
JP
Japan
Prior art keywords
character
document
read
reading
editing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2151661A
Other languages
English (en)
Inventor
Yoshitake Tsuji
辻 善丈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2151661A priority Critical patent/JPH0444185A/ja
Publication of JPH0444185A publication Critical patent/JPH0444185A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、書籍などの文書画像のレイアラ1−構造を解
析し、文字読取りを行う文書読取装置、特に、レイアウ
ト解析結果を利用して読取った文字コート列を編集する
機能を有する文書読取装置に関する。
〔従来の技術] 一般書籍等の既存文書画像を文字認識技術を利用して自
動的に読取ることは、利用者の負担を軽減して既存文書
画像の効率的な蓄積・編集を実現する」二で重要である
従来、このような既存文書画像を文字認識を利用して読
取り、ワープロなどの文字編集装置を利用して所望のデ
ータヘースを作る方法が一般的に行われている。この場
合、段組や図などが混在する文書画像では、読取るべき
領域を数回に分けて処理し、ワープロ等で再度編集する
必要があるため、機器の操作性や利用者の負担などの面
で問題があった。
一方、例えば同一出願人による特願昭62−29020
7号明細書「文書画像解析方式」に示されているように
、段組や図などが混在する文書画像を文字行図などの基
本ブロツクに分割し、更にパラグラフテキスト等の文書
画像を構成する要素ブロック及び要素ブロック間の配置
関係を木構造として生成する文書画像の自動解析方式が
知られている。
〔発明が解決しようとする課題〕
従来、既存文書画像を文字認識技術を用いて読取り、読
取った結果の順序変更消去等の編集を行う場合にも、ワ
ープロなどの文書読取装置とは異なる文字編集装置を用
いる必要があり、機器の操作性や修正に要する時間など
に問題があった。
本発明の目的は、従来の」1記課題を解決するために、
文書画像を自動解析した結果に基づいて文字読取りを行
い、所定の順序で変換される文字コード列の順序変更や
所望の領域の文字読取り結果の選択などを文書のレイア
ウト情報に従って容易に行えるようにした文書読取装置
を提供することにある。
〔課題を解決するための手段〕
第1の発明の文書読取装置は、 文書画像を基本ブロックに分解する領域分割手段と、 前記基本ブロックを基にして、前記文書画像を構成する
要素ブロック及び各要素ブロック間の配置関係を木構造
として生成する文書構造化手段と、前記木構造から文字
行ブロックを読出ず行読出し手段と、 読出された文字行ブロックを1文字単位に切出し、認識
辞書と照合して文字読取り結果を順次得る文字認識手段
と、 文字行ブロックを含む複数個の要素ブロックに対して、
文字読取りを行った順序で順序イ」げを行い、前記文書
画像と共に表示する手段と、順序付げされた前記複数個
の要素ブロックの編集を指示し、前記指示に基づいて読
取られた複数個の文字コード列を編集する手段とを有す
ることを特徴とする。
第2の発明の文書読取装置は、 文書画像を基本ブロックに分解する領域分割手段と、 前記基本ブロックを基にして、前記文書画像を構成する
要素ブロック及び各要素ブロック間の配置関係を木構造
として生成する文書構造化手段と、前記木構造から文字
行ブロックを読出ず行読出し手段と、 読出された文字行ブロックを1文字単位に切出し、認識
辞書と照合して文字読取り結果を順次得る文字認識手段
と、 文字行ブロックを含む複数個の要素ブロック単位に、文
字読取りを行った順序で文字コード列を表示する手段と
、 前記複数個の要素ブロックの編集を指示し、前記指示に
基づいて読取られた複数個の文字コード列を編集する手
段とを有することを特徴とする。
〔実施例] 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は、第1の発明の一実施例を示す機能ブロック図
である。
この文書読取装置は、画像メモリ1.領域分割部21文
書構造化部3.構造化データ記憶部4゜行続出し部52
文字切出し部69文字認識部7認識結果記憶部8.ブロ
ック探索部92表示制御部10.表示部11.指示情報
入力部129編集部13編集結果記憶部14.探索レベ
ル記憶部151画像圧縮部16を有している。
画像メモリ1は、文書画像を量子化された画像情報とし
て記憶する。
領域分割部2は、画像メモリに記憶された文字画像を文
字行1図などの基本ブ1コックに分割する機能を有して
おり、その結果を構造化データ記憶部4に格納する。
文書構造化部3ば、構造化データ記憶部4の内容を順次
読出し、文書画像を構成する要素ブロック及び各要素ブ
ロック間の配置関係を木構造として生成し、再度構造化
データ記憶部4に格納する。
行読出し部5は、構造化データ記憶部4に格納された木
構造を縦型探索してその順序で文字行を順次読出し、文
字切出し部6へ転送する。
文字切出し部10は、順次転送される文字行ブロック情
報に従って、1文字車位のイメージを画像メモリ1に記
憶された文書画像から順次に切出し、文字認識部7へ転
送する。
文字認識部7は、予め記憶された認識辞書と順次入力さ
れる文字イメージを照合し、文字コードに変換し、認識
結果記憶部8の所定の領域に順次格納する。
探索レヘル記憶部I5は、予め定められた表示レヘル情
報(例えば、文章ブロックレベル、文字行レヘル)を格
納する。
ブロック探索部9は、探索レヘル記憶部15の内容に従
って、構造化データ記憶部4に格納された木構造を探索
し、表示される各要素ブロック情報を表示制御部10に
転送する。
画像圧縮部16は、画像メモリ1に記憶された文書画像
を所定ザイズに縮小して表示制御部1oに転送する。
表示制御部10は、縮小された文書画像及び各要素ブロ
ックを順次入力された順序で71117序付けを行った
各要素ブロックの表示内容を表示部1oに転送し、表示
部10で表示する。
指示情報入力部12ば、キーボードを有し、利用者が表
示部10の表示内容を参照しながら、認識結果を編集す
るだめの変更指示情報を編集部13へ入力する。
編集部13は、表示制御部1oに格納された各要素ブロ
ックの順序情報及び指示情報入力部]2がら入力された
変更指示情報に従って、認識結果記憶部8に格納された
文字読取り結果を編集し、編集結果記憶部14に格納す
る。
次に、本実施例の動作を説明する。
画像メモリ1に、第2図に示すような横書きで記載され
た文書画像が記憶されているものとする。
なお第2図において、斜線を入れた丸印は文字を示して
いる。
領域分割部2は、画像メモリ1に記憶された文書画像を
文字行1図などの基本ブロックに分割する。第2図に、
分割された基本ブロックである、文字行ブロックS、(
i=1.2.・・・ 19)および線分ブロックし1を
示す。分割の方法は、例えば「スプリット検出法に基づ
く頁画像の構造解析」(電子通信学会技術研究報告パタ
ーン認識と学習PRI、85−17.1985−6)に
よって実現することができる。このような従来技術を用
いることによって、例えば図などが混在していてもある
いは縦書きであっても、基本ブロックに分割できる。分
割結果は、構造化データ記憶部4に格納される。
文書構造化部3ば、構造化データ記憶部4の内容を順次
読出し、文書画像を構成する要素ブロック及び各要素ブ
ロック間の配置関係を木構造として生成するが、この処
理は次のようにして行われる。
まず、文書画像を構成する重要な要素ブロックとして文
章ブロックがある。例えば、同一の文字並び及び文字ピ
ッチを持つ文字行が所定の行間隔で並んでいる文字行の
集合に対して、その先頭の空白文字も考慮して文書ブロ
ックを定義すると、以下で述べる文章ブロックは、通常
の文書におけるパラグラフ単位で構造化される要素ブロ
ックと見なすことができる。例えば、第2図の文字行S
、、S、、S、は文章ブロックT2に構造化されること
になる。なお、以下の説明では、文章ブロックや文字行
1図、写真などの基本ブロックの組合せ領域を仮想ブロ
ックと呼ぶことにする。例えば、文章ブロックT、、T
2の合成領域M、は仮想ブ1コックとなる。
次に、文書画像を構成する要素ブロック間の配置関係と
して、上下関係、左右関係、包含関係を導入する。例え
ば、第2図において、文字行ブロックS、、S2は上下
関係にあり、仮想ブロックM3とM、は左右関係にある
。また、仮想ブロックM2と仮想ブロックM3は包含関
係となる。
以上に説明した配置関係も含めて基本ブロックの構造化
を行うと、第2図で示した文書画像に対して第3図で示
すような木構造が生成できる。第3図において、丸印で
示したノードは、各要素ブロック(但し、基本ブロック
も含む)を示し、ノード内の記号はそれぞれ第2図の要
素ブロック(但し、記号Pは1頁領域)を示している。
また、図中記号8.→は、それぞれ上下関係及び左右関
係の配置関係を意味する。この木構造は、構造化データ
記憶部4に格納される。なお、第3図で示した文書画像
の各要素ブロックの配置関係も含んだ構造化方法につい
ては、例えば、同一出願人による特願昭62−1721
99号明細書1文書画像解析方式」に記載された方式を
利用することができる。
行続出し部5は、構造化データを記憶部4に格納された
第3図の木構造を、1頁領域Pから始めて通常の縦型探
索を行い、文字行ブロックS。
(i=1.・・・19)を順次取り出す。この場合、最
初に、文字行SIが見つかり、次に文字行S、が、次G
こ文章ブロックT2を介して文字行S3が見つかること
になる。即ち、上下関係を満足する場合には、上から下
へ順次文字行が読み出せ、左右関係を満足する場合には
、第2図の横書きの例では、左から右へ順次文字行を読
出すことができる。読出された文字行は、文字切出し部
6へ転送される。
文字切出し部IOは、順次転送される文字行ブロック情
報に従って、1文字単位のイメージを画像メモリ1に記
憶された文書画像から順次に切出し、文字認識部7へ転
送する。文字認識部7は、予め記憶された認識辞書と順
次入力される文字イメージとを照合し、文字コードに変
換し、認識結果記憶部8の所定の領域に順次格納する。
一方、ブロック探索部9は、探索レベル記憶部15の内
容に従って、構造化データ記憶部4に格納された木構造
を探索し、表示される各要素ブロック情報を表示制御部
10に転送する。
表示制御部10は、以下に説明するように、縮小された
文書画像及び各要素ブロックを順次入力された順序で順
序付けを行った各要素ブロックの表示内容を表示部10
に転送し、表示部10で表示する。
第4図(a)は、表示部10での表示を示しており、第
2図で示した文書画像に対して領域分割及び構造化によ
って生成された木構造(第3図参照)を探索し、文章ブ
ロックのレベルで文書画像と共に表示したものである。
また、第4図(a)中の番号(■・・・■)は、文字読
取りが行われた順序を示しており、この順序で各文字行
に対する文字読取り結果が格納されている。
次に、利用者は、例えば読取り順序の変更や特定なブロ
ックを選択する場合、表示部10の表示内容を参照しな
がら、第4図(b)で示したように、認識結果を編集す
るための変更指示情報を指示情報人力部12を用いて人
力することによって、その変更指示情報は編集部13へ
転送される。
編集部13は、表示制御部10に格納された各要素ブロ
ックの順序情報及び指示情報入力部12から入力された
変更指示情報に従って、認識結果記憶部8に格納された
文字読取り結果を第4図(C)で示したように文字読取
り結果(図中×で示す)を編集し、編集結果記憶部14
に格納する。
なお、公知の技術を用いて、文字読取りの際に得られる
候補文字の選択や文字誤りの修正機能を本発明の編集方
法に組み入れることも可能であることは言うまでもない
第5図は、第2の発明の一実施例を示す機能ブロック図
である。
この文書読取装置は、画像メモリ1.領域分割部22文
書構造化部3.構造化データ記憶部4行続出し部52文
字切出し部69文字認識部7゜認識結果記憶部8.探索
レベル記憶部15.ブロック探索部9を有し、これらは
第1図で説明した機能と同等な機能を有する。第1図の
文書読取装置とは、表示制御部10および編集部13の
機能が異なる。
本実施例では、表示制御部10ヘブロック探索部9から
順次転送された各要素ブロックの順序付は結果及び認識
結果記憶部8に格納された文字読取り結果を表示制御部
10を介して表示部11において表示させる。
第6図(a)は、第2図で示した文書画像の各文字行に
対して順次読取られた文字読取り結果(図中×で示す)
を、第3図で示した木構造を探索し、文章ブロックのレ
ヘルで表示部11に順次表示したものである。なお、第
6図(a)の番号(■〜■)は、文字読取りが行われた
順序を示している。
次に、利用者は、例えば、読取り順序の変更や特定なブ
ロックを選択する場合、表示部10の表示内容を参照し
ながら、第6図(b)で示したように、認識結果を編集
するための変更指示情報を指示情報入力部12を用いて
入力することによって、その変更指示情報は編集部13
へ転送される。
裾集部13は、表示制御部10に格納された各要素ブロ
ックの順序情報及び指示情報入力部12から人力された
変更指示情報に従って、認識結果記憶部8に格納された
文字読取結果(図中×で示す)を第6図(C)で示した
ように編集し、編集結果記憶部14に格納する。
なお、公知の技術を用いて文字読取りの際に得られる候
補文字の選択や文字誤りの修正機能を上記編集方法に組
み入れることも可能である。
〔発明の効果〕
以上説明したように、本発明の文書読取装置によれば、
文書画像を自動解析した結果に基づいて文字読取りを行
い、変換された文字コード列の順序変更や文字読取り結
果の選択などの編集機能を文書のレイアウト情報に従っ
て実現することによって、利用者の負担を軽減すること
ができる。
【図面の簡単な説明】
第1図は、第1の発明の一実施例を示す機能ブロック図
、 第2図は、文書画像を基本ブロックに分割した後、文書
を構成する要素ブロックに構造化する方法を説明する図
、 第3図は、第2図の文書画像に対して得られる文書の配
置構造を木構造として生成された結果の一例を示す図、 第4図は、第1図の文書読取装置における文字読取り結
果編集方法を説明するための回、第5図は、第2の発明
の一実施例を示す機能ブロック図、 第6図は、第5図の文書読取装置における文字読取り結
果編集方法を説明するだめの図である。 1・・・・・画像メモリ 2・・・・・領域分割部 3・・・・・文書構造化部 4・・・・・構造化データ記憶部 5・・・・・行読出し部 6・・・・・文字読出し部 7 ・ 8 ・ 9 ・ 10・ 11・ 12・ 13・ 14・ 15・ 16・ 文字認識部 認識結果記憶部 ブロック探索部 表示制御部 表示部 指示情報入力部 編集部 編集結果記憶部 探索レベル記憶部 画像圧縮部

Claims (2)

    【特許請求の範囲】
  1. (1)文書画像を基本ブロックに分解する領域分割手段
    と、 前記基本ブロックを基にして、前記文書画像を構成する
    要素ブロック及び各要素ブロック間の配置関係を木構造
    として生成する文書構造化手段と、前記木構造から文字
    行ブロックを読出す行読出し手段と、 読出された文字行ブロックを1文字単位に切出し、認識
    辞書と照合して文字読取り結果を順次得る文字認識手段
    と、 文字行ブロックを含む複数個の要素ブロックに対して、
    文字読取りを行った順序で順序付けを行い、前記文書画
    像と共に表示する手段と、 順序付けされた前記複数個の要素ブロックの編集を指示
    し、前記指示に基づいて読取られた複数個の文字コード
    列を編集する手段とを有することを特徴とする文書読取
    装置。
  2. (2)文書画像を基本ブロックに分解する領域分割手段
    と、 前記基本ブロックを基にして、前記文書画像を構成する
    要素ブロック及び各要素ブロック間の配置関係を木構造
    として生成する文書構造化手段と、前記木構造から文字
    行ブロックを読出す行読出し手段と、 読出された文字行ブロックを1文字単位に切出し、認識
    辞書と照合して文字読取り結果を順次得る文字認識手段
    と、 文字行ブロックを含む複数個の要素ブロック単位に、文
    字読取りを行った順序で文字コード列を表示する手段と
    、 前記複数個の要素ブロックの編集を指示し、前記指示に
    基づいて読取られた複数個の文字コード列を編集する手
    段とを有することを特徴とする文書読取装置。
JP2151661A 1990-06-12 1990-06-12 文書読取装置 Pending JPH0444185A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2151661A JPH0444185A (ja) 1990-06-12 1990-06-12 文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2151661A JPH0444185A (ja) 1990-06-12 1990-06-12 文書読取装置

Publications (1)

Publication Number Publication Date
JPH0444185A true JPH0444185A (ja) 1992-02-13

Family

ID=15523460

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2151661A Pending JPH0444185A (ja) 1990-06-12 1990-06-12 文書読取装置

Country Status (1)

Country Link
JP (1) JPH0444185A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07134750A (ja) * 1993-11-11 1995-05-23 Nec Corp 文書画像認識装置
JP2017204270A (ja) * 2016-05-10 2017-11-16 凸版印刷株式会社 文字列領域・文字矩形抽出装置、文字列領域・文字矩形抽出方法、およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61198378A (ja) * 1985-02-28 1986-09-02 Toshiba Corp 光学的文字読取装置
JPH01258089A (ja) * 1988-04-07 1989-10-16 Toshiba Corp 文書処理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61198378A (ja) * 1985-02-28 1986-09-02 Toshiba Corp 光学的文字読取装置
JPH01258089A (ja) * 1988-04-07 1989-10-16 Toshiba Corp 文書処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07134750A (ja) * 1993-11-11 1995-05-23 Nec Corp 文書画像認識装置
JP2017204270A (ja) * 2016-05-10 2017-11-16 凸版印刷株式会社 文字列領域・文字矩形抽出装置、文字列領域・文字矩形抽出方法、およびプログラム

Similar Documents

Publication Publication Date Title
US5860075A (en) Document data filing apparatus for generating visual attribute values of document data to be filed
JPH04350768A (ja) 名刺電子ファイリング装置
JPH0444185A (ja) 文書読取装置
JP2701350B2 (ja) 文書読取装置
JP3041883B2 (ja) 文書作成支援方法および装置
JPH0612543B2 (ja) 文字列指定方法
JPH0612411A (ja) 文書処理装置
JPH08202859A (ja) 電子ファイリング装置及びその方法
JP2000089778A (ja) 表読み上げ装置
JPH07107711B2 (ja) 文書画像の処理装置
JP2002297574A (ja) ルビ付与システムおよびプログラム
JPH0757046A (ja) 文字認識装置における文書画像記憶方式
CN117933187A (zh) 网上自动编辑排版设计方法及其系统
JPH03102565A (ja) 文書作成装置
JPS61296388A (ja) 罫線削除方法
JPH10307927A (ja) 文書処理装置
JPH06119321A (ja) 文書作成装置
JPS62182967A (ja) 漢字入力装置
JPH04195518A (ja) データ出力装置
JPH0546143A (ja) 文字データベース作成装置、文字データベース作成方法及び文字データベース
JPH03142656A (ja) 文書処理装置
JPS62290983A (ja) 特定文字修正用画面編集装置
JPS62182839A (ja) 文書処理装置
JPS6114693A (ja) 文書編集装置
JPS6337462A (ja) 文書作成装置