JPS6327990A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPS6327990A
JPS6327990A JP61172513A JP17251386A JPS6327990A JP S6327990 A JPS6327990 A JP S6327990A JP 61172513 A JP61172513 A JP 61172513A JP 17251386 A JP17251386 A JP 17251386A JP S6327990 A JPS6327990 A JP S6327990A
Authority
JP
Japan
Prior art keywords
information
format
area
character recognition
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61172513A
Other languages
English (en)
Inventor
Koichi Ejiri
公一 江尻
Akira Sakurai
彰 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP61172513A priority Critical patent/JPS6327990A/ja
Publication of JPS6327990A publication Critical patent/JPS6327990A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [技術分野] 本発明は、文書類の文字等の画像情報を光学的に読取り
入力する画像情報入力装置(以下、OCRという)に関
し、特に、あらかじめ文章情報のフォーマット認識モー
ドを設定し、そのモードにおけるフォーマット情報を印
字情報から抽出して認識する技術に関するものである。
[従来技術] 従来、手書文等の文書をOCRで認識する装置は1通常
、ある程度のフォーマットの情報をも認識する。例えば
、文頭、iの段落、空白行、大略のタブ位置を認識でき
る。その結果、第11図の(a)に示すような文章のパ
ターンを読取って入力すると、第11図の(b)に示す
ような文章のパターンに再現される。この第11図にお
いて、横線は、文章行を示している。
しかしながら、従来のOCRで認識する装置では1文字
単位で認識しているため、文頭が初め揃っていたとして
も、再生車にカウンタのエラーによって1文字程度の不
揃いが生じる。また、空白行の間隔が不正確になったり
、通常行間隔が不正確になったりするという問題があっ
た。
[目的] 本発明の目的は、ワードプロセッサー等で印字する場合
、印字情報からフォーマット情報を抽出して認識するこ
とができる技術を提供することにある。
本発明の前記ならびにその他の目的と新規な特徴は1本
明細書の記述及び添付図面によって明らかになるであろ
う。
[構成] 本発明は、文書類の文字等の画像情報を光学的に読取り
入力する画像情報入力装置における文字認識方法におい
て1文字認識に先立ってあらかじめ文章等の情報のフォ
ーマット認識モードを設定し、そのモードにおけるフォ
ーマット情報を印字情報から抽出して認識する段階を備
えたことを特徴とするものである。
また、さらに、前記抽出された領域ごとに各領域固有の
処理を施す段階とを備えたことを特徴とするものである
以下1本発明の実施例を図面を用いて具体的に説明する
なお、実施例を説明するための全回において。
同一機能を有するものは同一符号を付け、その繰り返し
の説明は省略する。
[実施例■コ 第1図は、本発明の実施例Iの文字認識方法を実施する
ためのOCRの概略構成を示すブロック図、 第2図は、第1図に示すOCRを用いた多機能画像情報
処理装置の概略構成を示すブロック図。
第3図は、本発明の実施例IのOCRを用いた文字Li
 T’S方法の処理プロセスを示すフローチャートであ
る。
本実施例のOCR用文字認識方法を適用した画像情報処
理装置において、第2図に示すように、キーボード1は
1文字を入力する他に各種のモード(仮名漢字変換、漢
字仮名変換、OCR文字認識等)を指定するものに用い
る。OCR2は、原稿を光学的に読取り入力する。処理
装置3は、キーボード1や0CR2からの入力情報につ
いて、指定されたモードに従った処理を実行し、出力装
置4に出力する。出力装置4は、ディスプレイ装置、プ
リンタ等を総称して示したものである。処理装置3の処
理に必要なプログラムメモリ(ROM)5に格納される
が、キーボード入力による仮名漢字変換、OCR文字認
識の後処理、OCR入力された文字等の仮名漢字変換や
漢字仮名変換についてできるだけ共通のアルゴリズムが
利用される。データメモリ(RAM)6は、処理装置3
での処理途中のデータやパラメータを格納するのに用い
られる。単語辞書メモリ7には読み表記対応データを付
加した単語辞書が格納されている。
前記第2図に示す0CR2は、第1図に示すように、光
源と電荷結合素子(CCD)等からなる光学的スキャナ
ー11により、原稿上の文字等の画像情報を読み取って
入力する。この入力された仮名文字列又は仮名漢字混合
文字列、英字列等の画像情報を1文字切出しユニット1
2により、1文字毎に切出され、特徴抽出ユニット13
でその切出された文字の特徴を抽出する。この抽出され
たデータは、特徴マツチングユニット14で特徴辞書メ
モリ(ROM又はRAM)15に格納されている特徴辞
書データとのマツチングがとられる。
マツチングがとれれば、入力文字が認識され処理装置3
に送られる。マツチングがリジェクトとなった場合には
、特徴マツチングユニット14からリジェクト信号が発
生して前記文字切出しユニット12に送られる。
次に、本実施例の文字認識方法の処理プロセスを第3図
に従って説明する。
なお、本実施対象としては文章情報を扱う。
(1)フォーマット情報抽出認識処理プロセスまず1段
I!tJ101で各種モードの中からフォーマット認識
モードを指定する。段階102で前記指定モードである
かの判断を行い、YESであれば1段階103に移る6
段階103で行切出し処理を行う。この行切出し処理は
、通常の文字認識と同様に文字行を1行ずつ切り出す。
このアルゴリズムは、従来のように水平方向に一括射影
でもよいし、アダプティブに文字列を追跡してもよい。
この時1段階104で前の行と次の行との間の行間ピッ
チPQ (PQ=(現走査ライン番地)−(前走査ライ
ン番地)〕を同時に取り出す。そして、同時に、前記行
間ピッチPQを横軸にとり、縦軸に頻度をとった行間ピ
ッチヒストグラムを、全画面にわたって集計して図示す
ると、第4図に示すようなグラフで表わされる。この時
、最も小さいピンチのものをPlとおく。この最も小さ
いピッチP1が基本ピッチである。
次に、段階105でコラム抽出処理を行う。このコラム
抽出処理は、従来にない新規な機能であり、特に、情報
が行と直交方向に構造を持っている時、コラムと呼ぶが
、このコラムは以下のようにして抽出する〔第11図の
(a)のCの部分〕。
まず、第5図に示すような一辺が文字サイズの1/2程
度のウィンドウを3X3個(9個)用意し、これを論理
用ウィンドウとする。この注目ウィンドウ(X)が0(
白)でウィンドウ(A)+(B)+(C)・・・・又は
画素(F)+(G)+(H)・・・・とする。
このときウィンドウ内の白黒の判定は適当に設定された
閾値によるものとし、代表的には、1つのウィンドウ内
の黒の割合が0.2以上の場合を黒と判定する。この処
理を行ピッチP1と同等程度のピッチで実施すると、第
6図に示すような文章行(水平4りは互に接触し、斜線
で示すような領域になる。この領域が文章領域である。
このとき、文章の行間が埋まらないことが生じた場合は
、同−m理ウィンドウを使って(B)+ (G)≧1の
とき、X=1とする処理を複数回繰り返せばよい。
もしも、この時、文章領域中に孤立空白部があれば埋め
る。このためには、空白部のラベリング(4連結)を行
い、小さい孤立空白部のラベルを黒に置換すればよい。
次に、段階106でレイアウトエディツト処理を行い、
段階107に移る。段階107でフォーマット認識処理
終了か否かの判断を行い、Noであれば段階101に戻
し、YESであれば、フォーマット認識処理を終了する
前記抽出された文章領域を水平/垂直の線分で近似させ
、もし必要なら、この線分の編集をする。
第7図の(a)は線分で近似させた文章領域を示し、(
b)はこれを編集した後の領域である。この場合の編集
は、マニュアル操作でもよいし、長線分を一辺とする長
方形近似を自動的に行ってもよい。結果は、識別コード
をファイル名として。
その領域を定義しておく。
(2)文字認識処理 まず、前記段階101で各種モードの中から文字認識モ
ードを指定する。段階102で前記指定モードかの判断
行い、YESであれば、段階108に移る。段階108
で行切出し処理を行い、フォーマント認識処理の後又は
直接起動されるモードで、従来の文字認識処理と同様に
段階109〜112の処理を行う。これらの段階109
〜112処理は、従来の処理と同じであるので、ここで
はその説明は省略する。
ただし、フォーマット認識処理後に各領域ごとにその領
域固有の処理、例えば文字認識処理を実行する場合は、
抽出された領域別に認識手続を実行し、認識された文字
記号列の先頭には、領I!A識別コードを付与する。結
果として、文字列のレイアウトができ上がる。第8図は
、その例であり、ファイル名20は、領域とその全ての
属性を固定する。スタート、エンド座標値21は、長方
形領域の左」二、右下隅の座標値であり、属性22は文
字フォント、ピッチ等テキスト(Text)内の属性を
示す。テキスト情報は、従来のワードプロセッサー内部
コードと見なしてよい。
このように、文字認識に先立ってあらかじめ文章等の情
報のフォーマット認識モードを設定し、そのモードにお
けるフォーマット情報を印字情報から抽出して認識する
段階を備えたことにより、ワードプロセッサー等で印字
する場合、印字情報からフォーマットコード情報を容易
に復元することができる。
この復元された領域ごとに各領域固有の処理を施す段階
とを備えたことにより、各領域に適切な画像が得られる
ので、空白行の間隔及び通常行間隔が正確に揃った再生
文を得ることができる。
一般に読み取られる文字と、再生される文字の大きさは
同じではないから、抽出された各領域内にぴったり文章
が納まる保障はない。これらの処理は従来のレイアウト
エディタあるいは組板システムで実施すればよい。
[実施例■コ 本発明の実施例■の文字認識方法のフォーマット認識処
理のプロセスについて説明する。
まず、第1図に示す0CR2の前記スキャナー11によ
り、原稿全体の画像を2値(例えば2゜Oドツト/イン
チ)でコンピュータ処理装置3に読み込み、第2図に示
す出力装置(以下、ディスプレイという)4に表示し、
この表示された画像をデータメモリ6にファイルAとし
て格納する。
この時、低価格のディスプレイ4では1例えば、帳票全
体(例えば200ドツト/インチでは約1600X 2
400ドツト)を表示することは困難であるから画素を
間引き、第9図に示すような帳票30の全体のレイアウ
トをディスプレイ4上に表示する。
そして、後で述べるフォーマット認識処理を行って、フ
ァイルB、C,D、E、Fを清書ファイルとしてデータ
メモリ6に格納する。この時ファイルAは消去してもか
まわない。
前記ファルB、C,D、E、Fの処理方法は、第10図
に示すディスプレイ4に表示されている画像レイアウト
図4A上でマウス等の入力装置により、所定の領域を指
定する。手書き文字31に関しては、低解像度で十分で
あるからデータメモリ6に格納されているファイルAの
中の指定領域の画像データに文字種(ANSK、漢字な
ど入力装置により指定)の情報も付加して0CR2に送
り、その認識結果をデータメモリ6にファイルBとして
格納する。
また、第9図に示すタイトル30Aなど大きな文字は、
前記文字認識装置の画像バッファの制約でこのまま送れ
ないことが多いので、前記ファイルAの中の指定領域の
画像データを間引いて送り。
その認識結果に大文字の情報を付加してデータメモリ6
にファイルCとして格納する。また、図3 4やグラフ
などは指定領域の画像をそのままファイルDとしてデー
タメモリ6に格納する。この時画像データを間引いて格
納してもよい。
また、活字33に関しては、低解像度では不充分である
ので、マウス等の入力装置によりディスプレイ4に表示
された画像レイアウト図4A上で、帳票30の指定され
た領域を高解像度(例えば300.400ドツト/イン
チ)で再びスキャナー11により読取り、0CR2に送
り、その認識結果をファイルEとしてデータメモリ6に
格納する。
また、ハーフトーンの写真32などに関しては。
帳票30の指定された領域をハーフトーン処理(ディザ
処理など)を指定し、再びスキャナー11により読取り
、ファイルEとしてデータメモリ6に格納する。
このように様々な画像の領域のフォーマットの指定をデ
ィスプレイ4上のレイアウト図を用いて行うようにした
dで、オペレータの作業を軽減することができると共に
、柔軟なフォーマット指定が可能となる。
また、処理の異なる領域に対して、再度スキャナー11
により読取ることをディスプレイ4で指定するようにし
たので、その領域固有の処理の作業が容易となる。
また、不定形帳票等の場合においても前記フォーマット
指定が可能となる。
また、標準ドツトで表示する表示画面よりも小さい画像
メモリでも前記フォーマット指定が可能となる。
以上1本発明を実施例にもとずき具体的に説明したが1
本発明は、前記実施例に限定されるものではなく、その
要旨を逸脱しない範囲において種々変更可能であること
は言うまでもない。
〔発明の効果〕
以上説明したように1本発明によれば、文字認識に先立
ってあらかじめ文章等の情報のフォーマット認識モード
を設定し、そのモードにおけるフォーマット情報を印字
情報から抽出して認識する段階を備えたことにより、ワ
ードプロセッサー等で印字する場合、印字情報からフォ
ーマットコ−ド情報を抽出して容易にその領域を復元す
ることができる。
この抽出された領域ごとに各領域固有の処理を施す段階
とを備えたことにより各領域に適切な画像が得られるの
で1文章の空白行の間隔及び通常行間隔が正確に揃った
再生車を得ることができる。
【図面の簡単な説明】
第1図は1本発明の実施例Iの文字認識方法を実施する
ためのOCRの概略構成を示すブロック図、 第2図は、第1図に示すOCRを用いた多機能画像情報
処理装置の概l118構成を示すブロック図。 第3図は、本発明の実施例IのOCRを用いた文字認識
方法の処理プロセスを示すフローチャート、 第4図は1行間ピッチヒストグラムを全画面にわたって
集計したグラフ。 第5図は、3X3画素の論理用ウィンドウを説明するた
めの図、 第6図は、本発明の実施例■のフォーマット情報抽出認
識方法を用いて所定の領域を表示した図。 第7図は、第6図に示す領域を線分で、近似させた文章
領域及び編集領域を示す図、 第8図は、本発明の実施例Hのフォーマット認識処理の
後に文字認識処理を行うためのフォーマット情報を文字
記号列の先頭に領域識別コードを付与した例を示す図、 第9図は、本発明の実施例■を説明するための帳票の全
体レイアウトを示す図、 第10図は、第9図の帳票全体のレイアウトをディスプ
レイ上に表示させた帳票全体のレイアウト図、 第11図は、従来の文章認識方法の問題点を説明するた
めの図である。 図中、3・・・処理装置、4・・・出力装置(ディスプ
レイ)、11・・・スキャナー、12・・・文字切出し
ユニット、13・・・特徴抽出ユニット、14・・・特
徴マツチングユニット、15・・・特徴辞書メモリであ
る。

Claims (2)

    【特許請求の範囲】
  1. (1)文書類の文字等の画像情報を光学的に読取り入力
    する画像情報入力装置における文字認識方法において、
    文字認識に先立ってあらかじめ文章等の情報のフォーマ
    ット認識モードを設定し、そのモードにおけるフォーマ
    ット情報を印字情報から抽出して認識する段階を備えた
    ことを特徴とする文字認識方法。
  2. (2)文書類の文字等の画像情報を光学的に読取り入力
    する画像情報入力装置における文字認識方法において、
    文字認識に先立ってあらかじめ文章等の情報のフォーマ
    ット認識モードを設定し、そのモードにおけるフォーマ
    ット情報を印字情報から抽出して認識する段階と、この
    抽出された領域ごとに各領域固有の処理を施す段階とを
    備えたことを特徴とする文字認識方法。
JP61172513A 1986-07-22 1986-07-22 文字認識方法 Pending JPS6327990A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61172513A JPS6327990A (ja) 1986-07-22 1986-07-22 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61172513A JPS6327990A (ja) 1986-07-22 1986-07-22 文字認識方法

Publications (1)

Publication Number Publication Date
JPS6327990A true JPS6327990A (ja) 1988-02-05

Family

ID=15943348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61172513A Pending JPS6327990A (ja) 1986-07-22 1986-07-22 文字認識方法

Country Status (1)

Country Link
JP (1) JPS6327990A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04195693A (ja) * 1990-11-28 1992-07-15 Toshiba Corp マルチメディア入力装置
JP2009163398A (ja) * 2007-12-28 2009-07-23 Toshiba Corp 帳票読取装置、帳票読取システムおよびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04195693A (ja) * 1990-11-28 1992-07-15 Toshiba Corp マルチメディア入力装置
JP2009163398A (ja) * 2007-12-28 2009-07-23 Toshiba Corp 帳票読取装置、帳票読取システムおよびプログラム

Similar Documents

Publication Publication Date Title
EP0543598B1 (en) Method and apparatus for document image processing
EP1343095A2 (en) Method and system for document image layout deconstruction and redisplay
JPS63155386A (ja) 帳票デ−タ読取装置
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JPH10162098A (ja) 文書電子化装置及び文書電子化方法
JPS6327990A (ja) 文字認識方法
JPH05303619A (ja) 電子スクラップブック
JPH0991371A (ja) 文字表示装置
Aparna et al. A complete OCR system development of Tamil magazine documents
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP2000082110A (ja) 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体
JPH0916582A (ja) 文書作成装置及び同装置に用いられる認識結果出力方法
JP2957729B2 (ja) 行方向判定装置
JPH07262317A (ja) 文書処理装置
JP2005004395A (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JPS5949671A (ja) 光学的文字読取装置
JPH0713996A (ja) 文字認識装置
JP2887823B2 (ja) 文書認識装置
JP2931041B2 (ja) 表内文字認識方法
JPH0728934A (ja) 文書画像処理装置
JPH04293185A (ja) ファイリング装置
JPS63155385A (ja) 光学文字読取装置
JPH1049602A (ja) 帳票認識方法
JPH0728933A (ja) 文字認識装置
JPH0589279A (ja) 文字認識装置