JPH04123282A - 表認識装置 - Google Patents

表認識装置

Info

Publication number
JPH04123282A
JPH04123282A JP2244298A JP24429890A JPH04123282A JP H04123282 A JPH04123282 A JP H04123282A JP 2244298 A JP2244298 A JP 2244298A JP 24429890 A JP24429890 A JP 24429890A JP H04123282 A JPH04123282 A JP H04123282A
Authority
JP
Japan
Prior art keywords
line
ruled
image
histogram
ruled line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2244298A
Other languages
English (en)
Inventor
Yujiro Kamimura
上村 裕二郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2244298A priority Critical patent/JPH04123282A/ja
Publication of JPH04123282A publication Critical patent/JPH04123282A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、印刷された表を読み取り、表構造及び、セル
内の文字を認識する表認識装置に関するものである。
従来の技術 近年、表認識装置がコンピュータなどの入力装置として
利用されるようになってきた。文書の清書システムとし
て表認識装置の利用を考慮すると、罫線位置、線種、線
幅、及びセル内の文字を認識する必要がある。
従来の表マ識装置は表の構造を認識することによシ、セ
ルの位置を検出し、セル内の文字を認識していた。
発明が解決しようとする課題 このような従来の表認識装置では、表を構成する罫線の
位置、線種、線幅の認識は行なっていなかった。したが
って、入力画像に忠実な再現ができないという問題点を
有していた。
本発明は上記問題点を解決するもので、入力F像に近い
画像が再現できる表認識装置を提供す7ことを目的とし
ている。
課題を解決するための手段 本発明は上記目的を達成するために、罫線の1置、線種
、線幅、文字を認識する手段を含んでンるものである。
作用 本発明は上記した構成によシ、罫線の位置、糸種、線幅
などの線の属性を認識し表として出力することかできる
ものである。
実施例 第1図は本発明の一実施例における表認識装fの機能ブ
ロック図である。第1図において11にキーボード、マ
ウス等の指示により、表認識をでなう命令を発行する認
識指令部である。12はツカされた画像データを格納す
る画像メモリ、13は画像メモリの縦、横2方向の黒画
素のヒストグラムをとるヒストグラム抽出部、14は抽
出さtたヒストグラムにおいて、しきい値よりも高い部
分の画像データを局所的に見ることにより罫線を抽出し
、セルに分解する表構造抽出部、16は表を構成する罫
線の線種、線幅などの線の属性を認識する罫線属性認識
部、16はサンプル文字を記憶する文字パターン辞書、
17は各セル内の文字をサンプル文字と比較し曲もって
決めた値よりも近い類似度ならば、その文字として出力
する文字認識部、18は認識した表の情報を出力する表
出力部である。
第2図は本実施例の表認識装置の構成を示すブロック図
である。第2図において21は表面像を読み取るスキャ
ナで、読み取った表面像をイメージデータとして出力す
る。22はRAMでスキャナ21からのイメージデータ
を記憶する画像領域23、イメージデータの縦、横2方
向の黒画素のヒストグラムを格納するヒストグラム領域
24、表認識の結果得られる表の構造、セル内の文字を
格納する表データ領域25を有する。26はROMで文
字認識に使用する辞書を記憶した特徴辞書領域27及び
プログラム記・億領域28を有する。
29はプログラム記憶領域28に記憶された制御プログ
ラムに従って処理を行なう処理回路である30は認識指
令を行なうキーボードであり、31は表データ領域26
に記憶された表を表示する表示部である。
以上のように構成された本実施例の表認識装置について
以下その動作を第3図のフローチャートを用いて説明す
る。
ステップS1では、スキャナから画像を入力しメモリに
格納する。ステップS2では、入力した画像の傾きを補
正する。ステップ$3では、傾き補正した画像の縦、横
2方向のヒストグラムを抽出する。ステップS4では、
抽出したヒストグラムにおいて、しきい値よυも高く、
ヒストグラムの幅がしきい値よシも小さい部分に罫線が
あると推定する。ステップS6では、推定した罫線位置
の画像を部分的に見ていくことによって、表を構成する
罫線の位置、線種、線幅等の線の属性を認識する。この
ステップの詳細は後述する。ステップ$6では、認識さ
れた罫線の位置からセルを抽出する。ステップS7では
、ステップs6で抽出したセルの内部の文字を認識する
。ステップs8では、全てのセルについてステップs7
の文字認識が済んでいるか調べ、済んでいなければステ
ップS7に戻り、処理を繰り返し、済んでいれば終了す
る。
次にステップS5の詳細について第4図のフローチャー
トを用いて説明する。
ステップ811では、ステップs6で推定した縦、横方
向の罫線位置から、罫線があると考えられる部分に小矩
形を設定しく第5図)、その小矩形の縦・横方向のヒス
トグラムを取る。ステップ812では、線の長さ方向の
ヒストグラムの中心へを求め、罫線の位置とする(第6
図)。ステップS13では、線の長さ方向と垂直方向の
ヒストグラムにおいて、レベルが0の部分と、そうでな
い部分の分布から線種を判別する。ステップ814では
、線の長さ方向に垂直な方向のヒストグラムにおいて、
レベルが0でない部分の高さの平均値から線幅を求める
(第6図)。ステップ815でば、すべての小矩形につ
いて811から514までの処理が終わったかどうかを
調べ、終わっていなければヌテップS11に戻って処理
を繰9返し、終わっていれば終了する。
このように本発明の実施例の表認識装置によれば、罫線
属性認識部を設けであるので、表面像の罫線の属性の情
報を保存することができる。
発明の効果 以上の実施例から明らかなように本発明によれば罫線属
性認識部を設けであるので、罫線の位置、線種、線幅と
いった罫線の属性の情報が得られ、認識結果を出力する
場合に入力画像に近い画像を再現することができ、した
がって、表認識を画像圧縮や、デスクトップパブリッシ
ングの入力として用い得る表認識装置を提供できる。
【図面の簡単な説明】
第1図は本発明の一実施例の表認識装置の機能ブロック
図、第2図は同構成を示すブロック図、第3図は同制御
手順を示すフローチャート、第4図は同罫線属性認識手
順を示すフローチャート、第5図は同表面像の説明図、
第6図は同罫線位置、線幅等細部認識の説明図である。 11・・・・・・認識指令部、12・・・・・画像メモ
リ、13・・・・・ヒストグラム抽出部、14・・・・
・表構造抽出部、15・・・・・・罫線属性認識部、1
6・・・・・・文字パターン辞書、17 ・・・・文字
認識部。 代理人の氏名 弁理士 小鍜治 明 ほか2名第 図 第 図

Claims (3)

    【特許請求の範囲】
  1. (1)罫線位置、線種、線幅、及びセル内の文字を認識
    する手段を含む表認識装置。
  2. (2)罫線を抽出する表構造抽出部と、表を構成する罫
    線の線種、線幅を認識する罫線属性認識部と、文字認識
    部とを含んで成り、罫線位置、線種、及び文字を認識す
    るように配してなる表認識装置。
  3. (3)罫線属性認識部は罫線があると考えられる部分に
    小矩形を設定しその小矩形の縦及び横方向のヒストグラ
    ムを取る手段、線の長さ方向のヒストグラムの中心点を
    求め罫線の位置とする手段、線の長さ方向と垂直方向の
    ヒストグラムにおいてレベルが零の部分とそうでない部
    分の分布から線種を判別する手段、線の長さ方向に垂直
    な方向のヒストグラムのレベルが零でない部分の高さの
    平均から線幅を求める手段を備えてなる請求項(2)記
    載の表認識装置。
JP2244298A 1990-09-14 1990-09-14 表認識装置 Pending JPH04123282A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2244298A JPH04123282A (ja) 1990-09-14 1990-09-14 表認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2244298A JPH04123282A (ja) 1990-09-14 1990-09-14 表認識装置

Publications (1)

Publication Number Publication Date
JPH04123282A true JPH04123282A (ja) 1992-04-23

Family

ID=17116659

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2244298A Pending JPH04123282A (ja) 1990-09-14 1990-09-14 表認識装置

Country Status (1)

Country Link
JP (1) JPH04123282A (ja)

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP3411472B2 (ja) パターン抽出装置
US6810147B2 (en) Document image processing apparatus for processing line portions manually input to document image, method therefor, and computer readable recording medium recorded with document image processing program therefor
JPH04123282A (ja) 表認識装置
JP3052438B2 (ja) 表認識装置
US7103220B2 (en) Image processing apparatus, method and program, and storage medium
JP3060248B2 (ja) 表認識装置
JP2957729B2 (ja) 行方向判定装置
JP2788506B2 (ja) 文字認識装置
JP2003317107A (ja) 罫線抽出方法及び装置
JP3086277B2 (ja) 文書画像処理装置
JPH04360294A (ja) 表認識装置および表認識方法
JP3502130B2 (ja) 表認識装置および表認識方法
JPH0628520A (ja) 文字認識装置
JPH0728934A (ja) 文書画像処理装置
JPH0573721A (ja) 表認識装置
JPH0573718A (ja) 領域属性識別方式
JP2957707B2 (ja) 行方向判定装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH08185475A (ja) 画像認識装置
JPH03217993A (ja) 文字サイズ認識装置
JPH06195505A (ja) 表認識装置
JPH05108882A (ja) 文字認識装置
JPH1055408A (ja) 接触パターンを分離するパターン分離装置および方法