JPH04172574A - グラフ認識装置 - Google Patents

グラフ認識装置

Info

Publication number
JPH04172574A
JPH04172574A JP2299962A JP29996290A JPH04172574A JP H04172574 A JPH04172574 A JP H04172574A JP 2299962 A JP2299962 A JP 2299962A JP 29996290 A JP29996290 A JP 29996290A JP H04172574 A JPH04172574 A JP H04172574A
Authority
JP
Japan
Prior art keywords
graph
data
item
character
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2299962A
Other languages
English (en)
Inventor
Tatatomi Aso
忠臣 麻生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2299962A priority Critical patent/JPH04172574A/ja
Publication of JPH04172574A publication Critical patent/JPH04172574A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、デスクトップパブリッシング(これよりDT
Pと略す)における表計算アプリケーションの入力手段
として、また、ファクシミリなどの画像電送装置や、電
子ファイリングシステムなどにおける画像圧縮装置とし
て利用する事が出来るグラフ認識装置に関するものであ
る。
(従来の技術) 最近の技術の進歩により、DTP、ファクシミリ、電子
ファイリングシステムなど画像情報の重要性がさらに増
加してくるようになってきた。画像データの種類として
は写真、イラスト、図面、グラフ等種々のものが多く存
在するが、それらを上記装置に入力する際には、画像情
報の圧縮を行なうことが多い。画像情報圧縮の方法とし
ては、次の2種類の方法によって圧縮が行われていた。
(1)  ドツトデータをMH符号、MR符号。
MMR符号などに変換することによって画像圧縮する。
(2)図面を直線、円弧などのプリミティブで表現する
ことによって圧縮を行う。
これまでグラフ画像に関しては(1)のドットデ−夕と
しての圧縮の方法が取られていた。
(発明が解決しようとする課題) 上記従来例では、グラフを単なる画像データとして圧縮
を行っていたので、高い圧縮効果を得ることが困雛であ
り、グラフのもっている内容については全く認識してい
ないので読み取ったグラフデータを表計算ソフトやWP
(ワードプロセッサ)で見るなど、データの再加工が行
えなかった。
本発明の目的は、従来の欠点を解消し、グラフを構成し
ている各項目名とその値を記憶し、大幅な情報圧縮が可
能になり、認識されたグラフデータを表計算データに変
更することによって、高速で操作性のよいグラフ認識装
置を提供することである。
(課題を解決するための手段) 本発明のグラフ認識装置は、グラフ画像から図形と文字
を分離、認識し、文字データからその項目およびそれに
対する量(または割合)を得ることによってグラフの認
識を行うものである。
(作 用) グラフの意味を認識することにより、グラフデータとし
て、グラフの種類、項目、値だけを記憶するだけでよい
ので高い圧縮率が得られる。また、認識結果を利用して
表への変換などグラフデータの2次利用が可能となる。
(実施例) 第1図は棒グラフの例であり、第2図は円グラフの例で
ある。
第3図は本発明の構成図の例である。lはグラフ画像を
電気信号に変換する光電変換部、2は変換された結果を
格納する画像記憶部、3は画像データの中から文字部と
図形部とを分離する文字図形分離部、4はそれぞれ分離
された文字を認識する文字認識部、5は図形を認識する
図形認識部、6は認識された文字、図形からグラフの項
目を抽呂するグラフ認識部、7はその認識された結果を
保存するグラフ書式格納部である。
これより本発明の詳細な説明を第3図を使用して行う。
まず、光電変換部1でグラフ画像をスキャナ等の光電変
換装置により電気信号に変換し、画像記憶部2に蓄えら
れる。
蓄えられた画像データは文字図形分離部3によって文字
1(1(グラフの項目と数値が表示されている)と図形
部(グラフの外形が書かれている)とに分離される。文
字と図形との分離には図形候補、および文字候補を囲む
外接矩形により、判別を行う。すなわち、外接矩形の面
積がある一定のしきい値より大きければ図形と見なし、
小さければ文字であるとする。第4図に文字と図形の例
を示す。
以上のようにして分離された文字は文字認識部4によっ
て文字に変換され、図形は図形認識部5によってグラフ
を構成する円、直線、長方形などに変換される。
文字認識の方向については、これまで多くの研究が有り
、どの方法も本発明に利用可能であり、図形認識技術に
おいても円や直線の認識についてその手法は確立してい
る。
グラフを構成する文字、図形の認識を行ったのち、グラ
フ認識部6により、文字、図形の認識の結果からグラフ
の特徴を使用して項目とそれに対応する値を抽呂する。
その抽出の方法について説明する。
第5図に示すように棒グラフは通常、縦軸11、横軸1
2、接部13、項目部14、数値部15から構成されて
いる。また。項目部14は横軸12の下にかかれており
、対応する各接部13の真下に位置する。また、各項目
の値を表す数値部15は接部13の真上に位置する。
第6図に示すように円グラフは数値部21、項目部22
、円23、区切り線24とから構成されている。
円グラフでは項目部22が円23の内部または円周の近
くに存在する。数値部21は項目部22の下部にかかれ
ているという特徴がある。
次に、棒グラフ認識の流れについて第7図のフローチャ
ートを使って各ステップについて説明する。
(1)ステップS1 認識された図形の中から円または長方形を探して、円が
存在すれば円グラフであるとしてステップ55−1へ進
む。
(2)ステップS2 長方形が横に連続して並んでいれば棒グラフであるとし
てステップ54−1へ進み、どちらにも合致しない場合
には処理可能な画像ではないとしてステップS3で終了
する。
◎棒グラフの認識 (1)ステップ54−1 棒グラフの縦軸、横軸を抽出する。縦軸、横軸は第3図
の図形認識部により、折れ線として認識されているもの
を探索する。
(2)ステップ54−2 接部を抽出する。接部は、図形認識部で長方形として認
識されているものが候補となる。
(3)ステップ54−3 項目を抽出する。項目は横軸の下でかつ接部の真下の座
標を探索する。
(4)ステップ54−4 抽出した項目に対応する数値を得る。数値は接部の真上
を探索する。
0円グラフの認識 (1)ステップ55−1 円グラフの外形円23を抽出する。
(2)ステップ55−2 円グラフ上で各項目を区切っている区切り線24を取り
出す。
(3)ステップ55−3 区切り線の間にある項目部22の文字列を取り出す。
(4)ステップ55−4 項目部22の下方にある数値部21を取り出す。
以上の方法により、グラフを認識したのち、グラフ書式
格納部7で項目とそれに対応する値とを保存する。第5
図の棒グラフの認識を行い、その結果が第8図のフォー
マットである。■はこのデータが棒グラフデータである
ことを示し、■はグラフデータの項目を、■は項目に対
する数値を表している。この例では項目と値とを単純に
並べる方法が取られている。
(発明の効果) 本発明によれば、グラフのイメージを記憶するのではな
く、グラフを構成している各項目名とその値を記憶する
ことによって大幅な情報圧縮が可能になる。また、認識
されたグラフデータを表計算データに変更することによ
って、高速で操作性のよい入力装置として使用すること
ができ、その実用上の効果は大である。
【図面の簡単な説明】
第1図は棒グラフの例を示す図、第2図は円グラフの例
を示す図、第3図は本発明の構成図、第4図(a)は図
形、(b)は文字を示す図、第5図は棒グラフを構成す
る各要素の説明をする図、第6図は円グラフを構成する
各要素の説明をする図、第7図は第3図のグラフ認識部
6を説明するためのフローチャート、第8図は第3図の
グラフ書式格納部7において変換される書式の例を示す
図である。 1・・・光電変換部、  2・・・画像記憶部、3・・
・文字図形分離部、 4・・・文字認識部、5・・・図
形認識部、 6・・・グラフ認識部、7・・・書式格納
部、 11・・・縦軸、 12・・・横軸、 13・・
・接部、 14.22・・・項目部、15、21・・・
数値部、 23・・・円、 24・・・区切り線。 特許出願人 松下電器産業株式会社 代 理 人   星  野  恒  司   )第1図 第2図 E社 第3図 第4図 (a) 図形             又子 弟5図 第6図 第7図

Claims (1)

    【特許請求の範囲】
  1. グラフ画像を電気信号に変換する光電変換部と、変換さ
    れた結果を格納する画像記憶部と、画像データの中から
    文字部と図形部とを分離する文字図形分離装置と、それ
    ぞれ分離された文字を認識する文字認識部と、図形を認
    識する図形認識部と、認識された文字、図形からグラフ
    の項目を抽出するグラフ認識部と、その認識された結果
    を保存するグラフ書式格納部からなるグラフ認識装置に
    おいて、前記画像データとしてのグラフから、前記グラ
    フの種類、グラフを構成する項目および割合等を認識し
    、文字および数値データに変換することにより、前記デ
    ータの圧縮および再利用が可能となることを特徴とする
    グラフ認識装置。
JP2299962A 1990-11-07 1990-11-07 グラフ認識装置 Pending JPH04172574A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2299962A JPH04172574A (ja) 1990-11-07 1990-11-07 グラフ認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2299962A JPH04172574A (ja) 1990-11-07 1990-11-07 グラフ認識装置

Publications (1)

Publication Number Publication Date
JPH04172574A true JPH04172574A (ja) 1992-06-19

Family

ID=17879074

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2299962A Pending JPH04172574A (ja) 1990-11-07 1990-11-07 グラフ認識装置

Country Status (1)

Country Link
JP (1) JPH04172574A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537522A (en) * 1994-01-31 1996-07-16 Fuji Xerox Co., Ltd. Document processing device for improving image quality
US5802535A (en) * 1995-02-03 1998-09-01 Fuji Xerox Co., Ltd. Document processing apparatus for editing and generating documents
JP2005326940A (ja) * 2004-05-12 2005-11-24 Fuji Xerox Co Ltd グラフ作成装置、プログラムおよび記録媒体
KR20170002710A (ko) * 2015-06-22 2017-01-09 한국표준과학연구원 스마트폰을 기반으로 하는 현장용 그래프 수치 분석 어플리케이션 및 그를 이용한 수치 분석방법
JP2022109974A (ja) * 2017-05-03 2022-07-28 株式会社半導体エネルギー研究所 蓄電装置、半導体装置、icチップ、電子機器

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537522A (en) * 1994-01-31 1996-07-16 Fuji Xerox Co., Ltd. Document processing device for improving image quality
US5802535A (en) * 1995-02-03 1998-09-01 Fuji Xerox Co., Ltd. Document processing apparatus for editing and generating documents
JP2005326940A (ja) * 2004-05-12 2005-11-24 Fuji Xerox Co Ltd グラフ作成装置、プログラムおよび記録媒体
JP4543741B2 (ja) * 2004-05-12 2010-09-15 富士ゼロックス株式会社 グラフ作成装置、プログラムおよび記録媒体
KR20170002710A (ko) * 2015-06-22 2017-01-09 한국표준과학연구원 스마트폰을 기반으로 하는 현장용 그래프 수치 분석 어플리케이션 및 그를 이용한 수치 분석방법
JP2022109974A (ja) * 2017-05-03 2022-07-28 株式会社半導体エネルギー研究所 蓄電装置、半導体装置、icチップ、電子機器
US11955612B2 (en) 2017-05-03 2024-04-09 Semiconductor Energy Laboratory Co., Ltd. Neural network, power storage system, vehicle, and electronic device

Similar Documents

Publication Publication Date Title
US5373566A (en) Neural network-based diacritical marker recognition system and method
US8428356B2 (en) Image processing device and image processing method for generating electronic document with a table line determination portion
US7460710B2 (en) Converting digital images containing text to token-based files for rendering
JP4271878B2 (ja) 映像中の文字検索方法及び装置並びに文字検索処理プログラム
Chester et al. Getting computers to see information graphics so users do not have to
JPH0314184A (ja) 文書画像再配置ファイリング装置
JPH0721310A (ja) 文書認識装置
CN113780276A (zh) 一种结合文本分类的文本检测和识别方法及系统
JPH04172574A (ja) グラフ認識装置
CN116597467B (zh) 一种图纸检测方法、系统、设备及存储介质
Agrawal et al. Text extraction from images
KR930002349B1 (ko) 압축영상의 문자열 분리방법
JPH04309186A (ja) 棒グラフ認識装置
CN113486881B (zh) 一种文本识别方法、装置、设备及介质
JP3604993B2 (ja) 画像符号化装置、画像符号化方法、画像復号装置、および画像復号方法
JPH08180068A (ja) 電子ファイリング装置
JP5159588B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JPH04324577A (ja) 折れ線グラフ認識装置
Vaxivière et al. Subsampling: A structural approach to technical document vectorization
JPH05108740A (ja) 帯グラフ認識装置
JPH0573685A (ja) レーダーチヤート認識装置
JPH05174150A (ja) 円グラフ認識装置
JPH05159062A (ja) 文書認識装置
KR100210492B1 (ko) 영문 접촉문자 분리기능을 개선한 문서 인식장치 및 그 방법
CN115439867A (zh) 一种基于多行文本的动态解析方法