JPS61267177A - 文書画像追加情報の蓄積方法 - Google Patents

文書画像追加情報の蓄積方法

Info

Publication number
JPS61267177A
JPS61267177A JP60108122A JP10812285A JPS61267177A JP S61267177 A JPS61267177 A JP S61267177A JP 60108122 A JP60108122 A JP 60108122A JP 10812285 A JP10812285 A JP 10812285A JP S61267177 A JPS61267177 A JP S61267177A
Authority
JP
Japan
Prior art keywords
image
memo
information
document
retrieving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60108122A
Other languages
English (en)
Other versions
JPH0750483B2 (ja
Inventor
Haruo Takeda
晴夫 武田
Kuniaki Tabata
邦晃 田畑
Tetsuo Machida
哲夫 町田
Masatoshi Hino
樋野 匡利
Kunihiro Nomura
訓弘 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60108122A priority Critical patent/JPH0750483B2/ja
Priority to US06/863,242 priority patent/US4748678A/en
Priority to DE3650554T priority patent/DE3650554T2/de
Priority to EP86106907A priority patent/EP0202671B1/en
Publication of JPS61267177A publication Critical patent/JPS61267177A/ja
Publication of JPH0750483B2 publication Critical patent/JPH0750483B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32106Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
    • H04N1/32112Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file in a separate computer file, document page or paper sheet, e.g. a fax cover sheet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3245Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of image modifying data, e.g. handwritten addenda, highlights or augmented reality information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3274Storage or retrieval of prestored additional information
    • H04N2201/3277The additional information being stored in the same storage device as the image data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Library & Information Science (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は情報検索方式に係り、特に文書画像情報の検索
方式に関する。
〔発明の背景〕
近年、大容量光ディスクを利用した文書画像ファイル・
システム(電子ファイル)が、新しい文書管理の手段と
して注目を集めている。光ディスクは容量が大きく、画
像データの記録が可能なので、帳票、設計図、契約書そ
の他の文書画像情報を蓄積することができる。しかし、
検索方法としては、文書名9分類コード、キーワードな
どの指定による、比較的簡単なものが開発されているに
すぎない(例えば、「日経コンピュータJ 1983゜
12.26.第62〜64頁参照)。
このため検索者が上記文書名等の情報を忘却したり曖昧
である場合には、文書画像データ自身をファイルから1
件単位に読出し表示して、目的のデータを探索せざるを
得ないので、検索時間が膨大となる問題があった。
〔発明の目的〕
本発明の目的は、文書名やキーワード等のあらかじめ文
書に付された情報が曖昧な場合に、2次的に文書に付し
た手書メモ等をもとに文書を検索する手段を提供し、検
索の柔軟性の付与、操作性の向上、検索処理の高速化等
を実現する文書画像情報の検索方式を提供することにあ
る。
〔発明の概要〕
本発明では手書メモ情報を文書検索時に利用するために
、まず原文書画像データとは別に原文書画像に手書メモ
情報を追記したメモ付文書画像データを入力し、原文書
画像データとの位置合わせを行って照合し不一致部分と
して手書メモ情報のみを抽出する0次にメモの種類を判
別し、その種類に応じて各種の処理を施して検索用の2
次情報として登録する。この2次情報をその画像データ
のキーワードまたは特徴として利用するものでこれによ
り該画像データの検索時には上記のメモの種類に応じて
、種々の検索手段を利用することを可能とする。
〔発明の実施例〕
以下、本発明を実施例により詳細に説明する。
第1図は本発明が適用された文書画像情報検索システム
の一例を示したもので1図中、1はマイクロプロセッサ
(CPU)、2は主メモリ(MM)。
3はキーボード(KB)、4はイメージ・スキャナ(I
S)、5はファイル装置(FD)、6はビットマツプ・
メモリ(BM)、7はイメージ・プロセッサ(IP)、
8はティスプレィ制御部(Dc)9はCRTディスプレ
イ、10はプリンタ(PR)である。
まずメモ付文書画像データ(以下メモ付画像と略す)か
らメモ部分のみを抽出する処理について説明する。第2
図はメモ抽出過程を模式的に描いた図である。まず原画
像の原紙11をIS4から8M6に取込み、原画像12
を得る。次に後述の位置合わせのための矩形外枠を、C
PUIの指令によりIP7が原画像12上に書込み、枠
付画像13を作成し、PRIO上に枠付画像の原紙14
として出力する0次に原紙14に紙面上でメモ(−例と
して下線)を追記してメモ付画像の原紙15を作成し、
さらにこれをIS4から8M6の枠付画像13が格納さ
れているのとは別の領域に取込みメモ付画像16を得る
。通常のイメージスキャナでは1紙面を傾きなく画像化
することは困難であり、またPRIOとIS4は一般に
は画素密度が異なるため、メモ付画像16を、傾きと大
きさを枠付画像13と合致する様たとえば矩形枠を利用
して正規化して、正規化画像17を得る。
次に枠付画像13と正規化画像17のマツチングを行い
、不一致部分のみを残した差分画像18を得る。差分画
像には、メモ情報以外に・枠付画像13をPRIOおよ
びIS4を通したことによる原画像自身の劣化情報も含
まれるため、最後に差分画像18から劣化情報を除去し
、メモ情報のみを残してメモ両像19を得る0以上の処
理は、全体の制御をCPUIが行い、個々の画像処理に
ついては、CPUIの指令によりIP7が行う、以下I
P7による各画像処理方法について詳細に説明する。
まず原画像12から枠付画像13を作成する処理につい
て説明する。線を8MS上に描くには、線の要素パター
ンを順次上下または左右方向に定義していけばよい、こ
こではさらに後述の正規化処理のために、外枠の外側部
分に存在する黒画素を白画素に変換する処理も行なう。
次にメモ付画像16から正規化画像17を作成する正規
化処理について説明する。本正規化処理は外枠を構成す
る4本の直線を検出して外枠の傾きと大きさを求めるス
テップと、この傾きと太きさを枠付画像13のそれと一
致させる様にメモ付画像全体を座標変換するステップか
ら構成する。
まず外枠の傾きと大きさを求めるステップで、外枠を構
成する直線を求める処理について説明する。
直線を求めるアルゴリズムは従来から種々提案されてい
るが、ここではHough変換の手法を用いた方法につ
いて説明する。以下−例として外枠の左側の縦線を求め
る処理について説明する。第3図は左側の縦線を求める
プログラムのフローチャートの一例である。図中、γ、
θが求める直線を表わし、γはその原点からの距離、θ
はその傾きを表わす。本アルゴリズムの概要は、まず処
理22〜24で直線上の1点の候補を探索し、次に処理
25二29でこの点を通るすべての直線として。
γ=xsinθ+y cosθにおけるγとθの組を求
め、処理22〜31を繰返すことにより、頻度が最大と
なるγとθが、最も多くの直線上の候補点を通る直線の
パラメータとして求めるものである。以下同様にして他
の直線の方程式を求める。さらに4本の直線の方程式の
4つの交点として、外枠の左上、右上、左下、右下の各
角点を求め、それぞれ左上角点を原点とする新しい座標
系に関して(0,O) 、 (M、、 Ni) 、 (
M、、 N、) 、 (M、+M2. N、+N、) 
 とする。次にメモ付画像16全体を変換するステップ
について説明する。枠付画像13の4つの角点を(0,
O)、(m、O)。
(0,n)、(m、n)とすると、この変換はと表わす
ことができる。ここに(xt y)はメモ付画像16の
画素の座標、(X、Y)は正規化画像17の(x、y)
に対応する画素の座標である。
この式による変換は、実際には上式と同値な式によって
(xpy)の格子点に対応する(xey)を求め、一般
には(xt y)は画素の存在する格子点にはならない
ので周囲の格子点の論理和等で補間して濃度を求めて、
これを(x、y)の濃度と量ることによって実現する1
以上は位置合わせ用の記号として4本の線分から構成す
る外枠を利用する実施例について説明したが、これ以外
にも、4隅に特徴点を付してマツチングをとる方法、記
号は特に付加せず原文書の特徴部分によりマツチングを
とる方法等が考えられる。また以上はPRloとIS4
の画素密度の差異による歪みは、線形であることを前提
としたが、たとえばIS4がラインセンサをモータで駆
動するタイプの装置であると、駆動速度が一定ではない
ことにより非線形の歪みが生じる場合がある。この場合
には、例えば第7図にように複数の平行線により間隔の
変化を検出し、これをもとに小領域単位に、上で述べた
のと同様の変換を施すことによって正規化画像を得るこ
とができる。
次に枠付画像13と正規化画像17から差分画像18を
作成する処理について説明する。差分画像18は、枠付
画像13と正規化画像17を画素単位に比較して不一致
部分を黒、一致部分を白とすることによって簡単に作成
することもできるが、ここではさらにメモ情報とこれ以
外の雑音とを切分けるために、以下の方法で作成する。
枠付画像13をf (xt y)を正規化画像17をg
(xyy)とする、ここにf Cxe y) y g 
(XI y)は点(xey)における画素の濃度を表わ
し、ここでは2値画像を仮定し、黒画素の場合は1.白
画素の場合はOとする。まず、枠付画像13の黒領域を
膨張する。膨張は、 f’ Cxey)=fCx*y)f(x+1yy)V7
(x、y+1)V7(x+1.y+1)をすべてのX1
3’について行うことにより実現する。次に正規化画像
17が黒画素の領域で膨張した枠付画像が白黒画素の領
域を求める。この処理は、 h(x、y)=D’ (x、y)7g(x、y))△f
’cxty’)をすべてのx、yについて行うことによ
り実現する。この方法が前述の不一致部から差分画像を
得る単純な方法に比べて秀れている点は、まず前者の膨
張の処理により、メモ情報以外の情報で。
PRIOとIS4を介したことにより本来の領域からハ
ミ出した部分を取除くことができ、後者の処理により逆
にPRIOとIS4を介したことにより本来の領域が欠
落した部分を差分画像として検出しないようにすること
ができる点である。なおこの例では膨張処理は近傍4画
素の論理和をとったが、これをさらに9画素、16画素
9等と拡張することも同様にして可能である。また対象
とするメモの種類によっては、膨張の処理を省略するこ
とも可能である。
最後に差分画像18からメモ画像19を作成する処理に
ついて説明する。本処理は雑音付のメモ情報から雑音を
除去する処理である。ここでは、メモ情報に比べて雑音
は線巾が/11さいと仮定して、収縮の変換により雑音
を除去し、膨張の変換によりメモ情報の線巾を復元する
。差分画像18をh (xt y)とする。まず差分画
像18の黒領域を収縮する6収縮は。
h’ (xey)=h(xey)△h (:c + 1
 e y )△h(x、y+1)△h(x+l、y+1
)をすべての!+’jについて行うことにより実現する
。次に収縮画像h’ Cxt y)の黒領域を膨張する
。膨張は前述の! ’ (x * y)と同様にして行
う。
なお雑音の線巾の大きさにより、上側のように近傍4画
素の論理和、または論理積ではなく、9画素、16画素
等と拡張することもできる。また差分画像を求める処理
において、枠付画像13の膨張処理により稀にメモ情報
に途切れ等の欠陥が生じる場合があるが、これを本収縮
膨張処理に先立って、膨張およびその後に収縮変換を行
うことによるこの欠陥を補間することもできる。
以上でメモ付画像からメモ部分のみを抽出する処理の説
明を終り、次に抽出したメモ情報の種類を判別して、そ
の種類に応じて検索用2次情報を作成する処理について
説明する。第4図はメモ分類過程の一例を模式的に描い
た図である。図中、(a)はメモ付画像16.(b)は
メモ画像19゜(c)は(b)で黒画素が連続した領域
単位に切出して、外接矩形を求めた領域分割画像、(d
)はメモ分類の結果である。ここでは、簡単のためメモ
の種類として、下線、囲み、および、それ以外の注釈の
3種類を考えて、これらのメモとメモではないが前記の
差分画像18からメモ画像19を得るときに除去しきれ
なかった雑音の分類方法について説明する。
まずメモ画像(b)から領域分割画像(c)を作成する
処理について説明する。ここでは黒画素が連続した領域
の単位に画像を分割し、各々の領域にメモ翫を付する。
連続した領域の切出しは、従来種々のアルゴリズムが提
案されているが、例えば電子通信学会編の長尾真氏によ
るパターン情報処理(1983年)と題する文献の84
ページにあるラベル付はアルゴリズムによっても実現で
きる。
ここでそれぞれの領域に付されたラベル1〜6をメモ島
として表(d)の欄40に対応させる。このとき領域の
最上端、下端の座標より領域の縦長さを計算して表(d
)の1141に、最左右、右端の座標より横長さを計算
して4142に書込む。
次にメモの分類方法について説明する。前記の領域分割
により求めた各領域の位置情報をもとに、メモ分類に必
要な各種のパラメータを計算して。
この判別を行う。ここでは−例として943〜45のパ
ラメータを計算する。欄43は領域の横長さ/縦長さで
定義され、領域の縦横比を表すパラメータである。下線
はこの値が他に比べて大となるので下線とこれ以外のメ
モを分離できる。欄44は領域の横長さ十縦長さで定義
され、領域の大きさを表すパラメータである。雑音はこ
の値が他に比べて小となるので、雑音とメモを分離でき
る。5145は領域に対応する位置の原画像12の黒画
素数の領域面積に対する割合である。囲みは対応する領
域に原画像が存在するので大きな値をもち、これ以外の
メモでは小さな値となるので、囲みとそれ以外のメモを
分離できる。第5図に以上のパラメータを用いてメモを
分類するためのプログラムのフローチャートの一例を示
す。図中、θ、、〜θ45はそれぞれ欄43〜45のパ
ラメータの上記分離の閾値を表わす、なおここでは、メ
モとして下線、囲み、注釈の3種類のみ考えればよかっ
たが、メモの種類によって各種のパラメータが考えられ
、例えば面積、空間周波数の大小等、全く同じ考え方で
利用できる。
最後に上で求めた領域の種類に応じて検索用2次情報を
作成する処理の一例について説明する・まず下線は、重
要なキーワードの下に付した記号と想定して、その上方
の文字列を切出して検索用2次情報としてFD5に格納
する。上方の文字列は、下線領域の底辺を底辺とする矩
形上で、原画像12を横方向に投影することによって行
の切れ目を求めて最下行として検出する。囲みは図Nα
を表わす記号と想定して、領域内の数字を認識する。
認識は従来0CR1置で用いられてきた種々のアルゴリ
ズムを適用することが可能であるし、また簡単に、前述
の電子通信学会編の文献の98ページにあるパターンマ
ツチングの手法を用いてもよい。認識結果は1例えば既
に同一出願人が出願した文書画像情報の検索方式(特願
昭59−18327号)で述べたように、本文から図り
へのポインタと先にFD5に格納する。注釈は、前記の
領域分割アルゴリズムでは文字単位に切出されるため、
ここでは隣接する領域の統合を行う。統合はまず、注釈
領域を膨張し、重なりが生じた領域は同一の領域と見做
すことによって行い、結果は統合された領域を単位とし
てFD5に格納する。なお以上の説明では、たとえば下
線は切出し、囲みは認識と限定したが、こ熟を下線は認
識、囲みは切出し等定義することも勿論全く同様にして
可能である。
また図翫を認識する例について説明したが、参考文献の
勲を認識して、文献の末尾から対応する文献名を切出し
て登録/表示することも可能である。
さらに分類結果が、不正確な場合に備えて対話処理によ
る修正機能を設けることもできる。
以上で領索用2次情報を作成する処理の説明を終り、最
後にこれらの情報の検索処理での利用方法の一例につい
て説明する。第6図は検索処理の流れの一例を示す画面
フロー図である1図中50は通常の検索画面で、分類コ
ードを指定した結果である。このとき文書名またはその
他の番号の情報等が曖昧であるとき、下線部のみ表示の
指示を出すと、同図51のように文書単位に下線部のみ
が表示される。また図のみ表示、注釈のみ表示の指示に
より、同図52または53のように表示される。さらに
図Nαについては、認識されて本文との対応がついてい
るため、検索後に本文と図を対比着せて表示する等、前
記の既出願の検索方式のような利用が可能である。また
複数種類のメモを同時に一覧表等の形式で検索時に表示
することも勿論できる。
〔発明の効果〕
このように本発明によれば、文書名やキーワードや文書
の特徴等あらかじめ文書に付された情報を忘却したり、
曖昧になったりした場合にも、2次的に付加したメモ等
の情報により効率よく文書を検索できる。メモは文書の
一部分に過ぎないので、このような場合に、全文書を表
示して探索する方法に比べて、極めて短時間で、操作性
よく目的の文書を検索できる効果がある。
【図面の簡単な説明】
第1図は本発明が適用される情報検索システムの一例を
示すブロックダイアグラム、第2図は本発明におけるメ
モ抽出過程を示す処理の模式図、第3図は本発明による
線抽出処理のフローチャート、第4図は本発明によるメ
モ分類過程を示す処理の模式図、第5図は本発明による
メモ分類処理のフローチャート、第6図は本発明による
検索処理の画面のフローを示す図、第7図は本発明一実
施例の位置合せよう記号の説明図である・1・・・マイ
クロプロセッサ、2・・・主メモリ、3・・・キーボー
ド、4・・・イメージスキャナ、5・・・ファイル装置
、6・・・ビットマツプメモリ、7・・・イメージプロ
セッサ、8・・・ディスプレイ制御部、9・・・ディス
プレイ、10・・・プリンタ、12・・・原画像、19
・・・冨  4   図 <a−ン                 (b) 
                   (c)(d) 洒 6  呂 4ft−v舎1?7丸用 J乙号

Claims (1)

    【特許請求の範囲】
  1. 文書画像情報を格納するファイル装置と、前記ファイル
    装置に格納された情報を検索する装置と少なくとも1つ
    のディスプレイとを備えた情報検索装置において、原文
    書と原文書に2次的な情報を加えた文書を比較照合する
    ことにより該2次的な情報のみを抽出する手段を設けた
    ことを特徴とする文書画像情報の検索方式。
JP60108122A 1985-05-22 1985-05-22 文書画像追加情報の蓄積方法 Expired - Lifetime JPH0750483B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP60108122A JPH0750483B2 (ja) 1985-05-22 1985-05-22 文書画像追加情報の蓄積方法
US06/863,242 US4748678A (en) 1985-05-22 1986-05-14 Method of storing and retrieving image data
DE3650554T DE3650554T2 (de) 1985-05-22 1986-05-21 Speicherungs- und Wiederauffindungsverfahren für Bilddaten
EP86106907A EP0202671B1 (en) 1985-05-22 1986-05-21 Method of storing and retrieving image data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60108122A JPH0750483B2 (ja) 1985-05-22 1985-05-22 文書画像追加情報の蓄積方法

Publications (2)

Publication Number Publication Date
JPS61267177A true JPS61267177A (ja) 1986-11-26
JPH0750483B2 JPH0750483B2 (ja) 1995-05-31

Family

ID=14476482

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60108122A Expired - Lifetime JPH0750483B2 (ja) 1985-05-22 1985-05-22 文書画像追加情報の蓄積方法

Country Status (4)

Country Link
US (1) US4748678A (ja)
EP (1) EP0202671B1 (ja)
JP (1) JPH0750483B2 (ja)
DE (1) DE3650554T2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007172336A (ja) * 2005-12-22 2007-07-05 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2011154713A (ja) * 2011-04-06 2011-08-11 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム

Families Citing this family (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2047821A1 (en) * 1990-09-17 1992-03-18 Wayne A. Buchar Electronic filing system recognizing highlighted original to establish classification and retrieval
US5265242A (en) * 1985-08-23 1993-11-23 Hiromichi Fujisawa Document retrieval system for displaying document image data with inputted bibliographic items and character string selected from multiple character candidates
US5172245A (en) * 1986-10-17 1992-12-15 Sharp Kabushiki Kaisha Electronic information retrieval apparatus for image information using primary and secondary menus
US4907283A (en) * 1987-03-13 1990-03-06 Canon Kabushiki Kaisha Image processing apparatus
US4803643A (en) * 1987-08-10 1989-02-07 Oclc Online Computer Library Center Incorporated System and method for creating memory-retained, formatted pages of text, tabulation, and graphic data
US4985930A (en) * 1987-09-24 1991-01-15 Hitachi, Ltd. Image data filing system and image data correcting method
JPS6482286A (en) * 1987-09-25 1989-03-28 Toshiba Corp Image inclination detector
JP3020500B2 (ja) * 1988-01-29 2000-03-15 株式会社日立製作所 メモ情報を持つデータベースシステム及びメモ情報の管理方法
JPH01261745A (ja) * 1988-04-08 1989-10-18 Internatl Business Mach Corp <Ibm> データ・ベース・レコードのトランザクシヨンの回復方法
US4901365A (en) * 1988-12-19 1990-02-13 Ncr Corporation Method of searching binary images to find search regions in which straight lines may be found
US5140650A (en) * 1989-02-02 1992-08-18 International Business Machines Corporation Computer-implemented method for automatic extraction of data from printed forms
EP0382541B1 (en) * 1989-02-09 1996-09-25 Canon Kabushiki Kaisha Electronic filing apparatus and method of retrieving image information
US5280574A (en) * 1989-05-26 1994-01-18 Hitachi, Ltd. Text document management method adapted for generating plural text documents derived from the same original text document
JP2940676B2 (ja) * 1989-06-16 1999-08-25 株式会社リコー ファクシミリ装置
IL91220A (en) * 1989-08-04 1995-03-30 Ibm Israel Compression of information
US5093911A (en) * 1989-09-14 1992-03-03 International Business Machines Corporation Storage and retrieval system
DE59010737D1 (de) * 1989-10-24 1997-08-21 Horst Froesel Verfahren zur mindestens teilweisen Umsetzung von Bilddaten in Text mit Vorbereitung für nachfolgende Speicherung oder Weiterverarbeitung
US5191525A (en) * 1990-01-16 1993-03-02 Digital Image Systems, Corporation System and method for extraction of data from documents for subsequent processing
GB9003744D0 (en) * 1990-02-20 1990-04-18 Eden Design Group Ltd Tamper proof handwritten information recording device and electronic mail network
US5146552A (en) * 1990-02-28 1992-09-08 International Business Machines Corporation Method for associating annotation with electronically published material
JPH0424768A (ja) * 1990-05-15 1992-01-28 Ricoh Co Ltd 画像ファイリング装置の登録・検索方法
US5109439A (en) * 1990-06-12 1992-04-28 Horst Froessl Mass document storage and retrieval system
US5444840A (en) * 1990-06-12 1995-08-22 Froessl; Horst Multiple image font processing
US5396588A (en) * 1990-07-03 1995-03-07 Froessl; Horst Data processing using digitized images
JP3026585B2 (ja) * 1990-07-12 2000-03-27 旭光学工業株式会社 静止画再生装置
US5546572A (en) * 1991-08-28 1996-08-13 Hitachi, Ltd. Method for retrieving database of image information
US5926565A (en) * 1991-10-28 1999-07-20 Froessl; Horst Computer method for processing records with images and multiple fonts
CA2078423C (en) * 1991-11-19 1997-01-14 Per-Kristian Halvorsen Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
US5568566A (en) * 1991-11-25 1996-10-22 Kabushiki Kaisha Toshiba Drawing processing apparatus
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US5251273A (en) * 1992-04-15 1993-10-05 International Business Machines Corporation Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
US5305396A (en) * 1992-04-17 1994-04-19 International Business Machines Corporation Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
JPH064642A (ja) * 1992-04-20 1994-01-14 Hitachi Ltd イメージデータ管理システム
US5235654A (en) * 1992-04-30 1993-08-10 International Business Machines Corporation Advanced data capture architecture data processing system and method for scanned images of document forms
US5555388A (en) * 1992-08-20 1996-09-10 Borland International, Inc. Multi-user system and methods providing improved file management by reading
JP3093493B2 (ja) * 1992-11-16 2000-10-03 キヤノン株式会社 画像記憶検索装置
JP3055126B2 (ja) * 1993-03-25 2000-06-26 キヤノン株式会社 画像情報処理装置の制御方法
EP0625757B1 (en) * 1993-05-07 2000-08-23 Canon Kabushiki Kaisha Selective document retrieval method and system
US5526520A (en) * 1993-09-21 1996-06-11 Krause; Gary M. Method to organize and manipulate blueprint documents using hypermedia links from a primary document to recall related secondary documents
US5428694A (en) * 1993-10-14 1995-06-27 International Business Machines Corporation Data processing system and method for forms definition, recognition and verification of scanned images of document forms
US5555325A (en) * 1993-10-22 1996-09-10 Lockheed Martin Federal Systems, Inc. Data capture variable priority method and system for managing varying processing capacities
US5394487A (en) * 1993-10-27 1995-02-28 International Business Machines Corporation Forms recognition management system and method
US5521991A (en) * 1993-10-29 1996-05-28 International Business Machines Corporation Method and system for fast forms recognition of document form images
DE69516751T2 (de) * 1994-04-15 2000-10-05 Canon Kk Bildvorverarbeitung für Zeichenerkennungsanlage
US5664183A (en) * 1994-04-19 1997-09-02 International Business Machines Corporation Application of groupware to ISO 9000 registration via facilitated work sessions
US5502637A (en) * 1994-06-15 1996-03-26 Thomson Shared Services, Inc. Investment research delivery system
JPH09270902A (ja) * 1996-01-31 1997-10-14 Ricoh Co Ltd 画像ファイリング方法および画像ファイリング装置
US5832474A (en) * 1996-02-26 1998-11-03 Matsushita Electric Industrial Co., Ltd. Document search and retrieval system with partial match searching of user-drawn annotations
US6910184B1 (en) * 1997-07-25 2005-06-21 Ricoh Company, Ltd. Document information management system
US5905991A (en) * 1997-08-21 1999-05-18 Reynolds; Mark L System and method providing navigation between documents by creating associations based on bridges between combinations of document elements and software
EP0977129A1 (en) * 1998-07-30 2000-02-02 Infopoint Systems Research &amp; Development Ltd. Development of multi-media systems
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
JP3708768B2 (ja) * 1999-11-22 2005-10-19 シャープ株式会社 読取り装置及びデータ処理システム
US7042594B1 (en) 2000-03-07 2006-05-09 Hewlett-Packard Development Company, L.P. System and method for saving handwriting as an annotation in a scanned document
GB2362056B (en) * 2001-02-09 2004-05-26 Hewlett Packard Co System and method for saving handwriting as an annotation in a scanned document
DE10105951B4 (de) * 2000-03-07 2006-04-06 Hewlett-Packard Development Co., L.P., Houston System und Verfahren zum Speichern einer Handschrift als eine Anmerkung in einem gescanten Dokument
EP1182503A1 (en) * 2000-08-17 2002-02-27 Eastman Kodak Company A kit for use in organizing images
US6909805B2 (en) * 2001-01-31 2005-06-21 Matsushita Electric Industrial Co., Ltd. Detecting and utilizing add-on information from a scanned document image
JP2002278984A (ja) * 2001-03-22 2002-09-27 Fujitsu Ltd 文書管理装置
JP2003115039A (ja) * 2001-07-11 2003-04-18 Ricoh Co Ltd 文書ファイリング装置、文書ファイリング方法、プログラムおよび記憶媒体
JP4154156B2 (ja) * 2002-02-08 2008-09-24 ソニーマニュファクチュアリングシステムズ株式会社 欠陥分類検査装置
US20030193582A1 (en) * 2002-03-29 2003-10-16 Fuji Photo Film Co., Ltd. Method for storing an image, method and system for retrieving a registered image and method for performing image processing on a registered image
JP4251629B2 (ja) * 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7391917B2 (en) * 2003-02-13 2008-06-24 Canon Kabushiki Kaisha Image processing method
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
US20060136629A1 (en) * 2004-08-18 2006-06-22 King Martin T Scanner having connected and unconnected operational behaviors
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
WO2008028674A2 (en) * 2006-09-08 2008-03-13 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US7668404B2 (en) * 2004-06-30 2010-02-23 Lexmark International, Inc. Method and system of deskewing an image using monochrome conversion to separate foreground from background
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
US8396331B2 (en) * 2007-02-26 2013-03-12 Microsoft Corporation Generating a multi-use vocabulary based on image data
CN102369724B (zh) 2009-02-18 2016-05-04 谷歌公司 自动捕获信息,例如使用文档感知设备捕获信息
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
WO2010105245A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Automatically providing content associated with captured information, such as information captured in real-time
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
US8996350B1 (en) 2011-11-02 2015-03-31 Dub Software Group, Inc. System and method for automatic document management
US8687886B2 (en) 2011-12-29 2014-04-01 Konica Minolta Laboratory U.S.A., Inc. Method and apparatus for document image indexing and retrieval using multi-level document image structure and local features
JP6578858B2 (ja) * 2015-09-30 2019-09-25 富士ゼロックス株式会社 情報処理装置及びプログラム
JP6868186B2 (ja) * 2017-03-24 2021-05-12 富士フイルムビジネスイノベーション株式会社 検索情報生成装置、画像処理装置、検索情報生成プログラム
TWI681661B (zh) * 2018-03-26 2020-01-01 虹光精密工業股份有限公司 影像輸出裝置、多功能事務機、影像處理模組以及相關的影像輸出方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59135576A (ja) * 1983-01-21 1984-08-03 Nippon Telegr & Teleph Corp <Ntt> ドキユメント情報登録検索装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4300123A (en) * 1979-01-02 1981-11-10 Westinghouse Electric Corp. Optical reading system
US4408181A (en) * 1979-04-10 1983-10-04 Tokyo Shibaura Denki Kabushiki Kaisha Document data filing/retrieval system
EP0027594B1 (de) * 1979-10-23 1984-05-09 Scantron GmbH &amp; Co. Elektronische Lesegeräte KG Verfahren und Vorrichtung zum Identifizieren von Gegenständen
DE3175959D1 (en) * 1980-10-31 1987-04-09 Toshiba Kk Document information filing system with a single display device
US4538182A (en) * 1981-05-11 1985-08-27 Canon Kabushiki Kaisha Image processing apparatus
JPS59128661A (ja) * 1983-01-14 1984-07-24 Fuji Xerox Co Ltd 画像フアイル装置
JPS59183458A (ja) * 1983-04-01 1984-10-18 Hitachi Ltd 画像検索方式
US4553261A (en) * 1983-05-31 1985-11-12 Horst Froessl Document and data handling and retrieval system
JPS603056A (ja) * 1983-06-21 1985-01-09 Toshiba Corp 情報整理装置
JPS6077271A (ja) * 1983-10-03 1985-05-01 Fuji Xerox Co Ltd 画像フアイル装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59135576A (ja) * 1983-01-21 1984-08-03 Nippon Telegr & Teleph Corp <Ntt> ドキユメント情報登録検索装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007172336A (ja) * 2005-12-22 2007-07-05 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム
JP2011154713A (ja) * 2011-04-06 2011-08-11 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法、並びにコンピュータ・プログラム

Also Published As

Publication number Publication date
EP0202671A2 (en) 1986-11-26
DE3650554T2 (de) 1997-02-20
US4748678A (en) 1988-05-31
DE3650554D1 (de) 1996-09-19
JPH0750483B2 (ja) 1995-05-31
EP0202671A3 (en) 1989-10-11
EP0202671B1 (en) 1996-08-14

Similar Documents

Publication Publication Date Title
JPS61267177A (ja) 文書画像追加情報の蓄積方法
JP5659563B2 (ja) 識別方法、識別装置およびコンピュータプログラム
JP3469345B2 (ja) 画像のファイリング装置及びファイリング方法
JP5663866B2 (ja) 情報処理装置及び情報処理プログラム
KR100412317B1 (ko) 문자인식/수정방법및장치
Khurshid et al. Word spotting in historical printed documents using shape and sequence comparisons
JPH11161737A (ja) 手書きワードの認識方法及び装置
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JPH1011531A (ja) 帳票読取装置
CN114170423A (zh) 一种图像文档版面识别方法、装置及其系统
JP2008108114A (ja) 文書処理装置および文書処理方法
CN113806472B (zh) 一种对文字图片和图像型扫描件实现全文检索的方法及设备
JP4518212B2 (ja) 画像処理装置及びプログラム
Diem et al. Semi-automated document image clustering and retrieval
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3898645B2 (ja) 帳票書式編集装置および帳票書式編集プログラム
JP4517822B2 (ja) 画像処理装置及びプログラム
Syeda-Mahmood Indexing of handwritten document images
Yamashita et al. A document recognition system and its applications
CN112287763A (zh) 图像处理方法、装置、设备及介质
JP3817442B2 (ja) 画像認識装置、画像認識方法、及び画像認識方法を実現するプログラムとこのプログラムの記録媒体
Yin et al. Automating data extraction and identification on Chinese road maps
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JPH0757040A (ja) Ocr付きファイリング装置
JP3409993B2 (ja) 接触パターンを分離するパターン分離装置および方法