JP2002319025A - スキャンした文書イメージの付加情報の検知及び利用方法 - Google Patents

スキャンした文書イメージの付加情報の検知及び利用方法

Info

Publication number
JP2002319025A
JP2002319025A JP2002021702A JP2002021702A JP2002319025A JP 2002319025 A JP2002319025 A JP 2002319025A JP 2002021702 A JP2002021702 A JP 2002021702A JP 2002021702 A JP2002021702 A JP 2002021702A JP 2002319025 A JP2002319025 A JP 2002319025A
Authority
JP
Japan
Prior art keywords
text line
printed text
document
handwritten
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002021702A
Other languages
English (en)
Other versions
JP3623200B2 (ja
Inventor
Yue Ma
マー ユー
Jinhong Katherine Guo
キャサリン クオ チンホン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of JP2002319025A publication Critical patent/JP2002319025A/ja
Application granted granted Critical
Publication of JP3623200B2 publication Critical patent/JP3623200B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 手書き注釈及び少なくとも1つの印刷テ
キスト行を有するスキャンした文書イメージから上記手
書き注釈を検知する方法を提供する。 【解決手段】 印刷テキスト行とともに手書き注釈など
の付加情報を含むスキャンされた文書イメージを、手書
き文字を検知する方法により処理する。先ず、スキャン
した文書イメージに関して、少なくとも1つの投影ヒス
トグラムを生成する。上記投影ヒストグラムは、上記印
刷テキスト行と相関する一定のパターンを含む。次に、
上記スキャンした文書イメージに対して連結成分の解析
をおこない、少なくとも1つの併合テキスト行を生成す
る。上記併合テキスト行は、上記手書き注釈及び印刷テ
キスト行のうちの少なくとも一方とそれぞれ関係してい
る。上記併合テキスト行と上記投影ヒストグラムの一定
のパターンとを比較することにより、上記手書き注釈と
上記印刷テキスト行とを区別する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、主に情報処理に関
する。特に、本発明は、オリジナルテキスト及び付加情
報を有するスキャンした文書イメージから上記付加情報
を区別する方法に関する。
【0002】
【従来の技術】過去数十年間にわたるコンピュータを利
用したシステムの急速な発展に伴ない、今日では事務従
事者が文書処理のためにコンピュータシステムを利用す
ることが一般的なこととなり、そのようなコンピュータ
化された事務処理システムを用いて、印刷された文書、
スプレッドシート、ビジネスプレゼンテーションなどを
含むあらゆる種類の文書が作られているとともに、編集
及び修正されている。このようなコンピュータシステム
には高性能の文書編集ツールが含まれるが、印刷文書を
編集したり、あるいは印刷文書に注釈を施す場合、単
に、印刷文書のコピーの本文の上又は余白に注釈を書き
込む方が、文書編集ツールなどを利用するよりも好都合
なことがある。例えば、文書を編集したり、あるいは文
書に注釈を施す者が該文書の電子的コピーを入手できな
いことがあるが、そういった場合、コンピュータによる
文書編集ツールの利用は不可能だと考えられる。
【0003】さらに、印刷文書を編集する又は印刷文書
に注釈を施す者が、文書に手書きで修正や追加を行なっ
た後に、編集及び注釈が施されていないオリジナルの状
態の文書のコピーを必要とする場合もある。そのために
は、オリジナルの状態の文書のコピーを前もって余分に
取っておかなければならない。編集箇所及び注釈箇所を
手作業で削除あるいは隠すことにより、大幅に編集され
た文書を再構成しようとした者であれば、このような作
業がいかに単調であり且つ多くの時間を必要とするか理
解できるであろう。印刷文書から該印刷文書に施された
手書き注釈を自動的に分離する方法が開発されれば、上
述したような作業の単調さが大幅に緩和される可能性が
ある。
【0004】手書き注釈を施すことにより、文書の再構
成における問題とは別の処理上の問題がさらに生じる。
すなわち、どのように手書き注釈を識別且つ利用して、
文書をコード化し、コンピュータによるデータベースに
おいて保存及び検索できるようにするかという問題であ
る。例えば、紙の文書のスキャンイメージを、スキャン
する前の文書に施された手書き注釈に基づいて類別、保
存、及び検索することが可能になれば、非常に有益であ
る。これにより、コード化された指示を識別及び読み取
る作業や、文書を適切に保存する作業をイメージングシ
ステムに任せつつ、手作業で文書を迅速にコード化する
ことが可能になる。
【0005】一般的に、スキャンした文書イメージの付
加情報を検知及び利用することは非常に重要である。そ
の理由は、付加情報が加えられた文書は、その内容によ
り、元のスキャンした文書イメージよりも豊富な情報を
有する場合があるからである。先ず、印刷文書、そして
場合によるとその画像は、文書のオリジナリティーを示
す一方、手書き注釈、スタンプなどの付加情報はオリジ
ナルの文書に対して加えられた変更を表す。次に、オリ
ジナルの文書と該文書に加えられた変更との区別は、文
書管理システムに様々な形で利益をもたらす。例えば、
OCR/ICR、又はその他のパターンを認識及び/又は
整合する技術を用いて、手書き注釈が加えられた文書を
分離することにより、付加情報の内容を元に戻すことも
できる。また、手書き注釈が加えられた文書の本来の内
容を元に戻すことにより、文書の履歴を記録することも
可能である。さらに、付加情報を漏らすことなく、文書
の本来の内容を確実に伝送すること、そして効率的に圧
縮及び保存するための方式を実現することもできる。オ
リジナルの文書が既にデータベースに保存されている場
合、付加情報を有する文書のコピーを全てデータベース
に保存する必要はなく、付加情報のみを保存するだけで
良い。
【0006】印刷文書から手書き注釈を分離する必要へ
の取り組みとして、幾つかの試みがなされてきた。その
1つとして、銀行小切手のイメージを圧縮し、手書きの
書き込みを元の小切手用紙から分離する方法がある。こ
のような方法では、磁気インキ文字認識装置(MIC
R)用の文書の識別子に全面的に依存して、元の小切手
用紙から手書きの書き込みが分離される。
【0007】
【発明が解決しようとする課題】しかしながら、上述の
ような試みでは、文書の識別子に求められる条件によ
り、X線や核磁気共鳴(NMR)によるイメージなどを
用いる非常に特殊な分野に限定されるため、そのコスト
が高く、有用性が損なわれている。
【0008】フォーム処理の分野においては、別の限定
的な適用がなされている。例えば、フォーム処理におい
て、フォーム上の手書きの記載は、標準のテンプレート
を用いることにより抽出することができる。このような
簡便な方法は、雑誌の定期購買申込用紙や口座申込用紙
など同様のフォーマットを有するフォームを大量に処理
する上で有用である。しかしながら、異なる種類の文書
を処理する場合、テンプレートを取り替える必要が生じ
る。その理由は、テンプレートを利用して異なる種類の
文書を処理する場合、限られた種類の文書しか処理でき
ないからである。実際には、文書管理システムにおいて
は、商取引に用いる手紙やフォーム、イメージ、ファッ
クス文書など、あらゆる種類の文書が扱われる。従っ
て、このようなフォーム処理方法は、その利用が限定さ
れており、非常に多くの時間を要するとともに有用でな
い場合がある。
【0009】上述のような情報処理方法は、意図された
利用範囲においては有効であることが証明された。その
一方、自動的に付加情報を分離することにより、本質的
な利益が得られる新たな技術の開発が求められている。
さらに、この新たな技術は、特定の分野やフォーマット
に限定されないにも拘らず、本文から付加情報を極めて
効率的に分離することができることが大いに望ましい。
【0010】そこで、本発明の目的は、前述の要求にこ
たえ、手書き注釈及び少なくとも1つの印刷テキスト行
を有するスキャンした文書イメージから上記手書き注釈
を検知する方法を提供することである。
【0011】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明の方法において、先ず、スキャンした文書
イメージに関して、少なくとも1つの投影ヒストグラム
を生成する。上記投影ヒストグラムは、印刷テキスト行
と相関する一定のパターンを含む。次に、上記スキャン
した文書イメージに対して連結成分の解析をおこない、
少なくとも1つの併合テキスト行を生成する。上記連結
成分の解析により、上記スキャンした文書イメージ上に
おいて互いに関連する暗色画素が連結され、連結成分が
生成される。そして、境界箱が作成され、全ての関連す
る連結成分が囲われる。行併合は、上記スキャンした文
書イメージに対して行なわれ、同様のテキスト行内の境
界箱が併合されることにより、上記少なくとも1つの併
合テキスト行が生成される。上記併合テキスト行は、上
記手書き注釈及び上記印刷テキスト行のうち少なくとも
一方とそれぞれ相関する。上記併合テキスト行と上記投
影ヒストグラムの一定のパターンとを比較することによ
り、上記印刷テキスト行と上記手書き注釈とが区別され
る。
【0012】尚、本発明、その目的及び利点を更に十分
に理解するため、本願明細書の以下の記述及び添付図面
を参照されたい。
【0013】
【発明の実施の形態】図面のうち図1は、本発明の教示
に従った、スキャンした文書イメージから付加的な手書
き注釈を検知及び分離する方法10を示す。尚、本発明
は、手書き注釈及び少なくとも1つの印刷テキスト行を
有するイメージを含むあらゆる文書イメージに適用が可
能である。方法10は、好ましくは以下の手順で行なわ
れる。先ず、スキャンした文書イメージに関して、少な
くとも1つの投影ヒストグラムを生成する(ステップ1
4及び16)。通常は、上記投影ヒストグラムから印刷
テキスト行と相関する一定したパターンが得られる(ス
テップ18)。次に、上記スキャンした文書イメージに
対して連結成分の解析をおこない(ステップ20)、少
なくとも1つの併合したテキスト行を生成する(ステッ
プ22)。上記併合テキスト行は、上記手書き注釈及び
印刷テキスト行のうち少なくとも一方とそれぞれ関係す
る。上記併合テキスト行と上記投影ヒストグラムの一定
のパターンとを比較することにより、上記手書き注釈と
上記印刷テキスト行とが区別される(ステップ24ない
し28)。
【0014】具体的には、先ず、ステップ12におい
て、印刷テキスト行を含むとともに手書き注釈が余白の
上又はその近傍に施された文書をスキャンする。ステッ
プ14及び16においては、上記スキャンした文書イメ
ージに関して、垂直方向及び水平方向の投影ヒストグラ
ムをそれぞれ生成する。ステップ18では、これらのヒ
ストグラムに基づき、上記印刷テキスト行の余白が特定
される。次に、ステップ20において、上記スキャンし
た文書イメージに対して連結成分の解析をおこない、境
界箱を作成する。ステップ22においては、上記連結成
分の境界箱に対して行の併合を行ない、少なくとも1つ
の併合行を生成する。ステップ24では、ステップ18
で特定されたテキスト行の余白、及びステップ22で生
成された併合行に基づき、判読可能なテキスト行を削除
する。ステップ24の後、少数の小さな連結成分又は境
界箱を除いて、上記印刷テキスト行の大多数と上記手書
き注釈とは分離されている。ステップ26においては、
上記印刷テキスト行と手書き注釈とをさらに区別し、上
記テキストの余白と相関しない小さな境界箱を有する残
りのテキスト行を検知する。そして、ステップ28にお
いて、ステップ26で検知された手書き注釈も上記スキ
ャンした文書イメージから分離する。
【0015】図面のうち図2は、本発明に従い、ステッ
プ14及び16(図1)で生成された投影ヒストグラム
を示している。印刷テキスト行52及び手書き注釈54
を有するスキャンした文書イメージ50に関して、垂直
方向及び水平方向の投影ヒストグラム56及び62をそ
れぞれ生成する。投影ヒストグラム56及び62の最初
の急上昇58及び64、また最後の急降下60及び66
は、スキャンした文書イメージ50の余白を示す。具体
的には、最初の急上昇58及び64は、投影ヒストグラ
ム56及び62の限界内での最大の上昇を示すととも
に、余白から印刷テキスト行52への移り変わりを表
す。同様に、最後の急降下60及び66は、投影ヒスト
グラム56及び62の限界内での最大の降下を示すとと
もに、印刷テキスト行52から余白、すなわち空白への
移り変わりを表す。
【0016】図2に最善の形で示されているように、印
刷テキスト行52は、一般的に、英語文書の余白内で横
方向に配列されている。これに対し、手書き注釈54
は、スキャンした文書イメージ50の空白であれば所か
まわず書き込まれており、テキスト行の余白を越えて書
き込まれていることも多い。尚、文書の種類は、英語の
文書に限定されない。例えば、文書の余白内で縦方向に
印刷テキスト行が配列され且つ手書き注釈が空いている
余白に書き込まれた中国語や日本語の文書など、一定の
パターンを有するあらゆる文書が用いられても良い。
【0017】垂直方向及び水平方向の投影ヒストグラム
56及び62は、文書イメージ50内におけるテキスト
の配置の規則性を示す。水平方向の投影ヒストグラム6
2から最初の急上昇64及び最後の急降下66を検知す
ることにより、左側及び右側の余白、すなわち空白が特
定される。その一方、垂直のヒストグラム56から最初
の急上昇58及び最後の急降下60を検知することによ
り、上側と底側の余白が特定される。さらに、垂直方向
の投影ヒストグラム56は、各印刷テキスト行52に関
して、一定のパターンの輝度を示す。印刷テキスト行5
2は、2つの輝度のピーク57をそれぞれ有し、これら
2つの輝度のピーク57は、各印刷テキスト行52の上
端及び下端の位置と対応している。文書の余白に書き込
まれた手書き注釈54は、投影ヒストグラム56及び6
2に波紋を生じさせる場合があるが、余白はその影響を
受けることなく検知される。
【0018】図面のうち図3A及び3Bは、スキャンし
た文書イメージ50に対して連結成分の解析を行なった
様子を示す。図3Aは、印刷テキスト行52及び手書き
注釈54を含むスキャンした文書イメージ50の上部を
示している。本発明において、連結成分の生成には、ラ
ンレングス法による高速アルゴリズムが好ましい。ラン
レングス法によるアルゴリズムにより、暗色画素の連続
的な列、及びこれらの画素とこれらに隣接する画素との
連結性を判定し、関連する画素を発見する。ランレング
ス法による高速アルゴリズムのより詳細な説明は、本発
明と同じ譲受人に譲受された米国特許出願「円領域抽出
アルゴリズムの性能を高めるランレングス法による連結
成分及び等高線描画」(Run-length Based Connected C
omponents and Contour Following for Enhancing the
performance of Circled RegionExtraction Algorith
m)において開示されている。尚、連結成分の解析をお
こなうための別の方法を用いることも可能である。
【0019】図3Bに最善の形で示されているように、
印刷テキスト行52及び手書き注釈54の境界箱72及
び74は、スキャンした文書イメージ50に対して連結
成分の解析が終了した後に生成される。境界箱72及び
74は、関連する連結成分を併合するようそれぞれ構成
されている。各境界箱のサイズは適切に選択され、考慮
する全ての暗色画素が境界箱内に存在する。連結成分の
解析後、連結成分の境界箱72及び74に対して行併合
ステップ22(図1)が行なわれ、図4A及び4Bに示
すように、同じ行内の個々の文字が併合される。
【0020】図4Aは、連結成分の解析が行なわれた後
の、スキャンした文書イメージ50の上部を示す。印刷
テキスト行及び手書き注釈は、境界箱72及び74によ
りそれぞれ囲われている。印刷テキスト行の境界箱72
は、境界箱74よりも一定した形状となっている。印刷
テキスト行の境界箱72は、例えば、同様の高さを有し
ており且つ上端の位置も同様である。これに対し、手書
き注釈の境界箱74の形状は、境界箱72の形状と比べ
て一定していない。また、手書き注釈の境界箱74は、
互いに異なるサイズ及び高さを有している。
【0021】行併合ステップ22においては、2つの境
界箱73、75が任意に選択され、行が併合される。例
えば、印刷テキスト行の境界箱72のうち何れか2つ、
手書き注釈の境界箱74のうち何れか2つ、又は印刷テ
キスト行の境界箱72のうち1つと手書き注釈の境界箱
74のうち1つが任意に選択されても良い。行併合ステ
ップ22で用いられるアルゴリズムでは、何れか2つの
任意の境界箱73、75のそれぞれの上端の位置、高
さ、及び互いからの水平方向の距離が考慮される。これ
ら2つの選択した境界箱73、75のうち一方が完全に
他方の境界箱内にある場合、これら2つの選択した境界
箱73、75は併合される。また、2つの選択した境界
箱73、75が隣接するとともに同じ行の上にある場
合、これら2つの境界箱73、75は併合される。すな
わち、これら2つの選択した境界箱間の上端位置から計
測した水平距離が所定の閾より下であり、これら2つの
選択した境界箱73、75の高さが同様である場合、こ
れら2つの境界箱は併合される。行併合のプロセスは、
行併合をおこなうことができなくなるまで繰り返され
る。その理由は、併合した境界箱は、第3の境界箱7
2、74とさらに併合することも可能であるからであ
る。
【0022】図面の図4Bに示されるように、行併合の
後、(図2の印刷テキスト行52が併合された)併合テ
キスト行82は、一様の高さの長い境界箱を形成する。
一定の形状を有する併合テキスト行82の境界箱は、垂
直方向の投影ヒストグラム56中の対のピーク57(図
2にも図示)と対応している。しかしながら、図4A及
び4Bに示すように、手書き注釈の境界箱74は、通
常、サイズが著しく異なる連結成分によりつくられる。
従って、手書き注釈の境界箱74が併合する可能性は概
して低く、通常は投影ヒストグラム56と対応しない。
【0023】図面の図4A、4B及び5においては、印
刷テキスト行を削除するステップ24がより詳細に示さ
れている。垂直方向及び水平方向の投影ヒストグラム5
6及び62が生成された後、各併合テキスト行82と対
応するピークは、ピーク57として特徴付けられる。対
のピーク57の高さは同様であり、互いからの距離は所
定の範囲内である。対のピーク57は、各印刷テキスト
行の上端及び下端の位置をそれぞれ示す。対のピーク5
7の先端間の距離を用いて、対応する印刷テキスト行の
高さを計算することも可能である。垂直方向の投影ヒス
トグラム56が有するテキスト行のピーク57は、ステ
ップ90において検知される。
【0024】ステップ90においてテキスト行のピーク
が検知された後、ステップ92において、対のピーク5
7間の中心に当る位置にある併合テキスト行82及び8
4がスキャンされる。ステップ94では、各併合テキス
ト行82及び84が個々に吟味され、余白内に全ての境
界箱72、74が位置するかどうかが判定される。境界
箱72、74が余白の内側にない場合、ステップ96に
おいて、併合テキスト行82、84は削除されない。そ
して、ステップ92で、ピーク57間の中心に当る位置
にある次の併合テキスト行82、84がスキャンされ
る。
【0025】境界箱72、74がステップ94の条件を
満たす場合、ステップ98において、これらの境界箱は
さらに吟味され、その高さがピークの高さに近いかどう
かが判断される。境界箱72、74がピークの高さと同
様の高さを有していない場合、ステップ100におい
て、スキャンされた併合テキスト行82、84は削除さ
れない。そして、ステップ92で、ピーク57間の中心
に当る位置にある次の併合テキスト行がスキャンされ
る。境界箱72、74がステップ98の条件を満たす場
合、ステップ102において、スキャンされた併合テキ
スト行は印刷テキスト行であると見なされ、削除され
る。その後、印刷テキスト行削除ステップ24のプロセ
スはステップ92へと戻り、全ての併合テキスト行8
2、84がスキャンされるまで、併合テキスト行が次々
とスキャンされ続ける。
【0026】ステップ104で、全てのテキスト行が併
合された境界箱が吟味された後、ステップ106におい
て、次のピークが検知される。ステップ108におい
て、スキャンした文書イメージに対する同様の削除プロ
セスは、全てのピークが検知され且つ吟味されるまでお
こなわれる。印刷テキスト行削除ステップ24のプロセ
スにより、本文の可能性がある印刷テキスト行52(図
2)のみが確実に削除される。本文の可能性があるテキ
スト行のみを確実に削除するため、投影ヒストグラムの
ピークの位置及び幅は、削除する印刷テキスト行の位置
及び高さと照合確認される。従って、余白内にある併合
テキスト行82及び84のみが削除の対象として考慮さ
れる。
【0027】図6は、印刷テキスト行52(図2)と手
書き注釈54(図2)との間の区別をさらにつけるため
のステップ26を示す。印刷テキスト行削除ステップ2
4の後、印刷テキスト行の境界箱のうち僅かを除く、印
刷テキスト行の大多数が削除されている。例えば、テキ
スト行内の幾つかの小さな連結成分の境界箱は、削除さ
れていないことも考えられる。これらの小さな連結成分
には、通常の境界箱のサイズではない文章の句読点又は
特殊な記号が含まれる。非常に短い印刷テキスト行の境
界箱は、検知される可能性が低い。その理由は、投影ヒ
ストグラムにより示されるこれらの境界箱の低い輝度
は、その他の印刷テキスト行の一定のパターンの輝度と
同等でないからである。これに対し、手書き注釈の断片
の中の幾つかの小さな連結成分が削除されている場合が
ある。その理由は、これらの連結成分が偶然にも印刷テ
キスト行の余白内に位置するとともに、検知されたピー
クと揃っているためである。
【0028】印刷テキスト行削除ステップ24(図5)
の後、ステップ110において、アルゴリズムにより、
残った成分が所定の小さなサイズよりも小さいサイズを
有しているかどうかが判定される。これらの残った成分
のサイズが所定の小さなサイズよりも小さい場合、ステ
ップ112において、アルゴリズムにより、これらの残
った成分が削除されたテキスト行内あるいはその近傍に
あるかどうかが判定される。これらの残った成分が削除
されたテキスト行内あるいはその近傍にあると判定され
た場合、ステップ114において、これら残った成分は
文章内の句読点又は特殊な記号と見なされ、削除され
る。
【0029】これらの残った成分が削除されたテキスト
行内あるいはその近傍にない場合、ステップ116にお
いて、アルゴリズムにより、これらの残った成分が他の
テキストから孤立しているかどうかが判定される。これ
らの残った成分が孤立している場合、ステップ118に
おいて、これらの残った成分はノイズと見なされ、削除
される。これらの残った成分が孤立していない場合、ス
テップ120において、これらの残った成分は手書き注
釈と見なされ、そのまま残される。
【0030】ステップ110で、これらの残った成分が
所定の小さなサイズよりも大きいサイズを有していると
判定された場合、ステップ122において、アルゴリズ
ムにより、これらの残った成分が所定の大きなサイズよ
りも大きいサイズを有しているかどうかが判定される。
これらの残った成分が所定の大きなサイズよりも大きい
サイズを有していると判定された場合、ステップ124
において、これらの残った成分は手書き注釈と見なさ
れ、そのまま残される。
【0031】これらの残った成分のサイズが所定の大き
なサイズよりも大きくない場合、ステップ126におい
て、これらの残った成分の高さと削除されたテキスト行
の大多数の高さとが比較されるとともに、これらの残っ
た成分の境界箱が余白内にあるかどうかが判定される。
これらの残った成分の高さが削除されたテキスト行の大
多数の高さと同様でないか、又はこれらの残った成分の
境界箱が文書の余白内にない場合、ステップ124にお
いて、残った成分は手書き注釈と見なされ、そのまま残
される。
【0032】これらの残った成分がステップ126の条
件を満たす場合、ステップ128において、これらの残
った成分が左側の余白64(図2の投影ヒストグラム6
2の最初の急上昇64)と揃っているかどうかが判定さ
れる。これらの残った成分が左側の余白64と揃ってい
ない場合、ステップ124において、これらの残った成
分は手書き注釈と見なされ、そのまま残される。これら
の残った成分が左側の余白64と揃っている場合、ステ
ップ130において、これらの残った成分は、垂直方向
の投影ヒストグラム56のピークの輝度が低すぎて検知
できない短い印刷テキスト行と見なされ、削除される。
【0033】さらなるテキスト行の削除がおこなわれる
ステップ130では、テキスト行の削除により削除され
た各成分がさらに吟味され、手書き注釈に属する可能性
のある連結成分が削除されていないかどうかが判定され
る。本発明において、不規則な形状の一群に囲まれた境
界箱は、上述の条件を全て満たす場合でも手書き注釈と
見なされる。これらの不規則な形状の一群に囲まれた境
界箱は、ステップ26(図1)の最後で元に戻される。
【0034】図面の図7及び図8は、手書き注釈を検知
した結果、及びスキャンした文書イメージ50(図2)
から手書き注釈を分離した結果をそれぞれ示す。分離ス
テップ28(図1)の後、手書き注釈は、行併合が行な
われた境界箱85として残され、印刷テキスト行は処分
されるか又は保存される。その後、手書き注釈54が抽
出されるが、これも処分されても良いし又は後の利用の
ために保存されて良い。
【0035】図9は、本発明を、文書の履歴を記録する
方法200に、どのように適用するかを第1の実施例と
して示している。ここで、文書は1つ以上のバージョ
ン、即ち、少なくともオリジナルバージョン(第1のバ
ージョン)と、修正されたバージョン(二次バージョ
ン)とを有していても良い。オリジナルバージョンは印
刷テキスト行のみを含むのに対し、二次バージョンは印
刷テキスト行と付加的な手書き注釈とを含む。紙の文書
をスキャンした場合、オリジナルバージョン(印刷テキ
スト行)は、文書のデーターベースに電子化されて存在
している場合もあるし、存在しない場合もある。
【0036】この方法のプロセスが始まるステップ20
2では、手書き注釈とともに印刷テキスト行を有する文
書がスキャンされる。ステップ204においては、上述
のスキャンした文書イメージから手書き注釈を検知及び
分離する方法に従って、スキャンした文書イメージの手
書き注釈と印刷テキスト行とが区別される。ステップ2
06では、抽出された印刷テキスト行がデータベースの
全ての文書と比較され、ステップ208においては、デ
ータベースにオリジナルバージョンと同一のオリジナル
文書が存在するかどうかが判定される。ステップ208
において、抽出した印刷テキスト行と同一のオリジナル
文書がデータベースに存在する場合、この文書は、スキ
ャンした文書イメージのオリジナルバージョンとして確
認される。2つの同様の文書、即ち同一の文書を検知す
る方法は、幾つかの出版物により開示されている。19
97年2月に行なわれたIS&TとSPIE共催のエレ
クトロニック・イメージングに関するシンポジウムの文
書理解IVの議事録、「同一文書の検知」(88ページ〜
94ページ)("Duplicate document detection" in Pr
oceedings of Document Recognition IV(IS&T/SPIE El
ectronic Imaging),pages 88-94, February, 1997))
において、スピッツ(Spitz)は、文字形状のコードを
特徴として利用し、これらを標準のストリングマッチン
グアルゴリズムを用いて比較している。また、1997
年8月に行なわれた第4回文書解析・理解国際会議の議
事録の「文書イメージのデータベース中の同一データ検
知」(314ページから318ページ)("The detecti
on of duplicates in documentimage databases" in Pr
oceedings of the Fourth International Conferenceon
Document Analysis and Recognition, pages 314-318,
August 1997)において、ドゥアマン(Doermann)らは形
状コードを用い、同一文書の検知において生じる問題に
全体的なレイアウトの観点から対処している。
【0037】抽出した印刷テキスト行と同一のオリジナ
ル文書が発見されない場合、ステップ212において、
分離した印刷テキスト行がオリジナル文書として保存さ
れる。ステップ218では、手書き注釈及び印刷テキス
ト行を有するスキャンした文書イメージがこのオリジナ
ル文書の二次バージョンとして記録され、プロセスが終
了する。ステップ208で、分離した印刷テキスト行が
1つのオリジナル文書と関係している場合、ステップ2
10において、このオリジナル文書に修正が施されてい
るかどうか(オリジナル文書の二次バージョンが存在す
るかどうか)がさらに判定される。この確認されたオリ
ジナル文書が他に二次バージョンを有していない場合、
ステップ222において、スキャンした文書イメージ
が、同一と確認されたオリジナル文書の二次バージョン
として保存され、プロセスが終了する。同一と確認され
たオリジナル文書が少なくとも1つのバージョンを有す
る場合、ステップ220において、スキャンされた文書
が、同一と確認されたオリジナル文書の最新のバージョ
ンとして保存され、プロセスが終了する。上述の本発明
の適用は、特に、異なる位置及び時間において複数の人
々により修正された文書の履歴を保存する方法に対して
行なわれることを想定しているが、この方法に限定され
るものではない。
【0038】図10は、本発明を、文書のオリジナルバ
ージョンを確実に伝送する方法300に、どのように適
用するかを第2の実施例として示す。ここで、文書は2
つのバージョン、即ち、オリジナルバージョン及び少な
くとも1つの二次バージョンを有している。オリジナル
バージョンは印刷テキスト行を含むのに対し、二次バー
ジョンは印刷テキスト行とともに手書き注釈も含む。
【0039】この方法のプロセスが始まるステップ30
2では、印刷テキスト行及び手書き注釈を有する文書の
二次バージョンがスキャンされる。次に、ステップ30
4において、上述の付加情報を検知及び分離する方法1
0(図1)に従って、手書き注釈が印刷テキスト行から分
離される。この分離の後、得られた文書を伝送する手段
は2つある。第1の手段(ステップ306)は、付加情
報である手書き注釈が伝送されてしまうのを回避する目
的で、抽出した印刷テキスト行のみを伝送するというも
のである。
【0040】場合によっては、文書のオリジナルバージ
ョン(印刷テキスト行)と同一のオリジナル文書がデー
タベースに存在するとき、このオリジナル文書を伝送す
る第2の手段(ステップ308)を用いることも可能で
ある。第2の手段(ステップ308)には、ステップ3
10、312及び314が含まれる。ステップ310に
おいて、抽出した印刷テキスト行とデータベース中の全
てのオリジナル文書とが比較される。ステップ312
で、抽出した印刷テキスト行と同一のオリジナル文書が
データベースから確認された場合、ステップ314にお
いて、この同一と確認されたオリジナル文書が代わりに
伝送される。抽出した印刷テキスト行と同一のオリジナ
ル文書が確認されない場合、ステップ306において、
抽出した印刷テキスト行が伝送される。時折、異なる時
間において、同一の文書の様々なバージョンが伝送され
るが、手書き注釈の分離結果における僅かな差異によ
り、それぞれの時間において異なる印刷テキスト行が抽
出されてしまうこともある。しかし、第2の手段(ステ
ップ308)を適用した場合、その度に、オリジナルバ
ージョンと同一のオリジナル文書が受取人に伝送され
る。上述の本発明の適用は、特に、手書きの秘密情報を
含む文書のオリジナルバージョンを確実に伝送する方法
に対して行なわれることを想定しているが、この方法に
限定されるものではない。
【0041】図11は、本発明をどのように、圧縮方法
400に適用するかを第3の実施例として示す。ここ
で、文書は、データベースにオリジナル文書として保存
される印刷テキスト行を有するオリジナルバージョンを
含む一方、印刷テキスト行とともに手書き注釈も有する
二次バージョンをさらに含む。
【0042】この方法のプロセスが開始されるステップ
402においては、印刷テキスト行及び手書き注釈を有
する文書の二次バージョンがスキャンされる。次に、ス
テップ404では、上述の付加情報を検知及び分離する
方法10(図1)に従って、手書き注釈が印刷テキスト行
から分離される。その後、ステップ406において、分
離した印刷テキスト行とデータベース中の全てのオリジ
ナル文書とが比較され、ステップ408において、分離
した印刷テキスト行と同一のオリジナル文書が発見され
る。印刷テキスト行と同一のオリジナル文書が存在しな
い場合、ステップ410において、抽出した印刷テキス
ト行がオリジナル文書として保存され、ステップ412
において、手書き注釈が異なる記憶場所に保存される。
ステップ414において、手書き注釈が保存された記憶
場所は、オリジナル文書の記憶場所と関連付けられ、プ
ロセスは終了する。抽出したテキスト行と同一のオリジ
ナル文書がデータベース中にあった場合、ステップ41
6において、手書き注釈のみが保存され、ステップ41
8で、この手書き注釈と確認されたオリジナル文書とが
関連付けられ、プロセスが終了する。この場合、抽出し
た印刷テキスト行は無視され、記憶場所のスペースが節
約される。
【0043】当業者であれば、上述の説明から本発明の
広範な教示が様々な形で実現可能であることが理解でき
る。従って、本発明を具体例と関連して説明してきた
が、本発明の真の範囲はこれらにより限定されるべきで
はない。その理由は、本発明の図面、明細書、及び特許
請求の範囲を検討することにより、本発明の変更が可能
であることは、当業者にとって明らかであるからであ
る。
【図面の簡単な説明】
【図1】本発明に係るスキャンした文書イメージから手
書き注釈を検知及び分離する方法を示すフローチャー
ト。
【図2】印刷テキスト行及び手書き注釈を有するととも
に垂直方向及び水平方向の投影ヒストグラムが配置され
た、スキャンした文書イメージのサンプルを示す図。
【図3】スキャンした文書イメージ(図3A)に対して
どのように連結成分の解析(図3B)を行なうかを例示
する図。
【図4】図2のスキャンした文書イメージ中の連結成分
の境界箱(図4A)に対してどのように行併合(図4
B)を行なうかを例示する図。
【図5】本発明に係る判読可能なテキスト行を削除する
工程を示すフローチャート。
【図6】本発明に係るスキャンした文書イメージの印刷
テキスト行と手書き注釈とをさらに区別する工程を示す
フローチャート。
【図7】図2のスキャンした文書イメージから手書き注
釈の境界箱を検知及び分離した状態を示す図。
【図8】図2のスキャンした文書イメージから抽出した
手書き注釈を示す図。
【図9】本発明に従った、少なくとも1つの二次バージ
ョンを有する文書の履歴を記録する方法に対して本発明
をどのように適用するかを示すフローチャート。
【図10】本発明に従った、印刷テキスト行及び付加情
報を有する文書の伝送を確実にする方法に対して本発明
をどのように適用するかを示すフローチャート。
【図11】本発明の教示に従った効率的な圧縮方法に対
して本発明をどのように適用するかを示すフローチャー
ト。
【符号の説明】
10 手書き注釈を検知及び分離する方法 50 スキャンした文書イメージ 52 印刷テキスト行 54 手書き注釈 56 垂直方向の投影ヒストグラム 57 ピーク 58 垂直方向の投影ヒストグラム56の最初の急
上昇 60 垂直方向の投影ヒストグラム56の最後の急
降下 62 水平方向の投影ヒストグラム 64 水平方向の投影ヒストグラム62の最初の急
上昇(左側の余白) 66 水平方向の投影ヒストグラム62の最後の急
降下 72 印刷テキスト行の境界箱 74 手書き注釈の境界箱 82 併合テキスト行 84 併合テキスト行 85 行併合が行なわれた境界箱 200 文書の履歴を記録する方法 300 文書のオリジナルバージョンを確実に伝送す
る方法 400 圧縮方法
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B009 SA14 5B075 KK07 ND07 NR03 NR20 PP10 PP30 PQ02 UU06 5L096 AA03 AA07 BA07 BA17 CA25 DA01 FA18 FA36 FA42 FA44 GA36

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 手書き注釈及び少なくとも1つの印刷テ
    キスト行を有するスキャンした文書イメージから上記手
    書き注釈を検知する方法であって、 上記印刷テキスト行と相関する一定のパターンを含む少
    なくとも1つの投影ヒストグラムを、上記スキャンした
    文書イメージに関して生成する工程と、 上記スキャンした文書イメージに対して連結成分の解析
    をおこなうことにより、上記手書き注釈及び上記印刷テ
    キスト行のうち少なくとも一方とそれぞれ相関する少な
    くとも1つの併合テキスト行を生成する工程と、 上記併合テキスト行と上記投影ヒストグラムの一定のパ
    ターンとを比較することにより、上記手書き注釈と上記
    印刷テキスト行とを区別する工程とを備えた方法。
  2. 【請求項2】 上記一定のパターンは、上記印刷テキス
    ト行の余白である請求項1記載の方法。
  3. 【請求項3】 上記投影ヒストグラムは、垂直方向の投
    影ヒストグラム、水平方向の投影ヒストグラム、及びこ
    れらの組み合わせの中から選択される請求項1記載の方
    法。
  4. 【請求項4】 上記スキャンした文書イメージの投影ヒ
    ストグラムからテキスト行のピークを検知する工程をさ
    らに備えた請求項1記載の方法。
  5. 【請求項5】 上記連結成分の解析をおこなう工程は、 上記スキャンした文書イメージ上の互いに関係する暗色
    画素を連結することにより、連結成分を生成する工程
    と、 上記連結成分の境界箱を生成する工程と、 同じテキスト行内の上記境界箱の行併合をおこなうこと
    により、上記併合テキスト行を生成する工程とをさらに
    備えた請求項1記載の方法。
  6. 【請求項6】 上記行併合工程は、行併合をおこなう境
    界箱が同じテキスト行に存在しなくなるまで繰り返され
    る請求項5記載の方法。
  7. 【請求項7】 上記境界箱の1つが完全に別の境界箱内
    にある場合、上記行併合工程により、これら2つの境界
    箱が併合される請求項5記載の方法。
  8. 【請求項8】 上記境界箱のうちの2つが隣接するとと
    もに同じ行の上にある場合、上記行併合工程により、こ
    れら2つの境界箱が併合される請求項5記載の方法。
  9. 【請求項9】 上記境界箱のサイズと上記印刷テキスト
    行のサイズとを比較することにより、上記印刷テキスト
    行と上記手書き注釈とを分離する工程をさらに備えた請
    求項1記載の方法。
  10. 【請求項10】 手書き注釈及び少なくとも1つの印刷
    テキスト行を有するスキャンした文書イメージから上記
    手書き注釈を検知する方法であって、 上記印刷テキスト行と相関する余白を含む垂直方向及び
    水平方向の投影ヒストグラムを、上記スキャンした文書
    イメージに関して生成する工程と、 上記スキャンした文書イメージ上で互いに関連する暗色
    画素を連結することにより、連結成分を生成する工程
    と、 上記連結成分のうち互いに関係する連結成分を全て囲む
    境界箱を生成する工程と、 同じテキスト行内の上記境界箱の行併合をおこなうこと
    により、上記手書き注釈及び上記印刷テキスト行のうち
    少なくとも一方とそれぞれ相関する少なくとも1つの併
    合テキスト行を生成する工程と、 上記スキャンした文書イメージの垂直方向の投影ヒスト
    グラムからテキスト行のピークを検知する工程と、 上記併合テキスト行と上記垂直方向及び水平方向の投影
    ヒストグラムから特定された余白とを比較することによ
    り、上記手書き注釈と上記印刷テキスト行とを区別する
    工程とを備えた方法。
  11. 【請求項11】 文書の履歴を記録する方法であって、 印刷テキスト行及び手書き注釈を有する文書をスキャン
    する工程と、 上記スキャンした文書の印刷テキスト行から上記手書き
    注釈を分離する工程と、 上記スキャンした文書と上記印刷テキスト行のみを含む
    オリジナル文書とを比較する工程と、 上記オリジナル文書の前のバージョンの存在を判定する
    工程と、 上記分離した手書き注釈に基づき、上記スキャンした文
    書の履歴を記録する工程とを備えた方法。
  12. 【請求項12】 上記スキャンした文書イメージの印刷
    テキスト行から上記手書き注釈を分離する工程は、 上記印刷テキスト行と相関する一定のパターンを含む少
    なくとも1つの投影ヒストグラムを、上記スキャンした
    文書イメージに関して生成する工程と、 上記スキャンした文書イメージに対して連結成分の解析
    をおこなうことにより、上記手書き注釈及び上記印刷テ
    キスト行のうち少なくとも一方とそれぞれ関係する少な
    くとも1つの併合テキスト行を生成する工程と、 上記併合テキスト行と上記投影ヒストグラムの一定のパ
    ターンとを比較することにより、上記手書き注釈と上記
    印刷テキスト行とを区別する工程とをさらに備えた請求
    項11記載の方法。
  13. 【請求項13】 上記連結成分の解析をおこなう工程
    は、 上記スキャンした文書イメージ上で互いに関係する暗色
    画素を連結することにより、連結成分を生成する工程
    と、 上記連結成分の境界箱を生成する工程と、 同じテキスト行内の上記境界箱の行併合をおこなうこと
    により、上記併合テキスト行を生成する工程とをさらに
    備えた請求項12記載の方法。
  14. 【請求項14】 上記オリジナル文書の存在を検知する
    工程と、 上記スキャンした文書の印刷テキスト行と上記検知した
    オリジナル文書とが異なるとき、上記印刷テキスト行を
    上記オリジナル文書として保存する工程と、 上記スキャンした文書を、上記オリジナル文書の二次バ
    ージョンとして記録する工程とをさらに備えた請求項1
    1記載の方法。
  15. 【請求項15】 上記文書の履歴を記録する工程は、 上記オリジナル文書の前のバージョンが検知されなかっ
    た場合、上記スキャンした文書を上記オリジナル文書の
    二次バージョンとして記録する工程と、 上記オリジナル文書の前のバージョンが少なくとも1つ
    検知された場合、上記スキャンした文書を上記オリジナ
    ル文書の最新のバージョンとして記録する工程とをさら
    に備えた請求項11記載の方法。
  16. 【請求項16】 印刷テキスト行のみを含むオリジナル
    バージョンと、印刷テキスト行及び手書き注釈を含む少
    なくとも1つの二次バージョンとを有する文書のうち上
    記オリジナルバージョンの文書を確実に伝送する方法で
    あって、 上記少なくとも1つの二次バージョンの文書における手
    書き注釈から上記印刷テキスト行を分離する工程と、 上記手書き注釈から分離した印刷テキスト行と関係する
    オリジナルバージョンの文書を判定する工程と、 上記オリジナルバージョンの文書を判定する工程の後、
    上記印刷テキスト行を伝送する工程とを備えた方法。
  17. 【請求項17】 上記手書き注釈から上記印刷テキスト
    行を分離する工程は、 上記印刷テキスト行と相関する余白を含む垂直方向及び
    水平方向の投影ヒストグラムを、上記スキャンした文書
    イメージに関して生成する工程と、 上記スキャンした文書イメージ上の互いに関連する暗色
    画素を連結することにより、連結成分を生成する工程
    と、 上記連結成分のうち互いに関係する連結成分を全て囲む
    境界箱を生成する工程と、 同じテキスト行内の上記境界箱の行併合をおこなうこと
    により、上記手書き注釈及び上記印刷テキスト行のうち
    少なくとも一方とそれぞれ相関する少なくとも1つの併
    合テキスト行を生成する工程と、 上記スキャンした文書イメージの垂直方向の投影ヒスト
    グラムからテキスト行のピークを検知する工程と、 上記併合テキスト行と上記垂直方向及び水平方向の投影
    ヒストグラムから特定された余白とを比較することによ
    り、上記手書き注釈と上記印刷テキスト行とを区別する
    工程とをさらに備えた請求項16記載の方法。
  18. 【請求項18】 上記伝送工程は、 上記印刷テキスト行が上記オリジナルバージョンの文書
    と同一であるとき、上記オリジナルバージョンを伝送す
    る工程と、 上記印刷テキスト行が上記オリジナルバージョンの文書
    と異なるとき、上記印刷テキスト行を伝送する工程とを
    さらに備えた請求項17記載の方法。
  19. 【請求項19】 印刷テキスト行のみを含むオリジナル
    バージョンと、印刷テキスト行及び手書き注釈を含む少
    なくとも1つの二次バージョンとを有する文書を、デー
    タベース中に蓄えられたオリジナルバージョンの文書を
    用いて効率的に圧縮する方法であって、 上記少なくとも1つの二次バージョンの文書をスキャン
    する工程と、 上記少なくとも1つの二次バージョンの文書における上
    記手書き注釈から上記印刷テキスト行を分離する工程
    と、 上記印刷テキスト行と上記オリジナルバージョンの文書
    とを比較する工程と、 上記オリジナルバージョンの文書に関連して上記手書き
    注釈のみを保存する工程とを備えた方法。
  20. 【請求項20】 上記手書き注釈から上記印刷テキスト
    行を分離する工程は、 上記印刷テキスト行と相関する余白を含む垂直方向及び
    水平方向の投影ヒストグラムを、上記スキャンした文書
    イメージに関して生成する工程と、 上記スキャンした文書イメージ上の互いに関連する暗色
    画素を連結することにより、連結成分を生成する工程
    と、 上記連結成分のうち互いに関係する連結成分を全て囲む
    境界箱を生成する工程と、 同じテキスト行内の上記境界箱の行併合をおこなうこと
    により、上記手書き注釈及び上記印刷テキスト行のうち
    少なくとも一方とそれぞれ相関する少なくとも1つの併
    合テキスト行を生成する工程と、 上記スキャンした文書イメージの垂直方向の投影ヒスト
    グラムからテキスト行のピークを検知する工程と、 上記併合テキスト行と上記垂直方向及び水平方向の投影
    ヒストグラムから特定された余白とを比較することによ
    り、上記手書き注釈と上記印刷テキスト行とを区別する
    工程とをさらに備えた請求項19記載の方法。
  21. 【請求項21】 上記手書き注釈を保存する工程は、 上記手書き注釈と上記データベース中のオリジナルバー
    ジョンとを関連付ける工程をさらに備えた請求項19記
    載の方法。
JP2002021702A 2001-01-31 2002-01-30 スキャンした文書イメージの付加情報の検知及び利用方法 Expired - Lifetime JP3623200B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/773,213 US6909805B2 (en) 2001-01-31 2001-01-31 Detecting and utilizing add-on information from a scanned document image
US09/773,213 2001-01-31

Publications (2)

Publication Number Publication Date
JP2002319025A true JP2002319025A (ja) 2002-10-31
JP3623200B2 JP3623200B2 (ja) 2005-02-23

Family

ID=25097551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002021702A Expired - Lifetime JP3623200B2 (ja) 2001-01-31 2002-01-30 スキャンした文書イメージの付加情報の検知及び利用方法

Country Status (3)

Country Link
US (1) US6909805B2 (ja)
EP (1) EP1229485A3 (ja)
JP (1) JP3623200B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006201885A (ja) * 2005-01-18 2006-08-03 Sharp Corp 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
JP2008009785A (ja) * 2006-06-30 2008-01-17 Fuji Xerox Co Ltd 画像処理システムおよび画像処理プログラム
JP2008084324A (ja) * 2006-09-28 2008-04-10 Ricoh Co Ltd 文書管理システム、装置、及び方法
KR100847037B1 (ko) 2005-03-29 2008-07-17 후지제롯쿠스 가부시끼가이샤 주석 데이터를 추출하여 분류하는 프로그램이 기록된 매체및, 주석 데이터 처리 장치 및 방법
JP2008181485A (ja) * 2006-12-28 2008-08-07 Konica Minolta Business Technologies Inc 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム
JP2011018337A (ja) * 2009-07-10 2011-01-27 Palo Alto Research Center Inc 文書内のテキスト行を区分するための方法
US8339619B2 (en) 2003-11-14 2012-12-25 Canon Kabushiki Kaisha System and image processing method and apparatus for re-using and re-editing images
JP2013127823A (ja) * 2013-03-28 2013-06-27 Seiko Epson Corp 検索装置およびプログラム
US8508756B2 (en) 2006-12-28 2013-08-13 Konica Minolta Business Technologies, Inc. Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6561422B1 (en) * 1999-05-03 2003-05-13 Hewlett-Packard Development Company System and method for high-contrast marking and reading
US6940617B2 (en) * 2001-02-09 2005-09-06 Matsushita Electric Industrial Co., Ltd. Printing control interface system and method with handwriting discrimination capability
JP3864246B2 (ja) * 2001-05-30 2006-12-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 画像処理方法、画像処理システムおよびプログラム
US20030004991A1 (en) * 2001-06-29 2003-01-02 Keskar Dhananjay V. Correlating handwritten annotations to a document
US7013029B2 (en) * 2001-06-29 2006-03-14 Intel Corporation Incorporating handwritten notations into an electronic document
US7712028B2 (en) * 2001-10-19 2010-05-04 Xerox Corporation Using annotations for summarizing a document image and itemizing the summary based on similar annotations
US7120299B2 (en) 2001-12-28 2006-10-10 Intel Corporation Recognizing commands written onto a medium
JP2004145072A (ja) * 2002-10-25 2004-05-20 Riso Kagaku Corp 手書き文字フォント作成装置及び手書き文字フォント作成プログラム
US20040139391A1 (en) * 2003-01-15 2004-07-15 Xerox Corporation Integration of handwritten annotations into an electronic original
US7415667B2 (en) * 2003-01-31 2008-08-19 Ricoh Company, Ltd. Generating augmented notes and synchronizing notes and document portions based on timing information
US7072514B1 (en) * 2003-02-06 2006-07-04 The United States Of America As Represented By The National Security Agency Method of distinguishing handwritten and machine-printed images
US7826101B2 (en) * 2003-06-25 2010-11-02 Ricoh Company, Ltd. Document management method, document management program, recording medium, and document management apparatus
US20050038788A1 (en) * 2003-08-14 2005-02-17 International Business Machines Corporation Annotation security to prevent the divulgence of sensitive information
US7840067B2 (en) * 2003-10-24 2010-11-23 Arcsoft, Inc. Color matching and color correction for images forming a panoramic image
US20050094192A1 (en) * 2003-11-03 2005-05-05 Harris Rodney C. Systems and methods for enabling electronic document ratification
US7962846B2 (en) 2004-02-13 2011-06-14 Microsoft Corporation Organization of annotated clipping views
JP2006092027A (ja) * 2004-09-21 2006-04-06 Fuji Xerox Co Ltd 文字認識装置、文字認識方法および文字認識プログラム
JP2006092346A (ja) * 2004-09-24 2006-04-06 Fuji Xerox Co Ltd 文字認識装置、文字認識方法および文字認識プログラム
JP4477468B2 (ja) * 2004-10-15 2010-06-09 富士通株式会社 組み立て図面の装置部品イメージ検索装置
US7302098B2 (en) * 2004-12-03 2007-11-27 Motorola, Inc. Character segmentation method and apparatus
US8645821B2 (en) * 2010-09-28 2014-02-04 Xerox Corporation System and method for page frame detection
JP4466378B2 (ja) * 2005-01-11 2010-05-26 株式会社ニコン 履歴付加装置、電子カメラ、および画像処理プログラム
JP4240050B2 (ja) * 2006-04-13 2009-03-18 コニカミノルタビジネステクノロジーズ株式会社 文書管理装置、文書管理方法及び文書管理プログラム
US20070247655A1 (en) * 2006-04-21 2007-10-25 Microsoft Corporation Dynamic printer system
US8014040B2 (en) * 2006-04-21 2011-09-06 Microsoft Corporation Dynamic scanner system
US8115948B2 (en) 2006-04-21 2012-02-14 Microsoft Corporation Interactive paper system
US8213687B2 (en) * 2006-04-28 2012-07-03 Hewlett-Packard Development Company, L.P. Image processing methods, image processing systems, and articles of manufacture
US7478332B2 (en) * 2006-05-24 2009-01-13 170 Systems Inc. System for and method of providing a user interface for a computer-based software application
JP2007335920A (ja) * 2006-06-12 2007-12-27 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
JP4933993B2 (ja) * 2006-09-19 2012-05-16 株式会社リコー 画像管理方法及び画像処理装置
US8265382B2 (en) * 2007-05-29 2012-09-11 Livescribe, Inc. Electronic annotation of documents with preexisting content
US8194257B2 (en) * 2007-11-15 2012-06-05 Hewlett-Packard Development Company, Lp. Simplified operation of scan based devices
US20090202151A1 (en) * 2008-02-13 2009-08-13 Kabushiki Kaisha Toshiba Format processing apparatus for document image and format processing method for the same
US8240554B2 (en) * 2008-03-28 2012-08-14 Keycorp System and method of financial instrument processing with duplicate item detection
US8631079B2 (en) * 2008-06-20 2014-01-14 Microsoft Corporation Displaying a list of file attachments associated with a message thread
JP5014284B2 (ja) * 2008-08-08 2012-08-29 キヤノン株式会社 画像処理装置、画像処理方法、およびプログラム
TWI385584B (zh) * 2008-11-05 2013-02-11 Avermedia Information Inc 自動排列手寫字串之裝置及方法
CN102171541B (zh) * 2009-01-06 2013-03-27 西门子医疗保健诊断公司 用于使用成像确定容器中的液面的方法和装置
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US8832853B2 (en) 2009-12-07 2014-09-09 Dst Technologies, Inc. Managed virtual point to point communication service having verified directory, secure transmission and controlled delivery
US8948535B2 (en) * 2010-01-27 2015-02-03 Dst Technologies, Inc. Contextualizing noisy samples by substantially minimizing noise induced variance
US8600173B2 (en) 2010-01-27 2013-12-03 Dst Technologies, Inc. Contextualization of machine indeterminable information based on machine determinable information
US8824785B2 (en) * 2010-01-27 2014-09-02 Dst Technologies, Inc. Segregation of handwritten information from typographic information on a document
US8606046B2 (en) 2010-06-21 2013-12-10 Palo Alto Research Center Incorporated System and method for clean document reconstruction from annotated document images
US9081412B2 (en) 2010-07-31 2015-07-14 Hewlett-Packard Development Company, L.P. System and method for using paper as an interface to computer applications
US8731296B2 (en) 2011-04-21 2014-05-20 Seiko Epson Corporation Contact text detection in scanned images
US9135512B2 (en) 2011-04-30 2015-09-15 Hewlett-Packard Development Company, L.P. Fiducial marks on scanned image of document
JP5948866B2 (ja) * 2011-12-27 2016-07-06 富士ゼロックス株式会社 画像処理装置及びプログラム
US9165188B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US8837830B2 (en) * 2012-06-12 2014-09-16 Xerox Corporation Finding text in natural scenes
US9418310B1 (en) * 2012-06-21 2016-08-16 Amazon Technologies, Inc. Assessing legibility of images
US9569679B1 (en) * 2012-12-04 2017-02-14 A9.Com, Inc. Adaptive image sampling for text detection
US9286280B2 (en) 2012-12-10 2016-03-15 International Business Machines Corporation Utilizing classification and text analytics for optimizing processes in documents
US10430506B2 (en) 2012-12-10 2019-10-01 International Business Machines Corporation Utilizing classification and text analytics for annotating documents to allow quick scanning
FR3002353B1 (fr) * 2013-02-15 2016-06-10 Sagemcom Documents Sas Procede et un dispositif de decision parmi un ensemble d'images constituees de pixels, d'au moins une image pour laquelle un traitement de ladite image est pertinent.
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US10127636B2 (en) 2013-09-27 2018-11-13 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US9098217B2 (en) 2013-03-22 2015-08-04 Hewlett-Packard Development Company, L.P. Causing an action to occur in response to scanned data
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
JP2016538783A (ja) 2013-11-15 2016-12-08 コファックス, インコーポレイテッド モバイル映像データを用いて長尺文書の合成画像を生成するためのシステムおよび方法
JP2016015115A (ja) * 2014-06-09 2016-01-28 株式会社リコー 情報処理装置、情報処理方法、及び記録媒体
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US10552699B2 (en) 2016-12-27 2020-02-04 Datalogic Usa, Inc. Robust string text detection for industrial optical character recognition
US10621693B2 (en) * 2016-12-28 2020-04-14 Ancestry.Com Operations Inc. 2D multi-coordinate adaptive dynamics programming method for robust document registration
US10121072B1 (en) * 2016-12-30 2018-11-06 Intuit Inc. Unsupervised removal of text from form images
US10496894B2 (en) * 2017-03-31 2019-12-03 Tata Consultancy Services Limited System and method for text localization in images
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US11616816B2 (en) * 2018-12-28 2023-03-28 Speedchain, Inc. Distributed ledger based document image extracting and processing within an enterprise system
US10783323B1 (en) * 2019-03-14 2020-09-22 Michael Garnet Hawkes Analysis system
EP4014201A1 (en) * 2019-08-14 2022-06-22 F. Hoffmann-La Roche AG Three dimensional object segmentation of medical images localized with object detection
US11176410B2 (en) * 2019-10-27 2021-11-16 John Snow Labs Inc. Preprocessing images for OCR using character pixel height estimation and cycle generative adversarial networks for better character recognition
WO2021087334A1 (en) 2019-11-01 2021-05-06 Vannevar Labs, Inc. Neural network-based optical character recognition
US11106858B2 (en) * 2020-01-16 2021-08-31 Adobe Inc. Merging selected digital point text objects while maintaining visual appearance fidelity
US11074473B1 (en) * 2020-01-21 2021-07-27 Capital One Services, Llc Systems and methods for digitized document image text contouring
CN111860479B (zh) * 2020-06-16 2024-03-26 北京百度网讯科技有限公司 光学字符识别方法、装置、电子设备及存储介质
JP2022092119A (ja) * 2020-12-10 2022-06-22 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0750483B2 (ja) * 1985-05-22 1995-05-31 株式会社日立製作所 文書画像追加情報の蓄積方法
US4949392A (en) * 1988-05-20 1990-08-14 Eastman Kodak Company Document recognition and automatic indexing for optical character recognition
US5159667A (en) * 1989-05-31 1992-10-27 Borrey Roland G Document identification by characteristics matching
US5181255A (en) * 1990-12-13 1993-01-19 Xerox Corporation Segmentation of handwriting and machine printed text
US5119433A (en) * 1990-03-12 1992-06-02 International Business Machines Corporation Method and system for locating the amount field on a document
US5063600A (en) * 1990-05-14 1991-11-05 Norwood Donald D Hybrid information management system for handwriting and text
US5237628A (en) * 1991-06-03 1993-08-17 Nynex Corporation System and method for automatic optical data entry
CA2045907C (en) * 1991-06-28 1998-12-15 Gerald B. Anderson A method for storing and retrieving annotations and redactions in final form documents
US5243149A (en) * 1992-04-10 1993-09-07 International Business Machines Corp. Method and apparatus for improving the paper interface to computing systems
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5668897A (en) * 1994-03-15 1997-09-16 Stolfo; Salvatore J. Method and apparatus for imaging, image processing and data compression merge/purge techniques for document image databases
US5897648A (en) * 1994-06-27 1999-04-27 Numonics Corporation Apparatus and method for editing electronic documents
JP3547025B2 (ja) * 1994-08-23 2004-07-28 株式会社リコー 情報抽出方法
US6178431B1 (en) * 1994-10-05 2001-01-23 International Business Machines Corporation Method and system for providing side notes in word processing
US6301386B1 (en) * 1998-12-09 2001-10-09 Ncr Corporation Methods and apparatus for gray image based text identification
JP2000181993A (ja) * 1998-12-16 2000-06-30 Fujitsu Ltd 文字認識方法および装置
US6721921B1 (en) * 2000-07-26 2004-04-13 Itm Associates Method and system for annotating documents using an independent annotation repository

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8339619B2 (en) 2003-11-14 2012-12-25 Canon Kabushiki Kaisha System and image processing method and apparatus for re-using and re-editing images
JP2006201885A (ja) * 2005-01-18 2006-08-03 Sharp Corp 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体
KR100847037B1 (ko) 2005-03-29 2008-07-17 후지제롯쿠스 가부시끼가이샤 주석 데이터를 추출하여 분류하는 프로그램이 기록된 매체및, 주석 데이터 처리 장치 및 방법
US7703001B2 (en) 2005-03-29 2010-04-20 Fuji Xerox Co., Ltd. Media storing a program to extract and classify annotation data, and apparatus and method for processing annotation data
JP2008009785A (ja) * 2006-06-30 2008-01-17 Fuji Xerox Co Ltd 画像処理システムおよび画像処理プログラム
JP2008084324A (ja) * 2006-09-28 2008-04-10 Ricoh Co Ltd 文書管理システム、装置、及び方法
JP2008181485A (ja) * 2006-12-28 2008-08-07 Konica Minolta Business Technologies Inc 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム
US8508756B2 (en) 2006-12-28 2013-08-13 Konica Minolta Business Technologies, Inc. Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions
JP2011018337A (ja) * 2009-07-10 2011-01-27 Palo Alto Research Center Inc 文書内のテキスト行を区分するための方法
JP2013127823A (ja) * 2013-03-28 2013-06-27 Seiko Epson Corp 検索装置およびプログラム

Also Published As

Publication number Publication date
US6909805B2 (en) 2005-06-21
US20020102022A1 (en) 2002-08-01
EP1229485A3 (en) 2004-05-26
EP1229485A2 (en) 2002-08-07
JP3623200B2 (ja) 2005-02-23

Similar Documents

Publication Publication Date Title
JP3623200B2 (ja) スキャンした文書イメージの付加情報の検知及び利用方法
Clark et al. Pdffigures 2.0: Mining figures from research papers
JP3282860B2 (ja) 文書上のテキストのデジタル画像を処理する装置
US6694053B1 (en) Method and apparatus for performing document structure analysis
US9218326B2 (en) Method and apparatus for detecting pagination constructs including a header and a footer in legacy documents
JP3232144B2 (ja) 文章中の単語文節の出現頻度を求めるための装置
CA2078423C (en) Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
US7705848B2 (en) Method of identifying semantic units in an electronic document
CA2077274C (en) Method and apparatus for summarizing a document without document image decoding
CN101443790B (zh) 数字图像中的非回流内容的有效处理
US5761686A (en) Embedding encoded information in an iconic version of a text image
US5164899A (en) Method and apparatus for computer understanding and manipulation of minimally formatted text documents
US7697757B2 (en) Computer assisted document modification
US7991709B2 (en) Method and apparatus for structuring documents utilizing recognition of an ordered sequence of identifiers
US9098581B2 (en) Method for finding text reading order in a document
Déjean et al. A system for converting PDF documents into structured XML format
US20070027749A1 (en) Advertisement detection
US9436882B2 (en) Automated redaction
JP2008146605A (ja) 画像処理装置及びその制御方法
JP2008022159A (ja) 文書処理装置及び文書処理方法
JP2006221569A (ja) 文書処理システム、文書処理方法、プログラムおよび記憶媒体
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
US20130329263A1 (en) Image processing apparatus, and image processing method and program therefor
WO2007070010A1 (en) Improvements in electronic document analysis
JP4480109B2 (ja) 画像管理装置および画像管理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040720

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041026

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041122

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3623200

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071203

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081203

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091203

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091203

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101203

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101203

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111203

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111203

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121203

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121203

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131203

Year of fee payment: 9

EXPY Cancellation because of completion of term