JP2002319025A - スキャンした文書イメージの付加情報の検知及び利用方法 - Google Patents
スキャンした文書イメージの付加情報の検知及び利用方法Info
- Publication number
- JP2002319025A JP2002319025A JP2002021702A JP2002021702A JP2002319025A JP 2002319025 A JP2002319025 A JP 2002319025A JP 2002021702 A JP2002021702 A JP 2002021702A JP 2002021702 A JP2002021702 A JP 2002021702A JP 2002319025 A JP2002319025 A JP 2002319025A
- Authority
- JP
- Japan
- Prior art keywords
- text line
- printed text
- document
- handwritten
- line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
キスト行を有するスキャンした文書イメージから上記手
書き注釈を検知する方法を提供する。 【解決手段】 印刷テキスト行とともに手書き注釈など
の付加情報を含むスキャンされた文書イメージを、手書
き文字を検知する方法により処理する。先ず、スキャン
した文書イメージに関して、少なくとも1つの投影ヒス
トグラムを生成する。上記投影ヒストグラムは、上記印
刷テキスト行と相関する一定のパターンを含む。次に、
上記スキャンした文書イメージに対して連結成分の解析
をおこない、少なくとも1つの併合テキスト行を生成す
る。上記併合テキスト行は、上記手書き注釈及び印刷テ
キスト行のうちの少なくとも一方とそれぞれ関係してい
る。上記併合テキスト行と上記投影ヒストグラムの一定
のパターンとを比較することにより、上記手書き注釈と
上記印刷テキスト行とを区別する。
Description
する。特に、本発明は、オリジナルテキスト及び付加情
報を有するスキャンした文書イメージから上記付加情報
を区別する方法に関する。
用したシステムの急速な発展に伴ない、今日では事務従
事者が文書処理のためにコンピュータシステムを利用す
ることが一般的なこととなり、そのようなコンピュータ
化された事務処理システムを用いて、印刷された文書、
スプレッドシート、ビジネスプレゼンテーションなどを
含むあらゆる種類の文書が作られているとともに、編集
及び修正されている。このようなコンピュータシステム
には高性能の文書編集ツールが含まれるが、印刷文書を
編集したり、あるいは印刷文書に注釈を施す場合、単
に、印刷文書のコピーの本文の上又は余白に注釈を書き
込む方が、文書編集ツールなどを利用するよりも好都合
なことがある。例えば、文書を編集したり、あるいは文
書に注釈を施す者が該文書の電子的コピーを入手できな
いことがあるが、そういった場合、コンピュータによる
文書編集ツールの利用は不可能だと考えられる。
に注釈を施す者が、文書に手書きで修正や追加を行なっ
た後に、編集及び注釈が施されていないオリジナルの状
態の文書のコピーを必要とする場合もある。そのために
は、オリジナルの状態の文書のコピーを前もって余分に
取っておかなければならない。編集箇所及び注釈箇所を
手作業で削除あるいは隠すことにより、大幅に編集され
た文書を再構成しようとした者であれば、このような作
業がいかに単調であり且つ多くの時間を必要とするか理
解できるであろう。印刷文書から該印刷文書に施された
手書き注釈を自動的に分離する方法が開発されれば、上
述したような作業の単調さが大幅に緩和される可能性が
ある。
成における問題とは別の処理上の問題がさらに生じる。
すなわち、どのように手書き注釈を識別且つ利用して、
文書をコード化し、コンピュータによるデータベースに
おいて保存及び検索できるようにするかという問題であ
る。例えば、紙の文書のスキャンイメージを、スキャン
する前の文書に施された手書き注釈に基づいて類別、保
存、及び検索することが可能になれば、非常に有益であ
る。これにより、コード化された指示を識別及び読み取
る作業や、文書を適切に保存する作業をイメージングシ
ステムに任せつつ、手作業で文書を迅速にコード化する
ことが可能になる。
加情報を検知及び利用することは非常に重要である。そ
の理由は、付加情報が加えられた文書は、その内容によ
り、元のスキャンした文書イメージよりも豊富な情報を
有する場合があるからである。先ず、印刷文書、そして
場合によるとその画像は、文書のオリジナリティーを示
す一方、手書き注釈、スタンプなどの付加情報はオリジ
ナルの文書に対して加えられた変更を表す。次に、オリ
ジナルの文書と該文書に加えられた変更との区別は、文
書管理システムに様々な形で利益をもたらす。例えば、
OCR/ICR、又はその他のパターンを認識及び/又は
整合する技術を用いて、手書き注釈が加えられた文書を
分離することにより、付加情報の内容を元に戻すことも
できる。また、手書き注釈が加えられた文書の本来の内
容を元に戻すことにより、文書の履歴を記録することも
可能である。さらに、付加情報を漏らすことなく、文書
の本来の内容を確実に伝送すること、そして効率的に圧
縮及び保存するための方式を実現することもできる。オ
リジナルの文書が既にデータベースに保存されている場
合、付加情報を有する文書のコピーを全てデータベース
に保存する必要はなく、付加情報のみを保存するだけで
良い。
の取り組みとして、幾つかの試みがなされてきた。その
1つとして、銀行小切手のイメージを圧縮し、手書きの
書き込みを元の小切手用紙から分離する方法がある。こ
のような方法では、磁気インキ文字認識装置(MIC
R)用の文書の識別子に全面的に依存して、元の小切手
用紙から手書きの書き込みが分離される。
ような試みでは、文書の識別子に求められる条件によ
り、X線や核磁気共鳴(NMR)によるイメージなどを
用いる非常に特殊な分野に限定されるため、そのコスト
が高く、有用性が損なわれている。
的な適用がなされている。例えば、フォーム処理におい
て、フォーム上の手書きの記載は、標準のテンプレート
を用いることにより抽出することができる。このような
簡便な方法は、雑誌の定期購買申込用紙や口座申込用紙
など同様のフォーマットを有するフォームを大量に処理
する上で有用である。しかしながら、異なる種類の文書
を処理する場合、テンプレートを取り替える必要が生じ
る。その理由は、テンプレートを利用して異なる種類の
文書を処理する場合、限られた種類の文書しか処理でき
ないからである。実際には、文書管理システムにおいて
は、商取引に用いる手紙やフォーム、イメージ、ファッ
クス文書など、あらゆる種類の文書が扱われる。従っ
て、このようなフォーム処理方法は、その利用が限定さ
れており、非常に多くの時間を要するとともに有用でな
い場合がある。
利用範囲においては有効であることが証明された。その
一方、自動的に付加情報を分離することにより、本質的
な利益が得られる新たな技術の開発が求められている。
さらに、この新たな技術は、特定の分野やフォーマット
に限定されないにも拘らず、本文から付加情報を極めて
効率的に分離することができることが大いに望ましい。
たえ、手書き注釈及び少なくとも1つの印刷テキスト行
を有するスキャンした文書イメージから上記手書き注釈
を検知する方法を提供することである。
めに、本発明の方法において、先ず、スキャンした文書
イメージに関して、少なくとも1つの投影ヒストグラム
を生成する。上記投影ヒストグラムは、印刷テキスト行
と相関する一定のパターンを含む。次に、上記スキャン
した文書イメージに対して連結成分の解析をおこない、
少なくとも1つの併合テキスト行を生成する。上記連結
成分の解析により、上記スキャンした文書イメージ上に
おいて互いに関連する暗色画素が連結され、連結成分が
生成される。そして、境界箱が作成され、全ての関連す
る連結成分が囲われる。行併合は、上記スキャンした文
書イメージに対して行なわれ、同様のテキスト行内の境
界箱が併合されることにより、上記少なくとも1つの併
合テキスト行が生成される。上記併合テキスト行は、上
記手書き注釈及び上記印刷テキスト行のうち少なくとも
一方とそれぞれ相関する。上記併合テキスト行と上記投
影ヒストグラムの一定のパターンとを比較することによ
り、上記印刷テキスト行と上記手書き注釈とが区別され
る。
に理解するため、本願明細書の以下の記述及び添付図面
を参照されたい。
に従った、スキャンした文書イメージから付加的な手書
き注釈を検知及び分離する方法10を示す。尚、本発明
は、手書き注釈及び少なくとも1つの印刷テキスト行を
有するイメージを含むあらゆる文書イメージに適用が可
能である。方法10は、好ましくは以下の手順で行なわ
れる。先ず、スキャンした文書イメージに関して、少な
くとも1つの投影ヒストグラムを生成する(ステップ1
4及び16)。通常は、上記投影ヒストグラムから印刷
テキスト行と相関する一定したパターンが得られる(ス
テップ18)。次に、上記スキャンした文書イメージに
対して連結成分の解析をおこない(ステップ20)、少
なくとも1つの併合したテキスト行を生成する(ステッ
プ22)。上記併合テキスト行は、上記手書き注釈及び
印刷テキスト行のうち少なくとも一方とそれぞれ関係す
る。上記併合テキスト行と上記投影ヒストグラムの一定
のパターンとを比較することにより、上記手書き注釈と
上記印刷テキスト行とが区別される(ステップ24ない
し28)。
て、印刷テキスト行を含むとともに手書き注釈が余白の
上又はその近傍に施された文書をスキャンする。ステッ
プ14及び16においては、上記スキャンした文書イメ
ージに関して、垂直方向及び水平方向の投影ヒストグラ
ムをそれぞれ生成する。ステップ18では、これらのヒ
ストグラムに基づき、上記印刷テキスト行の余白が特定
される。次に、ステップ20において、上記スキャンし
た文書イメージに対して連結成分の解析をおこない、境
界箱を作成する。ステップ22においては、上記連結成
分の境界箱に対して行の併合を行ない、少なくとも1つ
の併合行を生成する。ステップ24では、ステップ18
で特定されたテキスト行の余白、及びステップ22で生
成された併合行に基づき、判読可能なテキスト行を削除
する。ステップ24の後、少数の小さな連結成分又は境
界箱を除いて、上記印刷テキスト行の大多数と上記手書
き注釈とは分離されている。ステップ26においては、
上記印刷テキスト行と手書き注釈とをさらに区別し、上
記テキストの余白と相関しない小さな境界箱を有する残
りのテキスト行を検知する。そして、ステップ28にお
いて、ステップ26で検知された手書き注釈も上記スキ
ャンした文書イメージから分離する。
プ14及び16(図1)で生成された投影ヒストグラム
を示している。印刷テキスト行52及び手書き注釈54
を有するスキャンした文書イメージ50に関して、垂直
方向及び水平方向の投影ヒストグラム56及び62をそ
れぞれ生成する。投影ヒストグラム56及び62の最初
の急上昇58及び64、また最後の急降下60及び66
は、スキャンした文書イメージ50の余白を示す。具体
的には、最初の急上昇58及び64は、投影ヒストグラ
ム56及び62の限界内での最大の上昇を示すととも
に、余白から印刷テキスト行52への移り変わりを表
す。同様に、最後の急降下60及び66は、投影ヒスト
グラム56及び62の限界内での最大の降下を示すとと
もに、印刷テキスト行52から余白、すなわち空白への
移り変わりを表す。
刷テキスト行52は、一般的に、英語文書の余白内で横
方向に配列されている。これに対し、手書き注釈54
は、スキャンした文書イメージ50の空白であれば所か
まわず書き込まれており、テキスト行の余白を越えて書
き込まれていることも多い。尚、文書の種類は、英語の
文書に限定されない。例えば、文書の余白内で縦方向に
印刷テキスト行が配列され且つ手書き注釈が空いている
余白に書き込まれた中国語や日本語の文書など、一定の
パターンを有するあらゆる文書が用いられても良い。
56及び62は、文書イメージ50内におけるテキスト
の配置の規則性を示す。水平方向の投影ヒストグラム6
2から最初の急上昇64及び最後の急降下66を検知す
ることにより、左側及び右側の余白、すなわち空白が特
定される。その一方、垂直のヒストグラム56から最初
の急上昇58及び最後の急降下60を検知することによ
り、上側と底側の余白が特定される。さらに、垂直方向
の投影ヒストグラム56は、各印刷テキスト行52に関
して、一定のパターンの輝度を示す。印刷テキスト行5
2は、2つの輝度のピーク57をそれぞれ有し、これら
2つの輝度のピーク57は、各印刷テキスト行52の上
端及び下端の位置と対応している。文書の余白に書き込
まれた手書き注釈54は、投影ヒストグラム56及び6
2に波紋を生じさせる場合があるが、余白はその影響を
受けることなく検知される。
た文書イメージ50に対して連結成分の解析を行なった
様子を示す。図3Aは、印刷テキスト行52及び手書き
注釈54を含むスキャンした文書イメージ50の上部を
示している。本発明において、連結成分の生成には、ラ
ンレングス法による高速アルゴリズムが好ましい。ラン
レングス法によるアルゴリズムにより、暗色画素の連続
的な列、及びこれらの画素とこれらに隣接する画素との
連結性を判定し、関連する画素を発見する。ランレング
ス法による高速アルゴリズムのより詳細な説明は、本発
明と同じ譲受人に譲受された米国特許出願「円領域抽出
アルゴリズムの性能を高めるランレングス法による連結
成分及び等高線描画」(Run-length Based Connected C
omponents and Contour Following for Enhancing the
performance of Circled RegionExtraction Algorith
m)において開示されている。尚、連結成分の解析をお
こなうための別の方法を用いることも可能である。
印刷テキスト行52及び手書き注釈54の境界箱72及
び74は、スキャンした文書イメージ50に対して連結
成分の解析が終了した後に生成される。境界箱72及び
74は、関連する連結成分を併合するようそれぞれ構成
されている。各境界箱のサイズは適切に選択され、考慮
する全ての暗色画素が境界箱内に存在する。連結成分の
解析後、連結成分の境界箱72及び74に対して行併合
ステップ22(図1)が行なわれ、図4A及び4Bに示
すように、同じ行内の個々の文字が併合される。
の、スキャンした文書イメージ50の上部を示す。印刷
テキスト行及び手書き注釈は、境界箱72及び74によ
りそれぞれ囲われている。印刷テキスト行の境界箱72
は、境界箱74よりも一定した形状となっている。印刷
テキスト行の境界箱72は、例えば、同様の高さを有し
ており且つ上端の位置も同様である。これに対し、手書
き注釈の境界箱74の形状は、境界箱72の形状と比べ
て一定していない。また、手書き注釈の境界箱74は、
互いに異なるサイズ及び高さを有している。
界箱73、75が任意に選択され、行が併合される。例
えば、印刷テキスト行の境界箱72のうち何れか2つ、
手書き注釈の境界箱74のうち何れか2つ、又は印刷テ
キスト行の境界箱72のうち1つと手書き注釈の境界箱
74のうち1つが任意に選択されても良い。行併合ステ
ップ22で用いられるアルゴリズムでは、何れか2つの
任意の境界箱73、75のそれぞれの上端の位置、高
さ、及び互いからの水平方向の距離が考慮される。これ
ら2つの選択した境界箱73、75のうち一方が完全に
他方の境界箱内にある場合、これら2つの選択した境界
箱73、75は併合される。また、2つの選択した境界
箱73、75が隣接するとともに同じ行の上にある場
合、これら2つの境界箱73、75は併合される。すな
わち、これら2つの選択した境界箱間の上端位置から計
測した水平距離が所定の閾より下であり、これら2つの
選択した境界箱73、75の高さが同様である場合、こ
れら2つの境界箱は併合される。行併合のプロセスは、
行併合をおこなうことができなくなるまで繰り返され
る。その理由は、併合した境界箱は、第3の境界箱7
2、74とさらに併合することも可能であるからであ
る。
後、(図2の印刷テキスト行52が併合された)併合テ
キスト行82は、一様の高さの長い境界箱を形成する。
一定の形状を有する併合テキスト行82の境界箱は、垂
直方向の投影ヒストグラム56中の対のピーク57(図
2にも図示)と対応している。しかしながら、図4A及
び4Bに示すように、手書き注釈の境界箱74は、通
常、サイズが著しく異なる連結成分によりつくられる。
従って、手書き注釈の境界箱74が併合する可能性は概
して低く、通常は投影ヒストグラム56と対応しない。
刷テキスト行を削除するステップ24がより詳細に示さ
れている。垂直方向及び水平方向の投影ヒストグラム5
6及び62が生成された後、各併合テキスト行82と対
応するピークは、ピーク57として特徴付けられる。対
のピーク57の高さは同様であり、互いからの距離は所
定の範囲内である。対のピーク57は、各印刷テキスト
行の上端及び下端の位置をそれぞれ示す。対のピーク5
7の先端間の距離を用いて、対応する印刷テキスト行の
高さを計算することも可能である。垂直方向の投影ヒス
トグラム56が有するテキスト行のピーク57は、ステ
ップ90において検知される。
が検知された後、ステップ92において、対のピーク5
7間の中心に当る位置にある併合テキスト行82及び8
4がスキャンされる。ステップ94では、各併合テキス
ト行82及び84が個々に吟味され、余白内に全ての境
界箱72、74が位置するかどうかが判定される。境界
箱72、74が余白の内側にない場合、ステップ96に
おいて、併合テキスト行82、84は削除されない。そ
して、ステップ92で、ピーク57間の中心に当る位置
にある次の併合テキスト行82、84がスキャンされ
る。
満たす場合、ステップ98において、これらの境界箱は
さらに吟味され、その高さがピークの高さに近いかどう
かが判断される。境界箱72、74がピークの高さと同
様の高さを有していない場合、ステップ100におい
て、スキャンされた併合テキスト行82、84は削除さ
れない。そして、ステップ92で、ピーク57間の中心
に当る位置にある次の併合テキスト行がスキャンされ
る。境界箱72、74がステップ98の条件を満たす場
合、ステップ102において、スキャンされた併合テキ
スト行は印刷テキスト行であると見なされ、削除され
る。その後、印刷テキスト行削除ステップ24のプロセ
スはステップ92へと戻り、全ての併合テキスト行8
2、84がスキャンされるまで、併合テキスト行が次々
とスキャンされ続ける。
合された境界箱が吟味された後、ステップ106におい
て、次のピークが検知される。ステップ108におい
て、スキャンした文書イメージに対する同様の削除プロ
セスは、全てのピークが検知され且つ吟味されるまでお
こなわれる。印刷テキスト行削除ステップ24のプロセ
スにより、本文の可能性がある印刷テキスト行52(図
2)のみが確実に削除される。本文の可能性があるテキ
スト行のみを確実に削除するため、投影ヒストグラムの
ピークの位置及び幅は、削除する印刷テキスト行の位置
及び高さと照合確認される。従って、余白内にある併合
テキスト行82及び84のみが削除の対象として考慮さ
れる。
書き注釈54(図2)との間の区別をさらにつけるため
のステップ26を示す。印刷テキスト行削除ステップ2
4の後、印刷テキスト行の境界箱のうち僅かを除く、印
刷テキスト行の大多数が削除されている。例えば、テキ
スト行内の幾つかの小さな連結成分の境界箱は、削除さ
れていないことも考えられる。これらの小さな連結成分
には、通常の境界箱のサイズではない文章の句読点又は
特殊な記号が含まれる。非常に短い印刷テキスト行の境
界箱は、検知される可能性が低い。その理由は、投影ヒ
ストグラムにより示されるこれらの境界箱の低い輝度
は、その他の印刷テキスト行の一定のパターンの輝度と
同等でないからである。これに対し、手書き注釈の断片
の中の幾つかの小さな連結成分が削除されている場合が
ある。その理由は、これらの連結成分が偶然にも印刷テ
キスト行の余白内に位置するとともに、検知されたピー
クと揃っているためである。
の後、ステップ110において、アルゴリズムにより、
残った成分が所定の小さなサイズよりも小さいサイズを
有しているかどうかが判定される。これらの残った成分
のサイズが所定の小さなサイズよりも小さい場合、ステ
ップ112において、アルゴリズムにより、これらの残
った成分が削除されたテキスト行内あるいはその近傍に
あるかどうかが判定される。これらの残った成分が削除
されたテキスト行内あるいはその近傍にあると判定され
た場合、ステップ114において、これら残った成分は
文章内の句読点又は特殊な記号と見なされ、削除され
る。
行内あるいはその近傍にない場合、ステップ116にお
いて、アルゴリズムにより、これらの残った成分が他の
テキストから孤立しているかどうかが判定される。これ
らの残った成分が孤立している場合、ステップ118に
おいて、これらの残った成分はノイズと見なされ、削除
される。これらの残った成分が孤立していない場合、ス
テップ120において、これらの残った成分は手書き注
釈と見なされ、そのまま残される。
所定の小さなサイズよりも大きいサイズを有していると
判定された場合、ステップ122において、アルゴリズ
ムにより、これらの残った成分が所定の大きなサイズよ
りも大きいサイズを有しているかどうかが判定される。
これらの残った成分が所定の大きなサイズよりも大きい
サイズを有していると判定された場合、ステップ124
において、これらの残った成分は手書き注釈と見なさ
れ、そのまま残される。
なサイズよりも大きくない場合、ステップ126におい
て、これらの残った成分の高さと削除されたテキスト行
の大多数の高さとが比較されるとともに、これらの残っ
た成分の境界箱が余白内にあるかどうかが判定される。
これらの残った成分の高さが削除されたテキスト行の大
多数の高さと同様でないか、又はこれらの残った成分の
境界箱が文書の余白内にない場合、ステップ124にお
いて、残った成分は手書き注釈と見なされ、そのまま残
される。
件を満たす場合、ステップ128において、これらの残
った成分が左側の余白64(図2の投影ヒストグラム6
2の最初の急上昇64)と揃っているかどうかが判定さ
れる。これらの残った成分が左側の余白64と揃ってい
ない場合、ステップ124において、これらの残った成
分は手書き注釈と見なされ、そのまま残される。これら
の残った成分が左側の余白64と揃っている場合、ステ
ップ130において、これらの残った成分は、垂直方向
の投影ヒストグラム56のピークの輝度が低すぎて検知
できない短い印刷テキスト行と見なされ、削除される。
ステップ130では、テキスト行の削除により削除され
た各成分がさらに吟味され、手書き注釈に属する可能性
のある連結成分が削除されていないかどうかが判定され
る。本発明において、不規則な形状の一群に囲まれた境
界箱は、上述の条件を全て満たす場合でも手書き注釈と
見なされる。これらの不規則な形状の一群に囲まれた境
界箱は、ステップ26(図1)の最後で元に戻される。
した結果、及びスキャンした文書イメージ50(図2)
から手書き注釈を分離した結果をそれぞれ示す。分離ス
テップ28(図1)の後、手書き注釈は、行併合が行な
われた境界箱85として残され、印刷テキスト行は処分
されるか又は保存される。その後、手書き注釈54が抽
出されるが、これも処分されても良いし又は後の利用の
ために保存されて良い。
方法200に、どのように適用するかを第1の実施例と
して示している。ここで、文書は1つ以上のバージョ
ン、即ち、少なくともオリジナルバージョン(第1のバ
ージョン)と、修正されたバージョン(二次バージョ
ン)とを有していても良い。オリジナルバージョンは印
刷テキスト行のみを含むのに対し、二次バージョンは印
刷テキスト行と付加的な手書き注釈とを含む。紙の文書
をスキャンした場合、オリジナルバージョン(印刷テキ
スト行)は、文書のデーターベースに電子化されて存在
している場合もあるし、存在しない場合もある。
2では、手書き注釈とともに印刷テキスト行を有する文
書がスキャンされる。ステップ204においては、上述
のスキャンした文書イメージから手書き注釈を検知及び
分離する方法に従って、スキャンした文書イメージの手
書き注釈と印刷テキスト行とが区別される。ステップ2
06では、抽出された印刷テキスト行がデータベースの
全ての文書と比較され、ステップ208においては、デ
ータベースにオリジナルバージョンと同一のオリジナル
文書が存在するかどうかが判定される。ステップ208
において、抽出した印刷テキスト行と同一のオリジナル
文書がデータベースに存在する場合、この文書は、スキ
ャンした文書イメージのオリジナルバージョンとして確
認される。2つの同様の文書、即ち同一の文書を検知す
る方法は、幾つかの出版物により開示されている。19
97年2月に行なわれたIS&TとSPIE共催のエレ
クトロニック・イメージングに関するシンポジウムの文
書理解IVの議事録、「同一文書の検知」(88ページ〜
94ページ)("Duplicate document detection" in Pr
oceedings of Document Recognition IV(IS&T/SPIE El
ectronic Imaging),pages 88-94, February, 1997))
において、スピッツ(Spitz)は、文字形状のコードを
特徴として利用し、これらを標準のストリングマッチン
グアルゴリズムを用いて比較している。また、1997
年8月に行なわれた第4回文書解析・理解国際会議の議
事録の「文書イメージのデータベース中の同一データ検
知」(314ページから318ページ)("The detecti
on of duplicates in documentimage databases" in Pr
oceedings of the Fourth International Conferenceon
Document Analysis and Recognition, pages 314-318,
August 1997)において、ドゥアマン(Doermann)らは形
状コードを用い、同一文書の検知において生じる問題に
全体的なレイアウトの観点から対処している。
ル文書が発見されない場合、ステップ212において、
分離した印刷テキスト行がオリジナル文書として保存さ
れる。ステップ218では、手書き注釈及び印刷テキス
ト行を有するスキャンした文書イメージがこのオリジナ
ル文書の二次バージョンとして記録され、プロセスが終
了する。ステップ208で、分離した印刷テキスト行が
1つのオリジナル文書と関係している場合、ステップ2
10において、このオリジナル文書に修正が施されてい
るかどうか(オリジナル文書の二次バージョンが存在す
るかどうか)がさらに判定される。この確認されたオリ
ジナル文書が他に二次バージョンを有していない場合、
ステップ222において、スキャンした文書イメージ
が、同一と確認されたオリジナル文書の二次バージョン
として保存され、プロセスが終了する。同一と確認され
たオリジナル文書が少なくとも1つのバージョンを有す
る場合、ステップ220において、スキャンされた文書
が、同一と確認されたオリジナル文書の最新のバージョ
ンとして保存され、プロセスが終了する。上述の本発明
の適用は、特に、異なる位置及び時間において複数の人
々により修正された文書の履歴を保存する方法に対して
行なわれることを想定しているが、この方法に限定され
るものではない。
ージョンを確実に伝送する方法300に、どのように適
用するかを第2の実施例として示す。ここで、文書は2
つのバージョン、即ち、オリジナルバージョン及び少な
くとも1つの二次バージョンを有している。オリジナル
バージョンは印刷テキスト行を含むのに対し、二次バー
ジョンは印刷テキスト行とともに手書き注釈も含む。
2では、印刷テキスト行及び手書き注釈を有する文書の
二次バージョンがスキャンされる。次に、ステップ30
4において、上述の付加情報を検知及び分離する方法1
0(図1)に従って、手書き注釈が印刷テキスト行から分
離される。この分離の後、得られた文書を伝送する手段
は2つある。第1の手段(ステップ306)は、付加情
報である手書き注釈が伝送されてしまうのを回避する目
的で、抽出した印刷テキスト行のみを伝送するというも
のである。
ョン(印刷テキスト行)と同一のオリジナル文書がデー
タベースに存在するとき、このオリジナル文書を伝送す
る第2の手段(ステップ308)を用いることも可能で
ある。第2の手段(ステップ308)には、ステップ3
10、312及び314が含まれる。ステップ310に
おいて、抽出した印刷テキスト行とデータベース中の全
てのオリジナル文書とが比較される。ステップ312
で、抽出した印刷テキスト行と同一のオリジナル文書が
データベースから確認された場合、ステップ314にお
いて、この同一と確認されたオリジナル文書が代わりに
伝送される。抽出した印刷テキスト行と同一のオリジナ
ル文書が確認されない場合、ステップ306において、
抽出した印刷テキスト行が伝送される。時折、異なる時
間において、同一の文書の様々なバージョンが伝送され
るが、手書き注釈の分離結果における僅かな差異によ
り、それぞれの時間において異なる印刷テキスト行が抽
出されてしまうこともある。しかし、第2の手段(ステ
ップ308)を適用した場合、その度に、オリジナルバ
ージョンと同一のオリジナル文書が受取人に伝送され
る。上述の本発明の適用は、特に、手書きの秘密情報を
含む文書のオリジナルバージョンを確実に伝送する方法
に対して行なわれることを想定しているが、この方法に
限定されるものではない。
400に適用するかを第3の実施例として示す。ここ
で、文書は、データベースにオリジナル文書として保存
される印刷テキスト行を有するオリジナルバージョンを
含む一方、印刷テキスト行とともに手書き注釈も有する
二次バージョンをさらに含む。
402においては、印刷テキスト行及び手書き注釈を有
する文書の二次バージョンがスキャンされる。次に、ス
テップ404では、上述の付加情報を検知及び分離する
方法10(図1)に従って、手書き注釈が印刷テキスト行
から分離される。その後、ステップ406において、分
離した印刷テキスト行とデータベース中の全てのオリジ
ナル文書とが比較され、ステップ408において、分離
した印刷テキスト行と同一のオリジナル文書が発見され
る。印刷テキスト行と同一のオリジナル文書が存在しな
い場合、ステップ410において、抽出した印刷テキス
ト行がオリジナル文書として保存され、ステップ412
において、手書き注釈が異なる記憶場所に保存される。
ステップ414において、手書き注釈が保存された記憶
場所は、オリジナル文書の記憶場所と関連付けられ、プ
ロセスは終了する。抽出したテキスト行と同一のオリジ
ナル文書がデータベース中にあった場合、ステップ41
6において、手書き注釈のみが保存され、ステップ41
8で、この手書き注釈と確認されたオリジナル文書とが
関連付けられ、プロセスが終了する。この場合、抽出し
た印刷テキスト行は無視され、記憶場所のスペースが節
約される。
広範な教示が様々な形で実現可能であることが理解でき
る。従って、本発明を具体例と関連して説明してきた
が、本発明の真の範囲はこれらにより限定されるべきで
はない。その理由は、本発明の図面、明細書、及び特許
請求の範囲を検討することにより、本発明の変更が可能
であることは、当業者にとって明らかであるからであ
る。
書き注釈を検知及び分離する方法を示すフローチャー
ト。
に垂直方向及び水平方向の投影ヒストグラムが配置され
た、スキャンした文書イメージのサンプルを示す図。
どのように連結成分の解析(図3B)を行なうかを例示
する図。
の境界箱(図4A)に対してどのように行併合(図4
B)を行なうかを例示する図。
工程を示すフローチャート。
テキスト行と手書き注釈とをさらに区別する工程を示す
フローチャート。
釈の境界箱を検知及び分離した状態を示す図。
手書き注釈を示す図。
ョンを有する文書の履歴を記録する方法に対して本発明
をどのように適用するかを示すフローチャート。
報を有する文書の伝送を確実にする方法に対して本発明
をどのように適用するかを示すフローチャート。
して本発明をどのように適用するかを示すフローチャー
ト。
上昇 60 垂直方向の投影ヒストグラム56の最後の急
降下 62 水平方向の投影ヒストグラム 64 水平方向の投影ヒストグラム62の最初の急
上昇(左側の余白) 66 水平方向の投影ヒストグラム62の最後の急
降下 72 印刷テキスト行の境界箱 74 手書き注釈の境界箱 82 併合テキスト行 84 併合テキスト行 85 行併合が行なわれた境界箱 200 文書の履歴を記録する方法 300 文書のオリジナルバージョンを確実に伝送す
る方法 400 圧縮方法
Claims (21)
- 【請求項1】 手書き注釈及び少なくとも1つの印刷テ
キスト行を有するスキャンした文書イメージから上記手
書き注釈を検知する方法であって、 上記印刷テキスト行と相関する一定のパターンを含む少
なくとも1つの投影ヒストグラムを、上記スキャンした
文書イメージに関して生成する工程と、 上記スキャンした文書イメージに対して連結成分の解析
をおこなうことにより、上記手書き注釈及び上記印刷テ
キスト行のうち少なくとも一方とそれぞれ相関する少な
くとも1つの併合テキスト行を生成する工程と、 上記併合テキスト行と上記投影ヒストグラムの一定のパ
ターンとを比較することにより、上記手書き注釈と上記
印刷テキスト行とを区別する工程とを備えた方法。 - 【請求項2】 上記一定のパターンは、上記印刷テキス
ト行の余白である請求項1記載の方法。 - 【請求項3】 上記投影ヒストグラムは、垂直方向の投
影ヒストグラム、水平方向の投影ヒストグラム、及びこ
れらの組み合わせの中から選択される請求項1記載の方
法。 - 【請求項4】 上記スキャンした文書イメージの投影ヒ
ストグラムからテキスト行のピークを検知する工程をさ
らに備えた請求項1記載の方法。 - 【請求項5】 上記連結成分の解析をおこなう工程は、 上記スキャンした文書イメージ上の互いに関係する暗色
画素を連結することにより、連結成分を生成する工程
と、 上記連結成分の境界箱を生成する工程と、 同じテキスト行内の上記境界箱の行併合をおこなうこと
により、上記併合テキスト行を生成する工程とをさらに
備えた請求項1記載の方法。 - 【請求項6】 上記行併合工程は、行併合をおこなう境
界箱が同じテキスト行に存在しなくなるまで繰り返され
る請求項5記載の方法。 - 【請求項7】 上記境界箱の1つが完全に別の境界箱内
にある場合、上記行併合工程により、これら2つの境界
箱が併合される請求項5記載の方法。 - 【請求項8】 上記境界箱のうちの2つが隣接するとと
もに同じ行の上にある場合、上記行併合工程により、こ
れら2つの境界箱が併合される請求項5記載の方法。 - 【請求項9】 上記境界箱のサイズと上記印刷テキスト
行のサイズとを比較することにより、上記印刷テキスト
行と上記手書き注釈とを分離する工程をさらに備えた請
求項1記載の方法。 - 【請求項10】 手書き注釈及び少なくとも1つの印刷
テキスト行を有するスキャンした文書イメージから上記
手書き注釈を検知する方法であって、 上記印刷テキスト行と相関する余白を含む垂直方向及び
水平方向の投影ヒストグラムを、上記スキャンした文書
イメージに関して生成する工程と、 上記スキャンした文書イメージ上で互いに関連する暗色
画素を連結することにより、連結成分を生成する工程
と、 上記連結成分のうち互いに関係する連結成分を全て囲む
境界箱を生成する工程と、 同じテキスト行内の上記境界箱の行併合をおこなうこと
により、上記手書き注釈及び上記印刷テキスト行のうち
少なくとも一方とそれぞれ相関する少なくとも1つの併
合テキスト行を生成する工程と、 上記スキャンした文書イメージの垂直方向の投影ヒスト
グラムからテキスト行のピークを検知する工程と、 上記併合テキスト行と上記垂直方向及び水平方向の投影
ヒストグラムから特定された余白とを比較することによ
り、上記手書き注釈と上記印刷テキスト行とを区別する
工程とを備えた方法。 - 【請求項11】 文書の履歴を記録する方法であって、 印刷テキスト行及び手書き注釈を有する文書をスキャン
する工程と、 上記スキャンした文書の印刷テキスト行から上記手書き
注釈を分離する工程と、 上記スキャンした文書と上記印刷テキスト行のみを含む
オリジナル文書とを比較する工程と、 上記オリジナル文書の前のバージョンの存在を判定する
工程と、 上記分離した手書き注釈に基づき、上記スキャンした文
書の履歴を記録する工程とを備えた方法。 - 【請求項12】 上記スキャンした文書イメージの印刷
テキスト行から上記手書き注釈を分離する工程は、 上記印刷テキスト行と相関する一定のパターンを含む少
なくとも1つの投影ヒストグラムを、上記スキャンした
文書イメージに関して生成する工程と、 上記スキャンした文書イメージに対して連結成分の解析
をおこなうことにより、上記手書き注釈及び上記印刷テ
キスト行のうち少なくとも一方とそれぞれ関係する少な
くとも1つの併合テキスト行を生成する工程と、 上記併合テキスト行と上記投影ヒストグラムの一定のパ
ターンとを比較することにより、上記手書き注釈と上記
印刷テキスト行とを区別する工程とをさらに備えた請求
項11記載の方法。 - 【請求項13】 上記連結成分の解析をおこなう工程
は、 上記スキャンした文書イメージ上で互いに関係する暗色
画素を連結することにより、連結成分を生成する工程
と、 上記連結成分の境界箱を生成する工程と、 同じテキスト行内の上記境界箱の行併合をおこなうこと
により、上記併合テキスト行を生成する工程とをさらに
備えた請求項12記載の方法。 - 【請求項14】 上記オリジナル文書の存在を検知する
工程と、 上記スキャンした文書の印刷テキスト行と上記検知した
オリジナル文書とが異なるとき、上記印刷テキスト行を
上記オリジナル文書として保存する工程と、 上記スキャンした文書を、上記オリジナル文書の二次バ
ージョンとして記録する工程とをさらに備えた請求項1
1記載の方法。 - 【請求項15】 上記文書の履歴を記録する工程は、 上記オリジナル文書の前のバージョンが検知されなかっ
た場合、上記スキャンした文書を上記オリジナル文書の
二次バージョンとして記録する工程と、 上記オリジナル文書の前のバージョンが少なくとも1つ
検知された場合、上記スキャンした文書を上記オリジナ
ル文書の最新のバージョンとして記録する工程とをさら
に備えた請求項11記載の方法。 - 【請求項16】 印刷テキスト行のみを含むオリジナル
バージョンと、印刷テキスト行及び手書き注釈を含む少
なくとも1つの二次バージョンとを有する文書のうち上
記オリジナルバージョンの文書を確実に伝送する方法で
あって、 上記少なくとも1つの二次バージョンの文書における手
書き注釈から上記印刷テキスト行を分離する工程と、 上記手書き注釈から分離した印刷テキスト行と関係する
オリジナルバージョンの文書を判定する工程と、 上記オリジナルバージョンの文書を判定する工程の後、
上記印刷テキスト行を伝送する工程とを備えた方法。 - 【請求項17】 上記手書き注釈から上記印刷テキスト
行を分離する工程は、 上記印刷テキスト行と相関する余白を含む垂直方向及び
水平方向の投影ヒストグラムを、上記スキャンした文書
イメージに関して生成する工程と、 上記スキャンした文書イメージ上の互いに関連する暗色
画素を連結することにより、連結成分を生成する工程
と、 上記連結成分のうち互いに関係する連結成分を全て囲む
境界箱を生成する工程と、 同じテキスト行内の上記境界箱の行併合をおこなうこと
により、上記手書き注釈及び上記印刷テキスト行のうち
少なくとも一方とそれぞれ相関する少なくとも1つの併
合テキスト行を生成する工程と、 上記スキャンした文書イメージの垂直方向の投影ヒスト
グラムからテキスト行のピークを検知する工程と、 上記併合テキスト行と上記垂直方向及び水平方向の投影
ヒストグラムから特定された余白とを比較することによ
り、上記手書き注釈と上記印刷テキスト行とを区別する
工程とをさらに備えた請求項16記載の方法。 - 【請求項18】 上記伝送工程は、 上記印刷テキスト行が上記オリジナルバージョンの文書
と同一であるとき、上記オリジナルバージョンを伝送す
る工程と、 上記印刷テキスト行が上記オリジナルバージョンの文書
と異なるとき、上記印刷テキスト行を伝送する工程とを
さらに備えた請求項17記載の方法。 - 【請求項19】 印刷テキスト行のみを含むオリジナル
バージョンと、印刷テキスト行及び手書き注釈を含む少
なくとも1つの二次バージョンとを有する文書を、デー
タベース中に蓄えられたオリジナルバージョンの文書を
用いて効率的に圧縮する方法であって、 上記少なくとも1つの二次バージョンの文書をスキャン
する工程と、 上記少なくとも1つの二次バージョンの文書における上
記手書き注釈から上記印刷テキスト行を分離する工程
と、 上記印刷テキスト行と上記オリジナルバージョンの文書
とを比較する工程と、 上記オリジナルバージョンの文書に関連して上記手書き
注釈のみを保存する工程とを備えた方法。 - 【請求項20】 上記手書き注釈から上記印刷テキスト
行を分離する工程は、 上記印刷テキスト行と相関する余白を含む垂直方向及び
水平方向の投影ヒストグラムを、上記スキャンした文書
イメージに関して生成する工程と、 上記スキャンした文書イメージ上の互いに関連する暗色
画素を連結することにより、連結成分を生成する工程
と、 上記連結成分のうち互いに関係する連結成分を全て囲む
境界箱を生成する工程と、 同じテキスト行内の上記境界箱の行併合をおこなうこと
により、上記手書き注釈及び上記印刷テキスト行のうち
少なくとも一方とそれぞれ相関する少なくとも1つの併
合テキスト行を生成する工程と、 上記スキャンした文書イメージの垂直方向の投影ヒスト
グラムからテキスト行のピークを検知する工程と、 上記併合テキスト行と上記垂直方向及び水平方向の投影
ヒストグラムから特定された余白とを比較することによ
り、上記手書き注釈と上記印刷テキスト行とを区別する
工程とをさらに備えた請求項19記載の方法。 - 【請求項21】 上記手書き注釈を保存する工程は、 上記手書き注釈と上記データベース中のオリジナルバー
ジョンとを関連付ける工程をさらに備えた請求項19記
載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/773,213 US6909805B2 (en) | 2001-01-31 | 2001-01-31 | Detecting and utilizing add-on information from a scanned document image |
US09/773,213 | 2001-01-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002319025A true JP2002319025A (ja) | 2002-10-31 |
JP3623200B2 JP3623200B2 (ja) | 2005-02-23 |
Family
ID=25097551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002021702A Expired - Lifetime JP3623200B2 (ja) | 2001-01-31 | 2002-01-30 | スキャンした文書イメージの付加情報の検知及び利用方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6909805B2 (ja) |
EP (1) | EP1229485A3 (ja) |
JP (1) | JP3623200B2 (ja) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006201885A (ja) * | 2005-01-18 | 2006-08-03 | Sharp Corp | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 |
JP2008009785A (ja) * | 2006-06-30 | 2008-01-17 | Fuji Xerox Co Ltd | 画像処理システムおよび画像処理プログラム |
JP2008084324A (ja) * | 2006-09-28 | 2008-04-10 | Ricoh Co Ltd | 文書管理システム、装置、及び方法 |
KR100847037B1 (ko) | 2005-03-29 | 2008-07-17 | 후지제롯쿠스 가부시끼가이샤 | 주석 데이터를 추출하여 분류하는 프로그램이 기록된 매체및, 주석 데이터 처리 장치 및 방법 |
JP2008181485A (ja) * | 2006-12-28 | 2008-08-07 | Konica Minolta Business Technologies Inc | 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム |
JP2011018337A (ja) * | 2009-07-10 | 2011-01-27 | Palo Alto Research Center Inc | 文書内のテキスト行を区分するための方法 |
US8339619B2 (en) | 2003-11-14 | 2012-12-25 | Canon Kabushiki Kaisha | System and image processing method and apparatus for re-using and re-editing images |
JP2013127823A (ja) * | 2013-03-28 | 2013-06-27 | Seiko Epson Corp | 検索装置およびプログラム |
US8508756B2 (en) | 2006-12-28 | 2013-08-13 | Konica Minolta Business Technologies, Inc. | Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions |
Families Citing this family (78)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6561422B1 (en) * | 1999-05-03 | 2003-05-13 | Hewlett-Packard Development Company | System and method for high-contrast marking and reading |
US6940617B2 (en) * | 2001-02-09 | 2005-09-06 | Matsushita Electric Industrial Co., Ltd. | Printing control interface system and method with handwriting discrimination capability |
JP3864246B2 (ja) * | 2001-05-30 | 2006-12-27 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 画像処理方法、画像処理システムおよびプログラム |
US20030004991A1 (en) * | 2001-06-29 | 2003-01-02 | Keskar Dhananjay V. | Correlating handwritten annotations to a document |
US7013029B2 (en) * | 2001-06-29 | 2006-03-14 | Intel Corporation | Incorporating handwritten notations into an electronic document |
US7712028B2 (en) * | 2001-10-19 | 2010-05-04 | Xerox Corporation | Using annotations for summarizing a document image and itemizing the summary based on similar annotations |
US7120299B2 (en) | 2001-12-28 | 2006-10-10 | Intel Corporation | Recognizing commands written onto a medium |
JP2004145072A (ja) * | 2002-10-25 | 2004-05-20 | Riso Kagaku Corp | 手書き文字フォント作成装置及び手書き文字フォント作成プログラム |
US20040139391A1 (en) * | 2003-01-15 | 2004-07-15 | Xerox Corporation | Integration of handwritten annotations into an electronic original |
US7415667B2 (en) * | 2003-01-31 | 2008-08-19 | Ricoh Company, Ltd. | Generating augmented notes and synchronizing notes and document portions based on timing information |
US7072514B1 (en) * | 2003-02-06 | 2006-07-04 | The United States Of America As Represented By The National Security Agency | Method of distinguishing handwritten and machine-printed images |
US7826101B2 (en) * | 2003-06-25 | 2010-11-02 | Ricoh Company, Ltd. | Document management method, document management program, recording medium, and document management apparatus |
US20050038788A1 (en) * | 2003-08-14 | 2005-02-17 | International Business Machines Corporation | Annotation security to prevent the divulgence of sensitive information |
US7840067B2 (en) * | 2003-10-24 | 2010-11-23 | Arcsoft, Inc. | Color matching and color correction for images forming a panoramic image |
US20050094192A1 (en) * | 2003-11-03 | 2005-05-05 | Harris Rodney C. | Systems and methods for enabling electronic document ratification |
US7962846B2 (en) | 2004-02-13 | 2011-06-14 | Microsoft Corporation | Organization of annotated clipping views |
JP2006092027A (ja) * | 2004-09-21 | 2006-04-06 | Fuji Xerox Co Ltd | 文字認識装置、文字認識方法および文字認識プログラム |
JP2006092346A (ja) * | 2004-09-24 | 2006-04-06 | Fuji Xerox Co Ltd | 文字認識装置、文字認識方法および文字認識プログラム |
JP4477468B2 (ja) * | 2004-10-15 | 2010-06-09 | 富士通株式会社 | 組み立て図面の装置部品イメージ検索装置 |
US7302098B2 (en) * | 2004-12-03 | 2007-11-27 | Motorola, Inc. | Character segmentation method and apparatus |
US8645821B2 (en) * | 2010-09-28 | 2014-02-04 | Xerox Corporation | System and method for page frame detection |
JP4466378B2 (ja) * | 2005-01-11 | 2010-05-26 | 株式会社ニコン | 履歴付加装置、電子カメラ、および画像処理プログラム |
JP4240050B2 (ja) * | 2006-04-13 | 2009-03-18 | コニカミノルタビジネステクノロジーズ株式会社 | 文書管理装置、文書管理方法及び文書管理プログラム |
US20070247655A1 (en) * | 2006-04-21 | 2007-10-25 | Microsoft Corporation | Dynamic printer system |
US8014040B2 (en) * | 2006-04-21 | 2011-09-06 | Microsoft Corporation | Dynamic scanner system |
US8115948B2 (en) | 2006-04-21 | 2012-02-14 | Microsoft Corporation | Interactive paper system |
US8213687B2 (en) * | 2006-04-28 | 2012-07-03 | Hewlett-Packard Development Company, L.P. | Image processing methods, image processing systems, and articles of manufacture |
US7478332B2 (en) * | 2006-05-24 | 2009-01-13 | 170 Systems Inc. | System for and method of providing a user interface for a computer-based software application |
JP2007335920A (ja) * | 2006-06-12 | 2007-12-27 | Fuji Xerox Co Ltd | 画像処理装置および画像処理プログラム |
JP4933993B2 (ja) * | 2006-09-19 | 2012-05-16 | 株式会社リコー | 画像管理方法及び画像処理装置 |
US8265382B2 (en) * | 2007-05-29 | 2012-09-11 | Livescribe, Inc. | Electronic annotation of documents with preexisting content |
US8194257B2 (en) * | 2007-11-15 | 2012-06-05 | Hewlett-Packard Development Company, Lp. | Simplified operation of scan based devices |
US20090202151A1 (en) * | 2008-02-13 | 2009-08-13 | Kabushiki Kaisha Toshiba | Format processing apparatus for document image and format processing method for the same |
US8240554B2 (en) * | 2008-03-28 | 2012-08-14 | Keycorp | System and method of financial instrument processing with duplicate item detection |
US8631079B2 (en) * | 2008-06-20 | 2014-01-14 | Microsoft Corporation | Displaying a list of file attachments associated with a message thread |
JP5014284B2 (ja) * | 2008-08-08 | 2012-08-29 | キヤノン株式会社 | 画像処理装置、画像処理方法、およびプログラム |
TWI385584B (zh) * | 2008-11-05 | 2013-02-11 | Avermedia Information Inc | 自動排列手寫字串之裝置及方法 |
CN102171541B (zh) * | 2009-01-06 | 2013-03-27 | 西门子医疗保健诊断公司 | 用于使用成像确定容器中的液面的方法和装置 |
US9767354B2 (en) | 2009-02-10 | 2017-09-19 | Kofax, Inc. | Global geographic information retrieval, validation, and normalization |
US8832853B2 (en) | 2009-12-07 | 2014-09-09 | Dst Technologies, Inc. | Managed virtual point to point communication service having verified directory, secure transmission and controlled delivery |
US8948535B2 (en) * | 2010-01-27 | 2015-02-03 | Dst Technologies, Inc. | Contextualizing noisy samples by substantially minimizing noise induced variance |
US8600173B2 (en) | 2010-01-27 | 2013-12-03 | Dst Technologies, Inc. | Contextualization of machine indeterminable information based on machine determinable information |
US8824785B2 (en) * | 2010-01-27 | 2014-09-02 | Dst Technologies, Inc. | Segregation of handwritten information from typographic information on a document |
US8606046B2 (en) | 2010-06-21 | 2013-12-10 | Palo Alto Research Center Incorporated | System and method for clean document reconstruction from annotated document images |
US9081412B2 (en) | 2010-07-31 | 2015-07-14 | Hewlett-Packard Development Company, L.P. | System and method for using paper as an interface to computer applications |
US8731296B2 (en) | 2011-04-21 | 2014-05-20 | Seiko Epson Corporation | Contact text detection in scanned images |
US9135512B2 (en) | 2011-04-30 | 2015-09-15 | Hewlett-Packard Development Company, L.P. | Fiducial marks on scanned image of document |
JP5948866B2 (ja) * | 2011-12-27 | 2016-07-06 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
US9165188B2 (en) | 2012-01-12 | 2015-10-20 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US10146795B2 (en) | 2012-01-12 | 2018-12-04 | Kofax, Inc. | Systems and methods for mobile image capture and processing |
US8837830B2 (en) * | 2012-06-12 | 2014-09-16 | Xerox Corporation | Finding text in natural scenes |
US9418310B1 (en) * | 2012-06-21 | 2016-08-16 | Amazon Technologies, Inc. | Assessing legibility of images |
US9569679B1 (en) * | 2012-12-04 | 2017-02-14 | A9.Com, Inc. | Adaptive image sampling for text detection |
US9286280B2 (en) | 2012-12-10 | 2016-03-15 | International Business Machines Corporation | Utilizing classification and text analytics for optimizing processes in documents |
US10430506B2 (en) | 2012-12-10 | 2019-10-01 | International Business Machines Corporation | Utilizing classification and text analytics for annotating documents to allow quick scanning |
FR3002353B1 (fr) * | 2013-02-15 | 2016-06-10 | Sagemcom Documents Sas | Procede et un dispositif de decision parmi un ensemble d'images constituees de pixels, d'au moins une image pour laquelle un traitement de ladite image est pertinent. |
US9355312B2 (en) | 2013-03-13 | 2016-05-31 | Kofax, Inc. | Systems and methods for classifying objects in digital images captured using mobile devices |
US10127636B2 (en) | 2013-09-27 | 2018-11-13 | Kofax, Inc. | Content-based detection and three dimensional geometric reconstruction of objects in image and video data |
US9098217B2 (en) | 2013-03-22 | 2015-08-04 | Hewlett-Packard Development Company, L.P. | Causing an action to occur in response to scanned data |
US20140316841A1 (en) | 2013-04-23 | 2014-10-23 | Kofax, Inc. | Location-based workflows and services |
JP2016538783A (ja) | 2013-11-15 | 2016-12-08 | コファックス, インコーポレイテッド | モバイル映像データを用いて長尺文書の合成画像を生成するためのシステムおよび方法 |
JP2016015115A (ja) * | 2014-06-09 | 2016-01-28 | 株式会社リコー | 情報処理装置、情報処理方法、及び記録媒体 |
US9760788B2 (en) | 2014-10-30 | 2017-09-12 | Kofax, Inc. | Mobile document detection and orientation based on reference object characteristics |
US10242285B2 (en) | 2015-07-20 | 2019-03-26 | Kofax, Inc. | Iterative recognition-guided thresholding and data extraction |
US10552699B2 (en) | 2016-12-27 | 2020-02-04 | Datalogic Usa, Inc. | Robust string text detection for industrial optical character recognition |
US10621693B2 (en) * | 2016-12-28 | 2020-04-14 | Ancestry.Com Operations Inc. | 2D multi-coordinate adaptive dynamics programming method for robust document registration |
US10121072B1 (en) * | 2016-12-30 | 2018-11-06 | Intuit Inc. | Unsupervised removal of text from form images |
US10496894B2 (en) * | 2017-03-31 | 2019-12-03 | Tata Consultancy Services Limited | System and method for text localization in images |
US11062176B2 (en) | 2017-11-30 | 2021-07-13 | Kofax, Inc. | Object detection and image cropping using a multi-detector approach |
US11616816B2 (en) * | 2018-12-28 | 2023-03-28 | Speedchain, Inc. | Distributed ledger based document image extracting and processing within an enterprise system |
US10783323B1 (en) * | 2019-03-14 | 2020-09-22 | Michael Garnet Hawkes | Analysis system |
EP4014201A1 (en) * | 2019-08-14 | 2022-06-22 | F. Hoffmann-La Roche AG | Three dimensional object segmentation of medical images localized with object detection |
US11176410B2 (en) * | 2019-10-27 | 2021-11-16 | John Snow Labs Inc. | Preprocessing images for OCR using character pixel height estimation and cycle generative adversarial networks for better character recognition |
WO2021087334A1 (en) | 2019-11-01 | 2021-05-06 | Vannevar Labs, Inc. | Neural network-based optical character recognition |
US11106858B2 (en) * | 2020-01-16 | 2021-08-31 | Adobe Inc. | Merging selected digital point text objects while maintaining visual appearance fidelity |
US11074473B1 (en) * | 2020-01-21 | 2021-07-27 | Capital One Services, Llc | Systems and methods for digitized document image text contouring |
CN111860479B (zh) * | 2020-06-16 | 2024-03-26 | 北京百度网讯科技有限公司 | 光学字符识别方法、装置、电子设备及存储介质 |
JP2022092119A (ja) * | 2020-12-10 | 2022-06-22 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0750483B2 (ja) * | 1985-05-22 | 1995-05-31 | 株式会社日立製作所 | 文書画像追加情報の蓄積方法 |
US4949392A (en) * | 1988-05-20 | 1990-08-14 | Eastman Kodak Company | Document recognition and automatic indexing for optical character recognition |
US5159667A (en) * | 1989-05-31 | 1992-10-27 | Borrey Roland G | Document identification by characteristics matching |
US5181255A (en) * | 1990-12-13 | 1993-01-19 | Xerox Corporation | Segmentation of handwriting and machine printed text |
US5119433A (en) * | 1990-03-12 | 1992-06-02 | International Business Machines Corporation | Method and system for locating the amount field on a document |
US5063600A (en) * | 1990-05-14 | 1991-11-05 | Norwood Donald D | Hybrid information management system for handwriting and text |
US5237628A (en) * | 1991-06-03 | 1993-08-17 | Nynex Corporation | System and method for automatic optical data entry |
CA2045907C (en) * | 1991-06-28 | 1998-12-15 | Gerald B. Anderson | A method for storing and retrieving annotations and redactions in final form documents |
US5243149A (en) * | 1992-04-10 | 1993-09-07 | International Business Machines Corp. | Method and apparatus for improving the paper interface to computing systems |
US5680479A (en) * | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
US5668897A (en) * | 1994-03-15 | 1997-09-16 | Stolfo; Salvatore J. | Method and apparatus for imaging, image processing and data compression merge/purge techniques for document image databases |
US5897648A (en) * | 1994-06-27 | 1999-04-27 | Numonics Corporation | Apparatus and method for editing electronic documents |
JP3547025B2 (ja) * | 1994-08-23 | 2004-07-28 | 株式会社リコー | 情報抽出方法 |
US6178431B1 (en) * | 1994-10-05 | 2001-01-23 | International Business Machines Corporation | Method and system for providing side notes in word processing |
US6301386B1 (en) * | 1998-12-09 | 2001-10-09 | Ncr Corporation | Methods and apparatus for gray image based text identification |
JP2000181993A (ja) * | 1998-12-16 | 2000-06-30 | Fujitsu Ltd | 文字認識方法および装置 |
US6721921B1 (en) * | 2000-07-26 | 2004-04-13 | Itm Associates | Method and system for annotating documents using an independent annotation repository |
-
2001
- 2001-01-31 US US09/773,213 patent/US6909805B2/en not_active Expired - Fee Related
-
2002
- 2002-01-09 EP EP02250136A patent/EP1229485A3/en not_active Withdrawn
- 2002-01-30 JP JP2002021702A patent/JP3623200B2/ja not_active Expired - Lifetime
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8339619B2 (en) | 2003-11-14 | 2012-12-25 | Canon Kabushiki Kaisha | System and image processing method and apparatus for re-using and re-editing images |
JP2006201885A (ja) * | 2005-01-18 | 2006-08-03 | Sharp Corp | 画像判断装置、画像形成装置、画像判断方法、画像判断プログラム、画像形成プログラムおよびコンピュータ読取り可能な記録媒体 |
KR100847037B1 (ko) | 2005-03-29 | 2008-07-17 | 후지제롯쿠스 가부시끼가이샤 | 주석 데이터를 추출하여 분류하는 프로그램이 기록된 매체및, 주석 데이터 처리 장치 및 방법 |
US7703001B2 (en) | 2005-03-29 | 2010-04-20 | Fuji Xerox Co., Ltd. | Media storing a program to extract and classify annotation data, and apparatus and method for processing annotation data |
JP2008009785A (ja) * | 2006-06-30 | 2008-01-17 | Fuji Xerox Co Ltd | 画像処理システムおよび画像処理プログラム |
JP2008084324A (ja) * | 2006-09-28 | 2008-04-10 | Ricoh Co Ltd | 文書管理システム、装置、及び方法 |
JP2008181485A (ja) * | 2006-12-28 | 2008-08-07 | Konica Minolta Business Technologies Inc | 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム |
US8508756B2 (en) | 2006-12-28 | 2013-08-13 | Konica Minolta Business Technologies, Inc. | Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions |
JP2011018337A (ja) * | 2009-07-10 | 2011-01-27 | Palo Alto Research Center Inc | 文書内のテキスト行を区分するための方法 |
JP2013127823A (ja) * | 2013-03-28 | 2013-06-27 | Seiko Epson Corp | 検索装置およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
US6909805B2 (en) | 2005-06-21 |
US20020102022A1 (en) | 2002-08-01 |
EP1229485A3 (en) | 2004-05-26 |
EP1229485A2 (en) | 2002-08-07 |
JP3623200B2 (ja) | 2005-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3623200B2 (ja) | スキャンした文書イメージの付加情報の検知及び利用方法 | |
Clark et al. | Pdffigures 2.0: Mining figures from research papers | |
JP3282860B2 (ja) | 文書上のテキストのデジタル画像を処理する装置 | |
US6694053B1 (en) | Method and apparatus for performing document structure analysis | |
US9218326B2 (en) | Method and apparatus for detecting pagination constructs including a header and a footer in legacy documents | |
JP3232144B2 (ja) | 文章中の単語文節の出現頻度を求めるための装置 | |
CA2078423C (en) | Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information | |
US7705848B2 (en) | Method of identifying semantic units in an electronic document | |
CA2077274C (en) | Method and apparatus for summarizing a document without document image decoding | |
CN101443790B (zh) | 数字图像中的非回流内容的有效处理 | |
US5761686A (en) | Embedding encoded information in an iconic version of a text image | |
US5164899A (en) | Method and apparatus for computer understanding and manipulation of minimally formatted text documents | |
US7697757B2 (en) | Computer assisted document modification | |
US7991709B2 (en) | Method and apparatus for structuring documents utilizing recognition of an ordered sequence of identifiers | |
US9098581B2 (en) | Method for finding text reading order in a document | |
Déjean et al. | A system for converting PDF documents into structured XML format | |
US20070027749A1 (en) | Advertisement detection | |
US9436882B2 (en) | Automated redaction | |
JP2008146605A (ja) | 画像処理装置及びその制御方法 | |
JP2008022159A (ja) | 文書処理装置及び文書処理方法 | |
JP2006221569A (ja) | 文書処理システム、文書処理方法、プログラムおよび記憶媒体 | |
JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
US20130329263A1 (en) | Image processing apparatus, and image processing method and program therefor | |
WO2007070010A1 (en) | Improvements in electronic document analysis | |
JP4480109B2 (ja) | 画像管理装置および画像管理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040720 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041026 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041122 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3623200 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071203 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081203 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091203 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091203 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101203 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101203 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111203 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111203 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121203 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121203 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term |