JP2000115476A - 走査画像の領域を操作するためのシステム及び方法 - Google Patents

走査画像の領域を操作するためのシステム及び方法

Info

Publication number
JP2000115476A
JP2000115476A JP11270886A JP27088699A JP2000115476A JP 2000115476 A JP2000115476 A JP 2000115476A JP 11270886 A JP11270886 A JP 11270886A JP 27088699 A JP27088699 A JP 27088699A JP 2000115476 A JP2000115476 A JP 2000115476A
Authority
JP
Japan
Prior art keywords
area
user
text
scan
logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11270886A
Other languages
English (en)
Inventor
Steven J Simske
スティーブン・ジェイ・シムスケ
P Lee Jeffrey
ジェフリー・ピー・リー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JP2000115476A publication Critical patent/JP2000115476A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Facsimiles In General (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【課題】 走査画像の領域をリアルタイムで操作するた
めのシステムを提供する。 【解決手段】 本発明のシステムは、スキャナ(11)に
よって生成される領域情報を操作するためのシステム
(100)であって、文書解析ソフトウェアコンポーネン
ト(17)と、文書解析ソフトウェアコンポーネント(1
7)と連絡するユーザインタフェース(13)と、ユーザ
インタフェース(13)が走査画像に割り当てられる属性
の少なくとも1つの操作(36、37)を可能にするよう構
成されることと、を備えることを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般に電子走査機
器に関し、より詳細には走査画像の領域を操作するため
のシステム及び方法に関する。
【0002】
【従来の技術】走査機器は、印刷された形式から電子形
式に画像を変換して転送することが望ましい多くのアプ
リケーションにおいて有益である。ページを読み取り電
子フォーマットに変換可能なスキャナは、長期にわたっ
て利用されてきた。典型的にはスキャナは、ページを電
子的に読み取り、ページ上の様々なタイプの画像を分類
して、後で表示し使用するために情報を電子的に記憶す
る。通常、走査されるページの分類のタイプは、テキス
ト、写真、図面、チャート、テーブル、ビジネス用グラ
フィックス、数式、手書き、ロゴ等が含まれる。これら
の走査画像の様々なパーツは、典型的にはスキャナがペ
ージを走査した後でユーザによって領域に分類される。
スキャナには、走査されるページの特定領域の分類を所
定の命令によって決定することが可能なものもある。
【0003】例えばテキストと図面を含むページでは、
ページを走査し、テキスト情報をテキスト領域として分
類して記憶したり、図面情報を図面領域として分類して
記憶する等を行うスキャナもある。残念ながらスキャナ
は、ユーザが所望するのとは異なる方法でいくつかの領
域を解釈してしまうこともあり得る。ユーザに表示され
るべき走査画像の属性については、同一の走査情報でも
様々な解釈が可能である。例えばスキャナ、より正確に
はスキャナ解析コードが、テキストのある特定区域(例
えば大きな頭文字で印刷された段落の最初の文字)を図
面情報として分類することもあり、また別の例として、
背景が色づけされたテキストをテキストとして表示すべ
きか、あるいは全ての背景ピクセルを含むビットマップ
の一部として表示すべきかをスキャナ解析コードが判断
しなければならない。これらの予め定められた分類を受
け入れるスキャナユーザもいれば、分類された各領域タ
イプに関してスキャナの感度を変更、すなわち調整する
か、あるいはこれらの領域をグループ化、すなわちクラ
スタ化の仕方を変更できることを望むユーザもいる。
【0004】例えば、ページの情報をワードプロセッサ
文書に入力するためにそのページを走査するだけでよ
く、それ以上の操作を望まないユーザもいる。また別の
ユーザは、同じページを走査してもそのページの情報を
より洗練された方法で操作することを望むかもしれな
い。
【0005】さらに、スキャナが領域もしくは領域の組
をある特定のフォーマットで解析し、解釈してユーザに
表示すると、通常その領域は調整可能ではなくなる。
【0006】領域には、一般に4つの主要なクラスがあ
る。
【0007】1.「プリミティブ(基本)」と「コンポ
ジット(複合)」 プリミティブ領域は、領域のうちで可能な最も単純な表
現である。したがってテキストに関する基本は単一のワ
ードである。テーブルに関する基本は単一のセルであ
る。ビジネス用グラフィックスに関する基本は、単一の
グラフィックス要素又は単一のテキスト要素である。
【0008】コンポジット領域は、2つ以上のプリミテ
ィブ領域から構成される。例えばテキストのパラグラフ
はそれ自体、基本テキストワードから構成された複合テ
キストラインから構成される。テーブルは、そのセル、
横のルール(rule)、縦のルール、列、行の各プリミテ
ィブで構成される。チャート、グラフ及び数式は、テキ
スト、数学的記号、ルール及び図面の各基本の組み合わ
せから構成される。ボックス及びカーツーン(cartoon)
は、図面、テキスト及び/又は手書きの各プリミティブ
から構成される。
【0009】2.「囲まれる(Enclosed)」と「含む(Con
taining)」 「囲まれる」領域は、そのピクセル群全体が別の「含
む」領域の境界内にある領域である。囲まれる/含む領
域の組み合わせの重要な例に、含むボックス内にあるテ
キスト、写真等、含むルールを有するテーブル内のセ
ル、写真又は図面上の通常の又は「反転した」(すなわ
ち、より明るい)テキスト、ビジネス用グラフィックス
に書かれたテキスト、陰影のある背景(陰影が均一であ
るか、又は強調されていることが多い)上のテキストが
含まれる。
【0010】3.「前景(フォアグランド)」と「背景
(バックグランド)」 「前景」領域は、テキスト、写真、図面、数式、手書
き、テーブル、グラフィックス等の情報を伝えることを
目的とした領域である。「背景」領域は、情報を伝える
ことが目的ではなく、多くは文書の断片化を行うか、あ
るいは文書のセグメント同士を分離することを目的とし
ている。背景領域には、スキャナカバー(白、黒又は灰
色)、自動文書フィーダのカバー(各部位が不揃いであ
ってもよい)、スキャンベッド(scanbed)のエッジ及
び走査される文書の三次元相(threedimensional aspec
ts)(例えば、走査中の書籍の各ページの各辺)によっ
て生じる「縞」模様等の要素も含まれる。
【0011】4.「隠す(hidden)」と「表示(visibl
e)」 「隠す」領域は、文書解析コードによって識別済みであ
るがユーザに表示されない領域である。例としてページ
の折り曲げ、ステープル痕、パンチ孔、シミ等の文書上
の明らかな「ジャンク」領域、重なった領域(例えば、
テキスト又は写真)に比べてユーザにとってさほど重要
ではないと推測される背景領域、走査処理に対応する領
域(例えばスキャナのエッジ、スキャナカバー又は自動
文書フィーダのフットプリントに沿った縞)が挙げられ
る。「表示」領域は、ユーザに表示される、解析コード
によって識別される領域一式である。
【0012】
【発明が解決しようとする課題】これらの領域は、スキ
ャナソフトウェアに含まれる自動文書処理(ページ解析
コード)システムによってユーザに表示され、典型的に
は「スキャンプレビュー」動作中にユーザに表示され
る。スキャンプレビュー中、ユーザは走査されることに
なる画像をディスプレイ上で視認する。この視認される
情報には、領域タイプ、各領域内に含まれる情報が含ま
れる。これまでスキャナユーザは、各領域内に含まれる
情報又は領域の表示のフォーマットを変更することがで
きなかった。
【0013】
【課題を解決するための手段】本発明は、走査画像の領
域を操作するためのシステム及び方法を提供する。本発
明によりスキャナユーザは、走査領域内に含まれる属性
の感度を調整することによって、この領域各々の内容を
リアルタイムで変更又は修正することができるととも
に、表示領域のグループ化をさらにユーザが変更するこ
ともできる。これらの特定用途に限定されないが、走査
画像の領域を操作するためのシステム及び方法は、走査
される情報に関連の情報の操作に特に適する。他の用途
として、ディジタルデータベース/ファイルシステムか
ら、又はビデオキャプチャシステムやディジタルカメラ
等他のディジタルキャプチャ機器から文書を操作するこ
とが挙げられる。
【0014】構造上本発明は、文書解析ソフトウェアコ
ンポーネント及び、この文書解析ソフトウェアコンポー
ネントと連絡するユーザインタフェースを備えるスキャ
ナにより生成される領域情報を操作するためのシステム
として、概念化することが可能である。
【0015】好適な実施の形態において、本発明は、ス
キャナユーザがある走査画像の特定領域に関する情報を
操作するとともにこの領域自体を操作することを可能に
する。
【0016】また本発明は、以下のステップを含む、ス
キャナによって生成された領域情報を操作するための方
法を提供するものとして、概念化することができる。ま
ず少なくとも1つの領域を含む画像を走査する。次にこ
の走査された画像を文書解析ソフトウェアパッケージに
より解析する。解析コードにより、この領域に属性を割
り当て、予め定められた命令に応じてこの領域をグルー
プ化する。走査される領域各々の感度及びこの領域のグ
ループ化は、文書解析ソフトウェアと連絡するユーザイ
ンタフェースを用いて操作される。
【0017】本発明には多数の利点があり、そのいくつ
かを単なる例として以下に詳述する。
【0018】本発明の利点は、走査画像に対して著しく
改善された制御をユーザに提供することである。
【0019】本発明の別の利点は、スキャナユーザが、
走査文書を特定ユーザの好みに応じて操作(再グループ
化)できるようにしたことである。
【0020】本発明の別の利点は、ユーザが調整可能な
スキャナオプションを多岐にわたって開発可能としたこ
とである。
【0021】本発明の別の利点は、文書解析パッケージ
によって作成される領域一覧とのユーザの対話の単純化
を可能としたことにより、ユーザタスクの柔軟性と解析
コードの精度を高めたことである。
【0022】本発明の別の利点は、領域グループ化情報
をその領域とともに記憶できるようにしたことにより、
ユーザが指定した変更に伴い文書解析パッケージを再実
行する必要をなくしたことである。
【0023】本発明の別の利点は、何れの特殊な領域タ
イプも解析コードパッケージによって「自動検索」でき
るようにしたことである。
【0024】本発明の別の利点は、領域情報を再演算す
るたびに、スキャンベッド全体を再解析する必要をなく
したことにより高速化が実現されたことである。
【0025】本発明の別の利点は、望み通りに表現され
る自動化領域のユーザによる選択的な保存を可能にしな
がら、ユーザが操作を望むこれらの領域をユーザが選択
的に変更できるようにしたことである。
【0026】本発明の別の利点は、領域の「リアルタイ
ム更新」についてそのモチーフをユーザの期待通りにし
たことである。
【0027】本発明の別の利点は、設計を簡単にし、大
量の商業的生産を容易に実施できるようにしたことであ
る。
【0028】本発明の他の特徴及び利点については、以
下の図面及び詳細な説明を検討すれば、当業者には明ら
かとなろう。これらの追加の特徴及び利点は、本明細書
中の本発明の範囲に含まれるものとする。
【0029】
【発明の実施の形態】特許請求の範囲に画定されるよう
な本発明は、以下の添付図面を参照することでよりよく
理解することが可能である。図中の各要素は、必ずしも
互いに相対した寸法で描かれておらず、本発明の原理を
明確に図示することを意図して強調した。
【0030】本発明の走査領域タイプ感度論理及び走査
領域クラスタ化/クラスタ分解論理は、ソフトウェア、
ハードウェア又はこれらの組み合わせにおいて実施が可
能である。好適な実施の形態において、走査領域タイプ
感度論理及び走査領域クラスタ化/クラスタ分解論理
は、メモリに記憶されるとともに、演算装置内部に設置
された適当なマイクロプロセッサ(μP)によって実行
されるソフトウェアにおいて実施される。しかしなが
ら、走査領域タイプ感度ソフトウェア及び走査領域クラ
スタ化/クラスタ分解ソフトウェアは、論理機能を実施
するための実行可能な命令の整然とした一覧を備えてい
るため、コンピュータベースのシステム、プロセッサを
含むシステムもしくは命令実行システム、装置又はデバ
イスから命令を取り出してこれらの命令を実行可能とす
る他のシステム等の命令実行システム、装置又はデバイ
スによって用いられる、あるいはこれと併用されるコン
ピュータ読み取り可能な媒体であれば何れにおいても具
体化することが可能である。
【0031】本明細書の文脈において、「コンピュータ
読み取り可能な媒体」とは、命令実行システム、装置又
はデバイスによって使用される、あるいはこれと併用さ
れるプログラムを含み、記憶し、連絡し、伝達し又は輸
送することが可能な任意の手段とすることができる。コ
ンピュータ読み取り可能な媒体には、例えば電子、磁
気、光学、電磁、赤外線又は半導体システム、装置、デ
バイス又は伝達媒体があるが、これに限定されない。コ
ンピュータ読み取り可能な媒体のより具体的な例(列挙
したものが全てではない)として以下が含まれる。すな
わち、1以上の配線を有する電気的接続(電子)、ポー
タブルコンピュータディスケット(磁気)、ランダムア
クセスメモリ(RAM)(磁気)、読み取り専用メモリ(R
OM)(磁気)、消去可能プログラム可能読み取り専用メ
モリ(EPROM又はフラッシュメモリ)(磁気)、光ファ
イバ(光学)、ポータブルコンパクトディスク読み取り
専用メモリ(CD-ROM)(光学)。なおコンピュータ読み
取り可能な媒体は、用紙又はプログラムを印字するのに
適切な別の媒体でもよいということに注目され、この場
合には、例えば用紙又は他の媒体の光学的走査を介して
プログラムは電子的に捕捉され、次いでコンパイルさ
れ、解釈されさもなくば必要に応じて適切な方法で処理
されてコンピュータメモリに記憶される。
【0032】さらにテキストの感度を調整することにつ
いて、走査領域タイプ感度論理を以下に図示するが、こ
の走査領域タイプ感度論理は、走査される画像(例えば
図面、写真、数式、グラフィックス等があるがこれに限
定されない)のその他多くの属性の感度を調整する際に
役立つ。さらに走査領域クラスタ化/クラスタ分解論理
が図面及び大きなテキストに関して以下に図示するが、
走査画像中に生成されるすべての領域に応用可能である
ことは明らかである。
【0033】ここで図1を参照すると、本発明の走査領
域タイプ感度論理及び走査領域クラスタ化/クラスタ分
解論理が内在する、スキャナ及びコンピュータシステム
100の概略図が示される。
【0034】図1の例では、スキャナ11は、これに配置
された文書をコンピュータ12と協働して走査する。コン
ピュータ12は、スキャナ11が機能するようなソフトウェ
アに接続し、このソフトウェアを実行することが可能な
何れの汎用コンピュータであってもよい。図1の例で
は、コンピュータ12はパーソナルコンピュータである
が、しかしながらコンピュータ12は、スキャナ11と連絡
可能な何れのコンピュータであってもよい。走査画像
は、コンピュータ12内部に配置されたデータキャプチャ
ブロック14によって獲得される。走査画像データは、図
1ではランダムアクセスメモリ(RAM)16に記憶され
る。RAM 16は、解析コード17、ユーザインタフェース13
及びマイクロプロセッサ(μP)25とバス24を介して連
絡される。
【0035】図1の例では、解析コード17は、スキャナ
11と連動して、獲得データとしてRAM 16に記憶される走
査画像の領域タイプ、場所及び統計を決定する論理であ
る。上述のように領域タイプには、テキスト、写真、数
式、図面、テーブル、ビジネス用グラフィックス等があ
る。さらに解析コード17は、μP 25とともに走査画像
データを維持する基本的な処理手段である。また解析コ
ード17には、本発明の走査領域タイプ感度論理110及び
走査領域クラスタ化/クラスタ分解論理120が含まれ
る。走査領域タイプ感度論理110は、バス24及び接続部2
8を介してデータマネージャ21と連絡する解析コード17
内に存在する。データマネージャ21は、接続部28を介し
てバス24と連絡して、RAM 16に記憶されたデータにアク
セスし、プレビュースキャン動作又は他の事後解析タス
クを実行する。事後解析タスクには、例えば印字、ファ
ックス送信、光学式文字認識等がある。領域マネージャ
22は、接続部29を介してバス24と連絡し、解析コード17
内に保持される領域クラスタ化に関する情報にアクセス
し、プレビュースキャン動作中に走査画像をディスプレ
イ19上に描く。
【0036】走査領域タイプ感度論理110と走査領域ク
ラスタ化/クラスタ分解論理120は、いずれも確率に基
づく解析手段の一部であり、μP 25において実行され
るが、これについては詳細を後述する。図1においてユ
ーザインタフェース13がプレビュースキャンブロック18
を含むことにより、最後の走査以前にあるいは適当な走
査データ領域をダウンストリームの宛先(アプリケーシ
ョン、記憶装置等)に送信する前に、スキャナユーザ
は、走査対象の文書を閲覧することができる。プレビュ
ースキャン18は、接続部32において走査画像を出力し、
ユーザに対してディスプレイ19上に出力する。
【0037】図2は、本発明の論理が内在する、図1の
ユーザインタフェース13及び解析コード17を示す概略図
である。ユーザインタフェース13には、プレビュースキ
ャンブロック18が含まれ、このプレビュースキャンブロ
ック18にはユーザ制御34がさらに含まれる。図2の例に
おいてはユーザ制御34は、スライドバー36と右クリック
要素37を含む。スライドバー36は、モードボックス(図
4〜図17を参照して以下で詳述する)であってもよく、
又は表示される要素の属性を調整可能とする同様のユー
ザインタフェースであってもよい。典型的には右クリッ
ク要素37は、パーソナルコンピュータとともに供給され
るマウスユーザ入力デバイス上で利用可能な右マウスボ
タンである。スライドバー36及び右クリック要素37につ
いては、図4〜図17及び図19〜図23に関連してより詳し
く後述する。スライドバー36は、接続部42を介してアプ
リケーションプログラミングインタフェース(API)38
と連絡し、右クリック要素37は、接続部44を介してAPI
38と連絡する。走査領域タイプ感度論理110及び走査領
域クラスタ化/クラスタ分解論理120は、解析コード17
内にあって、ユーザが各種の走査領域情報を操作可能と
するために必要な論理を包含する。API 38は、接続部47
を介して解析コード17と連絡する。また解析コード17も
接続部28を介してデータマネージャ21と、接続部29を介
して領域マネージャ22と連絡する。
【0038】走査領域タイプ感度論理110及び走査領域
クラスタ化/クラスタ分解論理120は、接続部47を介し
て解析コード17を通じてAPI 38の呼出し(call)によりア
クセスされる。解析コード17は、正確なAPI呼出しをフ
ィルタにかけ、走査領域タイプ感度論理110又は走査領
域クラスタ化/クラスタ分解論理120の何れか一方に送
信する。データマネージャ21は、接続部26を介してプレ
ビュースキャン18と連絡し、領域マネージャ22は、接続
部31を介してプレビュースキャン18と連絡して、領域及
び領域データを含むプレビュースキャン情報をディスプ
レイ19上でユーザに対して表示する。データマネージャ
21及び領域マネージャ22は、操作された領域に関する情
報を解析コード17から接続部28及び29を介してそれぞれ
受信する。
【0039】使用にあたり、ユーザは、ディスプレイ19
上で走査画像を閲覧するが、このときユーザ制御34によ
りユーザは、ユーザの好みに応じて表示画像を操作する
ことができる。例えばユーザは、スライドバー36を用い
て属性の感度を調整することによって、走査画像の領域
のある特定の属性の感度を調整することができる。これ
は例えば、スライドバー36内に含まれるポインタの位置
を調整することによって実現し得る。この調整によっ
て、スライドバー36は、接続部42を介してAPI 38と信号
を連絡する。API 38は、スライドバー制御情報を解析コ
ード17に送信する。この調整は、ユーザが、表示画像の
ある特定の属性の感度に対する変更を望んでいることを
示し、API呼出しを指令する。API 38は、接続部47を介
して解析コード17と連絡し、API 38によって送信される
信号に基づいて接続部28を介してデータマネージャ21を
更新する。データマネージャ21は、ユーザインタフェー
ス13を通じてディスプレイ19上でユーザに対して表
示されることになるデータを記憶する。領域属性が一旦
調整されると、ディスプレイ19は、調整された領域をユ
ーザに対してリアルタイムで表示する。このようにし
て、走査領域タイプ感度論理110は、解析コード17と協
働してユーザインタフェース13によって生成される領域
群を更新する一方、スキャンベッド全体を再演算する必
要をなくしている。
【0040】同様に、ユーザは、右クリック要素37を用
いて走査領域のクラスタ化/クラスタ分解を調整するこ
とによって、領域のグループ化を調整することができ
る。これは例えば、マウスポインタをユーザが操作した
いと思う特定の領域に配置しながらマウスを右クリック
することによって実現し得る。マウスボタンを右クリッ
クすることで、「削除」、「検索」、「背景を表示す
る」、「背景を隠す」、「前景を表示する」、「前景を
隠す」、「コンポジットを形成する」、「コンポジット
をセグメント化する」、「囲まれる領域と含み領域を組
み合わせる」、「囲まれる領域と含み領域を分離させ
る」等の領域調整コマンドのメニューを表示させること
ができる。
【0041】各領域調整コマンドの説明は以下の通りで
ある。「削除」は、領域を「表示する」から「隠す」に
変更する。「検索」は、クリックされた時点での「隠れ
た」領域を「表示」領域にする。「背景を表示する」
は、「隠れた」背景領域を「表示」させる。「背景を隠
す」は、「背景を表示する」の反対である。「前景を表
示する」は、先に「隠れた」(このため背景領域が、前
景要素を有する背景ではなくむしろ1つのクラスタ化さ
れた領域として表現されていた)背景領域をクリックし
て領域すべてを「表示」させる。「前景を隠す」は、
「前景を表示する」の反対である。「コンポジットを形
成する」は、クリックされた時点での領域を一緒にクラ
スタ化して、局所的な「プリミティブ」から「コンポジ
ット」領域を形成する。「コンポジットをセグメント化
する」は、「コンポジット」領域をそのプリミティブに
分割する。「囲まれる領域と含み領域を組み合わせる」
は、画定した境界内で領域プリミティブをその境界と統
合する(クラスタ化)。「囲まれる領域と含み領域を分
離させる」は、境界領域とその囲まれたプリミティブを
別個のプリミティブ領域に分割する。
【0042】上記の調整によって、右クリック要素37
は、接続部44を介して信号をAPI 38に連絡する。この信
号は、ユーザが表示画像における領域のグループ化又は
クラスタ化の変更を望んでいることを示し、API呼出し
を指令する。API 38は、接続部47を介して解析コード17
と連絡し、API 38によって送信された信号に基づいて接
続部29を介して領域マネージャ22を更新する。領域マネ
ージャ22は、ユーザインタフェース13を通じてディスプ
レイ19上でユーザに対して表示されることになるデータ
を記憶する。領域のグループ化が上述にしたがって一旦
調整されると、ディスプレイ19は、改定されたクラスタ
化された領域をユーザに対してリアルタイムで表示す
る。このようにして、走査領域クラスタ化/クラスタ分
解論理120は、解析コード17と協働してユーザに対して
表示領域群を更新する一方、スキャンベッド全体を再演
算する必要を排除している。
【0043】走査領域タイプ感度論理110及び走査領域
クラスタ化/クラスタ分解論理120は、セグメント化さ
れたデータをクラスタ化及びクラスタ分解するための、
またそれらの領域の型付け(typedness)のためにセグメ
ント化された領域をランク付け(確率を割り当てること
によって)するためのアルゴリズムの任意の適切な組を
用いることで実施可能である。
【0044】例えば、走査領域タイプ感度論理110の可
能な実施を図示するために、テキストの正規ライン(reg
ular line)を以下の確率(統計学においてp値と呼ば
れ、100%の全確率に対して合計して1.00とならなけれ
ばならない)、テキスト確率=0.99、図面確率=0.01を
割り当てることができる。より大きなテキストライン
(例えば、見出し又はタイトル)であれば、以下の確
率、テキスト確率=0.45、図面確率=0.55に割り当てる
ことができる。ここでは、第2テキストラインに対する
デフォルト表現は図面であるが、これは(光学式文字認
識(OCR)パッケージにおいて見られるように、利用可
能なもののうち最も近似するフォントと一致させるので
はなくむしろ)大きなテキストの精確な「ルックアンド
フィール(lookand feel)」の確保を保証するのに十分な
サイズとなり得るためである。しかしながら、(例えば
図5のような)スライダが移動されてテキストに都合よ
く十分に離されれば、スライダの位置が右に移動されれ
ば(例えばスライダはテキストに対して「p値」を連続
してさらに追加する)、テキスト表現は、図面表現より
「重み付けされる(outweigh)」ことになる。例えばスラ
イダを半分以上移動させると、その重みは0.20となり、
するとテキスト=0.45+0.2=0.65となり、図面の0.55
よりも重み付けされるため、領域がテキストとして現れ
る。
【0045】クラスタ化/クラスタ分解の決定を簡略に
するために、同様の統計的重み付けが利用される。例え
ば走査領域クラスタ化/クラスタ分解論理120の可能な
実施を図示するために、ユーザがある領域で右クリック
し、ポップアップメニュー(図20〜図22の175)から
「コンポジットを形成する」を選択する場合を考える。
すると走査領域クラスタ化/クラスタ分解論理120は、
クリックしたポイント近くの領域群を(任意の適切なク
ラスタ化アルゴリズムを用いて)選択し、どのタイプの
クラスタが形成に最適であるかを判断する。例えばクリ
ックしたポイントの近くにテーブルがある場合、クリッ
クしたポイント付近ではテキスト及びルールの各プリミ
ティブが優勢になりやすく、これに対してクリックした
ポイント近くにビジネス用グラフィックス領域がある
と、クリックしたポイント近くには少なくとも1つの大
きな図面領域があることが多い。基本論理110及び120を
用いる他の全ての領域では、クラスタ化された領域に可
能な領域タイプ全ての確率が割り当てられる。
【0046】例えばテーブルクラスタには以下の確率を
割り当てることができる。テーブルp=0.45、ビジネス
用グラフィックスp=0.20、カーツーンp=0.15、チャ
ートp=0.10、数式p=0.10である。テーブルに対する
確率(p値)が最も大きいため、クラスタ化された領域
はテーブルに指定される。これは、本発明の好適な実施
の形態において、基本的な確率構成(scheme)の値を表し
ている。すなわちクラスタ化された領域が実際にはテー
ブルではないと分類手段(テーブル領域を処理するため
に用いられる任意のアルゴリズム)が判断すると、クラ
スタを次の最も可能性のある候補(この場合には「ビジ
ネス用グラフィックス」)に割り当てるよう、走査領域
クラスタ化/クラスタ分解論理120に要請することがで
きる。このようにして、基本的な領域統計学を用いて、
クラスタ化/クラスタ分解の精度を最適化することが可
能である。
【0047】図3は、図1及び図2の走査領域タイプ感
度論理110の動作を示すフロー図である。ブロック111に
おいて、走査領域はディスプレイ19上でユーザに対して
表示される。これらの領域は、解析コード17が適用する
デフォルト設定にしたがって表示される。解析コード17
には各領域に関連する全てのデータが含まれているが、
最初は、デフォルト設定によって生成された領域のみが
表示される。
【0048】ブロック112において、ユーザがブロック1
11において表示された領域に満足しているかどうかが判
断される。ユーザがこの表示に満足していれば、ブロッ
ク117において事後解析タスク、例えばファックス送
信、印字、光学式文字認識等が実行されるが、これにつ
いては当業者にとって認められるものであろう。しかし
ながら決定ブロック112において、表示されるような領
域がユーザの好みではないと判断されると、走査領域タ
イプ感度論理110及びスライドバー36を使用すること
で、ユーザは、いかなる表示領域であっても、ユーザの
特定の用途にとって望ましい属性が表示されるようにそ
の感度を調整することができる。
【0049】ブロック114において、ユーザは、図2を
参照して説明したようにスライドバー36を作動させるこ
とによりこれらの所望の領域を更新する。図示の例にお
いて、ユーザは、スライドバー36の調整を含むモードボ
ックスを表示させる。ユーザは、関心のある特定領域に
割り当てられた特定の属性の感度を調整することができ
る。
【0050】次にブロック118において、解析コード17
にアクセスして、所望の領域特性を得ると、ブロック11
6において、この領域はリタイプされ、更新された領域
とともにディスプレイ19上でユーザに対してリアルタイ
ムで再び表示される。ユーザは、この改定された領域を
認めて先に進むか、あるいは領域感度を再び調整するこ
ともできる。
【0051】図4〜図17を合わせて、図1、図2及び図
3の走査領域タイプ感度論理110の動作を通して得られ
る結果を示す。図4は、代表的な走査ページ150を示す
図である。図示の例においてページ150は、背景が白い
テキスト151、写真152、図面154、背景に陰影をつけた
テキスト156、より大きなフォントサイズのテキスト15
7、特殊テキスト158及び反転テキスト159を含む。ペー
ジ150は、例えば雑誌、書籍又は様々なタイプの情報を
1ページに掲載した書類における典型的な1ページとし
てもよい。
【0052】図5は、ポインタ51によって示される設定
を有するスライドバー36を示し、ここではテキスト感度
を最小にしている。この設定において、スライドバー36
は、走査領域タイプ感度論理110にテキストを全く表示
させないように命令すると、ページ150は白紙として現
れる。
【0053】図6及び図7に示す走査ページ150では、
スライドバー36のポインタ51の最小設定(図7)に対応
して、背景が白いテキスト151のみが表示されている。
なおテキストが全く表示されなかった図5において示さ
れる設定に対し、僅かにずらしてポインタ51を調整した
ことに注目されたい。本質的に、スライドバー36を介し
て属性(本例ではテキスト)の感度を高くすることによ
って、走査領域タイプ感度論理110がより多くの領域を
テキストとして表示させる。これは図2に関して説明し
た確率アルゴリズムの説明に対応する。例えばテキスト
確率を0.45として割り当てる。スライドバー36のポイン
タ51を右に移動する(したがってテキスト感度が高くな
る)ことによって、このテキスト確率に追加の「p値」
が加えられる。このようにして、画像のより多く部分が
テキストとして表示される。
【0054】図8及び図9に示す走査ページ150では、
テキスト感度がさらに高くなるようにスライドバー36の
ポインタ51(図9)が調整されている。背景が白いテキ
スト151と背景に陰影をつけたテキスト156の両方がここ
で表示されていることがわかる。スライドバー36を用い
て感度を高くすることによって、追加のテキストが表示
される。このことは、例えば当初、解析コード17がテキ
ストを図面として分類したとしても、走査領域タイプ感
度論理110の感度を高くすることによって、ユーザは、
最初テキストとして分類されなかった領域の属性を変更
してテキストとして表示させることができることを示し
ている。本質的にスライドバー36を移動することで、別
のタイプの領域として分類される確率がもともと高かっ
たとしても、その領域がテキストとして分類されるよう
にp値の「バランス」が傾く。この特徴により、これま
でのスキャナ製品では手に入らなかった領域感度を操作
する性能をユーザは得ることができるとともに、ユーザ
は、走査画像の外観をいかなる特定用途にも効率よく調
整することができる。
【0055】図10及び図11に示す走査ページ150では、
スライドバー36のポインタ51(図11)が調整されて走査
テキストの感度がさらに高くされている。背景が白いテ
キスト151と背景に陰影をつけたテキスト156に加えて、
このようにより高く感度を調整すると、より大きなフォ
ントサイズのテキスト157も表示されることがわかる。
スライドバー36を用いて走査領域タイプ感度論理110の
感度を高くすることによって、テキスト以外のものとし
て当初分類されていた領域をより多くテキストとして表
示させることが可能であることがわかる。
【0056】図12及び図13に示す走査ページ150では、
スライドバー36のポインタ51(図13)が感度をさらに高
くして調整されている。ここでこの走査画像中には特殊
テキスト158が現れていることがわかる。特殊テキスト1
58は、例えばパラグラフの最初にくるフォントサイズを
より大きくした文字であってもよく、これはサイズが大
きいため解析コード17によって最初図面として分類され
る場合もあるが、ユーザによる要求に応じてスライドバ
ー36からの入力を通してテキスト感度を高くしたことに
より、ここではテキストとして表示されている。また特
殊テキスト158は、例えばページ150の最下段のロゴの一
部であってもよい。
【0057】図14及び図15に示す走査ページ150では、
スライドバー36のポインタ51(図15)が感度をより一層
高くして調整されている。この調整により、ここでは走
査領域タイプ感度論理110が反転テキスト159をテキスト
として表示する。反転テキスト159は、前景及び背景の
カラーを、例えば白地の背景に黒字のテキストから黒地
の背景に白字のテキストへと反転させたテキストとする
ことができる。反転テキスト159は、解析コード17によ
って最初図面情報として分類される場合もあるが、ここ
ではテキストとして表示される。
【0058】図16及び図17に示す走査ページ150では、
スライドバー36のポインタ51(図17)が感度を最大にし
て調整され、後からの書き込み161(図16の例ではペー
ジ上の曲がりくねる手書きである)をテキストとしてユ
ーザに対して表示している。テキスト感度をより高く調
整すると、より多くの領域がテキストとして表示される
ことがわかる。
【0059】本明細書ではテキストを用いて説明してき
たが、領域属性の調整として、使用可能な、例えば図
面、写真、数式、テーブル等が挙げられるが、これに限
定されず、全ての領域タイプが含まれる。
【0060】図18は、図1及び図2の走査領域クラスタ
化/クラスタ分解論理120の動作を示すフロー図であ
る。ブロック121において、走査領域がディスプレイ19
上でユーザに対して表示される。これらの領域は、解析
コード17が適用するデフォルト設定にしたがって表示さ
れる。解析コード17には各領域に関連する全てのデータ
が含まれているが、最初はデフォルト設定によって生成
されたクラスタ化領域のみが表示される。
【0061】ブロック122において、ユーザがブロック1
21において表示された領域に満足しているかどうかが判
断される。ユーザがこの表示されている領域に満足して
いれば、ブロック127において事後解析タスク、例えば
ファックス送信、印刷、光学式文字認識等が実行される
が、これについては当業者に理解されるであろう。しか
しながら決定ブロック122において、表示されている領
域がユーザの好みではないと判断されると、走査領域ク
ラスタ化/クラスタ分解論理120及び右クリック要素37
を使用することで、ユーザはいかなる表示領域であって
も、ユーザの特定の用途にとって望ましい属性を表示さ
せるようにそのクラスタ化を調整することができる。
【0062】ブロック124において、ユーザは、図2を
参照して説明したように、例えば右クリック要素37を作
動させることにより、これらの所望の領域を更新する。
図の例においてはユーザは、ある特定の領域で右クリッ
クして、使用可能な領域グループ化調整オプションに相
当するメニュー選択の一覧を表示させる。ユーザは、こ
れらの領域のクラスタ化、すなわちグループ化を調整し
て、所望の領域クラスタ化を得ることができる。
【0063】次にブロック128において、解析コード17
にアクセスして、所望の領域特性を得ると、ブロック12
6において、この領域が再演算され、更新された領域ク
ラスタ化とともにディスプレイ19上でユーザに対してリ
アルタイムで再び表示される。ユーザは、この改定され
た領域クラスタ化を認めて先に進むか、あるいは領域ク
ラスタ化を再び調整することもできる。
【0064】図19〜図23を合わせて、図1、図2及び図
18の走査領域クラスタ化/クラスタ分解論理120の動作
によって得られる結果を示す。図19は、走査画像170を
示す図である。図19において走査画像170は、テキスト1
71、写真172、大きなテキスト174、円グラフ形式のビジ
ネス用グラフィックス177、ビジネス用グラフィックス1
77を取り囲むテキスト178を含む。
【0065】図20は、ユーザインタフェース13(図2)
を介して右クリック37する(図2)ことによってスキャ
ナユーザが選択する円グラフ177を示す図である。右ク
リックすることにより、メニュー175がディスプレイ19
上でユーザに対して表示され、選択された領域を操作す
るために用いるコマンドの選択をユーザができるように
している。
【0066】図21は、円グラフ177を取り囲むテキスト1
78とクラスタ化された円グラフ177を示す図である。こ
れは、カーソルが円グラフ177上に位置した状態でスキ
ャナ製品のユーザがマウスを右クリック37する(図2)
ことによって達成される。図21の例では、ユーザは円グ
ラフ177上で右クリックしてメニューオプション「コン
ポジットを形成する」を選択する。「コンポジットを形
成する」を選択することによって、図21に示すように円
グラフ177及び円グラフ177を取り囲むテキスト178がク
ラスタ化され、領域179を形成する。本質的に、走査領
域クラスタ化/クラスタ分解論理120は、ユーザインタ
フェース(図2の37)からの入力を利用して解析コード
17にアクセスし、これらの選択された領域(すなわち、
円グラフ領域177及び円グラフ177を取り囲むテキスト17
8)をユーザが選択したある特定の領域にグループ化す
る。例えば、円グラフ領域177及び円グラフ領域177を取
り囲むテキスト178が、「ビジネス用グラフィックス」
又は新たな領域タイプとして領域179に再グループ化さ
れる。逆にユーザが領域179上で右クリックして、表示
メニュー175から「コンポジットをセグメント化する」
を選択すると、領域179はセグメント化、すなわちクラ
スタ分解されて、図20において先に示したように領域17
7と178が分離される。
【0067】図22は、ユーザが文字の上で右クリックす
ることによって選択される大きなテキスト文字176を示
す図である。大きなテキスト文字176上で右クリックす
ることによって表示されるメニュー175から「コンポジ
ットを形成する」コマンドをイネーブルにすることによ
って、ユーザは、図23に示すような領域181に大きなテ
キストをクラスタ化することができる。逆に領域181上
で右クリックして「コンポジットをセグメント化する」
を選択することによって、領域181は領域174及び176に
クラスタ分解することができる。
【0068】本発明の原理から実質的に逸脱することな
く、上述したような本発明の好適な実施の形態に多くの
変形及び改変を加えることができることは、当業者には
自明であろう。例えば、走査画像の領域を操作するため
のシステム及び方法を、各種の走査及び演算製品を用い
て実施することが可能である。さらに、走査画像の領域
を操作するためのシステム及び方法は、ディジタルデー
タベース/ファイルシステムから、又はビデオキャプチ
ャシステムやディジタルカメラ等他のディジタルキャプ
チャ機器から文書を操作する際に有益である。このよう
な変形及び改変は、全て添付の特許請求の範囲において
記載される本発明の範囲内で本明細書中に包含されるも
のである。
【0069】以下においては、本発明の種々の構成用件
の組み合わせからなる例示的な実施態様を示す。
【0070】1. スキャナ(11)によって生成される
領域情報を操作するためのシステム(100)であって、
文書解析ソフトウェアコンポーネント(17)と、前記文
書解析ソフトウェアコンポーネント(17)と連絡するユ
ーザインタフェース(13)と、該ユーザインタフェース
(13)が走査画像に割り当てられる属性の少なくとも1
つの操作(36、37)を可能にするよう構成されること
と、を備えることを特徴とするシステム。
【0071】2. 前記文書解析ソフトウェアコンポー
ネント(17)が、領域タイプ感度論理(110)をさらに
含む、1項記載のシステム。
【0072】3. 前記文書解析ソフトウェアコンポー
ネント(17)が、領域クラスタ化/クラスタ分解論理
(120)をさらに含む、1項記載のシステム。
【0073】4. 前記ユーザインタフェース(13)
が、前記走査画像の領域の感度(110)の操作(36)を
行うことが可能である、2項記載のシステム。
【0074】5. 前記ユーザインタフェース(13)
が、前記走査画像の複数領域のグループ化(120)の操
作(37)を行うことが可能である、4項記載のシステ
ム。
【0075】6. スキャナ(11)によって生成される
領域情報を操作するための方法(110、120)であって、
少なくとも1つの領域を備える画像(150、170)を走査
するステップと、文書解析ソフトウェア(17)を使用し
て前記走査された画像を分析するステップと、前記文書
解析ソフトウェア(17)と連絡するユーザインタフェー
ス(13)を使用して、前記走査された画像の属性の少な
くとも1つを操作するステップと、を含むことを特徴と
する方法。
【0076】7. 前記走査された画像の少なくとも1
つの領域の感度を操作する(36)ステップをさらに含
む、6項記載の方法。
【0077】8. 前記走査された画像の複数の領域の
グループ化を操作する(37)ステップをさらに含む、6
項記載の方法。
【0078】
【発明の効果】本発明においては、走査領域タイプ感度
論理(110)及び走査領域クラスタ化/クラスタ分解論
理(120)が走査画像内の領域の操作(36、37)を可能
とする。走査領域タイプ感度論理(110)は、スキャナ
(11)製品のユーザがユーザインタフェース(13)を使
用することによって、リアルタイムで特定の領域タイプ
の感度(36)を調整することができるとともに、ユーザ
に対して調整の結果を示すことによって領域タイプの属
性の操作(36)をユーザインタフェース(13)を介して
行うことを可能とする。走査領域クラスタ化/クラスタ
分解論理(120)は、スキャナ(11)製品のユーザがユ
ーザインタフェース(13)を使用することによって、リ
アルタイムでユーザに対して示される領域のグループ化
の操作(37)することを可能とする。走査論理のこれ
らの形態の双方は、確率(「p値」)もしくは全てのも
っともらしい領域タイプの他の関連する統計を、その領
域を画定する部分として記憶する文書分析技術(17)
の基本的な使用に基づく。このような構成により、スキ
ャナユーザは、各領域内に含まれる情報又は領域の表示
のフォーマットをリアルタイムで変更することができ
る。
【図面の簡単な説明】
【図1】本発明の論理が内在する例示的なスキャナ及び
コンピュータシステムの概略図である。
【図2】本発明の論理が内在する、図1のユーザインタ
フェース及び解析コードを示す概略図である。
【図3】図1及び図2の走査領域タイプ感度論理の動作
を示すフロー図である。
【図4】図1、図2及び図3の走査領域タイプ感度論理
の動作を通して得られた結果を示す。
【図5】図1、図2及び図3の走査領域タイプ感度論理
の動作を通して得られた結果を示す。
【図6】図1、図2及び図3の走査領域タイプ感度論理
の動作を通して得られた結果を示す。
【図7】図1、図2及び図3の走査領域タイプ感度論理
の動作を通して得られた結果を示す。
【図8】図1、図2及び図3の走査領域タイプ感度論理
の動作を通して得られた結果を示す。
【図9】図1、図2及び図3の走査領域タイプ感度論理
の動作を通して得られた結果を示す。
【図10】図1、図2及び図3の走査領域タイプ感度論
理の動作を通して得られた結果を示す。
【図11】図1、図2及び図3の走査領域タイプ感度論
理の動作を通して得られた結果を示す。
【図12】図1、図2及び図3の走査領域タイプ感度論
理の動作を通して得られた結果を示す。
【図13】図1、図2及び図3の走査領域タイプ感度論
理の動作を通して得られた結果を示す。
【図14】図1、図2及び図3の走査領域タイプ感度論
理の動作を通して得られた結果を示す。
【図15】図1、図2及び図3の走査領域タイプ感度論
理の動作を通して得られた結果を示す。
【図16】図1、図2及び図3の走査領域タイプ感度論
理の動作を通して得られた結果を示す。
【図17】図1、図2及び図3の走査領域タイプ感度論
理の動作を通して得られた結果を示す。
【図18】図1及び図2の走査領域クラスタ化/クラス
タ分解論理の動作を示すフロー図である。
【図19】図1、図2及び図18の走査領域クラスタ化/
クラスタ分解論理の動作を通して得られた結果を示す。
【図20】図1、図2及び図18の走査領域クラスタ化/
クラスタ分解論理の動作を通して得られた結果を示す。
【図21】図1、図2及び図18の走査領域クラスタ化/
クラスタ分解論理の動作を通して得られた結果を示す。
【図22】図1、図2及び図18の走査領域クラスタ化/
クラスタ分解論理の動作を通して得られた結果を示す。
【図23】図1、図2及び図18の走査領域クラスタ化/
クラスタ分解論理の動作を通して得られた結果を示す。
【符号の説明】
11 スキャナ 13 ユーザインタフェース 17 解析コード 36 スライドバー 37 右クリック要素 110 走査領域タイプ感度論理 120 走査領域クラスタ化/クラスタ分解 150 走査ページ 170 走査画像
フロントページの続き (72)発明者 ジェフリー・ピー・リー アメリカ合衆国コロラド州80634,グリー レイ,43アベニュー・1838

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 スキャナ(11)によって生成される領域
    情報を操作するためのシステム(100)であって、 文書解析ソフトウェアコンポーネント(17)と、 前記文書解析ソフトウェアコンポーネント(17)と連絡
    するユーザインタフェース(13)と、該ユーザインタフ
    ェース(13)が走査画像に割り当てられる属性の少なく
    とも1つの操作(36、37)を可能にするよう構成される
    ことと、を備えることを特徴とするシステム。
JP11270886A 1998-09-23 1999-09-24 走査画像の領域を操作するためのシステム及び方法 Pending JP2000115476A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US159147 1998-09-23
US09/159,147 US6263122B1 (en) 1998-09-23 1998-09-23 System and method for manipulating regions in a scanned image

Publications (1)

Publication Number Publication Date
JP2000115476A true JP2000115476A (ja) 2000-04-21

Family

ID=22571278

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11270886A Pending JP2000115476A (ja) 1998-09-23 1999-09-24 走査画像の領域を操作するためのシステム及び方法

Country Status (4)

Country Link
US (1) US6263122B1 (ja)
EP (1) EP0992934B1 (ja)
JP (1) JP2000115476A (ja)
DE (1) DE69939415D1 (ja)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6151426A (en) * 1998-10-01 2000-11-21 Hewlett-Packard Company Click and select user interface for document scanning
US6950553B1 (en) * 2000-03-23 2005-09-27 Cardiff Software, Inc. Method and system for searching form features for form identification
WO2001086585A1 (de) * 2000-05-09 2001-11-15 Siemens Aktiengesellschaft Verfahren und anordnung zum ermitteln eines objekts in einem bild
SG93868A1 (en) * 2000-06-07 2003-01-21 Kent Ridge Digital Labs Method and system for user-configurable clustering of information
US6647144B2 (en) * 2000-12-04 2003-11-11 Xerox Corporation Detection and verification of scanning attributes
US7254270B2 (en) * 2002-07-09 2007-08-07 Hewlett-Packard Development Company, L.P. System and method for bounding and classifying regions within a graphical image
US7184028B2 (en) * 2003-01-03 2007-02-27 Kabushiki Kaisha Toshiba Switchable LCD touchscreen panel scan module
US7424672B2 (en) * 2003-10-03 2008-09-09 Hewlett-Packard Development Company, L.P. System and method of specifying image document layout definition
JP3962721B2 (ja) * 2003-12-15 2007-08-22 キヤノン株式会社 文書処理装置及び文書処理方法
KR100699493B1 (ko) * 2004-11-11 2007-03-26 삼성전자주식회사 미리보기이미지 구현방법 및 장치
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
US7539343B2 (en) * 2005-08-24 2009-05-26 Hewlett-Packard Development Company, L.P. Classifying regions defined within a digital image
US7479968B2 (en) * 2006-01-31 2009-01-20 Microsoft Corporation Semi-transparent highlighting of selected objects in electronic documents
US7944592B2 (en) * 2006-12-18 2011-05-17 Hewlett-Packard Development Company, L.P. Image capture device
US7853074B2 (en) * 2007-02-26 2010-12-14 Eastman Kodak Company Multi-color dropout for scanned document
JP4470958B2 (ja) * 2007-05-01 2010-06-02 村田機械株式会社 画像処理装置
US20090323128A1 (en) * 2008-06-27 2009-12-31 Hari Asuri System, method, and computer program product for scanning
US8352855B2 (en) 2009-01-02 2013-01-08 Apple Inc. Selection of text in an unstructured document
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US20100225937A1 (en) * 2009-03-06 2010-09-09 Simske Steven J Imaged page warp correction
US8913285B1 (en) * 2009-06-07 2014-12-16 Apple Inc. Automated method of decomposing scanned documents
WO2011001439A2 (en) 2009-07-02 2011-01-06 Hewlett-Packard Development Company, L.P. Skew detection
US20110216342A1 (en) * 2010-03-08 2011-09-08 Kabushiki Kaisha Toshiba Image processing device and image processing method
US8549399B2 (en) * 2011-01-18 2013-10-01 Apple Inc. Identifying a selection of content in a structured document
US20130050222A1 (en) * 2011-08-25 2013-02-28 Dov Moran Keyboard with embedded display
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9165188B2 (en) 2012-01-12 2015-10-20 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US10380554B2 (en) 2012-06-20 2019-08-13 Hewlett-Packard Development Company, L.P. Extracting data from email attachments
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
CN105283884A (zh) 2013-03-13 2016-01-27 柯法克斯公司 对移动设备捕获的数字图像中的对象进行分类
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
EP2992481A4 (en) 2013-05-03 2017-02-22 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
KR20160027862A (ko) * 2014-09-02 2016-03-10 삼성전자주식회사 이미지 데이터를 처리하는 방법과 이를 지원하는 전자 장치
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5048096A (en) * 1989-12-01 1991-09-10 Eastman Kodak Company Bi-tonal image non-text matter removal with run length and connected component analysis
US5048109A (en) * 1989-12-08 1991-09-10 Xerox Corporation Detection of highlighted regions
JP2579397B2 (ja) * 1991-12-18 1997-02-05 インターナショナル・ビジネス・マシーンズ・コーポレイション 文書画像のレイアウトモデルを作成する方法及び装置
DE69519323T2 (de) * 1994-04-15 2001-04-12 Canon Kk System zur Seitensegmentierung und Zeichenerkennung
US6504540B1 (en) * 1995-06-19 2003-01-07 Canon Kabushiki Kaisha Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
JPH10188016A (ja) * 1996-12-27 1998-07-21 Toshiba Corp ドキュメントリーダ及びドキュメントリーダにおけるレイアウト解析ならびに修正処理方法

Also Published As

Publication number Publication date
US6263122B1 (en) 2001-07-17
EP0992934A3 (en) 2002-01-09
EP0992934B1 (en) 2008-08-27
EP0992934A2 (en) 2000-04-12
DE69939415D1 (de) 2008-10-09

Similar Documents

Publication Publication Date Title
JP2000115476A (ja) 走査画像の領域を操作するためのシステム及び方法
JP4970714B2 (ja) 指定されたドキュメント・エリアからのメタデータの抽出
CN1318940C (zh) 在文档上覆盖电子墨迹的方法
US6903751B2 (en) System and method for editing electronic images
US9053076B2 (en) Autoflow in photobook development
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US9152292B2 (en) Image collage authoring
US7610274B2 (en) Method, apparatus, and program for retrieving data
JP2007503032A (ja) ドキュメントスキャナ
US10013147B2 (en) Image display apparatus
JP2006065524A (ja) 文書処理装置および方法
JP4338856B2 (ja) 編集コマンドを提供する方法およびシステム
US12029987B2 (en) Image processing apparatus, image processing method, image processing program, and recording medium storing image processing program
US11495040B2 (en) Information processing apparatus for designation of image type, image reading apparatus, and non-transitory computer readable medium storing program
CN112947826A (zh) 信息获取方法、装置及电子设备
US10755034B2 (en) Information processing apparatus
US20060209311A1 (en) Image processing apparatus and image processing method
JP2021149196A (ja) 画像処理装置、画像処理方法、及びプログラム
JP4092849B2 (ja) 帳票認識装置および記録媒体
JP2008257537A (ja) 情報登録装置、情報検索装置、情報検索システム、情報登録プログラム、および情報検索プログラム
JP2019074875A (ja) 情報処理装置、制御方法、およびプログラム
US20060206531A1 (en) Document managing apparatus
JP7522514B1 (ja) 図面処理装置、及び、図面処理方法
US20230186540A1 (en) Information processing apparatus, information processing method, and storage medium
US20210026502A1 (en) System and method for automating visual layout of hierarchical data

Legal Events

Date Code Title Description
A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20031202

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20031205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040302

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040727