JP2000123181A - 自動走査領域選択装置及び方法 - Google Patents

自動走査領域選択装置及び方法

Info

Publication number
JP2000123181A
JP2000123181A JP11275701A JP27570199A JP2000123181A JP 2000123181 A JP2000123181 A JP 2000123181A JP 11275701 A JP11275701 A JP 11275701A JP 27570199 A JP27570199 A JP 27570199A JP 2000123181 A JP2000123181 A JP 2000123181A
Authority
JP
Japan
Prior art keywords
area
user
automatic
region
selection logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11275701A
Other languages
English (en)
Inventor
Julie T Dawe
ジュリー・ティー・ダウ
Gerald L Meyer
ジェラルド・エル・メイヤー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JP2000123181A publication Critical patent/JP2000123181A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1429Identifying or ignoring parts by sensing at different wavelengths
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Facsimile Scanning Arrangements (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Abstract

(57)【要約】 【課題】印刷画像を電子画像へと変換するスキャナにお
いて、ユーザーが特定の対象領域を選択する為には、従
来技術ではユーザーが原稿を走査台上に置き、プレビュ
ー走査を行ってスキャナをインタラクティブに操作しな
ければならない。本願発明は、スキャナ上に原稿を置く
前に走査すべき対象領域を決定することが可能な自動領
域選択を行う装置及び方法を提供するものである。 【解決手段】ユーザーは原稿のどの領域をスキャナで検
出するかを、一般の蛍光カラーマーカー、ボールペン、
或はクレヨンを用いてページ上の対象領域を単に囲んで
選択する。自動領域選択ロジックは自動的に、囲まれた
対象領域と他の画像部分との間における色の差異を識別
し、ユーザーにより指定された対象領域だけを走査する
ことが出来る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一般的には電子走
査装置に関し、より具体的には電子走査装置中の走査す
べき画像の特定の領域を自動的に選択する為のシステム
及び方法に関する。
【0002】
【従来の技術】走査装置は印刷画像を電子画像へと変換
することが望まれる多くのアプリケーションにおいて便
利なものである。ページを読み取り、電子フォーマット
へと変換する能力を持つスキャナはかなり以前から出ま
わっている。通常スキャナは、ページを電子的に読み取
り、ページ上の異なるタイプの画像を分類し、その情報
を電子的に記憶して後の表示及び利用の為に供する。走
査されたページの分類タイプとしては、代表的にはテキ
スト、写真、図、チャート、表、グラフィクス、数式、
手書き、ロゴ等が含まれる。走査された画像のこれらの
異なる部分は通常はスキャナでページを走査した後にユ
ーザーが領域へと分類する。スキャナの中には事前に決
められた命令に従って走査されたページの特定領域を決
定する能力を持つものもある。
【0003】例えば、複数のテキスト領域を含むページ
において、あるスキャナはページを走査し、テキスト情
報全てを文字領域として記憶する。しかしながら、中に
は原稿全体を走査、分類するのではなく、原稿の一部分
のみを対象としたいユーザーもいる。前述の例において
は、あるユーザーにとっての対象領域を選択する為に
は、そのユーザーが原稿を走査台上に置き、プレビュー
走査として知られる作業を通じてスキャナをインタラク
ティブに操作しなければならない。他の選択肢として
は、走査されたページを自動分析することによって自動
的に領域を検出、分類するスキャナシステムを用いるこ
とである。また更なる選択肢としては、テンプレート即
ちフォームを用いて対象領域を事前定義することがあげ
られる。これらの選択肢は全て、ある特定の状況下にお
いては好ましくないという欠点を有している。例えば、
走査されたページの自動分析はいくつかの事例において
は便利である一方で、常に好ましいというわけではな
く、多大なシステムリソースを消費してしまうこともあ
る。他の例としては、領域を事前定義する為の電子テン
プレート即ちフォームの利用においては、その本質的な
性質によって走査された原稿の周知の事前定義構造が必
要とされる。これではケースバイケースでの対応が難し
い。
【0004】
【解決しようとする課題】本発明は、スキャナのユーザ
ーがスキャナ上に原稿を置く前に走査すべき対象領域を
決定することが可能な自動領域選択を行う為のシステム
及び方法を提供するものである。本発明によりスキャナ
のユーザーは原稿のどの領域をスキャナで検出するか
を、例えば一般の蛍光カラーマーカー、ボールペン、或
はクレヨンを用いてページ上の対象領域を単に囲むだけ
で選択することが出来る。基本的に色を利用して対象領
域をその周囲を取り囲む非対象領域から区別する為のい
かなる方法を用いても等しい効果が得られる。この自動
領域選択用のシステム及び方法は、これらの特定用途に
限られたものではないものの、走査された情報に関する
領域分類の決定に特に適している。その他の応用として
は、デジタルデータベース/ファイルシステムからの、
又はビデオ取り込み装置及びデジタルカメラ等のその他
のデジタル取り込み装置からの、原稿の自動領域選択が
含まれる。
【0005】構造的に本発明は走査画像の特定領域を自
動的に選択する為の、スキャナ、スキャナと交信する文
書分析ソフトウエア要素及び文書分析ソフトウエア要素
と交信する自動領域選択ロジックを含むシステムとして
概念化することが出来る。
【0006】
【課題を解決するための手段】本実施例においては、ス
キャナのユーザーは本発明により原稿の走査を行う以前
に走査すべき原稿の領域を決定することが出来る。ユー
ザーは対象領域を、例えば蛍光マーカー又は原稿上の対
象領域に識別色を書き込む為のその他の手段を用いて示
すことが出来る。自動領域選択ロジックは自動的に対象
領域と残りの画像部分との間における色の差異を認知
し、ユーザーにより指定された対象領域だけをディスプ
レイ上に表示することが出来る。
【0007】本発明はまた、以下のステップを含む走査
すべき領域を自動的に選択する為の方法を提供するもの
として概念化することが出来る。ユーザーは例えば走査
すべき画像部分を蛍光マーカー等の識別色で囲むことが
出来る。その後ユーザーは走査すべき画像をスキャナ上
に置き、ここで文書分析ソフトウエアが画像を分析す
る。そして自動領域選択ロジックを含む文書分析ソフト
ウエアが識別色を検出し、対象領域のみをユーザーに表
示する。
【0008】本発明には数々の利点があり、その内のい
くつかを以下に単なる具体例として説明する。
【0009】本発明の1つの利点は、画像を走査する前
に、走査すべき画像の特定の対象領域をユーザーが指定
出来るようにしたところにある。
【0010】本発明の他の利点は、画像の対象領域を非
対象領域から色によって自動的に識別する能力をスキャ
ナに持たせたところにある。
【0011】本発明の他の利点は、領域がユーザーに表
示された後にその1つ又は複数の領域の更なる変更が可
能なところにある。
【0012】本発明の他の利点は、複数の領域タイプを
対象領域として示し、分類することが可能なところにあ
る。
【0013】本発明の他の利点は、安価な市販の蛍光マ
ーカー又はペンを用いて走査する原稿の特定の対象領域
を示すことが可能なところにある。
【0014】本発明の他の利点はユーザーにとっての使
い易さにある。原稿上、又は原稿を守る為の透明シート
上にマーキングするというユーザー手順は、対象領域を
指定する為に走査ソフトウエアを使う手順よりユーザー
にとっては馴染みやすい。
【0015】本発明の他の利点は、一括処理が必要な状
況においては走査する前に対象領域を指定することが有
益であるところにある。
【0016】本発明の他の利点は、デザインが単純であ
り、大規模な工業的生産が容易な点である。
【0017】本発明のその他の特徴及び利点は、添付の
図及び詳細な説明を読むことにより当業者には明らかと
なる。これらの更なる特徴及び利点は本願により本発明
の範囲に含まれることを意図されたものである。
【0018】本発明の自動領域選択ロジックはソフトウ
エア、ハードウエア、又はそれらの組み合わせにより実
現可能である。本実施例においては、自動領域選択ロジ
ックはメモリ中に記憶され、演算装置中に位置する好適
なマイクロプロセッサにより実行されるソフトウエアと
して実現されている。しかしながら、論理機能を実現す
る為の実行可能命令の順序付けられたリストを含む自動
領域選択ソフトウエアは、コンピュータベースのシステ
ム、プロセッサを含むシステム、或は命令実行システム
装置又は機器から命令を得て実行することが出来るその
他のシステム等の、命令実行システム、装置又は機器に
より用いられる、又はそれに接続する、コンピュータに
より読み取り可能のいずれかの媒体として実現されてい
ても良い。
【0019】本発明の説明における「コンピュータによ
り読み取り可能の媒体」は、命令実行システム、装置又
は機器により用いられる為の、あるいはそれに接続す
る、そのプログラムを包含、記憶、通信、伝搬又は伝送
することが出来るいかなる手段であっても良い。コンピ
ュータにより読み取り可能の媒体は、例えば電子、磁
気、光学、電磁、赤外線又は半導体のシステム、装置、
機器でも、或は伝搬システムであっても良いが、これら
に限られたものではない。コンピュータにより読み取り
可能の媒体のより具体的な例としては以下が含まれるが
この限りではない:1つ以上の配線を持つ電気又は電子
接続、携帯用コンピュータの磁気ディスク、ランダムア
クセスメモリ(RAM)、リードオンリーメモリ(RO
M)、消去・プログラミング可能ROM(EPROM又
はフラッシュメモリ)、光学光ファイバ、及び携帯用C
D−ROM等が含まれる。留意すべきは、コンピュータ
により読み取り可能の媒体は、プログラムが印刷された
紙又はその他の適当な媒体でさえも良く、これは例えば
その紙又は他の媒体を光学走査した後、コンパイリン
グ、翻訳処理することで、さもなければ必要に応じてそ
の他の適宜の方法で処理することでそのプログラムを電
子的に取り込むことが可能な為である。
【0020】更に、自動領域選択ロジックについてはテ
キスト情報の選択に関連して以下に説明するが、走査画
像の他の属性(例えば図や写真、数式、グラフィクス、
線画等、を含むがこれに限らない)を自動的に認識する
為にも有益なものである。
【0021】
【実施例】次に図1を参照すると、スキャナ及び本発明
の自動領域選択ロジック(110)を有するコンピュー
タシステム(100)の概略図が示されている。
【0022】例として、スキャナ(11)はその中に置
かれた原稿をコンピュータ(12)と協調して走査す
る。コンピュータ(12)はスキャナ(11)を機能さ
せるソフトウエアに接続し、実行することが可能ないず
れの一般用途向けコンピュータでも良い。例においては
コンピュータ(12)はパーソナルコンピュータである
が、コンピュータ(12)はスキャナ(11)と通信可
能のいずれのコンピュータでも良い。走査された画像は
コンピュータ(12)中に位置するデータ取り込みブロ
ック(14)により取り込まれる。走査された画像デー
タは例えばランダムアクセスメモリ(RAM)(16)
に記憶される。RAM(16)は分析コード系(1
7)、ユーザーインターフェース(13)及びマイクロ
プロセッサ(25)とバス(24)上で通じている。
【0023】例において分析コード系(17)は、RA
M(16)に取り込みデータとして記憶される走査画像
の領域タイプ、位置、及び統計値を決定する為にスキャ
ナ(11)と共に作動するロジックである。前述した通
り、領域タイプには文字、写真、数式、図、表、グラフ
ィクス等が含まれる。更に、分析コード系(17)はマ
イクロプロセッサ(25)と共に走査画像データを保持
する基本処理エンジンである。分析コード系(17)は
また本発明の自動領域選択ロジック(110)をも含ん
でいる。自動領域選択ロジック(110)はバス(2
4)及び接続(28)を介してデータマネージャー(2
1)と通じる分析コード系(17)内部にある。データ
マネージャー(21)はプレビュー走査処理又はその他
の分析後のタスクを実行する為にRAM(16)に記憶
されたデータにアクセス出来るように接続され(28)
バス(24)と通じている。本発明はプレビュー走査処
理が必要な訳ではない。実際、プレビュー走査処理は例
えば一括処理の際等、幾つかのアプリケーションにおい
ては省いてもかまわない。分析後のタスクには、例えば
印刷、ファックスの送信、光学的文字認識等が含まれ
る。領域マネージャー(22)は、プレビュー走査処理
中にディスプレイ(19)上に走査画像を表示する為に
分析コード系(17)中に保持される領域クラスターに
関わる情報へのアクセスが可能なように接続され(2
9)バス(24)と通じている。
【0024】自動領域選択ロジック(110)により分
析コード系(17)はユーザーが示した1つ又は複数の
特定の対象領域のある被走査画像の部分を認識すること
が出来る。例えば、ユーザーはページ中のテキストのあ
る段落だけを走査したい場合もある。
【0025】例えばユーザーは画像の他の部分と異なる
色の境界線によりその段落を囲む(境界ボックス)こと
によりその対象領域を示すことが出来る。例えば、特定
の対象領域(この例においてはテキストの1つの段落)
を囲む為にユーザーは市販の蛍光ペン即ちマーカー、ボ
ールペン又はクレヨンを用いる。以下に詳細を説明する
が、自動領域選択ロジック(110)は特定の対象領域
を認識し、ユーザーが望む場合にはプレビュー走査処理
においてユーザーに対しその対象領域を表示する。ユー
ザーは対象となる段落全体を囲むかわりに1つの又は複
数の特定の文、或は被走査画像のその他の部分を対象領
域として示す場合にも蛍光マーカーを用いることが出来
る。
【0026】コンピュータ(12)には例えばプレビュ
ー走査ブロック(18)を含むユーザーインターフェー
ス(13)も含まれている。プレビュー走査(18)に
よりスキャナのユーザーは最終的な走査の前、或は適切
な走査データ領域をダウンストリームの宛先(アプリケ
ーション、記憶装置等)に送る前に被走査文書を見るこ
とが出来る。プレビュー走査(18)はユーザーへディ
スプレイ出力する為に走査された画像を接続(32)に
出力する。
【0027】図2は図1におけるユーザーインターフェ
ース(13)及び本発明の自動領域選択ロジック(11
0)を含む分析コード系(17)の概略図を描いたもの
である。ユーザーインターフェースはプレビュー走査ブ
ロック(18)及びユーザーコントロール(34)を含
む。ユーザーコントロール(34)はコンピュータと対
話する為に使用可能の手段又は方法で良く、一般的には
マウス、スタイラス又はキーボードがあげられる。ユー
ザーコントロール(34)の機能は、対象領域がユーザ
ーに望まれる形で表示されない場合に対象領域を分析コ
ード系(17)へと伝達することである。上述したよう
に、一括処理等のいくつかのアプリケーションにおいて
は、プレビュー走査処理、及びその他のあらゆるユーザ
ー対話を省略出来る場合もある。
【0028】自動領域選択ロジック(110)は分析コ
ード系(17)中にあり、そしてユーザーにより示され
た対象領域をスキャナが認識出来るようにする為に必要
なロジックを含んでいる。自動領域選択ロジック(11
0)はまた、RGB(Red(赤)、Green(緑)、Blue
(青))からHLS(Hue(色相)、Lightness(明
度)、Saturation(飽和度))へと変換する変換要素
(115)も含んでいる。ユーザーインターフェース
(13)はバス(24)で分析コード系(17)と交信
し、プレビュー走査(18)は自動領域選択ロジック
(110)と接続(31)で交信する。
【0029】使用中、スキャナのユーザーが色を使って
対象領域を区別することにより画像の対象領域を示す。
これは例えば市販の蛍光マーカーを用いてユーザーが対
象とするテキスト画像の一節又は段落を示すことにより
行うことが出来る。かわりに、ユーザーは被走査対象画
像をページプロテクタにはさむか、透明シートでカバー
するかして、そのカバー上に対象領域を示すようにして
も良く、これにより原稿を汚さずに済む。
【0030】自動領域選択ロジック(110)は蛍光マ
ーカーで示された1つ又は複数の領域を選択領域の色を
区別することにより検出する。これは様々な方法によっ
て行うことが出来、これに限られないが、例えばRGB
−HLS変換要素(115)等を用いることにより可能
である。RGB−HLS変換要素(115)は、各画素
をRGB値からHLS値へと変換するロジックを含む。
色を持つ画素はいずれも比較的高い飽和度値を有し、飽
和度値が高い程色が表示される確率が高い。加えて色相
もまた分析することが出来るが、色相は異なる色を区別
する為に使われる。自動領域選択ロジック(110)は
その後飽和度値を対象領域を表わすものとして捉える。
自動領域選択ロジック(110)は、カラーの部分であ
りこれが対象領域を示す飽和領域と、飽和度値がわずか
な又は無い領域(無視される領域)との間を区別する。
飽和領域が無飽和領域を取り囲んでいる場合、その飽和
を有する領域は、対象領域を囲む為に用いられる境界ボ
ックスである可能性があり、対象領域として認識され
る。
【0031】自動領域選択ロジック(110)が認知す
る為に必ずしも対象領域を境界ボックスで囲まなければ
ならないということは無い。例えば、それ自体が蛍光マ
ーカーでハイライトされているテキストの一部も飽和度
を持つものとして見られ、自動領域選択ロジック(11
0)により対象領域であると認識される。このように、
対象領域はそれが色を有することで自動領域選択ロジッ
ク(110)により認識される。具体的にはユーザーが
原稿を走査する前に対象領域を示す為に利用したカラー
蛍光マーカーにより自動領域選択ロジック(110)が
非対象領域と対象領域との間の区別をつけられるのであ
る。
【0032】更に、高飽和度値を持つ領域、従って対象
領域が見つかると、異なる色同士を区別する為に色相が
分析される。例えば、赤の色相は青の色相の値とは異な
る値を持つ。このように、例えばテキスト、写真、線
画、表等の異なる領域タイプを示す為に異なる色相を利
用することが出来る。留意すべきはRGB−HLS変換
が画像中に色があるかどうかを判定する、単なる一方法
にしか過ぎないことである。例えば、色を判定する為
に、HSV(Hue(色相)、Saturation(飽和度)、Val
ue(値))色空間を利用することも出来るし、或は直接
RGB値を分析することも可能である。その他の色のつ
いた領域の判定方法には、L***又はL***のよ
うな明度、赤/緑及び黄/青の軸を有する色空間が含ま
れる。これらのような空間では赤/緑(a*、u*)又は
黄/青(b*、v*)パラメータのいずれか、或は両方が
ゼロ、即ち中間から著しく異なっているものを探す。更
に、その他数多くの色空間でもその他の飽和及び色相の
色空間と同様、効果があることは当業者に明らかであ
る。
【0033】自動領域選択ロジック(110)がページ
上のカラー部分を区別することが出来る1つの可能な方
法を説明する為にRGB−HLS変換を用いる場合を考
慮する。この例においては、市販の緑色の蛍光マーカー
を特定の対象領域を示す為に用いることを仮定してい
る。周知のRGB−HLS変換アルゴリズムは以下の通
りである。 RGBは赤、緑、青の原色(0−1) Hは色相(0−360°)、赤は0° Lは明度(0−1) Sは飽和度(0−1) Maxは最大値関数 Minは最小値関数 明度の判定 M1=Max(R、G、B) M2=Min(R、G、B) L=(M1+M2)/2 飽和度の判定 無色の場合 if M1=M2 then S=0 H=不確定 else 有色の場合 if L0.5 then S=(M1−M2)/(M1+M2) else S=(M1−M2)/(2−M1−M2) end if 色彩の判定 Cr=(M1−R)/(M1−M2) Cg=(M1−G)/(M1−M2) Cb=(M1−B)/(M1−M2) if R=M1 then H=Cb−Cg if G=M1 then H=2+Cr−Cb if B=M1 then H=4+Cg−Cr H=60*H if H<0 then H=H+360 end if finish
【0034】例として緑色の蛍光マーカーを用いると、
システムはまず0−255の赤、緑及び青値を255で
割ることにより0−1の間の値へと変換する。赤、緑及
び青値は、緑の蛍光マーカーを走査し、例えばフォトシ
ョップ(Adobe Systems社の登録商標)画
像編集ソフトウエアパッケージを用いてランダムに選択
された画素の色を分析することにより判定することが出
来る。簡略化する為に以下の計算では小数点第四位以下
を切り捨てた。 R=152/255=0.5961 G=255/255=0.8824 B= 0/255=0 M1=0.8824、M2=0 L=0.8824/2=0.4412が明度値。 M1≠M2の為有色である。L0.5、よってS=
(0.8824−0)/(0.8824+0)=1 →
S=1、よって完全飽和であり、従ってカラーであ
る。これは自動領域選択ロジック(110)がカラーの
領域を判定したことを示し、従って対象領域を表わして
いることになる。次にどの色が識別されたかを判定する
為に色相が以下の通りに分析される。Cが色を示す場
合、 Cr=(0.8824−0.5961)/(0.882
4−0)=0.3245 Cg=(0.8824−0.8824)/(0.882
4−0)=0 Cb=(0.8824−0)/(0.8824−0)=
1 Green=M1、従って H=2+Cr−Cb H=2+0.3245−1 H=1.3245 H=60*H H=79.47° HLS二重六角円錐カラーモデル(Double hexcone c
olor model)を見ると、79.47°が幾分黄色に近
い緑と黄色の間にあたることが当業者には明らかであろ
う。これはこの画素が黄緑の色相の色画素を表わしてい
ることを示す。人間の目にはこの色は黄色と言うよりも
緑により近く映るが、自動領域選択ロジック(110)
はこれをより黄色として認識する。このように、自動領
域選択ロジック(110)は色の有無によって対象領域
を判別することが出来、また更には異なる色を識別する
ことが出来る。
【0035】その後ユーザーが望めばプレビュー走査
(18)が自動的に選択された対象領域をディスプレイ
(19)上に表示する。プレビュー走査処理(18)の
間に原稿がディスプレイ(19)上に表示されると、自
動領域選択ロジックがその1つの又は複数の対象領域を
正確に解釈したかを確認する機会がユーザーに与えられ
る。対象領域がユーザーが望むように出なかった場合、
ユーザーはユーザーコントロール(34)を使ってその
領域を変更することが出来る。選択、表示された領域が
満足の行くものとなると、当業者には明らかなようにユ
ーザーは引き続きファックス送信や印刷、光学的文字認
識等のような、分析後の処理に移ることが出来る。
【0036】図3は図1及び図2の自動領域選択ロジッ
ク(110)の処理を説明するフローチャートである。 ブロック(111):特定の対象領域に蛍光マーカーを
引く、又は境界ボックスで囲む。 ブロック(112):被走査原稿をスキャナ(11)に
置く。 ブロック(114):自動領域選択ロジック(110)
が、対象領域の色に基づいて対象領域を検出する。 ブロック(116):自動領域選択ロジック(110)
が検出した対象領域をディスプレイ上に表示する。 ブロック(117):プレビュー走査により示された領
域が所望のものかどうかが判断される。 ブロック(118):光学的文字認識、ファックス送
信、印刷等の分析後タスクの実行。 ブロック(119):ユーザーが所望の対象領域となる
ようにその領域をユーザーコントロールを使って修正す
る。 以下フローチャートの詳細を示す。ブロック(111)
において、ユーザーは、例えば特定の対象領域に蛍光マ
ーカーを引くことにより、或はその対象領域を自動領域
選択ロジック(110)により認識可能の適切な色の境
界ボックスで囲むことにより、1つ又は複数の走査すべ
き対象領域を選択することが出来る。かわりに、ユーザ
ーは被走査画像を透明の保護用封筒に入れ、その透明の
封筒上に対象領域を示すようにしても良い。
【0037】ブロック(112)においてユーザーは被
走査原稿をスキャナ(11)に置く。
【0038】ブロック(114)では自動領域選択ロジ
ック(110)が、示された対象領域の色を上述した方
法に基づいて認識及び翻訳することによりその1つ又は
複数の対象領域を検出する為の処理を行う。ユーザーが
異なる領域タイプを示す異なる色を使うことにより、異
なる領域タイプが対象であることが示される。このよう
に自動領域選択ロジックは飽和度値、或は用いる色空間
に応じたその他の色の指標を分析し、ある特定の領域が
対象領域として示されているものかどうかを判定する。
自動領域選択ロジック(110)はまた、各々がある特
定の色で示された異なる領域タイプを区別する為に色相
値をも分析する。一度自動領域選択ロジック(110)
が対象領域を判別し、そして更なる作業が必要とされな
い場合(例えば一括処理モード等)、ブロック(11
8)において光学的文字認識やファックス送信、印刷等
のような分析後タスクが実行される。
【0039】ユーザーが自動領域選択ロジック(11
0)によって判断された対象領域を見ることを望む場
合、ブロック(116)において自動領域選択ロジック
(110)が解釈した対象領域がユーザーに対してディ
スプレイ(図2:19)上に表示される。ブロック(1
17)においては、プレビュー走査(図2:18)によ
りユーザーに示された領域が所望のものかどうかが判断
される。
【0040】表示された領域が所望のものではなかった
場合、ブロック(119)においてユーザーは分析コー
ド系(図2:17)を利用してユーザーが望むような対
象領域となるようにその領域をユーザーコントロール
(図2:34)を使って操作することが出来る。通常、
ユーザーはプレビュー走査処理(図2:18)の間、マ
ウスを使って対象領域を選択する。領域が所望のものと
なると、光学的文字認識、ファックス送信、印刷等の分
析後タスク(118)が実行される。
【0041】図4は図1、図2及び図3の自動領域選択
ロジック(110)の処理を通じて得られた結果を描い
た概略図である。図4には、代表的な被走査ページ(1
50)が描かれている。ページ(150)は例えばテキ
スト(151)を含んでいる。この例においては、自動
領域選択ロジック(110)の処理を通じて得られる結
果を説明する為にテキストを使っているが、本発明の利
用を通じて例えば線画、写真、図、グラフィクス等の異
なるタイプの領域も自動的に選択することが出来る。更
に、同一原稿上の複数の領域も、異なる領域タイプに異
なる色を指定することにより識別可能である。例えば、
テキスト領域を第一の色を使って識別する一方でグラフ
ィクス領域を第二の色を使って識別することが可能であ
る。
【0042】境界ボックス(155)は対象となるテキ
スト領域(152)を囲んでいる。境界ボックス(15
5)は例えば蛍光ペンのようなカラーマーカーを使って
テキスト(152)を囲むように形成されている。走査
された場合、境界ボックス(155)は自動領域選択ロ
ジック(図1、図2:110)によって対象領域として
解釈される。これが起こるのは境界ボックス(155)
が異なる色であり、従ってページ(150)中の残りの
部分の飽和度値とは異なる値を有する為である。ユーザ
ーは自動領域選択ロジック(110)に対し、このよう
にテキスト(152)が対象領域であることを明示す
る。自動領域選択ロジック(110)はその後ページ
(150)を分析し、飽和領域及び無飽和領域を探す。
例えば無飽和領域を取り囲む境界ボックス(155)の
ような飽和領域が識別されると、それは対象領域として
解釈され、ユーザーにそのように表示される。反対に、
テキスト(154)は飽和度値がわずかな、或は全く無
い領域として認識され、自動領域選択ロジック(11
0)はテキスト(154)を表示しない。
【0043】かわりに、ユーザーは1つ又は複数の対象
領域を、ある文章のみ、又は一語のみに蛍光マーカーで
印をつけることにより示すことも出来る。例えば、蛍光
マーカーの引かれた領域(157)は、テキスト部分
(152)もまた対象領域であることを示している。こ
の態様においては、自動領域選択ロジック(110)は
境界ボックス(155)を認識するかわりに蛍光マーカ
ーの引かれた領域(157)を認識する。例えば、ペー
ジ(150)上の色を有するあらゆる領域が自動領域選
択ロジック(110)により対象領域であると識別さ
れ、そしてそのようにユーザーに表示される。飽和度と
共に分析されるのが各対象領域の色相である。異なる色
相値を色の識別に利用することが出来、異なる色は同じ
原稿上の異なる領域タイプを示す為に利用できる。例え
ば、ユーザーは黄色の蛍光マーカーを使ってテキストを
対象領域として示し、青の蛍光マーカーを使って図を他
の対象領域として示すことが可能なのである。飽和度値
が分析されると、黄色及び青領域の両方が自動領域選択
ロジック(110)に両方とも対象領域であると判定さ
せるに充分な飽和度値を有していることがわかる。次に
黄色及び青領域両方を色相について分析することが出
来、どちらの色がテキストを示しているのか、またどち
らの色が図を示しているのかが判定される。このよう
に、原稿上の1つ又は複数の対象領域の判定が可能であ
るだけに留まらず、同じ原稿上の異なる領域タイプをも
判定することが可能なのである。更に、境界ボックス
(155)は長方形として描かれているが、特定の対象
領域を示すのにいかなる形を使っても良い。
【0044】以上、本発明の実施例について詳述した
が、以下、本発明の各実施態様の例を示す。
【0045】(実施態様1)被走査画像の特定領域(1
52)を自動的に選択する為のシステム(100)であ
って、(a)スキャナ(11)と、(b)前記スキャナ
(11)と交信する文書分析ソフトウエア要素(17)
と、(c)前記文書分析ソフトウエア要素(17)と交
信し、走査された画像中の色の違いを検出するように構
成されている自動領域選択ロジック(110)と、を含
むことを特徴とするシステム。
【0046】(実施態様2)前記走査された画像が複数
の画素を含み、前記各画素が赤、緑および青の値を有
し、前記自動領域選択ロジック(110)が前記各画素
の赤、緑および青の値から色相、明度および飽和度の値
へと変換するように構成されたロジック(115)を更
に有する、ことを特徴とする実施態様1に記載のシステ
ム(100)。
【0047】(実施態様3)前記自動領域選択ロジック
(110)が所定の色で境界を引かれた領域(155、
157)により画定される選択領域(152)を検出す
る、ことを特徴とする実施態様1に記載のシステム(1
00)。
【0048】(実施態様4)前記自動領域選択ロジック
(110)が走査された画像(155、157)の飽和
度の違いを検出することを特徴とする実施態様2に記載
のシステム(100)。
【0049】(実施態様5)前記自動領域選択ロジック
(110)が走査された画像(155、157)の色相
の違いを検出することを特徴とする実施態様2に記載の
システム(100)。
【0050】(実施態様6)被走査領域(152)を自
動的に選択する為の方法であって、(a)識別色(15
5、157)で被走査画像(150)の部分(152)
を囲む(155、157)ステップと、(b)前記画像
(150)を文書分析ソフトウエア要素(17)を使っ
て分析するステップと、(c)前記原稿分析要素(1
7)を使って、前記識別色(155、157)を検出す
るステップと、を含むことを特徴とする方法。
【0051】(実施態様7)前記検出するステップが、
前記被走査画像の前記部分を赤、緑および青の値から、
色相、明度および飽和度の値へと変換するステップ(1
15)を更に含むことを特徴とする実施態様6に記載の
方法。
【0052】(実施態様8)前記飽和度値が前記被走査
画像(150)の前記部分(152)を区別する為に使
われることを特徴とする実施態様7に記載の方法。
【0053】(実施態様9)前記色相値が前記被走査画
像(150)の前記部分を区別する為に使われることを
特徴とする実施態様7に記載の方法。
【0054】当業者には明らかであるが、上述したよう
に多くの修正及び変更を本発明の実施例に本発明の原理
から離れること無く加えることが可能である。例えば、
自動領域選択の為のシステム及び方法を様々な走査及び
コンピューター計算上の生成物を使って実施しても良
く、同じ画像における複数の領域タイプを識別する為に
実施しても良い。更に、自動領域選択の為のシステム及
び方法は、有色及び無色の領域を区別するあらゆる方法
を利用して実施することも可能である。このような修正
及び変更は全て請求項に定義された本発明の範囲におい
て本願に含まれることが意図されてたものである。
【図面の簡単な説明】
以下の図を参照することで請求項に定義の本発明のより
深い理解が得られる。図における構成要素は必ずしも互
いに対して一定に決められているわけではなく、本発明
の原理を明確に説明することに比重をおいて描かれたも
のである。
【図1】 本発明の自動領域選択ロジックを有するスキ
ャナ及びコンピュータシステムの具体例の概略図であ
る。
【図2】 図1のユーザーインターフェース及び本発明
のロジックを有する分析コード系を描いた概略図であ
る。
【図3】 図1及び図2の自動領域選択ロジックの処理
を説明するフローチャートである。
【図4】 図1、図2及び図3の自動領域選択ロジック
の処理を通じて得られる結果を描いた概略図である。
【符号の説明】
11:スキャナ 12:コンピュータ 13:ユーザーインターフェース 14:データ取り込みブロック 16:RAM 17:分析コード系 18:プレビュー走査ブロック 19:ディスプレイ 21:データマネージャー 22:領域マネージャー 24:バス 25:マイクロプロセッサ 34:ユーザーコントロール 100:システム 110:自動領域選択ロジック 115:RGB−HLS変換要素

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】被走査画像の特定領域を自動的に選択する
    為のシステムであって、(a)スキャナと、(b)前記
    スキャナと交信する文書分析ソフトウエア要素と、
    (c)前記文書分析ソフトウエア要素と交信し、走査さ
    れた画像中の色の違いを検出するように構成されている
    自動領域選択ロジックと、を含むことを特徴とするシス
    テム。
JP11275701A 1998-10-08 1999-09-29 自動走査領域選択装置及び方法 Pending JP2000123181A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16880998A 1998-10-08 1998-10-08
US168,809 1998-10-08

Publications (1)

Publication Number Publication Date
JP2000123181A true JP2000123181A (ja) 2000-04-28

Family

ID=22613016

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11275701A Pending JP2000123181A (ja) 1998-10-08 1999-09-29 自動走査領域選択装置及び方法

Country Status (2)

Country Link
EP (1) EP0996080A3 (ja)
JP (1) JP2000123181A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017228973A (ja) * 2016-06-23 2017-12-28 京セラドキュメントソリューションズ株式会社 画像処理装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2362056B (en) * 2001-02-09 2004-05-26 Hewlett Packard Co System and method for saving handwriting as an annotation in a scanned document
US7042594B1 (en) 2000-03-07 2006-05-09 Hewlett-Packard Development Company, L.P. System and method for saving handwriting as an annotation in a scanned document
US7286248B2 (en) * 2001-01-25 2007-10-23 Xerox Corporation Image forming system for forming multiple images on a printing medium
WO2022150042A1 (en) 2021-01-08 2022-07-14 Hewlett-Packard Development Company, L.P. Feature extractions to optimize scanned images

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5579407A (en) * 1992-04-21 1996-11-26 Murez; James D. Optical character classification
JP3461626B2 (ja) * 1995-07-28 2003-10-27 シャープ株式会社 特定画像領域抽出方法及び特定画像領域抽出装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017228973A (ja) * 2016-06-23 2017-12-28 京セラドキュメントソリューションズ株式会社 画像処理装置

Also Published As

Publication number Publication date
EP0996080A3 (en) 2002-01-09
EP0996080A2 (en) 2000-04-26

Similar Documents

Publication Publication Date Title
US10339378B2 (en) Method and apparatus for finding differences in documents
US8000529B2 (en) System and method for creating an editable template from a document image
US8428356B2 (en) Image processing device and image processing method for generating electronic document with a table line determination portion
US7577295B2 (en) Markup symbol document processing system
US10477063B2 (en) Character detection and binarization
JP4574503B2 (ja) 画像処理装置、画像処理方法およびプログラム
GB2360417A (en) Automatic assignment of a filename to a scanned document
CN101689203A (zh) 图像处理设备、图像处理方法和计算机程序
US9558433B2 (en) Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
US7864985B1 (en) Automatic operator-induced artifact detection in document images
JP2007004621A (ja) 文書管理支援装置、文書管理支援方法およびプログラム
CN111738901A (zh) 存储介质以及图像处理装置
US7042594B1 (en) System and method for saving handwriting as an annotation in a scanned document
US8570619B2 (en) Control devices for scanning documents, systems including such control devices, and non-transitory, computer-readable media storing instructions for such control devices
US9338310B2 (en) Image processing apparatus and computer-readable medium for determining pixel value of a target area and converting the pixel value to a specified value of a target image data
JP2008204184A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US10887491B2 (en) Image processing apparatus for processing of highlighted regions
JP2000123181A (ja) 自動走査領域選択装置及び方法
JP5020698B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP2019046225A (ja) 認識装置、認識プログラム、及び認識方法
US10572751B2 (en) Conversion of mechanical markings on a hardcopy document into machine-encoded annotations
US8295602B2 (en) Image processing apparatus and image processing method
EP0975146A1 (en) Locating the position and orientation of multiple objects with a smart platen
EP1018694B1 (en) System and method for automatic graph parsing
GB2362056A (en) Detecting and saving annotations in a scanned document