JP4486193B2 - 文書処理方法 - Google Patents

文書処理方法 Download PDF

Info

Publication number
JP4486193B2
JP4486193B2 JP31413799A JP31413799A JP4486193B2 JP 4486193 B2 JP4486193 B2 JP 4486193B2 JP 31413799 A JP31413799 A JP 31413799A JP 31413799 A JP31413799 A JP 31413799A JP 4486193 B2 JP4486193 B2 JP 4486193B2
Authority
JP
Japan
Prior art keywords
glyph
image
document
pattern
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31413799A
Other languages
English (en)
Other versions
JP2000155837A (ja
Inventor
エル クロッツ ジュニア レイ
ダブリュ ペトリエ グレン
エス バウアー ロバート
ディビス ダニエル
エイ クレイグ ジュリア
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US09/192,014 external-priority patent/US7168036B2/en
Priority claimed from US09/191,969 external-priority patent/US6470096B2/en
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2000155837A publication Critical patent/JP2000155837A/ja
Application granted granted Critical
Publication of JP4486193B2 publication Critical patent/JP4486193B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32128Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image
    • H04N1/32133Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image on the same paper sheet, e.g. a facsimile page header
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00962Input arrangements for operating instructions or parameters, e.g. updating internal software
    • H04N1/00968Input arrangements for operating instructions or parameters, e.g. updating internal software by scanning marks on a sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3204Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a user, sender, addressee, machine or electronic recording medium
    • H04N2201/3205Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a user, sender, addressee, machine or electronic recording medium of identification information, e.g. name or ID code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3212Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a job, e.g. communication, capture or filing of an image
    • H04N2201/3222Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a job, e.g. communication, capture or filing of an image of processing required or performed, e.g. forwarding, urgent or confidential handling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3269Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of machine readable codes or marks, e.g. bar codes or glyphs

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ハードコピー文書を利用して文書処理アプリケーションのためのユーザインタフェースを実現する技術に関し、特に、ハードコピー文書を用いて、そのハードコピー文書に関連するタグ上に印刷データとして格納されたユーザ情報又はサービス情報に従って各種サービスを実行するようにしたタグ利用ユーザインタフェーススキームに関する。
【0002】
【従来の技術】
多くの人々にとって、文書はハードコピー(紙等に印刷した状態)で取り扱うのがもっとも扱いやすい。一般に、ハードコピー文書は、ディジタル状態の文書よりも読みやすく、取り扱いやすく、保存しやすい。特別の専門知識やコンピュータハードウエアも必要としない。
【0003】
しかしながら、一般に文書は、ディジタル状態の方が細かな操作が行いやすい。テキスト文書は、索引付けしたり、検索したり、フォーマット(形式)を変更したり、一部を抽出したり、その他の変更を加えたりすることができる。保存された文書は容易にしかも品質の劣化なく複製でき、人から人へ(例えば電子メールなどで)送信することができる、そして、重要なことに、これら全てのことは紙を用いずに行うことができる。更には、オフィスや家庭でディジタル複写機やスキャナの普及が進んでいる。
【0004】
その一方で、文書をディジタル状態で取り扱うには、一般にはコンピュータシステムやネットワークにアクセスする必要がある。コンピュータシステムのユーザがそのシステムを使うための基礎レベルの専門知識や能力を持っていない場合は、生産性に悪影響を及ぼすおそれもある。このことは、ディジタル文書を(紙文書に替えて)主たる文書タイプする「ペーパレスオフィス」の実現の大きな妨げになる。
【0005】
したがって、ディジタルドメインの文書を効率的に管理できるようにし、ハードコピー文書からディジタル文書へ容易に変換できるようにすることが要望されている。
【0006】
ディジタル文書の取扱を可能にする従来の試みでは、伝統的なユーザインタフェースパラダイムを用いることが多かった。例えば、ハードコピー文書をスキャンして文書保管部に入力する場合、そのためのコマンドがまずコンピュータ端末又はスキャナ装置に入力され、これによりそれら装置がその文書について所望のサービスを提供する。同様の手順は、ハードコピーをスキャンしてファックスしたり、スキャンして電子メール送信したり、スキャンして(OCRソフトウエアで)文字認識したり、その他様々な処理を行ったりする際にも実行される。コマンドの入力は、ユーザフレンドリなソフトウエアやそのまま読めば分かるコマンドにより行うことができるが、このようなコマンド入力のための余計なステップは退屈なものであり、ある程度の専門知識を要するものでもある。更に、入力される一連のコマンドは、いったん操作が終わると失われてしまい、経験のあるユーザでさえ誤りを起こすおそれがある。
【0007】
別の手法として、それらコマンド群を指定するためのフォームを含んだカバーシートを用いるものがある。カバーシートにはユーザの希望に従って書き込み(例えば手書きのコマンドやチェックボックスへのチェック書き込み)が行われ、スキャナはカバーシート上のそれらコマンドを解釈し、添付された文書をそれに従って処理する。これも、手間がかかり、比較的効率がよくない。なぜなら、この方法では、各ジョブごとに専用のカバーシートを必要とするからである。そのような専用のカバーシートを常時用意するのは容易ではない。
【0008】
各種の1次元及び2次元のデータコードが、ハードコピー文書上にディジタルデータを記すためのものとして知られており、利用されている。例えば、各種のバーコード(例えば小売製品コードとして用いられている周知のUPCシンボル)が非常によく知られており、これらはデコードに関するロバスト性が高い。線形バーコードの他の例としては、Code39やCode128、Inteleaved2of5、Postnetなどが知られている。PDF417やUnited Percel Service社で荷物の追跡に用いられているUPS MaxiCodeなどの2次元バーコードも、普及しつつある。
【0009】
Xerox社のDataGlyphのようなセルフクロック(自動クロック生成)・グリフは、通常のハードコピー文書を含む各種の画像の中に、機械読取可能なディジタル情報を埋め込む手法として魅力のあるものである。これらのコードは、画像ひずみやノイズに対して実質的に耐性がある。なぜなら、そのコードでエンコードされたディジタル情報は、明確に示される機械読取可能なマーク(すなわち“グリフ”。ここで、この用語は、Xerox社のDataGlyphに限定するものではなく、機械読取可能な全てのマークを含むものとして用いる)群に埋め込まれ、それらマークによって完全に規定されるからである。これらグリフは、そのコードに埋め込まれる情報を表すだけでなく、そのコードから情報を取り出すために用いるサンプリングクロックを定めるためにも用いられる。したがって、それらグリフは、コードに“セルフクロック”特性をもたらすと共に、歪み・ノイズ耐性をもたらしている。
【0010】
セルフクロック・グリフコードの別の利点は、通常の場合見た目に目立たないという点である。この利点は、グリフ群が、その各々の中心が2次元空間的に周期的なパターン(例えば正方格子パターン)に従うように配列される場合に顕著である。なぜなら、グリフが空間的に周期的に繰り返されることにより、コードがある程度均一なテクスチャ(構造)に見えるからである。例えば、論理的に順番に並んだ1ビットのディジタル量子は、所定の空間フォーマット規則に従う2次元の空間的な周期パターンに従って記される、スラッシュ(斜線)状の長いグリフにコード化される。ここで、各グリフは、垂直線に対してほぼ+45°又は−45°と右左に傾いた線分として記され、一方が論理値“0”を、他方が“1”を示す。この方式では、1ビットディジタル量子の2つの論理値を表すグリフが互いに対して垂直となるので、コードの弁別性が向上し、コードパターンがほぼ均一なグレースケールに見えるほど精細なパターンで表された場合でさえ、コードに埋め込まれた情報の再生が十分に可能となる。なお、セルフクロック・グリフコードは、上述の1ビットディジタル量子(1ビットコード)だけでなく、複数ビットディジタル量子(例えば1バイトコードなど)をコード化するのに用いることもできる。
【0011】
【発明が解決しようとする課題】
本発明は、ディジタル文書の利用と、ハードコピー形式からディジタル形式への文書の変換を可能にする、単純かつ効率的で便利な、ユーザ側の専門知識をほとんど又はまったく要求しない解決手段を提供することを目的とする。
【0012】
【課題を解決するための手段】
参考例では、コードが付された粘着式のステッカーやラベルなどのタグを利用し、ハードコピー文書処理システムの基本的なユーザインタフェースを提供する。このシステムでは、ユーザは、実行させたいアクションやサービスを指定したり、自分の識別情報を示したりするのに、文書にステッカーを貼り、これをコピー機やスキャナのビンに投入して読み取らせるだけでよい。
【0013】
ステッカーは、比較的小さくて目立たないものとする。参考例を適用した一つの具体例としては、ユーザIDや所望のサービス、及びサービスについてのオプションの引数などをエンコードするのに、Xerox社のDataGlyphを利用するものがあり、これについては後に詳しく説明する。ユーザは、特定のサービス(例えば「スキャンして私の個人用電子メールアカウントに送る」などの個別のサービス)のためのステッカーを持っているようにする。ユーザは、そのサービスを実行させたいと思ったときには、単にその目的に合ったステッカーを文書に貼り付けるだけでよい。
【0014】
参考例に係るコンピュータシステムは、まずユーザの身元を表す識別情報を受け取る。この識別情報は、例えば、そのユーザの名刺を読み取って解析するなどにより得ることができる。この情報はデータベースに保存され、この情報に対して一意的なユーザID番号が付与される。このユーザIDは、要求されるサービスのコードと組み合わせられ、この結果得られたデータセットは、要求された印刷データフォーマットに従ってエンコードされる。そして、このシステムは、そのユーザIDとサービスを表したそのユーザ専用のラベルを印刷出力する。
【0015】
ユーザは、自分のステッカーが示すサービスを受けたいと思ったときは、単にそのステッカーを1枚とって文書に貼り付け、この文書をスキャナのキュー(読取処理用のトレイなど)に入れればよい。すると、この文書が読み取られ、ステッカーが識別されてそのデータのデコードが行われ、データベースから検索されたユーザの情報に対して関連づけされ、要求されたサービスが実行される。
【0016】
このシステムが、単に文書を読み取って文書保管部に格納するサービスや、文書をファクシミリ送信するサービス、文書を標準的な電子文書形式(例えばマイクロソフト社のWord形式など)に変換するサービス、その他様々なサービスやアクション(動作)の実行に適用可能なことは明らかであろう。
【0017】
このように、参考例に係るステッカーを用いたユーザインタフェースは便利かつ簡単であり、ユーザは、コンピュータシステムにコマンドを入力したり、処理すべき文書毎にそのカバーシートのチェックボックス等に書き込みを行ったり、等の作業をする必要がない。このシステムは、ユーザが小さなステッカーを切らさないように管理しているだけでよいので、効率的である。
本発明に係る方法は、ディジタル化画像の中から、所定の対角線長さを持つ実質的に矩形のパターンを検出する方法であって、ディジタル化画像のデータを取得するステップと、その画像中の連結成分を検出するステップと、その連結成分中の複数の極点を求めるステップと、前記複数の極点の中に、前記所定の対角線長さに実質的に等しい距離の極点のペアがあるか否かを判定するステップと、そのようなペアがあれば、その極点ペアに係るパターン候補の頂点の位置を求めるステップと、それら頂点群により、所定寸法の実質的に矩形形状のパターンが規定されるかを判定するステップと、を含む。
【0018】
【発明の実施の形態】
以下、本発明の実施の形態(以下実施形態という)について、図面に基づいて説明する。
【0019】
図1は、本発明に係るペーパー・ユーザインタフェース・タグとして用いることができるグリフ・ステッカーパターン110の一例を示す。ここで注意しておきたいのは、この図に示したパターン110はいずれかの特定の縮尺に対応して描いたものではないということである。ここに例示のパターンは、垂直方向2.5cm(1インチ)以下程度のオーダを想定したものであるが、ここでは細部が識別できるよう明確にするため、拡大して示している。
【0020】
更に、ここでは、ユーザインタフェースタグは、文書に取り付け可能な粘着式のステッカーとして図1に示したが、このパターン110はフォーム(帳票)やスリップシート(合紙)、カバーシート、名刺、IDカード、ネームタグなど、文書に対して関連付け可能で且つ機械読取可能な情報を担持できるものであればどのようなものにも適用できる。例えば、本発明のある具体化例では、パターン110を担持したラペル(襟)ピンを用い、文書をスキャンして処理する際に(例えばハンドヘルド型のレーザスキャナで)そのピンをスキャンすることで、そのピンをその文書に関連付けることができる。
【0021】
グリフパターン110は、いくつかの重要な属性を持っている。実質的に矩形の境界線111がその他の特徴部分を取り囲んでおり、その境界線自体は白色スペース部113で取り囲まれている。グリフフィールド112は、本実施形態の目的を実現するために用いるディジタルデータの印刷表現を含んでいる。グリフフィールド112の構造と内容は、後で詳しく説明する。ここでは、図1のグリフフィールド112が、Xerox社のDataGlyphを用いていることに留意されたい。しかしながら、バーコードや1次元あるいは2次元のデータパターン、光学読み取り認識可能なアルファベットや数字などの文字(アルファニューメリック文字)など(ただしこれらに限定はしない)も、例示したグリフと同様の効果をもたらすものとして利用することができるのは言うまでもない。
【0022】
グリフステッカーパターン110には、その他の識別用要素を含めることができる。例えば、図示の例では、Xerox社のロゴ“Digital X”114や登録商標“PaperWare”116などが表示されており、これらは美的な目的や商標表示のために用いられている。“The Person”というフレーズ118も表示されているが、この部分はユーザの名前やその他視覚的な識別のための情報の表示に置き換えることができる。境界部120は、隅が折られたページを示している。この折り曲げ部を表す境界部120は、美的目的のためのみに設けてもよいが、グリフステッカーパターン110の正しい向きの判別のために用いてもよい。これらの点については、後に改めて説明する。
【0023】
次に図2を参照して説明する。図2は、グリフフィールド112に埋め込まれるデータ構造210の一例を示す。データ構造210は、サービスコード212を含み、このコードは例えばこの例では1バイト(2進ビットで8ビット)である。したがってこの例では、サービスコード212は256種類までの異なるアクション、変換及びサービスを示すことができる。サービスには、例えば「文書をスキャンして保管部に保管」、「スキャンして電子メールで送信」、「スキャンしてファックス送信」、「スキャンしてコピー印刷」など(ただし、これらに限定されるものではない)が含まれる。1つのサービスが複数のアクション(例えば、スキャンした後文字認識を行い、更にそのテキストを電子メール送信する、など)を含むようにすることもでき(ただしこれに限定するものではない)、またサービスには、ハードコピーから電子形式への文書の変換やその逆変換なども含まれる。さらに、アクションの中には、文書のディジタル化画像上のグリフステッカーパターン110を削除したり変更したりする処理もある。グリフステッカーパターン110は、いったん本実施形態のシステム及び方法によって機能した後は、もはや文書上に存在する必要はない(あれば、その文書の見栄えを損なうかも知れない)ので、そのような処理を行う場合も出てくる。
【0024】
サービス引数214は、サービスコード212に対する引数をコード化したものである。本実施形態では、引数214は、付加的な1バイト(8ビット)の情報である。例えば、数字の引数(例えば「スキャンしてコピー印刷」のコードの後に「10」という引数が続けば、10部のコピーを印刷する指示となる)を必要とするサービスもある。別のサービスの中には、これとは異なるやり方でコード化した引数を必要とするものもある(例えば「スキャンしてファックス送信」の後に「2」という引数が続いた場合、文書を(当該ユーザのオフィスのファックス番号や当該オフィスの別のファックス番号ではなく)当該ユーザの自宅のファックス番号に送信することを表すものとする、などである。オフィスのファックス番号には、別の引数が割り当てられる)。サービス引数214は、本発明の範囲を逸脱することなく、他にも様々な利用の仕方ができる。
【0025】
識別コード216は、データ構造210の残りのほとんどの部分から校正されている。本実施形態では、識別コードは、16バイトの識別情報(これだけあれば、考え得る全人口の各メンバーの一意的な識別番号を表すのに十分である)と、8バイトのセキュリティ情報を含んでいる。セキュリティ情報は、識別情報に耐タンパ性を付与する(識別情報の改竄を防止する)。識別情報は、その識別コードを発行したマシンのネットワークアドレス(Ethernetアドレス又はIPアドレス)、タイムスタンプ、及びシーケンシャル番号(自動生成される続き番号)を含む。この方式で生成される番号はあらゆる状況で一意であるとは保証できない(例えばシーケンシャル番号のデータベースが失われ、同じタイムスタンプが同時に2度使われる場合など)が、本発明が目的とするような範囲では、ロバスト性が高く、十分に一意的なものである。なお、識別コードは、その他の様々な方法で生成することができ、これら様々な方法は全て本実施形態で利用することができる。
【0026】
データ構造210は、上記のデータフィールド全体にわたって、本発明の分野で周知の方式で誤り訂正及び同期のための情報を含むが、これらは図2には示していない。図3は本実施形態のシステムレベルでの概要を表す図であり、いくつかの高レベルの機能要素に分けて示されている。「フロントエンド」部310はデータ入力部312から情報を受け取る。データ入力部312はキーボード、名刺スキャナ、音声認識装置、その他ユーザの識別情報を取得するための機能を持つデータ収集手段を含む。データ入力部312はユーザーの名前、会社、肩書、住所、(1つ又は複数の)電話番号、(1つ又は複数の)電子メールアドレス、その他の識別情報(合衆国社会保障番号やカンファレンスのID番号など)を取得するためのものである。このユーザ情報は、識別処理部314に渡される。識別処理部314は、その情報を、データベースサーバ316が管理するデータベースに格納する。同時に、ユーザ情報は識別処理部314で処理され、これにより識別コード216(上述の識別及びセキュリティのための情報を含む)が生成される。そして、識別コード216と、要求に応じて付け加えられるサービスコード212及びサービス引数214とが、エンコードされ、プリンタ318その他の識別処理部314に接続されたハードコピー出力装置にてプリントされる。
【0027】
ユーザがある文書を処理したいと思った場合、そのユーザは本実施形態のグリフステッカーをその文書に貼り付け、その文書をスキャナ320にセットする。スキャナ320は本システムの「バックエンド」319の一部である。スキャナは、複数のジョブと複数ページの文書をユーザの介入無しに取り扱うことができる自動スキャナであることが望ましい。ただし、本実施形態では、他のタイプのディジタル化装置(例えばフラットベッド型スキャナ、ディジタルコピー機、ハンドヘルド型のスキャナなど)を利用することもできる。スキャナ320は文書を読み取り、その文書(及びその文書上のグリフステッカー)のビットマップ表現を形成する。
【0028】
アクション処理部322は、スキャナ320から受け取ったビットマップを読み取り、グリフステッカーを識別してデコード(復号)し、データベースサーバ316にアクセスしてユーザの識別を行う。要求されたサービスは、アクション処理部322がローカルで持っている提供可能なサービスのリストにアクセスすることで知ることができ、またデータベースサーバ316のサービスデータベースにアクセスすることで判定することもでき、更には単にユーザの識別情報から推論することもできる。
【0029】
このようにして求められたユーザの識別情報と要求されたサービスに基づき、アクション処理部322は、その要求されたアクションを実行する。このアクションは、変換された文書を出力装置324から出力する動作を含みうる。出力装置324についてはここで概略の特徴を示した。しかしながら、出力装置324は、上述のように、ハードコピープリンタやファクシミリ装置(又はファックスメッセージが送信可能なモデム)、電子メールのためのネットワーク接続装置、文書保管部への接続装置、ディジタル記憶装置(フロッピーディスクドライブなど)、あるいは上述の機能のいくつか又は全てを有する装置、を含みうる。
【0030】
図3のシステムは、いくつかの機能ブロックに分けて示したが、これらの機能は単一のコンピュータシステムで実現することもできるし、通信ネットワークを介して接続された複数のコンピュータシステムで実現することもできる。例えば、データベースサーバ316は、識別処理部314及びアクション処理部322にローカル接続することもできるし、インターネットや社内イントラネットなどの通信ネットワークを介して他の機器と通信する個別の処理装置として構成することもできる。
【0031】
図3を用いて示したように、本システムのフロントエンド処理、すなわちユーザ情報及び要求されたサービスに基づくグリフステッカーパターン110の生成処理は、一連のステップにより行われる。これら一連のステップが図4のフローチャートに示される。
【0032】
まず、ユーザ(又は他の人)が、典型的にはデータ入力部312(図3)を介して、本システムに情報を入力する(ステップ410)。全ての情報は、データベースサーバ316のデータベースに格納される(ステップ412)。そして、サービスが選択される(ステップ414)。サービスは、例えば、提供可能なサービス群を示す「メニュー」から選択される。なお、ただ1つのサービスのみが可能なシステムも本発明の範囲内である。提供可能なサービスが1つだけの場合、サービスコード212やサービス引数214(図2)を、グリフステッカーパターン110から省略することもできる。
【0033】
次に、ユーザ識別コード216、サービスコード212及びサービス引数214がエンコードされ、その情報を表すグリフフィールド112内に書き込まれる(ステップ416)。このようにして新規作成されたユーザ専用のグリフフィールド112は、グリフステッカーパターン110として、ユーザが利用したいときに所望の数のステッカーに、好きなだけ繰り返して印刷される(ステップ418)。
【0034】
図5は、ユーザが文書にステッカーを貼り付けスキャナに投入した後に起こる処理を説明するためのフローチャートである。まず、その文書はスキャンされ(ステップ510)、この結果得られたビットマップが処理のために保持される。この時点では、オリジナルのハードコピー文書はユーザの手元に戻り、その後は本システムでは必要とされない。
【0035】
次に、グリフステッカーパターン110がその文書の中から検出される(ステップ512)。本発明の好適な実施例では、グリフステッカーパターンは、図6を用いて後に説明する矩形マッチング法によって検出される。別の実施例としては、ユーザが文書上の予め決められた場所(先頭ページの右上隅など)にグリフステッカーを貼ることで、グリフステッカーパターン110の位置検出のための処理を単純化するという方法もある。更に別の例では、スキャンした文書のビットマップをテキスト部分とグラフィックス(図形)部分とに分割し、線図形部分の中からグリフステッカーパターン110の境界線を含んだ直角の線を検出することにより、ステッカーパターン110が文書上のどこにあっても検出することができる。これを実現するための方法は、ブルームバーグ(Bloomberg)に付与された米国特許第5,202,933号“SEGMENTATION OF TEXT AND GRAPHICS(テキストと図形の分割)”に詳細に示されており、この米国特許の内容をここにリファレンスとして組み込む。これを可能とするために、ハーフトーンや精細なテクスチャのグラフィックス領域(リソグラフ写真など)も、米国特許第5,065,437号や同第5,131,049号などに示される方法を用いて、分割(そして線図形部分から区別)する。ここで、グリフステッカーパターン110は、ほとんどあらゆる向きを取り得ることに注意が必要である。したがって、この分割手法は、グリフステッカーパターンがないと決定する前に、(前記米国特許5,202,933号で用いられるモーフォロジカル(morphological)操作にて、異なった形状の構造化要素を用い、水平線及び垂直線を識別することにより)いくつかの異なる方向についてチェックできるようになっている必要がある。ハウスドルフ距離を用いたアルゴリズムを用いることもできる。この方法は、上述したモーフォロジカル方式と同様、回転に敏感であり、従って計算的には効率がよくないことに注意が必要である。
【0036】
グリフステッカーパターン110が検出されると、グリフフィールド112の中のデータが次にデコードされる(ステップ514)。これは、後に図7から4を用いて詳細に説明する方法を用いて実現される。次にこのデータは、(データベースサーバ316から受け取った)ユーザ識別情報と要求されたサービスとに関連付けられ(ステップ516)、そのサービスが、公知の上述の手段により実行される(ステップ518)。
【0037】
ディジタル画像からユーザインタフェースタグ(例えば図1のグリフステッカーパターン110)を検出するのに用いる好適な方法を図6に示す。この方法は、一隅が折り畳まれたページのアイコン表現のような、本発明の一実施例のグリフステッカーパターン110(図1)として用いられるものと同様の、ほぼ矩形形状のオブジェクトを識別し検出するために用いることができる。このような矩形オブジェクトは、高さと幅によって特徴づけられる。この識別方法は、所望のパターンがどの方向を向いていても、多少の寸法の変化があっても(これは印刷や読取の際に起こる)、あるいは画像にノイズが含まれている場合でさえも、そのパターンを識別することができる。この方法はモノクロ画像(すなわち1画素当たり1ビットで表されたバイナリ画像)に対して適用できる。もしディジタル化画像が他の形式(カラーやグレースケールなど)であった場合は、まず、図6に示した方法を実行する前に、その画像をバイナリ形式に変換する必要がある。この変換は例えば、しきい値関数やディザ法により実行することができる。
【0038】
利用するディジタル化装置の特性(例えば解像度)は既知であるとする。したがって、グリフステッカーパターン110(図1)の絶対サイズは既知なので、その画像サイズが計算できる。すなわち、画素単位でのパターン110の幅をw、高さをhとすると、それらは既知であるか、あるいは簡単に計算できる。前述のような寸法の小さな変化を考慮して、幅と高さの許容誤差(それぞれΔw、Δhとする)を考えに入れると、期待される幅の最小値はwmin=(w−Δw)、最大値はwmax=(w+Δw)、期待される高さの最小値はhmin=(h−Δh)、最大値はhmax=(h+Δh)となる。好適な例では、Δh=(0.1)h、Δw=(0.1)wであり、これは別の言い方では、許容誤差は高さ、幅のそれぞれ10%であるということになる。なお、当然ながら許容誤差の範囲はこれに限らず、高さ及び幅について他の許容誤差を用いることもできる。
【0039】
したがって、上述の説明によれば、対角線の長さの最小値及び最大値は、それぞれ、dmin={(w−Δw)2+(h−Δh)21/2 、dmax={(w+Δw)2+(h+Δh)21/2となる。
【0040】
適切なディジタル画像が得られると、その画像内の全ての連結成分をまず識別する(ステップ610)。連結成分は、ある単一の値(例えば黒を表す値)の画素の組であり、その組の任意の画素から同じくその組の別の任意の画素まで、その組から外れることなく(すなわち黒画素のみを通って)パスを形成することができる。一般的な用語では、連結成分は「4連結」か「8連結」のいずれかである。4連結の場合、パスは垂直方向又は水平方向にのみ伸展することができ、すなわち4つの方向を取りうる。したがって、斜め方向について隣り合う2つの黒画素同士は、他の黒画素が水平又は垂直方向に隣接してそれら2つの橋渡しをしない限り、4連結ではない。8連結の場合、画素間のパスは斜め方向にも延びることができる。好適な実施形態としては8連結の成分を用いるが、4連結の成分も識別でき使用することができる。
【0041】
グリフステッカーパターン110(図1)の境界線111は、連続する1組の黒画素が形成されているので、境界線111は単一の連結成分からなることが検知される。境界線111の周囲の空白スペース113は、グリフステッカーパターン110が適用されたハードコピー文書の一部に、その境界線111が偶然接触してしまうことがないよう、十分に広いスペースとなっている。更に、境界線111は、画像ノイズによって偶然にとぎれてしまうことがないよう、十分に太いものである。
【0042】
画像中の連結成分は、公知の方法(すなわち、画像中のある1つの黒画素から出発し、連結成分が完全に求められるまで、その黒画素に連結する画素を再帰的に検出し、これを画像中の全ての黒画素が連結成分に属する様になるまで繰り返すなど)により識別される。なお、これ以外の方法でも同様のことを成し得る。
【0043】
次に、各連結成分がそれぞれ個別に処理される。もし未処理の連結成分があれば(ステップ611)、これについて以下に示す処理を行う。連結成分が小さすぎる場合(ステップ612)、すなわちその連結成分の高さ又は幅が、前述した期待される高さ、幅の最小値より小さい場合は、その連結成分を削除する(ステップ614)。パターン110の回転を考慮して、hminとwminうちの小さい方を、高さ及び幅の共通の最小値として用いることもできる。同様に、連結成分が大きすぎる場合(ステップ616)、すなわち幅又は高さが想定した最大値よりもかなりの程度大きい場合、その連結成分は削除される(ステップ614)。パターン110の回転を考慮して、hmaxとwmaxうちの大きい方を、高さ及び幅の共通の最大値として用いることもできる。パターン110(又は任意の矩形)がある角度に傾いていると、その幅及び高さが想定よりも大きく見え、dmaxに近づく。したがって、上記の後者のチェックにはある程度余裕を見込む。
【0044】
連結成分Cを構成する画素の組から、8個の「コンパス位置」(東西南北などの方位)の各々について1つずつ、合計8個の極点を選択する(ステップ618)。各点は(x,y)の座標ペアで表される位置を持っており、画像平面内で選ばれた方向(北、北東、東、南東、南、南西、西、又は北西)について最も端にある連結成分Cの画素を表している。各極点は次のようにして選ばれる。
【0045】
【数1】
Figure 0004486193
これら8個の極点を識別する方法には、様々な最適化を施すことができることに注意すべきである。例えば、もし連結成分Cが連続した画素群からなる水平方向のラン(run)に分解されれば、NW(北西)、W(西)、及びSW(南西)の極点の候補として、それら各ランの最左端の画素のみを考慮すればよい。また、NE(北東)、E(東)、SE(南東)の極点の候補としては、各ランの最右端の画素のみを考慮すればよい。更に、水平ランが垂直方向に並んでいれば、上端及び下端のランの端点のみが、N(北)及びS(南)の極点を求めるのに考慮される。境界線111(図1)が、正立状態に対して正確に45°間隔で傾いた各向き(すなわち、0°、45°、90°、135°・・・と傾いた各状態)にある場合、連結成分の中には、上述の極点の条件を1つ又はそれ以上を満足する画素が多数出てくることになる。これは実際のところ問題とはならない。条件を満足する点ならどれを選んでもよい。例えば、図1の境界線111には単一の最南画素というものはなく、底辺上のいずれの画素を選んでもよい。さらに、1つの画素が複数の極点として用いられてもよい。図1を再び参照すれば、例えば右下隅の画素122は、S、SE及びEの各極点として用いることができ、こうしても本実施形態の方法に何ら影響はない。
【0046】
もし連結成分Cが境界線111(すなわち一隅が欠けた矩形)であれば、3つの極点が矩形の各隅の点の情報(折り返された隅の情報は補われる)を含み、他の5つの極点は不要な情報を含むことになる。ただし、ここに示す方法は、まだこの時点では、その連結成分Cが境界線111であるか否かを判定していないし、どの極点が境界線の隅の点を表すかも判別していない。この判定については後で説明する。
【0047】
次に、8つの極点全てについて考える。真反対の位置にある2つの極点のペアのいずれかについて、それら両者間の距離が前述の対角線長さの条件を満足すれば(ステップ620)、その連結成分は境界線の候補となる。すなわち、もし以下の4つの条件、
【数2】
Figure 0004486193
のいずれかが成立すれば、境界線の候補が見つかったことになる。その他の場合には、その連結成分は削除される(ステップ614)。
【0048】
求められた対角線に基づき、当該連結成分のもう1組の隅の点が識別され(ステップ622)、考慮に入れられる。もし極点N−S間、又はE−W間が対角線であると分かった場合、N,E,W,Sの各値がそれぞれ、境界線候補の4隅の点を表すp1,p2,p3,p4に用いられる。同様に、極点NE−SW間、又はSE−NW間が対角線であると分かった場合、NE,SE,NW,SWの各値がそれぞれ、境界線候補の4隅の点を表すp1,p2,p3,p4に用いられる。
【0049】
次に、4つの点p1,p2,p3,p4の間の関係を調べ、矩形形状をなしているかを判定する(ステップ624)。p12間、p23間、p34間、及びp41間の各距離がすべて調べられる。(これら4つの距離のうち)少なくとも1つの距離が、前述した期待される幅にほぼ等しく、これに隣接する(対向ではない)少なくとも1つの距離が、前述した期待される高さに等しくなる必要がある。
【0050】
すなわち、
【数3】
Figure 0004486193
または
【数4】
Figure 0004486193
のいずれかが成り立てば、注目している連結成分Cは境界線111である可能性があり、Cが、可能性のある位置のリストに追加される(ステップ626)。そうでなければ、その連結成分Cは削除される(ステップ614)。
【0051】
上述のように、可能性のある位置のリストは、上述の条件を満足するすべての境界線候補から構成される。このリストの全体が、このあと、デコードプロセス(図5のステップ514)に渡される。おそらくは、それらの中のただ1つの境界線候補のみが有効なグリフ(又はその他の形式の)データを含んでいる。もし有効なデータを含む境界線候補が1個より多い場合は、最初に見つけたものを使用する。
【0052】
上述の方法は、グリフステッカーパターン110の実質的に矩形形状の境界線111がどの向きに向いていても、大きさが多少変わっていても、それを識別し検出することができるが、この方法は、他の様々な画像処理アプリケーションに適用でき、有用である。図6を参照して以上に説明した方法は、ディジタル化画像中から、実質的に矩形のパターンであればほぼどのようなものでも、それを識別し、検出することができるようにするものである。このことに、ここに示した他の特徴や性能の中の一つとして、あるいはそれらとは別個に注目されたい。
【0053】
更に、当業者ならば容易に分かるように、この方法に多少の変更を加えれば、矩形や略矩形の形状に加え、平行四辺形や菱形、台形、及び不等辺四辺形などの様々なパターンを識別しその位置を検出できる。このような変形例では、2本の対角線の1つ又は両方を検査する。これら2つの対角線は異なる長さを持っていると想定できる。更に、この方法は、n辺からなる多角形一般の識別及び位置検出に拡張することができる。このためには、2n個の等間隔のコンパス位置の極点を求め、交互に極点の位置にある頂点を探していけばよい。nが奇数の場合、求められる対角線は、直径的な(すなわち真反対の頂点を結ぶ)ものではないことに注意されたい。しかしながら、隣り合う頂点間又は隣り合わない頂点間の期待される距離(又はその組)は、ほぼどのようなn角形でも、画像中から多角形を識別するための本実施形態の方法に用いることができる。
【0054】
図7は、グリフフィールド112(図1)を認識しそれをバイナリデータに変換するための一連の処理を示している。まず、グリフの格子が求められる(ステップ710)。基本的には、スキュー(斜方歪み)と寸法の情報を持つグリフ格子ベクトル(図8)を求める必要がある。この処理は、図9に図示されており、その詳しい説明は後ほど行う。次に、シード(種)グリフが見つけられる(ステップ712)。認識処理は、1つの「よい」グリフ、すなわちシードグリフ、を見つけることにより始まる。次に、シードグリフから順に隣を再帰的に調べていくことにより(図12、13参照)、すべてのグリフが検出される(ステップ714)。格子ベクトルがサーチの基準となり、画像空間からグリフ値の行列への写像処理を助ける。後に示すように、これらのステップはすべて、グリフフィールドの回転にかかわらず実行できる。
【0055】
すべてのグリフの検出が終わると、グリフフィールド112自体の回転を検出する(ステップ716)。図1に示したように、好適なグリフ構成は+45°及び−45°の向きの「スラッシュ」パターンを含んでいる。したがって、グリフフィールド112は、0°、90°、180°及び270°の向きのときには、有効であるように見える。そこで、グリフフィールド112によって表されるバイナリパターンを処理して正しい回転位置(向き)を求める。1つの例としては、グリフフィールド112に同期パターンを埋め込む方法がある。この同期パターンは、フィールド112が正しい向きを向いているときにだけ、正しく再構成される。グリフフィールドの向きを特定する方法については、ヘクト(Hecht)及びスターンズ(Stearns)に付与された米国特許第5,449,895号『セルフクロックグリフコードのための明示的な同期手法(EXPLICIT SYNCHRONIZATION FOR SELF-CLOCKING GRYPH CODES)』を参照されたい。この特許は、参照のために本明細書に組み込む。この米国特許の特に第15〜16欄に、回転方向の特定のための詳細な記述がある。別の方法として、折られた隅120(図1)の位置からグリフフィールド112の正しい向きを決定することもできる。
【0056】
図8に示すように、グリフ画像810は、2つの格子並進ベクトル812及び814と、各格子点で表されるべき情報を示す2つ(又はそれ以上)のビットマップ816及び818とによって規定される。この定義は、固体物理の結晶の定義と類似している。グリフ画像を表すためのこの方法は、幅広く様々な構造のことを考慮しているが、更に任意の回転、寸法、格子、及びビットマップを取り扱うためのスキームも用意している。例えば、グリフ画像810の回転は、並進格子ベクトル812及び814の回転に対応する。並進ベクトルがグリフ画像の構築の際のグリフ中心からグリフ中心までの変位を規定するのと同様、並進ベクトルは認識処理の際のグリフ中心からグリフ中心までの変位を規定している。グリフ画像を格子と見ることにより、回転と寸法変化を扱い得る多彩なグリフフォーマットスキームが実現できる。
【0057】
グリフ格子を求める方法は、グリフの局所的な隣のものを示す平均画像を構築し、この平均から格子ベクトルを求める、という処理に基づいている。好適な例では、この方法は次に示すようにして実装される(図9を参照)。
【0058】
グリフ画像(すなわち境界線111の中の領域)において、画像内のいくつかの画素を、処理のためのシード画素として検出する(ステップ910)。これらシード画素は、例えば、その画像全体にわたって、N×N画素の格子上に離間配置される。ここで、Nは10〜50程度のオーダである(グリフ画像810全体でだいたい100個のシード画素となるように、間隔が選択される)。
【0059】
次に、各シード画素毎に、当該シードの最近傍部の画像における画像強度の極小部を求める(ステップ912)。シード画素から適切な距離の範囲(例えば10画素分)内でそのような極小部が見つけられなかったら、次のシード画素の処理に移行する。極小部、すなわちビットマップ中での最も暗い点は、基本的にはグリフに相当する。
【0060】
極小部が見つけられると、その極小部から1乃至2画素の範囲(すなわち中心部)と、その極小部から3乃至4画素の範囲(すなわち周辺部)との間に十分な画像コントラストがあるかどうかが判定される(ステップ914)。もしコントラストが、その極小部の周囲の平均的な画像強度(明るさ)と比較して小さすぎる場合は、その現在の極小部に関する以降の処理を取り止め、グリフ画像中の次のシード画素の処理に移行する(もちろん次のシード画素があればの話である)。このステップは、ノイズその他の非グリフ部による偽物の極小部を除去するためのものである。このステップは、望むならば、なくしてもよい。
【0061】
コントラストが良好であれば、その極小部を含む部分のグレースケール画像が、コンポジット画像に追加される(ステップ916)。コンポジット画像は、最初は、値が0の画素のみによって満たされている。このコンポジット画像は、この処理の間に構築されるものであり、グリフ画像中の多数の極小部の周囲のビットマップを足し合わせたものとなる。コンポジット画像は、20×20画素のオーダの寸法である。
【0062】
もし未処理のシード画素が残っていれば(ステップ918)、この処理が繰り返される。
【0063】
すべてのシード画素についての極小部が見つけられると、コンポジット画像の解析が行われ(ステップ920)、各平均グリフ位置が求められる。例えば、コンポジット画像の中心は、必ず極小部である。なぜなら、コンポジット画像は、極小部を中心とする多数の画像から構築されているからである。その中心に最も近い極小部は、グリフ格子内における、グリフに最も近い隣のグリフの平均位置に対応する。これら極小部をコンポジット画像から求める(ステップ922)ことにより、グリフ格子の構造に関する知識が得られ、これから格子ベクトル812及び814が求められる(ステップ924)。
【0064】
上述した図9の方法は、コンポジット画像を構成する際の平均操作の特性により、ロバスト性が高いものとなる。あらゆる信号の平均化処理と同様、コンポジット画像では、グリフの位置に対応する画素は、一貫して足し合わされるのに対し、画像ノイズの部分はそのようにはならない。実際、多数のグリフ(全体の50%以上)が画像ノイズや他の像への上書きによりぼやけて不明瞭になっている場合でも、画像についての前述の平均グリフ格子パラメータはしっかりと求めることができた。更に、この処理は、画像がいかに歪んでいても機能する。
【0065】
グリフの格子ベクトル812及び814から、サーチ方向リスト1010が生成される。図10を参照のこと。サーチ方向リストは、画像空間1012とデータ空間1014とのそれぞれにおける、隣のグリフを見つけるための相対変位の情報のリストである。画像空間における既知のグリフから、サーチ方向リスト1010は、隣接グリフがあるべき位置に関する情報を提供する。画像空間における各変位(1016、1018、1020及び1022)に対応して、データ空間においてそれらに対応する変位(1024、1026、1028及び1030)が存在する。したがって、格子構造、回転及び寸法が既知の場合、画像空間内での相対移動は、データ空間における相対移動を変化させることなく、特定することができる。サーチ処理を規定するこの方法は、多様なグリフ格子、多様な回転、多様な寸法を処理することができる。サーチ方向リストは、2番目に近いグリフのサーチや、非直線的なサーチパターンなどのために拡張することもできる。
【0066】
図11を参照して、認識処理のためのシードグリフを見つけるための操作について説明する。よいシードグリフを見つけることが非常に重要である。もしシードグリフが実際には偽の中心であったならば、処理はすぐに失敗する。好適には、本処理では、少なくとも4つの隣接グリフをもつシードグリフを探す。この方法によれば、選んだシードグリフが偽物でないことについて幾分の保証が得られる。
【0067】
シードグリフは、画像中のランダムな位置から見つけ出される。選択されたランダム位置(ステップ1110)において、3×3の近傍画素群に対して1組の相関フィルタが適用され、これにより1個のグリフの領域が覆われる(ステップ1112)。3×3近傍により、グリフ格子内のノイズや微小な変化が許容されるようになる。適用される相関フィルタは、格子ベクトル812及び814の算出により求められた画像スキュー(歪み)に依存する。もしスキューが −22.5から+22.5°の間であれば、次の相関フィルタ・カーネル、
【数5】
Figure 0004486193
が適用される。
【0068】
スキューが −45°から−22.5の間であれば、次の相関フィルタ・カーネル、
【数6】
Figure 0004486193
が適用される。
【0069】
スキューが +22.5°から+45°の間であれば、次の相関フィルタ・カーネル、
【数7】
Figure 0004486193
が適用される。
【0070】
2つの相関カーネルは、それぞれ個別に、グリフがあると期待される3×3近傍に適用される。グリフは典型的には黒に見えるので、2つの相関の最小値を調べ、それら2つの相関の差を求め(ステップ1114)、しきい値と比較する(ステップ1116)。すなわち、
【数8】
Figure 0004486193
である。ここで、*は相関演算を示す。もしvの絶対値が、予め定められたしきい値より小さければ(ステップ1118)、その場所にはグリフは含まれない。もしvが正の値であればグリフの値は0であり、vが負の値であればグリフの値は1である。
【0071】
グリフが見つかると、本処理では、上述のサーチ方向リストを用いて隣のグリフを探す(ステップ1120)。そして、4つの隣接グリフを持つグリフを見つけたところで(ステップ1122)、このシードグリフ・サーチ処理は終了する。
【0072】
認識処理の最後のステップは、個々のグリフの値を求め、その値を行列に登録する処理である。本実施形態では、サーチ方向リスト(図10)を用いることにより、新たなグリフを見つけ、それらの値を行列上に正しくマッピングする。この処理は、図13に示したが、シードグリフから開始される。シードグリフは動的データ行列に配置され、画像空間上及びデータ空間上でのそのシードグリフの位置がサーチ用のFIFO(first-in first-out)リストに入れられる(ステップ1310)。
【0073】
このサーチFIFOリストは、クラスタリング処理を制御するために用いられる。新たなグリフが見つかると、このグリフはサーチFIFOリストの末尾に加えられる。基本的に、サーチFIFOリストは、隣接グリフ群の探索が必要な画像位置のリストである。サーチFIFOリストが空の場合、処理が終了する。
【0074】
シードグリフから出発して、FIFOリストにグリフがあれば(ステップ1312)、このFIFOリストからグリフの位置が一つ取り出される(ステップ1314)。そしてそのグリフの値が求められ(ステップ1316)、その値がデータ行列中に配置される。グリフの値は、シードグリフを求めるのに用いたのと同様の相関カーネルを用いて求める。次に、外側に向かってサーチを行い、隣接グリフを探す(ステップ1318)。この探索は、サーチ方向リストを用いて行う(図12(a)参照)。そして、隣接グリフ群がFIFOリストに加えられる(ステップ1320)。この方法では、既知のグリフのクラスタが生成され、このクラスタの外辺部の周囲に新たなグリフを見つける毎にクラスタが成長していく(図12(b))。この処理の結果、グリフ画像810を表す、すべてのデータ値からなるデータ行列1210が得られる。
【0075】
この方法はいくつかの好ましい特徴を持っている。まず、境界が任意形状のグリフグループを取り扱うことができる。グリフブロックが矩形である必然性はない。第二に、この方法によれば、寸法や向き(回転)の変化をきれいに処理することができる。最後に、この方法は、強度勾配やグリフ上へのマーキングなどに対して耐性がある。なお、ここではFIFOを用いたが、LIFO(last-in first-out)スタックや、画像中での位置などのその他の順序づけスキームを用いたリスト、などを利用した方法を用いても、同様の処理を行うことができる。
【0076】
最後に、既に説明したように、データ行列は、図14に示すような手順で利用される。まず、上述のように、データ行列の回転の向きが特定される(ステップ1410)。次に、これに従って、データ行列中のバイナリ値が再配置される(ステップ1412)。この処理では、特定された向きに基づき、必要な行列の順序替えとデータ値の反転が行われる。この結果求められたデータから、サービスコードが抽出され(ステップ1414)、更にユーザコードが抽出され(ステップ1416)、これに基づき、図3で説明したようなサービスのための処理が行われる。
【図面の簡単な説明】
【図1】 本発明に係るグリフステッカーの一例を示す図である。
【図2】 グリフステッカーによって表現されるデータ構造の一例を示す図である。
【図3】 システムレベルのブロック図である。
【図4】 本発明に係るステッカー作成機能の高レベルの機能フローチャートである。
【図5】 本発明に係るステッカー処理機能の高レベルの機能フローチャートである。
【図6】 ステッカー検出処理の詳細を示すフローチャートである。
【図7】 デコード処理の詳細を示すフローチャートである。
【図8】 グリフ格子、グリフビットマップ及び格子ベクトルの説明のための図である。
【図9】 グリフ格子を求めるための処理手順を示すフローチャートである。
【図10】 グリフのサーチに用いられるサーチ方向リストを説明するための図である。
【図11】 シードグリフの探索処理の手順を示すフローチャートである。
【図12】 グリフフィールドのすべてのグリフが検出されていくプロセスを模式的に示す図である。
【図13】 シードグリフからすべてのグリフを見つけていく手順を示すフローチャートである。
【図14】 グリフパターンのデコード処理の手順を示すフローチャートである。
【符号の説明】
110 グリフパターン、111 境界線、112 グリフフィールド、212 サービスコード、214 サービス引数、216 識別コード、310 フロントエンド部、312 データ入力部、314 識別処理部、316 データベースサーバ、319 バックエンド部、320 スキャナ、322 アクション処理部、324 出力装置。

Claims (1)

  1. ディジタル化画像の中から、所定の対角線長さを持つ実質的に矩形のパターンを検出する方法であって、
    ディジタル化画像のデータを取得するステップと、
    その画像中の連結成分を検出するステップと、
    その連結成分中の複数の極点を求めるステップと、
    前記複数の極点の中に、前記所定の対角線長さに実質的に等しい距離の極点のペアがあるか否かを判定するステップと、
    そのようなペアがあれば、その極点ペアに係るパターン候補の頂点の位置を求めるステップと、
    それら頂点群により、所定寸法の実質的に矩形形状のパターンが規定されるかを判定するステップと、
    を含む方法。
JP31413799A 1998-11-13 1999-11-04 文書処理方法 Expired - Fee Related JP4486193B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US09/191969 1998-11-13
US09/192014 1998-11-13
US09/192,014 US7168036B2 (en) 1998-11-13 1998-11-13 User interface identification and service tags for a document processing system
US09/191,969 US6470096B2 (en) 1998-11-13 1998-11-13 Method for locating user interface tags in a document processing system

Publications (2)

Publication Number Publication Date
JP2000155837A JP2000155837A (ja) 2000-06-06
JP4486193B2 true JP4486193B2 (ja) 2010-06-23

Family

ID=26887594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31413799A Expired - Fee Related JP4486193B2 (ja) 1998-11-13 1999-11-04 文書処理方法

Country Status (3)

Country Link
EP (1) EP1001605B1 (ja)
JP (1) JP4486193B2 (ja)
DE (1) DE69935392T2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2421742A1 (en) * 2000-09-08 2002-03-14 Findthedot, Inc. A method and system of connecting printed media to electronic information as a response to a request
WO2002033954A2 (en) 2000-10-17 2002-04-25 Digimarc Corporation User control and activation of watermark enabled objects
EP1211881A1 (en) * 2000-12-04 2002-06-05 Fuji Photo Film Co., Ltd. Image processing method and device
US7747655B2 (en) 2001-11-19 2010-06-29 Ricoh Co. Ltd. Printable representations for time-based media
US7861169B2 (en) 2001-11-19 2010-12-28 Ricoh Co. Ltd. Multimedia print driver dialog interfaces
GB0213531D0 (en) * 2002-06-13 2002-07-24 Hewlett Packard Co Paper-to-computer interfaces
JP2004242295A (ja) * 2003-01-15 2004-08-26 Ricoh Co Ltd 画像形成装置、画像形成方法、情報処理装置、情報処理方法、情報処理プログラム、及び記録媒体
US7703002B2 (en) 2003-03-31 2010-04-20 Ricoh Company, Ltd. Method and apparatus for composing multimedia documents
US7552381B2 (en) 2003-03-31 2009-06-23 Ricoh Co., Ltd. Check boxes for identifying and processing stored documents
US7757162B2 (en) 2003-03-31 2010-07-13 Ricoh Co. Ltd. Document collection manipulation
US7739583B2 (en) 2003-03-31 2010-06-15 Ricoh Company, Ltd. Multimedia document sharing method and apparatus
US7607571B2 (en) 2003-05-30 2009-10-27 Intellidot Corporation Medical work flow system
US7715061B2 (en) * 2004-03-04 2010-05-11 Visioneer, Inc. Document routing method for utilizing paper medium to direct outcome of scanned documents and software therefor
JP4569359B2 (ja) * 2005-04-05 2010-10-27 富士ゼロックス株式会社 電子文書管理システム、画像形成装置、印刷媒体、電子文書管理方法およびプログラム
JP4903034B2 (ja) 2005-12-28 2012-03-21 株式会社リコー 画像処理装置、画像処理方法及びコンピュータプログラム
JP2007201660A (ja) * 2006-01-25 2007-08-09 Fuji Xerox Co Ltd 画像処理装置、画像形成装置、画像処理方法及びプログラム
US7913920B2 (en) 2006-12-20 2011-03-29 Palo Alto Research Center Incorporated Document processing devices, systems and methods thereof
JP2010211466A (ja) * 2009-03-10 2010-09-24 Canon Inc 画像処理装置および画像処理方法及びプログラム
US8856247B2 (en) 2009-08-18 2014-10-07 Hewlett-Packard Development Company, L. P. Communicating electronic mail
US8856044B1 (en) 2013-03-23 2014-10-07 Jeffrey Drazan Segmented access of remotely stored biographical data to a client device

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2393484A1 (fr) * 1977-05-31 1978-12-29 Cit Alcatel Procede d'identification d'un document en vue de la transmission fac-simile de son contenu et installation automatique de transmission de fac-simile
US5084769A (en) * 1988-06-13 1992-01-28 Canon Kabushiki Kaisha Image processing apparatus
CA2044404C (en) * 1990-07-31 1998-06-23 Dan S. Bloomberg Self-clocking glyph shape codes
US5227893A (en) * 1990-10-31 1993-07-13 International Business Machines Corporation Pseudo-bar code control of image transmission
JPH05284264A (ja) * 1992-04-01 1993-10-29 Fuji Xerox Co Ltd 画像処理装置
US5438430A (en) * 1992-09-25 1995-08-01 Xerox Corporation Paper user interface for image manipulations such as cut and paste

Also Published As

Publication number Publication date
EP1001605A3 (en) 2001-03-21
DE69935392T2 (de) 2007-12-06
EP1001605A2 (en) 2000-05-17
DE69935392D1 (de) 2007-04-19
JP2000155837A (ja) 2000-06-06
EP1001605B1 (en) 2007-03-07

Similar Documents

Publication Publication Date Title
US6470096B2 (en) Method for locating user interface tags in a document processing system
US8640018B2 (en) User interface tag for use in processing a document
JP4486193B2 (ja) 文書処理方法
US7640269B2 (en) Image processing system and image processing method
TW541502B (en) Machine readable code and method and device of encoding and decoding the same
JP4883662B2 (ja) 視覚的に有意なバーコード・システム
US7552381B2 (en) Check boxes for identifying and processing stored documents
JP5253352B2 (ja) 文書内にメッセージを埋め込む方法、及び距離場を使用して文書内にメッセージを埋め込む方法
TW464811B (en) Storage management system for document image database
JP4557765B2 (ja) 画像処理装置およびその方法
US8520006B2 (en) Image processing apparatus and method, and program
EP1672473A2 (en) Stamp sheet
EP2264995B1 (en) Image processing apparatus, image processing method, and computer program
US7481374B2 (en) System and method for placement and retrieval of embedded information within a document
JP4502385B2 (ja) 画像処理装置およびその制御方法
JP2007102545A (ja) 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
US20080148970A1 (en) Document processing devices, systems and methods thereof
AU2008202785B2 (en) Information processing device, printing device, information processing system, method, and program
JP2004246577A (ja) 画像処理方法
JP2008028716A (ja) 画像処理方法及び装置
JP2007129557A (ja) 画像処理システム
JP5998090B2 (ja) 画像照合装置、画像照合方法、画像照合プログラム
CN100501728C (zh) 图像处理方法、系统、程序、程序存储介质以及信息处理设备
JP2005149097A (ja) 画像処理システム及び画像処理方法
JP2006134042A (ja) 画像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061031

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061031

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091022

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091027

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100302

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100326

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130402

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140402

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees