JP2007042106A - 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム - Google Patents

文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム Download PDF

Info

Publication number
JP2007042106A
JP2007042106A JP2006209926A JP2006209926A JP2007042106A JP 2007042106 A JP2007042106 A JP 2007042106A JP 2006209926 A JP2006209926 A JP 2006209926A JP 2006209926 A JP2006209926 A JP 2006209926A JP 2007042106 A JP2007042106 A JP 2007042106A
Authority
JP
Japan
Prior art keywords
data
document
image
image data
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2006209926A
Other languages
English (en)
Inventor
Hiroki Sugano
浩樹 菅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba TEC Corp
Original Assignee
Toshiba Corp
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba TEC Corp filed Critical Toshiba Corp
Publication of JP2007042106A publication Critical patent/JP2007042106A/ja
Abandoned legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32106Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
    • H04N1/32112Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file in a separate computer file, document page or paper sheet, e.g. a fax cover sheet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32128Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3204Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a user, sender, addressee, machine or electronic recording medium
    • H04N2201/3205Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a user, sender, addressee, machine or electronic recording medium of identification information, e.g. name or ID code
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3212Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a job, e.g. communication, capture or filing of an image
    • H04N2201/3214Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to a job, e.g. communication, capture or filing of an image of a date
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3226Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3232Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of a page, copy or picture number
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3243Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of type information, e.g. handwritten or text document
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3254Orientation, e.g. landscape or portrait; Location or order of the image data, e.g. in memory
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3256Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document colour related metadata, e.g. colour, ICC profiles

Abstract

【課題】 原稿画像を電子データに変換してファイルするときに、ユーザによるマニュアルでのインデックスデータの入力を不要とし、ユーザにかかる負担を軽減する。
【解決手段】 スキャナ14で読み取った画像データを特性データ解析アプリケーション16で自動的に画像解析し、メタデータを生成する。メタデータをインデックスデータ117bとして画像データ117aとリンクしてリンクデータ117を生成して、リンクデータ117をデータベース100にファイルする。ドキュメント10の検索時には、検索キーワードと一致するインデックスデータ117bを有するリンクデータ117を選択する。
【選択図】図2

Description

この発明は、一般にドキュメントの管理に関し、より詳細には、用紙上のドキュメントをスキャンして作成された画像データに関する特性データを自動的に設定する、文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システムに関する。
近年画像データの電子化が進み、これら電子化された画像データは、文書管理システムにより、コンピュータ管理されている。文書管理システムを使用することにより、ユーザは、文書管理システムに保存された多数の画像データの中から、特定の画像データを容易に識別し、検索することが出来る。このようにユーザによる特定の画像データの識別を容易にするために、文書管理システムにあっては、従来、各画像データと、それに関連付けられたタイトルや、キーワード等のインデックスデータが夫々別に管理されていた。
そして、原稿画像を電子化して、文書管理システムにより管理するために、従来は、原稿画像をスキャナで読み取って画像データを形成し、この画像データをデータベースにファイルすると共に、各画像データに関連付けられるインデックスデータを、ユーザがマニュアルで入力し、データベースにファイルしていた。
しかしながら上記従来の文書管理システムでは、画像データをファイルする時に、原稿画像をスキャナで読み取る度に読み取った各画像データのインデックスデータを、ユーザがパソコン等からマニュアルで入力しなければならず、しかも画像データの検索が高精度になるに従い、インデックスデータのデータ量が増大し、ユーザの負担が大きくなっていた。
本発明は上記事情を考慮してなされたもので、原稿画像を電子データに変換してファイルする時に、ユーザが画像データに関連付けられるインデックスデータをマニュアルで入力する必要が無く、しかも画像データを高度に検索可能とすることが出来る、文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システムを提供することを目的とする。
本発明は上記課題を解決するための手段として、原稿画像を読み取って画像データを生成する工程と、前記画像データを画像解析して特性データを生成する工程と、前記画像データと前記特性データをリンクしてリンクデータを生成する工程と、前記リンクデータをファイルする工程とを実施するものである。
本発明の文書処理方法によれば、画像データのインデックスデータを画像データから自動的に抽出でき、ユーザによるインデックスデータの入力が不要となる。しかもインデックスデータとしての情報量を容易に増大でき、画像データの高度な検索が容易に可能となる。
本発明は、原稿画像の特徴を多量に有し画像データから自動的に抽出されるメタデータを、インデックスデータとして画像データにリンクすることから、ユーザがマニュアルでインデックスデータを入力する必要が無く、ユーザの負担を軽減して、画像データの高度な検索を可能とする。更に原稿画像を管理する際に、ユーザはインデックスデータと画像データとを識別でき、利便性を向上出来る。
以下、本発明の実施例について図1乃至図4を用いて説明する。図1は、本発明の文書処理システムおよび文書管理システムを概略的に示すブロック図である。文書管理システム18は、リンク部17、データベース100、受信部110、選択部120及び、出力部130を有している。文書処理システム12は、原稿画像であるドキュメント10を読み取る例えばスキャナ14等からの画像データを、画像解析する解析部である特性データ解析アプリケーション16及び文書管理システム18のリンク部17及びデータベース100からなっている。スキャナ14は、ドキュメント10をスキャンして、当業者により周知の多様なフォーマットで保存されるビットマップ化された画像データを生成する。
例えば、ビットマップ化された画像データは、ティフファイルとして保存される。ビットマップ化された画像データは、特性データ解析アプリケーション16に入力される。特性データ解析アプリケーション16は、画像データを画像解析して、ドキュメント10の特徴を抽出する。特性データ解析アプリケーション16による画像解析により、特性データであるメタデータが生成される。
メタデータは、タイトル、作成日、スキャンした日、著者、テーマ、合計ページ数、開始ページ番号、終了ページ番号、色タイプ、ドキュメントタイプ、言語、および画像方向等を有する。但しメタデータは、画像データに関連付けられるデータであれば、これらに限定されない。特性データ解析アプリケーション16で生成されたメタデータは、文書管理システム18のリンク部17に入力され、画像データとリンクされる。リンク部17では、画像データ117aのヘッダにメタデータをリンクして、ビットマップ化された画像データ117aのインデックスデータ117bとして、ヘッダ付画像データであるリンクデータ117を生成する。リンクデータ117は、文書管理システム18の記憶部であるデータベース100にファイルされる。検索時、ユーザは、データベース100にファイルされるリンクデータ117を検索する。メタデータからなるインデックスデータ117bは、ドキュメント10の特徴を多量に有していることから、高度の検索を可能とする。
文書処理システム12は、検索ジョブを要求する単独の装置に使用されるものであっても良いし、或いは、ネットワーク回線等により送受信可能なインタフェースを備えた複数の装置によって使用されても良い。又文書処理システム12機能を、ネットワークを介して装置にダウンロードしても良いし、文書処理システム12機能を、メディアである記録媒体に記憶させたものを装置にインストールしても良い。
記録媒体としては、CD−ROM等プログラムを記憶でき、且つ装置が読取り可能な記録媒体であれば、その形態はいずれの形態であっても良い。またこのように予めインストールやダウンロードにより得る、文書処理システム12機能は、装置のOS(オペレーティング・システム)等と協動してその機能を実現させるものであっても良い。又、特性データ解析アプリケーション16はスキャナ14の一部として使用することも可能である。この場合、スキャナは、スキャンしたドキュメントをビットマップ化した画像データを作成した後に、画像データを特性データ解析アプリケーションで、自動的に画像解析する。
スキャナ14および特性データ解析アプリケーション16は第1のインタフェース20で接続される。第1のインタフェース20は、シリアルポートあるいはパラレルポートなどのような、ネットワーク・インタフェースまたはローカル接続等からなる。第1のインタフェース20は、有線あるいは無線のインタフェースとして使用され、ビットマップ化された画像データをスキャナ14から特性データ解析アプリケーション16へ送信する。第1のインタフェース20は、当業者が周知の各種情報伝達手段および通信プロトコルが使用可能である。例えば、情報伝達手段は、遠距離無線接続、短距離無線接続および電話回線、ケーブル・ライン、電力線等を含むがそれに限定されない。
文書管理システム18は、ハードディスク・ドライブのような記憶装置、ROMなどのような不揮発性メモリ、および/またはスキャナ14の動作を制御するプログラムに加えて特性データ解析アプリケーション16を格納するランダムアクセス記憶装置(RAM)などを含む。
特性データ解析アプリケーション16及び文書管理システム18は第2のインタフェース22で接続される。第2のインタフェース22は、シリアルポートあるいはパラレルポートなどのような、ネットワーク・インタフェースまたはローカル接続でありえる。第2のインタフェース22は、有線あるいは無線のインタフェースとして使用され、ビットマップ化された画像データおよびメタデータを、特性データ解析アプリケーション16から文書管理システム18に送信する。
様々な情報伝達手段および通信プロトコルは、同業者により既知のものが使用できる。例えば、情報伝達手段は、遠距離無線接続、短距離無線接続および電話回線、ケーブル・ライン、電力線などを含むが、それに限定されない。
図2に、文書処理システム12による、文書処理のフローチャートを示す。先ず特性データ解析アプリケーション16は画像データを読込む(ステップ60)。ビットマップ化された画像データは、第1のインタフェース20を介してスキャナ14から入力される。あるいは、ビットマップ化された画像データは、スキャナ内のプロセッサに直接読込んでも良い。ついで特性データ解析アプリケーション16は、画像データを画像解析する(ステップ62)。特性データ解析アプリケーション16は、画像のレイアウト解析、画像の方向解析、光学文字認識(OCR)解析、自然言語解析、カラー解析等、原稿画像の特徴を抽出するのに必要な解析手法を有している。
ステップ62の画像解析のサブルーチンS62として、先ず画像データを画像レイアウト解析する(ステップ64)。これによりドキュメント10上のレイアウト(どの領域がテキストであり、どの領域がグラフであり、どの領域が写真である等)が解析される。次いで、画像データを方向解析する(ステップ65)。方向解析は、ドキュメント10の向きが、横長であるか、縦長であるかを解析する。方向解析は、ドキュメント10の行毎の画素データを合計して閾値と比較し、更にドキュメント10の列毎の画素データを合計して閾値と比較し、行と列とで、どちらが閾値をより多く超えているかで、横長であるか、縦長であるかを解析する。
図4に例えばテキスト画像200の方向を解析する例を示す。テキスト画像200の向きは、縦長となっている。テキスト画像200のサイズは、水平方向にX、垂直方向にYとなっている。方向解析ではテキスト画像200の0〜(Y−1)行までの、各行の水平方向の画素数を数える。また、0〜(X−1)列までの各列の垂直方向の画素数を数える。水平突出(ph)、および垂直突出(pv)、は次の方程式により測定される。
Figure 2007042106
d(i、n)は位置(i、n)でのピクセル値(0または1)、d(n、i)は位置(n、i)でのピクセル値である。画素上にトナーあるいはインクがない場合、画素値は0であり、また、画素上にトナーまたはインクがプリントされていれば、画素値は1である。従って、プリントされた画素値「1」が水平方向に多いか、垂直方向に多いかで、テキスト画像の向きが解析される。
水平突出(ph)或いは垂直突出(pv)は、閾値(th)と比較され、どれだけの水平突出ph(n)が閾値h(th)を越えるか、及びどれだけの垂直突出pv(n)が閾値v(th)を越えるか、判定される。水平突出ph(n)の確定的な数及び垂直突出pv(n)の確定的な数を比較して、水平突出ph(n)の確定的な数が垂直突出pv(n)の確定的な数より大きい場合、テキスト画像の向きは縦長である。反対に、垂直突出pv(n)の確定的な数が水平突出ph(n)の確定的な数より大きい場合、テキスト画像の向きは横長である。図4に示すテキスト画像200は、閾値を超える数が、水平突出ph(n)の方が多いので解析結果は縦長方向となる。
原稿画像20の方向を解析する手法は、テキストの言語に合わせて変更可能である。例えば、英語であればテキストは横書きであるが、日本語であれば、一般的にテキストは縦書きとなる。この差を説明するために、レイアウト判定に先立って光学文字認識(OCR)を行なうことができる。より詳細には、ここに記述されるOCRは、ページの言語を判定することができる。レイアウト方向は確定された言語に従って判定される。
次にOCR解析を行う(ステップ66)。OCR解析は、スキャナ14で生成されたビットマップ化された画像データをデジタル文字として認識する。したがって、OCR解析後、画像データはテキストで編集可能文字に生成される。OCR解析は、当業者に知られているように、ソフトウェア或いはハードウェアとソフトウェアの組み合せを使用して行うことができる。OCR解析により、ドキュメント10に使用される実際のテキストを解析することとなる。
ステップ66のOCR解析を行った後、自然言語解析を行う(ステップ67)。自然言語解析は、当業者に周知の自然言語処理技術を使用して、ドキュメント10の言語を解析する。
次にカラー解析を行なう(ステップ68)。カラー解析は、ドキュメント10がカラー画像、白黒(モノクロ)画像あるいはグレースケール画像であるか解析する。カラー解析のため、ヒストグラムを生成し、生成されたヒストグラムに基づいてカラー・フォーマットを解析する。より詳細には、スキャナ14は各画素に対して表示されるカラーを示す一定のビットを使用して、スキャンした原稿画像の各画素を保存する。ヒストグラムは、各画素のカラー評価を介して、ドキュメント10のカラー濃度を示す。例えば、モノクロテキスト中のカラー部分を、解析したカラー・フォーマットはカラーとなる。カラー解析では、各ピクセル値を解析すると、カラーのドキュメントは、各画素に可変RGB値を有している。即ち、カラードキュメントは、赤、緑および青の画素値が異なるが、モノクロ或いはグレースケールドキュメントは、各画素のRGB値が等しくなる。カラー解析は、さらにモノクロと赤、あるいはモノクロと青、のような特定のカラー情報を提供することもできる。このようなカラー情報が提供された場合は、赤或いは青等のカラー部分は強調する情報であると解析される。
カラー解析後、ドキュメントタイプの解析を行う(ステップ70)。ある特定のドキュメントタイプについては周知のドキュメントフォーマットを取り入れることもできる。ドキュメントタイプとしては、例えば、レターや技術論文等がある。ステップ64でドキュメント10の画像レイアウトを解析したときに、例えばレターであれば、ドキュメント10の1頁目の上方に、左寄せで作成日や差出人が記載されるドキュメントフォーマットとなっている。或いは技術論文であれば、ドキュメント10の1頁目の上方中央に、タイトルや著者等が記載されるドキュメントフォーマットとなっている。このような解析により、ドキュメントタイプが解析される。
画像データの画像解析(ステップ62)により、ビットマップ化された画像データに適用された上記各種解析ステップに基づいて、ドキュメント10に関するメタデータが自動的に抽出される(ステップ72)。尚、画像データの画像解析は、上記ステップに限定されず、又、その解析順も任意である。更に画像解析は、後段の解析ステップを前段の解析ステップにフィードバックして、解析精度を改善する等しても良い。或いは解析精度の改善のために、画像解析ステップを繰り返して行うことも可能である。
ドキュメント10に関連するメタデータを抽出後、ドキュメント10の特性データファイルを作成するかを比較する(ステップ74)。特性データを判定すると、特性データをビットマップ化された画像データとリンクする方法に関して判定がなされる。特性データが特性データファイルに保存されない場合、文書管理システム18に記憶される単独の文書を作成するために、特性データはビットマップ化された画像データと結合することができる。例えば、特性データとビットマップ化された画像データをリンクすることは、ビットマップ化された画像データのヘッダに特性データを加えるということを含む。
ヘッダは、1セットの情報を提供する1つ以上の領域を含む。例えば、ティフファイルは、文書に関連した文書とメタデータに関するコメントを含むヘッダを持っている。メタデータはデータに関する情報で、例えばどのように、いつ、および、誰により文書が作成され、データがどのようにフォーマットされるかを説明する。メタデータは、したがって、ドキュメント10に対して判定された特性データを含んでいる。
ティフファイルは、画像データ・ディレクトリ(IFD)を指す8バイトの画像データ・ヘッダを含む。IFDは、同じファイル内に記憶された実際の画像データへの画像(文書)およびポインタに関する情報を含む。IFDは、ディレクトリ・エントリ数(つまり領域数)の2バイト・カウントとして一般的に使用される。ティフ領域はティフタグおよびその値がある論理的な実体である。
ティフタグが領域を識別する。例えば、「アーティスト」という項目が、タグ番号315の領域に指定されることをティフスタンダードが明示する。これにより文書の著者を識別する特性データは、ティフファイルのヘッダのタグ番号315と共に、関連した値に置かれる。したがって、特性データは、ビットマップ化された画像データを記憶するために使用されるフォーマットに基づいてビットマップ化された画像データの適切な領域に書き込まれる。その他、当業者に既知の、他のフォーマットを使用可能である。
リンク部17で画像データとメタデータをリンクして生成されたリンクデータ117は、データベース100にファイルされる(ステップ77)。このとき任意のドキュメント10を管理するためにデータベース100内には、リンクデータ117が、単独でファイルされる。ドキュメント10の検索時には、リンクデータ117のヘッダのインデックスデータ117bを使用することとなる。ドキュメント10の検索時に、リンクデータ117のヘッダのインデックスデータ117bを識別することにより、画像データ117aも識別可能となる。
他方、特性データファイルを作成する場合(ステップ74でYes.の場合)、特性データ解析アプリケーション16は、特性データファイルを作成する(ステップ78)。ステップ72で抽出されたメタデータは、作成された特性データファイルに書き込まれる(ステップ80)。特性データファイルにメタデータを書き込むために、当業者に周知の様々なフォーマットを使用可能である。更にメタデータを書き込まれた特性データファイルは、ビットマップ化された画像データと関連付けられる(ステップ82)。例えば、特性データファイルは、ビットマップ化された画像データをファイルするための画像データ領域を有していて、画像データを画像データ領域にファイルすることにより、画像データと関連付けられる。
ステップ80で特性データファイルを作成した場合には、データベース100には、特性データファイルと、ビットマップ化された画像データとが、夫々別にファイルされる(ステップ84)。ドキュメント10の検索時には、特性データファイルに書かれたメタデータを使用することとなる。
次に、上記文書処理システム12により生成されたリンクデータ117をデータベース100にファイルしてなる文書管理システム18で、実際の文書管理として、画像検索ジョブを実施するための装置について、図3のブロック図を参照して詳述する。装置40は、表示部42、入力インタフェース44、記憶装置48、プロセッサ50、特性データ解析アプリケーション16、および文書管理システム18を有する。プロセッサ50は、通信インタフェース46を介し、ネットワーク52と接続される。装置40のコンポーネントは、これに限定されず、追加のコンポーネントを組み入れる等任意である。装置40は実際には、パーソナルコンピュータ(PC)、ワークステーション、サーバ、携帯端末(PDA)、その他携帯用装置等の各種処理装置からなる。
表示部42は装置40のユーザに、検索結果或いはビットマップ化された画像データ等の情報を提示する。表示部42は、薄膜トランジスタ(TFT)表示部、発光ダイオード(LED)表示部、液晶表示部(LCD)、CRT表示部、あるいは当業者に既知の多様な異なる表示部であり得る。表示部42は装置40のオプションのコンポーネントである。
入力インタフェース44は、ユーザから受領した、ドキュメント10を検索するための検索項目である検索キーワード等の情報をプロセッサ50へ入力するためのインタフェースを提供する。入力インタフェース44は、ユーザがプロセッサ50へ情報を入力するか、あるいは選択するために、キーボード、ペン、タッチスクリーン、マウス、トラックボール、タッチスクリーン、キーパッド、ボタン、等を含むがそれに限定されない。入力インタフェース44は入力および出力インタフェースの機能も有し、例えば、タッチスクリーンはユーザ入力或いは出力表示の両方が可能である。
通信インタフェース46は、ネットワーク52等の通信媒体を介して情報の受信及び送信をするためのインタフェースを提供する。通信インタフェース46は、例えばプロセッサ50が、スキャナ14からビットマップ化された画像データを受け取るように設定される。装置40とネットワーク52の間の通信は、赤外線通信リンク、無線通信リンク、セルラー・ネットワーク・リンク、シリアルポート、パラレルポート等の接続方法によって実施されるが、それに限定されない。これらの接続方法の少なくとも1つは、装置40への或いは装置40からの、コンテンツの転送に使用される。装置40は、トランスミッション・コントロール・プロトコル/インターネット・プロトコル(TCP/IP)、ブルートゥース、IEEE802.11、赤外線通信規格、無線周波数識別などを含む多様な送信技術を使用して通信するが、それに限定されない。装置40は、ラジオ、赤外線、レーザ、光学系、ユニバーサル・シリアル・バス、イーサネット(登録商標)、IEEE1394などを含む多様なメディアを使用して通信するが、それに限定されない。ネットワーク52は、ローカルエリアネットワーク、広域ネットワーク、無線ネットワーク、ブルートゥース・パーソナル・エリア・ネットワーク、およびインターネットを含むが、それに限定されない。スキャナ14が装置40と一体化している場合、通信インタフェース46は装置40のオプションのコンポーネントとなる。
記憶装置48は、装置40のオペレーティング・システム50、特性データ解析アプリケーション16、文書管理システム18および/または他のアプリケーションを有することが可能である。
装置40は、RAM、ROM、フラッシュ・メモリ、ディスク・ドライブ等の多様な記録技術を使用した、1つ以上の記録装置48を有するが、それに限定されない。
プロセッサ50は、装置40に指示を出し、様々な機能を行なわせる。その指示は、プログラム言語、スクリプト言語、アセンブリ言語などを使用して書き込まれる。さらに、その指示は、専用コンピュータ、論理回路あるいはハードウェア回路で実行される。従って、プロセッサ50は、ハードウェア、ファームウェア、ソフトウェアあるいはそれらの任意の組み合せからなる。実行とは、アプリケーションを作動させる処理、あるいは指示により呼び出された操作の実行のことである。プロセッサ50が指示を実行するということは、指示により呼び出された操作を実行するということである。プロセッサ50は、図3の特性データ解析アプリケーション16および文書管理システム18で具体化された指示を実行する。装置40のプロセッサ50は1つに限定されず、同一の、あるいは異なるプロセッサ50が特性データ解析アプリケーション16および文書管理システム18の両方を実行することができる。
特性データ解析アプリケーション16は、装置40が文書処理を実行すると、図2のフローチャートに示す動作を一組の指示として実施される。その指示は、1つ以上のプログラム言語、アセンブリ言語、スクリプト言語などを使用して書き込まれる。ドキュメント10がスキャンされ、ビットマップ化された画像データが通信インタフェース46によって受信された場合、特性データ解析アプリケーション16は画像データを自動的に画像解析する。尚特性データ解析アプリケーション16は、自動的に行うのではなく、入力インタフェース44を使用してユーザが画像解析を選択した場合に、画像解析を実行するようにしても良い。特性データ解析アプリケーション16を実行するために、アプリケーションの実行可能な形式を不揮発性メモリ装置から検索し、プロセッサ50が実行するアプリケーションを一時メモリにコピーすることもできる。一時メモリは例えばRAM等である。不揮発性メモリ装置は例えばROMまたはフラッシュ・メモリ等である。
文書管理システム18は、装置40が文書管理を実行すると、一組の指示として実施される。文書管理システム18を実施することにより、ユーザは、データベース100にファイルされたリンクデータ117に基づいて特定のドキュメントを識別可能となる。検索ジョブを要求するユーザが、検索のために、入力インタフェース44から、検索キーワードを入力すると、文書管理システム18は、受信部110で検索キーワードを受信する。
次いで、文書管理システム18は、選択部120で、リンクデータ117のメタデータ117bを検索して、検索キーワードと一致するリンクデータ117を選択する。文書管理システム18の出力部130は、選択したリンクデータ117をプロセッサ50に出力する。プロセッサ50は、表示部42に、メタデータ117bと画像データ117aをリンクしたリンクデータ117を表示する。これにより、ユーザは、表示部42にて検索されたドキュメントを識別可能となる。この後ユーザは、検索されたドキュメントのリビュー、プリント、或いは編集等を可能とされる。
文書管理システム18は、装置40内部に設置されなくても良い。通信インタフェース46により、文書管理システム18を実行可能な別の装置に画像データを転送して、画像解析によりメタデータ、リンクデータを生成することも可能である。また文書管理システム18機能を、ネットワークを介して装置40にダウンロードしても良いし、文書管理システム18機能を、メディアである記録媒体に記憶させたものを装置40にインストールしても良い。記録媒体としては、CD−ROM等プログラムを記憶でき、且つ装置が読取り可能な記録媒体であれば、その形態はいずれの形態であっても良い。またこのように予めインストールやダウンロードにより得る、文書管理システム18機能は、プロセッサ50のOS(オペレーティング・システム)等と協動してその機能を実現させるものであっても良い。更に文書管理システム18は、一体的でなく、データベース100のみを記録媒体で保管するものであっても良い。
この実施例によれば、スキャナ14から入力された画像データを特性データ解析アプリケーション16で自動的に画像解析して生成されるメタデータを、インデックスデータ117bとして画像データ117aとリンクしてリンクデータ117を生成して、データベース100にファイルする。これにより、ユーザは、ドキュメント10をデータベース100にファイルする時に、インデックスデータ117bをマニュアルで入力する必要が無く、ユーザの負担を軽減出来る。しかもメタデータはドキュメント10の特徴を多量に有することが出来、高度な検索を得られる。また、ドキュメント10の検索時にユーザは、インデックスデータ117bのみでなく画像データ117aも識別できることから、検索しやすくなり、利便性向上を得られる。しかもリンクデータ117を用いれば、データベース100をリンクデータ117のみで構成出来、シンプルな文書管理を行うことも可能となる。
尚この発明は上記実施例に限られるものではなく、この発明の範囲内で種々変形可能であり、例えばビットマップ化した画像データのフォーマットはティフファイルに限定されないし、画像データを画像解析する解析部の解析内容は、必要とする検索項目等に応じて任意である。又、解析部で生成されるメタデータの内容も限定されない。
本発明の実施例の文書処理システムおよび文書管理システムを概略的に示すブロック図。 本発明の実施例の文書処理システムによる文書処理を示すフローチャート。 本発明の実施例の文書管理を実施するための装置を示すブロック図。 本発明の実施例の方向解析の手法を示す概略説明図。
符号の説明
10…ドキュメント
12…文書処理システム
14…スキャナ
16…特性データ解析アプリケーション
17…リンク部
18…文書管理システム
40…装置
100…データベース
110…受信部
117…リンクデータ
117a…画像データ
117b…インデックスデータ
120…選択部
130…出力部

Claims (11)

  1. 原稿画像を読み取って画像データを生成する工程と、
    前記画像データを画像解析して特性データを生成する工程と、
    前記画像データと前記特性データをリンクしてリンクデータを生成する工程と、
    前記リンクデータをファイルする工程とを具備することを特徴とする文書処理方法。
  2. 前記画像データは、前記原稿画像をスキャンした後、ビットマップ化して成ることを特徴とする請求項1記載の文書処理方法。
  3. 前記特性データは前記画像データのメタデータであり、
    前記リンクデータは、前記画像データのヘッダとして前記メタデータを追加してなるヘッダ付画像データであることを特徴とする請求項1又は請求項2記載の文書処理方法。
  4. 前記ファイル工程は前記ヘッダ付画像データのみをファイルすることを特徴とする請求項3記載の文書処理方法。
  5. 前記画像解析が、前記画像データのレイアウト解析、方向解析、光学文字認識解析、自然言語解析、カラー解析の少なくとも1つであることを特徴とする請求項1乃至請求項4のいずれかに記載の文書処理方法。
  6. 前記画像解析が、前記自然言語解析による解析結果から、前記メタデータを生成することを特徴とする請求項5記載の文書処理方法。
  7. 前記メタデータが、前記画像データのタイトル、作成日、スキャン日、著者、主題、合計ページ数、開始ページ番号、終了ページ番号、カラー・タイプ、ドキュメントタイプの少なくとも1つを含むことを特徴とする請求項6記載の文書処理方法。
  8. 文書検索時に用いられる検索情報を得る文書処理メディアにおいて、
    原稿画像を読み取ってなる画像データを画像解析して特性データを生成する工程と、
    前記画像データと前記特性データをリンクしてリンクデータを生成する工程とを実行して、前記検索情報を得ることを特徴とする文書処理メディア。
  9. 原稿画像を読み取ってなる画像データを画像解析して特性データを生成する工程と、
    前記画像データと前記特性データをリンクしてリンクデータを生成する工程と、
    前記リンクデータをファイルする工程
    前記ファイルされたリンクデータから前記原稿画像を検索するための検索項目を受信する工程と、
    前記リンクデータの前記特性データと、前記検索項目とを比較して、一致するリンクデータを選択する工程と、
    前記選択した前記リンクデータを出力する工程とを具備することを特徴とする文書管理方法。
  10. 原稿画像を読み取ってなる画像データを画像解析して特性データを生成する解析部と、
    前記画像データと前記画像データをリンクしてリンクデータを生成するリンク部と、
    前記リンクデータをファイルしてなる記憶部とを具備することを特徴とする文書処理システム。
  11. 画像データと前記画像データを画像解析してなる特性データとがリンクされたリンクデータをファイルしてなる記憶部と、
    原稿画像を検索するための検索項目を受信する受信部と、
    前記検索項目と一致する前記特性データを有する前記リンクデータを選択する選択部と、
    前記選択した前記リンクデータを出力する出力部とを具備することを特徴とする文書管理システム。
JP2006209926A 2005-08-02 2006-08-01 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム Abandoned JP2007042106A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/194,575 US20070035780A1 (en) 2005-08-02 2005-08-02 System and method for defining characteristic data of a scanned document

Publications (1)

Publication Number Publication Date
JP2007042106A true JP2007042106A (ja) 2007-02-15

Family

ID=37742250

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006209926A Abandoned JP2007042106A (ja) 2005-08-02 2006-08-01 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム

Country Status (2)

Country Link
US (1) US20070035780A1 (ja)
JP (1) JP2007042106A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010073114A (ja) * 2007-10-25 2010-04-02 Fuji Xerox Co Ltd 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
US8885229B1 (en) 2013-05-03 2014-11-11 Kofax, Inc. Systems and methods for detecting and classifying objects in video captured using mobile devices
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
JP4856925B2 (ja) * 2005-10-07 2012-01-18 株式会社リコー 画像処理装置、画像処理方法及び画像処理プログラム
US20070195378A1 (en) * 2006-02-21 2007-08-23 Brother Kogyo Kabushiki Kaisha Image-reading device
US8228522B2 (en) * 2007-01-29 2012-07-24 Kabushiki Kaisha Toshiba Document data management apparatus to manage document data read and digitized by an image reading apparatus and a technique to improve reliability of various processing using document data
US8244031B2 (en) 2007-04-13 2012-08-14 Kofax, Inc. System and method for identifying and classifying color regions from a digital image
US20090138296A1 (en) 2007-11-27 2009-05-28 Ebay Inc. Context-based realtime advertising
JP5111242B2 (ja) * 2008-06-04 2013-01-09 キヤノン株式会社 画像処理装置及び方法
GB2464980A (en) * 2008-10-31 2010-05-05 Symbian Software Ltd Method of associating and labeling primary and secondary files
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US20100316291A1 (en) * 2009-06-11 2010-12-16 Shulan Deng Imaging terminal having data compression
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US8989515B2 (en) 2012-01-12 2015-03-24 Kofax, Inc. Systems and methods for mobile image capture and processing
EP2807608B1 (en) 2012-01-23 2024-04-10 Microsoft Technology Licensing, LLC Borderless table detection engine
EP2807604A1 (en) 2012-01-23 2014-12-03 Microsoft Corporation Vector graphics classification engine
CN104221033A (zh) * 2012-01-23 2014-12-17 微软公司 固定格式文档转换引擎
US9953008B2 (en) 2013-01-18 2018-04-24 Microsoft Technology Licensing, Llc Grouping fixed format document elements to preserve graphical data semantics after reflow by manipulating a bounding box vertically and horizontally
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9311531B2 (en) 2013-03-13 2016-04-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
US9386235B2 (en) 2013-11-15 2016-07-05 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
KR101484419B1 (ko) 2013-12-17 2015-01-28 비플라이소프트(주) 전자문서의 레이아웃 자동인식 시스템 및 레이아웃 자동인식 방법
US9229674B2 (en) 2014-01-31 2016-01-05 Ebay Inc. 3D printing: marketplace with federated access to printers
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US9595037B2 (en) 2014-12-16 2017-03-14 Ebay Inc. Digital rights and integrity management in three-dimensional (3D) printing
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach
US11934726B1 (en) * 2023-02-21 2024-03-19 Xerox Corporation Print job redirector to electronic transmission

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08167006A (ja) * 1994-12-13 1996-06-25 Canon Inc 自然言語処理装置及びその方法
JP2005071349A (ja) * 2003-08-20 2005-03-17 Oce Technol Bv 指定されたドキュメント・エリアからのメタデータの抽出

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5999664A (en) * 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
US7426054B1 (en) * 1999-05-13 2008-09-16 Canon Kabushiki Kaisha Image processing apparatus, image reproduction apparatus, system, method and storage medium for image processing and image reproduction
US7239747B2 (en) * 2002-01-24 2007-07-03 Chatterbox Systems, Inc. Method and system for locating position in printed texts and delivering multimedia information
US7397578B2 (en) * 2003-03-12 2008-07-08 Sharp Laboratories Of America, Inc. Thumbnail audit trail in MFP and print processor/spooler-based print-job auditing
US7171618B2 (en) * 2003-07-30 2007-01-30 Xerox Corporation Multi-versioned documents and method for creation and use thereof
US7505056B2 (en) * 2004-04-02 2009-03-17 K-Nfb Reading Technology, Inc. Mode processing in portable reading machine

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08167006A (ja) * 1994-12-13 1996-06-25 Canon Inc 自然言語処理装置及びその方法
JP2005071349A (ja) * 2003-08-20 2005-03-17 Oce Technol Bv 指定されたドキュメント・エリアからのメタデータの抽出

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010073114A (ja) * 2007-10-25 2010-04-02 Fuji Xerox Co Ltd 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム

Also Published As

Publication number Publication date
US20070035780A1 (en) 2007-02-15

Similar Documents

Publication Publication Date Title
JP2007042106A (ja) 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム
US9514103B2 (en) Effective system and method for visual document comparison using localized two-dimensional visual fingerprints
JP4859025B2 (ja) 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
US8726178B2 (en) Device, method, and computer program product for information retrieval
CN101178725B (zh) 用于信息检索的设备和方法
JP5712487B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
US8482808B2 (en) Image processing apparatus and method for displaying a preview of scanned document data
KR101814120B1 (ko) 이미지를 전자문서에 삽입하는 방법 및 이를 수행하는 장치
JP6540280B2 (ja) 画像処理装置およびコンピュータプログラム
JP2007004621A (ja) 文書管理支援装置、文書管理支援方法およびプログラム
JP2017146745A (ja) 情報処理装置、制御方法、情報処理システム、およびプログラム
JP4261988B2 (ja) 画像処理装置及び方法
US8219594B2 (en) Image processing apparatus, image processing method and storage medium that stores program thereof
JP2008204184A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP4811133B2 (ja) 画像形成装置及び画像処理装置
US11146705B2 (en) Character recognition device, method of generating document file, and storage medium
US20100070854A1 (en) Device for editing metadata of divided object
JP2007041709A (ja) 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP5098614B2 (ja) 文章処理装置の制御方法および文章処理装置
JP2021056722A (ja) 情報処理装置及びプログラム
JP2004348467A (ja) 画像検索装置及びその制御方法、プログラム
EP2166467B1 (en) Information processing apparatus, control method thereof, computer program, and storage medium
JP2019133370A (ja) 画像処理装置および画像処理プログラム
US20050256868A1 (en) Document search system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090728

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110517

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20110712