JP2009093627A - 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム - Google Patents

文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム Download PDF

Info

Publication number
JP2009093627A
JP2009093627A JP2008209289A JP2008209289A JP2009093627A JP 2009093627 A JP2009093627 A JP 2009093627A JP 2008209289 A JP2008209289 A JP 2008209289A JP 2008209289 A JP2008209289 A JP 2008209289A JP 2009093627 A JP2009093627 A JP 2009093627A
Authority
JP
Japan
Prior art keywords
document image
data
image data
text
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008209289A
Other languages
English (en)
Inventor
Masajiro Iwasaki
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2008209289A priority Critical patent/JP2009093627A/ja
Priority to US12/209,369 priority patent/US8194982B2/en
Priority to CN2008102131473A priority patent/CN101393564B/zh
Publication of JP2009093627A publication Critical patent/JP2009093627A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】文書画像データを簡単に再利用できる文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラムを提供することを目的としている。
【解決手段】文書画像データ提供システムにおいて、文書画像データ提供装置は、文書画像データが入力されると、文書画像データを構成する文書画像要素の領域を認識する。文書画像データ提供装置は、文書画像データ提供装置と接続された情報処理装置において文書画像データから文書画像要素が選択されると、選択された文書画像要素の要素データを文書画像データから抽出して情報処理装置に提供する。
【選択図】図4

Description

本発明は、文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラムに係り、文書画像データの処理に関する。
近年、コンピュータ関連技術の向上、オフィスにおけるネットワーク環境の整備により、文書の電子化が進んでいる。従来では、電子化された文書画像データを再利用する場合、例えば編集用のアプリケーション等を用いて文書画像データから必要な部分データを切り出したり、OCRアプリケーションで文書画像データを文字コード化したりして利用することができる。
特許文献1には、電子文書を構成する複数のオブジェクトに対する選択を受け付け、選択されたオブジェクト同士を統合し、電子文書と統合されたオブジェクトとを関連づけて管理する情報処理装置、情報処理方法、情報処理プログラム及び記録媒体が記載されている。
特開2007−200014号公報
しかしながら上記従来の技術では、文書画像データ中の所望のデータのみを再利用する場合等には、手作業で再利用したい部分のデータを切り出す必要があり、操作が繁雑である。
本発明は、上記事情を鑑みてこれを解決すべく成されたものであり、文書画像データを簡単に再利用できる文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラムを提供することを目的とする。
本発明は、上記目的を達成するために、以下の如き構成を採用した。
本発明は、文書画像データを情報処理装置へ提供する文書画像データ提供装置であって、文書画像データを入力する文書画像入力手段と、前記文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、前記テキスト領域以外の領域とを認識する領域認識手段と、前記領域認識手段により認識された前記テキスト領域に含まれるテキストデータを取得するテキストデータ取得手段と、前記情報処理装置から文書画像データの提供を要求された際、前記文書画像入力手段により入力された文書画像データから生成された低解像度の画像データと、前記テキストデータ取得手段により取得されたテキストデータと、を前記情報処理装置へ提供する提供手段と、を有する構成とした。
係る構成によれば、文書画像データを簡単に再利用できる。
本発明は、文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、テキスト領域以外の領域とを認識する文書画像データ提供装置と接続された情報処理装置であって、前記文書画像データ提供装置から、前記文書画像データと、認識された前記テキスト領域に含まれる前記テキストデータと、を取得する取得手段と、前記文書画像データから前記文書画像データを構成する文書画像要素を選択する文書画像要素選択手段と、前記文書画像要素選択手段により選択された前記文書画像要素の要素データがテキストデータのとき、前記取得手段により取得された前記テキストデータにおいて前記要素データと対応したテキストデータを表示手段に表示させる表示制御手段と、を有する構成とした。
係る構成によれば、文書画像データを簡単に再利用できる。
本発明は、文書画像データを提供する文書画像データ提供装置と、前記文書画像データ提供装置に接続されており前記文書画像データ提供装置から前記文書画像データを提供される情報処理装置とを有する文書画像データ提供システムにおいて、前記文書画像データ提供装置は、文書画像データを入力する文書画像入力手段と、前記文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、前記テキスト領域以外の領域とを認識する領域認識手段と、前記領域認識手段により認識された前記テキスト領域に含まれるテキストデータを取得するテキストデータ取得手段と、前記情報処理装置から文書画像データの提供を要求された際、前記文書画像入力手段により入力された文書画像データから生成された低解像度の文書画像データと、前記テキストデータ取得手段により取得されたテキストデータと、を前記情報処理装置へ提供する提供手段と、を有し、前記情報処理装置は、前記画像処理装置から、前記低解像度の文書画像データと、認識された前記テキスト領域に含まれる前記テキストデータと、を取得する取得手段と、前記低解像度の文書画像データから前記低解像度の文書画像データを構成する文書画像要素を選択する文書画像要素選択手段と、前記文書画像要素選択手段により選択された前記文書画像要素の要素データがテキストデータのとき、前記取得手段により取得された前記テキストデータにおいて前記要素データと対応したテキストデータを表示手段に表示させる表示制御手段と、を有する構成とした。
係る構成によれば、文書画像データを簡単に再利用できる。
本発明は、文書画像データを情報処理装置へ提供する文書画像データ提供装置による文書画像データ提供方法であって、文書画像データを入力する文書画像入力手順と、前記文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、前記テキスト領域以外の領域とを認識する領域認識手順と、前記領域認識手順により認識された前記テキスト領域に含まれるテキストデータを取得するテキストデータ取得手順と、前記情報処理装置から文書画像データの提供を要求された際、前記文書画像入力手順で入力された文書画像データから生成された低解像度の文書画像データと、前記テキストデータ取得手順により取得されたテキストデータと、を前記情報処理装置へ提供する提供手順と、を有する方法とした。
係る方法によれば、文書画像データを簡単に再利用できる。
本発明は、文書画像データを情報処理装置へ提供する文書画像データ提供装置において実行される文書画像データ提供プログラムであって、前記文書画像データ提供装置は演算処理装置と記憶装置とを有し、前記演算処理装置に、文書画像データを入力する文書画像入力ステップと、前記文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、前記テキスト領域以外の領域とを認識する領域認識ステップと、前記領域認識ステップにより認識された前記テキスト領域に含まれるテキストデータを取得するテキストデータ取得ステップと、前記情報処理装置から文書画像データの提供を要求された際、前記文書画像入力ステップで入力された文書画像データから生成された低解像度の文書画像データと、前記テキストデータ取得ステップにより取得されたテキストデータと、を前記情報処理装置へ提供する提供ステップと、を実行させるプログラムとした。
係るプログラムによれば、文書画像データを簡単に再利用できる。
本発明は、文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、テキスト領域以外の領域とを認識する文書画像データ提供装置と接続された情報処理装置による情報処理方法であって、前記文書画像データ提供装置から、前記文書画像データと、認識された前記テキスト領域に含まれる前記テキストデータと、を取得する取得手順と、前記文書画像データから前記文書画像データを構成する文書画像要素を選択する文書画像要素選択手順と、前記文書画像要素選択手順により選択された前記文書画像要素の要素データがテキストデータのとき、前記取得手順により取得された前記テキストデータにおいて前記要素データと対応したテキストデータを表示手段に表示させる表示制御手順と、を有する方法とした。
係る方法によれば、文書画像データを簡単に再利用できる。
本発明は、文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、テキスト領域以外の領域とを認識する文書画像データ提供装置と接続された情報処理装置において実行される情報処理プログラムであって、前記情報処理装置は演算処理装置と記憶装置とを有し、前記演算処理装置に、前記文書画像データ提供装置から、前記文書画像データと、認識された前記テキスト領域に含まれる前記テキストデータと、を取得する取得ステップと、前記文書画像データから前記文書画像データを構成する文書画像要素を選択する文書画像要素選択ステップと、前記文書画像要素選択ステップにより選択された前記文書画像要素の要素データがテキストデータのとき、前記取得ステップにより取得された前記テキストデータにおいて前記要素データと対応したテキストデータを表示手段に表示させる表示制御ステップと、を実行させるプログラムとした。
係るプログラムによれば、文書画像データを簡単に再利用できる。
本発明によれば、文書画像データを簡単に再利用することができる。
本発明の文書画像データ提供システムでは、文書画像データ提供装置は、文書画像データが入力されると、文書画像データを構成する文書画像要素の領域を認識する。そして文書画像データ提供装置は、文書画像データ提供装置と接続された情報処理装置において、文書画像データから文書画像要素が選択されると、選択された文書画像要素の要素データを文書画像データから抽出して情報処理装置に提供する。
以下に図1を参照して本発明の概要を説明する。
図1は、本発明の文書画像データ提供システム100を説明する図である。尚、以下の本発明の実施形態の説明では、文書画像データ提供装置を、例えばスキャン機能、コピー機能、FAX機能などを有し、文書画像データを蓄積可能なMFP(Multi Function Peripherals)により実現し、情報処理装置を、演算処理装置と記憶装置とを有する一般のコンピュータにより実現する形態を説明する。なお、MFP以外に文書画像データ提供装置として、インターネットにより接続可能な情報提供サーバ、コンピュータ等、様々な画像処理装置を用いることができる。
図1に示す文書画像データ提供システム100は、MFP200、情報処理装置300と、がネットワーク400を介して接続されて構成されている。
文書画像データ提供システム100においてMFP200は、文書画像10が読み取られて文書画像データ10Aとされると、文書画像データ10Aを構成する文書画像要素の領域を認識する。その際にMFP200は、テキストデータが含まれる文書画像要素の領域と、それ以外のデータが含まれる文書画像要素の領域とを認識する。尚ここで言うテキストデータとは、文書画像データ10Aに含まれる文字コードの集合を示す。図1の例では、MP200は、文書画像データ10Aを構成する文書画像要素11、12、13の領域を認識する。またMFP200は、文書画像データ10Aと、文書画像要素11、12、13とを関連付けて蓄積しておく。
MFP200は、情報処理装置300において文書画像要素11、12、13のうち、テキストデータが含まれる文書要素画像以外の文書画像要素が選択されると、選択された文書画像要素の要素データを文書画像データ10Aから抽出して情報処理装置300へ提供(出力)する。テキストデータが含まれる文書画像要素が選択された場合の詳細は後述する。情報処理装置300では、MFP200から提供される要素データを取得し、取得した要素データを用いて文書画像データ10Aの編集を行うことができる。
尚本実施形態では、文書画像要素の領域の認識とは、例えば文書画像要素の領域が矩形状である場合には、領域の左上の一点の位置情報と右下の一点の位置情報とを取得することであっても良いし、矩形状以外の場合には、文書画像要素が外接する矩形の位置情報を取得することであっても良い。また本実施形態の要素データの抽出とは、例えば文書画像データ10において選択された文書画像要素の要素データの複製を生成することであっても良い。
文書画像要素とは、例えば文書画像に含まれる画像、テキスト、図形、表などである。また要素データとは、各文書画像要素に対応したデータを示す。具体的には例えば、文書画像に画像とテキスト(文字列)が含まれる場合、文書画像を構成する文書画像要素は画像とテキストである。文書画像要素が画像であった場合の要素データは、画像データである。文書画像要素がテキストであった場合には、要素データはテキストデータである。また例えば文書画像要素が図形、表等であった場合には、図形、表は画像として認識されるため、要素データは図形、表を示す画像データとなる。
ここで文書画像要素の種類と、要素データの種類との対応を表1に示す。表1に示されるように本実施形態では、文書画像要素が画像、図形、表であった場合には、要素データを画像データとして取得し、文書画像要素がテキストであった場合には要素データをテキストデータとして取得する。
Figure 2009093627
図2は、本発明のMFP200におけるハードウェア構成の一例を示す図である。
MFP200は、それぞれバスBで相互に接続されているスキャン装置21、プロッタ装置22、ドライブ装置23、補助記憶装置24、メモリ装置25、演算処理装置26、インターフェース装置27及び操作パネル28で構成される。
スキャン装置21はスキャナエンジンとエンジン制御部等で構成され、文書画像(原稿)を読み取って文書画像データとするために用いられる。プロッタ装置22はプロッタエンジンとエンジン制御部等で構成され、画像データを印刷用紙等の記録媒体に出力するために用いられる。インターフェース装置27は、モデム、LANカード等で構成されており、ネットワーク400に接続する為に用いられる。操作パネル28は、MFP200の操作を行うために用いられるものであり、表示機能も兼ね備えるタッチパネル等により構成される。
本発明の画像処理プログラムは、MFP200を制御するために用いられる各種プログラムの少なくとも一部である。画像処理プログラムは例えば記録媒体29の配布やネットワーク400からのダウンロード等によって提供される。画像処理プログラムを記録した記録媒体29は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記録媒体を用いることができる。
また、画像処理プログラムを記録した記録媒体29がドライブ装置23にセットされると、画像処理プログラムは記録媒体29からドライブ装置23を介して補助記憶装置24にインストールされる。ネットワーク400からダウンロードされた画像処理プログラムは、インターフェース装置27を介して補助記憶装置24にインストールされる。
補助記憶装置24は、インストールされた画像処理プログラムを格納すると共に、必要なファイル、データ等を格納する。メモリ装置25は、コンピュータの起動時に補助記憶装置24から画像処理プログラムを読み出して格納する。そして、演算処理装置26はメモリ装置25に格納された画像処理プログラムに従って、後述するような各種処理を実現している。
図3は、本発明の情報処理装置300におけるハードウェア構成の一例を示す図である。
情報処理装置300は、それぞれバスBで相互に接続されている入力装置31、出力装置32、ドライブ装置33、補助記憶装置34、メモリ装置35、演算処理装置36およびインターフェース装置37で構成される。
入力装置31はキーボードやマウスなどで構成され、各種信号を入力するために用いられる。表示装置32はディスプレイ装置などで構成され、各種ウィンドウやデータ等を表示するために用いられる。インターフェース装置37は、モデム、LANインターフェースなどで構成されており、ネットワーク400に接続する為に用いられる。
本発明の情報処理プログラムは、情報処理装置300を制御するために用いられる各種プログラムの少なくとも一部である。情報処理プログラムは例えば記録媒体38の配布やネットワーク400からのダウンロードなどによって提供される。情報処理プログラムを記録した記録媒体38は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記録媒体、ROM、フラッシュメモリ、半導体メモリ等、様々なタイプの記録媒体を用いることができる。
また、情報処理プログラムを記録した記録媒体38がドライブ装置33にセットされると、情報処理プログラムは記録媒体38からドライブ装置33を介して補助記憶装置34にインストールされる。ネットワーク400からダウンロードされた情報処理プログラムは、インターフェース装置37を介して補助記憶装置34にインストールされる。
補助記憶装置34は、インストールされた情報処理プログラムを格納すると共に、必要なファイル、データ等を格納する。メモリ装置35は、コンピュータの起動時に補助記憶装置34から情報処理プログラムを読み出して格納する。そして、演算処理装置36はメモリ装置35に格納された情報処理プログラムに従って、後述するような各種処理を実現している。
(第一の実施形態)
以下に図面を参照して本発明の第一の実施形態について説明する。図4は、第一の実施形態の文書画像データ提供システム100を構成する各装置の機能構成を示す図である。
本実施形態のMFP200は、文書画像入力部205、領域認識部210、テキストデータ取得部215、画像生成部220、格納制御部230、一覧提供部240、プレビュー画像提供部250、要素データ抽出部260、要素データ提供部270を有する。またMFP200は、補助記憶装置24内に設けられたデータベース280を有する。
文書画像入力部205(文書画像入力手段)は、文書画像をスキャンして文書画像データとして画像処理装置200に入力する。
領域認識部210(領域認識手段)は、文書画像データを構成する文書画像要素の領域を認識する。具体的には領域認識部210は、文書画像データに含まれるデータの特徴から、テキストデータ、図のデータ、表のデータ、写真のデータ等をそれぞれの領域を判別し、領域内の特徴に基づいて領域内のデータの種別を判別することで文書画像要素を認識する。本実施形態の領域認識部210は、文書画像要素がテキストである領域をテキスト領域と認識し、文書画像要素がテキスト以外である領域を画像領域と認識する。尚本実施形態の領域認識部210では、文書画像データにおける文書画像要素の座標情報に基づき、文書画像要素の領域情報を得ることができる。尚領域判別は公知の技術であるため、詳細な説明は割愛する。
テキストデータ取得部215(テキストデータ取得手段)は、領域認識部210により、テキスト領域と認識された領域の文書画像要素からテキストデータを取得する。テキストデータ取得部215は、例えばOCR(Optical Character Recognition)機能などにより実現される。テキストデータ取得部215により取得されたテキストデータは、後述するデータベース280に格納される。
画像生成部220(画像生成手段)は、文書画像入力部205により入力された文書画像データを用いて、入力された文書画像データよりも解像度の低い文書画像データを生成する。本実施形態の画像生成部220では、入力された文書画像データよりも解像度の低い第一の文書画像データと、第一の文書画像データよりもさらに解像度の低い第二の文書画像データを生成する。第一の文書画像データと第二の文書画像データの詳細は後述する。
格納制御部230は、後述するデータベース280に対する文書画像データの格納の制御を行う。一覧提供部240(提供手段)は、データベース280から、データベース280に格納されている文書画像データの一覧を取得して、情報処理装置300に提供する。
プレビュー画像提供部250(提供手段)は、情報処理装置300において後述するようにしてサムネイル画像が選択されると、データベース280から選択されたプレビュー画像データを取得して情報処理装置300へ提供する。ここでプレビュー画像提供部250は、このプレビュー画像の元となる文書画像データに含まれるテキストデータ及び文書画像データにおいて認識された文書画像要素の領域情報とをプレビュー画像データと共に情報処理装置300へ提供する。
要素データ抽出部260(要素データ抽出手段)は、入力された文書画像データから、選択された文書画像要素に対応する要素データを抽出する。要素データ提供部270(要素データ提供手段)は、要素データ抽出部260により抽出された要素データを情報処理装置300へ提供する。
データベース280は、文書画像データのメタデータが格納されるメタデータ部281、文書画像データが格納される文書画像データ部282を有する。
メタデータ部281には、文書画像データの属性を示す情報(書誌情報)が格納された文書テーブル283、文書画像データに含まれるページの情報が格納されるページテーブル284、文書画像要素毎の情報が格納される要素テーブル285を有する。
図5は、文書テーブル283のデータ構造の一例を示す図である。文書テーブル283は、文書画像データの書誌情報が格納される。具体的には文書テーブル283には、入力された文書画像データを識別子するための文書ID、文書画像データの作成日、文書画像データのページ数、文書画像データのタイトル等が関連付けられて格納される。また本実施形態の文書テーブル283では、例えば文書画像データがメモリカード等の記録媒体から直接入力された場合には、この文書画像データが直接文書テーブル283に格納される。
また本実施形態では、スキャン装置21からADF(Auto Document Feeder)機能などにより、複数ページの文書画像が一括して読み取られた場合、複数ページの文書画像データを1ファイルとして扱えるフォーマットに変換した後に文書画像データを文書テーブル283に格納しても良い。
ページテーブル284では、文書画像データをページ毎に管理するための情報が格納されている。図6は、ページテーブル284のデータ構成の一例を示す図である。
ページテーブル284では、ページID、文書ID、ページ番号、サムネイル画像、プレビュー画像、テキストデータ取得部215により取得されたテキストデータが関連付けられて格納されている。ページIDは、文書画像データをページ毎に識別するための識別情報である。文書IDは、ページIDで特定されるページが含まれる文書画像データのIDである。ページ番号は、文書IDで特定される文書画像データにおける当該ページの番号である。
サムネイル画像とは、当該ページのサムネイル画像である。プレビュー画像とは、当該ページのプレビュー画像である。
ここでサムネイル画像とプレビュー画像について説明する。
本実施形態では、文書画像データが入力されると、画像生成部220が文書画像データに含まれるページ毎に、文書画像データよりも解像度の低いプレビュー用の文書画像データ(以下、プレビュー画像データ)を生成する。このプレビュー画像データが、第一の文書画像データである。また画像生成部220は、プレビュー用の文書画像データよりもさらに解像度の低いサムネイル用の文書画像データ(以下、サムネイル画像データ)を生成する。このサムネイル画像データが、第二の文書画像データである。
本実施形態のMFP200では、文書画像データが入力されてプレビュー画像データとサムネイル画像データが生成されると、格納制御部230はプレビュー画像データとサムネイル画像データをページテーブル284の該当する箇所へ格納する。
文書画像データ部282には、スキャン装置21によりスキャンされた文書画像データが格納されて蓄積される。文書画像データ部282では、文書画像データの有するページIDにより、メタデータ部281のページテーブル284と関連付けられている。尚本実施形態の文書画像データ部282に格納される文書画像データは、スキャン装置21でスキャンされたときの解像度のまま格納されるものであって、他のアプリケーションにコピーした場合にも、十分再利用可能な解像度の画像とする。
尚本実施形態では、例えば文書画像データ部282に格納される文書画像データの解像度を600dpiとした場合に、プレビュー画像データの解像度は100dpi程度、サムネイル画像データは、一覧性を良くするために画像サイズを統一し、100ピクセル×100ピクセル程度であることが好ましい。
またページテーブル284には、サムネイル画像データとプレビュー画像データ以外にも、解像度の異なるページ画像データが格納されても良い。またこのときの解像度は、予めシステム管理者などにより設定されていても良い。この場合画像生成部220は、文書画像データが入力されると、サムネイル画像データと、プレビュー画像データの他に、設定された解像度のページ画像を生成する。そして格納制御部230は、生成されたページ画像データを、ページIDと関連付けてページテーブル284へ格納する。
図7は、要素テーブル285のデータ構造の一例を示す図である。要素テーブル285には、文書画像入力部205により入力された文書画像データにおいて、領域認識部210による文書画像要素の認識における文書画像要素毎の情報等が格納される。要素テーブル285に格納される文書画像要素毎の情報とは、文書画像要素の領域を識別するための識別情報である領域ID、文書画像要素を含む文書画像データを示す文書ID、文書画像要素が含まれるページを示すページID、文書画像要素の領域情報(座標情報)、文書画像要素の種別等が関連付けられて格納される。
図4に戻って、次に本実施形態の文書画像データ提供システム100を構成する情報処理装置300について説明する。
情報処理装置300は、一覧取得部310、取得部320、領域表示部325、文書画像要素選択部330、要素データ取得部340、範囲選択部342、選択範囲抽出部344、表示制御部350、編集部360を有する。
一覧取得部310は、MFP200のデータベース280に格納されている文書画像データの一覧を取得する。取得部320は、一覧取得部310により取得した文書画像データから選択されたプレビュー画像に対応するプレビュー画像データを取得する。また取得部320は、プレビュー画像データに対応する文書画像データに含まれるテキストデータ及び文書画像データにおいて認識された文書画像要素の領域情報を取得する。
領域表示部325は、取得したプレビュー画像データを表示する際に、文書画像要素毎の領域を示す表示を行う。文書画像要素選択部330は、文書画像から文書画像要素を選択する。要素データ取得部340は、文書画像要素選択部330により選択された文書画像要素に対応した要素データを取得する。
範囲選択部342は、取得部320によりプレビュー画像と同時に取得されたテキストデータにおいて、抽出するテキストデータの範囲を選択する。尚テキストデータの抽出の詳細は後述する。選択範囲抽出部344は、範囲選択部342により選択された範囲のテキストデータを、取得部320により取得されたテキストデータから抽出する。
表示制御部350は、表示装置32における表示を制御する。編集部360は、要素データ取得部340により取得された要素データを用いた編集を行う。尚編集部360は、例えば情報処理装置300にインストールされた要素データを編集するための編集用アプリケーション等により実現されても良い。
また本実施形態の一覧取得部310、取得部320、文書画像要素選択部330、要素データ取得部340、範囲選択部342、選択範囲抽出部344、表示制御部350は、情報処理装置300の有するWebブラウザ370により実現されるものとした。
次に、図8及び図9を参照して本実施形態の文書画像データ提供システム100の動作について説明する。図8は、第一の実施形態の文書画像データ提供システム100における文書画像データの登録(蓄積)の動作を説明するフローチャートである。
MFP200において文書画像入力部205により文書画像データが入力されると、ステップS801へ進み、領域認識部210により文書画像要素の認識が行われる。文書画像要素が認識されると、格納制御部230は、文書画像データに含まれる文書画像データの書誌情報を文書テーブル283へ格納する。また格納制御部230は、文書画像データに含まれる各ページ毎の情報をページテーブル284へ格納する。
さらに格納制御部230は、認識された文書画像要素毎に、各文書画像要素の領域情報等を要素テーブル285に格納する。また格納制御部230は、文書画像データを文書画像データ部282へ格納する。
ステップS801に続いてステップS802へ進み、MFP200は、テキストデータ取得部215により、ステップS801で認識された文書画像要素のうち、テキスト領域と認識された文書画像要素から要素データであるテキストデータを取得する。ステップS802に続いてステップS803へ進み、格納制御部230はテキストデータ取得部215が取得したテキストデータをページテーブル284に格納する。
ステップS803に続いてステップS804へ続き、画像生成部220は、ステップS801で入力された文書画像データからプレビュー画像データとサムネイル画像データを生成する。具体的には例えば、画像生成部220は、文書画像データを圧縮してプレビュー画像データとサムネイル画像データとを生成する。ステップS804に続いてステップS805へ進み、格納制御部230は、生成されたプレビュー画像データとサムネイル画像データとをページテーブル284へ格納する。
本実施形態では、以上のようにしてMFP200に文書画像データが登録されて蓄積される。
次に本実施形態の情報処理装置300における文書画像データの表示について説明する。図9は、第一の実施形態の文書画像データ提供システム100における文書画像データの表示を説明するフローチャートである。
ステップS901において、情報処理装置300が文書画像データの一覧取得指示を受けるとステップS902へ進む。ステップS902においてMFP200は、情報処理装置300から一覧取得指示を受けて、一覧提供部240によりデータベース280に格納されている文書画像データの一覧を情報処理装置300へ提供する。このとき一覧提供部240は、ページテーブル284に格納されている文書画像データの一覧としてサムネイル画像データの一覧を取得し、情報処理装置300へ提供する。
ステップS902に続いてステップS903へ進み、情報処理装置300は、一覧取得部310により、提供されたサムネイル画像の一覧を取得する。そして情報処理装置300において表示制御部350は、取得した一覧を表示装置32に表示させる。図10は、表示装置32にサムネイル画像の一覧が表示された表示画面の一例を示す図である。図10に示すように、表示装置32に表示される一覧は、文書画像のサムネイル画像により示される。
図10に示す表示画面32Aでは、文書画像データの一覧として4つのサムネイル画像81〜84が表示されている。各サムネイル画像の下には、文書画像データのタイトルが表示されている。尚例えば複数ページの文書画像データを1ファイルとしている場合、表示画面32Aには、最初のページの文書画像データのサムネイル画像が表示されても良い。
図9に戻って、ステップS903に続いてステップS904へ進み、情報処理装置300において表示画面32Aからサムネイル画像が選択される。尚本実施形態の情報処理装置300では、サムネイル画像が例えばマウス等のポインティングデバイスによりクリックされたとき、そのサムネイル画像が選択されるものとしても良い。
ステップS904に続いてステップS905へ進み、サムネイル画像が選択されると、MFP200は、プレビュー画像提供部250により、データベース280から選択されたサムネイル画像に対応するプレビュー画像データを取得する。そしてMFP200は、プレビュー画像提供部250により、取得したプレビュー画像データを情報処理装置300へ提供する。このときMFP200は、プレビュー画像データと共に、文書画像要素の領域情報及びページテーブル284に格納されているテキストデータも情報処理装置300へ提供する。
ステップS905に続いてステップS8906へ進み、情報処理装置300は、取得部320によりMFP200から提供されたプレビュー画像データと、文書画像要素の領域情報と、テキストデータとを取得する。表示制御部350は、取得したプレビュー画像データに基づきプレビュー画像を表示装置32に表示させる。
ステップS906に続いてステップS907進み、情報処理装置300において領域表示部325は、文書画像要素の領域情報に基づき、プレビュー画像上に文書画像要素の領域を示す矩形を表示させて表示の処理を終了する。以下に矩形の表示について説明する。
図11は、表示装置32にプレビュー画像が表示された表示画面の一例を示す図である。図11の示す表示画面32Bは、図10に示す文書画像データの一覧においてサムネイル画像82が選択された場合の表示画面を示している。
表示画面32Bに表示されたプレビュー画像90の元となる文書画像は、文書画像要素91、92、93から構成されている。よってプレビュー画像90には、文書画像要素91の領域を示す矩形94A、文書画像要素92の領域を示す矩形94B、文書画像要素93の領域を示す矩形94Cが表示されている。矩形94A、94B、94Cは、プレビュー画像90を表示するためのプレビュー画像データと共に取得した文書画像要素91、92、93の領域情報に基づき表示される。尚本実施形態では、プレビュー画像90における文書画像要素91、92、93のレイアウトは、文書画像データの元となる文書画像における文書画像要素のレイアウトと同様である。
また本実施形態では、例えば領域表示部325により表示される矩形94A、94B、94Cの色を、文書画像要素の種別に合わせて変更しても良い。例えば文書画像要素91の種別が画像である場合には、矩形94Aの色を青とし、文書画像要素92の種別がテキストであった場合には矩形94Bの色を赤とする、などである。
本実施形態では、以上に説明したように、MFP200に文書画像データを登録し、情報処理装置300で登録された文書画像データを表示する。
また本実施形態の文書画像データ提供システム100では、上述したMFP200及び情報処理装置300の機能により、MFP200に蓄積された文書画像データの要素データを再利用して文書画像を編集することができる。
以下に本実施形態における文書画像の編集について説明する。本実施形態の情報処理装置300では、編集部360により、表示装置32に文書画像の編集画面を表示させて、要素データを用いた文書画像の編集を行うことができる。
本実施形態の情報処理装置300では、表示装置32にプレビュー画像と編集画面とを表示させ、例えばマウス等によりプレビュー画像の文書画像要素を編集画面へドラッグ&ドロップすることにより、対象となる文書画像要素の要素データを編集画面へ貼り付けることができる。
図12は、第一の実施形態の情報処理装置300における文書画像の編集を説明するフローチャートである。
ステップS1201において情報処理装置300は、文書画像データのプレビュー画像データを取得する。プレビュー画像データの取得については上述した通りである。ステップS1201に続いてステップS1202へ進み、表示制御部350は、取得したプレビュー画像データに基づき表示装置32にプレビュー画像を表示させる。ここで表示されるプレビュー画像には、文書画像要素の領域を示す矩形が表示されている。また編集部360は、表示装置32に文書画像の編集画面を表示させる。
ステップS1202に続いてステップS1203へ進み、プレビュー画像において文書画像要素選択部330により文書画像要素が選択される。尚本実施形態では、プレビュー画像90において、矩形94A、94B、94Cにより囲われた領域内においてマウス等のポインティングデバイスがクリックされると、クリックされた矩形94A、94B、94C内の文書画像要素91、92、93が選択されたものと判断される。よって本実施形態の文書画像要素選択部330は、入力装置31により実現される。情報処理装置300において文書画像要素が選択されると、選択指示と、選択された文書画像要素の領域情報とがMFP200へ送信される。
ステップS1203に続いてステップS1204へ進み、情報処理装置300は選択された文書画像要素に対応した要素データを取得する。
ステップS1204において選択された文書画像要素に対応した要素データがテキストデータである場合、ステップS1205へ進む。ステップS1205において情報処理装置300は、要素データ取得部340により、プレビュー画像データと共に取得した領域情報とテキストデータに基づき、選択された文書画像要素に対応したテキストデータを要素データとして取得する。より具体的には要素データ取得部340は、プレビュー画像データと共に取得したテキストデータから、領域情報に示される領域に含まれるテキストデータを抽出して要素データとする。
ステップS1205に続いてステップS1206へ進み、情報処理装置300は、表示制御部350によりステップS1205で取得したテキストデータ(要素データ)をプレビュー画像上に表示させる。ここで表示制御部350は、プレビュー画像上の選択された文書画像要素の近傍にウィンドウを表示させ、このウィンドウ内に該当するテキストデータを表示させても良い。尚文書画像要素の選択は、マウス等により矩形の領域内がクリックされたときとしたが、これに限定されない。本実施形態では、例えば矩形の領域内にカーソルが合わされたときにウィンドウを表示させてテキストデータを表示させても良い。
ステップS1206に続いてステップS1207へ進み、情報処理装置300では、範囲選択部342により、表示されたテキストデータからドラッグ&ドロップされるテキストデータの範囲が選択される。より具体的には、例えばテキストデータが表示されたウィンドウ内のテキストデータから、マウス等のポインティングデバイスによりドラッグ&ドロップされるテキストデータが選択される。したがって本実施形態の範囲選択部342は、情報処理装置300の有する入力装置31により実現できる。
ステップS1207に続いてステップS1208へ進み、編集対象として選択されたテキストデータにドラッグ&ドロップの操作がなされると、選択範囲抽出部344は選択された範囲のテキストデータを、要素データ取得部340により取得されたテキストデータから抽出する。そしてステップS1209に進み、編集部360により抽出されたテキストデータが編集画面に表示される。
次にステップS1204において選択された文書画像要素に対応する要素データがテキストデータでなかった場合、ステップS1210へ進み、選択された文書画像要素は、編集画面上へドラック&ドロップされる。
ステップS1210に続いてステップS1211へ進み、情報処理装置300は、選択された文書画像要素がドラッグ&ドロップされると、要素データ取得部340により選択された文書画像要素の要素データを取得する。
以下に要素データの取得について説明する。
情報処理装置300からの選択指示と文書画像要素の領域情報とを受けて、MFP200の要素データ抽出部260は、選択された文書画像要素を含む文書画像データを文書画像データ部282から取得する。要素データ抽出部260は、取得した文書画像データから、領域情報に基づき文書画像要素に対応する要素データを切り出して抽出する。尚ここで切り出される要素データは、プレビュー画像よりも高解像度のデータである。
MFP200の要素データ提供部270により提供された要素データは、情報処理装置300の要素データ取得部350により取得される。
ステップS1211に続いてステップS1209へ進み、編集部360により、取得した要素データが編集画面上に表示される。
このようにして本実施形態の情報処理装置300では、編集画面に表示された要素データを任意にレイアウトすることができる。
以上に説明したように本実施形態では、文書画像データにおいて文書画像要素が選択されたときに、その都度、選択された文書画像要素に対応した要素データを文書画像データから切り出して抽出する。よって本実施形態では、予め文書画像データを文書画像要素に分割し、文書画像要素毎にデータを保持しておく必要がなく、文書画像データの蓄積に必要となるメモリ容量を削減することができる。
また本実施形態では、プレビュー画像において文書画像要素が選択されると、プレビュー画像よりも高解像度の文書画像データから、選択された文書画像要素に対応する要素データを抽出する。よって本実施形態では、再利用される画像の画質を高画質に保つことができる。
以下に図13を文書画像の編集を具体的に説明する。図13は、プレビュー画像と編集画面が表示された表示画面の一例を示す図である。
図13に示す表示画面32Cにおいて、プレビュー画像90と、編集画面111とが表示されている。表示画面32Cに表示されるプレビュー画像90は、文書画像要素91、92、93を有し、各文書画像要素の領域を示す矩形94が表示されている。
まず図12のステップS1204において選択された文書画像要素の要素データが、テキストデータの場合の文書画像の編集について説明する。
表示画面32Cにおいて、プレビュー画像90では、文書画像要素92が再利用される要素データとして選択される。
表示画面32Cに示す例では、文書画像要素92はテキストである。プレビュー画面90において、例えばマウス等により文書画像要素92にカーソルKが合わせられ、文書画像要素92が選択されると、文書画像要素92の下方にテキストデータ表示用のウィンドウWが表示される。ウィンドウWには、矩形94Bに示される領域に含まれるテキストデータが表示される。
ウィンドウWにおいて、例えばカーソルKにより編集対象とするテキストデータの範囲Mが選択されて、範囲Mが編集画面111へドラッグ&ドロップされると、範囲M内のテキストデータ92Aのみが編集画面111へ表示される。尚本実施形態では、ウィンドウWにおいて範囲M内のテキストデータがコピーされて、編集画面111上に貼り付けされても良い。
次に図12のステップS1204において選択された文書画像要素の要素データが、テキストデータでない場合の文書画像の編集について説明する。
表示画面32Cでは、プレビュー画像90において文書画像要素91が再利用される要素データとして選択されている。本実施形態の情報処理装置300では、プレビュー画像90の文書画像要素91の領域を示す矩形94A内にカーソルを合わせ、矩形94A内の文書画像要素91が編集画面111上にドラッグ&ドロップされると、文書画像要素91の要素データがMFP200から情報処理装置300へ提供される。MFP200からの要素データの提供は、上で説明した通りである。
提供された文書画像要素91の要素データ91Aは、編集画面111内に貼り付けられる。尚要素データ91Aは、例えばドラッグ&ドロップの際に編集画面111内のカーソルで指定された位置に貼り付けられても良い。尚表示画面32Cに示す例では、文書画像要素91は画像とした。よって要素データ91Aは、文書画像データから抽出された画像データである。
このように本実施形態では、要素データがテキストデータの場合には、編集画面111において編集を行う前に、プレビュー画像90上で予めテキストデータを表示させることができる。このため本実施形態では、文書画像データが入力された際のテキストデータ取得部215によりテキストデータが正しく取得されているか否かを、編集前に確かめることができる。また本実施形態では、プレビュー画像上に表示されたテキストデータから編集対象となるテキストデータのみを選択して再利用することができる。よって本実施形態では、テキストデータを再利用する際に、一度取得した不要なデータを削除する、といった繁雑な操作を行う必要がない。
このように本実施形態によれば、MFP200に蓄積されている文書画像データの要素データを用いて文書画像を編集することができ、文書画像データを構成する文書画像要素を簡単に再利用することができる。
尚本実施形態では、一度文書画像データから抽出されて再利用された要素データをページテーブル284に格納しても良い。このとき要素データは、この要素データが含まれるページIDと関連付けられて格納されても良い。
尚以上の説明では、文書画像要素が画像の場合には、要素データは画像データとなり、文書画像要素がテキストの場合には要素データはテキストデータとなるものとしたが、本実施形態ではこれに限定されない。
本実施形態の情報処理装置300では、文書画像要素が選択される際の所定の操作により、要素データを画像データ又はテキストデータの何れで取得するかを選択することができる。本実施形態のMFP200では、情報処理装置300において例えば画像である文書画像要素を選択する際に所定の操作をされた場合、テキストデータの取得指示を受けたものと見なし、文書画像データから画像データを要素データとして抽出せずに、OCR機能等の結果であるテキストデータを要素データとしても良い。
また本実施形態のMFP200は、例えば情報処理装置300において例えばテキストである文書画像要素を選択する際に所定の操作をされた場合、画像データの取得指示を受けたものと見なし、要素データをテキストデータではなく画像データとして提供することもできる。この場合情報処理装置300へ提供される要素データは、文書画像データから抽出された画像データとなる。
尚本実施形態における所定の操作とは、例えば情報処理装置300において文書画像要素を選択する際に、マウスによる選択指示(クリック)をしている間に、キーボードの所定のキーを押す、などの操作である。
(第二の実施形態)
以下に図面を参照して本発明の第二の実施形態について説明する。本発明の第二の実施形態では、情報処理装置300の有するWebブラウザ370と編集部360の機能をMFP200に搭載したものである。本実施形態の以下の説明では、第一の実施形態と同様の機能構成を有するものには第一の実施形態で用いた符号と同様の符号を付与し、その説明を省略する。
図14は、第二の実施形態の文書画像データ提供システム100Aのシステム構成を示す図である。
本実施形態の文書画像データ提供システム100Aは、MFP200Aと情報処理装置300とがネットワーク400を介して接続されて構成されている。
本実施形態のMFP200Aは、第一の実施形態のMFP200の有する各部に加え、第一の実施形態の情報処理装置300の有するWebブラウザ370と編集部360とを有する。
Webブラウザ370と編集部360の有する機能については第一の実施形態で説明した通りである。よって本実施形態のMFP200Aでは、MFP200Aの有する操作パネル28上に、文書画像要素の領域を示す矩形が表示されたプレビュー画像を表示させ、文書画像要素を選択させることができる。そして選択された文書画像要素の素データを用いて文書画像の編集を行うことができる。
よって本実施形態によれば、文書画像データを簡単に再利用することができる。
以上、各実施形態に基づき本発明の説明を行ってきたが、上記実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
本発明の文書画像データ提供システム100を説明する図である。 本発明のMFP200のハードウェア構成の一例を示す図である。 本発明の情報処理装置300のハードウェア構成の一例を示す図である。 第一の実施形態の文書画像データ提供システム100を構成する各装置の機能構成を示す図である。 文書テーブル283のデータ構造の一例を示す図である。 ページテーブル284のデータ構成の一例を示す図である。 要素テーブル285のデータ構造の一例を示す図である。 第一の実施形態の文書画像データ提供システム100における文書画像データの登録の動作を説明するフローチャートである。 第一の実施形態の文書画像データ提供システム100における文書画像データの表示を説明するフローチャートである。 表示装置32に文書画像データの一覧が表示された表示画面の一例を示す図である。 表示装置32にプレビュー画像が表示された表示画面の一例を示す図である。 第一の実施形態の情報処理装置300における文書画像の編集を説明するフローチャートである。 プレビュー画像と編集画面が表示された表示画面の一例を示す図である。 第二の実施形態の文書画像データ提供システム100Aのシステム構成を示す図である。
符号の説明
100、100A 文書画像データ提供システム
200、200A MFP
205 文書画像入力部
210 領域認識部
215 テキストデータ取得部
220 画像生成部
230 格納制御部
240 一覧提供部
250 プレビュー画像提供部
260 要素データ抽出部
270 要素データ提供部
280 データベース
281 メタデータ部
282 文書画像データ部
283 文書テーブル
284 ページテーブル
285 要素テーブル
300 情報処理装置
310 一覧取得部
320 取得部
325 領域表示部
330 文書画像要素選択部
340 要素データ取得部
342 範囲選択部
344 選択範囲抽出部
350 表示制御部
360 編集部
370 Webブラウザ

Claims (12)

  1. 文書画像データを情報処理装置へ提供する文書画像データ提供装置であって、
    文書画像データを入力する文書画像入力手段と、
    前記文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、前記テキスト領域以外の領域とを認識する領域認識手段と、
    前記領域認識手段により認識された前記テキスト領域に含まれるテキストデータを取得するテキストデータ取得手段と、
    前記情報処理装置から文書画像データの提供を要求された際、前記文書画像入力手段により入力された文書画像データから生成された低解像度の画像データと、前記テキストデータ取得手段により取得されたテキストデータと、を前記情報処理装置へ提供する提供手段と、を有することを特徴とする文書画像データ提供装置。
  2. 前記文書画像要素を選択させるために、入力された前記文書画像データの低解像度画像データを生成する画像生成手段を有することを特徴とする請求項1記載の文書画像データ提供装置。
  3. 前記画像生成手段は、
    前記入力された文書画像データよりも解像度の低い第一の文書画像データと、該第一の文書画像データよりも解像度の低い第二の文書画像データと、を生成することを特徴とする請求項2記載の文書画像データ提供装置。
  4. 前記情報処理装置において前記文書画像データの文書画像要素が選択されたとき、前記文書画像入力手段から入力された前記文書画像データから、選択された前記文書画像要素の要素データを抽出する要素データ抽出手段を有し、
    前記提供手段は、前記要素データ抽出手段により抽出された前記要素データを前記情報処理装置へ提供することを特徴とする請求項1ないし3の何れか一項に記載の文書画像データ提供装置。
  5. 文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、テキスト領域以外の領域とを認識する文書画像データ提供装置と接続された情報処理装置であって、
    前記文書画像データ提供装置から、前記文書画像データと、認識された前記テキスト領域に含まれる前記テキストデータと、を取得する取得手段と、
    前記文書画像データから前記文書画像データを構成する文書画像要素を選択する文書画像要素選択手段と、
    前記文書画像要素選択手段により選択された前記文書画像要素の要素データがテキストデータのとき、前記取得手段により取得された前記テキストデータにおいて前記要素データと対応したテキストデータを表示手段に表示させる表示制御手段と、を有することを特徴とする情報処理装置。
  6. 前記表示手段に表示されたテキストデータから抽出するテキストデータの範囲を選択する範囲選択手段と、
    前記範囲選択手段により選択された範囲のテキストデータを前記表示手段に表示させたテキストデータから抽出する選択範囲抽出手段と、を有することを特徴とする請求項5記載の情報処理装置。
  7. 前記文書画像要素選択手段により選択された文書画像要素の要素データを取得する要素データ取得手段を有することを特徴とする請求項5又は6記載の情報処理装置。
  8. 文書画像データを提供する文書画像データ提供装置と、前記文書画像データ提供装置に接続されており前記文書画像データ提供装置から前記文書画像データを提供される情報処理装置とを有する文書画像データ提供システムにおいて、
    前記文書画像データ提供装置は、
    文書画像データを入力する文書画像入力手段と、
    前記文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、前記テキスト領域以外の領域とを認識する領域認識手段と、
    前記領域認識手段により認識された前記テキスト領域に含まれるテキストデータを取得するテキストデータ取得手段と、
    前記情報処理装置から文書画像データの提供を要求された際、前記文書画像入力手段により入力された文書画像データから生成された低解像度の文書画像データと、前記テキストデータ取得手段により取得されたテキストデータと、を前記情報処理装置へ提供する提供手段と、を有し、
    前記情報処理装置は、
    前記画像処理装置から、前記低解像度の文書画像データと、認識された前記テキスト領域に含まれる前記テキストデータと、を取得する取得手段と、
    前記低解像度の文書画像データから前記低解像度の文書画像データを構成する文書画像要素を選択する文書画像要素選択手段と、
    前記文書画像要素選択手段により選択された前記文書画像要素の要素データがテキストデータのとき、前記取得手段により取得された前記テキストデータにおいて前記要素データと対応したテキストデータを表示手段に表示させる表示制御手段と、を有することを特徴とする文書画像データ提供システム。
  9. 文書画像データを情報処理装置へ提供する文書画像データ提供装置による文書画像データ提供方法であって、
    文書画像データを入力する文書画像入力手順と、
    前記文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、前記テキスト領域以外の領域とを認識する領域認識手順と、
    前記領域認識手順により認識された前記テキスト領域に含まれるテキストデータを取得するテキストデータ取得手順と、
    前記情報処理装置から文書画像データの提供を要求された際、前記文書画像入力手順で入力された文書画像データから生成された低解像度の文書画像データと、前記テキストデータ取得手順により取得されたテキストデータと、を前記情報処理装置へ提供する提供手順と、を有することを特徴とする文書画像データ提供方法。
  10. 文書画像データを情報処理装置へ提供する文書画像データ提供装置において実行される文書画像データ提供プログラムであって、
    前記文書画像データ提供装置は演算処理装置と記憶装置とを有し、
    前記演算処理装置に、
    文書画像データを入力する文書画像入力ステップと、
    前記文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、前記テキスト領域以外の領域とを認識する領域認識ステップと、
    前記領域認識ステップにより認識された前記テキスト領域に含まれるテキストデータを取得するテキストデータ取得ステップと、
    前記情報処理装置から文書画像データの提供を要求された際、前記文書画像入力ステップで入力された文書画像データから生成された低解像度の文書画像データと、前記テキストデータ取得ステップにより取得されたテキストデータと、を前記情報処理装置へ提供する提供ステップと、を実行させることを特徴とする文書画像データ提供プログラム。
  11. 文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、テキスト領域以外の領域とを認識する文書画像データ提供装置と接続された情報処理装置による情報処理方法であって、
    前記文書画像データ提供装置から、前記文書画像データと、認識された前記テキスト領域に含まれる前記テキストデータと、を取得する取得手順と、
    前記文書画像データから前記文書画像データを構成する文書画像要素を選択する文書画像要素選択手順と、
    前記文書画像要素選択手順により選択された前記文書画像要素の要素データがテキストデータのとき、前記取得手順により取得された前記テキストデータにおいて前記要素データと対応したテキストデータを表示手段に表示させる表示制御手順と、を有することを特徴とする情報処理方法。
  12. 文書画像データを構成する文書画像要素の領域のうち、テキストデータが含まれるテキスト領域と、テキスト領域以外の領域とを認識する文書画像データ提供装置と接続された情報処理装置において実行される情報処理プログラムであって、
    前記情報処理装置は演算処理装置と記憶装置とを有し、
    前記演算処理装置に、
    前記文書画像データ提供装置から、前記文書画像データと、認識された前記テキスト領域に含まれる前記テキストデータと、を取得する取得ステップと、
    前記文書画像データから前記文書画像データを構成する文書画像要素を選択する文書画像要素選択ステップと、
    前記文書画像要素選択ステップにより選択された前記文書画像要素の要素データがテキストデータのとき、前記取得ステップにより取得された前記テキストデータにおいて前記要素データと対応したテキストデータを表示手段に表示させる表示制御ステップと、を実行させることを特徴とする情報処理プログラム。
JP2008209289A 2007-09-18 2008-08-15 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム Pending JP2009093627A (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2008209289A JP2009093627A (ja) 2007-09-18 2008-08-15 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム
US12/209,369 US8194982B2 (en) 2007-09-18 2008-09-12 Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
CN2008102131473A CN101393564B (zh) 2007-09-18 2008-09-18 文档图像数据提供系统、装置和方法,及信息处理装置和方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007241585 2007-09-18
JP2008209289A JP2009093627A (ja) 2007-09-18 2008-08-15 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム

Publications (1)

Publication Number Publication Date
JP2009093627A true JP2009093627A (ja) 2009-04-30

Family

ID=40493857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008209289A Pending JP2009093627A (ja) 2007-09-18 2008-08-15 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム

Country Status (2)

Country Link
JP (1) JP2009093627A (ja)
CN (1) CN101393564B (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102663035B (zh) * 2012-03-27 2015-06-17 北京慧眼智行科技有限公司 文件预览实现方法和装置
JP5720811B1 (ja) * 2014-01-30 2015-05-20 富士ゼロックス株式会社 文書管理システム、文書管理装置、および、プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000306103A (ja) * 1999-04-26 2000-11-02 Canon Inc 情報処理装置及び方法
JP2007025814A (ja) * 2005-07-12 2007-02-01 Canon Inc 画像処理装置、画像処理方法及びコンピュータプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4350414B2 (ja) * 2003-04-30 2009-10-21 キヤノン株式会社 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
JP4671885B2 (ja) * 2005-06-01 2011-04-20 株式会社リコー 画像処理装置、プログラムおよび画像処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000306103A (ja) * 1999-04-26 2000-11-02 Canon Inc 情報処理装置及び方法
JP2007025814A (ja) * 2005-07-12 2007-02-01 Canon Inc 画像処理装置、画像処理方法及びコンピュータプログラム

Also Published As

Publication number Publication date
CN101393564A (zh) 2009-03-25
CN101393564B (zh) 2011-12-07

Similar Documents

Publication Publication Date Title
US8203748B2 (en) Image processing apparatus, control method therefor, and program
JP4455357B2 (ja) 情報処理装置及び情報処理方法
US8326090B2 (en) Search apparatus and search method
US8244035B2 (en) Image processing apparatus and control method thereof
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP4766661B2 (ja) 画像処理方法及び画像処理装置
JP4966077B2 (ja) 画像処理装置及びその制御方法
JP2010020468A (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
JP4208780B2 (ja) 画像処理システム及び画像処理装置の制御方法並びにプログラム
JP5061151B2 (ja) オブジェクト取得装置、オブジェクト管理システム、オブジェクト管理方法
US8144988B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
US20070133873A1 (en) Document management method and apparatus
US20050237573A1 (en) Image processing apparatus and method
JP2009271792A (ja) 画像処理装置およびその制御方法
US8355577B2 (en) Image processing apparatus and method
JP4960796B2 (ja) 画像処理装置、画像処理方法ならびにそのプログラム及び記憶媒体
US8194982B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP2004214991A (ja) 文書画像データ管理システム、文書画像データ管理プログラム、文書画像データ管理装置及び文書画像データ管理方法
JP2009093627A (ja) 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム
JP4179977B2 (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP2007325196A (ja) 文書管理装置および文書管理方法
JP2011053901A (ja) 文書画像データ提供装置、文書画像データ提供システム、文書画像データ提供方法、文書画像データ提供プログラム、背景処理プログラム
JP2009080798A (ja) 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム
JP2011124662A (ja) 画像処理装置、画像処理方法、コンピュータプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110602

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120723

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120904