JP2007041709A - 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 - Google Patents

文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 Download PDF

Info

Publication number
JP2007041709A
JP2007041709A JP2005223187A JP2005223187A JP2007041709A JP 2007041709 A JP2007041709 A JP 2007041709A JP 2005223187 A JP2005223187 A JP 2005223187A JP 2005223187 A JP2005223187 A JP 2005223187A JP 2007041709 A JP2007041709 A JP 2007041709A
Authority
JP
Japan
Prior art keywords
document
reading
image data
image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005223187A
Other languages
English (en)
Inventor
Tomoshi Yoshida
知史 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005223187A priority Critical patent/JP2007041709A/ja
Publication of JP2007041709A publication Critical patent/JP2007041709A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】 文書蓄積に適したカラー画像に対してOCR処理をすると認識精度が悪くなることがあった。また、異なる処理を行わせるために、その都度、ユーザがスキャン条件を設定し直して読取り処理を行わせるのは、ユーザの大きな負荷になってしまっていた。
【解決手段】 本発明では、文書を読み取って得た生の画像データから、当該文書の種類を保存するのに適した第1の画像データ(S8)と、当該文書を文字認識するのに適した第2の画像データ(S9)とを生成するように構成した。また、2次元バーコードなどの識別子に応じて、文書の種類に対応する画像データを生成できるようにした(S6,S7)。
【選択図】 図4

Description

本発明は、帳票等の原稿を電子データとして蓄積・保管する技術に関するものである。
これまで紙として保管することが義務づけられた請求書、領収書等の帳票原稿を、法令等によって電子化して保存・保管することが可能になってきている。従って、今後、紙文書から電子化文書への変換時の真正性(紙文書からスキャンされた文書で、画像情報に改竄等がないこと示す)を画像情報で視覚的に表現し、人的に目視で確認するため、カラー画像による電子化文書保存が今後必須要件となりうる。
一方、保管されている電子化データの検索、閲覧を可能とするために、インデックス情報を生成し、そのインデックスと関連付けて当該電子データを保管・保存することが必要になる。インデックス情報を生成する方法としては、その読取った原稿画像をOCR処理して抽出することが知られている(特許文献1)。
また、原稿を電子データとして保存する場合、その原稿が推奨する読取りモード(読取り解像度や、階調数等)で読取り、電子化することが望ましい(特許文献2)。これには、この読取りモードの設定手法の一つとして、例えば、原稿に記載されたバーコードとマーク欄のマークとに基づいて、スキャナの読取モードを選択すること(読み取り解像度の選択や、両面/片面の選択など)が記載されている。
特開平08−202731号公報 特開平05−328065号公報
前述したように、紙文書から電子化文書への変換時の真正性が確認できるような画像を生成する際は、修正液や消しゴム等で修正した形跡などを残し、その形跡の有無をユーザが判別しやすい画像を生成することが望まれる。そのためには、スキャナのセンサで読み取った信号(生データ)に対して、ノイズ除去などを行わないようにして、原稿に忠実なカラー画像(修正痕の有無を判別しやすいカラー画像)を生成することが望まれる。また、原稿の種類によっては、色を濃い目に調整したカラー画像を生成することが望まれることがある(例えば、薄い色の背景を見やすくするような場合など)。しかしながら、このようにして生成されたカラー画像を2値化してOCR処理した場合、該2値化して得た画像には結果的にノイズが多くなってしまうので、ノイズの影響を受けるなどして認識精度が悪くなってしまう。
本発明はかかる問題点に鑑みなされたものであり、原稿の読み取りから保存までの処理を自動化し、また、原稿読み取りに係る設定作業等のユーザ負担を軽減させる技術を提供しようとするものである。
また、本発明では、文書保存に適したカラー画像(修正痕等を判別しやすいカラー画像)を2値化するのではなく、スキャナで読み取った信号(生データ)から直接、OCR処理に適した2値画像を生成する。
かかる課題を解決するため、例えば、本発明の文書処理システムは以下の構成を備える。すなわち、
文書を読み取る読取手段と、
前記読取手段で文書を読み取って得た生の画像データから、当該文書の種類を保存するのに適した第1の画像データと、当該文書を文字認識するのに適した第2の画像データとを生成する生成手段とを有する。
本発明によれば、スキャナ等で読み取った生の画像データから直接、文書蓄積に適した画像データと、文字認識に適した画像データとを生成できるようにしたので、文字認識精度があがるとともに、電子文書法等に適応した画像データも作成することができる。
また、本発明によれば、蓄積対象となる原稿の種類に応じた原稿読み取りモードを設定操作をしなくても、一度のスキャン操作で複数種類の読み取りモードで読取った画像を生成することが可能となり、操作環境を簡略化させ、一連の処理をスムーズに実行できる。
以下、添付図面に従って本発明に係る実施形態を詳細に説明する。
図1は実施形態におけるシステム構成図である。図中、1は原稿を読取るスキャナ装置であり、2はスキャナ装置1を接続し、スキャナ装置1のドライバ、原稿画像の登録に関するアプリケーションプログラムがインストールされた文書入力装置である。3は大容量の記憶装置を有し、電子化された文書を保存し、ネットワークからの要求に応じて検索処理する文書管理サーバである。4は文書管理サーバ3に対する検索要求を行ない、その検索結果を表示出力する文書検索端末装置である。
なお、文書入力装置2、文書管理サーバ3、及び、文書検索端末装置4は、ハードウェア的にはパーソナルコンピュータ(PC)で構築されているものとする。ただし、文書入力装置2については、以下に説明する機能を実現できれば良く、例えばスキャナを搭載した複合機でもって構成しても構わない。
図2は文書入力装置2がPCで構成されている場合のブロック構成図である。図中、101は装置全体の制御を司るCPUであり、102はBIOSやブートプログラムを格納しているROMである。103はCPU101のワークエリアとして使用されるRAMである。CPU101は、OSやスキャナドライバ、ネットワークドライバ、実施形態における文書入力アプリケーションプログラム等の各種ソフトウェアを、このRAM103にロードし、実行することで、文書入力装置として機能することになる。104はハードディスク装置(HDD)であり、OSや各種ソフトウェア(実施形態における文書入力アプリケーションを含む)や、フォーム辞書(詳細後述)が格納されている。
105はキーボード(KB)やマウス等のポインティングデバイス(PD)であり、ユーザインターフェースの一部として機能する。106は表示制御部であり、CPU101の制御下で、内蔵のビデオメモリ(不図示)への描画処理、及び、ビデオメモリからイメージデータを読出し、映像信号として出力する。107は表示制御部106からの映像信号を入力し、表示する表示装置であって、一般にはCRT、液晶表示器である。108はスキャナ1と通信するためのスキャナインターフェース(I/F)であり、一般的には、SCSIインターフェース、USBインターフェース等である。109はネットワークとの通信を行うネットワークI/Fである。
上記構成において、本文書入力装置2に電源を投入すると、CPU101はROM102のブートプログラムを実行し、HDD104からOSをRAM103にロードする。そして、実施形態における文書入力アプリケーションを、HDD104からRAM103にロードし実行することで、本装置が本文書入力装置2として機能することになる。
なお、文書検索端末装置4における検索は、通常の文書検索と実質的に同じであるので、その説明は省略する。
図3は実施形態における文書入力装置2を中心とする、原稿画像の入力から文書管理サーバ4への登録に係るデータの流れを示している。また、図4は文書入力装置2上で実行する文書入力アプリケーションとスキャナ装置とによってなされる処理手順を示すフローチャートである。以下、図3を参照にしながら、図4のフローチャートの処理を説明する。
操作者は原稿をスキャナ装置1にセットし、本文書入力アプリケーションを起動する。そして、操作者が文書入力の開始指示をポインティングデバイス等で指示すると、ステップS1にて帳票読み取りモードをスキャナ装置1にセットする。この帳票読み取りモードとは、実施形態における文書管理サーバに登録する全帳票の種類における、それぞれの推奨解像度の最大解像度であり、多値カラー画像として読取るものである。例えば、扱う帳票の種類が3種類存在し、それぞれの読取り解像度が300dpi、400dpi、600dpiであった場合には、600dpiで読取るようにする。この帳票読み取りモードにおける解像度は、本アプリケーションの設定画面で設定・登録するものとする。以下の説明での帳票読み取りモードでの読取り解像度は600dpiとして説明を続ける。
次いで、ステップS2に進んで、スキャン開始コマンドを、スキャナ装置1に発行し、原稿画像の読み取りを開始させる。この結果、スキャナ装置1からは設定した条件に従って原稿画像データ(画像処理を行っていない生データ)が転送されてくるので、ステップS3でそれを受信し、RAM103に一時的に格納する。
次いで、ステップS4に進んで、RAM103に格納された原稿画像データから、2次元バーコードが抽出できたか否か(2次元バーコードがあるか否か)を判定する。画像から2次元バーコードを抽出する処理は、既に多くの技術が知られているので、その詳細な説明は省略する。また本実施形態では2次元バーコードを用いることとしたが、その他の識別子であっても構わない。
2次元バーコードが存在しないと判定した場合には、ステップS5で文書管理サーバ3に登録すべき原稿ではないとして、エラー表示し、本処理を終える。
一方、2次元バーコードが存在すると判定した場合には、ステップS6において、その2次元バーコードを解析し、それに格納された情報を抽出する。実施形態では、2次元バーコードには、帳票の種類を識別するためのフォームID情報、帳票を読取る際のスキャナモード情報(解像度、モノクロ/カラー、多値/2値、濃度調整など)、登録する際のフォーマット情報(構造化文書にするか否かを示す情報)が含まれているものとする。なお、スキャナモード情報は、例えば、各帳票に対応する電子文書法などの法律に適用したモードである。
ステップS7では、解析した結果からスキャナモード情報を取得し、ステップS8にて、RAM103に一時的に格納された原稿画像データから、取得したスキャナモードで読取ったのと同じ条件の画像を生成し、それをHDD104に格納する。例えば、2次元バーコードを解析して得られたスキャナモードが「300dpi、多値カラー画像、背景のノイズ除去無し」を示す場合には、RAMに格納された生の画像データを間引き処理し、背景に存在するノイズの除去は行わずに生成する。
なお、スキャナモードに従って生成した画像データをHDD104に格納するとしたが、RAM103が十分な容量があれば、格納先はRAM103でも構わない。
次いで、ステップS9に進み、先のステップS3の処理で格納した生のカラー画像データからOCR処理に適した画像を生成する。OCR処理用の画像データとしては、例えば、300dpi、モノクロ2値、背景ノイズ除去有り、程度で十分であるが、背景画像がノイズにならないように且つ文字画像が鮮明になるように画像処置を適用する。このOCR処理用の画像データについても、文書入力アプリケーションにおける環境設定にて設定登録しておくものとする。ただし、OCR用の解像度は、帳票読み取りモードにおける解像度より高くはできない。また、余り解像度を高くすると、OCR処理にかかる時間が増えてしまい、効率が良いとは言えない。例えば、上述したように300dpiで十分であろう。
次に、ステップS10において、2次元バーコードから抽出したフォーマット情報に基づき、原稿画像を構造化文書(例えばXML文書)にするか否かを判断する。
構造化文書にしないと判断した場合には、ステップS11に進み、2次元バーコードからフォームID(帳票を特定する情報)を抽出する。そして、ステップS12にて、そのフォームIDをキーにして、HDD104に予め格納されたフォーム辞書を検索する。このフォーム辞書は、フォームIDと、そのフォーム上のOCR処理するべき矩形領域(座標位置情報と水平、垂直方向のサイズ)が格納されている。また、1つのフォームに対する矩形領域は1つとは限らず、複数存在し得る。この結果、注目原稿中のOCRすべきエリアが決定できる。次にステップS13において、先のステップS9で生成したOCR用の画像中から該当する各エリア内の文字認識を行ない、各エリア毎の文字認識して得られた文字列(文字コード群)を抽出する。
次いで、ステップS14において、OCR処理して得られた各エリアの文字列(インデックス情報となる)、ステップS8で保存したスキャナモード用の画像データ、及び、登録要求コマンドを文書管理サーバ3に送信し、登録させる。各エリア内の文字列は、各エリアに対応するインデックス情報(属性情報)として登録されることになる。
一方、ステップS10にて、構造化文書とすることを決定した場合には、ステップS15に進む。ステップS15では、先のステップS9で生成されたOCR用画像の全域についてOCR処理を行う。
次にステップS16にて、ステップS8で一時保存した、スキャナモード用のカラー画像からイメージ部分を抽出し、またイメージ部とテキスト部との構造を解析して、構造化文書を作成する。構造化文書は、イメージ部とテキスト部とで構成され、そのイメージ部には、スキャナモード用のカラー画像から抽出したイメージを挿入する。
次いで、ステップS17にて、ステップS16で作成した構造化文書のテキスト部に、先のステップS15で得られた全文OCRによるテキストデータを挿入する。
この結果、画像データ、及び、その全文OCRして得られたテキストで構成される1つの構造化文書が出来上る。従って、別途インデックスを文書管理サーバ3に保存しなくても、構造化文書のテキスト部を参照することで、文書検索端末装置4から検索が可能になる。
ステップS18では、上記のようにして作成された構造化文書ファイルを、登録要求コマンドと共に、文書管理サーバ3に送信し、登録を行わせる。
以上説明したように本実施形態によれば、原稿(帳票)の種類に限らず、1回の原稿読み取りでもって、しかも、その読取に際しては格別な知識がなくても、その原稿の意図したスキャナモードの画像データを文書管理サーバ3に登録することが可能になる。また、検索する際に用いるキーワードとなるテキストについては、OCR処理に適した画像を内部的に生成した上でOCR処理を行うので、十分な認識精度で、且つ、効率良くOCR処理が行える。また、所定の帳票の場合には、全文が検索対象として登録されるので、様々なキーワードでもって検索することが可能となり、OCR処理による誤認識の影響も少なくできる。
なお、実施形態では、図1の構成のように、文書入力装置2とスキャナ1がケーブル接続された形態で説明した。しかしながら、本発明はこの構成に限るものではなく、文書入力装置とスキャナとが一体型の装置(例えばコピーなどが可能な複合機など)において実現するようにしても構わない。
また、上述した実施形態では、スキャナから送信されてきた生の画像データから、電子文書法などの法律の条件を満たすようにして文書保存に適したカラー画像と、OCRに適した画像とを、文書入力装置において生成することとした。しかしながら、これに限るものではなく、スキャナ装置において、2次元バーコードを解析して、文書保存に適したカラー画像とOCRに適した画像とを生成した後、各画像を文書入力装置に送信するようにしてもよい。
また、文書入力装置、文書管理サーバ、文書検索端末装置は、同一の情報処理装置で実現しても構わない。
また、実施形態の主要部分は上記の通り文書入力装置にあり、文書入力アプリケーションプログラムによるものであることも説明した。すなわち、本発明は、コンピュータプログラムでもって実現できるものである。また、通常、アプリケーションプログラムでCD−ROM等のコンピュータ可読記憶媒体に格納されていて、その記憶媒体をコンピュータにセットして、システムにコピーもしくはインストールすることで実行可能になる。従って、かかるコンピュータ可読記憶媒体も本発明の範疇に入るのは明らかである。
実施形態におけるシステム構成図である。 実施形態における文書入力装置のブロック構成図である。 実施形態における文書入力装置を中心とする処理の概要を示す図である。 実施形態における文書入力装置の処理手順を示すフローチャートである。

Claims (18)

  1. 文書を読み取る読取手段と、
    前記読取手段で文書を読み取って得た生の画像データから、当該文書の種類を保存するのに適した第1の画像データと、当該文書を文字認識するのに適した第2の画像データとを生成する生成手段と、
    を有することを特徴とする文書処理システム。
  2. 前記生成手段は、前記文書の画像データに含まれる識別子に基づいて、前記文書の種類に対応する前記第1の画像データを生成することを特徴とする請求項1に記載の文書処理システム。
  3. 前記生成手段で生成された第2の画像データを用いて、文字認識処理を実行する文字認識手段と、
    前記第1の画像データと前記文字認識処理手段による文字認識結果とに基づいて、当該文書の電子データを蓄積手段に保存するように制御する保存手段と、
    を備えることを特徴とする請求項1または2のいずれかに記載の文書処理システム。
  4. 前記読取手段を備える読取り装置と、
    前記生成手段と前記文字認識手段と前記保存手段とを備える文書処理装置とによって構成されることを特徴とする請求項3に記載の文書処理システム。
  5. 前記読取手段と前記生成手段とを備える読取り装置と、
    前記文字認識手段と前記保存手段とを備える文書処理装置とによって構成されることを特徴とする請求項3に記載の文書処理システム。
  6. 前記保存手段は、前記第1の画像データと前記文字認識処理手段による文字認識結果とに基づいて、当該文書の構造化電子データを生成して前記蓄積手段に保存するように制御することを特徴とする請求項3に記載の文書処理システム。
  7. 前記保存手段は、前記文字認識処理手段による文字認識結果を属性情報として、前記第1の画像データとともに前記蓄積手段に保存するように制御することを特徴とする請求項3に記載の文書処理システム。
  8. 文書を読み取る読取手段を有する文書処理システムを制御するための制御方法であって、
    前記読取手段で文書を読み取って得た生の画像データから、当該文書の種類を保存するのに適した第1の画像データと、当該文書を文字認識するのに適した第2の画像データとを生成する生成工程を有することを特徴とする文書処理システムの制御方法。
  9. 文書を読み取る読取手段を有する文書処理システムを制御するためのコンピュータ実行可能なコンピュータプログラムであって、
    前記読取手段で文書を読み取って得た生の画像データから、当該文書の種類を保存するのに適した第1の画像データと、当該文書を文字認識するのに適した第2の画像データとを生成する生成工程をコンピュータに実行させるためのプログラムコードを含むことを特徴とするコンピュータプログラム。
  10. 請求項9に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
  11. 原稿をカラー画像として読取る読取り手段を備え、当該読取り手段で読取った原稿画像を所定の蓄積装置に蓄積する文書処理装置であって、
    蓄積すべき原稿の種類毎の読取りモードを包含する読み取りモードを設定し、前記読取り手段で原稿を読取る読取り制御手段と、
    該読取り制御手段で読取って得られたカラー原稿画像データ中の2次元バーコードを解析する解析手段と、
    該解析手段の解析結果から、原稿の読み取りモード情報を抽出する読取りモード抽出手段と、
    該読取りモード抽出手段で抽出された読取りモード情報に対応する画像データを、前記読取り制御手段で読取った原稿画像データから生成する画像生成手段と、
    該画像生成手段で生成された画像データを前記蓄積装置に保存する保存手段と
    を備えることを特徴とする文書処理装置。
  12. 更に、前記読取り制御手段で得られたカラー原稿画像データから、所定解像度のモノクロ2値画像を生成する2値画像生成手段と、
    該2値画像生成手段で生成された2値画像データに対して文字認識を行う文字認識手段とを備え、
    前記保存手段は、前記文字認識手段で認識された文字列を、前記画像生成手段で生成された画像データと対応づけて保存することを特徴とする請求項11に記載の文書処理装置。
  13. 更に、原稿の種類毎に、文字認識すべき領域情報を記憶する記憶手段と、
    前記解析手段の解析結果から、構造化文書として登録するか否かを示す情報を抽出する登録様式情報抽出手段と、
    前記解析手段の解析結果から、原稿の種類を特定する情報を抽出する原稿種類情報抽出手段とを備え、
    前記文字認識手段は、
    前記登録様式情報抽出手段により構造化文書として登録する情報が抽出された場合、前記2値画像生成手段で生成された2値画像全域について文字認識し、
    非構造化文書を示す情報が抽出された場合には、原稿種類情報抽出手段で得られた原稿種別情報で示される文字認識すべき領域情報を前記記憶手段から取得し、取得した領域情報内について文字認識する
    ことを特徴とする請求項12に記載の文書処理装置。
  14. 前記蓄積手段は、ネットワーク上の文書画像を蓄積管理するサーバであることを特徴とする請求項11に記載の文書処理装置。
  15. 原稿をカラー画像として読取る読取り手段を備え、当該読取り手段で読取った原稿画像を所定の蓄積装置に蓄積する文書処理装置の制御方法であって、
    蓄積すべき原稿の種類毎の読取りモードを包含する読み取りモードを設定し、前記読取り手段で原稿を読取る読取り制御工程と、
    該読取り制御工程で読取って得られたカラー原稿画像データ中の2次元バーコードを解析する解析工程と、
    該解析工程の解析結果から、原稿の読み取りモード情報を抽出する読取りモード抽出工程と、
    該読取りモード抽出工程で抽出された読取りモード情報に対応する画像データを、前記読取り制御工程で読取った原稿画像データから生成する画像生成工程と、
    該画像生成工程で生成された画像データを前記蓄積装置に保存する保存工程と
    を備えることを特徴とする文書処理装置の制御方法。
  16. 原稿をカラー画像として読取る読取り手段を備え、当該読取り手段で読取った原稿画像を所定の蓄積装置に蓄積する文書処理装置として機能させるためのコンピュータプログラムであって、
    蓄積すべき原稿の種類毎の読取りモードを包含する読み取りモードを設定し、前記読取り手段で原稿を読取る読取り制御手段と、
    該読取り制御手段で読取って得られたカラー原稿画像データ中の2次元バーコードを解析する解析手段と、
    該解析手段の解析結果から、原稿の読み取りモード情報を抽出する読取りモード抽出手段と、
    該読取りモード抽出手段で抽出された読取りモード情報に対応する画像データを、前記読取り制御手段で読取った原稿画像データから生成する画像生成手段と、
    該画像生成手段で生成された画像データを前記蓄積装置に保存する保存手段
    として機能させるためのプログラムコードを含むことを特徴とするコンピュータプログラム。
  17. 請求項16に記載のコンピュータプログラムを格納したことを特徴とするコンピュータ可読記憶媒体。
  18. スキャナ装置と、文書画像蓄積サーバと、前記スキャナ装置で読取った原稿画像を前記文書画像蓄積サーバに送信する文書入力装置とで構成される文書処理システムであって、
    蓄積すべき原稿の種類毎の読取りモードを包含する読み取りモードを設定し、前記スキャナ装置を制御し、原稿を読取る読取り制御手段と、
    該読取り制御手段で読取って得られたカラー原稿画像データ中の2次元バーコードを解析する解析手段と、
    該解析手段の解析結果から、原稿の読み取りモード情報を抽出する読取りモード抽出手段と、
    該読取りモード抽出手段で抽出された読取りモード情報に対応する画像データを、前記読取り制御手段で読取った原稿画像データから生成する画像生成手段と、
    該画像生成手段で生成された画像データを、前記文書画像蓄積サーバに蓄積させるために送信する送信手段と
    を備えることを特徴とする文書処理システム。
JP2005223187A 2005-08-01 2005-08-01 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 Withdrawn JP2007041709A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005223187A JP2007041709A (ja) 2005-08-01 2005-08-01 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005223187A JP2007041709A (ja) 2005-08-01 2005-08-01 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Publications (1)

Publication Number Publication Date
JP2007041709A true JP2007041709A (ja) 2007-02-15

Family

ID=37799650

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005223187A Withdrawn JP2007041709A (ja) 2005-08-01 2005-08-01 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体

Country Status (1)

Country Link
JP (1) JP2007041709A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008312133A (ja) * 2007-06-18 2008-12-25 Ricoh Co Ltd 画像データ生成装置、画像データ生成方法及び画像データ生成プログラム
CN102375981A (zh) * 2010-08-12 2012-03-14 富士施乐株式会社 图像处理装置
US8339623B2 (en) 2008-02-29 2012-12-25 Fuji Xerox Co., Ltd. Paper document processing apparatus, paper document processing method, and computer readable medium
KR101470961B1 (ko) * 2007-06-06 2014-12-10 파나소닉 주식회사 재생장치, 기록방법
JP2018190240A (ja) * 2017-05-09 2018-11-29 富士ゼロックス株式会社 情報処理装置、情報処理システム及びプログラム
CN111507236A (zh) * 2020-04-13 2020-08-07 上海朗曦信息技术有限公司 文件处理方法、系统、装置及介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101470961B1 (ko) * 2007-06-06 2014-12-10 파나소닉 주식회사 재생장치, 기록방법
JP2008312133A (ja) * 2007-06-18 2008-12-25 Ricoh Co Ltd 画像データ生成装置、画像データ生成方法及び画像データ生成プログラム
US8724165B2 (en) 2007-06-18 2014-05-13 Ricoh Company, Ltd. Image data generating device, image data generating method, and computer-readable storage medium for generating monochrome image data and color image data
US8339623B2 (en) 2008-02-29 2012-12-25 Fuji Xerox Co., Ltd. Paper document processing apparatus, paper document processing method, and computer readable medium
CN102375981A (zh) * 2010-08-12 2012-03-14 富士施乐株式会社 图像处理装置
CN102375981B (zh) * 2010-08-12 2015-09-09 富士施乐株式会社 图像处理装置
JP2018190240A (ja) * 2017-05-09 2018-11-29 富士ゼロックス株式会社 情報処理装置、情報処理システム及びプログラム
CN111507236A (zh) * 2020-04-13 2020-08-07 上海朗曦信息技术有限公司 文件处理方法、系统、装置及介质
CN111507236B (zh) * 2020-04-13 2023-05-12 上海朗曦信息技术有限公司 文件处理方法、系统、装置及介质

Similar Documents

Publication Publication Date Title
JP7013182B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP4926004B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
US7640269B2 (en) Image processing system and image processing method
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP2007042106A (ja) 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム
US8412705B2 (en) Image processing apparatus, image processing method, and computer-readable storage medium
CN101178725A (zh) 用于信息检索的设备、方法和计算机程序产品
US20060285748A1 (en) Document processing device
JP2008052372A (ja) 画像処理装置、手書き情報認識方法、手書き情報認識プログラム
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
US8073256B2 (en) Image processing apparatus and method therefor
US8144988B2 (en) Document-image-data providing system, document-image-data providing device, information processing device, document-image-data providing method, information processing method, document-image-data providing program, and information processing program
JP2007041709A (ja) 文書処理システム、文書処理システムの制御方法、文書処理装置、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
US20150304510A1 (en) Electronic document generation system and recording medium
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP4811133B2 (ja) 画像形成装置及び画像処理装置
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
CN108875570B (zh) 信息处理装置、存储介质和信息处理方法
JP2017072941A (ja) 文書振り分けシステム、情報処理方法及びプログラム
JP2009026075A (ja) 画像処理装置
JP2007066286A6 (ja) 画像検索装置、画像処理装置、及びそれらの方法
JP2007066286A (ja) 画像検索装置、画像処理装置、及びそれらの方法
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP4823049B2 (ja) 文書画像検索装置及びプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081007