JP2005275849A - 文書処理装置および文書処理方法 - Google Patents

文書処理装置および文書処理方法 Download PDF

Info

Publication number
JP2005275849A
JP2005275849A JP2004088596A JP2004088596A JP2005275849A JP 2005275849 A JP2005275849 A JP 2005275849A JP 2004088596 A JP2004088596 A JP 2004088596A JP 2004088596 A JP2004088596 A JP 2004088596A JP 2005275849 A JP2005275849 A JP 2005275849A
Authority
JP
Japan
Prior art keywords
image data
character string
document
file name
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004088596A
Other languages
English (en)
Inventor
Noriko Matsuzawa
紀子 松澤
Atsushi Kashioka
敦之 柏岡
Tomoshi Yoshida
知史 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2004088596A priority Critical patent/JP2005275849A/ja
Publication of JP2005275849A publication Critical patent/JP2005275849A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 文書登録処理を容易にする。
【解決手段】 複合機は、ネットワークを介して電子倉庫サーバ、クライアントPCやWEBサービスサーバ等に接続可能であり、クライアントPCにはコンピュータアプリケーションが搭載される。
複合機は、操作パネル(タッチパネル)をユーザが操作することによりユーザ所望の動作を設定するユーザ操作部を備え、ユーザ操作部においてユーザが設定した内容に応じて、画像データや文書を自動的に電子倉庫サーバ、クライアントPC、WEBサービスサーバ等に送信する。
クライアントPCは、公知の文書管理システムアプリケーションが搭載され、文書のデータベース化等を実行する。
Webサービスサーバは、公知のOCRサービス、OCR校正サービス、特徴語抽出サービス等の機能を有する。
【選択図】 図1

Description

本発明は、ドキュメントを電子化して登録管理するため文書処理装置および文書処理方法に関する。
近年、オフィス等で保有する文書のデータベース化のためのドキュメント・マネージメント・システム(DMS)等の文書処理装置が普及しており、様々なファイルサーバやドキュメント管理(データベース)サーバ、DMS機能を有する複合機や、スキャナデバイスとの連携や融合性を考慮した各クライアントPC(パーソナルコンピュータ)用コンピュータアプリケーションが提案されている。
DMS等においては、文書を読み取って電子化する際にファイル名を設定する必要があり、従来は(1)ユーザがファイル名をキー入力したり、(2)アプリケーションで作成したファイル名や、文書を読み取ったときの日付、連番や予め設定された固定文字列を用いてファイル名を自動生成したりすることによって、文書画像にファイル名を付与してデータベースに格納していた。(例えば、特許文献1)
特開平8−212331号公報
従来例はファイル名入力操作が煩雑であったり、ドキュメント内容と無関係なファイル名が付されてしまったりするために、操作性能や検索性能が低下する。
またクライアントPC用コンピュータアプリケーションを用いる場合、PC導入が不可欠であり、新たにPC管理業務が発生する。
さらに複合機を用いたシステムは、ファイル名編集操作を行う場合には、処理負荷が大となり、充分にマルチタスク機能を発揮できない。
本発明は、このような従来の問題点を解消すべく創案されたもので、文書登録処理を容易にすることを目的とする。
本発明によれば、文書登録処理が容易である。
本発明に係る文書処理装置は、画像データを取得する手段と、前記画像データから文字部分を抽出する抽出手段と、前記画像データを保存する保存手段と、前記抽出手段によって抽出された文字部分についてOCR処理を実行して、文字列を抽出するOCR処理手段と、前記OCR処理手段によって抽出された文字列を表示する表示手段と、前記表示手段によって表示された文字列から、画像データのファイル名に含める文字列を選択し得る選択手段と、前記選択手段によって選択された文字列に基いたファイル名を前記画像データに設定するファイル名設定手段とを備える。
これによって文書登録処理が容易になる。
本発明に係る文書処理装置は、画像データを取得する手段と、前記画像データから文字部分を抽出する抽出手段と、前記画像データを保存する保存手段と、前記抽出手段によって抽出された文字部分についてOCR処理を実行して、文字列を抽出するOCR処理手段と、前記OCR処理手段によって抽出された文字列を校正するOCR校正処理手段と、前記OCR校正処理手段によって校正された文字列を表示する表示手段と、前記表示手段によって表示された文字列から、画像データのファイル名に含める文字列を選択し得る選択手段と、前記選択手段によって選択された文字列に基いたファイル名を前記画像データに設定するファイル名設定手段とを備える。これによって、より正確な文書列抽出に基く文書登録処理が可能になる。
本発明に係る文書処理装置において、OCR処理手段は、ファイル名に適すると判断した文字列を抽出するものであってもよい。
本発明に係る文書処理装置において、前記ファイル名設定手段でファイル名が設定された画像データの格納先は、例えば、文書登録アプリケーションが搭載された汎用コンピュータである。
本発明に係る文書処理装置において、前記ファイル名設定手段でファイル名が設定された画像データの格納先は、例えば、電子倉庫サーバである。
本発明に係る文書処理装置において、前記表示手段は、例えば、前記画像データのプレビュー画像を表示するとともに、前記OCR処理手段で抽出された文字列に関する文字部分を前記プレビュー画像上で区別して表示する。
本発明に係る文書処理装置において、前記選択手段によって選択された文字列を表示するとともに、該文字列の編集を可能とする編集手段をさらに設けてもよい。
本発明に係る文書処理装置において、前記ファイル名に日付データを付加する手段をさらに設けてもよい。
本発明に係る文書処理装置において、前記OCR処理手段によって抽出された文字列から特徴語を抽出する特徴語抽出処理手段をさらに設けてもよい。
本発明に係る文書処理装置において、前記画像データを取得する手段、前記表示手段および前記選択手段を、ネットワークを介して前記OCR処理手段に接続してもよい。
本発明に係る文書処理方法は、画像データを取得するステップと、前記画像データから文字部分を抽出する抽出ステップと、前記画像データを保存する保存ステップと、前記抽出ステップで抽出された文字部分についてOCR処理を実行して、文字列を抽出するOCR処理ステップと、前記OCR処理手段によって抽出された文字列を表示する表示ステップと、前記表示手段によって表示された文字列から、画像データのファイル名に含める文字列を選択し得る選択ステップと、前記選択手段によって選択された文字列に基いたファイル名を前記画像データに設定するファイル名設定ステップとを備える。これによって文書登録処理が容易になる。
本発明に係る文書処理方法は、画像データを取得するステップと、前記画像データから文字部分を抽出する抽出ステップと、前記画像データを保存する保存ステップと、前記抽出ステップによって抽出された文字部分についてOCR処理を実行して、文字列を抽出するOCR処理ステップと、前記OCR処理ステップによって抽出された文字列を校正するOCR校正処理ステップと、前記OCR校正処理ステップによって校正された文字列を表示する表示ステップと、前記表示ステップによって表示された文字列から、画像データのファイル名に含める文字列を選択し得る選択ステップと、前記選択ステップによって選択された文字列に基いたファイル名を前記画像データに設定するファイル名設定ステップと、を備える。
次に本発明に係る文書処理装置および文書処理方法の好適な実施例を図面に基いて説明する。
[文書処理装置]
図1において、本発明に係る文書処理装置の実施例1が適用された複合機1000は、ネットワークINを介して電子倉庫サーバ2000、クライアントPC3000やWEBサービスサーバ4000等に接続可能であり、クライアントPCにはコンピュータアプリケーションが搭載される。ただし、実施例1は複合機1000で取得した画像データを、複合機1000においてOCR処理やファイル名付与処理を行って登録することを主眼とするものであり、ファイル名が付与された画像データを登録(送信)する登録先(送信先)を限定するものではない。
複合機1000は、操作パネル(タッチパネル)1200をユーザが操作することによりユーザ所望の動作を設定するユーザ操作部1000M(図6)と、ユーザ操作部においてユーザが設定した内容に応じて、画像データや文書を送信先(電子倉庫サーバ2000、クライアントPC3000、WEBサービスサーバ4000等)に送信するサーバ部1000S(図5)に分けられる。
クライアントPC3000は、公知の文書管理システムアプリケーションが搭載され、文書のデータベース化等を実行する。
Webサービスサーバ4000は、公知のOCRサービス4010、OCR校正サービス4020、特徴語抽出サービス4030等の機能を有する。
図2において、画像データ送信に際しては、複合機1000の操作パネル1200に送信設定画面が表示され、送信設定画面には、宛先一覧1201、文書名表示ボックス1020、文書名設定ボタン1203、送信ボタン1204および宛先スクロールボタン1205が設けられる。宛先一覧1201には1個または複数の宛先が表示され、宛先スクロールボタン1205を押すことにより宛先をスクロールし得る。ユーザは1個または複数の宛先を選択し得る。
文書名設定ボタン1203を押すと、図3の画面に移行し、送信する画像データの文書名を設定し得る。設定された文書名は文書名表示ボックス1020に表示される。
宛先を選択した後に送信ボタン1204を押すと、画像データはその宛先に送信される。
文書名設定ボタン1203が押されたときには、図3のようなプレビュー画像1206、編集ボタン1207、戻るボタン1208、エディットボックス1209および日付付加ボタン1210が表示される。
プレビュー画像1206には画像データをOCR処理することによって得られた文字が網掛け状に表示されるとともに、読み込んだ画像が表示される。ユーザは網掛け状の文字を選択でき、選択された文字はエディットボックス1209内に取り込まれる。図3では、「行事一覧」の文字列が取り込まれるとともに、その後に現在年月日時分秒(2002年12月16日11時57分30秒とする。)を示す「20021216115730」の文字が付加されている。年月日時分秒は日付付加ボタン1210をチェックすることによって自動的に付加される。
編集ボタン1207を押すと、公知のキーボード入力画面等が表示され、エディットボックス1209内の文字の編集が可能となる。「編集」は画像読み込み時の解像度や、OCR処理の精度に起因した誤認識の対策、あるいは文書名をユーザの好みに適合させる際等に有効である。
文書名を設定したときは、戻るボタン1208を押すことにより、図2の送信設定画面に戻る。このとき文書名表示ボックス1020にはエディットボックス1209内の文書名がそのまま表示される。
複合機1000のサーバ部1000Sは、CPU、HDDや各処理を行うための専用電子回路などで構成されるが、本実施形態の各処理構成を模式的に示すと、図5のように、サーバ部1000Sの各構成要素を制御するサーバメイン部1400、読取設定部1002、デバイス制御部1003、プロトコルインターフェース部1004、イメージ取得部1006、プレビュー作成部1007、ブロックセレクション部1008、OCR処理部1009、メール送信設定部1010、ログ管理部1011、ファックス自動転送設定部1012などで構成されるものとする。なお、本実施形態では、一部又は全部の構成を汎用CPUあるいは電子回路(ASIC等)で構成するものとするが、汎用CPUを用いる場合は、汎用CPUで処理実行するためのプログラムをROMやハードディスクなどの記憶媒体から読み込んで実行することになる。
イメージ取得部1006にはイメージ格納部1005が接続され、メール送信設定部1010、ログ管理部1011、ファックス自動転送設定部1012には情報管理部1013が接続されている。
図6に示すようなユーザ操作部1000Mは、サーバ部1000Sと連携して動作する。ユーザ操作部1000Mの各構成要素を制御するユーザインターフェースメイン部1300を備え、ユーザインターフェースメイン部1300には、CPU(図示省略)、HDD(図示省略)、プロトコルインターフェース部1004、イメージ取得部1006、画像処理部1009、メール送信設定部1010、ログ管理部1011、ファックス自動転送設定部1012、操作パネル1200、プリンタ1210、スキャナ1220が接続されている。なお、ユーザ操作部についても、一部又は全部の構成を汎用CPUあるいは電子回路(ASIC等)で構成するものとするが、汎用CPUを用いる場合は、汎用CPUで処理実行するためのプログラムをROMやハードディスクなどの記憶媒体から読み込んで実行することになる。また、サーバ部とユーザ操作部で使用されるCPUは同一のCPUを兼用して使用してもよいし、複数のCPUを用いるようにしても構わない。
読取設定部1002は、スキャナ1220により原稿画像読取の設定を行い、デバイス制御部1003はプリンタ1210、スキャナ1220等の機器を制御する。
プロトコルインターフェース部1004は、複合機1000から電子倉庫サーバ2000に画像データを格納する際の制御を実行する。
イメージ格納部1005は、スキャナ1220によってスキャンされた原稿画像を一旦格納する。
イメージ取得部1006は、イメージ格納部1005の画像に対する処理に際して、イメージ格納部1005内の画像を所定の構成要素転送する。
プレビュー作成部1007は、イメージ格納部1005に格納された画像を操作パネル1200に表示するための、プレビュー画像を生成する。
ブロックセレクション部1008は、イメージ格納部1005内の画像について、文章部分(本文やタイトルなどの文字部分)、画像部分等の領域分けを行い、各領域の座標情報をあわせて抽出する。
OCR処理部1009は、イメージ格納部1005の画像の文章部分について、OCR処理を実行する。
メール送信設定部1010は、複合機1000から電子倉庫サーバ2000、クライアントPC3000やWEBサービスサーバ4000などに画像データ等を送信する際に、宛先設定等を行う。
ログ管理部1011は、ファイル格納情報を情報管理部1013に保存し、管理する。
ファクス自動転送判定部1012は、ファクス受信した際の転送条件を取得する。
情報管理部1013は、ログ管理部1011によって管理されるファイル格納情報を格納する。
操作パネル1200は、図2、図3、図8、図10、図19、図20に示すように、複合機1000におけるGUIであり、処理対象画像や種々の情報、メッセージを表示する。
プリンタ1210は、スキャナ1220で読み取った画像や、ファックスで受信した画像を印刷する。
スキャナ1220は原稿画像を読取り、イメージ格納部1005に格納する。
スキャナ1220によって原稿画像をスキャンしたときには、イメージ取得部1006はプレビュー作成部1007に対して画像データ取得を通知し、プレビュー作成部1007はイメージ取得部1006より画像データを取得し、操作パネル1200に表示するためのプレビュー画像を作成するとともに、ユーザインターフェースメイン部1300に通知する。ユーザインターフェースメイン部1300は、プレビュー作成部107より受けたプレビュー画像を複合機1000のモニタ(操作パネル)1200上に表示する。
これにより、ユーザは送信(アップロード)すべき文書の確認でき、誤った原稿をスキャンした場合等、アップロードをキャンセルし得る。Webサービス/アプリケーションとして提供される電子倉庫サーバ2000などは、課金制となっている場合もあるため、ユーザにとって無駄な課金を抑えることができる。
ユーザインターフェースメイン部1300は、イメージ格納部1005における画像データ格納フォルダ名をイメージ取得部1006から取得する。画像スキャンに際しては、ユーザは読取設定部1002によってスキャン読取設定を行い、設定内容はアップロード先とともに、情報保存部1013に格納する。これにより、格納設定内容に示された設定内容が、どの画像データに対して行う処理であるのか管理できる。
ブロックセレクション部1008は、イメージ取得部1006からイメージ格納部1005内の画像データを受け取り、公知の手法により画像データ中の文章部分と写真部分とを領域抽出するとともに、各領域の座標位置をOCR処理部1009に通知する。
OCR処理部1009は、ブロックセレクション部1008によって文章部分の座標位置に基いて、文章領域をOCR処理し、名詞を抽出する。
ユーザインターフェースメイン部1300は、OCR処理部1009で抽出された名詞のリストを表示し、ユーザは名詞リスト中の名詞あるいはその組み合わせを、画像データのファイル名として設定し得る。画像データはそのファイル名によって電子倉庫サーバ2000に格納される。
画像データのファイル名は、スキャン読取設定、宛先(アップロード先)、イメージ格納部1005のフォルダ名とともに、格納設定内容として情報保存部1013に格納される。
ファクス自動転送設定部1012は、ユーザインターフェースメイン部1300の設定によって、複合機1000が受信したファクス画像を自動的に電子倉庫サーバ2000にアップロードし得る。
ファクス自動転送設定部1012は、送信元ファクス番号、複合機1000の1個または複数の受信ファクス番号、Fコード等のファクス情報に関する条件を設定でき、条件に合致したファクス情報を電子倉庫サーバ2000に自動転送する。ファクス自動転送設定部1012は、プロトコルインターフェース部1004を介して電子倉庫サーバ2000の格納場所を指定する。
ファクス自動転送設定によってファックス情報を電子倉庫サーバ2000に自動転送したときには、ユーザに自動転送したことを通知するよう設定することも可能である。このような設定内容は、ファクス転送設定内容として情報管理部113において保存される。
サーバメイン部1400は、格納該設定内容もしくはファクス自動転送内容に従い、画像データを電子倉庫サーバ2000に格納する際のフォーマットに変換し、電子倉庫サーバ2000に格納する。またサーバメイン部1400は、画像データを格納設定内容もしくはファクス自動転送内容に従って電子倉庫サーバ2000に格納した処理結果を、メールにてユーザに通知する。このとき、ログ管理部1011は、処理結果をログとして出力し、情報管理部113に保存する。
画像データの格納処理が完了したときは、画像データはイメージ格納部1005から削除されるが、格納処理に失敗した場合、画像データの保障のため、イメージ格納部1005に保存しておく。
[文書処理方法]
本発明に係る文書処理方法の実施例1を、複合機1000からクライアントPCの文書登録アプリケーションへの画像データ送信に適用した例を図面に基づいて説明する。
図4において、文書処理方法は以下の各ステップによって実行される。
ステップS401:まず、複合機1000のスキャナ1220によって、画像データを取得し、ステップS402に進む。
ステップS402:タッチパネル1200に、図2の送信設定画面を表示し、ステップS403に進む。
ステップS403:送信設定画面でユーザが宛先一覧1201の中から送信先を選択したとき、メール送信設定部1010によって宛先を設定し、ステップS404に進む。
ステップS404:ユーザが文書名設定ボタン1203を押したか否か判断する。文書名設定ボタン1203が押されたときはステップS405に進み、押されなかったときはステップS414にジャンプする。
ステップS405:ブロックセレクション部1008によって、ステップS401で取得した画像データについて、公知のブロックセレクション処理を実行し、ステップS406に進む。
ステップS406:ステップS405のブロックセレクション処理で取得した各領域について、OCR処理部1009によって公知のOCR処理を実行し、画像データに含まれる文字列を抽出する。
ステップS407:プレビュー作成部1007によって、ブロックセレクション処理およびOCR処理により取得した文字列を網掛けの状態にしたプレビューを作成し、タッチパネル1200にプレビュー画像1206に表示する。
ステップS408:ステップS407に続いて、プレビュー画像1206において、ユーザがプレビュー画像1206から文字列を選択したか否を判断する。文字列が選択されたときにはステップS409に進み、選択されなかったときにはステップS410にジャンプする。
ステップS409:エディットボックス1209に選択された文字列を表示し、ステップS410に進む。
ステップS410:ユーザが日付付加ボタン1210をチェックしたか否かを判断する。日付付加ボタン1210がチェックされたときはステップS411に進み、チェックされなかったときはステップS412にジャンプする。
ステップS411:エディットボックス1209内の文字列の末尾に現在年月日時分秒を示す文字を付加し、ステップS412に進む。
ステップS412:ユーザが編集ボタン1207を押したか否か判断する。編集ボタン1207が押されたときはステップS413に進み、押されなかったときはステップS414にジャンプする。
ステップS413:キーボード入力画面に移行し、エディットボックス1209内文字列の編集を可能とする。
ステップS414:ステップS413に続いて、キーボード入力画面における編集の終了を待ち、ステップS414に進む。
ステップS414:ユーザが、送信ボタン1204を押下することによって、指定された送信先へ画像を送信する。このとき、ファイル名が設定されている場合には、その設定されたファイル名を採用する。ファイル名が設定されていないときには、自動的に、現在の年月日時分秒がファイル名として採用される。
ステップS405〜S407の処理は複合機1000内部の処理であり、タッチパネル1200上には表示されない。
以上のとおり、実施例1はOCR処理によって取得した名詞をファイル名に含める文字列候補とするので、ファイル名設定処理が容易であり、またファイル名編集も可能であるので、ファイル名は適正なものに設定できる。
[文書処理方法]
次に、図1、図5、図6の文書処理装置によって実行される文書処理方法の実施例2を図面に基いて説明する。
実施例2では、電子倉庫サーバ2000に対する文書送信処理を効率化する。
図7において、サーバ部1000Sのスキャナ1220で文書画像を読み取り、あるいはファクス受信した画像データは、ユーザ操作部1000Mにおいて、以下の各ステップによって電子倉庫サーバ2000にアップロード(文書配信)される。
ステップS701(スキャン画像のアップロードを選択):まず、ユーザが、タッチパネル1200に表示されるユーザインターフェースメイン部1001を用いて、画像データのアップロードを選択したときに以下の処理が開始される。
ステップS702(スキャン読取設定):タッチパネル1200において、スキャナ1220で設定し得る読取条件をユーザに提示し、ユーザは原稿を読み取る際の詳細な設定を行う。
読取設定においては、前記電子倉庫サーバ2000に画像を格納した際のファイルフォーマットを含んでいても良い。これにより、スキャナデバイスが文書を読み取った際の画像フォーマットがどのような形式であっても、前記サーバ部の画像処理部1009において画像変換処理を行うことで、ユーザ所望の画像フォーマットに変換することが可能となる。
また、読取設定のみでなく、このスキャン動作により電子倉庫サーバ2000に画像データをアップロードするまでの処理結果をユーザにメール通知するために、メール送信設定部1010が持つユーザインターフェースを用いて、メールアドレスを指定しても良い。これにより、ユーザはアップロードまでの過程や結果を複合機1000の前で待つ必要が無くなる。
ステップS703(アップロード先選択):ステップS702に続いて、プロトコルインターフェース部1004において、画像データを電子倉庫サーバ2000のどのフォルダに格納すべきか指定する。
ステップS704:ステップS703に続いて、ユーザがユーザインターフェース部1001に設けられたスキャンボタンを押下すると、デバイス制御部1003を介してスキャナ1220に読取命令を発行する。スキャナ1220は読取命令を受けて、ステップS702で設定された読取条件により、原稿台またはADF(原稿自動給送装置)にセットされた原稿の画像をスキャンし、画像データをイメージ格納部1005に保存する。
ステップS705:ステップS704に続き、イメージ格納部1005に保存された画像データをイメージ取得部1006によって取得し、プレビュー作成部1007を介してユーザインターフェースメイン部1001に表示する。
ステップS706:ステップS705に並行して、イメージ取得部1006で取得した画像データについて、ブロックセレクション部1008によって文章部分、写真部分等の領域を抽出する。
ステップS707:ステップS706で文章部分として抽出された画像領域に対して、OCR処理部1009を用いてOCR処理を施す。OCR処理結果については、図示しない辞書データベースを用いて、名詞を抽出し、頻度の高い名詞を抽出する。
ステップS708:図8に示すように、ステップS707で抽出した高頻度の名詞のリスト802をユーザインターフェースメイン部100に表示する。ユーザはリスト中の1個または複数の名詞をして選択でき、画像データを電子倉庫サーバ2000に格納する際のファイル名として採用し得る。複数の名詞を選択したときは、これら名詞を合成してファイル名とする。
ユーザが表示された名詞のリスト以外のファイル名を望む場合、例えば図8の編集ボタン1203を押すことによって、キーボード入力等によりファイル名を指定してもよい。
あるいはプレビュー画像801において、文章部分の画像領域を矩形803で囲む等の処理により、ファイル名としてもよい。図8では、「行事一覧」の文字列が選択され、エディットボックス1209に表示されるとともに、実施例1と同様に現在年月日時分秒が付加されている。
ファイル名等の格納設定は、ログ管理部1011によって情報管理部1013に保存される。
図9において、電子倉庫サーバ2000へのアップロード(文書配信)に際して、サーバ部1000Sでは以下の各ステップが実行される。
ステップS901:まず、サーバメイン部1400によって、イメージ取得部1006を介してイメージ格納部1005内の画像データを取得する。
ステップS902:ステップS901で取得した画像データに関し、ユーザ操作部1000Mで設定され、情報管理部113に格納された格納設定内容をログ管理部1011を介して参照しつつ、画像処理部1009よって画像変換処理を行う。
ここでは、再度前記OCR処理部1009より文書原稿全面に対してOCR処理を施し、OCR処理結果をテキストとして含むPDFファイル等を作成してもよい。またエッジ強調、コントラスト強調など画質の向上に関する一般的な処理を同時に施してもよい。
ステップS903:ステップS902で変換した画像データを、格納設定内容に従って、プロトコルインターフェース部1004を介して、電子倉庫サーバ2000にアップロードする。
画像データの格納処理が完了したときは、画像データはイメージ格納部1005から削除されるが、格納処理に失敗した場合、画像データの保障のため、イメージ格納部1005に保存しておき、再度アップロード処理を実行できるように管理する。
ステップS904:電子倉庫サーバ2000に画像データをアップロードするまでの間の処理の状態、もしくは処理結果を、ログ管理部1011を介して情報管理部1013に格納する。
図11において、図7のステップS703(アップロード先選択)の処理は以下の各ステップによって実行される。
ステップS1001:ユーザは、前記電子倉庫サーバ2000のアドレスを指定する。この際、ユーザは毎回アドレスを入力するのではなく、一度入力したアドレスを保管し、履歴を表示する方が望ましい。
ステップS1002:ステップS1001で指定した電子倉庫サーバ2000のアドレスにアクセスし、電子倉庫サーバ2000より応答があるか否かを判断する。応答があったときはステップS1003に進み、応答がなかったときはステップS1001に戻る。
電子倉庫サーバ2000はインターネットINを介して接続しており、そのプロトコルは、https等のセキュリティを考慮したプロトコルであることが望ましい。
ステップS1003:電子倉庫サーバ2000にアクセスするためのユーザ名とパスワードを入力し、送信する。
ステップS1004:ステップS1003で入力したユーザ名とパスワードが電子倉庫サーバ2000において認証されたか否かを判断する。ユーザ名とパスワードが認証されたときにはステップS1005に進む、認証されなかったときにはステップS1003に戻る。
ステップS1005:ユーザ名とパスワードでアクセス可能な最上位のフォルダ一覧を、電子倉庫サーバ2000から取得し、表示する。
ステップS1006:ユーザが、ステップS1005で表示されたフォルダ以外のフォルダへの移動を指示したか否かを判断する。フォルダ移動を指示したときにはステップS1005に戻って移動先フォルダ一覧を表示し、移動指示が為されなかったときにはステップS1007に進む。
なお、フォルダ移動毎に該電子倉庫サーバ2000にアクセスすると時間を要するため、ステップS1005において、アクセス可能なフォルダ情報を一度に取得する方が望ましい。
ステップS1007:ユーザは画像データの格納場所を指定する。格納場所は、スキャン読取設定とともに、格納設定内容として情報保存部1013に格納される。
図12において、図7のステップS704(スキャン実行)の処理は以下の各ステップによって実行される。
ステップS1101:ユーザは前記ユーザインターフェースメイン部1300にあるスキャンボタンを押下を待ち、スキャンボタンが押されたときにステップS1102に進む。
ステップS1102:スキャンボタンの押下に呼応して、スキャナ1220にスキャン命令を発行する。
ステップS1103:ステップS1102のスキャン実行に続き、スキャンごとにイメージ格納部1005にユニークなフォルダ名を生成し、そのフォルダ以下に画像データを保存する。これによって、多くの画像がスキャンされたときにも、スキャンごとの画像データの管理が可能となる。
ステップS1104:ステップS1103の処理によって画像データが得られることを、イメージ取得部1006に通知する。一方、イメージ取得部1006は、ユーザインターフェースメイン部1300、プレビュー作成部1007、ブロックセレクション部1008、サーバメイン部1400に、画像データを取得した旨を通知する。
図13において、図7のステップS707(OCR処理)の処理は以下の各ステップによって実行される。
ステップS1201:ブロックセレクション部1008により取得した文章領域に対してOCR処理を施し、ステップS1202に進む。
ステップS1202:OCR処理結果について、図示しない辞書データを用いて名詞の抽出を行い、ステップS1203に進む。
ステップS1203:抽出された名詞を一覧とし、各名詞の出現回数(頻度)をカウントする。
ステップS1204:ステップS1203でカウントされた名詞頻度に基き、出現回数の多い名詞のリストを作成する。名詞頻度リストは画像データの文章領域の座標位置と合わせて、ユーザインターフェースメイン部1300に通知される。
図14において、図7のステップS701(画像データ取得)の処理は以下の各ステップによって実行される。
ステップS1401:サーバメイン部1400は、イメージ取得部1006から画像データ取得の通知を受けると、イメージ格納部1005から画像データ、および画像データが格納されていたパス名(ドライブ名+フォルダ名)を取得する。
ステップS1402:ステップS1401で得たパス名より、画像データがスキャナ、ファクスのいずれで取得したかを判定する。スキャナ画像データとファックス画像データとは、別個のドライブに格納される。
スキャナ画像データのときはステップS1403に進み、ファックス画像データのときはステップS1404に進む。
ステップS1403:ログ管理部1011を介して情報管理部1013から格納設定内容を取得し、そのまま処理を終了する。このとき取得する格納設定内容におけるフォルダ名は、イメージ格納部1005の画像データ格納フォルダ名と一致する。
ステップS1404:ファクス自動転送判定部1012において、ファクス受信した際の転送条件を取得、そのまま処理を終了する。このとき取得する転送条件は、情報管理部1013にある転送条件と一致する。
実施例2の文書配信システムによれば、PC3000を介すことなく、複合機1000を用いてスキャンした画像データもしくはファクス受信した画像データを、インターネットを介して電子倉庫サーバ2000に格納することができ、PCを省略し得る。
実施例2では、画像データを電子倉庫サーバ2000に格納する際のファイル名を、文書領域のOCR処理結果を用いて作成できるので、容易に検索し得る形態で電子倉庫サーバ2000に登録し得る。
実施例2では、画像データを複合機1000内に保存できるので、何らかのエラーで出力できなかったときにも、ユーザは複合機1000を操作することで画像データを処理できる。従って、原稿の再スキャンやファクス再受信は不要である。
以上のとおり、実施例2では電子倉庫サーバ2000に対する登録処理を効率化し得る。
[文書処理方法]
次に、図1、図5、図6の文書処理装置によって実行される文書処理方法の実施例3を図面に基いて説明する。
実施例3では、複合機1000とWEbサービスサーバ4000との連携によって、文書管理PCへの登録処理を実行する。
図15において、サーバメイン部1400によって実行されるソフトウェアは、PC3000との通信、文書の格納等の機能や、Webサービスへのアクセス、操作パネル12における各種情報表示、操作パネル1200から入力取得等のための機器制御アプリケーション1501と、複合機1000の各構成要素を制御するためのOS1502、BIOS1503を備える。
またOS1502は、LAN通信におけるTCP/IP等のプロトコルハンドリングを実行する。
図16において、複合機1000においてPC3000に対して文書を送信する際の宛先作成は以下の各ステップによって実行される。
ステップS1601:複合機1000における操作パネル1200の初期画面で宛先作成機能が選択されたときに、宛先作成の処理を開始する。
ステップS1602:ステップS1601に続き、複合機1000とPC3000とを接続する。すなわち、ネットワークコンピュータである複合機1000とPC3000との間で、データ交換のための基本動作としての接続が為される。
ステップS1603:ステップS1602に続き、文書管理システムから保存先情報を取得する。保存先情報はオブジェクト、リスト等の形態で供給される。複合機1000は、PC3000内の他のソフトウェアとのデータ交換方式を解釈するソフトウェアを備え、保存先情報に基いて適宜データ交換を実行する。
ステップS1604:ステップS1603に続き、保存先情報を操作パネル1200に表示し、ユーザの操作によって所望の保存先選択操作を促す。ユーザが保存先を選択したときは、その保存先を宛先として、複合機1000内のソフトウェア内の記憶方式に従い保存する。
ステップS1605:ステップS1604に続き、図19に示すように、操作パネル1200上に宛先入力GUI1903を表示する。ここでユーザ入力を待ち、ユーザの宛先入力終了の処理をもってその入力された文字列を宛先として採用する。このとき保存先の情報と宛先を連携し、保存先を容易に参照し得る名称とする。
ステップS1606:ステップS1605で設定した宛先名称を複合機1000のアドレス帳に保存する。宛先は、宛先入力GUI1903に表示され、変更ボタン1904によって変更、選択し得る。操作パネル1200で送信ボタン1204を押すと、画像データは文書管理PC3000の保存先を読出し、文書を文書管理システムに格納する。
ステップS1607:ステップS1606に続き、宛先の作成を完了するか否かを判断する。宛先作成を続行する場合には、ステップS1604に戻り、ステップS1603で取得した保存先情報を使用して、再度ステップS1604〜ステップS1606までの処理を繰り返す。宛先の作成を完了するときはステップS1608へ進む。
ステップS1608:宛先作成を完了し、宛先作成に使用したシステムリソース等を開放するとともに、操作パネル1200をニュートラルの状態に戻す。
図17、図18において、複合機1000から文書管理PC3000への画像データ送信は以下の各ステップにより実行される。
ステップS1701:まず、複合機1000によって画像データ送信の処理を開始する。すなわち複合機1000の電源投入、初期動作等を完了し、文書管理PC3000への文書登録処理を開始するとともに、複合機1000の他のタスクの実行を可能とする。
ステップS1702:ステップS1701に続いて処理待ち状態となり、複合機1000はタスク処理の完了を待つ。例えば文書送信のときは、ユーザのスキャン実行やファックス文書の選択操作を待つ。複合機1000の基本機能であるファックス受信、PC3000からプリンタ1210へ印刷文書入力等を機器が待っている状態である。なお、フローチャートでは処理をシーケンシャルに表記するが、他のタスクの実行中であっても、処理待状態においては、常に処理実行開始を受け付け、実行中のタスクと動作が競合しない場合には、複合機1000上で並行処理が可能であることは言うまでもない。
ステップS1703:ステップS1702に続いて、複合機1000の処理を終了すべきか否か判断する。ステップS1702では、複合機1000の終了処理も待受け対象であり、終了処理操作が行われた場合、本ステップでそれを判断する。複合機1000の処理を終了すべきときはステップS1704に進み、終了すべきでないときはステップS1705に進む。
ステップS1704:複合機1000の終了処理を実行する。
ステップS1705:ステップS1702で受け付けた、終了処理以外の処理の種類を判断し、スキャン処理のときはステップS1708に進み、ファック画像選択処理のときはステップS1707に進む。またその他の処理のときはステップS1706に進む。
ステップS1706:本発明ではスキャン処理およびファックス受信の処理が特徴的であるため、特徴的でないその他処理をステップ1706で一括して表現し、説明を省略する。ステップ1706の処理終了後にはステップS1701に戻る。
ステップS1707:複合機1000に保存されている文書(FAX画像)を選択し、ステップS1710に進む。図20に示すように、選択操作に際しては操作パネル1200上にファックス画像一覧2001を表示し、ユーザがいずれかのファックス画像を選択する。ファックス画像一覧2001には、例えばチェックボックス2002、日付2003、発信者2004を表示し、ユーザがチェックボックス2002にチェックをしたファックス画像を選択し得る。チェックボックス2002へのチェック後に選択ボタン2005を押すことにより、ファックス画像の選択が完了し、複合機1000のユーザインターフェースメイン部1300のメモリに展開され、ステップS1710でファックス画像そのものが操作パネル1200にプレビュー表示される(図19)。
複合機1000から文書管理システムPCへの文書登録処理において、複合機1000上でのスキャン文書を文書管理システムに送信する場合、ステップS1708に進む。
ステップS1708:複合機1000上でスキャン処理を実行し、ステップS1709に進む。スキャン処理に使用される原稿台、スキャナセンサー、画像データ処理は公知技術を採用しており、また本発明の特徴には特に関連しない、機器内部の動作なので説明を省略する。
ステップS1709:スキャンされた画像を、複合機1000のユーザインターフェースメイン部13000に一時記憶し、ステップS1710に進む。
ステップS1710:図19に示すように、取得した画像を送信文書として操作パネルに表示し、ステップS1711に進む。
ステップS1711:プレビュー表示された文書を、Webサービスサーバ4000が提供するOCRサービス4010に送付し、OCRサービスを実行する。
複合機1000とWebサービスサーバ4000とのデータおよび情報の交換は、一般に共通技術として提案されるプロトコルによって実行され、あるいは、特にプロトコルを特定せず両者が相互理解できかつコマンドやデータ構造の解釈処理が行える設定とする。
ステップS1712:ステップS1711に続いて、Webサービスサーバ4000において、複合機1000から送付された画像データに対してOCR処理を実行する。
Webサービスサーバ4000がOCR処理を実行している間、複合機1000は、Webサービスサーバ4000からの処理終了のメッセージを待つ。すなわち複合機1000は、OCR処理に関しては待受け処理のみを実行するので、他のタスクの処理する余力があり、複合機1000内の機器リソースを該タスクに充分振り向けることができる。
ステップS1713:ステップS1712に続いて、複合機1000は、Webサービスサーバ4000によるOCR処理結果を受ける。
ステップS1714:ステップS1713に続いて、OCR処理結果を、Webサービスサーバ4000のOCR校正サービス4020に送付して、OCR校正サービスを実行する。
ここに、本実施例においてOCRサービスとOCR校正サービスを別々のサービスとして提供している理由は、OCR処理とOCR処理結果の校正処理とが、別個のアルゴリズム、技術分野に属することにある。
OCR処理、校正処理は、ともに既に一部公知であり、OCR関連の一連の処理として使用される技術であるが、OCR処理は光学的文字認識分野の技術であり、校正処理は文章操作処理に属する技術である。
本発明における校正処理は、一般の文章校正というよりも、OCR処理で頻繁に実行される誤字認識を補う処理である。
ステップS1715:ステップS1714に続いて、Webサービスサーバ4000においてOCR校正サービスを実行する。
ステップS1716:ステップS1715に続いて、複合機1000がWebサービスサーバ4000からOCR校正サービス結果を取得する。
ステップS1717:ステップS1716に続いて、OCR校正サービス結果を、さらにWebサービスサーバ4000の特徴語抽出サービス4030に送る。
ステップS1718:ステップS1717に続いて、Webサービスサーバ4000において特徴語抽出サービスを実行する。特徴語抽出では、文書内容を読み取り、文書の内容が表記している分野毎に分類する。分類処理においては、まず文書の単語抽出を行い、単語ごとにその単語が属する分野を内部パラメータとして一時記憶しておき、最終的に各分野を示す内部パラメータをカウントして、最も多くの単語が属する分野をその文書の内容が表記している分野とする。
さらに決定された分野に属する単語を文書中から抽出し、文字列リストとして特徴語抽出結果を複合機1000送付する。
図19の操作パネル1200の画像を例にとると、文書をIT関連分野に分類し、さらに文書中の文字列から「コンピュータ」、「インターネット」等のIT関連用語をピックアップする。
分野分類用文字列や各分野で抽出すべき文字列は、Webサービスサーバ4000において、複数分野について辞書およびプロファイル等の手段であらかじめ設けられる。辞書の内容(分類の種類や辞書に登録されている文字列は)は、個々のユーザに合わせた運用がなされるべきものなので、本発明では特に言及しない。
ステップS1719:ステップS1718に続いて、複合機1000が、Webサービスサーバから特徴語抽出サービスの結果を取得する。次に、図18のステップS1801に進む。
ステップS1801:OCR校正結果を参照し、特徴語の出現頻度をカウントする。
ステップS1802:ステップS1801に続いて、出現頻度の高い順に単語リストを作成する。
ステップS1803:ステップS1802に続いて、ステップS1802で作成した単語リストを操作パネル1200のファイル名候補リスト1902に表示する(図19)。表示する単語候補が多い場合は、表示エリアの制限があるためスクロール表示等の手段が実行される。
ステップS1804:ステップS1803に続いて、ユーザは、操作パネル1200上に表示されたファイル名候補リスト1902からファイル名にする単語を選択する。選択操作はユーザがポインティング手段によって画面上の単語の表示エリア位置を指定することで行う。操作パネルがタッチパネルの場合、ユーザの手指がポインティング手段であり、直接操作パネル上の単語の表示エリアに触れることで単語が選択される。操作パネルがタッチパネルではない場合は、マウスや画面カーソル移動等による一般的なポインティング手段によって単語を選択し得る。
ステップS1805:ステップS1804で選択された文字列をファイル名に表示し、ファイル名とする。ただし、操作パネル1200のファイル名コントロールは、一般に言うエディットボックス形式で提供されるため、このファイル名コントロールで表示されたファイル名の文字列を編集しファイル名とすることも可能である。
文書管理システムPC3000の文書保存が一般的PCのファイル形式で実行される場合、ファイルの種類を特定する拡張子を、コントロールで表示するファイル名に付加してもよい。
また、文書管理システムPC3000で独自のファイル管理方式を採用して、文書の保存管理を行ってもよい。その場合、ファイル名を文書名という形式でプロパティの一つとして保存する方式もあるため、選択されたファイル名がプロパティの文書名としてそのまま保存される。
ファイル名に関する禁則文字の処理(ファイル名として使用できない文字をファイル名文字列から削除する処理)についても、それそれの文書管理システムに適合させる。
ステップS1806:ステップS1805に続いて、宛先の選択を行う。宛先は、別途宛先作成フローによって作成され、複合機1000内に保存されており、変更ボタン1904(図5)の押下によって、複合機に設定保存されている宛先が操作パネル上に表示され、選択可能となる。ユーザが宛先を選択したときには、選択された宛先が宛先ボックス1903(図5)内に表示される。
ステップS1807:ステップS1806に続いて、ユーザが送信ボタン1204(図5)を押すことによって、画像ファイルが送信される。
ステップS1808:ステップS1807に続いて、宛先の呼び出し処理を実行する。すなわち、ステップS1806で選択された宛先に関連して記録されている、文書管理システム内の実際の保存先情報を読出す。
ステップS1809:ステップS1808に続いて、文書管理システムPC3000の接続処理を行った上で、その保存先をオープンし、文書の登録を可能にする処理を実行する。
ステップS1810:ステップS1809に続いて、画像ファイルを文書管理システムPC3000に送信し、文書情報等もあわせて登録する。送信ファイル付されたファイル名は、本発明の特徴的な機能によって作成される。
文書管理システムによっては、ユーザの目に見えるファイル名という機能概念がなく、文書名というプロパティの一つといった位置付けで文書の名前を扱うものがあるが、その場合にも、本発明の機能で作成したファイル名をプロパティの文書名として登録すればよい。
ステップS1811:ステップS1810に続いて、文書管理システムとの接続を切断し、文書登録処理を終了する。最後に、処理をステップS1702に戻し、複合機1000は次のタスク実行のアクションを待つ状態となる。
このように、複合機1000上で、予め宛先を登録しておくことによって、ユーザが文書登録システムを運用し、文書を文書管理システムへ送信する際の手順が、スキャンボタン実行、ファイル名選択、宛先選択、送信実行の4回のアクションによって実現できる。
以上のとおり実施例3では、Webサービスサーバとの連携によって、PC3000への登録処理を効率化し得る。
なお、画像データを登録すべ保存手段はPC3000、電子倉庫サーバ2000に限定されるものではなく、複合機1000に含まれる記憶手段その他であってもよい。
本発明に係る文書処理装置の実施例1が適用された装置構成を示すブロック図である。(実施例1) 図1の複合機における操作パネルの表示を示す図である。(実施例1) 図1の複合機における操作パネルの他の表示を示す図である。(実施例1) 図1の装置で実施される文書処理方法の実施例1を示すフローチャートである。(実施例1) 図1における複合機のサーバ部を示すブロック図である。(実施例1) 図1における複合機のユーザ操作部を示すブロック図である。(実施例1) 図1の装置で実施される文書処理方法の実施例2を示すフローチャートである。(実施例2) 図7の文書処理方法における、図1の複合機の操作パネルの表示を示す図である。(実施例2) 文書処理方法の実施例2における、電子倉庫サーバへのアップロード処理を示すフローチャートである。(実施例2) 文書処理方法の実施例2で使用される操作パネルを示す図である。(実施例2) 図7におけるアップロード先選択処理を示すフローチャートである。(実施例2) 図7におけるスキャン実行処理を示すフローチャートである。(実施例2) 図7におけるOCR処理を示すフローチャートである。(実施例2) 図9におけるスキャン/ファックス画像取得処理を示すフローチャートである。(実施例2) 図1の装置で実施される文書処理方法の実施例3のソフトウエア構成を示すメモリマップである。(実施例3) 文書処理方法の実施例3における宛先作成処理を示すフローチャートである。(実施例3) 文書処理方法の実施例3における画像データ送信処理を示すフローチャートである。(実施例3) 画像データ送信処理の図17に続く処理を示すフローチャートである。(実施例3) 文書処理方法の実施例3における操作パネルの表示を示す図である。(実施例3) 文書処理方法の実施例3における操作パネルの他の表示を示す図である。(実施例3)
符号の説明
IN インターネット
1000 複合機
1006 イメージ取得部
1008 ブロックセレクション部
1206 プレビュー画像
1207 編集ボタン
1209 エディットボックス
1210 日付付加ボタン
1200 操作パネル
1220 スキャナ
2000 電子倉庫サーバ
3000 文書管理システムPC
4000 Webサービスサーバ
4010 OCRサービス
4020 OCR校正サービス
4030 特徴語抽出サービス

Claims (14)

  1. 画像データを取得する手段と、
    前記画像データから文字部分を抽出する抽出手段と、
    前記画像データを保存する保存手段と、
    前記抽出手段によって抽出された文字部分についてOCR処理を実行して、文字列を抽出するOCR処理手段と、
    前記OCR処理手段によって抽出された文字列を表示する表示手段と、
    前記表示手段によって表示された文字列から、画像データのファイル名に含める文字列を選択し得る選択手段と、
    前記選択手段によって選択された文字列に基いたファイル名を前記画像データに設定するファイル名設定手段と、
    を備えた文書処理装置。
  2. 画像データを取得する手段と、
    前記画像データから文字部分を抽出する抽出手段と、
    前記画像データを保存する保存手段と、
    前記抽出手段によって抽出された文字部分についてOCR処理を実行して、文字列を抽出するOCR処理手段と、
    前記OCR処理手段によって抽出された文字列を校正するOCR校正処理手段と、
    前記OCR校正処理手段によって校正された文字列を表示する表示手段と、
    前記表示手段によって表示された文字列から、画像データのファイル名に含める文字列を選択し得る選択手段と、
    前記選択手段によって選択された文字列に基いたファイル名を前記画像データに設定するファイル名設定手段と、
    を備えた文書処理装置。
  3. OCR処理手段は、ファイル名に適すると判断した文字列を抽出することを特徴とする請求項1または2記載の文書処理装置。
  4. 前記ファイル名設定手段でファイル名が設定された画像データの格納先は、文書登録アプリケーションが搭載された汎用コンピュータであることを特徴とする請求項1乃至3のいずれかに記載の文書処理装置。
  5. 前記ファイル名設定手段でファイル名が設定された画像データの格納先は、電子倉庫サーバであることを特徴とする請求項1乃至4のいずれかに記載の文書処理装置。
  6. 前記表示手段は、前記画像データのプレビュー画像を表示するとともに、前記OCR処理手段で抽出された文字列に関する文字部分を前記プレビュー画像上で区別して表示する、
    ことを特徴とする請求項1乃至5のいずれかに記載の文書処理装置。
  7. 前記選択手段によって選択された文字列を表示するとともに、該文字列の編集を可能とする編集手段をさらに備えたことを特徴とする請求項1乃至6のいずれかに記載の文書処理装置。
  8. 前記ファイル名に日付データを付加する手段をさらに備えたことを特徴とする請求項1乃至7のいずれかに記載の文書処理装置。
  9. 前記OCR処理手段によって抽出された文字列から特徴語を抽出する特徴語抽出処理手段をさらに備えたことを特徴とする請求項1乃至8のいずれかに記載の文書処理装置。
  10. 前記画像データを取得する手段、前記表示手段および前記選択手段は、ネットワークを介して前記OCR処理手段に接続されていることを特徴とする請求項1乃至9のいずれかに記載の文書処理装置。
  11. 画像データを取得するステップと、
    前記画像データから文字部分を抽出する抽出ステップと、
    前記画像データを保存する保存ステップと、
    前記抽出ステップで抽出された文字部分についてOCR処理を実行して、文字列を抽出するOCR処理ステップと、
    前記OCR処理手段によって抽出された文字列を表示する表示ステップと、
    前記表示手段によって表示された文字列から、画像データのファイル名に含める文字列を選択し得る選択ステップと、
    前記選択手段によって選択された文字列に基いたファイル名を前記画像データに設定するファイル名設定ステップと、
    を備えた文書処理方法。
  12. 画像データを取得するステップと、
    前記画像データから文字部分を抽出する抽出ステップと、
    前記画像データを保存する保存ステップと、
    前記抽出ステップによって抽出された文字部分についてOCR処理を実行して、文字列を抽出するOCR処理ステップと、
    前記OCR処理ステップによって抽出された文字列を校正するOCR校正処理ステップと、
    前記OCR校正処理ステップによって校正された文字列を表示する表示ステップと、
    前記表示ステップによって表示された文字列から、画像データのファイル名に含める文字列を選択し得る選択ステップと、
    前記選択ステップによって選択された文字列に基いたファイル名を前記画像データに設定するファイル名設定ステップと、
    を備えた文書処理方法。
  13. 請求項11または12に記載の文書処理方法の各ステップを、コンピュータに実行させるためのコンピュータプログラム。
  14. 請求項13に記載のコンピュータプログラムを格納したコンピュータ可読記憶媒体。
JP2004088596A 2004-03-25 2004-03-25 文書処理装置および文書処理方法 Withdrawn JP2005275849A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004088596A JP2005275849A (ja) 2004-03-25 2004-03-25 文書処理装置および文書処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004088596A JP2005275849A (ja) 2004-03-25 2004-03-25 文書処理装置および文書処理方法

Publications (1)

Publication Number Publication Date
JP2005275849A true JP2005275849A (ja) 2005-10-06

Family

ID=35175456

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004088596A Withdrawn JP2005275849A (ja) 2004-03-25 2004-03-25 文書処理装置および文書処理方法

Country Status (1)

Country Link
JP (1) JP2005275849A (ja)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007141142A (ja) * 2005-11-22 2007-06-07 Denso Wave Inc メモリデバイス
JP2008234216A (ja) * 2007-03-19 2008-10-02 Ricoh Co Ltd ワークフロー管理システム
JP2009026288A (ja) * 2007-07-23 2009-02-05 Sharp Corp 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体
US8284442B2 (en) 2008-02-13 2012-10-09 Kyocera Document Solutions Inc. Image processing system with maximum magnification image data generation section and preview editing
US8290269B2 (en) 2007-01-15 2012-10-16 Sharp Kabushiki Kaisha Image document processing device, image document processing method, program, and storage medium
US8295600B2 (en) 2007-01-15 2012-10-23 Sharp Kabushiki Kaisha Image document processing device, image document processing method, program, and storage medium
JP2014115750A (ja) * 2012-12-07 2014-06-26 Ricoh Co Ltd 文書処理装置、画像処理装置、文書処理方法及び文書処理プログラム
JP2016201669A (ja) * 2015-04-09 2016-12-01 キヤノン株式会社 原稿読取装置、原稿読取装置の制御方法、プログラム、及び記憶媒体
JP2018072985A (ja) * 2016-10-26 2018-05-10 富士通株式会社 イメージスキャンシステム、イメージスキャナ、情報取得方法及び情報取得プログラム
JP2018092569A (ja) * 2016-12-06 2018-06-14 株式会社リコー 情報処理システム、情報処理装置、情報処理方法及びプログラム
JP2018124657A (ja) * 2017-01-30 2018-08-09 キヤノン株式会社 画像処理装置、及びその制御方法とプログラム
JP2018124656A (ja) * 2017-01-30 2018-08-09 キヤノン株式会社 画像処理装置とその制御方法、及びプログラム
JP2019040250A (ja) * 2017-08-22 2019-03-14 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP2019068324A (ja) * 2017-10-03 2019-04-25 キヤノン株式会社 スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
JP2019079554A (ja) * 2019-01-04 2019-05-23 富士通株式会社 イメージスキャンシステム、イメージスキャナ、情報取得方法及び情報取得プログラム
JP2019128715A (ja) * 2018-01-23 2019-08-01 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
WO2019193923A1 (ja) * 2018-04-02 2019-10-10 日本電気株式会社 画像処理装置、画像処理方法および記録媒体
JP2020144646A (ja) * 2019-03-07 2020-09-10 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2021100279A (ja) * 2020-08-27 2021-07-01 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP2021117750A (ja) * 2020-01-27 2021-08-10 シャープ株式会社 情報処理装置、制御方法及びプログラム
US11115553B2 (en) 2019-07-29 2021-09-07 Fujifilm Business Innovation Corp. Information processing system for detecting image information and non-transitory computer readable medium
US11562122B2 (en) 2020-03-03 2023-01-24 Fujifilm Business Innovation Corp. Information processing apparatus, image processing apparatus, and non-transitory computer readable medium storing program

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007141142A (ja) * 2005-11-22 2007-06-07 Denso Wave Inc メモリデバイス
JP4626496B2 (ja) * 2005-11-22 2011-02-09 株式会社デンソーウェーブ メモリデバイス
US8290269B2 (en) 2007-01-15 2012-10-16 Sharp Kabushiki Kaisha Image document processing device, image document processing method, program, and storage medium
US8295600B2 (en) 2007-01-15 2012-10-23 Sharp Kabushiki Kaisha Image document processing device, image document processing method, program, and storage medium
JP2008234216A (ja) * 2007-03-19 2008-10-02 Ricoh Co Ltd ワークフロー管理システム
JP2009026288A (ja) * 2007-07-23 2009-02-05 Sharp Corp 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体
JP4533920B2 (ja) * 2007-07-23 2010-09-01 シャープ株式会社 画像文書処理装置、画像文書処理方法、画像処理プログラムおよび画像処理プログラムを記録した記録媒体
US8284442B2 (en) 2008-02-13 2012-10-09 Kyocera Document Solutions Inc. Image processing system with maximum magnification image data generation section and preview editing
JP2014115750A (ja) * 2012-12-07 2014-06-26 Ricoh Co Ltd 文書処理装置、画像処理装置、文書処理方法及び文書処理プログラム
JP2016201669A (ja) * 2015-04-09 2016-12-01 キヤノン株式会社 原稿読取装置、原稿読取装置の制御方法、プログラム、及び記憶媒体
JP2018072985A (ja) * 2016-10-26 2018-05-10 富士通株式会社 イメージスキャンシステム、イメージスキャナ、情報取得方法及び情報取得プログラム
JP2018092569A (ja) * 2016-12-06 2018-06-14 株式会社リコー 情報処理システム、情報処理装置、情報処理方法及びプログラム
JP2018124657A (ja) * 2017-01-30 2018-08-09 キヤノン株式会社 画像処理装置、及びその制御方法とプログラム
JP2018124656A (ja) * 2017-01-30 2018-08-09 キヤノン株式会社 画像処理装置とその制御方法、及びプログラム
KR20200067238A (ko) * 2017-01-30 2020-06-12 캐논 가부시끼가이샤 화상처리장치, 그 제어 방법, 및 기억매체
US11600090B2 (en) 2017-01-30 2023-03-07 Canon Kabushiki Kaisha Image processing apparatus, control method therefor, and storage medium
KR102247606B1 (ko) * 2017-01-30 2021-05-03 캐논 가부시끼가이샤 화상처리장치, 그 제어 방법, 및 기억매체
JP2019040250A (ja) * 2017-08-22 2019-03-14 キヤノン株式会社 スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム
JP2019068324A (ja) * 2017-10-03 2019-04-25 キヤノン株式会社 スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム
US11386046B2 (en) 2017-10-03 2022-07-12 Canon Kabushiki Kaisha Apparatus for setting file name for scan image, method of controlling same, and storage medium
JP2019128715A (ja) * 2018-01-23 2019-08-01 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
WO2019193923A1 (ja) * 2018-04-02 2019-10-10 日本電気株式会社 画像処理装置、画像処理方法および記録媒体
JP2019185140A (ja) * 2018-04-02 2019-10-24 日本電気株式会社 画像処理装置、画像処理方法およびプログラム
US11482029B2 (en) 2018-04-02 2022-10-25 Nec Corporation Image processing device, image processing method, and recording medium
JP2019079554A (ja) * 2019-01-04 2019-05-23 富士通株式会社 イメージスキャンシステム、イメージスキャナ、情報取得方法及び情報取得プログラム
JP2020144646A (ja) * 2019-03-07 2020-09-10 富士ゼロックス株式会社 情報処理装置及びプログラム
US11115553B2 (en) 2019-07-29 2021-09-07 Fujifilm Business Innovation Corp. Information processing system for detecting image information and non-transitory computer readable medium
JP2021117750A (ja) * 2020-01-27 2021-08-10 シャープ株式会社 情報処理装置、制御方法及びプログラム
US11693825B2 (en) 2020-01-27 2023-07-04 Sharp Kabushiki Kaisha Information processing apparatus, control method, and recording medium storing program
JP7414554B2 (ja) 2020-01-27 2024-01-16 シャープ株式会社 情報処理装置、制御方法及びプログラム
US11562122B2 (en) 2020-03-03 2023-01-24 Fujifilm Business Innovation Corp. Information processing apparatus, image processing apparatus, and non-transitory computer readable medium storing program
JP7129512B2 (ja) 2020-08-27 2022-09-01 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム
JP2022141978A (ja) * 2020-08-27 2022-09-29 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP2021100279A (ja) * 2020-08-27 2021-07-01 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP7395674B2 (ja) 2020-08-27 2023-12-11 キヤノン株式会社 画像処理装置及び画像処理方法、プログラム

Similar Documents

Publication Publication Date Title
JP2005275849A (ja) 文書処理装置および文書処理方法
US8326090B2 (en) Search apparatus and search method
JP5887860B2 (ja) 画像形成装置、画像形成システム、制御方法、およびプログラム。
KR101088925B1 (ko) 정보 처리 장치, 화상 입력 장치, 문서 분배 시스템 및 그 제어 방법
JP5147383B2 (ja) 画像処理装置、画像処理装置の制御方法及びプログラム
JP7391672B2 (ja) 文書を電子化するための画像処理システム、その制御方法及びプログラム
JP2006120125A (ja) ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム
JP5534666B2 (ja) ドキュメント処理装置およびその制御方法、ドキュメント管理システムおよび該システムにおけるデータ処理方法並びにコンピュータプログラム
US8203740B2 (en) Image processing apparatus, distribution management method, and recording medium
JP5660100B2 (ja) 文書管理サーバ、文書管理サーバの制御方法、およびそのプログラム、文書管理システム、文書管理システムの制御方法、およびそのプログラム
JP4914195B2 (ja) 画像処理装置及びその制御方法
JP7353771B2 (ja) プログラム、記憶媒体、情報処理装置の制御方法、及び情報処理装置
US20060206498A1 (en) Document information management apparatus, document information management method, and document information management program
KR20240020719A (ko) 정보 처리 장치, 저장 매체, 및 저장 방법
JP2017135561A (ja) 受信した画像データを扱う画像処理装置、画像処理方法、及びプログラム
JP2021163447A (ja) 情報処理装置、およびその制御方法とプログラム
JP2004171304A (ja) 電子化原稿管理装置及びその制御方法、電子化原稿管理システム、プログラム
JP2021184190A (ja) 画像処理装置、画像処理方法、およびプログラム
CN115801963A (zh) 服务器、控制服务器的方法和存储介质
JP2023053602A (ja) 装置、情報処理方法、及びプログラム
JP7154982B2 (ja) 情報処理装置、制御方法、及びプログラム
JP2018072985A (ja) イメージスキャンシステム、イメージスキャナ、情報取得方法及び情報取得プログラム
JP2007048061A (ja) 文字処理装置、文字処理方法及び記録媒体
JP7490415B2 (ja) サーバー、情報処理方法、プログラム
JP5734400B2 (ja) ドキュメント処理装置およびその制御方法、ドキュメント管理システムおよび該システムにおけるデータ処理方法並びにコンピュータプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060606

A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070605