以下に添付図面を参照して、情報処理装置、情報処理システム、情報処理方法およびコンピュータプログラムの実施形態を詳細に説明する。
(実施形態)
図1は、本実施形態にかかる情報処理システム10の概要構成の一例を示す図である。図1に示すように、情報処理システム10は、少なくとも一つのMFP(複合機:Multi‐Function Peripheral)20と、文書管理サーバ30と、各種処理サーバ40、管理者端末50とを備える。
各種処理サーバ40のそれぞれは、文書を電子化したファイルの蓄積、転送、メール配信等の処理を行う装置である。本実施形態では一例として、各種処理サーバ40は、Windows(登録商標)の共有フォルダを管理し、ファイルを蓄積するファイルサーバ40−1、ファイルの転送処理を行うFTP(File Transfer Protocol)サーバ40−2、ファイルの管理を行うWebDAV(Web-based Distributed Authoring and Versioning)サーバ40−3、電子メールの送信を行うメールサーバ40−4によって構成される。この他に、各種処理サーバ40は、例えばファイルの管理をするサーバとしてSharePointサーバ等を備えてもよい。
情報処理システム10を構成する各装置は、図1に示した台数に限られるものではなく、それぞれ複数台存在しても良い。また、各装置は、LAN(Local Area Network)やインターネット等のネットワークに接続し、相互に通信が可能である。各装置間の通信は、無線通信又は有線通信の何れであっても良い。
なお、これらの各種処理サーバ40の機能は、クラウドサービス、ASP(Application Service Provider)などのような各種サービスによって提供されても良い。また、各サーバの機能をさらに複数のサーバに分散して実現する構成を採用しても良い。
MFP20は、用紙の表面をスキャンして画像データを生成する。MFP20は、生成した画像データを、ネットワークを介して文書管理サーバ30へと送信する。本実施形態のMFP20は、コピー機能、プリンタ機能、スキャナ機能およびファクシミリ機能のうち少なくとも2つの機能を有する複合機であるが、これに限らず、スキャナ装置等を採用することができる。
文書管理サーバ30は、MFP20により生成された画像データを入力する。文書管理サーバ30は、一連の処理を定義するワークフローに従って、入力した画像データに対して一連の処理を実行する。
ここで、ワークフローとは、PDF変換やOCR処理等の文書の加工処理と、加工したデータのアップロード先を組み合わせて、複数の処理の手順を定義したものである。MFP20および文書管理サーバ30は、ワークフローに従って処理を実行することにより、取り込んだ画像データを指定されたフォルダに自動で送信したり、自動でメール送信したりすることができる。
MFP20は本実施形態における画像形成装置の一例である。また、文書管理サーバ30は、本実施形態における文書管理装置の一例である。
また、MFP20と文書管理サーバ30は一体的に構成されても良く、MFP20および文書管理サーバ30は、本実施形態における情報処理装置の一例である。本実施形態においてMFP20が実現する機能の内、スキャナ機能以外の機能は、文書管理サーバ30が実現しても良い。また、本実施形態において文書管理サーバ30が実現する機能は、MFP20が実現しても良い。
本実施形態では、MFP20および文書管理サーバ30が加工処理等を行う画像データの一例として、医療現場において電子カルテシステム(不図示)から出力された紙文書を読み取った画像データを用いている。しかしながら、情報処理システム10が対象とする分野は医療現場に限定されず、他の分野においても適用可能である。
管理者端末50は、管理者により使用される情報処理装置である。管理者端末50は、例えば、デスクトップ型コンピュータ、ノート型コンピュータ、スマートフォン、タブレット端末および携帯電話機等である。管理者端末50は、情報入力機能、通信機能および表示機能等を有する。管理者端末50は、ネットワークを介して文書管理サーバ30にアクセスして、管理者の操作に応じてワークフロー情報を生成する。また、管理者端末50は、ネットワークを介して、MFP20および各種処理サーバ40にアクセスして、管理者の操作に応じて設定等をする。
次に、文書管理サーバ30のハードウェア構成について説明をする。図2は、本実施形態における文書管理サーバのハードウェア構成の一例を示す図である。
図2に示すように、文書管理サーバ30は、CPU(Central Processing Unit)101と、ROM(Read Only Memory)102と、RAM(Random Access Memory)103と、HDD(Hard Disk Drive)104と、通信デバイス105とを有するコンピュータである。CPU101、ROM102、RAM103、HDD104、および、通信デバイス105は、バスにより接続されている。
CPU101は、HDD104に記憶されたプログラムをRAM103に展開して実行し、各部品を制御してデータの入出力や、データの加工を行う。
ROM102は不揮発性の記憶媒体である。ROM102には、BIOS(Basic Input/Output System)およびブートストラップローダをHDD104からRAM103に読み出すスタートプログラムが記憶されている。ブートストラップローダは、OS(Operating System)をHDD104からRAM103に読み出す。
RAM103は、読み書き可能な記憶媒体であれば良く、例えばSRAM(Static Random Access Memory)やDRAM(Dynamic Random Access Memory)等を採用することができる。
HDD104は、不揮発性の記憶媒体である。HDD104は、SSD(Solid State Drive)等に置き換えても良い。HDD104は、OSおよびデバイスドライバを記憶している。
通信デバイス105は、他の機器と通信を行う装置である。通信デバイス105は、例えばLANに接続して、MFP20や各種処理サーバ40とネットワークを介して相互に通信を行う。
なお、各種処理サーバ40および管理者端末50のハードウェアも、文書管理サーバ30と同様の構成である。
次に、MFP20のハードウェア構成について説明をする。図3は、本実施形態における複合機のハードウェア構成の一例を示す図である。
MFP20は、一例として、コントローラ110と、オペレーションパネル125と、ファクシミリコントロールユニット(FCU)126と、撮像部127と、印刷部128とを有する。
コントローラ110は、CPU111と、ASIC112(Application Specific Integrated Circuit)と、NB113(ノースブリッジ)と、SB114(サウスブリッジ)と、MEM−P115(システムメモリ)と、MEM−C116(ローカルメモリ)と、HDD117と、メモリカードスロット118と、NIC119(ネットワークインタフェースコントローラ)と、USB(Universal Serial Bus)デバイス120と、IEEE1394デバイス121と、セントロニクスデバイス122とを有する。
CPU111は、種々の情報処理を実行するためのICであり、OSまたはプラットホーム上で、アプリケーションをプロセス単位で並列的に実行する。ASIC112は、画像処理用の半導体デバイスである。NB113は、CPU111とASIC112とを接続するためのブリッジである。SB114は、NB113と周辺機器等とを接続するためのブリッジである。ASIC112とNB113とは、例えばAGP(Accelerated Graphics Port)を介して接続されている。
MEM−P115は、NB113に接続されたメモリである。MEM−C116は、ASIC112に接続されたメモリである。HDD117は、ASIC112に接続されたストレージであり、画像データ蓄積、文書データ蓄積、プログラム蓄積、フォントデータ蓄積およびフォームデータ蓄積等を行うために使用される。
HDD117には、種々のアプリケーションプログラム(コピープログラム、スキャナプログラム、プリンタプログラム、ファックスプログラム等)が記憶されている。また、HDD117には、各種のプラグインプログラムが記憶されている。
メモリカードスロット118は、SB114に接続され、メモリカード124をセット(挿入)するために使用される。メモリカード124は、USBメモリ等のフラッシュメモリであり、プログラムを配布するために使用される。また、プログラムは、所定のサーバからMFP20にダウンロードすることで配布することもできる。
NIC119は、ネットワーク等を介してMACアドレス等を使用したデータ通信を行うためのコントローラである。USBデバイス120は、USB規格に準拠したシリアルポートを提供するためのデバイスである。IEEE1394デバイス121は、IEEE1394規格に準拠したシリアルポートを提供するためのデバイスである。セントロニクスデバイス122は、セントロニクス仕様に準拠したパラレルポートを提供するためのデバイスである。NIC119と、USBデバイス120と、IEEE1394デバイス121と、セントロニクスデバイス122とは、PCI(Peripheral Component Interconnect)バスを介してNB113およびSB114に接続されている。
オペレーションパネル125は、ユーザがMFP20に入力を行うためのハードウェア(操作部)であるとともに、MFP20がメニュー画面を表示するハードウェア(表示部)である。オペレーションパネル125は、ASIC112に接続されている。FCU126と撮像部127と印刷部128とは、PCIバスを介してASIC112に接続されている。
撮像部127は、コンタクトガラスに載置された原稿を光学的に走査することでスキャンし、その反射光をA/D変換して画像処理を施し、カラーまたはモノクロの画像データを生成する。
印刷部128は、例えばタンデム型の感光ドラムを有し、画像データまたはPDL(Page Description Language)データに基づきレーザビームを変調し感光ドラムを走査して潜像を形成する。そして、印刷部128は、潜像にトナーを付着して現像した1ページ毎の画像を用紙に熱と圧力で転写する。印刷部128は、このような電子写真方式のプロッタに限られず、液滴を吐出して画像を形成するインクジェット型のプロッタエンジンでも良い。
FCU126は、NIC119を介してネットワークに接続し、例えばT.37,T.38の規格に対応した通信手順または公衆通信網に接続し例えばG3、G4規格に対応した通信手順に従い画像データの送受信を行う。また、FCU126は、MFP20の電源がOFFのときに画像データを受信しても、印刷部128を起動して画像データを用紙に印刷することができる。
MFP20は、この他に、利用者がかざしたICカードから利用者の識別情報を読み取ることができるICカードリーダを備えても良い。
次に、本実施形態におけるMFP20と文書管理サーバ30の機能の詳細について説明をする。図4は、本実施形態におけるMFP20と文書管理サーバ30の機能ブロック図である。
図4に示すように、MFP20は、表示制御部201と、ユーザ認証部202と、スキャン制御部203と、バーコード読取部204と、データ処理制御部210と、通信部220とを備える。
表示制御部201は、オペレーションパネル125を制御する。表示制御部201は、オペレーションパネル125に表示する画面を制御すると共に、ユーザがオペレーションパネル125を介して入力したデータを取得する。
ユーザ認証部202は、利用者がオペレーションパネル125から入力したログイン情報を取得し、文書管理サーバ30が保持するユーザ情報352と照合する。ログイン情報は、MFP20にログインした利用者を一意に識別することができる利用者識別情報を含む。当該識別情報によって識別される利用者が、ユーザ情報352に登録済みであれば、ユーザ認証部202は、利用者に対し、MFP20の利用を許可する。なお、MFP20がユーザ情報352を備える構成を採用しても良い。
また、MFP20がICカードリーダを備える場合は、ユーザ認証部202はICカードから取得したログイン情報に基づいて、利用者に対し、MFP20の利用を許可するか否かを判断しても良い。
スキャン制御部203は、撮像部127を制御する。また、スキャン制御部203は、撮像部127が一または複数の文書を読み取ることで生成された画像データを取得する。スキャン制御部203は、本実施形態における第1の取得部の一例である。スキャン制御部203が取得した、紙文書をスキャンすることで生成された画像データは、以下でスキャン画像と呼ぶ。スキャン画像は、本実施形態における第1の画像データの一例である。
バーコード読取部204は、撮像部127が読み取った画像から、バーコードを検出し、そのバーコードが保持する情報を取得する。
ここで、本実施形態におけるスキャン対象の文書について説明する。図5は、本実施形態におけるスキャン対象の紙文書の一例を示す図である。
図5に示すように、当該紙文書は3枚のページで構成された手術同意書(符号500〜502)である。各ページの左下と右上に、2種類のバーコード(符号600、符号601〜603)が印刷されている。
各ページの左下のバーコード(符号600)は3ページ全てに共通し、この手術同意書の文書識別情報を示している。このバーコードを文書識別情報バーコード600という。
文書識別情報とは、各文書を一意に識別することができる文書IDと、その文書IDをもつ文書の属性情報を含む。文書IDに紐づく属性情報としては、少なくとも文書種別IDを含む。その他に、属性情報は患者ID、出力元、出力日時、バージョン番号等を含んでも良い。
ここで、文書種別とは、文書を分類する種別のことをいう。例えば、文書種別としては、手術同意書、入院同意書等がある。文書種別IDは、各文書種別を一意に識別することができる。
また、患者IDとは、患者を一意に識別することができる識別情報であり、文書識別情報に含まれる場合は、当該紙文書が発行された患者を示す。
出力元とは、当該紙文書を出力した診療科を示す識別情報である。
出力日時とは、当該紙文書が印刷された日時を示す。
バージョン番号とは、当該紙文書のフォーマットのバージョンの番号のことをいう。例えば、同じ「手術同意書」でもその書式や記載内容のフォーマットは更新される場合があるので、バージョン番号は、当該紙文書が、いずれのバージョンを印刷したものであるかを示す。なお、紙文書の基となるフォーマットは、紙文書の印刷を行う電子カルテシステムで管理される。
文書識別情報バーコード600は、当該バーコードが印刷された紙文書の文書識別情報を示す。図6は、本実施形態における文書識別情報バーコード600が示すデータの構成の一例を示す図である。
図6に示すように、文書識別情報バーコード600は、図5に示す手術同意書の文書識別情報として、文書ID、患者ID、文書種別ID、出力元、出力日時、バージョン番号等を含む。
患者ID、文書種別ID、出力元、出力日時、バージョン番号は、本実施形態における文書の属性情報の一例であり、文書識別情報は、これらの全てを含む必要はない。また、文書識別情報は、これら以外の情報を、さらに含んでも良い。
図5に戻り、手術同意書の各ページの右上のバーコード(符号601〜603)はそれぞれ、各ページのページ識別情報を示している。このバーコードをページ識別情報バーコード601〜603という。
ここで、ページ識別情報とは、単一の文書を構成する1ページごとに付与された識別情報であり、当該ページを含む文書の総ページ数と、当該ページが文書中の何ページ目であるかを示す。すなわち、ページ識別情報とは、各文書におけるページの順番を示すものである。ページ識別情報、およびその中に含まれるページ番号は、本実施形態における順番情報の一例である。
ページ識別情報バーコード601〜603は、当該バーコードが印刷された各ページのページ識別情報を示す。図7は、図5に示す手術同意書の1ページ目に印刷されたページ識別情報バーコード601が示すデータの構成の一例を示す図である。
図7に示すように、ページ識別情報バーコード601は、手術同意書の総ページ数と、ページ識別情報バーコード601が印刷されたページが手術同意書の1ページ目であることを示すページ番号とを含む。
図4に戻り、バーコード読取部204は、例えば、スキャンされた画像データに対して左上から右下へ走査し、1つ目はページ識別情報バーコード601、2つ目は文書識別情報バーコード600というように、バーコードの検出順で各識別情報を特定して情報を抽出しても良いし、各識別情報を読み取る位置の座標値を設定しておき、その座標値に基づいて各識別情報を抽出しても良い。
バーコード読取部204は、文書識別情報バーコード600またはページ識別情報バーコード601〜603を読み取ることができない場合は、データ処理制御部210にバーコード検出のエラーを送出し、データ処理制御部210は、通信部220を介して文書管理サーバ30に当該エラーを通知する。
ここで、文書識別情報バーコード600とページ識別情報バーコード601〜603の形態は、図5で示したものに限らない。例えば、1つのバーコードとして文書に印字され、その1つのバーコードから抽出された情報を、桁数で区切って、文書識別情報とページ識別情報を特定しても良い。なお、文書識別情報バーコード600およびページ識別情報バーコード601〜603は、QRコード(登録商標)等の2次元バーコードでも良い。
また、文書識別情報とページ識別情報は、文書に文字として印字されていても良い。その場合は、文書管理サーバ30のOCR読取部303が、その文字を読み取って各識別情報を取得する構成を採用しても良い。バーコード読取部204とOCR読取部303は、本実施形態における読取部の一例である。バーコード読取部204とOCR読取部303の配置は、図4に示した構成に限らず、MFP20と文書管理サーバ30のどちらに含まれる構成を採用しても良い。
図4に示すMFP20のデータ処理制御部210は、プログラムを実行してデータ処理をするとともにMFP20全体を制御する。また、データ処理制御部210は、文書管理サーバ30のワークフロー制御部310から制御を受け、ワークフローに基づいた処理を各機能201〜204に実行させる。
本実施形態においてデータ処理制御部210は、スキャン制御部203が取得した画像データであるスキャン画像と、バーコード読取部204が取得した文書識別情報およびページ識別情報とを一意に対応付ける処理を行う。
通信部220は、ネットワークを介して文書管理サーバ30や管理者端末50と接続し、データの送受信を行う。データ処理制御部210は、通信部220を介して、文書管理サーバ30に、対応付けをしたスキャン画像、文書識別情報およびページ識別情報と、MFP20にログインしてスキャン処理を実行したユーザの認証情報とを、送信する。
次に、文書管理サーバ30のソフトウェア構成について説明する。図4に示すように、文書管理サーバ30は、通信部320と、第1の記憶部350と、第2の記憶部360と、ワークフロー制御部310と、ワークフローに基づいて処理を実行する各種の処理部301〜307とを備える。
通信部320は、MFP20の通信部220から送信されたデータを受信する。
第1の記憶部350はHDD104に対応する。図4に示すように、第1の記憶部350には、ワークフロー情報351、ユーザ情報352、テンプレート情報353、文書登録管理情報354が保存されている。
ワークフロー情報351は、予め登録された少なくとも1つのワークフローの定義情報が登録されたデータである。ここで、ワークフローの定義情報とは、ワークフローに含まれるそれぞれの処理の内容および実行順序を定義した情報のことをいう。ワークフローの定義情報は、コンピュータにより解釈が可能なデータ形式、例えばXML(Extensible Markup Language)等により記述される。
ワークフローの定義情報は、管理者が、管理者端末50を使用してワークフロー情報351に設定する。また、文書管理サーバ30が、ワークフローの定義情報を他のシステムから取得してワークフロー情報351に登録しても良い。
ユーザ情報352は、情報処理システム10の利用者を一意に識別する利用者識別情報が登録されたデータである。本実施形態においては各利用者が紙文書をスキャンするためにMFP20にログインすることができるか否かは、ユーザ情報352に登録されている。
また、実際にスキャンの作業を行う事務の担当者だけではなく、情報処理システム10の管理対象である文書に関係する関係者も、利用者としてユーザ情報352に登録される。例えば、本実施形態では手術同意書に署名をした患者の担当医師や看護師等を識別する情報も、ユーザ情報352に登録される。ユーザ情報352は、単一のテーブルで構成されても良いし、複数のテーブルを組み合わせて構成されても良い。
ユーザ情報352は、利用者識別情報ごとに、利用者の連絡先の情報、例えばメールアドレスを保持している。
テンプレート情報353は、テンプレートページの保存場所を示すテーブルである。
ここで、テンプレートページとは、各文書種別の文書に含まれるページを定型化した画像データである。本実施形態においては、テンプレートページはTIFF(Tag Image File Format)形式の画像ファイルであるが、ファイル形式はこれに限定されない。
図8は、本実施形態におけるテンプレートページの一例を示す図である。図8に示すテンプレートページ700は、文書種別は手術同意書、ページ番号は「0001」である。
テンプレートページは、スキャンした紙文書に欠落したページがあった場合に、その欠落した文書のページを補完する。テンプレートページは、本実施形態における第2の画像データの一例である。
例えば、図5に示す手術同意書を印刷した紙文書の例においては、1ページ目および2ページ目に記載された病院からの説明は、文書種別が「手術同意書」であれば、どの患者に対して発行された紙文書にも同様の記載が印刷されている。一方、3ページ目は、患者の署名と、その署名を行った年月日、その患者の担当医の署名等を含むため、発行された紙の手術同意書ごとに記載が異なる。
このような紙文書の登録処理をする際に、1ページ目と2ページ目は、同一の文書種別の文書と共通しているため、紙文書のページが欠落している場合であっても、テンプレートページによって補完可能である。
例えば、事務の担当者が患者から回収した紙の手術同意書の1ページ目を紛失した場合、当該手術同意書をスキャンしたスキャン画像は、1ページ目が欠落している。このような場合に、文書管理サーバ30は、図8に示すテンプレートページ700をスキャン画像の1ページ目の代わりに挿入することで、スキャン画像の欠落ページを補完する。
このような場合において、テンプレート情報353は、文書種別が「手術同意書」でページ番号が「0001」のテンプレートページの保存場所を検索するために使用される。
図9は、実施形態におけるテンプレート情報353の構成の一例を示す図である。テンプレート情報353は、少なくとも文書種別IDと、ページ番号と、保存場所とを含む。
ここで、保存場所とは、テンプレートページが保存されているフォルダ等、および、そのフォルダ内のテンプレートページである画像ファイルを特定するパスのことをいう。そのため、保存場所は、テンプレートページごとに一意になる。
本実施形態では、テンプレートページは、1ページ分ごとの画像ファイルとして、ファイルサーバ40−1に保存されている。テンプレート情報353には、その画像ファイルへのファイルパスが、保存場所として登録される。あるいは、テンプレートページは文書管理サーバ30の第1の記憶部350内に保存されても良い。
テンプレート情報353は、テンプレートページの保存場所を特定するために、文書種別IDと、ページ番号と保存場所を対応付けて登録している。例えば、図9では、文書種別が「輸血同意書」であり、かつ、その輸血同意書中の「1ページ目」に対応するテンプレートページのファイルパスである保存場所を、特定することができる。テンプレート情報353は、本実施形態における第1の対応情報の一例である。
なお、図9ではテンプレート情報353は文書種別IDに対応する文書種別の名称を示す項目「文書種別」を有するが、各レコードの文書種別を特定できれば良いので、文書種別の名称は、テンプレート情報353に必須ではない。
また、図9に示すように、テンプレート情報353は、テンプレートページの出力元、バージョン番号、登録日時を、さらに保持しても良い。
ここで、テンプレート情報353における出力元とは、当該テンプレートページが、どの診療科を出力元とする紙文書に対応するものであるかを示す。例えば、診療科ごとに文書の発行に使用している電子カルテシステムが異なる場合は、発行される紙文書の記載も診療科ごとに異なることがある。そのような場合に、スキャン画像の文書識別情報に登録された出力元に対応したテンプレートページを用意することによって、複数の診療科が発行した文書に対応することができる。
例えば、図9に示すように、同じ「手術同意書」でも、異なる出力元「01」と「02」でそれぞれ異なる記載の文書を出力している場合、テンプレート情報353は、出力元ごとに異なるテンプレートページを保持しても良い。
また、テンプレート情報353におけるバージョン番号は、当該テンプレートページが、当該文書種別の文書のどのバージョンに対応しているかを示す。例えば、図9に示すように、手術同意書のフォーマットが変更された場合、テンプレート情報353は、古いバージョンの手術同意書に対応するバージョン番号「1」のテンプレートページと、新しいバージョンの手術同意書に対応するバージョン番号「2」のテンプレートページの両方を、保持しても良い。
また、テンプレート情報353における登録日時は、テンプレートページがテンプレート情報353に登録された日時を示す。例えば、手術同意書のフォーマットが10月1日に変更され、これに伴って、テンプレート情報353に新たなテンプレートページが追加される。このような場合に、9月30日に出力された紙文書が10月1日以降に電子化されるのであれば、スキャン画像の文書識別情報に登録された出力日時より登録日時が前のテンプレートページのうち、最も新しいものを欠落ページの補完のために使用するとしても良い。
図4に戻り、文書登録管理情報354は、文書管理サーバ30がスキャン画像を編集して、登録処理を行った際に、登録失敗、または仮登録となった文書が、文書ID毎に登録されたテーブルである。
図10は、本実施形態における文書登録管理情報354の構成の一例を示す図である。図10に示すように、文書登録管理情報354は、文書ID毎に1レコードで、文書の属性情報を対応付けて保持する。
文書登録管理情報354に登録される文書の属性情報は、少なくとも、文書種別IDと、登録状態と、欠落ページ番号と、保存場所を含む。
ここで、登録状態とは、文書管理サーバ30における文書登録処理において、当該文書IDに対応するスキャン画像の処理結果を示している。本実施形態では、登録状態には、本登録、仮登録、登録失敗の3種類がある。
ここで、本登録とは、処理対象のスキャン画像に欠落ページがなく、正常に登録処理が行われたことをいう。
また、仮登録とは、処理対象のスキャン画像に欠落ページが検出されたが、テンプレートページによって補完することができたという処理結果を示す。
一方、登録状態が登録失敗であるというのは、処理対象のスキャン画像に欠落ページが検出され、その欠落ページをテンプレートページで補完することができなかったという処理結果を示す。なお、1つの文書IDのスキャン画像を構成する複数のページが欠落している場合は、その全てのページを補完することができなければ、その文書IDに対応するスキャン画像は登録失敗となる。
文書登録管理情報354は、上記の登録状態のうち、仮登録または登録失敗となった文書を登録し、後に再登録の処理を行う際に使用される。
本実施形態においては、本登録となった文書の情報は、文書登録管理情報354では管理しないが、登録状態が本登録となった文書の管理も、文書登録管理情報354が行う構成を採用しても良い。
ここで、欠落ページ番号とは、取り込まれたスキャン画像に欠落していたページのページ番号である。図10に示す例では、文書ID「00011002」のスキャン画像は、1ページ目が欠落していたため、欠落ページ番号に「0001」と登録されている。一方、文書ID「00051008」のスキャン画像は、1ページ目と3ページ目が欠落していたため、欠落ページ番号に「0001,0003」と登録されている。ここで、スキャン画像が仮登録となった場合には、欠落ページ番号は、スキャン画像の補完に用いられたテンプレートページのページ番号と等しくなる。欠落ページ番号も、ページ識別情報、ページ番号と同様に、本実施形態における順番情報の一例である。
また、文書登録管理情報354における保存場所とは、仮登録または登録失敗となったスキャン画像が保存されるフォルダ等を示す。図9で説明したテンプレート情報353の保存場所がファイルパスを示していたのに対して、文書登録管理情報354は、スキャン画像をページ単位ではなく、同一の文書IDに紐づく複数のページ分のスキャン画像を1レコードで管理するため、文書登録管理情報354の保存場所は、スキャン画像が保存されたフォルダのパスを示す。後述の再登録処理において、同一の文書IDに紐づくスキャン画像をまとめて処理をすることから、このような構成が採用されている。
その他に、文書登録管理情報354に登録される文書の属性情報は、患者ID、出力元、出力日時、バージョン番号、登録日時等を含んでも良い。
ここで、文書登録管理情報354における患者ID、出力元、出力日時、バージョン番号とは、スキャン画像の文書識別情報に含まれていた患者ID、出力元、出力日時である。
ここで、文書登録管理情報354における登録日時とは、文書管理サーバ30が当該文書IDのスキャン画像に対して、前回の登録処理を行った年月日と時間を示す。
図4に戻り、第2の記憶部360は、RAM103に対応する。図4に示すように、第2の記憶部360には、スキャン画像情報361が保存されている。
スキャン画像情報361は、登録対象のスキャン画像の文書識別情報およびページ識別情報を、登録処理が行われている間、一時的に保存するためのテーブルである。スキャン画像情報361には、MFP20から送られたスキャン画像の文書識別情報およびページ識別情報が、1ページ分のスキャン画像ごとに、対応付けられて登録されている。
図11は、本実施形態におけるスキャン画像情報361の構成の一例を示す図である。図11に示すように、スキャン画像情報361は、所定の保存場所に保存された各スキャン画像のファイルパスに対して、そのスキャン画像に対応するページ識別情報と文書識別情報とを同一のレコードで保持している。スキャン画像の画像データの保存場所は、第2の記憶部360内に限定されず、例えば、第1の記憶部350であっても良い。
また、スキャン画像情報361は、MFP20にログインしてスキャン処理を実行したユーザの認証情報を、さらに保持しても良い。
本実施形態において、第1の記憶部350および第2の記憶部360は、記憶部の一例である。
図4に戻り、ワークフロー制御部310は、ワークフロー情報351に登録されたワークフローの定義情報に基づいて、文書管理サーバ30の各種の処理部301〜307、およびMFP20のデータ処理制御部210の制御を行う。各ワークフローは、予め管理者が設定した基準に基づいて開始されても良いし、利用者が実行することで開始しても良い。本実施形態における文書の電子化処理のワークフローは、例えば、利用者がMFP20のオペレーションパネル125に表示された処理のメニューから、文書の電子化処理を選択することで開始する。
文書管理サーバ30は、ワークフローに基づいて処理を実行する各種の処理部として、文書情報照合部301、文書編集部302、OCR読取部303、PDF変換部304、ファイル配信部305、メール配信部306、テンプレート生成部307を備える。
文書情報照合部301は、スキャン画像の文書識別情報に基づいて、同一文書から生成されたスキャン画像を特定し、スキャン画像のページ識別情報に基づいて、その特定された同一文書のスキャン画像に欠落したページがあるか否かを判断する。例えば、スキャン画像情報361に登録されたデータの中に、ページ識別情報「0002 0003」に紐づくスキャン画像と、「0003 0003」に紐づくスキャン画像はあるが、ページ識別情報「0001 0003」に紐づくスキャン画像がない場合、総ページ数が3ページの文書のうち、1ページ目が欠落していることが検出できる。
また、文書情報照合部301は、スキャン画像情報361に登録された文書の文書IDが、文書登録管理情報354に登録されている登録状態が登録失敗または仮登録である文書の文書IDのいずれかと、一致するか否かを照合する。
ここで、スキャン画像情報361に登録された文書の文書IDが、文書登録管理情報354に、登録失敗として登録されていれば、そのスキャン画像は、以前の処理で登録失敗となった文書を再登録するために、読み込まれたものである。
また、スキャン画像情報361に登録された文書の文書IDが、文書登録管理情報354に、仮登録として登録されていれば、そのスキャン画像は、以前の処理で仮登録となった文書を再登録するために、読み込まれたものである。
一方、スキャン画像情報361に登録された文書の文書IDが文書登録管理情報354に登録されていなければ、そのスキャン画像は新規に登録されるものである。
文書編集部302は、スキャン画像情報361に登録されたスキャン画像を文書IDごとに分割して編集する。例えば、文書編集部302は、同一文書IDのスキャン画像を、各スキャン画像に対応するページ番号に基づいてソートする処理を行う。
また、文書編集部302は、文書情報照合部301が検出したスキャン画像の欠落ページを、テンプレートページで補完する処理を行う。具体的には、文書編集部302は、スキャン画像の文書識別情報とページ識別情報に基づいてテンプレート情報353からテンプレートページの保存場所を特定し、特定した保存場所からスキャン画像の欠落したページに対応するテンプレートページを取得し、取得したテンプレートページで欠落したページを補完する。文書編集部302は、本実施形態における第2の取得部の一例である。
文書編集部302は、登録失敗文書および仮登録文書の再登録処理においては、以前の登録処理で保存したスキャン画像に対して、今回の登録処理で取り込まれた文書IDが同一のスキャン画像を追加してページの欠落を解消する。
すなわち、文書編集部302は、スキャン制御部203が取得したスキャン画像が、文書登録管理情報354に登録された文書の文書IDおよび欠落ページ番号に対応する場合に、文書登録管理情報354に登録された保存場所から、以前の処理で読み込まれたスキャン画像を取得する。その後、文書編集部302は、スキャン制御部203が取得したスキャン画像と、以前の処理で読み込まれたスキャン画像とを、ページ番号に基づいて、ソートをする。
さらに、文書編集部302は、編集したスキャン画像をPDF変換部304に渡す。PDF変換部304でのPDF変換の処理が終了後に、文書編集部302は、PDFファイルの基となった変換前のスキャン画像のデータを削除し、スキャン画像情報361から、当該スキャン画像に対応するレコードを削除する。
また、編集処理を行ったスキャン画像に欠落ページがあった場合は、文書登録管理情報354に、登録状態を仮登録、または登録失敗にして、文書ID毎に欠落ページの番号と属性情報を登録する。対象のスキャン画像が、既に仮登録や登録失敗のステータスで文書登録管理情報354に登録されている場合は、文書登録管理情報354の欠落ページや登録日時の情報を上書きして更新する。また、再登録時に前回までの処理で欠落していたページに対応するスキャン画像が新たに取り込まれた場合は、文書編集部302は、その文書に対応するレコードを、文書登録管理情報354から削除する。
OCR読取部303は、スキャン画像に対してOCR処理を行うことにより、データを取得する。例えば、ページ識別情報バーコード601〜603が印刷されない紙文書を登録する場合、OCR読取部303は、スキャン画像から、ページ識別情報に相当する、文書の総ページ数と、各ページのページ番号を読み取る。また、OCR読取部303は、各文書に記載された患者や医師の氏名の読み取りや、各ページに署名等の手書き文字が存在するか否かを検出することもできる。
PDF変換部304は、文書編集部302が編集した一または複数のスキャン画像を、文書IDごとに単一のPDFファイルに変換する。なお、複数のスキャン画像を1つのPDFファイルに変換する場合には、複数ページによって構成されるマルチページ形式のPDFファイルに変換する。
また、文書編集部302がスキャン画像の欠落ページをテンプレートページで補完した場合は、PDF変換部304は、スキャン画像およびテンプレートページから、単一のPDFファイルを生成する。
登録失敗文書および仮登録文書の再登録処理においては、PDF変換部304は、文書編集部302がページ番号に基づいてソートをした、スキャン制御部203が取得したスキャン画像と、文書編集部302により保存場所から取得されたスキャン画像とを、文書編集部302から受け取り、それらの画像から、文書IDごとに単一のPDFファイルを生成する。
PDFファイルは本実施形態における文書データの一例であり、コンピュータで加工可能であれば、他のファイル形式を採用しても良い。PDF変換部304は、本実施形態における生成部の一例である。
ファイル配信部305は、PDF変換部304が生成したPDFファイルを、所定の保存場所に配信する。ファイル配信部305は、本実施形態における配信部の一例である。具体的には、ファイル配信部305は、文書管理サーバ30の所定の場所にPDFファイルを格納し、FTPサーバ40−2、またはWebDAVサーバ40−3のファイル転送の機能を利用して、ファイルサーバ40−1内の所定のフォルダに転送する。
また、ファイル配信部305は、PDFファイルの配信前に、転送先のファイルサーバ40−1内のフォルダを参照し、2重配信のチェック処理を行う。すなわち、転送先のフォルダに、転送予定のPDFファイルと重複するPDFファイルが存在することを検出した場合は、ファイル配信部305は、重複するPDFファイルの管理情報を取得する。
2重配信をチェックする方法としては、例えば、PDF変換部304が、PDFファイルを生成する際に、文書IDと登録状態を含むファイル名を付与しておいても良い。この場合、ファイル配信部305が、転送先フォルダに格納されたファイルに同一の文書IDを含む文書ファイルが存在するか否かを、ファイル名から検出することができる。また、ファイル名に登録日時や、紙文書の電子化を行った利用者の識別情報を登録ユーザ情報として含めておくことで、ファイル配信部305が、重複するPDFファイルの管理情報を取得することができる。
その他の方法として、ファイルサーバ40−1がPDFファイルの管理情報を保持し、ファイル配信部305が、ファイルサーバ40−1のファイル管理情報を参照して重複するPDFファイルの存在確認および管理情報の取得をしても良い。
ただし、登録状態が仮登録のPDFファイルを、後の処理で登録状態が本登録のPDFファイルよって置き換えることは通常の処理であるので、ファイル配信部305は、このような場合は重複とは判断しない。
メール配信部306は、MFP20または文書管理サーバ30が行う紙文書の電子化の処理においてエラーが発生した場合に、メールサーバ40−4を介して所定の通知対象者にメールを配信してエラーを通知する。メール配信部306は、通知対象者のメールアドレスをユーザ情報352から取得して、メールの送信の宛先として用いる。
メール配信部306がエラーを通知する通知対象者は、MFP20を使用して紙文書のスキャンを実行したことをユーザ認証部202が識別した利用者の他、スキャンされた文書の関係者を含めても良い。例えば、スキャンされた文書が手術同意書であれば、その手術同意書に署名をした患者の担当医師や看護師等の関係者にエラーを通知しても良い。
このような関係者は、メール配信部306が、スキャン画像情報361に保存された文書識別情報に含まれる患者IDを用いて、ユーザ情報352を検索することで取得することができる。または、OCR読取部303が各文書に記載された患者や医師の氏名の文字を読み取り、それをメール配信部306が取得して、ユーザ情報352を検索することでも関係者のメールアドレスを特定することができる。文書識別情報に含まれる患者IDや、文書に記載された患者や医師の氏名は、本実施形態における関係者を識別するための個人識別情報の一例である。
メール配信部306がエラーを通知する場合として、例えば、前述の2重配信のチェックの結果、ファイル配信部305によって重複する文書ファイルが検出された場合、メール配信部306は、前述の通知対象者に、ファイル配信部305が検出した重複する文書ファイルの管理情報を通知する。その他に、文書編集部302が行った登録処理の結果が、登録失敗となった場合や、MFP20のバーコード読取部204が、正常に文書識別情報またはページ識別情報を読み取ることができない場合等に、メール配信部306はエラーを通知する。
メール配信部306は、本実施形態における通知部の一例であり、エラーの通知方法はメールの配信に限らない。例えば、MFP20のオペレーションパネル125にエラー内容を表示して利用者に通知しても良いし、各通知対象者が使用するコンピュータ端末の画面上に表示してエラーを通知する構成を採用しても良い。また、前述の通知対象者は一例であり、文書種別や、検出されたエラーの種類によって通知対象を変更する構成を採用しても良い。
前述の文書編集部302が、欠落ページの保存に用いるテンプレートページは、予め生成されてテンプレート情報353に登録されている必要がある。テンプレートページは管理者が管理者端末50より画像データを入力して作成しても良いが、本実施形態の文書管理サーバ30においては、見本となる紙文書をスキャンした画像から、テンプレートページを生成することができる。
テンプレート生成部307は、テンプレートページをスキャン画像から生成し、所定の保存場所に保存する。テンプレート生成部307は、テンプレートページを生成した場合には、テンプレート情報353に生成したテンプレートの情報を登録する。テンプレート生成部307は、本実施形態における第2の画像データ生成部の一例である。
この場合、患者の署名等の手書きされた文字が含まれるスキャン画像はテンプレートページにしてはいけないので、OCR読取部303は、MFP20から受信したスキャン画像を読み取り、手書きされた情報が含まれるか否かを検出する処理を行う。または、予め、テンプレートページにしないページの番号を文書管理サーバ30に登録し、そのページ番号に該当するスキャン画像をテンプレート作成処理から除いても良い。
具体的には、テンプレートの生成を行う場合、MFP20の撮像部127はテンプレートページの基となる文書を読み取る。スキャン制御部203は、読み取られた文書のスキャン画像を取得する。OCR読取部303は、スキャン画像を読み取り、手書きされた情報が含まれるか否かを検出する。テンプレート生成部307は、スキャン画像のうち、OCR読取部303によって手書きされた情報が検出されなかったものを、テンプレートページとして保存する。
次に、以上のように構成された本実施形態の文書の電子化処理について説明する。図12は、本実施形態における文書の電子化処理の手順の一例を示すフローチャートである。
このフローチャートの処理は、例えば利用者がMFP20のオペレーションパネル125にログイン情報を入力することで開始する。
最初のステップS101で、利用者がオペレーションパネル125に入力したログイン情報を、表示制御部201が取得する。ユーザ認証部202が、文書管理サーバ30のユーザ情報352を参照し、取得したログイン情報に含まれる利用者の識別情報が、当該MFP20を使用可能な利用者として登録されているか否かを判断する。登録されていた場合は、ユーザ認証部202は当該利用者の利用を許可する。その後、利用者は、文書の電子化のワークフローをオペレーションパネル125に表示されたメニューから選択する。
次のステップS102で、MFP20のスキャン制御部203は、撮像部127を制御して、利用者が原稿としてMFP20に設置した紙文書をスキャンし、スキャン画像を生成する。ここで、図13は、本実施形態におけるスキャンされた新規文書の登録処理の内容を説明する説明図である。ステップS102でスキャンされた原稿は、図13に示すように、ページの順番が前後していたり、複数の文書種別の文書が含まれたりしていても良い。
図12に戻り、次のステップS103で、スキャン制御部203は、全ての原稿のスキャンが完了したかを判断し、完了していなければ(S103“No”)、ステップS102に戻る。
全ての原稿のスキャンが完了した場合(S103“Yes”)、ステップS104で、バーコード読取部204は、原稿1ページ分ごとに生成されたスキャン画像に文書識別情報とページ識別情報の2種類のバーコードが存在するかを判断する。
スキャン画像から、2種類のバーコードを読み取ることができなかった場合(S104“No”)、ステップS105で、バーコード読取部204は、データ処理制御部210にバーコード検出のエラーを送出する。メール配信部306は、当該エラーの検出を受けて、当該原稿のスキャンを行った利用者にメールを送信してエラーを通知する。
メール配信部306がメールを送信するタイミングは、エラーが検出される毎に随時実施しても良いし、全てのスキャン画像に対するバーコード読取処理の終了後にまとめて行っても良い。
スキャン画像から、2種類のバーコードを読み取ることができた場合(S104“Yes”)、ステップS106で、バーコード読取部204は、これらのバーコードから、文書識別情報、およびページ識別情報のデータを取得する。
次のステップS107で、データ処理制御部210は、スキャン画像と、バーコード読取部204が読み取った文書識別情報およびページ識別情報とを、対応付ける。
次のステップS108で、データ処理制御部210は、全てのスキャン画像についてバーコード読み取りの処理が完了したか否かを判断する。処理が完了していない場合(S108“No”)、データ処理制御部210はバーコード読取部204を制御し、ステップS104〜S107の処理を再度行う。
全てのスキャン画像についてバーコード読み取りの処理が完了した場合(S108“Yes”)、次のステップS109で、データ処理制御部210は、スキャン画像と、文書識別情報と、ページ識別情報と、ユーザの認証情報とを、通信部220を介して文書管理サーバ30に送信する。文書管理サーバ30の通信部320はデータを受信する。ワークフロー制御部310の制御に基づいて、受信されたデータはスキャン画像情報361に保存される。
次のステップS200で、文書管理サーバ30の各処理部が、各スキャン画像を文書識別情報の文書IDごとに分割して、文書登録処理を実施する。ここで、図13に示すように、複数の文書IDの紙文書が混在する状態でスキャンされた場合でも、文書IDごとの単位で、スキャン画像に対して文書登録処理が行われる。図12に戻り、ステップS200に含まれる各処理が終了すると、文書の電子化処理は終了する。
次に、ステップS200の文書登録処理の内容について説明する。図14は、本実施形態における文書電子化処理に含まれる、文書登録処理の手順の一例を示すフローチャートである。
最初のステップS201で、文書情報照合部301は、スキャン画像情報361に登録された文書の文書IDが、文書登録管理情報354に登録されている登録状態が登録失敗の文書の文書IDのいずれかと、一致するか否かを照合する。
登録失敗の文書の文書IDと一致した場合(S201“Yes”)、ステップS400で、登録失敗文書の再登録処理が開始する。
登録失敗の文書の文書IDと一致しない場合(S201“No”)、ステップS202で、文書情報照合部301は、スキャン画像情報361に登録された文書の文書IDが、文書登録管理情報354に登録されている登録状態が仮登録の文書の文書IDのいずれかと、一致するか否かを照合する。
仮登録の文書の文書IDと一致した場合(S202“Yes”)、ステップS500で、仮登録文書の再登録処理が開始する。
仮登録の文書の文書IDと一致しない場合(S202“No”)、ステップS300で、新規文書の登録処理が開始する。
図14に示す処理の終了によって、ステップS200の文書登録処理は終了し、図12の文書の電子化処理のフローに戻る。
次に、ステップS300の新規文書の登録処理の内容について説明する。図15は、本実施形態における新規文書の登録処理の手順の一例を示すフローチャートである。
最初のステップS301で、文書情報照合部301が、スキャン画像に紐づくページ識別情報から、欠落ページの有無を判断する。
欠落ページが検出されない場合(S301“No”)、ステップS302で、文書編集部302は、文書IDが同一のスキャン画像を、各スキャン画像に対応するページ番号に基づいてソートする。PDF変換部304は、文書編集部302がソートしたスキャン画像を、PDF形式に変換し、単一のPDFファイルを生成する。このステップS302の処理は、図13に示す種別A、および種別Cの文書の編集処理に相当する。
図15に戻り、ステップS303で、文書編集部302は、PDF変換が終了したスキャン画像のデータを削除し、スキャン画像情報361から、対応するレコードを削除する。
次に、ステップS304で、ファイル配信部305は、配信先フォルダに重複したファイルが存在するか否かを判断する。
重複したファイルが存在しない場合(S304“No”)、ステップS305で、ファイル配信部305は、生成したPDFファイルを、配信用フォルダに格納し、所定の配信先フォルダへの転送処理を行う。
重複したファイルが存在する場合(S304“Yes”)、ステップS306で、ファイル配信部305は、重複したファイルの管理情報等のデータを取得する。
ステップS307で、メール配信部306は、通知対象者に、エラー内容を記載したメールを送信する。この場合、メール配信部306は、エラー内容として、重複したファイルの管理情報等のデータを含める。
一方、欠落ページが検出された場合(S301“Yes”)、ステップS308で、文書編集部302は、全ての欠落ページに対応するテンプレートページが存在するか否かを、テンプレート情報353を照会して判断する。
全ての欠落ページに対応するテンプレートページが存在する場合(S308“Yes”)、ステップS309で、文書編集部302は、文書IDが同一のスキャン画像を、各スキャン画像に対応するページ番号に基づいてソートし、欠落ページをテンプレートページの画像データで補完する。PDF変換部304は、文書編集部302が編集したスキャン画像を、PDF形式に変換し、単一のPDFファイルを生成する。
次のステップS310で、文書編集部302は、編集したスキャン画像を所定の保存場所に保存する。また、文書編集部302は、登録状態を仮登録として、当該スキャン画像の文書IDと、欠落ページの番号等を、文書登録管理情報354に登録する。
このステップS309、およびS310の処理は、図13に示す種別Bの文書の編集処理に相当する。
図15に戻り、ステップS311で、文書編集部302は、スキャン画像情報361から、文書登録管理情報354に登録したスキャン画像に対応するレコードを、削除する。
次のステップS304で文書情報照合部301が重複チェックの処理を実施する。
重複ファイルが検出されなかった場合(S304“No”)、ステップS305で、ファイル配信部305は、ファイルの転送処理を行う。
重複ファイルが検出された場合(S304“Yes”)、前述のステップS306〜S307の処理が行われる。
一方、テンプレートページで補完することができない欠落ページがあった場合(S308“No”)、ステップS312で、文書編集部302は、スキャン画像を所定の保存場所に保存する。また、文書編集部302は、登録状態を登録失敗として、当該スキャン画像の文書IDと、欠落ページの番号等を、文書登録管理情報354に登録する。
次のステップS313で、文書編集部302は、スキャン画像情報361から、文書登録管理情報354に登録したスキャン画像に対応するレコードを、削除する。
そして、ステップS307で、メール配信部306は、通知対象者に、エラー内容を記載したメールを送信する。この場合は、メール配信部306は、メールに記載するエラー内容として、当該文書の文書ID、欠落ページのページ番号等を含めても良い。
図15に示す処理の終了によって、ステップS300の新規文書の登録処理は終了し、図14の文書登録処理のフローに戻る。
次に、ステップS400の登録失敗文書の再登録処理の内容について説明する。図16は、本実施形態における登録失敗文書の再登録処理の手順の一例を示すフローチャートである。当該処理の対象となるスキャン画像は、以前に登録処理の対象となり、その際に欠落ページが検出され、全ての欠落ページをテンプレートページで補完することができず、登録失敗となったものである。
最初のステップS401で、文書編集部302は、全ての欠落ページ番号に対応するページが、今回取り込まれたスキャン画像に含まれるか否かを判断する。
全ての欠落ページ番号に対応するページが、今回取り込まれたスキャン画像に含まれる場合(S401“Yes”)、ステップS402で、文書編集部302は、前回までの登録処理で保存したスキャン画像に、ページの欠落を解消するために今回の登録処理で取り込まれた文書IDが同一のスキャン画像を追加し、ページ番号に基づいてソートする。PDF変換部304は、文書編集部302がソートしたスキャン画像を、PDF形式に変換し、単一のPDFファイルを生成する。
次に、ステップS403で、文書編集部302は、ページの欠落が全て解消された当該文書IDのレコードを、文書登録管理情報354から削除する。
次に、ステップS404で、文書編集部302は、PDF変換が終了したスキャン画像のデータを削除し、スキャン画像情報361から、対応するレコードを削除する。
次に、ステップS405で、ファイル配信部305は、配信先フォルダに重複したファイルが存在するか否かを判断する。
重複したファイルが存在しない場合(S405“No”)、ステップS406で、ファイル配信部305は、生成したPDFファイルを、配信用フォルダに格納し、所定の配信先フォルダへの転送処理を行う。
重複したファイルが存在する場合(S405“Yes”)、ステップS407で、ファイル配信部305は、重複したファイルの管理情報等のデータを取得する。
ステップS408で、メール配信部306は、通知対象者に、エラー内容を記載したメールを送信する。
一方、今回読み込まれたスキャン画像では、解消しないページの欠落がある場合(S401“No”)、ステップS409で、文書編集部302は、スキャン画像に含まれない全ての欠落ページに対応するテンプレートページが存在するか否かを、テンプレート情報353を照会して判断する。
スキャン画像に含まれない全ての欠落ページに対応するテンプレートページが存在する場合(S409“Yes”)、ステップS410で、文書編集部302は、前回までの登録処理で保存したスキャン画像に、ページの欠落を解消するために今回の登録処理で取り込まれた文書IDが同一のスキャン画像を追加し、ページ番号に基づいてソートする。文書編集部302は、欠落ページをテンプレートページの画像データで補完する。PDF変換部304は、文書編集部302が編集したスキャン画像を、PDF形式に変換し、単一のPDFファイルを生成する。
ステップS411で、文書編集部302は、編集したスキャン画像を所定の保存場所に保存する。また、文書編集部302は、登録状態を仮登録として、当該スキャン画像の文書IDと、欠落ページの番号等を、文書登録管理情報354に登録する。この場合、文書編集部302は、前回の登録処理の際に登録されたレコードを上書きして、文書登録管理情報354を更新する。
例えば、前回の登録処理時に欠落ページ番号として1ページ目と2ページ目が登録されていた場合に、今回の再登録処理で1ページ目のスキャン画像が読み込まれたのであれば、欠落ページ番号を2ページ目のみとするように、文書編集部302は、文書登録管理情報354を上書きする。
ステップS412で、文書編集部302は、スキャン画像情報361から、文書登録管理情報354に登録したスキャン画像に対応するレコードを、削除する。
その後、ステップS405〜S408の処理が行われる。
一方、スキャン画像に含まれず、テンプレートページで補完することもできない欠落ページがあった場合(S409“No”)、ステップS413で、文書編集部302は、スキャン画像を所定の保存場所に保存する。また、文書編集部302は、登録状態を登録失敗として、当該スキャン画像の文書IDと、欠落ページの番号等を、文書登録管理情報354に登録する。この場合、文書編集部302は、前回の登録処理の際に登録されたレコードを上書きして、文書登録管理情報354を更新する。
次のステップS414で、文書編集部302は、スキャン画像情報361から、文書登録管理情報354に登録したスキャン画像に対応するレコードを、削除する。
次に、ステップS408で、メール配信部306は、通知対象者に、エラー内容を記載したメールを送信する。
図16に示す処理の終了によって、ステップS400の登録失敗文書の再登録処理は終了し、図14の文書登録処理のフローに戻る。
次に、ステップS500の仮登録文書の再登録処理の内容について説明する。図17は、本実施形態における仮登録文書の再登録処理の手順の一例を示すフローチャートである。当該処理の対象となるスキャン画像は、以前に登録処理の対象となり、その際に欠落ページが検出され、テンプレートページで補完して仮登録されたものである。
前提として、当該文書は、前回までの登録処理で、欠落ページをテンプレートページによって補完することが可能であった文書である。よって、図17に示す処理では、当該文書は、新たに読み込まれたスキャン画像によってページの欠落が解消して本登録されるか、スキャン画像には全ての欠落ページは含まれず、再びテンプレートで補完して仮登録されるか、のいずれかの結果となる。
最初のステップS501で、文書編集部302は、全ての欠落ページ番号に対応するページが、今回取り込まれたスキャン画像に含まれるか否かを判断する。
全ての欠落ページ番号に対応するページが、今回取り込まれたスキャン画像に含まれる場合(S501“Yes”)、ステップS502で、文書編集部302は、前回の登録処理で保存したスキャン画像に、ページの欠落を解消するために今回の登録処理で取り込まれた文書IDが同一のスキャン画像を追加し、ページ番号に基づいてソートする。PDF変換部304は、文書編集部302がソートしたスキャン画像を、PDF形式に変換し、単一のPDFファイルを生成する。
次に、ステップS503で、文書編集部302は、ページの欠落が全て解消された当該文書IDのレコードを、文書登録管理情報354から削除する。
次に、ステップS504で、文書編集部302は、PDF変換が終了したスキャン画像のデータを削除し、スキャン画像情報361から、対応するレコードを削除する。
次に、ステップS505で、ファイル配信部305は、生成したPDFファイルを、配信用フォルダに格納し、所定の配信先フォルダへの転送処理を行う。この場合は、前回までの登録処理によって仮登録のファイルが生成されていることが前提であるため、ファイル配信部305は、2重配信チェックをせず、もし送信先のフォルダに重複するファイルがある場合は、今回の再登録処理で生成されたPDFファイルで置き換える。ただし、1度仮登録を行った後は再登録をしないという業務の流れである場合等は、仮登録文書の再登録処理においてもファイル配信部305が2重配信チェックをする構成としても良い。
一方、今回読み込まれたスキャン画像では、解消しないページの欠落がある場合(S501“No”)、ステップS506で、文書編集部302は、前回の登録処理で保存したスキャン画像に、ページの欠落を解消するために今回の登録処理で取り込まれた文書IDが同一のスキャン画像を追加し、ページ番号に基づいてソートする。文書編集部302は、欠落ページをテンプレートページの画像データで補完する。PDF変換部304は、文書編集部302が編集したスキャン画像を、PDF形式に変換し、単一のPDFファイルを生成する。
次に、ステップS507で、文書編集部302は、編集したスキャン画像を所定の保存場所に保存する。また、文書編集部302は、登録状態を仮登録として、当該スキャン画像の文書IDと、欠落ページの番号等を、文書登録管理情報354に登録する。この場合、文書編集部302は、前回の登録処理の際に登録されたレコードを上書きして、文書登録管理情報354を更新する。
ステップS508で、文書編集部302は、スキャン画像情報361から、文書登録管理情報354に登録したスキャン画像に対応するレコードを、削除する。
そして、ステップS505で、ファイル配信部305は、生成したPDFファイルを、配信用フォルダに格納し、所定の配信先フォルダへの転送処理を行う。
図17に示す処理の終了によって、ステップS500の仮登録文書の再登録処理は終了し、図14の文書登録処理のフローに戻る。
上記の処理の流れは、ワークフロー制御部310によって各処理部が制御されることによって実行される。
このように本実施形態では、取得したスキャン画像から、バーコード読取部204が文書識別情報とページ識別情報を読み取ることにより、文書情報照合部301がページ識別情報に基づいて、スキャン画像に欠落ページがあるか否かを判断する。また、文書編集部302が、文書識別情報とページ識別情報に基づいて、テンプレート情報353を照会することにより、欠落ページに対応するテンプレートページを取得する。そのため、スキャン対象の紙文書に欠落したページがあっても、文書編集部302がテンプレートページによって欠落したページを補完して仮登録をする。これにより、本実施形態によれば、ページが欠落していることを原因とする登録エラーの発生頻度を抑制することができる。
このため、本実施形態のMFP20および文書管理サーバ30によれば、仮登録の状態でPDFファイルが配信されるので、利用者は後続の業務を行うことができ、業務上の処理が止まることを防止することができる。
また、欠落ページがテンプレートページによって補完されるため、本実施形態によれば、利用者が欠落した紙文書のページを探したり、文書全体を再度作成し直したりという手作業を削減することができる。
このように、本実施形態のMFP20および文書管理サーバ30によれば、業務上の処理が停止することの防止や、手作業の削減をすることができるため、業務を効率化することができる。
さらに、本実施形態のテンプレート生成部307によれば、スキャン画像を用いて効率的にテンプレートページを生成することができる。また、その際、OCR読取部303が、スキャン画像に手書きされた情報が含まれるか否かを検出することで、テンプレート生成部307は、スキャン画像のうち、手書きされた情報を含まないページのみをテンプレートページとすることができるので、署名等を含む置き換え不可能なページについて、誤ってテンプレートページを生成してしまうことを防止することができる。
(変形例1)
上記の実施形態では、テンプレート情報353には、スキャン画像の欠落ページを補完可能なテンプレートページを検索するための情報が登録されていたが、変形例1では、テンプレート情報353は、欠落したとしてもテンプレートページによって補完してはいけないページのページ番号を、さらに保持する。
本変形例における情報処理システム10の概要構成、MFP20および文書管理サーバ30のハードウェア構成は、図1〜図3で説明した構成と同様である。
本変形例におけるテンプレート情報353は、患者のサインが記入されるページのように、欠落したとしてもテンプレートページによって補完してはいけないページのページ番号を、さらに保持する。補完してはいけないページは、文書種別ごとに異なり、各文書種別につき一または複数のページのページ番号を登録することができる。
また、本変形例における文書編集部302は、スキャン画像の欠落ページを補完するためのテンプレートページの保存場所を検索する前に、テンプレート情報353から、当該スキャン画像に対応する文書種別における、補完してはいけないページのページ番号を取得する。そして、取得したページ番号に、当該スキャン画像の欠落ページのページ番号が含まれた場合、文書編集部302は、その欠落ページを補完しない。
この場合、文書編集部302は、当該スキャン画像を登録失敗として文書登録管理情報354に登録する。
なお、テンプレート情報353は、1つのテーブルで構成されても良いし、複数のテーブルを組み合わせて構成されても良い。
また、本変形例のMFP20と文書管理サーバ30のその他の構成については、図4〜図11を用いて説明した実施形態の構成と同様である。
本変形例における文書電子化処理では、図15に示す新規文書の登録処理のステップS308において、文書編集部302が、全ての欠落ページに対応するテンプレートページが存在するか否かをテンプレート情報353を照会して判断する前に、各欠落ページのページ番号が、補完してはいけないページのページ番号に含まれるか否かを、判断する。
補完してはいけないページのページ番号に合致する欠落ページが1つでも存在する場合、当該スキャン画像はテンプレートページによる補完ができないため、ステップS308の結果は“No”となり、文書編集部302は、ステップS312の処理に進む。
欠落ページの中に、補完してはいけないページが存在しない場合(S308“Yes”)、文書編集部302は、ステップS309の処理に進む。
図16に示す登録失敗文書の再登録処理のステップS409においても、文書編集部302は、各欠落ページのページ番号が、補完してはいけないページのページ番号に含まれるか否かを、判断し、補完してはいけないページ番号に合致する欠落ページがあれば(S409“No”)、ステップS413に進み、補完してはいけないページ番号に合致する欠落ページがなければ(S409“Yes”)、ステップS410に進む。
また、図17に示す仮登録文書の再登録処理のステップS501においても、文書編集部302は、各欠落ページのページ番号が、補完してはいけないページのページ番号に含まれるか否かを、判断し、補完してはいけないページ番号に合致する欠落ページがあれば(S501“No”)、ステップS506に進み、補完してはいけないページ番号に合致する欠落ページがなければ(S501“Yes”)、ステップS502に進む。
本変形例におけるその他の処理の手順については、図10〜図17を用いて説明した実施形態における処理手順と同様である。
このように、本変形例によれば、例えば、管理者が誤って、患者のサイン等が必要なページのテンプレートページを作成し、その保存場所をテンプレート情報353に登録してしまった場合でも、スキャン画像の欠落ページが補完してはいけないページが否かを、文書編集部302がテンプレート情報353を参照して確認するため、そのようなページをテンプレートページで補完することを防止することができる。
すなわち、本変形例では、テンプレート情報353が補完してはいけないページのページ番号をさらに有し、文書編集部302が補完してはいけないページのページ番号に該当する欠落ページを補完しないことにより、業務上、登録失敗としてエラーが通知されるべきページの欠落が見落とされて処理が進行することを防止することができ、処理の正確性が向上する。
(変形例2)
上記の実施形態では、MFP20のユーザ認証部202が、利用者がオペレーションパネル125から入力したログイン情報を、文書管理サーバ30が保持するユーザ情報352と照合してユーザ認証を行っていたが、変形例2では、外部認証サーバ40−5がユーザ認証を行う。
図18は、本変形例における情報処理システム10の概要構成の一例を示す図である。図18に示すように、本変形例の情報処理システム10は、外部認証サーバ40−5をさらに備える。ここで、本変形例の情報処理システム10を構成するその他の装置は、図1において説明した実施形態の構成と同様である。
外部認証サーバ40−5は、利用者がオペレーションパネル125から入力したログイン情報を、MFP20から受信する。外部認証サーバ40−5は、受信したログイン情報を基に利用者の認証を実行し、認証結果をMFP20に返信する。
外部認証サーバ40−5は、MFP20にログイン可能な利用者の識別情報を有し、利用者が入力したログイン情報に基づいて、その利用者がMFP20を利用することを許可するか否かを決定することができる。例えば、外部認証サーバ40−5は、ActiveDirectoryサーバ、LDAP(Lightweight Directory Access Protocol)サーバ等で実現されても良い。また、外部認証サーバ40−5の機能は、クラウドサービス、ASPなどのような各種サービスによって提供されても良い。
図18に示すように、外部認証サーバ40−5は、MFP20と、相互に通信可能なネットワークで接続している。外部認証サーバ40−5は、利用者がMFP20のオペレーションパネル125から入力したログイン情報を、MFP20から受信する。そして、外部認証サーバ40−5は、受信したログイン情報に基づいて利用者の認証を実行して、その利用者がMFP20を利用可能であるか否かを判断した認証結果を、MFP20に返信する。
なお、外部認証サーバ40−5のハードウェア構成は、図2で説明した文書管理サーバ30の構成と同様である。
図19は、本変形例におけるMFP20と文書管理サーバ30の機能ブロック図である。図19に示すように、本変形例におけるMFP20は、外部認証サーバ認証部230を、さらに備える。
外部認証サーバ認証部230は、外部認証サーバ40−5が送信した認証結果を、データ処理制御部210の制御の下、通信部220を介して受け取ることにより、MFP20にログイン情報を入力した利用者の認証を行う。
本変形例における利用者の認証の流れは、まず、ユーザ認証部202が、利用者がオペレーションパネル125から入力したログイン情報を取得し、データ処理制御部210の制御の下、通信部220を介して外部認証サーバ40−5にログイン情報を送信する。次に、外部認証サーバ40−5は受信したログイン情報に基づく認証結果をMFP20に送信する。そして、外部認証サーバ認証部230は、認証結果に基づいて、利用者に対し、MFP20の利用を許可、あるいは拒絶する。
また、外部認証サーバ認証部230は利用者の識別情報と共に利用者の連絡先、例えばメールアドレスを記憶するものとしても良い。この場合、外部認証サーバ認証部230は、認証結果と共に、利用者の識別情報とメールアドレスもMFP20に送信する。
この利用者の識別情報とメールアドレスは、MFP20から文書管理サーバ30に送信される。送信された利用者の識別情報とメールアドレスは、文書管理サーバ30のスキャン画像情報361に保存されても良いし、別途テーブルを分けて保存されても良い。
本変形例のMFP20と文書管理サーバ30のその他の構成については、図4〜図11を用いて説明した実施形態の構成と同様である。
本変形例における文書電子化処理では、エラーが発生した際、メール配信部306は、外部認証サーバ40−5から返信された認証結果に基づいて識別された利用者にメールを送信してエラーを通知する。
例えば、図12に示す文書電子化処理のステップS105において、バーコード読取エラーを通知する際、メール配信部306は、外部認証サーバ40−5から返信された認証結果に基づいて識別された利用者にメールを送信する。
また、図15に示す新規文書の登録処理のステップS307において、ファイルの2重配信によるエラーを通知する際、またはページの欠落が補完できないことによるエラーを通知する際、メール配信部306は、外部認証サーバ40−5から返信された認証結果に基づいて識別された利用者にメールを送信する。
さらに、図16に示す登録失敗文書の再登録処理のステップS408において、ファイルの2重配信によるエラーを通知する際、またはページの欠落が補完できないことによるエラーを通知する際、メール配信部306は、外部認証サーバ40−5から返信された認証結果に基づいて識別された利用者にメールを送信する。
本変形例におけるその他の処理の手順については、図12〜図17を用いて説明した実施形態における処理手順と同様である。
このように本変形例によれば、外部の認証サーバ40−5を利用して利用者の認証を行うため、利用者の処理実行権限に関する情報を一括して効率的に管理することが可能である。
なお、実施形態および変形例のMFP20および文書管理サーバ30で実行される情報処理は、CPUで実行されるプログラムのモジュールでも良い。その場合、当該プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供されても良い。
また、実施形態および変形例のMFP20および文書管理サーバ30で実行される情報処理プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、実施形態および変形例のMFP20および文書管理サーバ30で実行される情報処理プログラムを、インターネット等のネットワーク経由で提供または配布するように構成しても良い。
また、実施形態および変形例の情報処理プログラムを、ROM等に予め組み込んで提供するように構成してもよい。
実施形態および変形例のMFP20および文書管理サーバ30で実行される情報処理プログラムは、上述した各部(記憶部、第1の取得部、第2の取得部、読取部、文書情報照合部、生成部)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(プロセッサ)が上記記憶媒体から情報処理プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、記憶部、第1の取得部、第2の取得部、読取部、文書情報照合部、生成部が主記憶装置上に生成されるようになっている。
本発明の実施形態および変形例を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。