JP2023054708A

JP2023054708A - 情報処理装置、文書分割方法、及びプログラム

Info

Publication number: JP2023054708A
Application number: JP2021163722A
Authority: JP
Inventors: 亜希子永原; Akiko Nagahara
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2021-10-04
Filing date: 2021-10-04
Publication date: 2023-04-14

Abstract

【課題】スキャン画像データを文書単位で精度よく自動分割する。【解決手段】情報処理装置によりページ単位のスキャン画像を文書ごとに分割する文書分割方法であって、奇数ページを対象ページとして、対象ページの直前ページについて、文書の末尾ページであるか否かを判定し、対象ページの直前ページが文書の末尾ページであると判定された場合には、対象ページが文書の先頭ページであるとしてスキャン画像を分割する。【選択図】図９

Description

本発明は、例えば複数文書などからなるスキャン画像データを解析して文書の分割位置を自動判別するための情報処理装置、文書分割方法、及びプログラムに関する。

従来、文書の管理手法として、文書をスキャナで読み取って得られたスキャン画像を所定フォーマットのファイルに変換し、ネットワーク上のストレージサーバに送信して保存する手法が広く利用されている。

そのような手法が利用されるユースケースとして、複数の文書からなる複数枚の紙文書をまとめてスキャンして電子化し、文書毎にファイルとして分割してストレージサーバに保存するということがある。

複数の紙文書から得られたスキャン画像データを文書単位で自動的に分割するための手法として、特許文献１がある。特許文献１は、複数の文書をまとめてスキャンした際に、各文書の最後の原稿の裏面に付与されている文書分割を示すマークを認識して、マークに基づいて文書単位に区切るものである。

特開平０７－２８７７４７号公報

しかしながら特許文献１の手法では、複数の紙文書をまとめてスキャンし、文書毎にファイル分割してストレージサーバに保存することを想定して、各文書の最後の用紙の裏面に文書分割マークを印字しておく必要があった。各文書の分割ページの裏面に所定の分割マークを付与しておくといった繁雑な事前準備を行わねばならず、不便である。

本発明は、上記事情に鑑みてなされたものであり、複数の紙文書からなるスキャン画像データを文書単位で精度よく自動分割しつつ、文書分割に関わる処理負荷を低減する手法を提供することを目的とするものである。

上記目的を達成するために本発明は以下の構成を有する。すなわち本発明の一側面によれば、ページ単位のスキャン画像を文書ごとに分割する情報処理装置であって、
奇数ページを対象ページとして、前記対象ページの直前ページについて、文書の末尾ページであるか否かを判定する第１の判定手段と、
前記直前ページが前記末尾ページであると判定された場合には、前記対象ページが文書の先頭ページであるとして前記スキャン画像を分割する分割手段と、を有する
ことを特徴とする情報処理装置が提供される。

本発明によれば、複数の紙文書からなるスキャン画像データを文書単位で精度よく自動分割しつつ、文書分割に関わる処理負荷を低減することが可能となる。

本システムの全体構成を示す図である。ＭＦＰのハードウェア構成図である。クライアントＰＣ及びＭＦＰ連携サービスのハードウェア構成図である。本システムのソフトウェア構成図である。各機器間の処理の流れを示すシーケンス図である。スキャン画像群と文書構成の一例を示す図である。スキャン画像の印字パターンと想定される文書分割の一例を示す図である。ＭＦＰまたはクライアントＰＣが表示する画面の一例を示す図である。本システムの画像処理部が行う処理の詳細を示すフローチャートである。本システムの画像処理部が行う処理の詳細を示すフローチャートである。本システムの画像処理部が行う処理の詳細を示すフローチャートである。本システムの画像処理部が行う処理の詳細を示すフローチャートである。本システムの画像処理部が行う処理の詳細を示すフローチャートである。本システムの画像処理部が行う処理の詳細を示すフローチャートである。本システムの画像処理部が行う処理の詳細を示すフローチャートである。本システムの画像処理部が行う変形例における処理の詳細を示すフローチャートである。

以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。

［第一の実施形態］
＜全体構成＞
図１は、本実施形態の画像処理システムの全体構成を示す図である。画像処理システムは、ＭＦＰ（Ｍｕｌｔｉ－ＦｕｎｃｔｉｏｎＰｅｒｉｐｈｅｒａｌ）１１０、クライアントＰＣ１１１、ＭＦＰ連携サービス１２０およびクラウドストレージ１３０を含む。ＭＦＰ１１０及びクライアントＰＣ１１１は、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）経由でインターネット上の各種サービスを提供するサーバーに対して通信可能に接続されている。

ＭＦＰ１１０は、スキャナやプリンタといった複数の機能を有する複合機であり、画像処理装置あるいは画像形成装置の一例である。クライアントＰＣ１１１はＭＦＰ連携サービス１２０に対して依頼したサービスの提供を受けるコンピュータまたはアプリケーションである。ＭＦＰ連携サービス１２０は、ＭＦＰ１１０でスキャンした画像ファイルをＭＦＰ連携サービス１２０が稼働するサーバー上に保存したり、別のストレージサービス等のファイル保存が可能なサービスに転送したりする機能を持つサービスの一例である。クラウドストレージ１３０は、インターネットを介してファイルを保存したりウェブブラウザでファイルを取得したりすることができるサービスである。ＭＦＰ連携サービス１２０は、たとえばＭＦＰ連携サービス機能を提供するサーバー（あるいは情報処理装置またはコンピュータ）により実現される。クラウドストレージ１３０もその機能を提供するサーバーにより実現される。

本実施形態の画像処理システムは、ＭＦＰ１１０、クライアントＰＣ１１１、ＭＦＰ連携サービス１２０およびクラウドストレージ１３０を有する構成としているがこれに限定されない。例えば、ＭＦＰ１１０がクライアントＰＣ１１１やＭＦＰ連携サービス１２０の役割を兼ね備えてもよい。また、ＭＦＰ連携サービス１２０はインターネット上ではなくＬＡＮ上のサーバーに配置した接続形態であってもよい。また、クラウドストレージ１３０はメールサーバーなどに置き換えて、スキャンした画像をメールに添付し送信してもよい。

＜ＭＦＰのハードウェア構成＞
図２は、ＭＦＰ１１０のハードウェア構成図である。ＭＦＰ１１０は、制御部２１０、操作部２２０、プリンタ部２２１、スキャナ部２２２、モデム２２３で構成される。制御部２１０は、以下の各部２１１～２１９で構成され、ＭＦＰ１１０全体の動作を制御する。ＣＰＵ２１１は、ＲＯＭ２１２に記憶された制御プログラムを読み出して、読取／印刷／通信などＭＦＰ１１０が有する各種機能を実行・制御する。ＲＡＭ２１３は、ＣＰＵ２１１の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施形態では１つのＣＰＵ２１１が１つのメモリ（ＲＡＭ２１３またはＨＤＤ２１４）を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のＣＰＵや複数のＲＡＭまたはＨＤＤを協働させて各処理を実行してもよい。ＨＤＤ２１４は、画像データや各種プログラムを記憶する大容量記憶部である。操作部Ｉ／Ｆ２１５は、操作部２２０と制御部２１０とを接続するインタフェースである。操作部２２０には、タッチパネルやキーボードなどが備えられており、ユーザーによる操作／入力／指示を受け付ける。プリンタＩ／Ｆ２１６は、プリンタ部２２１と制御部２１０とを接続するインタフェースである。印刷用の画像データはプリンタＩ／Ｆ２１６を介して制御部２１０からプリンタ部２２１へ転送され、記録媒体上に印刷される。スキャナＩ／Ｆ２１７は、スキャナ部２２２と制御部２１０とを接続するインタフェースである。スキャナ部２２２は、不図示の原稿台やＡＤＦ（ＡｕｔｏＤｏｃｕｍｅｎｔＦｅｅｄｅｒ：自動原稿送り装置）にセットされた原稿を読み取って画像データを生成し、スキャナＩ／Ｆ２１７を介して制御部２１０に入力する。ＭＦＰ１１０は、スキャナ部２２２で生成された画像データをプリンタ部２２１から印刷出力（コピー）する他、ファイル化してファイル送信またはメール送信することができる。モデムＩ／Ｆ２１８は、モデム２２３と制御部２１０とを接続するインタフェースである。モデム２２３は、ＰＳＴＮ上のファクシミリ装置との間で画像データをファクシミリ通信する。ネットワークＩ／Ｆ２１９は、制御部２１０（ＭＦＰ１１０）をＬＡＮに接続するインタフェースである。ＭＦＰ１１０は、ネットワークＩ／Ｆ２１９を用いてインターネット上の各サービスに画像データや情報を送信したり、各種情報を受信したりする。

＜クライアントＰＣ、ＭＦＰ連携サービスのハードウェア構成＞
図３は、クライアントＰＣ１１１及びＭＦＰ連携サービス１２０のハードウェア構成図である。クライアントＰＣ１１１及びＭＦＰ連携サービス１２０は、ＣＰＵ３１１、ＲＯＭ３１２、ＲＡＭ３１３、ＨＤＤ３１４及びネットワークＩ／Ｆ３１５で構成される。ＣＰＵ３１１は、ＲＯＭ３１２に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。ＲＡＭ３１３は、ＣＰＵ３１１の主メモリ、ワークエリア等の一時記憶領域として用いられる。ＨＤＤ３１４は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークＩ／Ｆ３１５は、ＭＦＰ連携サービス１２０をインターネットに接続するインタフェースである。ＭＦＰ連携サービス１２０およびクラウドストレージ１３０は、ネットワークＩ／Ｆ３１５を介して他の装置（ＭＦＰ１１０など）から処理リスエストを受けて各種情報を送受信する。

＜画像処理システムのソフトウェア構成＞
図４は、本実施形態に係る画像処理システムのソフトウェア構成図である。ＭＦＰ１１０は、ネイティブ機能部４１０と追加機能部４２０の大きく２つに分けられる。ネイティブ機能部４１０に含まれる各部はＭＦＰ１１０に標準的に備えられたものであるのに対し、追加機能部４２０はＭＦＰ１１０に追加インストールされたアプリケーションである。追加機能部４２０はＪａｖａ（登録商標）をベースとしたアプリケーションであり、ＭＦＰ１１０への機能追加を容易に実現できる。なお、ＭＦＰ１１０には図示しない他の追加アプリケーションがインストールされていても良い。

ネイティブ機能部４１０は、スキャン実行部４１１および画像データ保存部４１２を有する。追加機能部４２０は、表示制御部４２１、スキャン指示部４２２、連携サービスリクエスト部４２３を有する。

表示制御部４２１は、ＭＦＰ１１０の操作部２２０のタッチパネル機能を有する液晶表示部に、ユーザーによる操作を受け付けるためのユーザインターフェイス（ＵＩ）画面を表示する。例えば、ＭＦＰ連携サービス１２０へアクセスするための認証情報の入力、スキャン設定、ならびに、スキャン開始の操作、プレビュー画面などのＵＩ画面を表示する。スキャン指示部４２２は、ＵＩ画面を介して入力されたユーザー指示に応じたスキャン設定と共にスキャン実行部４１１にスキャン処理を要求する。

スキャン実行部４１１は、スキャン指示部４２２からのスキャン設定を含んだスキャン要求を受け取る。スキャン実行部４１１は、スキャン要求に従い、スキャナＩ／Ｆ２１７を介して、スキャナ部２２２で原稿台ガラスに置かれた原稿を読み取ることでスキャン画像データを生成する。生成したスキャン画像データは、画像データ保存部４１２に送られる。スキャン実行部４１１は、保存したスキャン画像データを一意に示すスキャン画像識別子をスキャン指示部４２２へ送る。スキャン画像識別子はＭＦＰ１１０においてスキャンした画像をユニークに識別するための番号や記号、アルファベットなどである（不図示）。画像データ保存部４１２は、スキャン実行部４１１から受け取ったスキャン画像データをＨＤＤ２１４に保存する。ここで、原稿の１面をスキャンすることにより読み取った画像データを１ページの画像データと呼び、スキャン画像識別子はページ単位で付与されてよい。

スキャン指示部４２２は、スキャン実行部４１１から受け取ったスキャン画像識別子に対応するスキャン画像データを画像データ保存部４１２から取得する。スキャン指示部４２２は、取得したスキャン画像データにＭＦＰ連携サービス１２０で処理を行う指示を連携サービスリクエスト部４２３に要求する。

連携サービスリクエスト部４２３は、ＭＦＰ連携サービス１２０に対して各種処理の要求を行う。例えば、ログイン、スキャン画像の解析、スキャン画像の送信などの要求を行う。ＭＦＰ連携サービス１２０とのやり取りはＲＥＳＴやＳＯＡＰなどのプロトコルを使用するが、その他の通信手段を用いてもよい。

ＭＦＰ連携サービス１２０は、リクエスト制御部４３１、画像処理部４３２、クラウドストレージアクセス部４３３、データ管理部４３４、表示制御部４３５を有する。

リクエスト制御部４３１は、外部装置からの要求を受信できる状態で待機している。処理要求を受けると要求に応じて適宜、画像処理部４３２、クラウドストレージアクセス部４３３、データ管理部４３４に処理を指示する。

画像処理部４３２は、画像に対して画像解析処理や、画像の回転や傾き補正などの画像に対する加工処理を行う。画像解析処理には文字領域解析、ＯＣＲ（ＯｐｔｉｃａｌＣｈａｒａｃｔｅｒＲｅｃｏｇｎｉｔｉｏｎ）、タイトルなどを認識する自然言語処理などの言語処理が含まれる。

クラウドストレージアクセス部４３３は、クラウドストレージに対する処理の要求を行う。クラウドサービスは一般的にＲＥＳＴやＳＯＡＰなどのプロトコルで、クラウドストレージにファイルを保存したり、保存したファイルを取得したりするための様々なインタフェースを公開している。クラウドストレージアクセス部４３３は、公開されたクラウドストレージのインタフェースを使用してクラウドストレージの操作を行う。

データ管理部４３４は、ＭＦＰ連携サービス１２０で管理するユーザー情報や各種設定データ等を保持する。

表示制御部４３５は、インターネット経由で接続されたＰＣやモバイル等の別端末（不図示）上で動作しているウェブブラウザからのリクエストを受けて画面表示に必要な画面構成情報（ＨＴＭＬ、ＣＳＳ等）を返す。ユーザーは、ウェブブラウザで表示される画面経由でＭＦＰ連携サービス１２０に登録しているユーザー情報を確認したり、スキャンする際の設定を変更したりする。

なお図４ではＭＦＰ１１０に追加機能部４２０をインストールする構成の例について説明したが、本件はこの構成に限定せず、クライアントＰＣ１１１に追加機能部４２０の機能が含まれていても構わない。

＜全体の処理の流れ＞
図５は、ＭＦＰ１１０でスキャンした画像をファイル化してクラウドストレージに送信する際の各装置間の処理の流れを示すシーケンス図である。ここでは、各装置間のやり取りを中心に説明する。なお、図５ではＭＦＰ１１０がＭＦＰ連携サービス１２０とやり取りを行う記載としているが、後述する解析結果取得、画面の表示等はＭＦＰ１１０でなくクライアントＰＣ１１１が実行する構成でも構わない。

ＭＦＰ１１０は、通常の状態では提供する各機能を実施するためのボタンを並べたメイン画面をタッチパネル上に表示する。
ＭＦＰ１１０にスキャン画像をクラウドストレージに送信するための追加アプリケーション（以降、スキャンアプリと呼ぶ）をインストールすることで、アプリケーションの機能を使用するボタンがＭＦＰ１１０のメイン画面に表示される。このボタンを押すとスキャンした画像をクラウドストレージに送信するための画面が表示され、図５のシーケンスで示す処理が行われる。

Ｓ５０１においてスキャンアプリは、ＭＦＰ連携サービス１２０にアクセスするための認証情報を入力するログイン画面を表示する。Ｓ５０２でユーザーによるログイン操作を受け付けると、Ｓ５０３においてＭＦＰ連携サービス１２０は、ログイン要求に含まれるユーザー名とパスワードが正しいか検証し、正しければアクセストークンをＭＦＰ１１０に返す。以降のＭＦＰ１１０からＭＦＰ連携サービス１２０に対して行う各種リクエストにはこのアクセストークンと共に要求が出され、この情報により処理対象のユーザーを特定することができる。ユーザー認証の方法は一般的に公知な手法（Ｂａｓｉｃ認証、Ｄｉｇｅｓｔ認証、ＯＡｕｔｈを用いた認可等）を用いて行う。

ＭＦＰ１１０は、ログイン処理が完了したらＳ５０４でスキャン設定画面を表示する。ユーザーがスキャン設定画面上で各種スキャンの読み込みに関する設定を行うとＭＦＰ１１０はその設定を保存する。ユーザーはさらに原稿台ガラスまたはＡＤＦにスキャンする対象の紙帳票を置き、「スキャン開始」ボタンを押す。ＭＦＰ１１０はそれに応じてＳ５０５でスキャンを実行して紙帳票を電子化したスキャン画像データを生成する。ここでスキャン対象は用紙の両面とする。またスキャンする面の順序及びシートの順序はＡＤＦの機構等に応じて決められた順序でよい。ユーザーはその決められた順序に従ってシートの各面がスキャンされるよう紙帳票をＡＤＦに載置すればよい。そして、Ｓ５０６でスキャン処理により生成した画像群とともにスキャン画像群の解析要求をＭＦＰ連携サービス１２０に送信する。ＭＦＰ連携サービス１２０は、スキャン画像群の解析要求を受信するとＳ５０７において、ＭＦＰ連携サービス１２０の画像処理部４３２で画像解析を開始する。その後、ＭＦＰ連携サービス１２０は、画像解析処理の終了を待たずに、ＭＦＰ連携サービス１２０に依頼した解析を一意に示す識別子である"ｐｒｏｃｅｓｓＩｄ"をＭＦＰ１１０に返す。

ＭＦＰ連携サービス１２０は、要求受信後、画像処理部４３２で画像解析処理を行う。

画像解析処理では、まず、Ｓ５０６でＭＦＰ１１０より受信したスキャン画像群に対してＳ５０８において文書先頭ページかを判定する。Ｓ５０８の処理の詳細については後述する。

ＭＦＰ１１０は、Ｓ５１１でＳ５０６のレスポンスで受け取った"ｐｒｏｃｅｓｓＩｄ"を使用してＭＦＰ連携サービス１２０に定期的（例えば数百ミリ秒から数ミリ秒程度毎など）に"ｐｒｏｃｅｓｓＩｄ"の画像解析の処理状況の確認を行う。図では省略するが、Ｓ５１１の処理はＭＦＰ連携サービス１２０の画像処理完了のレスポンスが取得できるまで（Ｓ５１２のタイミングまで）継続して行う。ＭＦＰ連携サービス１２０は、Ｓ５１１の処理状況確認の要求を受けると"ｐｒｏｃｅｓｓＩｄ"の処理の状況を確認し、レスポンスを返す。

レスポンスには、"ｓｔａｔｕｓ"に現在の処理状況を示す文字列が格納される。例えば"ｓｔａｔｕｓ"が"ｐｒｏｃｅｓｓｉｎｇ"の時は、ＭＦＰ連携サービス１２０で処理が行われている最中であることを示し、"ｃｏｍｐｌｅｔｅｄ"の時は処理が完了している状態であることを示す。なお、処理が失敗した場合に"ｆａｉｌｅｄ"など、この他のステータスが返ることもある。また処理完了時（ｓｔａｔｕｓがｃｏｍｐｌｅｔｅｄの場合）のレスポンスは、ステータスと共にスキャン画像を解析した結果やスキャン設定等の情報を含む。

Ｓ５１２において文書分割処理の完了を検知すると、Ｓ５１３でレスポンスに含まれる結果情報が格納されたＵＲＬから結果情報を取得する。そして、Ｓ５１４においてＳ５１３で取得した結果情報を使用して、複数のスキャン画像からなるスキャン画像群から文書の分割ページを確定するための分割ページ確定画面を表示する。図８は、ＭＦＰ１１０で表示する分割ページ確定画面８１０の一例を示したものである。分割ページ確定画面での処理の詳細については後述する。

ファイル名設定画面でスキャン画像にファイル名を設定し、「送信」ボタン８１７を押すと、ＭＦＰ１１０はＳ５１９でスキャン画像群と文書の先頭ページ番号等の情報をＭＦＰ連携サービス１２０に送信する。ＭＦＰ連携サービス１２０はリクエストを受信すると、ＭＦＰ１１０より受信した情報に基づきファイル生成処理を開始するとともにリクエストを正常に受けたことをＭＦＰ１１０に返す。ＭＦＰ１１０は送信のレスポンスを受けると処理を終了し、Ｓ５０４のスキャン設定画面表示に戻る。

ＭＦＰ連携サービス１２０は、Ｓ５２０でＭＦＰ連携サービスに登録されたスキャン設定からクラウドストレージ１３０に送信するファイルフォーマットの情報を取得し、その設定に基づいてスキャン画像群からファイルを生成する。そして、Ｓ５２１で生成したファイルをＳ５１９で受信したファイル名に設定してクラウドストレージ１３０に送信する。

●文書単位の分割の例
図６は、本実施形態において文書単位に自動分割されるスキャン画像群の例を示す図である。Ｓ５０５においてＭＦＰ１１０によって生成されたスキャン画像群が、図６に示す「スキャン画像群におけるページ順」の順番に生成されたものとする。これら１０ページからなるスキャン画像群は３つの文書からなっており、それぞれ文書６１０、文書６２０、文書６３０である。画像処理部４３２は、スキャン画像群におけるページ順が１番目、２番目、３番目のスキャン画像に対して、１ページ目、２ページ目、３ページ目と順番にページ番号を割り振り、データ管理部４３４にスキャン画像と共に情報が保持される。本実施形態では、文書６１０、文書６２０、文書６３０の順で並べた文書をスキャンした例である。文書６１０は、１～４ページ目、文書６２０は、５～６ページ目、文書６３０は、７～１０ページ目でスキャン画像が生成されている。また、文書６１０のスキャン画像６１１が１ページ目、文書６２０のスキャン画像６２１が５ページ目、文書６３０のスキャン画像６３１が７ページ目として文書の先頭ページで構成される。

本実施形態では、スキャン画像群に含まれる文書は、片面印刷された文書と両面印刷された文書が混在している。文書６１０は、片面印刷された文書であり、スキャン画像６１１、スキャン画像６１２、スキャン画像６１３、スキャン画像６１４で構成されている。文書６１０のコンテンツ内容はスキャン画像群におけるページ順の奇数ページ目に印字され、偶数ページ目は印字されていない状態となる。文書６２０は、両面印刷された文書であり、スキャン画像６２１、スキャン画像６２２で構成されている。文書６２０のコンテンツ内容はスキャン画像群におけるページ順の奇数ページと偶数ページに印字されている。両面印刷された文書において、物理的な紙の表面と裏面にあたる奇数ページ目と偶数ページ目の間で文書が異なることはない。さらに文書６３０は、両面印刷された文書であり、スキャン画像６３１、スキャン画像６３２、スキャン画像６３３、スキャン画像６３４で構成されている。通常、両面印刷された文書の最終ページは文書６２０のようにスキャン画像群におけるページ順の偶数ページとなる。文書６２０のように最終ページに印字されている場合もあるが、コンテンツ内容によっては文書６３０のスキャン画像６３４のように印字されていない状態となる場合もある。ここでスキャン画像群に含まれるある文書内の１ページ目を「文書先頭ページ」と呼称し区別する。図６の例では、スキャン画像群における文書先頭ページに成り得るページは、スキャン画像群におけるページ順の奇数ページにあたるスキャン画像６１１、スキャン画像６１３、スキャン画像６２１、スキャン画像６３１、スキャン画像６３３である。

これらのページに文字領域解析とＯＣＲを行ってテキストを抽出し、抽出したテキストに自然言語処理を行い、予め定めた特定の特徴量を含むページを文書先頭ページとし文書を分割する。特徴量とは、例えば文書のタイトル、日付、発行者などの先頭ページか判断可能な文字列のことである。
このように奇数ページのみを画像解析処理の対象とすることで「文書先頭ページ」が判断でき、文字列領域解析、ＯＣＲ、自然言語処理といった画像解析処理の対象とするページ数を減らすことが可能になる。この結果、処理負荷を最大半分に低減することができる。さらに画像解析処理を行うページを文書構造から判断することで、処理負荷を低減する。

図７は、４ページ分のスキャン画像の印字パターンと想定される文書分割例を示した図である。この例の印字パターンは、文書区切れの前後２ページ分のスキャン画像を示しており、スキャン画像群におけるページ順の３ページ目が文書先頭ページかを判断している場面である。

各文書は、片面印刷または両面印刷されているため、紙の表面となる奇数ページには印字が必ずある。このため、スキャン画像群におけるページ順の１ページ目と３ページ目は印字されており、２ページ目、４ページ目がそれぞれ印字されている場合と印字されていない場合に分けられる。このため２ページ目と４ページ目の印刷の有無によって印字パターンは合計４パターンとなる。印字パターンの４つをそれぞれ印字パターン７１０、印字パターン７２０、印字パターン７３０、印字パターン７４０として説明する。

印字パターン７１０では、４ページ全てに印字されている。このとき想定される文書は、２通り考えられる。ひとつは、スキャン画像７１１とスキャン画像７１２で構成される文書と、スキャン画像７１３とスキャン画像７１４で構成される文書の２つの文書に分かれる場合がある。ふたつ目に、スキャン画像７１１、スキャン画像７１２、スキャン画像７１３、スキャン画像７１４で構成される１つの文書となる場合がある。よって、スキャン画像７１３が文書先頭ページか判断することで文書分割することができる。このため、スキャン画像群におけるページ順の３ページ目に画像解析処理を行う必要がある。

印字パターン７２０では、スキャン画像７２２以外が印字されている。このとき想定される文書は、２通り考えられる。ひとつに、スキャン画像７２１とスキャン画像７２２で構成される片面印刷された文書と、スキャン画像７２３とスキャン画像７２４で構成される両面印刷の文書とに分かれる場合である。ふたつ目に、スキャン画像７２１とスキャン画像７２２で構成される両面印刷された文書と、スキャン画像７２３とスキャン画像７２４で構成される両面印刷の文書とに分かれる場合である。この場合には、コンテンツによってスキャン画像７２２が白紙となっている。いずれの場合でもスャン画像７２３が先頭ページとなるため、本パターンでは、文書の分かれ目を決定する目的でスキャン画像群におけるページ順の３ページ目に画像解析処理を行う必要がない。

印字パターン７３０では、スキャン画像７３４以外が印字されている。このとき想定される文書は、２通り考えられる。ひとつが、スキャン画像７３１とスキャン画像７３２で構成される両面印刷された文書と、スキャン画像７３３とスキャン画像７３４で構成される片面印刷の文書とに分かれる場合である。ふたつ目に、スキャン画像７３１、スキャン画像７３２、スキャン画像７３３、スキャン画像７３４で構成される両面印刷された文書だが、コンテンツによってスキャン画像７３４が白紙となった単一の文書の場合である。なおスキャン画像７３３とスキャン画像７３４で構成される文書が両面印刷のこともあり得るが、先頭ページの判断のためにはひとつ目の場合と区別する必要はない。よって、スキャン画像７３３が文書先頭ページか判断することで文書分割することができる。このため、スキャン画像群におけるページ順の３ページ目に画像解析処理を行って先頭ページに該当するか判定する必要がある。

印字パターン７４０では、スキャン画像７４１とスキャン画像７４３に印字されている。このとき想定される文書は、２通り考えられる。ひとつは、スキャン画像７４１とスキャン画像７４２で構成される片面印刷された文書と、スキャン画像７４３とスキャン画像７４４で構成される片面印刷された文書の２つの文書に分かれる場合がある。ふたつ目に、スキャン画像７４１、スキャン画像７４２、スキャン画像７４３、スキャン画像７４４で構成される片面印刷された１つの文書となる場合がある。よって、スキャン画像７４３が文書先頭ページか判断することで文書分割することができる。このため、スキャン画像群におけるページ順の３ページ目に画像解析処理を行って先頭ページに該当するか判定する必要がある。

印字パターン７１０、印字パターン７２０、印字パターン７３０、印字パターン７４０のうち、印字パターン７２０については文書構造から画像解析処理を実施せずに文書先頭ページと判断できる。先の図６の例では、文書構造からスキャン画像６２１に対して画像解析処理を実施せずに先頭ページと判断できる。

本実施形態では、これらの前提のもとで処理負荷を低減しつつスキャン画像群に含まれる１つないし複数の文書を適切に分割するための手法を提案する。

図８の画面８１０はＭＦＰ１１０またはクライアントＰＣ１１１が表示する分割ページ確定画面の一例を示す図である。本画面ではスキャン及び画像解析処理が完了し、クラウドストレージ１３０に送信前のスキャン画像を一覧することができる。さらに本画面では、Ｓ５０８で判定された、スキャン画像群に対する文書の分割箇所が確認、修正できるようになっている。画面８１０は上記の分割ページ確定画面であり、画面中に、スキャン画像群のサムネイル画像８１１及び対応するページ番号８１２が、スキャン画像群のページ数分だけ一覧して表示されている。さらに、画面表示時には、Ｓ５０８で判定された文書の先頭ページに基づき文書分割線８１３が表示された状態になっており、ユーザーは文書分割線８１３を例えばドラッグすることで先頭ページを修正することができるようになっている。「送信」ボタン８１７は、文書分割箇所を確定するためのボタンであり、ユーザーの押下により、ＭＦＰ１１０またはクライアントＰＣ１１１は、分割ページ確定画面で確定した文書の分割情報と共にスキャン画像群をＭＦＰ連携サービス１２０へ送信する。

画面８２０は、ＭＦＰ連携サービス１２０において、画像解析中にエラーが発生した時の画面の一例を示す図である。エラーとは、ＭＦＰ連携サービス１２０は、Ｓ５１１の処理状況確認の要求の"ｐｒｏｃｅｓｓＩｄ"対するレスポンスが"ｆａｉｌｅｄ"になった場合である。画面８２０はエラーが発生したときのエラー表示画面であり、ユーザーに文書のセットの確認を促す注意画面８２１を表示する。ユーザーは、注意画面８２１が表示されると、ＭＦＰ１１０で文書をセットし直してからＳ５０５におけるスキャンを再開する「再開」ボタン８２７、または、Ｓ５０６の処理以降を取り消す「中止」ボタン８２８を選べる。

●画像解析処理手順
図９は、本システムにおける画像処理部４３２が行う画像解析処理の詳細を示すフローチャートである。本フローは図５におけるＳ５０８に相当する。本フローにおける処理は、ＭＦＰ連携サービス１２０、特にその画像処理部により実行される。

Ｓ９０１において、ＭＦＰ連携サービス１２０は、Ｓ５０６においてＭＦＰ１１０より受信したスキャン画像群のうち、最初のページを取得する。「ページを取得」とは、スキャン画像およびページ番号、処理結果などを含むページ情報である。なおページの順序はスキャンした順序に従い、先頭のページ番号は１である。また取得したページを対象ページあるいは現在ページと呼ぶ。続くＳ９０２において、ＭＦＰ連携サービス１２０の画像処理部４３２は、Ｓ９０１で取得したスキャン画像データに対して、ページ番号が奇数ページであるか否かを判断する。奇数ページであった場合（Ｓ９０２がＹＥＳの場合）、Ｓ９０３に進み、偶数ページであった場合、（Ｓ９０２がＮＯの場合）、Ｓ９０７に進む。Ｓ９０３において、画像処理部４３２は、取得した対象ページの前後のページのスキャン画像が白紙か否かを判定する。詳しくは図１０を用いて説明する。

図１０は、本実施形態におけるＳ９０３の白紙判定について手順を説明するためのフローチャートである。本フローにおける処理は、ＭＦＰ連携サービス１２０により実行される。

Ｓ１００１において、画像処理部４３２は、Ｓ９０２で処理をしている対象ページの前後１ページずつのスキャン画像を取得する。続くＳ１００２において、画像処理部４３２は、Ｓ１００１で取得したページ（すなわち対象ページの前後のページ）のスキャン画像に閾値以上の割合の白領域があるかを判断する。白領域の算出方法については限定しないが、ここでは一例として白画素を使用して閾値以上の数の白画素が存在する領域を白領域として算出する。白領域の割合が所定の閾値を超えていた場合（Ｓ１００２がＹＥＳの場合）、Ｓ１００３に進み、超えていなかった場合（Ｓ１００２がＮＯの場合）、Ｓ１００４に進む。本実施形態では閾値はＭＦＰ連携サービス１２０内部で保持しているが、外部から設定しても良いし、画像によって動的に変更するような方法でも構わない。Ｓ１００３において、画像処理部４３２は、白紙判定の対象のページは白紙ページとしてページ情報をデータ管理部４３４に記録する。続くＳ１００４において、画像処理部４３２は、白紙判定の対象のページは印字ページ（或いは非白紙ページ）としてページ情報をデータ管理部４３４に記録する。図１０の手順では対象ページの前後それぞれのページについて白紙か否かを判定し、判定結果を記録して本フローを終了する。なお対象ページの直前ページと直後のページ両方について白紙判定を行う必要は必ずしもない。たとえば直前ページの判定を行って次に直後のページの判定を行うものとすれば、まず直前のページが非白紙であると判定されたなら、対象ページが文書の先頭であると判定できないので、直後のページについてはもはや白紙判定を行う必要はない。逆に直後ページの判定を行って次に直前ページの判定を行うものとすれば、まず直後のページが白紙であると判定されたなら、対象ページが文書の先頭であると判定できないので、直前のページについてはもはや白紙判定を行う必要はない。これらの場合には、対象ページの直前ページまたは直後ページのいずれかの判定結果を記録して白紙判定処理を終了してよい。

図９の説明に戻る。Ｓ９０４において、画像処理部４３２は、文書構造判定ステップを実行する。文書構造判定ステップでは、Ｓ９０３で算出した白紙判定結果から、文書構造で文書分割が可能か否かを判定する。図７の印字パターン７２０に示した通り、現在処理を行う対象ページの前ページが白紙ページであり、且つ、後ろページが印字ページである場合、文書構造から文書分割することができる。文書構造から文書分割できる場合（Ｓ９０４がＹＥＳの場合）、Ｓ９０５に進み、文書構造から文書分割できない場合（Ｓ９０４がＮＯの場合）、Ｓ９０６に進む。Ｓ９０５において、画像処理部４３２は、現在ページの直前のページは文書の末尾ページであり、現在ページは文書先頭ページとしてページ情報をデータ管理部４３４に記録する。

一方Ｓ９０６において、画像処理部４３２は、文書先頭ページ判定処理を実施する。詳しくは図１１を用いて説明する。Ｓ９０７において、画像処理部４３２は、次のページを対象ページとして取得する。続くＳ９０８において、画像処理部４３２は、次のページが存在するか否かを判定する。次のページがある場合（Ｓ９０８がＮＯの場合）、Ｓ９０２の処理に戻る。次のページがない場合（Ｓ９０８がＹＥＳの場合）、すなわちステップＳ９０７で次ページがないという理由でその取得に失敗した場合、本フローを終了する。

図１１は、本実施形態におけるＳ９０６の画像解析処理による文書先頭ページ判断について手順を説明するためのフローチャートである。本フローにおける処理は、ＭＦＰ連携サービス１２０により実行される。Ｓ１１０１において、画像処理部４３２は、処理中の対象ページの全ての領域に対して文字領域解析、ＯＣＲ処理（文字認識処理）を実行して文字領域とテキストを抽出する。そして文字領域の領域番号と座標（Ｘ座標、Ｙ座標、幅、高さ）とを決定し、文字領域に関連付けたテキスト（ＯＣＲ処理結果）をページ情報としてデータ管理部４３４に記録する。Ｓ１１０２において、画像処理部４３２は、抽出されたテキストついて自然言語処理を実行して特徴量を抽出し、自然言語処理結果をＳ１１０１における文字領域と関連付けをしてデータ管理部４３４に記録する。自然言語処理は、たとえば単語の抽出であり、その結果は抽出された単語であってよい。下表１はＳ１１０１とＳ１１０２において実行された文字領域抽出結果、ＯＣＲ処理、自然言語処理の結果の一例を示す表である。文字領域抽出結果は、文字領域の領域番号、Ｘ座標、Ｙ座標、幅、高さからなる文字領域を取得し、ＯＣＲ処理結果は文字領域のテキストデータを、自然言語処理では文字領域とＯＣＲ処理結果から文書の特徴量が取得される。文書の特徴量とは、たとえば自然言語処理で抽出された単語それぞれやその数うであってよい。

Ｓ１１０３において、画像処理部４３２は、Ｓ１１０２における画像解析処理結果から特徴量を取得する。本実施形態では一例として、Ｓ１１０２で取得した現在のページの文字領域のテキストデータを対象として自然言語処理を行い、たとえば意味のある単語を切り出す。自然言語処理には学習済の人工知能を用いてもよいし、テキストの辞書データベースを参照してもよい。

Ｓ１１０４において、画像処理部４３２は、文書先頭ページ判断を実行する。先頭ページ判断では、特徴量から現在のページが文書先頭ページか否かを判定する。たとえば自然言語処理の結果、先頭ページに含まれる蓋然性の高い文字列の数が所定数以上、たとえば３以上であれば先頭ページと判定する。表１の例では、自然言語処理結果としてタイトル、発行者、日付が対象ページから得られ、それらが、先頭ページに含まれる文字列として予め登録されていれば、そのページは先頭ページであると判定されることになる。またたとえば、自然言語処理により切り出された単語のテキストデータとデータ管理部４３４に記録された処理済みのページのテキストデータとを比較してもよい。その場合、比較の結果、一致率が閾値を超えたなら、それらページは同一文書に含まれ、したがって対象ページは文書の先頭ページではないと判定してもよい。なお判定の方法は、ページの文字領域抽出、ＯＣＲ処理及び自然言語処理を用いたものである限りにおいて一つに限定されるものではない。文書先頭ページである場合（Ｓ１１０４がＹＥＳの場合）、Ｓ１１０５に進み、文書先頭ページでない場合（Ｓ１１０４がＮＯの場合）、本フローを終了する。

Ｓ１１０５において、画像処理部４３２は、現在のページを文書先頭ページとするページ情報をデータ管理部４３４に記録し、本フローを終了する。

Ｓ５０５において生成された複数ページからなるスキャン画像群のそれぞれについて、図９、図１０、図１１を用いて説明したフローを実行することによりＳ５０７の画像解析処理を完了し、画像処理部４３２は解析処理結果をリクエスト制御部４３１に返す。リクエスト制御部４３１は解析結果取得要求に応じて解析処理結果をＭＦＰ１１０またはクライアントＰＣ１１１に送信する。解析処理結果にはデータ管理部４３４に記録された文書先頭ページを示す情報たとえば先頭ページのページ番号が含まれる。この解析処理結果を受けて、ＭＦＰ１１０またはクライアントＰＣ１１１は、文書分割線が表示された状態で分割ページ確定画面８１０を描画する。

以上の処理手順を実施することにより、対象ページの内容に基づいて先頭ページ判定を行う必要があるページは奇数ページに限られる。なおかつ、対象ページの直前のページが白紙でないか、または直後のページが白紙であるようなページに限られる。このケースは図７に示したように全ケースの３／４であるから、文書の長さが無作為であればページ画像の内容に基づいて文書区切りの判定を行う必要があるページ数の期待値は、スキャンした総ページ数の１／２×３／４＝３／８となる。

このように複数のページで構成される複数の文書が含まれるスキャン画像群から文書の分割位置を自動判定する処理において、文書構造を基づいて必要最小限の領域に自然言語処理で詳細な解析を行うことができるようになる。これにより、複数の紙文書からなるスキャン画像データを文書単位で精度よく自動分割しつつ、文書分割に関わる処理負荷を最小限に抑えることができるため、ユーザーにとっての応答性を向上することができるようになる。以上で本実施形態の説明を終える。

なお図１０で説明した白紙判定の方法については他の方法を用いることができる。たとえば画像データから縦横それぞれの方向のエッジを抽出し、抽出できたエッジの数が閾値よりも少なければ白紙と判定する方法を用いてもよい。また、画像を複数の領域に分割し、分割された領域毎に画素値の度数分布および分散値を求めて白領域であるか否かを判定し、領域すべてが白領域と判定された場合に画像全体についても白紙と判定してもよい。この場合、各領域について、閾値以下の画素値（すなわち非白画素）の画素について分散を求め、分散が所定値以下であれば白領域と判定してよい。もちろんこれらの方法以外の方法を白紙ページを判定するために採用してよい。

［変形例１］
上記実施形態では、対象ページの直前のページが白紙かつ直後のページが非白紙の場合に、対象ページは文書の先頭ページであると判定していた。しかしながら、対象ページの直前のページが非白紙であってもそのページは文書の末尾ページであり、対象ページはその次の文書の先頭ページであると判定できる場合がある。たとえば対象ページの直前のページの文が、そのページ途中までしかなく、その下が余白となっている場合である。この場合、対象ページの直前のページは、両面印刷された文書の末尾ページであると判断することができる。そこで本変形例ではそのような場合にも、対象ページを文字認識することなく対象ページを文書の先頭ページと判定する。

そのために、本変形例では図９のステップＳ９０３の「白紙判定」処理として図１６の処理を行う。図１６の手順で白紙と判定されるページは白紙とは限らず印字部分を含むこともある。

図１６においてまず対象ページの直後のページについて、図１０の白紙判定処理を実行する（Ｓ１６０１）。図１０では対象ページの前後のページについて白紙判定を行うとしたが、ここでは直後のページのみを対象とする。これによりまず直後のページについて白紙か非白紙かを判定する（Ｓ１６０２）。直後のページが白紙であれば、文書構造から対象ページが先頭ページであると判定することはないので、直後のページについて判定結果を記録して処理を終了する。

直後ページ画伯でないと判定された場合には、対象ページの直前ページの画像を取得し（Ｓ１６０３）、対象ページの直前ページについてステップＳ１６０４～Ｓ１６０８の処理を行う。まず直前ページの白領域のページに占める割合が第１閾値以上であるか判定する（Ｓ１６０４）。この第１閾値は、図１０のＳ１００２における閾値と同じであってよい。また白紙の判定の仕方も図１０と同じ要領であってよい。白領域の割合が第１閾値以上であれば対象ページの直前のページは白紙であると判定される（Ｓ１６０７）。

そうでない場合には直前ページの白領域のページに占める割合が第２閾値以上であり（Ｓ１６０５）、かつその白領域がページ後半部にあるか判定する（Ｓ１６０６）。この第２閾値は、第１閾値よりも小さい値であってよい。たとえば、ページ下部の空白が１行分程度であれば、章や節の区切り目である可能性がある。また、たとえば表や図などのテキストではないオブジェクトが当該ページに収まりきらず、次ページに表示するためにまとまった空白が生じている可能性もある。そこでたとえば第２閾値は１ページの４分の１程度に固定的に設定してもよいし、利用者により設定変更可能としてもよい。両方の条件を満たせば、直前のページは、文書の区切り判定目的で疑似的な白紙ページと判定される（Ｓ１６０７）。そうでなければ直前のページは印字ページ（すなわち非白紙ページ）と判定される。

このように判定した結果を基に、図９の文書先頭ページの判定を行えばよい。これにより、対象ページの直前のページがたとえ白紙でなくとも文書の末尾の可能性があれば、対象ページを先頭ページと判定することができる。

これにより、第１実施形態に加えて一層文書区切り処理の生産性を高めることができる。なお本変形例の白紙判定は他の実施形態に適用することもできる。

［変形例２］
変形例１ではまず対象ページの直後のページについて白紙であるか判定し、白紙であれば対象ページは先頭ページではないと判定していた。しかしながら、ステップＳ１６０６で直前ページが疑似的な白紙ページと判定された場合には、対象ページの直後ページが白紙であっても対象ページを先頭ページと判定してもよい。そこで本変形例では、図１６の処理をまずステップＳ１６０３から開始する。そしてステップＳ１６０４で、直前ページが白紙ページであるか否かを判定し、その判定結果を記録する。そのほかは変形例１と同様である。このようにすることで、文書構造から対象ページを先頭ページと判定する機会を増加させることができ、より生産性を向上させることができる。

［第二の実施形態］
本実施形態では、本発明を適切に用いることで、画像解析処理を実行する範囲をさらに限定し、スキャン画像群の自動分割にかかる所要時間をさらに削減できることを、図を用いて具体的に説明する。なお、本実施形態の説明に際して、第一の実施形態と構成や処理手順が同一である箇所の説明は省略し、差異のある箇所のみを説明する。

本実施形態は、画像解析処理実行領域を限定し、データ管理部４３４に保持されているページ情報を利用して文書先頭ページ判断を行う。同一文書のヘッダーフッター領域には、通常コンテンツ内容に依存しない文字列が存在することが多い。ヘッダーフッター領域に存在する文字列とは、文書タイトル、日付、通し番号などがある。ヘッダーフッター領域は、方形状の本文領域の外枠領域のことで、この領域は設定で変更しても良いし、それ以外の方法で定義しても良い。

現在のページが画像解析処理実行済ページと同一文書の場合、ヘッダーフッター領域に文書タイトルや日付などの文書内全てのページに一貫して印字されている文字列がある。文字列領域解析の結果、現在のページのヘッダーフッター領域の文字領域とデータ管理部４３４に記録された文字領域が一致する場合、同一文書と判断できる。

次に、ヘッダーフッター領域に文字領域が存在するが、データ管理部４３４に記録された文字領域と一致しない場合もある。例えばヘッダーフッター領域に通し番号が存在する場合、番号の桁数によって文字領域が変化してしまう。文字領域が一致しない場合、文字領域を自然言語処理し、テキストデータを比較して同一文書か判断する。ヘッダーフッター領域の文字領域と文字領域のテキストデータで判断できない場合、ヘッダーフッター領域以外の画像解析処理を行う。

本実施形態では、第一の実施形態にてＳ５０８の説明で述べた文書先頭ページ判断処理のフローチャートのうち、自然言語処理による先頭ページ判断Ｓ９０６に追加説明をする。

図１２は、本実施形態におけるＳ９０６の詳細な処理手順を説明するフローチャートである。本フローの処理はＭＦＰ連携サービス１２０によって実施される。Ｓ１２０１において、画像処理部４３２は、２ページ前のページ情報をデータ管理部４３４から取得する。Ｓ１２０２において、画像処理部４３２は、２ページ前の画像解析処理情報がページ情報に保存済みであるか否かを判定する。２ページ前の画像解析処理情報が存在する場合（Ｓ１２０２がＹＥＳの場合）、Ｓ１２０３に進み、存在しない場合（Ｓ１２０２がＮＯの場合）、Ｓ１１０１に進む。Ｓ１２０３において、画像処理部４３２は、現在のページのヘッダーフッター領域の文字領域を抽出する。Ｓ１２０４において、画像処理部４３２は、現在のページと２ページ前のヘッダー領域とフッター領域それぞれの文字領域が一致するか否か判定する。一致する場合（Ｓ１２０４がＹＥＳの場合）、Ｓ１２０５に進み、不一致の場合（Ｓ１２０４がＮＯの場合）、Ｓ１２０６に進む。Ｓ１２０５において、画像処理部４３２は、現在のページは２ページ前と同一文書であるため先頭ページでないと判断する。Ｓ１２０６において、画像処理部４３２は、Ｓ１２０３において抽出されたヘッダーおよびフッターの文字領域に対して自然言語処理を行う。続くＳ１２０７において、画像処理部４３２は、Ｓ１２０６における処理結果から特徴量を取得する。Ｓ１２０８において、画像処理部４３２は、２ページ前の特徴量と比較して同一文書か否かを判定する。特徴量が所定の誤差内で一致すれば同一文書と判定する。同一文書の場合（Ｓ１２０８がＹＥＳの場合）、Ｓ１２０５へ進み、同一文書でない場合（Ｓ１２０８がＮＯの場合）、Ｓ１１０１に進む。ヘッダーフッター領域の文字領域が一致する場合（Ｓ１２０４がＹＥＳの場合）、はＳ１２０５において先頭ページでないと判断され本フローを終了する。またヘッダーフッター領域の文字領域のテキストデータから同一文書と判断できる場合（Ｓ１２０４がＮＯであった結果、Ｓ１２０８がＹＥＳの場合）もＳ１２０５において先頭ページでないと判断され本フローを終了する。

一方、ヘッダーフッター領域で同一文書と判断できない場合（Ｓ１２０４がＮＯであった結果、Ｓ１２０８がＮＯの場合）、第一の実施形態と同様にページ全ての領域に画像解析処理を行い、先頭ページか判定する。なお上記例ではヘッダー領域とフッター領域のそれぞれについて文字認識とそれに基づく処理を行っているがいずれか一方であってもよい。特にヘッダー領域に含まれる情報が多いことが多いのでヘッダー領域のみを対象としてもよい。

以上のように本発明を実施することで、これまで実行した画像解析処理結果を利用し、コンテンツ内容に依存しない部分を比較することで、処理負荷を低減することができるようになる。コンテンツ内容に依存しない部分とは具体的にはヘッダー領域およびフッター領域またはこれらのいずれかである。これにより、ユーザーに対する応答性をさらに向上することができるようになる。以上で本実施例の説明を終える。

［第三の実施形態］
本実施形態では、本発明を適切に用いることで、文書の積載誤りによる文書の分割処理エラーを防ぎ、また、ユーザーによって挿入された白紙によって意図された文書分割を確実に実施する。こうすることで、ユーザーにとって応答性を向上させることを、図を用いて具体的に説明する。なお、本実施形態の説明に際して、第一及び第二の実施形態と構成や処理手順が同一である箇所の説明は省略し、差異のある箇所のみを説明する。

本実施形態は、図５のＳ５０５において、複数の紙文書を原稿台ガラスまたはＡＤＦでスキャン実行するときの文書の積載状態を確認することで、ユーザーにとって正確且つ容易な文書分割処理を行う。具体的には、複数文書の積載時に紙の表裏が逆に読み取りされると、第一または第二の実施形態では、正しく文書分割を判断できなくなる。よって、ページの表裏を判定することで文書自動分割処理エラーを防ぎ、ユーザーに対して確認を促すことができる。また、文書と文書の間に白紙を仕切り紙として挿入することで自動分割する既存の文書分割方法がある。このような仕切り紙が挿入された場合、仕切り紙である白紙を判定して、白紙の位置で文書分割を行う。

図１３は、本実施形態における画像処理部４３２が行う画像解析処理の詳細を示すフローチャートである。本フローは図５におけるＳ５０８に相当する。本フローにおける処理は、ＭＦＰ連携サービス１２０により実行される。

対象ページが奇数ページであると（Ｓ９０１－Ｓ９０２）、Ｓ１３０１において、画像処理部４３２は、白紙判定を行う。図１４は、本実施形態におけるＳ１３０１の処理手順を説明するフローチャートである。本フローの処理はＭＦＰ連携サービス１２０によって実施される。Ｓ１４０１において、画像処理部４３２は、処理をしている対象ページとその前後１ページずつのスキャン画像を取得する。各ページの白領域が所定の閾値を超えているかを判定し、ページ情報をデータ管理部４３４に記録し、本フローを終了する。各ページの白紙判定は図１０で説明した方法と同じ要領で行ってよい。図１４では白紙判定を、対象ページも含めてその前後３ページについて行う点で図１０と相違している。

Ｓ１３０２において、画像処理部４３２は、ユーザーミスに起因する設定の見直しが必要か否かを判定する。スキャン画像群におけるページ順の奇数ページは、片面印刷及び両面された文書ともに何らかの印字がされている。そこで現在の対象ページが白紙の場合にエラー処理を行う。対象ページは奇数ページであるので、本来は白紙ではないはずである。そこで、対象ページが白紙であれば、それは仕切り紙（間紙）であるか、あるいは原稿が表裏逆にセットされている可能性がある。そこでステップＳ１３０２では、対象ページが」白紙であると判定された場合には設定の見直しが必要と判断する。見直しが必要でない場合（Ｓ１３０２がＮＯの場合）、Ｓ９０４に進み、見直しが必要な場合（Ｓ１３０２がＹＥＳの場合）、Ｓ１３０３に進む。

Ｓ１３０３において、画像処理部４３２は、仕切り紙か否かを判定する。仕切り紙の判定には現在の対象ページが白紙（Ｓ１３０２がＮＯの場合）、且つ、後ろページが白紙の場合である。ステップＳ１３０３では対象ページの直後のページが白紙であれば、対象ページとその直後のページは仕切り紙の両面であると判定する。仕切り紙の場合（Ｓ１３０３がＹＥＳの場合）、Ｓ１３０４に進み、仕切り紙でない場合（Ｓ１３０３がＮＯの場合）、Ｓ１３０５に進む。Ｓ１３０４において、画像処理部４３２は、現在のページ及び後ろページを仕切り紙と判断し、文書分割をして、データ管理部４３４にその旨を記録する。Ｓ１３０５において、画像処理部４３２は、文書積載状態が誤っていることを、ＭＦＰ１１０またはクライアントＰＣ１１１に送信してユーザーに警告する。具体的には、実行中の画像解析処理の"ｐｒｏｃｅｓｓＩｄ"を指定して処理ステータス"ｆａｉｌｅｄ"をＭＦＰ１１０またはクライアントＰＣ１１１に返し、本フローを終了する。それを受信したＭＦＰ１１０またはクライアントＰＣ１１１は、ユーザインターフェイスに、スキャンした原稿の積載方向を確認させるメッセージを表示等で出力する。またユーザーが確認後に処理を再開させるためのボタンなどを表示し、それがタッチされたなら図５のS５０５から再度処理を実行してよい。

以上のように本実施形態によれば、文書の積載状況を確認しユーザーの意図した文書分割を実行できるようになる。これにより、ユーザーに対する応答性をさらに向上することができるようになる。以上で本実施例の説明を終える。

［第四の実施形態］
本実施形態では、事前にＯＣＲ処理が指定された場合に実施された処理結果を利用して文書分割を確実に実施する。ユーザーにとって応答性を向上させることを、図を用いて具体的に説明する。なお、本実施例の説明に際して、第一、第二及び第三の実施形態と構成や処理手順が同一である箇所の説明は省略し、差異のある箇所のみを説明する。

本実施形態では、Ｓ５０４においてユーザーがサーチャブルＰＤＦなどのテキストデータの抽出処理が必須となる設定を行った場合に、テキストデータを利用して文書先頭ページ判断を行う。その設定では、図５のＳ５０５においてスキャン実行されるとテキストデータが含まれる文書が生成され、Ｓ５０８において、文書に含まれるテキストデータを利用して先頭ページの判断を行い、文書分割を実行する。

本実施形態では、テキストデータを抽出する処理が事前に実行された場合、文書分割時に画像解析処理を実行することなく文書分割を実行する。本実施形態では、第一の実施形態にてＳ５０８の説明で述べた文書先頭ページ判断処理のフローチャートのうち、自然言語処理による先頭ページ判断Ｓ９０６に追加説明をする。

図１５は、本実施形態におけるＳ９０６の詳細な処理手順を説明するフローチャートである。本フローの処理はＭＦＰ連携サービス１２０によって実施される。

Ｓ１５０１において、画像処理部４３２は、スキャン画像群のテキストデータの抽出が必須か否かを判定する。テキストデータ抽出が必要ない場合（Ｓ１５０１がＹＥＳの場合）、Ｓ１１０１に進み、テキストデータ抽出が必要な場合（Ｓ１５０１がＮＯの場合）、Ｓ１５０２に進む。Ｓ１５０２において、画像処理部４３２は、ページ内に含まれるテキストデータを取得する。なおテキストデータ抽出が必要のない設定とは、たとえばサーチャブルＰＤＦなどが設定されて、すでにテキストデータが得られている場合である。

以上のように本発明を実施することで、重複して実行される処理を行うことなく文書分割を実行できるようになる。これにより、ユーザーに対する応答性をさらに向上することができるようになる。以上で本実施形態の説明を終える。

［その他の実施例］
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。

１１０ＭＦＰ、１１１クライアントＰＣ、１２０ＭＦＰ連携サービス、４２１表示制御部、４３１リクエスト制御部、４３２画像処理部、４３４データ管理部

Claims

ページ単位のスキャン画像を文書ごとに分割する情報処理装置であって、
奇数ページを対象ページとして、前記対象ページの直前ページについて、文書の末尾ページであるか否かを判定する第１の判定手段と、
前記直前ページが前記末尾ページであると判定された場合には、前記対象ページが文書の先頭ページであるとして前記スキャン画像を分割する分割手段と、を有する
ことを特徴とする情報処理装置。
請求項１に記載の情報処理装置であって、
前記対象ページの直後ページについて、白紙ページであるか否かを判定する第２の判定手段を更に有し、
前記第１の判定手段は、前記直前ページが白紙ページであるか否かを判定し、白紙ページと判定された場合には、前記第２の判定手段により前記直後ページが白紙ページでないと判定されると、前記直前ページが前記末尾ページであると判定する
ことを特徴とする情報処理装置。
請求項１または２に記載の情報処理装置であって、
前記第１の判定手段は、前記直前ページが、所定の割合を超える割合でページの後半部に白領域を含むページであるか否かを判定し、前記直前ページが、所定の割合を超える割合でページの後半部に白領域を含むページである場合には、前記直前ページが末尾ページであると判定する
ことを特徴とする情報処理装置。
請求項１乃至３のいずれか一項に記載の情報処理装置であって、
前記第１の判定手段により前記対象ページが前記末尾ページであると判定されなかった場合に、前記対象ページの２ページ前のページに文字認識処理が施されているならば、前記対象ページの２ページ前のページのヘッダー領域とフッター領域またはそのいずれか一方と、前記対象ページのヘッダー領域とフッター領域またはそのいずれか一方とが一致するか判定し、一致する場合には、前記対象ページは前記先頭ページではないと判定する、
ことを特徴とする情報処理装置。
請求項４に記載の情報処理装置であって、
前記対象ページの２ページ前のページのヘッダー領域とフッター領域またはそのいずれか一方と、前記対象ページのヘッダー領域とフッター領域またはそのいずれか一方とが一致しない場合には、前記対象ページの文字認識処理をおこなって、前記対象ページの２ページ前のページのヘッダー領域とフッター領域またはそのいずれか一方の文字列と、前記対象ページのヘッダー領域とフッター領域またはそのいずれか一方の文字列とが一致するか判定し、一致しない場合には、前記対象ページは前記先頭ページではないと判定する、
ことを特徴とする情報処理装置。
請求項１乃至５のいずれか一項に記載の情報処理装置であって、
前記対象ページが前記先頭ページであると判定されなかった場合には、前記対象ページの全体について文字認識処理を行って、その結果を保存するとともに、認識された文字に応じて前記対象ページが前記先頭ページであるか判定する
ことを特徴とする情報処理装置。
請求項４乃至６のいずれか一項に記載の情報処理装置であって、
前記スキャン画像の読み取り時に文字認識処理が行われている場合には、前記対象ページを仕切り紙としてその文字認識処理の結果を用いて前記対象ページが前記先頭ページであるか判定する
ことを特徴とする情報処理装置。
請求項２または請求項２を引用する請求項３乃至７のいずれか一項に記載の情報処理装置であって、
前記対象ページが白紙ページであるか判定する手段を更に有し、
前記分割手段は、前記対象ページと前記直後ページがいずれも白紙ページである場合には、前記対象ページと前記直後ページとを文書を区切る仕切り紙として前記スキャン画像を分割する
ことを特徴とする情報処理装置。
請求項２または請求項２を引用する請求項３乃至７のいずれか一項に記載の情報処理装置であって、
前記対象ページが白紙ページであるか判定する手段と、
前記対象ページが白紙ページであり、かつ前記直後ページが白紙ページでない場合には、前記スキャン画像の読み取り方についてユーザーに警告する手段と
を更に有する
ことを特徴とする情報処理装置。
請求項１乃至９のいずれか一項に記載の情報処理装置としてコンピュータを機能させるためのプログラム。
判定手段と分割手段とを有する情報処理装置によりページ単位のスキャン画像を文書ごとに分割する文書分割方法であって、
前記判定手段が、奇数ページを対象ページとして、前記対象ページの直前ページについて、文書の末尾ページであるか否かを判定し、
前記分割手段が、前記直前ページが前記末尾ページであると判定された場合には、前記対象ページが文書の先頭ページであるとして前記スキャン画像を分割する
ことを特徴とする文書分割方法。