JP2018042067A

JP2018042067A - 画像処理システム、画像処理方法、情報処理装置

Info

Publication number: JP2018042067A
Application number: JP2016173939A
Authority: JP
Inventors: 由希子吉岡; Yukiko Yoshioka; 俊典 ▲高▼木; Shunsuke Takagi
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2016-09-06
Filing date: 2016-09-06
Publication date: 2018-03-15

Abstract

【課題】画像データに効率的に画像処理を施す画像処理システムを提供すること。【解決手段】第１の画像処理装置と第２の画像処理装置とが通信する画像処理システムであって、前記第１の画像処理装置は、書類から生成された画像データを受信する受信手段と、前記画像データに対し第１の画像処理を行う第１の画像処理手段と、前記第１の画像処理の結果に基づいて前記画像データから特定書類画像を検出する仕分け手段と、前記仕分け手段により仕分けられた前記特定書類画像を前記第２の画像処理装置に送信する送信手段と、を有する。【選択図】図１

Description

本発明は画像処理システム、画像処理方法及び情報処理装置に関する。

従来、企業と受注業者との発注業務は、電話で当事者が会話しながら伝票などに手書きしたり、企業側が書いた伝票を受注業者に郵送したりしていた。また、ＦＡＸが普及すると、伝票の送信にＦＡＸが活用されるようになった。さらに、近年では、このような発注業務をコンピュータと通信回線を組み合わせたシステムを用いて電子的に行う電子発注システム（ＥＯＳ）が普及するようになった。

ＥＯＳは紙による書類の作成が不要であり、インターネットを通じて発注を行うので、発注作業に要する時間を短縮でき書類の管理も不要となり、さらに間違いも少なくなるなど多くの利点がある。例えば、多くの種類の商品を大量に発注するチェーン店の本部などは、社内における発注書の審査・承認にいくつもの作業工数を要するため、情報が電子化されているＥＯＳは大変便利である。

しかし、個々の店舗において急に発注する必要が生じた場合、店舗の担当者が本部に発注依頼しなければならないとすると、納入までに時間がかかりタイムリーな販売を行うことができない場合がある。このため、各店舗では店舗ごとに個別に商品の発注を行う場合が少なくない。この場合の発注にはＥＯＳは使用されず、個々の店舗による発注は、ＥＯＳへの入力が考慮された所定の注文書又は紙による注文書などを担当者が作成し、ＦＡＸで送信することが多い。

受注業者の担当者は店舗から送信されたＦＡＸをＦＡＸ装置で打ち出し（自動的に打ち出されることが多い）、受注システムへ注文内容を手で入力する。このような、ＦＡＸによる注文が増えると受注業者の担当者はその度に発注商品名、発注数量、発注金額などの情報を受注システムに入力しなければならず、作業量が膨大になり間違いも起こしやすくなってしまうため、ＦＡＸによる受注処理の効率化が求められている。

このような要請に対し、ＯＣＲ（Optical Character Reader）処理を利用することが検討される（例えば、特許文献１参照。）。特許文献１には、ＦＡＸ受信画像に含まれる数字又は文字を受信テキストデータとして認識し、受信テキストデータに基づいてデータ送信先を特定するＦＡＸＯＣＲシステムが開示されている。

しかしながら、特許文献１に記載されているＦＡＸＯＣＲシステムでは、サーバが受信したＦＡＸ受信画像の全体にＯＣＲ処理を施しているため、無駄なＯＣＲ処理が多いという問題がある。

まず、受注業者が受信するＦＡＸには発注書の他に一般文書も含まれるため、受注業者が受信した全てのＦＡＸ画像をＯＣＲ処理する必要性は低い。そこで、ＦＡＸ画像を仕分けることが検討されるが、仕分けるためにＦＡＸ画像の全体に画像処理を行う必要がない場合がある。このように、従来の技術ではＯＣＲ処理が効率よく行われていなかった。

本発明は、上記課題に鑑み、画像データに効率的に画像処理を施す画像処理システムを提供することを目的とする。

本発明は、第１の画像処理装置と第２の画像処理装置とが通信する画像処理システムであって、
前記第１の画像処理装置は、書類から生成された画像データを受信する受信手段と、前記画像データに対し第１の画像処理を行う第１の画像処理手段と、前記第１の画像処理の結果に基づいて前記画像データから特定書類画像を検出する仕分け手段と、前記仕分け手段により仕分けられた前記特定書類画像を前記第２の画像処理装置に送信する送信手段と、を有し、
前記第２の画像処理装置は、前記特定書類画像に対し第２の画像処理を行う第２の画像処理手段と、前記第２の画像処理の結果に基づいて前記特定書類画像の項目から項目情報を抽出する抽出手段と、を有し、
前記特定書類画像は、所定の領域に特定の書類に関する特定書類情報を有し、前記第１の画像処理手段は、前記所定の領域よりも大きく、かつ、前記特定書類画像が生成される際に想定される位置ずれを許容する範囲で、前記画像データから部分画像を抽出し、前記仕分け手段は、前記部分画像に基づいて前記特定書類画像か否かを判別し、前記抽出手段は、前記第２の画像処理手段が前記特定書類画像の前記位置ずれを補正した前記特定書類画像から、前記項目情報を抽出する。

画像データに効率的に画像処理を施す画像処理システムを提供することができる。

画像処理システムの概略的な動作を説明する図の一例である。画像処理システムのシステム構成図の一例である。ＭＦＰの概略的なハードウェア構成を示したブロック図の一例である。ＰＣの概略的なハードウェア構成を示したブロック図の一例である。画像処理システムの機能を説明する機能ブロック図の一例である。発注書の一例を示す図である。発注書における会社名又はロゴの位置を説明する図の一例である。傾き補正について説明する図の位置である。ロゴやシンボルマークの検出に関する処理部の機能を説明する図の一例である。特徴空間を説明する図の一例である。ＭＦＰが行う動作手順を説明する図の一例である。ＯＣＲ処理により発注書か否かの判断処理を説明するフローチャート図の一例である。類似画像検索により発注書か否かの判断処理を説明するフローチャート図の一例である。前処理部の処理を説明するフローチャート図の一例である。天地識別処理と天地補正処理の例を示す図である。罫線（表組み）の検出で使用される交点を模式的に示す図の一例である。ＦＡＸ画像の縦ずれ・横ずれの一例を説明する図である。ＯＣＲ処理の手順を示すフローチャート図の一例である。ＯＣＲ処理を説明する図の一例である。登録部が発注システム用ＤＢに発注書の内容を登録する手順を示すフローチャート図の一例である。ＭＦＰの基準位置登録部が会社マスタＤＢに判断テキスト位置や判断画像位置を登録する手順を示すフローチャート図の一例である。操作表示部に表示される画面例を説明する図の一例である。ＭＦＰの基準位置登録部が会社マスタＤＢに判断テキスト位置や判断画像位置を追加して登録する手順を示すフローチャート図の一例である。

以下、本発明を実施するための画像処理システムと、画像処理システムが行う画像処理方法について図面を参照しながら説明する。

＜概略的な動作＞
図１は、本実施形態の画像処理システム１００の概略的な動作を説明する図の一例である。受注業者はＭＦＰ（Multi-Function Peripheral）１０とＰＣ（Personal Computer）３０を有している。ＭＦＰ１０はＦＡＸを受信するＦＡＸ機能を有している。
（１）発注者がＦＡＸで商品を発注する際、発注者ＦＡＸ装置８から発注書６を受注業者５に送信する。図１の受注業者５は受注作業が行われる拠点又は受注業者としての法人などを意味する。また、発注者は、商品等を発注する法人又はその担当者などをいう。
（２）また、受注業者には発注書６以外の一般文書７も送信される。一般文書７を送信するＦＡＸ装置を一般ＦＡＸ装置９と称し、一般ＦＡＸ装置９は一般文書７を受注業者に送信する。
（３）受注業者のＭＦＰ１０は発注書６及び一般文書７を受信するが、受信した時には発注書６か一般文書７かを判別できない。このため、ＭＦＰ１０がＦＡＸ機能で受信したＦＡＸ画像の一部に、ＭＦＰ１０はＦＡＸ画像を仕分けるための画像処理を施し、受注処理のためのＯＣＲ（Optical Character Reader）処理を施すか否かを判断する。受注処理のためのＯＣＲ処理を施すＦＡＸ画像は発注書６であり、受注処理のためのＯＣＲ処理を施さないＦＡＸ画像は一般文書７である。
（４）一般文書７に仕分けられたＦＡＸ画像をＭＦＰ１０は印刷する。
（５）発注書６に仕分けられたＦＡＸ画像をＭＦＰ１０はＰＣ３０に送信する。
（６）ＰＣ３０は傾き補正、天地補正、罫線検出、縦ずれ補正、横ずれ補正などに対応し、ＭＦＰよりも高精度にテキストデータを検出できるＯＣＲ機能を有している。また、このＦＡＸ画像は発注書の可能性が高いので、ＭＦＰ１０は受注処理のためＦＡＸ画像の全体にＯＣＲ処理を施す。ＰＣ３０の処理能力はＭＦＰ１０よりも高く、また、ＦＡＸ画像が絞り込まれているので、受注業務が滞る可能性は低い。ＭＦＰ１０は比較的短時間に、ＦＡＸ画像から受注処理に必要な商品名、商品コード、発注数量などを低い誤り率で検出できる。ＯＣＲ処理により得られたテキストデータは発注システム用ＤＢ４３に格納され、適宜、発注システムに送信される。

このように、本実施形態の画像処理システム１００は、ＦＡＸ機能で受信したＦＡＸ画像の一部のみにＭＦＰ１０が画像処理を施して仕分けするので、ＭＦＰ１０が費やすリソースを削減できる。また、ＭＦＰ１０は受注処理のためのＯＣＲ処理を行う必要がない。また、ＰＣ３０がＯＣＲ処理を施すのは発注書６だけなので、ＰＣ３０が全てのＦＡＸ画像にＯＣＲ処理を施す必要がない。

＜用語について＞
書類とは、何らかの情報が記載されたシート状の有体物である。あるいは、情報が電子化され画像データに変換されうるシート状の物体である。本実施形態では、書類として発注書を例に説明する。発注書とは発注する企業が、発注内容を記載して受注先の企業に提出する書類である。発注書の他、画像データとして送信される情報がＯＣＲ処理により文字コードなどに変換される書類であれば、発注書以外でも好適に適用できる。例えば、見積書、納品書、受領書、請求書、領収書、契約書などにも適用できる。また、例えば、住民表、申告書などの法的書類、役所への提出書類などは文字コードなどに変換されると手入力が不要になる。また、一般のオフィスで使用される報告書などでもよい。

第１の画像処理は、画像データを仕分けるために必要な情報を画像データから取得、抽出、又は、検出する処理である。あるいは、画像データが所定の書類であるか否かを判断するための情報を取得する処理である。本実施形態では、画像データの一部へのＯＣＲ処理又は類似画像検索が挙げられる。

特定書類画像とは、不特定の書類の画像データと対比される用語であり、特定の書類の画像データをいう。すなわち、目的の情報が記載された書類から生成された画像データである。本実施形態では例えば発注書のＦＡＸ画像が例として挙げられる。

第２の画像処理は、画像データから目的の情報を取得、抽出、又は、検出する処理である。本実施形態では、例えばＯＣＲ処理が挙げられるが、特定書類画像によっては、人、写真又は任意のマークを取り出すパターンマッチングなどでもよい。

所定の項目情報は、第２の画像処理において取得の対象となる目的の情報である。発注書６の場合は、受注処理に使用される情報、又は商品に関する情報等である。発注書６以外では、書類によって、氏名、電話番号、住所、マイナンバーなど目的の情報は様々である。

特定書類情報とは、特定の書類に関する情報である。あるいは、特定の書類であることを判断するための情報である。したがって、特定の書類によって特定書類情報は変わりうる。また、判断方法によって特定の書類は同じでも特定書類情報が異なってよい。例えば特定の書類が発注書の場合、特定書類情報は会社名又は会社名を特定するための情報であるが、この他、発注書という文字でもよいし、商品名・商品コードなど発注書を意味する文字列でもよい。

部分画像とは、画像データの一部をいう。あるいは、特定書類情報が記載されている画像データの一部である。

出力とは、画像データを視認可能な態様に加工することをいう。例えば、紙文書に印刷すること、ディスプレイに表示することなどをいう。

ＯＣＲ処理とは、印刷されたり手書きされた文字等を、スキャナやデジタルカメラによって画像データに変換し、この画像データの文字等を文字コードに変換する処理をいう。文字等には、０〜９の数字、＋、！及び％等の記号を含む。また、日本語や英語などの言語に応じてＯＣＲ処理される。

＜受注時の作業について＞
説明の便宜上、ＦＡＸを利用した従来の受注業務を説明する。店舗ごとに発注する場合、個々の店舗の担当者（画像処理システム１００のユーザ）は、紙による発注書６を作成しＦＡＸを受注業者に送信する。しかし、これら店舗がいわゆる同じ系列のチェーン店である場合、各店舗が同じ書式の発注書６をＦＡＸで送信する。つまり、会社名はチェーン店を展開する会社の名前で同じだが、店舗名だけが異なる。

受注業者から見ると書式と会社名は同じで店舗名だけが異なる発注書６を一日に数百件も受領する。受注業者の担当者は、まず発注者の会社名で仕分けを行い、次いで店舗ごとに発注書６の内容を受注システムへ入力する。例えば、店舗ごとに発注された商品名、発注数量、発注金額などの情報を受注システムに入力する。

このような手作業を低減するために、ＯＣＲ処理が利用される場合がある。受注業者の担当者はＭＦＰ１０などのＦＡＸ装置で印刷された発注書６を、発注者ごとに仕分けする。次いで、印刷された発注書６のうち特定の発注者の注文書をスキャナでスキャンして画像データ化し、インターネットによるデータ送信や光ディスクへ記録することによりＰＣ３０に転送する。

転送された発注書６はＰＣ３０内でのＯＣＲ処理や手作業による入力によりテキストデータ化され、店舗名・商品名・発注数量・発注金額などの情報が受注システムに入力される。

このように、ＯＣＲ処理を利用する場合でも、ＦＡＸ装置が印刷した発注書６（紙文書）を担当者が手作業で仕分けし、仕分け後の発注書６を、再度、画像データに変換する必要がある。また、ＦＡＸ装置が印刷した紙文書はＦＡＸ発信時の読み取り（スキャン）で傾いている場合が多く、画像データ化の２度目の読み取り（スキャン）でさらに傾くことになる。傾いた画像データに対しＰＣ３０がＯＣＲ処理を行うと読み取り精度が低下する可能性が高くなる。

さらに、発注書６のような同じ書式に記載される文書は、罫線内の決まった領域に値が入力される。例えば、商品名、商品コード、個数などが１テーブルに記載されるような表のフォーマットの発注書６では、ＰＣ３０が表の罫線を解析して各入力位置を特定する必要があり、左右の傾きだけでなく上下のずれもエラーの原因となる場合があった。

本実施形態の画像処理システム１００は以上のような不都合を低減するため、手作業を少なくし、読み取り精度を向上させることが可能になる。

＜システム構成例＞
図２は、画像処理システム１００のシステム構成図の一例である。画像処理システム１００は、主に、ＭＦＰ１０とＰＣ３０とがネットワークＮを介して接続された構成を有する。画像処理システム１００がさらに、発注者ＦＡＸ装置８及び一般ＦＡＸ装置９を有していてもよい。

このネットワークＮは、ＭＦＰ１０が設置されている施設などに構築されているＬＡＮ、ＬＡＮをインターネットに接続するプロバイダのプロバイダネットワーク、及び、回線事業者が提供する回線等により構築されている。ネットワークＮが複数のＬＡＮを有する場合、ネットワークはＷＡＮやインターネットと呼ばれる。ネットワークＮは有線又は無線のどちらで構築されてもよく、また、有線と無線が組み合わされていてもよい。また、ＭＦＰ１０が３ＧやＬＴＥなどの携帯電話網に接続する機能を有する場合、ネットワークは携帯電話網とプロバイダネットワークである。

また、ネットワークＮはＭＦＰ１０とＰＣ３０を有線又は無線で１対１に接続するものでもよい。例えば、ＵＳＢケーブル、イーサネットケーブル（登録商標）、無線ＬＡＮのアドホックモード、ダイレクトＷｉ−Ｆｉなどがある。

ＭＦＰ１０は、複合機、画像形成装置又はプリンタなどと呼ばれる機器であるが、本実施形態ではＦＡＸ機能を有していればよい。さらに、好ましくは印刷機能を有するが、印刷はＭＦＰ１０とは別のプリンタで行ってもよい。また、ＭＦＰ１０は、ＦＡＸ機能と印刷機能の他、スキャナ機能及びコピー機能の１つ以上を有していてもよい。また、ＭＦＰ１０は、複写機、コピー機、オフィス機器などと呼ばれていてもよい。

ＰＣ３０は、情報処理装置の一例である。ＰＣ３０はサーバと呼ばれていてもよい。また、ＰＣ３０がクラウドコンピューティングに対応していてもよい。クラウドとは、特定のハードウェア資源を意図しない場合に用いられる用語である。この場合、ＰＣ３０は、１つの筐体に収納されていたりひとまとまりの装置として備えられていたりする必要はなく、負荷に応じてハード的なリソースが動的に接続・切断されることで構成される。また、一台の情報処理装置の中の仮想化環境に構築されていたり、複数台の情報処理装置に跨って構築されたりしてもよい。

ＰＣ３０は受注業者の施設内にある必要はなく、インターネット上など受注業者が利用できるリソースであればよい。

また、ＰＣ３０が、スマートフォン、タブレット端末、ゲーム機、ＰＤＡ（Personal Digital Assistant）、デジタルカメラ、ウェアラブルＰＣ（Personal Computer）などと呼ばれていてもよい。さらに、ＰＣ３０がＦＡＸを受信するＭＦＰ１０とは別のＭＦＰ１０で代用されてもよい。

受注業者のＭＦＰ１０はＦＡＸ網Ｆを介して発注者ＦＡＸ装置８、及び、一般ＦＡＸ装置と通信可能に接続されている。ＦＡＸ網Ｆは、従来から公衆交換電話網が利用されている。しかし、近年では、インターネットなどの電話交換機を介さないＩＰ通信網が利用される場合も多い。

発注者ＦＡＸ装置８、及び、一般ＦＡＸ装置９はどちらもＦＡＸ画像の送受信を行う装置である。すなわち、少なくともスキャナ機能と送信機能を有する。送信する書類をスキャナ機能でＦＡＸ画像に変換し、ＦＡＸ網に送信する。また、ＦＡＸ網からＦＡＸ画像を受信して印刷機能で紙文書に変換する。発注者ＦＡＸ装置８は本実施形態において発注書６を送信するＦＡＸ装置であり、一般ＦＡＸ装置９は本実施形態において一般文書７を送信するＦＡＸ装置である。

受注業者は一例として問屋又は卸売業者と呼ばれ、発注者は一例として小売業者と呼ばれる。発注者は店頭の商品の在庫が不足すると、受注業者に商品を発注する。受注業者は在庫があればその商品を、在庫がない場合は商品を仕入れ、発注者に配送する。本実施例の発注者は同じ系列のチェーン店の各店舗であることが想定されるが、チェーン店には限られず、フランチャイズ店、個人店舗など、どのような店舗でもよい。また、受注業者は、これらの多様な店舗（又は個人でもよい）からの受注業務を行う業者であればよく、一般的な販売店でもよい。受注業者は多様な企業からＦＡＸ画像を受信する。

＜ハードウェア構成＞
<<ＭＦＰ１０のハードウェア構成について>>
図３は、ＭＦＰ１０の概略的なハードウェア構成を示したブロック図の一例である。ＭＦＰ１０は、コントローラ４１０とエンジン部（Ｅｎｇｉｎｅ）４１５とをＰＣＩ（ＰｅｒｉｐｈｅｒａｌＣｏｍｐｏｎｅｎｔＩｎｔｅｒｆａｃｅ）バス４１６で接続した構成となる。

コントローラ４１０は、ＭＦＰ１０全体の制御と描画、通信、操作表示部４１１からの入力を制御するコントローラである。エンジン部４１５は、ＰＣＩバス４１６に接続可能なプリンタエンジンなどであり、たとえば白黒プロッタ、１ドラムカラープロッタ、４ドラムカラープロッタ、スキャナ又はファックスユニットなどである。

なお、このエンジン部４１５には、プロッタなどのいわゆるエンジン部分に加えて、誤差拡散やガンマ変換などの画像処理部分が含まれる。

コントローラ４１０は、ＣＰＵ４０１と、ノースブリッジ（ＮＢ）４０３と、システムメモリ（ＭＥＭ−Ｐ）４０２と、サウスブリッジ（ＳＢ）４０４と、ローカルメモリ（ＭＥＭ−Ｃ）４０７と、ＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）４０６と、ハードディスクドライブ（ＨＤＤ）４０８とを有し、ノースブリッジ（ＮＢ）４０３とＡＳＩＣ４０６との間をＡＧＰ（ＡｃｃｅｌｅｒａｔｅｄＧｒａｐｈｉｃｓＰｏｒｔ）バス４０５で接続した構成となる。

また、ＭＥＭ−Ｐ４０２は、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）４０２ａと、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ)４０２ｂと、をさらに有する。

ＣＰＵ４０１は、ＭＦＰ１０の全体制御をおこなうものであり、ＮＢ４０３、ＭＥＭ−Ｐ４０２及びＳＢ４０４からなるチップセットを有し、このチップセットを介して他の機器と接続される。

ＮＢ４０３は、ＣＰＵ４０１とＭＥＭ−Ｐ４０２、ＳＢ４０４、ＡＧＰバス４０５とを接続するためのブリッジであり、ＭＥＭ−Ｐ４０２に対する読み書きなどを制御するメモリコントローラと、ＰＣＩマスタ及びＡＧＰターゲットとを有する。

ＭＥＭ−Ｐ４０２は、プログラムやデータの格納用メモリ、プログラムやデータの展開用メモリ、プリンタの描画用メモリなどとして用いるシステムメモリであり、ＲＯＭ４０２ａとＲＡＭ４０２ｂとからなる。

ＲＯＭ４０２ａは、プログラムやデータの格納用メモリとして用いる読み出し専用のメモリであり、ＲＡＭ４０２ｂは、プログラムやデータの展開用メモリ、プリンタの描画用メモリなどとして用いる書き込み及び読み出し可能なメモリである。

ＳＢ４０４は、ＮＢ４０３とＰＣＩデバイス、周辺デバイスとを接続するためのブリッジである。このＳＢ４０４は、ＰＣＩバスを介してＮＢ４０３と接続されており、このＰＣＩバスには、ネットワークＩ／Ｆ４０９なども接続される。ＡＳＩＣ４０６は、画像処理用のハードウェア要素を有する画像処理用途向けのＩＣ（ＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ）であり、ＡＧＰバス４０５、ＰＣＩバス４１６、ＨＤＤ４０８及びＭＥＭ−Ｃ４０７をそれぞれ接続するブリッジの役割を有する。

このＡＳＩＣ４０６は、ＰＣＩターゲット及びＡＧＰマスタと、ＡＳＩＣ４０６の中核をなすアービタ（ＡＲＢ）と、ＭＥＭ−Ｃ４０７を制御するメモリコントローラと、ハードウェアロジックなどにより画像データの回転などをおこなう複数のＤＭＡＣ（ＤｉｒｅｃｔＭｅｍｏｒｙＡｃｃｅｓｓＣｏｎｔｒｏｌｌｅｒ）と、エンジン部４１５との間でＰＣＩバスを介したデータ転送をおこなうＰＣＩユニットとを有する。

ネットワークＩ／Ｆ４０９はネットワークＮを介してＰＣ３０等と通信するための通信装置であり、例えばＮＩＣ（Network Interface Card）である。

このＡＳＩＣ４０６には、ＰＣＩバスを介してＦＣＵ（ＦａｃｓｉｍｉｌｅＣｏｎｔｒｏｌＵｎｉｔ）４１２、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）４１３、ＩＥＥＥ１３９４（ｔｈｅＩｎｓｔｉｔｕｔｅｏｆＥｌｅｃｔｒｉｃａｌａｎｄＥｌｅｃｔｒｏｎｉｃｓＥｎｇｉｎｅｅｒｓ１３９４）インタフェース４１４が接続される。

操作表示部４１１はＡＳＩＣ４０６に直接接続されている。ＭＥＭ−Ｃ４０７は、コピー用画像バッファ、符号バッファとして用いるローカルメモリである。ＨＤＤ４０８は、画像データの蓄積、プログラムの蓄積、フォントデータの蓄積、フォームの蓄積を行うためのストレージである。

また、ＨＤＤ４０８は、ＭＦＰ１０で実行されるアプリケーションのライセンスファイルを保存する。ＡＧＰバス４０５は、グラフィック処理を高速化するために提案されたグラフィックスアクセラレーターカード用のバスインターフェースであり、ＭＥＭ−Ｐ４０２に高スループットで直接アクセスすることにより、グラフィックスアクセラレーターカードを高速にするものである。

<<ＰＣ３０のハードウェア構成>>
図４は、ＰＣ３０の概略的なハードウェア構成を示したブロック図の一例である。本発明のＰＣ３０は、概ねパーソナル・コンピュータ、ワークステーション又はアプライアンス・サーバとして実装することができる。ＰＣ３０は、ＣＰＵ２０１と、ＣＰＵ２０１が使用するデータの高速アクセスを可能とするメモリ２０２とを備える。ＣＰＵ２０１及びメモリ２０２は、システム・バス２０３を介して、ＰＣ３０の他のデバイス又はドライバ、例えば、グラフィックス・ドライバ２０４及びネットワーク・ドライバ（ＮＩＣ）２０５へと接続されている。

グラフィックス・ドライバ２０４は、バスを介してＬＣＤ（ディスプレイ装置）２０６に接続されて、ＣＰＵ２０１による処理結果をモニタする。また、ネットワーク・ドライバ２０５は、トランスポート層レベル及び物理層レベルでＰＣ３０をネットワークＮへと接続して、ＭＦＰ１０とのセッションを確立させている。

システム・バス２０３には、さらにＩ／Ｏバス・ブリッジ２０７が接続されている。Ｉ／Ｏバス・ブリッジ２０７の下流側には、ＰＣＩなどのＩ／Ｏバス２０８を介して、ＩＤＥ、ＡＴＡ、ＡＴＡＰＩ、シリアルＡＴＡ、ＳＣＳＩ、ＵＳＢなどにより、ＨＤＤ（ハードディスクドライブ）２０９などの記憶装置が接続されている。ＨＤＤ２０９はＰＣ３０の全体を制御するプログラム２０９ｐを記憶している。ＨＤＤ２０９はＳＳＤ（Solid State Drive）でもよい。

また、Ｉ／Ｏバス２０８には、ＵＳＢなどのバスを介して、キーボード及びマウス（ポインティング・デバイスと呼ばれる）などの入力装置２１０が接続され、システム管理者などのオペレータによる入力及び指令を受け付けている。

＜画像処理システム１００の機能について＞
図５は、画像処理システム１００の機能を説明する機能ブロック図の一例である。

<<ＭＦＰ１０>>
ＭＦＰ１０は、受信部１１、読取部１２、印刷部１３、基準位置登録部１４、補正部１５、処理部１６、仕分部１７、及び、転送部１８を有する。これら各機能は、図３に示したＨＤＤ４０８からＭＥＭ−Ｐ４０２に展開されたプログラム４０８ｐをＣＰＵ４０１が実行することにより実現されている。なお、このプログラム４０８ｐは、プログラム配信用のサーバから配信されてもよいし、ＵＳＢメモリや光記憶媒体などの可搬性の記憶媒体に記憶された状態で配布されてもよい。

また、ＭＦＰ１０は、ＨＤＤ４０８及びＭＥＭ−Ｐ４０２などにより実現された画像記憶部２１及び会社マスタＤＢ２２を有する。画像記憶部２１は、ＦＡＸ画像を例えば時系列に記憶する記憶装置である。会社マスタＤＢ２２について表１で説明する。

表１は会社マスタＤＢ２２が記憶する情報をテーブル状に示す表である。会社マスタＤＢ２２には受注業者がＦＡＸ画像を仕分けるための情報が登録されている。会社マスタＤＢ２２は、会社名、判断テキスト位置１，判断テキスト位置２、判断画像位置１、判断画像位置２、及び仕分方法の各項目を有する。判断テキスト位置ｉ（ｉは自然数）は１つでも３つ以上でもよく、区別しない場合は単に判断テキスト位置という。判断画像位置１，２についても同様である。

会社名は発注者を受注業者が認識、識別又は特定するための名称である。判断テキスト位置１には、会社名と、会社名を判断するためにＭＦＰ１０が画像処理を施すべきＦＡＸ画像の位置が登録されている。すなわち、会社名が記載されている可能性が高い位置が指定されている。会社名の他、電話番号、ＦＡＸ番号、電子メールアドレス、発注者コードなど、発注者を特定できる情報が記載されていてもよい。また、発注者の企業が一社の場合、支店コードや支店コード（後述する店舗コード）により発注者を判断してもよい。

定型の書式の発注書６では会社名の位置は固定なので、受注業者の担当者等が予め判断テキスト位置を設定しておくことができる。判断テキスト位置は、例えば、左上コーナと右下コーナで特定される矩形範囲を示す。本実施形態では図７に示すように予めいくつかの位置が定められている。円形やその他の多角形でもよい。判断テキスト位置２には、会社名が存在する可能性がある別の判断テキスト位置が登録される。別の判断テキスト位置とは、発注書６で会社名が記載されている場所が一箇所でない場合や、定型以外の発注書６が使用された場合に、会社名が記載されている可能性が高い場所である。

判断画像位置１には、発注者のロゴやシンボルマーク、及び、これらが記載されている可能性が高い位置が登録されている。ロゴとは会社名や代表的な商標が美的にデザインされた模様の一種であり、シンボルマークとは会社を表すマークやアイコンなどの模様の一種である。ロゴとシンボルマークを厳密に区分しなくてもよい。発注書６には会社のロゴやシンボルマークが決まった場所に記載されていることが多く、受注業者の担当者等が予め判断画像位置を設定しておくことができる。指定方法は判断テキスト位置１，２と同様である。判断画像位置２は、発注書６で会社のロゴやシンボルマークが記載されている場所が一箇所でない場合や、定型以外の発注書６が使用された場合に、ロゴやシンボルマークが記載されている可能性が高い場所である。

仕分方法には、原則的にＦＡＸ画像のＰＣ３０への転送と登録されている。これは、発注書６をＰＣ３０でＯＣＲ処理するためである。ただし、大量にＦＡＸで発注書６を送信する会社にはＰＣ３０へ転送と登録しておき、それ以外の会社の場合、担当者が手で入力するため印刷すると登録されていてもよい。

（ＭＦＰ１０の機能）
受信部１１は、図３に示したＣＰＵ４０１がプログラム４０８ｐを実行しＦＣＵ４１２又はネットワークＩ／Ｆを制御すること等により実現され、発注者ＦＡＸ装置８及び一般ＦＡＸ装置９からＦＡＸ画像を受信する。

読取部１２は、図３に示したＣＰＵ４０１がプログラム４０８ｐを実行しエンジン部４１５を制御すること等により実現され、紙文書を読み取って画像データに変換する。上記の判断テキスト位置１，判断テキスト位置２、判断画像位置１、判断画像位置２の登録時に紙文書を読み取る。

印刷部１３は、図３に示したＣＰＵ４０１がプログラム４０８ｐを実行しエンジン部４１５を制御すること等により実現され、ＦＡＸ画像を紙文書に印刷する。

補正部１５は、図３に示したＣＰＵ４０１がプログラム４０８ｐを実行すること等により実現され、ＦＡＸ画像に対し傾き補正等を行う。

処理部１６は、図３に示したＣＰＵ４０１がプログラム４０８ｐを実行すること等により実現され、ＦＡＸ画像の一部にＦＡＸ画像を仕分けるための画像処理を施す。つまり、受注処理のためのＯＣＲ処理を施すか否かを判断する。この画像処理は、例えば簡易的なＯＣＲ処理や類似画像検索である。

仕分部１７は、図３に示したＣＰＵ４０１がプログラム４０８ｐを実行すること等により実現され、処理部１６の処理結果を利用して、ＦＡＸ画像をＰＣ３０に転送するか、又は、ＭＦＰ１０で印刷するかを判断する。

転送部１８は、図３に示したＣＰＵ４０１がプログラム４０８ｐを実行しネットワークＩ／Ｆ４０９を制御すること等により実現され、ＦＡＸ画像をＰＣ３０に送信する。なお、この場合は会社名が分かっているので、会社名もＰＣ３０に送信する。

基準位置登録部１４は、図３に示したＣＰＵ４０１がプログラム４０８ｐを実行すること等により実現され、判断テキストと判断テキスト位置又は判断画像と判断画像位置を会社マスタＤＢ２２に登録する。なお、処理部１６がＯＣＲ処理のみを行う場合、判断画像と判断画像位置は登録されなくてもよく、類似画像検索のみを行う場合、判断テキスト位置と判断テキストは登録されなくてもよい。

<<ＰＣ３０>>
ＰＣ３０は、受信部３１、前処理部３２、ＯＣＲ処理部３３、及び、登録部３４を有する。これら各機能は、図４に示したＨＤＤ２０９からメモリ２０２に展開されたプログラム２０９ｐをＣＰＵ２０１が実行することにより実現されている。なお、このプログラム２０９ｐは、プログラム配信用のサーバから配信されてもよいし、ＵＳＢメモリや光記憶媒体などの可搬性の記憶媒体に記憶された状態で配布されてもよい。

また、ＰＣ３０は、ＨＤＤ２０９及びメモリ２０２などにより実現された画像記憶部４１、発注システム用ＤＢ４３、及び発注書ＤＢ４２を有する。画像記憶部４１は、ＭＦＰ１０から送信されたＦＡＸ画像を例えば時系列に記憶する記憶装置である。発注システム用ＤＢ４３について表２で、発注書ＤＢ４２を表３で説明する。

表２は、発注システム用ＤＢ４３に登録されている情報をテーブル状に示す表である。発注システム用ＤＢ４３は、発注書６に記載された発注内容が登録されるデータベースである。受注業者の担当者は、ＦＡＸ画像と発注システム用ＤＢ４３の内容を照らし合わせ、変換ミスがないことを確認した上、発注システムに登録する。変換ミスがある場合は、担当者が修正する。

発注システム用ＤＢ４３は、受注日時、会社名、会社コード、商品名、商品コード、及び、発注数量の各項目を有する。受注日時は、ＦＡＸ網Ｆを介して発注書６をＭＦＰ１０が受信した日時である。ＰＣ３０がＦＡＸ画像を受信した日時でもよい。会社名は発注者の名称、会社コードは会社を特定するための情報、商品名は商品の名称、商品コードは商品を特定するための情報、発注数量は発注された商品の個数である。

表３は、発注書ＤＢ４２に登録されている情報をテーブル状に示す表である。発注書ＤＢ４２は、各発注者の典型的（基本の）な発注書６の基本書式が登録されたデータベースである。発注書６の書式は一定でないものの、同じ発注者は同じ書式の発注書６を使用する場合が多い。また、発注書６には罫線や表組みが多用されているが、ＯＣＲ処理で罫線を正しく検出しないと発注書６にＯＣＲ処理を施して得た発注内容に誤りが含まれるおそれがある。本実施形態では、各発注者の発注書６の書式が登録されているので、ＭＦＰ１０が発注者を特定できれば、発注者の発注書６の基本書式を特定できる。したがって、ＰＣ３０は発注書６の書式に登録された罫線や表組みの位置と、ＦＡＸ画像の罫線や表組みの位置を比較してＦＡＸ画像の横ずれや縦ずれを補正できる。また、ＯＣＲ処理で表組みの構造を検出すれば、発注書６の書式と照らし合わせて各項目を特定し、項目内の発注内容を取り出せる。

なお、発注書ＤＢ４２には発注書６の画像データそのものが記憶されていてもよいし、書式の特徴情報が登録されていてもよい。特徴情報とは、発注書６の特徴を示す情報であり、例えば、ＦＡＸ画像の上端、下端、左端、右端から罫線までの距離、罫線と罫線の間隔などである。

また、発注書ＤＢ４２には、項目の並び、及び、各項目に格納されている情報が登録されている。例えば、（株）ＡＢＣの発注書６は項目が横方向に並んでおり、項目１には商品名、項目２には数量、項目３には金額が登録されている。項目１〜３は発注書６の項目を特定するための情報であり、発注書６の各項目と１対１に対応付けられている。より具体的には、発注書６における各項目の位置が項目１〜３に登録されている。これにより、ＯＣＲ処理により各項目をテキストデータに変換したＰＣ３０は、発注書６の各項目の情報を発注者の意図する内容で取得できる（例えば、商品名を誤って数量として取得することがない）。

（ＰＣ３０の機能）
ＰＣ３０の受信部３１は、図４に示したＣＰＵ２０１がプログラム２０９ｐを実行しネットワーク・ドライバ２０５を制御すること等により実現され、ＭＦＰ１０からＦＡＸ画像を受信する。なお、ＰＣ３０のＩＰアドレスはＭＦＰ１０に予め登録されている。

前処理部３２は、図４に示したＣＰＵ２０１がプログラム２０９ｐを実行すること等により実現され、ＯＣＲ処理に必要な前処理を行う。例えば、傾き補正、天地補正、罫線検出、縦ずれ補正、横ずれ補正等を行う。

ＯＣＲ処理部３３は、図４に示したＣＰＵ２０１がプログラム２０９ｐを実行すること等により実現され、ＦＡＸ画像にＯＣＲ処理を施して、テキストデータを取り出す。

登録部３４は、図４に示したＣＰＵ２０１がプログラム２０９ｐを実行すること等により実現され、発注書ＤＢ４２の発注書６の書式を参照して、ＯＣＲ処理で得られたテキストデータ（発注内容）を発注システム用ＤＢ４３に登録する。

＜発注書６の一例＞
図６は、発注書６の一例を示す図である。発注書６とは、発注者が商品を受注業者に発注するための所定の書式（様式）の書類（又は文書と称してもよい）である。同じ店舗や同じ系列のチェーン店であれば同じ書式の発注書６を使用する場合が多いが、各企業で使用する書式はまちまちであり、一定の書式が決まっているわけではない。

図６の発注書６には、発注書６という文字５０１、発注者のロゴ５０２、発注者の会社名５０３、支店名５０４、店舗コード５０５、発注リスト５０６、及び発注番号５０７等が記載されている。発注リスト５０６には商品名、商品コード及び発注数量などが記載されている。支店名５０４は店舗の名称であり、店舗コード５０５は店舗の識別情報である。これらは、チェーン店内（同じ会社名に対し）で重複しないように付与されているため一意であるが、別の会社とは重複するおそれがある。

なお、図６の発注書６は説明のための一例であり、発注システム用ＤＢ４３に登録されうる情報を含んでいてもよい。一方、受注業者は商品コードと商品名が対応付いた商品ＤＢを有することが一般なので、発注システム用ＤＢ４３に登録されうる情報を全て含まなくてよい場合もある。

受注業者の担当者は、発注書６という文字５０１や発注リスト５０６を見て、ＭＦＰ１０が受信したＦＡＸ画像が発注書６であると判断する。また、ＭＦＰ１０が発注書６という文字列を検出することもそれほど困難ではない。しかし、受注処理の目的である発注リスト５０６の内容を正確に検出しようとすると、ＯＣＲ処理がＦＡＸ画像の全体に対して必要になり、縦ずれや横ずれなどを補正する必要もあるためＭＦＰ１０の処理負荷が大きくなってしまう。この場合、ＦＡＸ画像の受信頻度に対し発注書６かどうかの判断が遅れてしまうおそれが高い。

これに対し、発注書６であるどうかを判断するのであれば、比較的、小さい負荷の画像処理で対応できる。

そこで、本実施形態ではＭＦＰ１０が、発注書６と一般文書７にＦＡＸ画像を仕分ける。これにより、ＭＦＰ１０は少ない処理負荷又はリソースでＦＡＸ画像の仕分けが可能になる。

発注書６には発注書６であることを示す情報と、発注者に関する情報がある。ＭＦＰ１０が発注書６を仕分けるためには、発注書６であることを示す情報を検出することが確実である。発注書６であることを示す情報には以下の情報がある。
・発注書６という文字５０１
・発注リスト５０６
・発注番号５０７
発注リスト５０６を抽出することは、発注書６の全体の画像処理が必要になり処理負荷が増大するおそれがある。そこで、発注書６という文字５０１や発注番号５０７など「発注」という文字列を抽出することが考えられる。この場合は、判断テキスト位置が発注書６という文字５０１や発注番号５０７に対し適切な位置に設定される。このような処理は処理負荷もそれほど大きくないが、「発注」という言葉が含まれる一般文書もあるため、一般文書をＰＣ３０に仕分ける可能性がある。しかし、この場合、ＰＣ３０でＯＣＲ処理した場合に会社名や罫線などから発注書６でないと判断できる。また、発注書６という文字列はＦＡＸ画像が縦ずれした場合にＦＡＸのヘッダー（ＦＡＸ装置が自動的に付与する送信元の社名、日付、宛先等）と重なるおそれがある。この場合、一般文書として印刷されるが、このような発注書６は多くないので、この場合は担当者が対応すればよい。

次に、発注者に関する情報には以下の情報がある。
・発注者のロゴ５０２
・発注者の会社名５０３
・支店名５０４
・店舗コード５０５、
また、これらの他、電話番号、ＦＡＸ番号、電子メールアドレス、発注者コードなども発注者に関する情報である。したがって、受注業者から見た発注者が１社の場合、これらの文字列（数字列を含む）を抽出して、例えば所定の会社名のものであれば、発注書６であることを特定できる。また、受注業者から見た発注者が２社以上の場合、これらの文字列（数字列を含む）を抽出して、会社マスタＤＢ２２と照合することで発注書６を特定できる。この場合、発注者が一般文書を送信した場合に一般文書を発注書６と誤認識する場合がある。しかし、この場合、ＰＣ３０でＯＣＲ処理した場合に罫線などが検出されないので発注書６でないと判断できる。

発注者に関する情報を利用して発注書６を検出する方法では、会社マスタＤＢ２２が必要になるため、画像処理システム１００にコストがかかる。しかし、発注者を振り分けて、発注者によって異なる処理が可能になるという利点がある。例えば、Ａという発注者の発注書６はＰＣ３０で処理し、Ｂという発注者の発注書６は担当者が手で入力したり個別に対応したりしたい場合に便利である。そこで、本実施形態では、発注者に関する情報を利用して発注書６を検出する方法を説明する。ただし、発注書６であることを示す情報で発注書６を検出する方法も本実施形態で対応できる。

点線５０９で示す判断テキスト位置又は判断画像位置のように、会社名５０３やロゴ５０２等は発注書の一部の決まった位置に記載されることが多い。また、受注業者に発注する発注者は繰り返し発注することが多く、不特定の発注者が発注することは少ない。また、不特定の発注者であれば発注書６の数も少ないので、受注業者の担当者が個別に対応できる。ＭＦＰ１０は、判断テキスト位置又は判断画像位置から発注者に関する情報（図では会社名５０３、ロゴ５０２、支店名５０４、店舗コード５０５）を検出し、会社マスタＤＢ２２に登録されているかどうかに応じて発注書６かどうかを判断する。

＜判断テキスト、判断画像の位置＞
図７は、発注書６における会社名又はロゴ等の位置を説明する図の一例である。上記のように発注書６では、会社名又はロゴ等の位置はほぼ決まっている。一般に、右上がほとんどである。また、同じ店舗であれば会社名又はロゴ等の位置はほぼ固定である。

そこで、受注業者の担当者は予め、発注者となる店舗の発注書６の会社名又はロゴ等の位置を会社マスタＤＢ２２に登録しておく。図７では、５つの位置が登録されている。この５つの位置は、会社名やロゴ等が記載されている可能性が高い位置である。なお、右上側に２箇所の位置が登録されているのは、特に右上に会社名やロゴ等が記載されていることが多いため、細かく区切って登録されているためである。

位置の広さは狭いほどＭＦＰ１０の処理負荷が低下するため好ましいが、狭すぎると会社名やロゴ等が位置からはみ出してしまい、ＭＦＰ１０がＦＡＸ画像を正しく仕分けできなくなる。逆に、位置の広さが広すぎると、ＭＦＰ１０の処理負荷が高くなってしまう。そこで、位置の広さは、ＦＡＸ送信時の傾き、横ずれ又は縦ずれが生じても、会社名やロゴ等がはみ出さない程度に余裕を持って設定されることが好ましい。例えば、発注書６の長手方向には４〜５区分程度、短手方向には２〜３程度に区分されることが好適である。

担当者は図７の５つの位置から、登録する対象の会社の会社名又はロゴやシンボルマークを含む位置を考慮して、判断テキスト位置又は判断画像位置を選択する。このように担当者が選択するだけでよいので、作業を低減できる。

なお、担当者はこれら判断テキスト位置又は判断画像の位置を登録する対象の会社名をＯＣＲ処理で入力してもよいし、手で入力してもよい。また、判断テキスト位置又は判断画像位置のどちらに登録するかを選択しておく。

また、担当者が任意の位置を登録してもよい。判断テキスト、判断画像の位置の登録の際、受注業者の担当者は、発注書６をＭＦＰ１０のスキャナ機能で読み取らせる。読取部１２は発注書６を画像データに変換し、基準位置登録部１４が操作表示部４１１に発注書６の画像データを表示する。担当者は、会社名やロゴ等が記載されている範囲よりもやや大きい範囲を指などで指定する。例えば、会社名やロゴ等が記載されている範囲の外接矩形のやや外側の左上コーナから右下コーナまで指をドラッグする。基準位置登録部１４は、指定された左上コーナと右下コーナに、書類読取時の傾き、横ずれ及び縦ずれを考慮して判断テキスト位置又は判断画像位置を決定し会社マスタＤＢ２２に登録する。登録の詳細を図２１〜２３等で説明する。

＜傾き補正について＞
ＭＦＰ１０では負荷の高い処理は実行しない方が好ましいが、ＦＡＸで送信されたＦＡＸ画像は発注者ＦＡＸ装置８や一般ＦＡＸ装置９が文書を読み取る際に傾いている場合が多い。この場合、受信したＦＡＸ画像も傾いている。傾いたＦＡＸ画像を傾いたままＯＣＲ処理すると（会社名等を検出すると）、傾いていることにより処理部１６が正確に会社名等を読み取ることができない場合が多い。例えば、誤ったテキストを検出する場合や、テキストを検出できない（処理エラー）場合がある。

そこで、本実施形態のＭＦＰ１０では、処理部１６がＯＣＲ処理を行う前に、補正部１５がＦＡＸ画像の傾き補正を行う。傾き補正のような処理であれば、ＭＦＰ１０の処理負荷もそれほど高くならない。ただし、ＭＦＰ１０では傾き補正を含むＯＣＲ処理のための画像処理を一切行わなくてもよい。

図８は、傾き補正について説明する図の位置である。ＭＦＰ１０の補正部１５は、ＦＡＸ画像（すでに２値化されている）の文字の並び（行）や図形のエッジ部（直線部）を検出して、画像の傾きθを検出する。そして、この傾きθがゼロになるようにＦＡＸ画像を回転させる。ＦＡＸ画像の傾きは発注書６の上辺がＦＡＸ装置のスキャナと平行になっていないために起こるので、例えばＦＡＸ画像の左上コーナを中心に回転させる。

補正する画像の傾きは、大半は数度、すなわち１０度以下である（水平方向に対し）。補正部１５は傾きが１０度以下でない場合はエラーであると判断し、傾き補正しなくてもよい。また、補正部１５はＦＡＸ画像のいくつか異なる場所で傾きを検出し、これらが１０度以下である場合に、中央値や最頻値を傾きに決定することが好ましい。

なお、文字の並びを検出することは後述するように処理負荷が高く、図形などの直線部のみを検出することも好適である。例えば、罫線を検出するため、所定長さ以上に連続した黒画素を探索し、直線かどうかを判断する。連続した黒画素の任意の二点を通る直線を算出し、連続した黒画素の他の点がこの直線を通るかどうかにより、直線かどうかを判断できる。あるいは、ハフ変換を行うことで直線を検出できる。直線のうち傾きが１０度以下の直線を検出できれば、この直線の傾きをＦＡＸ画像の傾きとして検出する。なお、垂直方向に対する傾きが１０度以下の直線を検出してもよい。

＜ロゴやシンボルマークの類似画像検索＞
続いて、図９、図１０を用いてＦＡＸ画像からロゴやシンボルマークを処理部１６が検出する類似画像検索を説明する。

図９は、ロゴやシンボルマークの検出に関する処理部１６の機能を説明する図の一例である。処理部１６は、特徴抽出部１６ａとマッチング部１６ｂを有している。特徴抽出部１６ａは、ＦＡＸ画像の判断画像位置にある画像及び会社マスタＤＢ２２から取得した判断画像から画像の特徴量を抽出する処理を実行する。マッチング部１６ｂはＦＡＸ画像の判断画像位置から抽出された特徴量と、会社マスタＤＢ２２に登録されている判断画像の特徴量とを比較し、ＦＡＸ画像の判断画像位置に含まれる画像と特徴が類似する判断画像と対応付けられた会社名を会社マスタＤＢ２２から決定する。

なお、ＦＡＸ画像の判断画像位置で指定される位置にロゴやシンボルマークが含まれているという前提では、エッジを検出してエッジで囲まれる範囲がロゴやシンボルマークの画像であると推定できる。

画像の特徴量としては、画像の色特徴（色ヒストグラム）、画像のエッジ特徴及び画像中のテクスチャ特徴が知られている。ただし、ＦＡＸ画像が白黒の場合、色ヒストグラムは使用されない。

画像の色ヒストグラムは、適当な色空間（例えばＬａｂ，Ｌｕｖ，ＨＳＶなどが一般的）を複数の領域に分割し、画像の各ピクセルが色空間中のどの領域に対応するかを調べ、領域毎のピクセル数を全体のピクセル数により正規化することによって得ることができる。画像のエッジは、例えばｓｏｂｅｌのようなエッジ抽出フィルタを用いて得ることができる。さらに、テクスチャは、同時生起行列（一定距離離れた２つのピクセル間の画素値の関係から模様を統計的に記述する方法）に基づくテクスチャ抽出によって得ることができる。あるいは、フーリエ変換やウェーブレット変換などの周波数解析によりテクスチャを検出してもよい。

特徴量の抽出によりＦＡＸ画像又は判断画像は、抽出した特徴量の種類毎に図１０に示すような特徴空間で表される。マッチング部１６ｂは、ＦＡＸ画像又は判断画像の特徴量を図１０に示す特徴空間にマッピングして、２つの特徴量が類似しているか否かを判断する。図１０に示すポイント（黒点）は、特徴空間にマップされた画像の特徴量を示し、ＦＡＸ画像のポイントと判断画像のポイント間の距離がＦＡＸ画像と判断画像の類似度となる。特徴量はベクトルデータとして扱えるので、ポイント間の距離をユークリッド距離などで算出するとこの距離を類似度として利用できる。また、画像の特徴量の種類に合わせて独自の距離を定義することもできる。

＜ＭＦＰ１０の動作手順＞
図１１は、ＭＦＰ１０が行う動作手順を説明する図の一例である。図１１の処理は、例えばＭＦＰ１０の受信部１１がＦＡＸ画像を受信するとスタートする。

まず、受信部１１は受信したＦＡＸ画像を画像記憶部２１に記憶させる（Ｓ１０）。

次に、補正部１５はＦＡＸ画像を画像記憶部２１から読み出して、上記のように傾き補正を行う。補正部１５は、判断テキスト位置１、判断テキスト位置２、判断画像位置１及び判断画像位置２にのみ傾き補正を行ってもよい。これにより、ＭＦＰ１０の処理負荷を低減できる。また、処理部１６がロゴやシンボルマークなどの判断画像のみで発注書６か否かを判断する場合、傾き補正は行わなくてもよい。これは、画像の特徴量は傾きには影響されないためである。

次に、処理部１６は傾き補正されたＦＡＸ画像に対し、発注書６か否かの判断処理を行う（Ｓ３０）。この判断処理には、ＯＣＲ処理を使用する方法と類似画像検索を使用する方法がある。まず、図１２を用いて、判断処理としてＯＣＲ処理が行われる場合を説明する。
S1：処理部１６は、会社マスタＤＢ２２から判断テキスト位置１及び判断テキスト位置２を読み出す。会社マスタＤＢ２２に複数の発注先の会社が登録されている場合、判断テキスト位置１及び判断テキスト位置２の全てを読み出す。
S2: 処理部１６は、判断テキスト位置１及び判断テキスト位置２を登録されている個数が多い順に並べる。図７に示したように、位置が５つの場合は、第２位置、第３位置、第１位置、第４位置、第５位置のように各位置の順番が決定される。
S3：処理部１６は決定した順に、ＦＡＸ画像から判断テキスト位置で決まる範囲をトリミングする。
S4：次に、処理部１６はトリミングした範囲にＯＣＲ処理を施す。
S5：処理部１６はテキストデータを検出できたか否かを判断する。テキストデータが検出されない場合、処理はステップＳ３に戻り、次の判断テキスト位置をトリミングして同様の処理が行われる。
S6：テキストデータが検出された場合、処理部１６は、会社マスタＤＢ２２に検出したテキストデータが登録されているか否かを判断する。例えば、処理部１６がトリミングした範囲から「ＡＢＣ」というテキストを抽出し（認識し）、会社マスタＤＢ２２に「ＡＢＣ」という会社名が登録されている場合、テキストデータが会社マスタＤＢ２２に登録されていると判断される。逆に、会社マスタＤＢ２２の「ＡＢＣ」という会社名が、処理部１６がトリミングした範囲のテキストデータに含まれているかどうかを判断してもよい。
S7：この場合、処理部１６はＦＡＸ画像が発注書６であると判断する。また、トリミングした範囲から抽出された「ＡＢＣ」というテキストにより会社マスタＤＢ２２の会社名を特定できる。
S8：一方、会社マスタＤＢ２２に抽出したテキストデータが登録されていない場合、処理部１６は一般文書７であると判断する。

次に、図１３を用いて、判断処理として類似画像検索が行われる場合を説明する。図１３のステップＳ１〜Ｓ３は図１２と同様である。
S4：処理部１６は、トリミングした範囲及び会社マスタＤＢ２２の判断画像から画像の特徴量を抽出する。なお、会社マスタＤＢ２２の判断画像の特徴量は予め抽出しておくことで、図１３の処理のたびに画像の特徴量を抽出する必要をなくすことができる。
S5：処理部１６は、トリミングした範囲の特徴量と、会社マスタＤＢ２２の各判断画像の特徴量との距離をそれぞれ算出する。
S6：処理部１６は、距離に基づいてトリミングした範囲の画像が会社マスタＤＢ２２に登録されているか否かを判断する。まず、各判断画像のうちトリミングした範囲の画像との距離が最も短い距離を決定する。そして、最も短い距離が閾値以下か否かを判断する。この閾値は、トリミングした範囲の画像と判断画像が同一と見なせる程度の距離であり、予め定められている。
S7：トリミングした範囲の画像が会社マスタＤＢ２２に登録されていると判断された場合、処理部１６はＦＡＸ画像が発注書６であると判断する。また、距離が最も小さかった判断画像に対応付けられた会社名を会社マスタＤＢ２２から特定できる。
S8：トリミングした範囲の画像が会社マスタＤＢ２２に登録されていない場合、処理部１６は一般文書７であると判断する。

ここで、ＯＣＲ処理と類似画像検索は両方、行われてもよい。この場合、ＯＣＲ処理と類似画像検索の両方で同じ結果（同じ会社名）が得られる場合に、該会社名を特定してもよいし、いずれか一方で会社名が検出できれば該会社名であると特定してもよい。前者はより正確に会社名を特定でき、後者は処理負荷を向上させずに会社名を特定できる可能性を向上できる。

図１１に戻り、ステップＳ３０に続いて、処理部１６はステップＳ３０の結果を使用して発注書６か否かを判断する（Ｓ４０）。

ステップＳ４０の判断がＹｅｓの場合、仕分部１７は会社マスタＤＢ２２の仕分方法を参照し、ＰＣ３０に転送するか印刷するかを判断する。ここでは、転送すると判断されたものとし、ＦＡＸ画像と会社名を転送部１８に転送させる（Ｓ５０）。

ステップＳ４０の判断がＮｏの場合、仕分部１７はＦＡＸ画像を印刷部１３に印刷させる（Ｓ６０）。

発注書６が印刷された場合は、受注業者の担当者が紙文書を確認して手で入力すると共に、必要であれば後述する判断テキスト位置や判断画像位置の登録を行う。一般文書がＰＣ３０に転送された場合は、ＰＣ３０によるＯＣＲ処理を受注業者の担当者がＦＡＸ画像と発注システム用ＤＢ４３の登録内容を比較して確認する際に気づくため不都合はない。あるいは、そもそも発注内容がないのでＰＣ３０がその旨を検出し、ＦＡＸ画像を担当者にメールなどで通知できる。

なお、判断テキスト位置１及び判断テキスト位置２の両方で同じ会社名が検出されることを条件にしてもよいし、判断テキスト位置１又は判断テキスト位置２の片方で会社名が検出されることを条件にしてもよい。前者はより正確に会社名を特定でき、後者は処理負荷を向上させずに会社名を特定できる可能性を向上できる。

なお、図１１では、ＦＡＸ画像が発注書６か否かでＦＡＸ画像が仕分けされているが、会社マスタＤＢ２２には発注者ごとに（会社ごと）転送先が登録されているので、発注書６をさらに仕分けることもできる。例えば、Ｘ社の発注書６はＭＦＰ１０内でＯＣＲ処理をするなどである。

また、ステップＳ４０の判断がＹｅｓの場合でも、転送部１８がＦＡＸ画像をＰＣ３０に転送すると共に、印刷部１３が印刷してよい。すなわち、発注書６の場合、ＰＣ３０で受注処理のためにＯＣＲ処理されると共に、ＭＦＰ１０が印刷する。これにより、担当者は発注書６も紙文書で取得できる。一方、担当者は発注書６が、発注書６として判断されＰＣ３０に転送されたか、一般文書７として判断されたか不明になるので、ＭＦＰ１０は一般文書７と区別できる態様で発注書６を印刷することが好ましい。例えば、一般文書７とは別の所定の排紙トレイに排紙したり、発注書６に「受注処理済み」という文字等を追加して印刷したりする。これらにより、担当者は発注書６が処理済みであると判断できる。

＜前処理部３２によるＯＣＲ処理の前処理＞
以上のようにして、発注書６のＦＡＸ画像と会社名がＰＣ３０に送信される。ＰＣ３０の受信部３１はＦＡＸ画像と会社名を対応付けて画像記憶部４１に記憶させる。ＰＣ３０の前処理部３２は、ＯＣＲ処理のためＦＡＸ画像に天地補正、傾き補正、罫線検出、縦ずれ補正、横ずれ補正等の前処理を行う。前処理とは、ＯＣＲ処理の認識率を高めるための処理であり、必ずしも必須ではない。しかし、発注書のように正確さが求められるＯＣＲ処理では前処理が行われることが好ましい。

図１４は、前処理部３２の処理を説明するフローチャート図の一例である。以下、前処理を順番に説明する。なお、傾き補正がＭＦＰ１０で行われている場合は、ＰＣ３０は行わなくてよいためと、傾き補正についてはすでに説明したため省略する。

<<Ｓ２０天地補正>>
図１５は、天地識別処理と天地補正処理の例を示す図である。天地識別処理では、画像の特徴量に基づいて画像の方向を識別する。画像を地図になぞらえて正しく表示された場合の上方を北と称する。天地識別結果により、現在のＦＡＸ画像の向き（東西南北）が分かる。図１５（ａ）には西向きのＦＡＸ画像が、図１５（ｂ）には東向きのＦＡＸ画像が、図１５（ｃ）には南向きのＦＡＸ画像がそれぞれ示されている。

前処理部３２は、文字部に傾き補正された状態で簡易的にＯＣＲ処理を行うことで、現在のＦＡＸ画像の向きを検出する。まず、ＦＡＸ画像を像域分離するなどしてレイアウトを判断する。前処理部３２は、ＦＡＸ画像のレイアウトを判断することにより、文字部６０１、表組み６０２、図形６０３、その他などを識別する。ここでは、文字部６０１を検出できればよいので、連続した黒画素の外接矩形がほぼ同じ大きさで、このほぼ同じ大きさの外接矩形が複数並んで得られる領域が文字部である。

各文字の外接矩形の縦横比に基づき、ＯＣＲ処理を行う文字を選択する。例えば、縦横比が５０％以上かつ２００％未満の文字をＯＣＲ処理の対象にする。これは、「一」や「１」など認識しても文字の方向を特定しにくい文字を除外するためである。また、前処理部３２は文字サイズが閾値（例えば２０ピクセル）以上の文字をＯＣＲ処理の対象にする。これは、同様の理由で「・」や「,」など小さい文字を除外するためである。

前処理部３２は、ＯＣＲ処理の対象となった文字の任意の１００文字くらいにＯＣＲ処理を施す。ＯＣＲ処理を文字の方向を９０度ずつ変えながら繰り返す。そして、方向ごとに、どのくらいの確度で文字を認識できるかを比較し、最も確度の高い方向が北向きとなるように天地補正する。このようにして北向きにＦＡＸ画像が補正される。

<<Ｓ３０罫線検出>>
図１６は罫線（表組み）の検出で使用される交点を模式的に示す図の一例である。罫線（表組み）は、図１６の交点を一部に有している。前処理部３２は、ＦＡＸ画像からこれらの交点を検出して罫線（表組み）を検出する。

具体的には、前処理部３２は、直線を検出すると任意の場所から直線の黒画素を追跡し、直角に分岐している部分（追跡してきた方向を除き２又は３方向に黒画素が連続する）を交点として検出する。この交点を中心に所定長の線分をトリミングして、図１６の部品とマッチングすると交点の種類を特定できる。

ＦＡＸ画像の全ての交点について交点の種類を特定すると、罫線（表組み）を検出できたことになる。なお、ノイズを省くため、所定長以上の直線と接続された交点のみを抽出してもよい。

このように、罫線（表組み）の全体が検出されたので、罫線（表組み）の構造が明らかになる。例えば、罫線（表組み）のレコード数とカラム数が特定される。また、罫線の位置（ＦＡＸ画像の上端、下端、左端、右端から罫線までの距離）も特定される。また、発注書ＤＢ４２に登録されている発注書６の書式と比較することにより、ＭＦＰ１０が判断した会社名が正しいかどうかを検証できる。

<<Ｓ４０縦ずれ・横ずれの補正>>
ＦＡＸによるスキャン時にＦＡＸ画像が縦ずれ・横ずれを起こすことがある。原因は種々であるが、例えばスキャン時に発注書６の紙送りに不具合が発生し、発注書６が紙送りされていないのにＦＡＸ画像の読み取りだけが進んでしまったような場合に縦ずれが発生する。また、発注者の担当者が発注書６を発注者ＦＡＸ装置８に置く際に場所がずれてしまった様な場合に横ずれが発生する。

図１７は、ＦＡＸ画像の縦ずれ・横ずれの一例を説明する図である。図１７（ａ）は縦ずれ及び横ずれしていない状態の発注書６を示し、図１７（ｂ）は縦ずれ及び横ずれしている状態の発注書６を示す。

縦ずれ量と横ずれ量は、発注書ＤＢ４２の発注書６の発注リストの位置と、ＦＡＸ画像の発注リストの位置の差により算出される。発注書などの文字の位置を比較してもよいが、罫線は、直線で構成されているため、位置を特定しやすい。

発注書ＤＢ４２の発注書６の書式における罫線の位置を上端からＶ_０、左端からＨ_０とする。また、ＦＡＸ画像における罫線の位置を上端からＶ_Ｆ、左端からＨ_Ｆとする。したがって、縦ずれ量と横ずれ量は以下のように算出される。

縦ずれ量：Ｖ_０−Ｖ_Ｆ＝Ｖ
横ずれ量：Ｈ_０−Ｈ_Ｆ＝Ｈ
Ｖが負値の場合、前処理部３２は左方向にＶ（絶対値）だけＦＡＸ画像を全体に移動する（平行移動する）。Ｖが正値の場合、前処理部３２は右方向にＶ（絶対値）だけＦＡＸ画像を全体に移動する（平行移動する）。

Ｈが負値の場合、前処理部３２は上方向にＨ（絶対値）だけＦＡＸ画像を全体に移動する（平行移動する）。Ｈが正値の場合、前処理部３２は下方向にＨ（絶対値）だけＦＡＸ画像を全体に移動する（平行移動する）。

こうすることで、図１７（ｃ）に示すように、ＦＡＸ画像のずれが解消される。これにより、ＰＣ３０は、発注書ＤＢ４２の書式等にしたがって、ＦＡＸ画像から発注商品名、商品コード、発注数量等の発注内容を正しく読み出すことができる。

＜ＯＣＲ処理＞
続いて、図１８、図１９を使用して、ＯＣＲ処理を説明する。図１８はＯＣＲ処理の手順を示すフローチャート図の一例である。

まず、ＯＣＲ処理部３３は、前処理が施されたＦＡＸ画像の全体にレイアウト解析を行う（Ｓ１０）。すなわち、文字部６１１、罫線部（表組み部）６１２、図形６１３等に分離する。文字部６１１については図１５で説明した。また、表組み（表組み部）６１２については図１６にて説明した。図形は文字部６１１と罫線部（表組み部）６１２以外の領域であり、連続した黒画素の外接矩形が文字より大きい領域等として検出される。

次に、ＯＣＲ処理部３３は文字部６１１と罫線部６１２から行を切り出す（Ｓ２０）。図１９（ａ）は行の切り出しを説明する図の一例である。ＯＣＲ処理部３３は、上端から１画素ずつ水平方向に走査線６２１で走査して白画素を検出する。白画素が水平方向に連続した部分が行間である。また、行間の上と下の黒画素が行である。このようにして、行を切り出すことができる。なお、垂直方向にも同様に処理するが、図１９（ａ）のように横書きの場合、垂直方向に連続した白画素は検出されない。

また、罫線の内部については、各項目内で同様の処理を行うことで、項目内の行を検出できる。

次に、ＯＣＲ処理部３３は、文字の切り出しを行う（Ｓ３０）。図１９（ｂ）は文字の切り出しを説明する図の一例である。ＯＣＲ処理部３３は、各行ごとに黒画素を垂直方向に投影したヒストグラムを作成する。文字と文字の境ではヒストグラムがゼロになるので、ゼロとゼロの間を１つの文字として切り出す。

次に、ＯＣＲ処理部３３は、文字認識を行う（Ｓ４０）。具体的には、正規化（Ｓ４０１）、特徴抽出（Ｓ４０２）、マッチング（Ｓ４０３）という処理を行う。正規化とは、切り出した１つの文字を一定の大きさ（日本語の場合一般に正方形）に変倍する処理である。これにより、文字の変形（縦長、横長など）を吸収し、マッチングの精度が向上する。

特徴抽出とは、文字を特徴づける情報を抽出することである。図１９（ｃ）は文字の特徴として、文字の方向成分の抽出例を示す。図１９（ｃ）のように文字を左右、斜め上方向、上下、左上方向の４つの成分に分解する。そして、図１９（ｄ）に示すように、４つの成分を７×７画素程度に縮小し、文字の特徴として使用する。したがって、７×７×４＝１９６個の特徴値に変換される。

次に、マッチングとは、文字の特徴を使って、登録された全ての文字の特徴（標準パターン）と認識対象の文字とを比較することである。なお、標準パターンは、いろいろな字体（明朝体、ゴシック体、教科書体など）や「かすれ」文字、「つぶれ」文字の認識を安定して行うために、いろいろな状態で印字された文字を平均化して作られる。なお、比較には、認識対象の文字と標準パターンの特徴をそれぞれベクトルとして、ユークリッド距離などを算出し、ユークリッド距離が最も近い標準パターンの文字が採用される。

次に、ＯＣＲ処理部３３は、知識処理を適用して変換ミスを補正する（Ｓ５０）。実際には似ている文字が存在するため、一意に文字が決まらない場合がある。このような場合、ＯＣＲ処理部３３は辞書を参照して複数の候補のうち、辞書に登録されている用語になるように各文字を修正する。

<<発注システム用ＤＢ４３への登録>>
ＯＣＲ処理が終了すると、ＰＣ３０の登録部３４が発注システム用ＤＢ４３に発注書６の内容を登録できる。図２０は、登録部３４が発注システム用ＤＢ４３に発注書６の内容を登録する手順を示すフローチャート図の一例である。

まず、登録部３４は、ＦＡＸ画像に対しＰＣ３０のＯＣＲ処理で得られたテキストデータから会社名を検出する（Ｓ１０）。例えば、会社マスタＤＢ２２の判断テキスト位置と同様の情報から会社名が記載された位置を特定し、会社名を取得してもよいし、テキストデータの全体から会社マスタＤＢ２２に登録されている会社名を検索してもよい。

次に、登録部３４は、ＭＦＰ１０の認識結果と一致するか否かを判断する（Ｓ２０）。ＭＦＰ１０はＦＡＸ画像と共に会社名を送信しているので、ステップＳ１０の会社名と比較する。

ステップＳ２０の判断がＮｏの場合、発注者を正しく識別できていない可能性が高いため、登録部３４はＦＡＸ画像を受注業者の担当者に電子メールなどで送信する（Ｓ８０）。これにより、担当者はＦＡＸ画像を確認し、発注書６であれば発注システムに登録し、発注書６でなければ印刷したり破棄したりする。担当者のメールアドレスはＰＣ３０に登録されている。あるいは、一般文書７であると判断されたＦＡＸ画像と同様に、ＭＦＰ１０に打ち出させてもよい。この場合、一般文書７とは別の排紙トレイから印刷することが好ましい。

ステップＳ２０の判断がＹｅｓの場合、発注者を正しく識別できた可能性が高いため、登録部３４は会社マスタＤＢ２２から罫線（表組み）の各項目の位置を取得する（Ｓ３０）。

次に、ＰＣ３０のＯＣＲ処理で得られたテキストデータから、ステップＳ３０で取得された項目の位置のテキストデータを取得する（Ｓ４０）。これにより、発注商品名、商品コード、発注数量などを取得できる。

登録部３４は、発注システム用ＤＢ４３に項目のテキストデータを登録する（Ｓ５０）。すなわち、発注商品名、発注コード、発注数量等を発注システム用ＤＢ４３の定められたフィールドに登録する。

登録部３４は、ステップＳ３０で取得した全ての項目の登録が終了したか否かを判断する（Ｓ６０）。ステップＳ６０の判断がＮｏの場合、処理はステップＳ４０に戻り、ステップＳ６０の判断がＹｅｓの場合、図２０の処理は終了する。

一般文書がＰＣ３０でＯＣＲ処理された場合、罫線が検出されないこと、又は、発注内容を抽出できないことなどを登録部３４が検出できる。この場合も、登録部３４はステップＳ２０のように電子メールなどで担当者に通知することが好ましい。

＜会社マスタＤＢ２２への登録＞
一般文書７として印刷されたＦＡＸ画像の中には、発注書６も存在しうると考えられる。例えば、会社マスタＤＢ２２に登録されている判断テキスト位置や判断画像位置ではない位置に会社名などがある場合などである。この場合、受注業者の担当者は会社マスタＤＢ２２に新たに判断テキスト位置や判断画像位置を登録することが好ましい。これにより、ＭＦＰ１０による発注書６の仕分けの精度を向上できる。

図２１は、ＭＦＰ１０の基準位置登録部１４が会社マスタＤＢ２２に判断テキスト位置や判断画像位置を登録する手順を示すフローチャート図の一例である。なお、適宜、図２２の画面例を参照して説明する。

まず、担当者は登録初期画面６３１を操作表示部４１１に表示する（Ｓ１０）。図２２（ａ）は登録初期画面６３１の一例を示す。担当者が会社マスタ変更ボタン６３２を押下すると、基準位置登録部１４が操作を受け付ける（Ｓ２０）。

この操作により、基準位置登録部１４は会社名選択画面６４１を操作表示部４１１に表示する。図２２（ｂ）は会社名選択画面６４１の一例を示す。会社名選択画面６４１は会社名ボタン６４２、新規登録ボタン６４３及び自動登録ボタン６４４を有する。会社名ボタン６４２は、すでに登録されている会社名に判断テキスト位置や判断画像位置を追加するためのボタンであり、新規登録ボタン６４３は新たに会社マスタＤＢ２２に会社名などの１レコードを登録するためのボタンである。自動登録ボタン６４４は、すでに会社名等が登録されている発注者に判断テキスト位置及び判断画像位置を自動で登録するためのボタンである。自動登録ボタン６４４については図２３にて説明する。

担当者が会社名ボタン６４２又は新規登録ボタン６４３を押下すると、基準位置登録部１４が操作を受け付ける（Ｓ３０）。

基準位置登録部１４は紙文書をＭＦＰ１０にセットするように担当者に要求し、担当者が紙文書をＭＦＰ１０にセットしてその旨をＭＦＰ１０に入力すると、読取部１２が紙文書を読み取り画像データに変換する（Ｓ４０）。この紙文書は発注書６だが一般文書７であると判断されたＦＡＸ画像の紙文書である。基準位置登録部１４は画像データを操作表示部４１１に表示する。図２２（ｃ）は画像データ画面６５１の一例を示す。画像データ画面６５１には画像データ６５２、判断テキストボタン６５３、及び、判断画像ボタン６５４が表示される。判断テキストボタン６５３は判断テキスト位置を登録するためのボタンであり、判断画像ボタン６５４は判断画像位置を登録するためのボタンである。

次に、基準位置登録部１４は判断テキスト位置又は判断画像位置を受け付ける（Ｓ５０）。図２２（ｄ）は画像データ画面６５１において担当者が入力した判断テキスト位置６５５を示す図である。担当者は判断テキストボタン６５３又は判断画像ボタン６５４のいずれかを選択する。基準位置登録部１４は選択を受け付ける。新規登録の場合は両者が順番に指定される。

基準位置登録部１４は、補正部１５や処理部１６を利用して画像データのうち指定された位置にＯＣＲ処理又は画像トリミングを施す（Ｓ６０）。判断テキストボタン６５３が押下された場合、ＯＣＲ処理が行われ、判断画像ボタン６５４が押下された場合、画像トリミングが行われる。

ＯＣＲ処理により、会社名などのテキストデータが得られる。画像トリミングにより判断画像の候補画像が得られる。図２２（ｅ）は登録テキスト表示画面６７１の一例である。登録テキスト表示画面６７１では、ＯＣＲ処理で得られた会社名６７２、ＯＫボタン６７３、及びキャンセルボタン６７４が表示される。担当者はＯＣＲ処理の結果を見て登録するかどうかを判断する。ここで、誤認識がある場合、担当者が修正してよい。担当者によるＯＫボタン６７３、及びキャンセルボタン６７４の操作を基準位置登録部１４が受け付ける。なお、画像トリミングの場合、会社名６７２の代わりに判断画像の候補画像が表示される。判断画像の候補画像は、外接矩形でトリミングされる。

ＯＫボタン６７３が押下された場合、基準位置登録部１４は情報を追加するか更新するかを受け付ける。図２２（ｆ）は追加更新選択画面６８１の一例である。追加更新選択画面６８１は、情報を追加するためのラジオボタン６８２と情報を更新するためのラジオボタン６８３を有する。情報の追加とは、すでに登録されている判断テキスト位置又は判断画像位置に、ステップＳ５０で受け付けた判断テキスト位置又は判断画像位置を追加することをいう。情報の更新とは、すでに登録されている判断テキスト位置又は判断画像位置を、ステップＳ５０で受け付けた判断テキスト位置又は判断画像位置で置き換えることをいう。

受注業者の担当者がいずれかのラジオボタン６８２，６８３を選択すると、基準位置登録部１４はステップＳ３０で新規登録が選択されていたかどうかを判断する（Ｓ７０）。

新規登録であった場合（Ｓ７０のＹｅｓ）、基準位置登録部１４は重複登録を禁止して会社名等を会社マスタＤＢ２２に登録する（Ｓ８０）。基準位置登録部１４はＯＣＲ処理で得られた会社名が会社マスタＤＢ２２にすでに登録されている場合はその旨を操作表示部４１１に表示し、重複登録しない。重複登録でない場合、会社名、判断テキスト位置１、判断画像位置１、及び仕分方法を会社マスタＤＢ２２に登録する。

新規登録でない場合（Ｓ７０のＮｏ）、基準位置登録部１４はステップＳ６０のＯＣＲ処理で得られた会社名を会社マスタＤＢ２２から検索する。あるいは、画像トリミングで得られたロゴ又はシンボルマークと類似した判断画像に対応付けられた会社名を特定する。これらにより、判断テキスト位置と判断テキスト又は判断画像位置と判断画像を会社名に対応付けて登録する（Ｓ９０）。すなわち、追加更新選択画面６８１で情報の追加が選択された場合は判断テキスト位置又は判断画像位置を追加し、情報の更新が選択された場合は判断テキスト位置又は判断画像位置を上書きする。

このように、受注業者の担当者は、紙文書を読み取らせるという簡単な操作で会社マスタＤＢ２２に会社名等を登録できる。

<<変形例>>
また、図２３に示すように、担当者が判断テキスト位置又は判断画像位置を登録しなくても、簡易的に判断テキスト位置又は判断画像位置が登録することもできる。図２３は、ＭＦＰ１０の基準位置登録部１４が会社マスタＤＢ２２に判断テキスト位置や判断画像位置を追加して登録する手順を示すフローチャート図の一例である。図２３では主に図２１との相違を説明する。

まず、ステップＳ１０、Ｓ２０は図２１と同様でよい。次に、担当者が自動登録ボタン６４４を押下したものとする。基準位置登録部１４が操作を受け付ける（Ｓ３０）。自動登録ボタン６４４が押下される場合、会社名等が登録済みなので、会社名又は判断画像が会社マスタＤＢ２２に登録されている。したがって、会社マスタＤＢ２２に登録された会社名又は判断画像を画像データから検索することが可能である。

基準位置登録部１４は紙文書をＭＦＰ１０にセットするように担当者に要求し、担当者が紙文書をＭＦＰ１０にセットしてその旨をＭＦＰ１０に入力すると、読取部１２が紙文書を読み取り画像データに変換する（Ｓ４０）。

基準位置登録部１４は、補正部１５や処理部１６を利用して画像データの全体にＯＣＲ処理を施し、また、判断画像の候補画像を抽出する（Ｓ５０）。候補画像は、像域分離などによりロゴやシンボルマークと推定できる文字以外の画像である。

そして、基準位置登録部１４は、会社マスタＤＢ２２の会社名をＯＣＲ処理で得られたテキストデータから検索し、会社マスタＤＢ２２の判断画像のうち画像候補と類似している判断画像を決定する（Ｓ６０）。これにより、登録するために読み取られた画像データがどの会社のものか分かる。

基準位置登録部１４は、会社名が検出された位置を判断テキスト位置として会社マスタＤＢ２２に登録し、ロゴ等が検出された位置を判断画像位置として会社マスタＤＢ２２に登録する（Ｓ７０）。なお、登録する判断テキスト位置又は判断画像位置は、会社名又は判断画像の外接矩形に十分なマージンを含んで決定される。十分なマージンとは、発注者ＦＡＸ装置８で発注書６を読み取る際の傾き、縦ずれ・横ずれを許容できる程度のマージンである。

したがって、すでに会社マスタＤＢ２２に登録されている発注者の発注書６であれば、担当者が判断テキスト位置又は判断画像位置を指定しなくても、判断テキスト位置又は判断画像位置を登録できる。

＜まとめ＞
以上説明したように、本実施形態の画像処理システム１００は、ＦＡＸ機能で受信したＦＡＸ画像の一部のみにＭＦＰ１０が画像処理して仕分けを行うので、仕分けに必要なＭＦＰ１０のリソースを削減できる。また、ＭＦＰ１０は受注処理のためのＯＣＲ処理を行う必要がない。また、ＰＣ３０が受注処理のためのＯＣＲ処理を施すのは発注書６だけなので、ＰＣ３０が全てのＦＡＸ画像にＯＣＲ処理を施す必要がない。また、発注書６が一般文書と判断されても、担当者が新たな判断テキスト位置や判断画像位置を登録することができる。

＜その他の適用例＞
以上、本発明を実施するための最良の形態について実施例を用いて説明したが、本発明はこうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。

例えば、ＭＦＰ１０はＦＡＸ装置と印刷装置の２台に分散されていてもよい。また、ＰＣ３０は複数台、存在してもよいし、複数のＰＣ３０に機能が分散されていてもよい。

また、会社マスタＤＢ２２はＭＦＰ１０がアクセスできる場所にあればよく、ＭＦＰ１０が有していなくてもよい。また、発注書ＤＢ４２や発注システム用ＤＢ４３はＰＣ３０がアクセスできる場所にあればよく、ＰＣ３０が有していなくてもよい。

また、図５などの構成例は、ＭＦＰ１０及びＰＣ３０の処理の理解を容易にするために、主な機能に応じて分割したものである。処理単位の分割の仕方や名称によって本願発明が制限されることはない。また、ＭＦＰ１０及びＰＣ３０の処理は、処理内容に応じてさらに多くの処理単位に分割することもできる。また、１つの処理単位がさらに多くの処理を含むように分割することもできる。

なお、受信部１１は受信手段の一例であり、処理部１６は第１の画像処理手段の一例であり、仕分部１７は仕分け手段の一例であり、転送部１８は送信手段の一例であり、前処理部３２とＯＣＲ処理部３３は第２の画像処理手段の一例であり、登録部３４は抽出手段の一例であり、印刷部１３は印刷手段の一例であり、基準位置登録部１４は登録手段の一例である。ＭＦＰ１０は第１の画像処理装置の一例であり、ＰＣ３０は第２の画像処理装置の一例である。会社マスタＤＢ２２は記憶手段の一例であり、判断テキスト位置又は判断画像位置は部分画像位置情報の一例である。

１０ＭＦＰ
１２読取部
１３印刷部
１４基準位置登録部
１５補正部
１６処理部
１７仕分部
１８転送部
３１受信部
３２前処理部
３３ＯＣＲ処理部
３４登録部
１００画像処理システム

特開2012-178692号公報

Claims

第１の画像処理装置と第２の画像処理装置とが通信する画像処理システムであって、
前記第１の画像処理装置は、
書類から生成された画像データを受信する受信手段と、
前記画像データに対し第１の画像処理を行う第１の画像処理手段と、
前記第１の画像処理の結果に基づいて前記画像データから特定書類画像を検出する仕分け手段と、
前記仕分け手段により仕分けられた前記特定書類画像を前記第２の画像処理装置に送信する送信手段と、を有し、
前記第２の画像処理装置は、
前記特定書類画像に対し第２の画像処理を行う第２の画像処理手段と、
前記第２の画像処理の結果に基づいて前記特定書類画像の項目から項目情報を抽出する抽出手段と、を有し、
前記特定書類画像は、所定の領域に特定の書類に関する特定書類情報を有し、
前記第１の画像処理手段は、前記所定の領域よりも大きく、かつ、前記特定書類画像が生成される際に想定される位置ずれを許容する範囲で、前記画像データから部分画像を抽出し、
前記仕分け手段は、前記部分画像に基づいて前記特定書類画像か否かを判別し、
前記抽出手段は、前記第２の画像処理手段が前記特定書類画像の前記位置ずれを補正した前記特定書類画像から、前記項目情報を抽出する画像処理システム。
前記特定書類情報は予め定められた文字列を含み、
前記第１の画像処理手段は、前記部分画像からテキストデータを抽出し、
前記仕分け手段は、前記テキストデータが前記文字列を含む場合に、前記画像データが前記特定書類画像であると判断することを特徴とする請求項１に記載の画像処理システム。
前記特定書類情報は模様を含み、
前記第１の画像処理手段は、前記部分画像から検出した前記模様が、予め定められた模様と類似するか否かを判断し、
前記仕分け手段は、前記部分画像から検出した前記模様が予め定められた模様と類似すると判断された場合、前記画像データが前記特定書類画像であると判断することを特徴とする請求項１に記載の画像処理システム。
前記特定書類画像でないと判断された前記画像データを印刷する印刷手段を有し、
前記印刷手段は、前記特定書類画像と判断された前記画像データと前記特定書類画像でないと判断された前記画像データとを異なる排紙トレイに出力する請求項１〜３のいずれか１項に記載の画像処理システム。
前記特定書類情報と、前記部分画像の位置を指定する部分画像位置情報とを対応付けて記憶する記憶手段を有し、
前記第１の画像処理装置は、
ユーザにより指定された画像データに対する前記部分画像位置情報を受け付け、
前記画像データの前記部分画像位置情報が指定する範囲を解析して得られた前記特定書類情報と、前記部分画像位置情報を対応付けて前記記憶手段に登録する登録手段、を有する請求項１〜４のいずれか１項に記載された画像処理システム。
前記記憶手段に登録されている前記特定書類情報が、前記第１の画像処理により前記画像データから検出された場合、
前記登録手段は、前記記憶手段の前記特定書類情報に対応付けて、前記画像データで前記特定書類情報が検出された位置を含む前記部分画像位置情報を登録する請求項５に記載の画像処理システム。
前記記憶手段には、前記特定書類情報に模様が対応付けて登録されており、
前記第１の画像処理により前記画像データから前記模様と類似する模様が検出された場合、
前記登録手段は、前記記憶手段の前記特定書類情報に対応付けて、前記画像データで前記模様が検出された位置を含む前記部分画像位置情報を登録する請求項５に記載の画像処理システム。
前記第１の画像処理手段は、前記記憶手段に登録されている前記部分画像位置情報に基づき抽出した前記部分画像から前記特定書類情報を抽出し、
前記仕分け手段は、抽出した前記特定書類情報が前記記憶手段に登録されているか否かに応じて、前記画像データが前記特定書類画像か否かを判断することを特徴とする請求項５〜７のいずれか１項に記載の画像処理システム。
前記特定書類情報は前記画像データを送信した送信元を特定するための情報であり、
前記部分画像には、前記送信元を特定するための情報が記載されている請求項１〜８のいずれか１項に記載の画像処理システム。
第１の画像処理装置と第２の画像処理装置とが通信する画像処理システムが行う画像処理方法であって、
前記第１の画像処理装置にて行われる、
受信手段が、書類から生成された画像データを受信するステップと、
第１の画像処理手段が、前記画像データに対し第１の画像処理を行うステップと、
仕分け手段が、前記第１の画像処理の結果に基づいて前記画像データから特定書類画像を検出するステップと、
送信手段が、前記仕分け手段により仕分けられた前記特定書類画像を前記第２の画像処理装置に送信するステップと、を有し、
前記第２の画像処理装置に行われる、
第２の画像処理手段が、前記特定書類画像に対し第２の画像処理を行うステップと、
抽出手段が、前記第２の画像処理の結果に基づいて前記特定書類画像の項目から項目情報を抽出するステップと、を有し、
前記特定書類画像は、所定の領域に特定の書類に関する特定書類情報を有し、
前記第１の画像処理手段は、前記所定の領域よりも大きく、かつ、前記特定書類画像が生成される際に想定される位置ずれを許容する範囲で、前記画像データから部分画像を抽出し、
前記仕分け手段は、前記部分画像に基づいて前記特定書類画像か否かを判別し、
前記抽出手段は、前記第２の画像処理手段が前記特定書類画像の前記位置ずれを補正した前記特定書類画像から、前記項目情報を抽出する画像処理方法。
予め定められた特定書類画像に対し第２の画像処理を行う第２の画像処理手段と、
前記第２の画像処理の結果に基づいて前記特定書類画像の項目から項目情報を抽出する抽出手段と、を有し、
前記抽出手段は、前記第２の画像処理手段が前記特定書類画像の位置ずれを補正した前記特定書類画像から前記項目情報を抽出する第２の画像処理装置と通信する情報処理装置であって、
書類から生成された画像データを受信する受信手段と、
前記画像データに対し第１の画像処理を行う第１の画像処理手段と、
前記第１の画像処理の結果に基づいて前記画像データから特定書類画像を検出する仕分け手段と、
前記仕分け手段により仕分けられた前記特定書類画像を前記第２の画像処理装置に送信する送信手段と、を有し、
前記特定書類画像は、所定の領域に特定の書類に関する特定書類情報を有し、
前記第１の画像処理手段は、前記所定の領域よりも大きく、かつ、前記特定書類画像が生成される際に想定される前記位置ずれを許容する範囲で、前記画像データから部分画像を抽出し、
前記仕分け手段は、前記部分画像に基づいて前記特定書類画像か否かを判別する情報処理装置。