JP2007158413A - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置 Download PDF

Info

Publication number
JP2007158413A
JP2007158413A JP2005346564A JP2005346564A JP2007158413A JP 2007158413 A JP2007158413 A JP 2007158413A JP 2005346564 A JP2005346564 A JP 2005346564A JP 2005346564 A JP2005346564 A JP 2005346564A JP 2007158413 A JP2007158413 A JP 2007158413A
Authority
JP
Japan
Prior art keywords
information
image
input
area
confidential
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005346564A
Other languages
English (en)
Other versions
JP2007158413A5 (ja
JP4557875B2 (ja
Inventor
Tatsuhiko Hirai
達彦 平井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005346564A priority Critical patent/JP4557875B2/ja
Publication of JP2007158413A publication Critical patent/JP2007158413A/ja
Publication of JP2007158413A5 publication Critical patent/JP2007158413A5/ja
Application granted granted Critical
Publication of JP4557875B2 publication Critical patent/JP4557875B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】機密情報が漏洩されようとする際に、その漏洩を未然に防ぎ、その操作に対して警告することを可能とする画像処理システムを提供すること。
【解決手段】機密として扱う紙文書またはデータのページ内の文字、グラフ、表、画像、写真、フォントなどの構成に関わる特徴を抽出し、これらの特徴を登録情報として格納する。MFPを使用して出力する際に、先ず、その紙文書またはデータのページ内の文字、グラフ、表、画像、写真、フォントなどの構成に関わる特徴を抽出する。次に、この抽出した特徴を、あらかじめ登録されている文書またはデータの特徴と照合する。この照合の結果、その文書またはデータが、あらかじめ登録された文書またはデータであるか否かを判定し、あらかじめ登録された文書またはデータであると判定した場合に、警告処理を実行する。
【選択図】図3

Description

本発明は、画像処理装置、画像処理方法に関する。
画像処理装置の普及に従って、誰でも原稿の複写やファクシミリ送信等が容易に行うことが可能になっている。しかし、これらはユーザにとっての利便性向上の反面、機密原稿などの複写や送信といった情報漏洩の観点では非常に問題となっている。
このような問題への対策として、例えば、磁気カードなどの手段で、ユーザの認証をして動作可能とするものもある。また、複写や送信などの際に、読み取った画像データを全て記録装置に蓄積しておく画像処理装置が存在する。これにより、情報漏洩した原稿が、どの画像処理装置で読み取られたかを、管理者が前記画像データを確認することによって、いつ、どこで、どのような処理をされたかを追跡可能になるといった効果がある。
ネットワーク・プリントにおいては、サーバを経由して印刷された際に、印刷されたデータに関する情報、印刷された日付、印刷処理を実行した出力者などの履歴を蓄積しておき、万が一情報が漏洩した場合でも履歴を追跡可能にした処理装置も開発されている。(例えば、特許文献1参照)。
また、原稿のコピーにおいては、読み取った画像から、その地紋パターン、背景画像、あるいは前面画像に埋め込まれたドットパターンを検出してあらかじめ登録されたデータと照合することも行われている(例えば、特許文献2、3参照)。これにより、その原稿が機密であるか否かを判定し、この判定結果に基づいてその出力(コピー)の禁止/許可を行っている。
特開2004−118243号公報 特開2004−201069号公報 特開2005−142918号公報
しかしながら、従来の画像処理装置、例えば特許文献1に記載されたものは、基本的には機密文書がコピーされて外部に持ち出され、その持ち出しが、あるいは機密情報の漏洩が発覚してから、その機密が漏洩した足取りを調査するシステムである。したがって、これらシステムは、積極的に情報が漏洩することを防止するというよりも、そのようなシステムであることを開示することにより、2次的な効果として、あるいは受け身の形で情報の漏洩を未然に防ぐ効果も有しているに過ぎない。
また、上述した特許文献2、3に記載されたものは、あらかじめ定められた特定のフォーマットを有する原稿のみが、機密として扱うことができるシステムである。このシステムでは、その原稿の用紙が限定されたり、あるいは、その原稿の作成時や印刷時に特定の処理を施す必要があり、煩わしさが存在する。またその原稿をユーザが観察することによりその原稿が特別に管理されていることを知ることができるなどの、ある意味での欠点もあり、またこれにより一般性が低かった。
したがって、本発明は、オブジェクトごとの画像情報と機密情報を登録しておき、そのオブジェクトが出力されそうになったときに警告を発生させることを目的とする。
このような目的を達成するために、本発明は、画像処理装置であって、画像入力手段により入力された画像情報の領域を分析して、その像域情報に応じてブロック分割するブロック・セレクション手段と、前記ブロック・セレクション手段により分割された1つ以上のオブジェクト画像をベクトル化するベクトル化手段と、前記ブロック・セレクション手段により分割された前記1つ以上のオブジェクト画像に対して機密情報を設定する機密情報設定手段と、前記機密情報設定手段により設定された機密情報に対応するオブジェクト画像のベクトル化された情報に、画像属性情報を付加した情報を、オブジェクト情報として格納する格納手段と、入力されるベクトル化されたオブジェクト情報を用いて前記格納手段内に格納されているオブジェクト情報を検索するオブジェクト情報検索手段と、前記オブジェクト情報検索手段により検索されたオブジェクト画像に機密情報が付加されている場合に警告処理する警告処理手段とを備えることを特徴とするものである。
以上の特徴ある構成を備えることにより、オブジェクトごとの画像情報と機密情報を登録しておき、そのオブジェクトが出力されそうになったときに警告を発することが可能となる。
(第1実施形態)
次に本発明に係る画像処理方法の第1実施形態を図面に基づいて説明する。
(画像処理システム)
図1は、本発明を実装することが可能な画像処理システムを説明するためのブロック図である。本発明は、エリア1として示した構成において、あるいは、さらにエリア2として示した構成における構成要素とをインターネット104で接続した環境において、使用することができる。
エリア1内に構築されたLAN107には、記録装置としてのMFP(マルチ・ファンクション複合機)100、MFP100を制御するマネージメントPC101、クライアントPC(外部記憶手段)102が接続されている。さらに、画像の履歴情報を記録するためのジョブ・アーカイブ・サーバ106、画像を記憶するための画像用ストレージ・サーバ105も接続されている。
エリア2内にはLAN108が構築され、LAN108には画像用ストレージ・サーバ105、およびジョブ・アーカイブ・サーバ106が接続されている。なお、エリア2内部のこれらのサーバは、エリア1内部の対応するサーバと同一の符号としており、共に両方に存在することも可能である。通常は、これらのサーバがどちらかのエリアに存在することを想定している。LAN107、108にはプロキシ・サーバ103が接続され、LAN107、108はプロキシ・サーバ103を介してインターネットに接続される。
画像用ストレージ・サーバ105は、MFP100がスキャンしたデータをブロック・セレクションにより文字領域と画像領域に分割し、格納するためのストレージ・デバイスである。ジョブ・アーカイブ・サーバ106は、MFP100におけるプリントや送信した画像を、ユーザ情報、日付、ユーザID、ジョブ種といった画像の属性情報と共にジョブ履歴として記録するためのサーバである。
MFP100は原稿から読み取った入力画像に対する画像処理の一部を担当し、処理結果としての画像データはLAN109を通じてマネージメントPC101に入力される。マネージメントPC101は、画像記憶手段、画像処理手段、表示手段、入力手段等を含む通常のコンピュータであり、機能的にはこれら構成要素の一部がMFP100と一体化して、画像処理システムの構成要素となっている。なお、本実施形態では、マネージメントPCにおいて、下記に記載の検索処理などが実行されるものとするが、マネージメントPCで行われる処理をMFPで実行するようにしても構わない。
さらにMFP100は、LAN109によってマネージメントPC101に直接接続されている。クライアントPC102から出力したイメージ・データを、MFP100でプリントすることができる他、格納されている画像データをダウンロードして表示することができる。
(MFP)
図2は、図1のMFP100の機能ブロックを示す図である。同図において、MFP100は、図示しないオート・ドキュメント・フィーダ(ADF)を有する画像読み取り部110を備える。画像読み取り部110は束状の或いは1枚の原稿の画像を光源で照射し、反射画像をレンズで固体撮像素子上に結像する。固体撮像素子は所定解像度(例えば600dpi)および所定濃度レベル(例えば8ビット)の画像読み取り信号を生成する。画像読み取り信号からラスターデータよりなる画像データが構成される。
MFP100は、記憶装置111および記録装置112を有し、通常の複写機能を実行する際には、イメージ・データをデータ処理装置115によって画像処理して記録信号に変換する。複数枚複写の場合には、1頁分の記録信号を一旦記憶装置111に記憶保持した後、記録装置112に順次出力して、記録紙上に記録画像を形成する。
また、MFP100は、図示しないモデムを備え、このモデムを介して一般公衆回線からファクシミリ受信し、あるいは、画像読み取り部で読み取った画像を、ファクシミリ送信することができる。
MFP100は、LAN107との接続のためのネットワークIF114を有し、クライアントPC102が出力したイメージ・データを、このIFから入力して、記録装置112によって記録したり、モデムを介してファクシミリ送信することができる。クライアントPC102から出力されたイメージ・データはLAN107からネットワークIF114を経てデータ処理装置115で記録可能な記録信号に変換される。この変換後、MFP100において、記録紙上に記録画像として記録される。また、データ処理装置115でファクシミリ送信可能な信号に変換された後、モデムを介して公衆回線上に送信される。
MFP100は、MFP100に設けられたキー操作部(入力装置113)、あるいはマネージメントPC101の入力装置(キーボード、ポインティング・デバイス等)を通じて操作される。これらの操作のために、データ処理装置115は内部の制御部(図示せず。)によって所定の制御を実行する。
また、入力装置113にユーザ認識装置118が接続され、ユーザ識別を行っている。ユーザ認識装置は、このMFP100を使用するユーザの有するICカードの読み取り部、あるいはユーザを識別するデータとそのユーザの暗証番号の入力部から構成される。また、指紋や虹彩識別といった生態認証手段を使用してユーザを特定する装置などを使用することも可能である。このような手段を介して入力したユーザ情報が、あらかじめ記憶している情報と一致しない場合、あるいは、所定のフォーマットを有さず、ユーザの識別ができない場合は、MFP100の操作ができないようになっている。
MFP100は、表示装置116を有し、操作入力の状態と処理すべきイメージ・データとを、表示装置116によって表示することができる。
記憶装置111はネットワークIF117を介して、マネージメントPC101から直接制御することが可能である。LAN109は、MFP100とマネージメントPC101との間のデータの授受、制御信号授受に用いられる。
整理すると、MFP100は、複写機能、プリンタ機能、スキャナ機能、ファクシミリの送受機能、等を有する。
(画像処理方法の全体の流れ)
本発明に係る画像処理の第1の実施形態は、図3の各ステップにより実行される。なお、図3は、管理者としてのユーザが登録処理をする場合、および非管理者としてのユーザが、使用する場合を示している。図におけるステップS305、S310、S314は、管理者として認証されたユーザが、登録処理をするか否かの判定を示しており、ユーザが非管理者の場合はこれらの判定でNOの方に進む。
ステップS301(ユーザ認証ステップ):ユーザ認識装置118から入力されたユーザ情報についてユーザの識別を行う。例えば、識別は、IDカード、ID入力手段もしくは指紋等の生態認証により個人が特定される。
ステップS302(ユーザ識別ステップ):登録されていないID、暗証番号、指紋が入力された場合は、あるいは、入力したデータが所定のフォーマットを有しない場合、表示装置116に個人の認証エラーが表示され、MFP100を操作することはできない。登録されているID、暗証番号、指紋が入力された場合、あるいは、所定のフォーマットを有する場合、処理はステップ303に進む。
ステップS303(画像入力ステップ):ユーザ認証が終了すると、MFP100の画像読み取り部110を動作させることが可能になり、ユーザ操作を受け付けて、原稿をラスター状に走査し、所定解像度および所定濃度レベルの画像信号を取得する。画像信号は、データ処理装置115によって前処理され、入力画像の1頁分のイメージ・データとして、記憶装置111に保存される。
ステップS304(ブロック・セレクション(領域分割)ステップ):マネージメントPC101によって、記憶装置111に格納されたイメージ・データが取得される。マネージメントPC101は、取得したイメージ・データの領域を分析して、背景領域(通常、原稿上の何も記録されていない領域)に対して、文字あるいは線画を含む文字・線画領域と、ハーフ・トーンを含む写真領域、不定形の画像領域のその他、に分ける。さらに文字・線画領域について、主に文字を含む文字領域と、表、図形等を含む線画領域とを分離し、線画領域は表領域と図形領域に分離する。なお、本実施形態では、この場合に、連結画素を検知し、該連結画素の外接矩形領域の形状・サイズ・画素密度等を用いて、属性ごとの領域に分割するものとするが、その他の領域分割手法を用いても構わない。
文字領域については、文字段落ごとの纏まった塊をブロックとして矩形ブロック(文字領域矩形ブロック)にセグメント化し、線画領域では、表、図形等の個々のオブジェクト(表領域矩形ブロック、線画領域矩形ブロック)毎に矩形ブロックにセグメント化する。
ハーフ・トーンで表現される写真領域は、画像領域矩形ブロック、背景領域矩形ブロック等のオブジェクトごとに、矩形ブロックにセグメント化する。これらの矩形ブロックの情報を「領域分割情報」という。
ブロック・セレクション・ステップで得られた領域分割情報と入力画像とを合成して、MFP100の表示装置116に表示する。この表示装置116に表示される操作画面の一例を図4に示す。この図に示す例においては、左半部に入力画像そのものが画像41として表示され、右半部に矩形ブロックにより領域分割情報を示す画像42が表示される。画像42では、入力画像を簡略表示すると共に、各矩形ブロックを矩形で示す。この図では、矩形ブロックの概念の理解を容易にするために、各矩形ブロックに対してその属性を示している。すなわち、文字(TEXT)/図面(PICTURE)/線画(LINE)/表(TABLE)/写真(PHOTO)の表示を付している。しかしながら、実際には、画面に属性情報は表示されず、分割された矩形領域が枠線として表示されるのみである。
TEXT、PICTURE、LINE、TABLE、およびPHOTOは、それぞれ、文字領域、図面領域、線図形領域、表領域矩形、および、写真領域の各矩形ブロックについての属性表示である。その他の矩形ブロックには、その他の属性表示を用いることもできる。なお、PICTUREとPHOTOは、色や階調の分布具合から、区分することができる。
なお、図4では入力画像と領域分割情報を左右に並べて表示しているが、これらを重ねて入力画像上に分割された矩形ブロックを表示する等、多様な表示形態が可能である。この処理が完了すると、処理はステップS305に進む。
ステップS305:このステップは、ステップS302で認証したユーザが管理者の場合にのみ存在し、管理者として、登録処理をするのか否かの操作入力を受け付ける。単にユーザとして使用する場合は、あるいは非管理者のユーザの場合はステップS306に無条件に進む。
ステップS306(機密情報設定ステップ):原稿画像全体もしくは、原稿内のオブジェクトごとに機密情報を設定することができる。オブジェクトごとに設定する場合は、表示装置116に表示された矩形オブジェクトを選択することにより行う。
ステップS307(ベクトル化ステップ):ブロック・セレクションにより分割されたオブジェクト情報をベクトル化処理により各領域のベクトル・データに変換する。ベクトル化の方法は、以下(a)〜(f)等が存在する。
(a)特定領域が文字領域のときは、さらにOCRによる文字画像のコード変換を行ったり、あるいは文字のサイズ、スタイル、字体を認識し、原稿を走査して得られた文字に可視的に忠実なフォント・データに変換したりする。
(b)特定領域が文字領域であり、かつOCRによる認識が不可能であったとき、文字の輪郭を追跡し、輪郭情報(アウトライン)を線分のつながりとして表現する形式に変換する。
(c)特定領域が図形領域のとき、図形オブジェクトの輪郭を追跡し、輪郭情報を線分のつながりとして表現する形式に変換する。
(d)上述(b)、(c)の処理結果の線分形式のアウトライン情報をベジエ関数などでフィッティングして、関数情報に変換する。
(e)上述の(c)の処理結果の図形オブジェクトの輪郭情報から、図形の形状を認識し、円、矩形、多角形、等の図形定義情報に変換する。
(f)特定領域が図形領域であって、特定領域の表形式のオブジェクトの場合、罫線や枠線を認識し、所定のフォーマットの帳票フォーマット情報に変換する。
以上の方法以外に、イメージ・データをコード情報、図形情報、関数情報等のコマンド定義形の情報に置きかえる種々のベクトル化処理が考えられる。
以上のベクトル化処理が全てのオブジェクトに対して完了すると、処理はステップ308に進む。
ステップS308(オブジェクト検索ステップ):ベクトル化されたオブジェクトごとに一致する、あるいは類似するオブジェクトの有無検索を行う。ネットワークに接続された画像用ストレージ・サーバ105には、画像オブジェクトが記憶(登録)されており、ベクトル化されたオブジェクトと、同じ情報あるいは類似率が高い情報が既にサーバに登録されていないかを検索する。
オブジェクトの検索は、テキスト、写真、表、線画などの各属性に応じて行われる。また、当然ながら、画像用ストレージ・サーバ105には、各属性毎に分類して格納されている。検索するオブジェクトが写真画像の場合、画像より抽出される特徴ベクトルに基づいて特徴空間上の誤差より類似率が算出される。ここでいう特徴ベクトルとは、色ヒストグラムや色モーメントのような色に関する特徴量、共起行列、コントラスト、エントロピ、Gabor変換等で表現されるテクスチャ特徴量、フーリエ記述子等の形状特徴量など複数挙げられる。このような複数の特徴量のうち最適な組み合わせを用いることができる。
また、検索するオブジェクトがテキストの場合は、OCR処理により文字コードが判別されているため、文字列の検索を行う。登録されたものと一致するか、所定の類似率以上のものが存在する場合、処理はステップS309に進み、そうでない場合、処理はステップS314に進む。
ステップS309(機密情報取得ステップ):オブジェクト検索ステップで一致するオブジェクトが検索された場合は、そのオブジェクトに機密情報データが設定されているかどうかのチェックを行う。設定されている場合、処理はステップS310に進み、設定されていない場合、処理はS314に進む。
ステップ310:ここのステップは、先のステップ305での設定に応じて、分岐する。以前にS305から、S307に進んだ場合は、S310からS313に進み、S305からS306に進んだ場合は、処理はS310からS311に進む。
ステップS311(警告処理ステップ):この場合、ユーザは管理者であり、登録処理中であり、この警告処理は、登録しようとするブジェクトの一部が機密情報に既に設定されていることを知らせることを意味する。管理者には、表示装置116で、どのオブジェクトが機密に設定されるかが判るように表示される。この報知が行われた後、S310に進むことも、また、既に登録されているとの理由で中止することも、ユーザの処理を継続するか否かについてのユーザの選択(ステップS312)に依存する。ステップS312で継続を選択した場合は、処理はステップS315に進み、継続を選択しない場合は、この処理は終了することになる。
ステップS313(警告処理):登録処理以外の場合において、機密情報データが設定されている場合には、そのオブジェクトは、以前に機密情報として登録されており、セキュリティーレベルの高いものである。したがって、例えば、コピー操作は制限される(禁止される)必要があることから、操作者に対してセキュリティー情報が含まれていることを通知し、さらに意図的に機密情報をコピーしようとしている可能性があるため出力禁止にする。さらに、機密オブジェクトの登録者、あるいは管理者に対してメールを送信して、セキュリティー情報がコピーされていることを通知することもできる。この場合、処理が停止されて終了したり、あるいは、ステップS316に進み、その後のステップでこの処理が行われたことを記録することができる。
ステップ314:ここのステップは、先のステップ305での設定に応じて、分岐する。以前にS305から、S307に進んだ場合は、処理はS314からS318に進み、S305からS306に進んだ場合は、処理はS314からS315に進む。
ステップS315(機密オブジェクト情報登録ステップ):オブジェクト検索ステップで一致するオブジェクトがなかった場合には、各オブジェクトを新規オブジェクトとして画像用ストレージ・サーバ105に登録を行う。この場合、登録されるオブジェクトには、そのオブジェクトの属性情報(TEXT、等)と共に、登録者、この場合、ステップS301で認証したユーザの情報を含ませることができる。
登録するオブジェクトが機密情報設定されたオブジェクトである場合には、機密情報データであることを示す情報と共に画像用ストレージ・サーバ105に登録される
ステップS316(画像属性情報取得ステップ):画像履歴情報として、以下の情報が取得される。日付、時刻情報、認証を行ったユーザ名称、画像の名称、FAX、送信、プリント、コピーといったジョブ種類、機体情報及び処理が正常終了したかどうかのジョブ結果等の画像属性情報。
ステップS317(履歴情報登録ステップ):画像の属性情報を履歴情報としてジョブ・アーカイブ・サーバ106に登録して、この処理は終了する。
ステップ318(記録出力ステップ):ステップS303で入力した画像を記録出力する。すなわち、複写装置であれば、複写した結果を出力し、ファクシミリ装置の場合では、ファクシミリ送信する。この処理完了後に、ステップS316に進むこと、あるいは終了することも可能である。
なお、管理者であっても、登録処理以外の場合は、ここに開示した範囲では、原則として、機密情報として設定されているコンテンツ、あるいは機密情報として設定されているコンテンツに類似するコンテンツを含む原稿は、記録出力することはできない。登録処理の場合は、単に、所定のサーバに登録するだけであり、記録出力は行われない。
上述した、ステップ311における処理について、さらに説明する。MFP100は、複写機能、プリンタ機能、スキャナ機能、ファクシミリの送受機能を有するので、この警告処理には、複写の禁止、プリントの禁止、スキャナしたデータの出力禁止、ファクシミリ送信の禁止が含まれる。したがって、ステップ318の処理には、複写出力、プリント出力、スキャナしたデータの出力、およびファクシミリ送信を含むことができる。
操作者に対してセキュリティー情報が含まれていることを通知する場合にも、複写の禁止、スキャナしたデータの出力禁止、ファクシミリ送信の禁止の場合には、表示装置116上にその旨を表示することで代用することが可能である。しかし、プリントの禁止の場合は、そのプリントデータを送信したユーザの端末に対して実行することが必要であり、このような報知は、ユーザ端末に表示されるプリンタのステイタス情報に含ませることができる。
また、このようなイベントが発生した際に、機密オブジェクトの登録者、あるいは管理者に対してメールを送信することも可能である。また、MFP100内に備えられたチャイムを鳴らすなどの、音響を出力することによって、装置周囲の人の注意を喚起することも考えられる。
次に図3に示す各ステップのうちステップ304、ステップ307について、さらに詳細に説明する。
(ブロック・セレクション化処理)
ステップS304(ブロック・セレクション・ステップ)においては、先ず入力画像を白黒に2値化し、黒画素輪郭で囲まれる画素塊を抽出する。
さらに、このように抽出された黒画素塊の大きさを評価し、大きさが所定値以上の黒画素塊の内部にある白画素塊に対する輪郭追跡を行う。白画素塊に対する大きさ評価、内部黒画素塊の追跡というように、内部の画素塊が所定値以上である限り、再帰的に内部画素塊の抽出、輪郭追跡を行う。
画素塊の大きさは、例えば画素塊の面積によって評価される。
このようにして得られた画素塊に外接する矩形ブロックを生成し、矩形ブロックの大きさ、形状に基づき属性を判定する。
例えば、縦横比が1に近く、大きさが一定の範囲の矩形ブロックは文字領域矩形ブロックの可能性がある文字相当ブロックとする。近接する文字相当ブロックが規則正しく整列しているときに、これら文字相当ブロックを纏めた新たな矩形ブロックを生成し、新たな矩形ブロックを文字領域矩形ブロックとする。
また扁平な画素塊を線画領域矩形ブロック、一定大きさ以上でかつ四角形の白画素塊を整列よく内包する黒画素塊を表領域矩形ブロック、不定形の画素塊が散在している領域を写真領域矩形ブロック、それ以外の不定形の画素塊を写真領域矩形ブロックとする。
ブロック・セレクション・ステップでは、このようにして生成された矩形ブロックのそれぞれについてその属性、座標、大きさ、等を含むブロック情報および、そのブロック総数を含む入力ファイル情報を生成する。これらの例を図5に示す。なお、図5は、図4と直接的な関係を持たせてはいない。
図5において、ブロック情報には、各ブロックの属性、位置の座標X、座標Y、幅W、高さH、OCR情報が含まれる。属性は1〜5の数値で与えられる。1は文字領域矩形ブロック、2は図面領域矩形ブロック、3は表領域矩形ブロック、4 は線画領域矩形ブロック、5は写真領域矩形ブロックを示す。座標X、座標Yは入力画像における各矩形ブロックの始点のX、Y座標(左上角の座標)である。幅W、高さHは矩形ブロックのX座標方向の幅、Y座標方向の高さである。OCR情報は入力画像におけるポインタ情報の有無を示す。さらに入力ファイル情報として矩形ブロックの個数を示すブロック総数Nが含まれる。
これらの矩形ブロックごとのブロック情報は、特定領域でのベクトル化に利用される。またブロック情報によって、特定領域とその他の領域を合成する際の相対位置関係を特定でき、入力画像のレイアウトを損なわずにベクトル化領域とラスターデータ領域を合成することが可能となる。
なお、テーブルについては、枠および罫線部分とその内部のTEXTブロックの部分を有するが、枠および罫線部分と、TEXTブロックとは、それぞれ独立したブロックとして扱うことも、結合したブロックとして扱うこともできる。
(ベクトル化ステップ)
ステップS307(ベクトル化処理)は、一実施形態においては、図8に示す各ステップによって実行することができる。図8は、ステップS304のブロック・セレクション化処理によってブロック化された各ブロック、および各ブロック内のブロックに対して、再帰的に実行される。先ず、ブロックが選択され、図8の処理が実行される。
ステップS801:そのブロックが文字領域矩形ブロックであるか否か判断し、文字領域矩形ブロックであればステップS802のステップに進み、そうでない場合は、ステップS812に移行する。
ステップ802以下のステップは、パターンマッチングの一手法を用いて認識を行い、対応する文字コードを得る処理を含む。
ステップS802:特定領域に対し横書き、縦書きの判定(組み方向判定)を行うために、特定領域内で画素値に対する水平・垂直の射影を取る。
ステップS803:ステップS802で得た射影の分散を評価する。水平射影の分散が大きい場合は横書き、垂直射影の分散が大きい場合は縦書きと判断する。
ステップS804:ステップS803の評価結果に基づき、組み方向を決定し、行の切り出しを行い、その後文字を切り出して文字画像を得る。
文字列および文字への分解は、横書きならば水平方向の射影を利用して行を切り出し、切り出された行に対する垂直方向の射影から、文字を切り出す。縦書きの文字領域に対しては、水平と垂直について逆の処理を行う。行、文字切り出しに際して、文字のサイズも検出することができる。
ステップS805:ステップS804で切り出された各文字について、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルを生成する。特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴ベクトルとする方法がある。
ステップS806:ステップS805で得られた観測特徴ベクトルと、あらかじめ字種(フォント)ごとに求められている辞書特徴ベクトルとを比較し、観測特徴ベクトルと辞書特徴ベクトルとの距離を算出する。
ステップS807:ステップS806で算出された距離を評価し、最も距離の近い字種を認識結果とする。
ステップS808:ステップS807における距離評価における最短距離が所定値よりも大きいか否かの判定から、類似度を判断する。最短距離が所定値以上の(類似度が低い)場合は、辞書特徴ベクトルにおいて、形状が類似する他の文字に誤認識している可能性が高い。そこで最短距離が所定値以上の(類似度が低い)場合は、ステップS807の認識結果を採用せず、ステップS811の処置に進む。最短距離が所定値以下の(類似度が高い)場合は、ステップS807の認識結果を採用し、ステップ809に進む。
ステップS809(フォント認識ステップ):文字認識の際に用いる、字種数ぶんの辞書特徴ベクトルを、文字形状種すなわちフォント種に対して複数用意しておき、パターンマッチングの際に、文字コードと共にフォント種を出力する。これにより、文字フォントを認識することができる。
ステップS810:文字認識およびフォント認識よって得られた文字コードおよびフォント情報を用いて、各々あらかじめ用意されたアウトライン・データを用いて、各文字をベクトル・データに変換する。なお、入力画像がカラーの場合は、カラー画像から各文字の色を抽出してベクトル・データと共に記録する。
ステップS811:文字を一般的な線画と同様に扱い、該文字をアウトライン化する。すなわち誤認識を起こす可能性の高い文字については、可視的にイメージ・データに忠実なアウトラインのベクトル・データを生成する。
ステップS812:特定領域が文字領域矩形ブロックでないときは、画像の輪郭に基づいてベクトル化の処理を実行する。
以上の処理により、文字領域矩形ブロックに属するイメージ情報をほぼ形状、大きさ、色が忠実なベクトル・データに変換することができる。
(文字領域以外の領域のベクトル化)
ステップS801で、選択したブロックが、文字領域矩形ブロック以外の領域、すなわち図面領域矩形ブロック、線画領域矩形ブロック、表領域矩形ブロック等と判断されると、ステップS812で、そのブロックの黒画素塊の輪郭をベクトル・データに変換する。
この変換について、先ず一般論を説明する。
文字領域以外の領域のベクトル化においては、先ず線画、あるいは輪郭線等を直線および/または所定の曲線の組み合わせとして表現するために、検出した任意形状の曲線を複数の区間(画素列)に区切る「角」を検出する。角とは曲率が極大となる点であり、図10の曲線上の画素Piが角か否かの判断は以下のように行う。
すなわち、Piを起点とし、曲線に沿ってPiから両方向に所定画素(k個とする。)づつ離れた画素Pi−k、Pi+kを直線の線分Lで結ぶ。画素Pi−k、P i+k間の距離をd1、線分Lと画素Piとの距離をd2、曲線の画素Pi−k 、Pi+k間の弧の長さをAとするとき、d2が極大となるとき、あるいは比(d1/A)が閾値以下となるときに、その画素Piを角と判断する。
角によって分割された画素列を、直線あるいは曲線で近似する。直線への近似は最小二乗法等により実行し、曲線への近似は3次スプライン関数などを用いる。画素列を分割する角の画素は近似直線あるいは近似直線における、始端または終端となる。
以上のようにして、線画、あるいは輪郭線等をベクトル化する。
さらにベクトル化された輪郭内に白画素塊の内輪郭が存在するか否かを判断し、内輪郭が存在するときはその内輪郭をベクトル化し、次々と内輪郭の内輪郭というように、再帰的に反転画素の内輪郭をベクトル化する。
以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。元原稿がカラーの場合は、カラー画像から図形の色を抽出してベクトル・データと共に記録する。
図9に示すように、ある注目区間で外輪郭PRjと、内輪郭PRj+1あるいは別の外輪郭が近接している場合、2個あるいは複数の輪郭線をひとまとめにし、太さを持った線として表現することができる。例えば、輪郭Pj+1の各画素Piから輪郭PRj上で最短距離となる画素Qiまでの距離PiQiを算出し、PQiのばらつきがわずかである場合には、注目区間を画素Pi、Qiの中点Miの点列に沿った直線または曲線で近似することができる。この場合、近似直線、近似曲線の太さは、例えば距離PiQiの平均値とする。
線や線の集合体である表罫線は、太さを持つ線の集合とすることにより、効率よくベクトル表現することができる。
対象とするブロック内の輪郭および、存在する場合にその内部の輪郭等について、実行して、最終的な輪郭まとめの処理の後、全体の処理を終了する。
以上の処理において、各ブロックは、それぞれ単独に、処理される。すなわち、テーブルについては、その枠や罫線のみのブロック、その内部の文字ブロックは、それぞれ単独に処理される。
なお写真領域矩形ブロックについては、ベクトル化せず、イメージ・データのままとする。
(図形認識)
以上の線図形等のアウトラインをベクトル化した後、ベクトル化された区分線を図形オブジェクトごとにグループ化する。
図6の各ステップは、ベクトル・データを図形オブジェクトごとにグループ化する処理を示す。
ステップS601:先ず各ベクトル・データの始点、終点を算出する。
ステップS602(図形要素検出):ステップS601で求められた始点、終点情報を用いて、図形要素を検出する。図形要素とは、区分線が構成している閉図形であり、検出に際しては、始点、終端となっている共通の角の画素においてベクトルを連結する。すなわち、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用する。
ステップS603:次に図形要素内に存在する他の図形要素、もしくは区分線をグループ化し、一つの図形オブジェクトとする。また、図形要素内に他の図形要素、区分線が存在しない場合は、その単一の図形要素を図形オブジェクトとする。
(図形要素の検出)
上述したステップS602(図形要素検出)の処理は、図7に示す各ステップによって実行される。
ステップS701:先ず、各ベクトル・データから、その両端に他のベクトルを連結していない不要なベクトルを除去し、閉図形を構成するベクトルを抽出する。
ステップS702:次に閉図形を構成するベクトルについて、いずれかのベクトルの端点(始点または終点)を開始点とし、一定方向、例えば時計回りに、順にベクトルを探索する。すなわち、他端点において他のベクトルの端点を探索し、所定距離内の最近接端点を連結ベクトルの端点とする。閉図形を構成するベクトルを1まわりして開始点に戻ったとき、通過したベクトルを全て一つの図形要素を構成する閉図形としてグループ化する。また、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらにまだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。
ステップS703:最後に、ステップS701で除去された不要ベクトルのうち、ステップS702で閉図形としてグループ化されたベクトルに端点が近接しているベクトルを検出し、一つの図形要素としてグループ化する。
以上の処理によって図形ブロックを、再利用可能な個別の図形オブジェクトとして扱うことが可能になる。
(第2実施形態)
この形態は、管理者としてのユーザが登録処理をする場合の他の実施形態を示している。
図11は、例えば、図2の表示装置上における表示画面を表している。図11aは、例えば、図3のステップ303で、入力した画像である。図11bは、図11(a)に示す原稿に対して、ユーザが入力装置113を操作して、その一部、すなわち、ブロック・セレクション化処理した後の、特定の文字領域矩形ブロックに対し、マスク(黒帯部分)を施した図である。図11(b)に示すように、公開したくない、機密として管理したい、ブロックに対してオブジェクトごとに、この場合、表領域矩形ブロック内の文字領域矩形ブロックごとに、マスクするマスク処理の機能を有する。
上述した第1の実施形態では、原稿の画像全体、もしくはオブジェクト毎(図11aの場合、中央の表領域)に対して機密情報を設定する構成であった。しかし、図11bに示すように、マスク処理を施すことで、そのマスク処理が施された領域を機密情報として、設定を行い、サーバに登録する構成でも良い。
本発明に係る画像処理システムを示すブロック図である。 図1におけるMFPの概略構成を示すブロック図である。 本発明に係る画像処理方法の第1の実施形態を示すフローチャ−トである。 図3の画像処理方法により処理される場合の、原稿と処理結果の画像の例を示す図である。 ブロック・セレクション処理で得られるブロック情報および入力ファイル情報の例を示す表図である。 図3のベクトル化処理で生成されたベクトル・データのグループ化の処理を示すフローチャートである。 図6の処理でグループ化されたベクトル・データに対する図形要素検出の処理を示すフローチャートである。 図3の文字領域のベクトル化処理を示すフローチャートである。 ベクトル化の処理における輪郭線まとめの処理を示す図である。 ベクトル化の処理における角抽出の処理を示す図である。 本発明に係るマスク処理の例を示す図である。
符号の説明
100 MFP
101 マネージメントPC
102 クライアントPC
103 プロキシ・サーバ
104 インターネット
105 画像用ストレージ・サーバ
106 ジョブ・アーカイブ・サーバ
107、108 LAN
110 画像読み取り部
111 記憶装置
112 記録装置
113 入力装置
114 ネットワークIF
115 データ処理装置
116 表示装置
117 ネットワークIF
118 ユーザ認識装置

Claims (6)

  1. 画像入力手段により入力された画像情報の領域を分析して、その像域情報に応じてブロック分割するブロック・セレクション手段と、
    前記ブロック・セレクション手段により分割された1つ以上のオブジェクト画像をベクトル化するベクトル化手段と、
    前記ブロック・セレクション手段により分割された前記1つ以上のオブジェクト画像に対して機密情報を設定する機密情報設定手段と、
    前記機密情報設定手段により設定された機密情報に対応するオブジェクト画像のベクトル化された情報に、画像属性情報を付加した情報を、オブジェクト情報として格納する格納手段と、
    入力されるベクトル化されたオブジェクト情報を用いて前記格納手段内に格納されているオブジェクト情報を検索するオブジェクト情報検索手段と、
    前記オブジェクト情報検索手段により検索されたオブジェクト画像に機密情報が付加されている場合に警告処理する警告処理手段と
    を備えることを特徴とする画像処理装置。
  2. 前記機密情報設定手段は、前記ブロック・セレクション手段により分割された前記1つ以上のオブジェクト画像に対して、マスク情報を設定するマスク情報設定手段を備え、
    前記格納手段は、前記マスク情報設定手段によりマスク設定されているオブジェクト画像のベクトル化された情報と、当該情報に対する機密情報と、ユーザ情報を含む画像属性情報とを備えることを特徴とする請求項1に記載の画像処理装置。
  3. ユーザ認識手段をさらに備え、
    前述画像属性情報は、前記ブロック・セレクション手段により分割された前記1つ以上のオブジェクト画像に対応する画像を前記画像入力手段で入力した際の、前記ユーザ認識手段により認識されたユーザのID、日付および時刻、このジョブ種類、画像処理装置を示す機器ID、ジョブの結果を備えることを特徴とする請求項1に記載の画像処理装置。
  4. 前記ユーザ認識手段は、カード入力手段、生態認証手段、ID入力手段のうちの少なくとも1つを備えることを特徴とする請求項3に記載の画像処理装置。
  5. 前記警告手段による前記警告処理は、表示手段へメッセージ表示すること、前記出力手段の動作を禁止することのうちの少なくとも1つを備えることを特徴とする請求項1に記載の画像処理装置。
  6. 画像入力手段により入力された画像情報の領域を分析して、その像域情報に応じてブロック分割するブロック・セレクション手段と、前記ブロック・セレクション手段により分割された1つ以上のオブジェクト画像をベクトル化するベクトル化手段と、前記ブロック・セレクション手段により分割された前記1つ以上のオブジェクト画像に対して機密情報を設定する機密情報設定手段と、前記機密情報設定手段により設定された機密情報に対応するオブジェクト画像のベクトル化された情報に、画像属性情報を付加した情報を、オブジェクト情報として格納する格納手段とを備えた画像処理システムの処理方法であって、
    入力されるベクトル化されたオブジェクト情報を用いて前記格納手段内に格納されているオブジェクト情報を検索すること、および
    前記検索することによって検索されたオブジェクト画像に機密情報が付加されている場合に警告処理すること
    を備えたことを特徴とする画像処理システムの処理方法。
JP2005346564A 2005-11-30 2005-11-30 画像処理方法及び装置 Expired - Fee Related JP4557875B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005346564A JP4557875B2 (ja) 2005-11-30 2005-11-30 画像処理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005346564A JP4557875B2 (ja) 2005-11-30 2005-11-30 画像処理方法及び装置

Publications (3)

Publication Number Publication Date
JP2007158413A true JP2007158413A (ja) 2007-06-21
JP2007158413A5 JP2007158413A5 (ja) 2010-07-22
JP4557875B2 JP4557875B2 (ja) 2010-10-06

Family

ID=38242241

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005346564A Expired - Fee Related JP4557875B2 (ja) 2005-11-30 2005-11-30 画像処理方法及び装置

Country Status (1)

Country Link
JP (1) JP4557875B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009211404A (ja) * 2008-03-04 2009-09-17 Ricoh Co Ltd 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。
JP2012182737A (ja) * 2011-03-02 2012-09-20 Nec Corp 秘密資料流出防止システム、判定装置、秘密資料流出防止方法およびプログラム
JP2016507124A (ja) * 2013-02-19 2016-03-07 シマンテック コーポレーションSymantec Corporation 仮想化環境においてアプリケーション及びデバイスを制御する方法並びに技術
JP2016175226A (ja) * 2015-03-19 2016-10-06 富士ゼロックス株式会社 画像処理装置、画像形成装置およびプログラム
JP2017531249A (ja) * 2014-09-10 2017-10-19 シマンテック コーポレーションSymantec Corporation データ配信チャネルを介して機密情報を送信する試みを検出するためのシステム及び方法
JP2018159986A (ja) * 2017-03-22 2018-10-11 日本電気株式会社 情報管理装置、情報管理方法、及びプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08139920A (ja) * 1994-11-11 1996-05-31 Ricoh Co Ltd 画像形成装置
JP2002305646A (ja) * 2001-04-05 2002-10-18 Fuji Xerox Co Ltd 画像処理装置及び画像形成装置
JP2004241938A (ja) * 2003-02-04 2004-08-26 Canon Inc 画像処理装置およびその方法
JP2004334340A (ja) * 2003-04-30 2004-11-25 Canon Inc 画像処理方法及び装置
JP2005149098A (ja) * 2003-11-14 2005-06-09 Canon Inc 画像処理システム及び画像処理装置並びに画像処理方法
JP2006243943A (ja) * 2005-03-01 2006-09-14 Canon Inc 画像処理装置およびその方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08139920A (ja) * 1994-11-11 1996-05-31 Ricoh Co Ltd 画像形成装置
JP2002305646A (ja) * 2001-04-05 2002-10-18 Fuji Xerox Co Ltd 画像処理装置及び画像形成装置
JP2004241938A (ja) * 2003-02-04 2004-08-26 Canon Inc 画像処理装置およびその方法
JP2004334340A (ja) * 2003-04-30 2004-11-25 Canon Inc 画像処理方法及び装置
JP2005149098A (ja) * 2003-11-14 2005-06-09 Canon Inc 画像処理システム及び画像処理装置並びに画像処理方法
JP2006243943A (ja) * 2005-03-01 2006-09-14 Canon Inc 画像処理装置およびその方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009211404A (ja) * 2008-03-04 2009-09-17 Ricoh Co Ltd 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。
JP2012182737A (ja) * 2011-03-02 2012-09-20 Nec Corp 秘密資料流出防止システム、判定装置、秘密資料流出防止方法およびプログラム
JP2016507124A (ja) * 2013-02-19 2016-03-07 シマンテック コーポレーションSymantec Corporation 仮想化環境においてアプリケーション及びデバイスを制御する方法並びに技術
JP2017531249A (ja) * 2014-09-10 2017-10-19 シマンテック コーポレーションSymantec Corporation データ配信チャネルを介して機密情報を送信する試みを検出するためのシステム及び方法
JP2016175226A (ja) * 2015-03-19 2016-10-06 富士ゼロックス株式会社 画像処理装置、画像形成装置およびプログラム
JP2018159986A (ja) * 2017-03-22 2018-10-11 日本電気株式会社 情報管理装置、情報管理方法、及びプログラム

Also Published As

Publication number Publication date
JP4557875B2 (ja) 2010-10-06

Similar Documents

Publication Publication Date Title
JP4533187B2 (ja) 画像処理装置およびその制御方法
US7640269B2 (en) Image processing system and image processing method
JP4557765B2 (ja) 画像処理装置およびその方法
US7961950B2 (en) Image processing apparatus, method thereof, and its control method
US6011857A (en) Detecting copy restrictive documents
JP4854491B2 (ja) 画像処理装置及びその制御方法
US20060008113A1 (en) Image processing system and image processing method
JP4732315B2 (ja) 画像処理装置及び方法
US7596271B2 (en) Image processing system and image processing method
JP4502385B2 (ja) 画像処理装置およびその制御方法
US9710524B2 (en) Image processing apparatus, image processing method, and computer-readable storage medium
US7421124B2 (en) Image processing system and image processing method
JP2004265384A (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP4557875B2 (ja) 画像処理方法及び装置
JP4338189B2 (ja) 画像処理システム及び画像処理方法
US8218178B2 (en) Image processing apparatus, image processing method, recording medium storing image processing program, and computer data signal embedded in carrier wave
JP2008028716A (ja) 画像処理方法及び装置
CN100501728C (zh) 图像处理方法、系统、程序、程序存储介质以及信息处理设备
JP2005149323A (ja) 画像処理システム及び画像処理装置並びに画像処理方法
JP2005149097A (ja) 画像処理システム及び画像処理方法
JP4055525B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラム
JP2007034923A (ja) 画像処理システム
JP2008066840A (ja) 画像処理装置、画像処理方法、画像処理方法のプログラム及びその記憶媒体
JP2005208872A (ja) 画像処理システム
JP2005149098A (ja) 画像処理システム及び画像処理装置並びに画像処理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100604

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100712

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100716

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100720

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130730

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees