JP4854491B2 - 画像処理装置及びその制御方法 - Google Patents

画像処理装置及びその制御方法 Download PDF

Info

Publication number
JP4854491B2
JP4854491B2 JP2006336380A JP2006336380A JP4854491B2 JP 4854491 B2 JP4854491 B2 JP 4854491B2 JP 2006336380 A JP2006336380 A JP 2006336380A JP 2006336380 A JP2006336380 A JP 2006336380A JP 4854491 B2 JP4854491 B2 JP 4854491B2
Authority
JP
Japan
Prior art keywords
keyword
data
content
extracted
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006336380A
Other languages
English (en)
Other versions
JP2008146605A (ja
Inventor
英一 西川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006336380A priority Critical patent/JP4854491B2/ja
Priority to US11/952,903 priority patent/US8073255B2/en
Publication of JP2008146605A publication Critical patent/JP2008146605A/ja
Application granted granted Critical
Publication of JP4854491B2 publication Critical patent/JP4854491B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0008Connection or combination of a still picture apparatus with another apparatus
    • H04N2201/0034Details of the connection, e.g. connector, interface
    • H04N2201/0037Topological details of the connection
    • H04N2201/0039Connection via a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Description

本発明は、入力された画像から抽出したコンテンツデータを、検索キーワードにより検索が可能となるように格納する画像処理装置及びその制御方法に関するものである。
部分画像データ(コンテンツ)をファイルサーバ等のストレージに格納した後、必要に応じて検索キーワードを用いて検索し、これらをプリンタ等で印刷することで、ユーザ所望のプリント出力を得る画像処理システムが考えられている(例えば、特許文献1)。このようなシステムでは、ストレージに格納されるデータの量が増加するに従い、必要なデータを見つけるためのキーワードをどのように付与しておくかが重要となってくる。
特開2004−3181874号公報
一方、文書画像をスキャンして当該文書内に含まれるコンテンツを再利用できるようにすることが考えられる。しかしながら、一つの文書の中には大量のコンテンツが含まれているため、各コンテンツ毎に適当な検索キーワードを人手で付加していかなければならないとすると、ユーザにとっては利便性が悪い。したがって、このようなシステムでは、機械によって自動的に検索キーワードを付加していく構成となっていることが望ましい。
つまり、コンテンツごとのデータを作成・格納する際に、適当なキーワードを該データに自動的に付加したうえで、ストレージに格納するように構成することが望ましい。
しかしながら、機械によって自動的に付加されるキーワードの質は、機械自体がコンテンツの内容を理解していない現状では、常に満足のいくレベルになるとは限らない。
このため、このようなシステムにおいてデータの検索精度を向上させるためには、一度付加されたキーワードの修正や追加あるいは削除等の編集が容易に行えるように構成しておくことが重要である。
しかしながら、検索キーワードの編集を無制限に許可することとすると、データのコピー許可や配布制限等の属性データ(画像データの処理制限に関する情報)までも改変されてしまうこととなる。その結果、情報セキュリティを守ることができなくなるという問題がある。
本発明は上記課題に鑑みてなされたものであり、文書内のコンテンツを抽出し、検索キーワードにより検索可能に格納する画像処理装置において、検索精度の向上と情報セキュリティの保持を両立させることを目的とする。
上記の目的を達成するために本発明に係る画像処理装置は以下のような構成を備える。即ち、
画像データ内に含まれるコンテンツのデータを取得するコンテンツ取得手段と、
前記画像データからキーワードを抽出する抽出手段と、
前記抽出手段で抽出したキーワードがどのようにして抽出されたキーワードであるかに応じて、当該キーワードの修正可否を設定する設定手段と、
前記コンテンツのデータと前記キーワードと前記修正可否設定とを対応付けて格納する格納手段と、を備え、
前記設定手段は、前記抽出手段で抽出したキーワードが、透かし情報、地紋情報、バーコード情報、紙紋情報の少なくともいずれかから抽出されたキーワードである場合、修正否を設定することを特徴とする。
本発明によれば、文書内のコンテンツをベクトル化し、検索キーワードにより検索可能に格納する画像処理装置において、検索精度の向上と情報セキュリティの保持を両立させることが可能となる。
[第1の実施形態]
1.画像処理システムの構成
以下、本発明の実施形態を図面を用いて説明する。図1は本発明の一実施形態にかかる画像処理装置(MFP100)を備える画像処理システムの構成を示す図である。同図に示すように、本実施形態では、オフィス10とオフィス20とがインターネット104で接続された環境において本発明の一実施形態にかかる画像処理装置(MFP100)が接続されているものとする。
オフィス10内に構築されたLAN107には、MFP100、MFP100を制御するマネージメントPC101、クライアントPC102、文書管理サーバ106、データベース105、およびプロキシ(proxy)サーバ103が接続されている。LAN107とオフィス20内のLAN108とはプロキシサーバ103を介してインターネット104により接続されている。また、LAN108には、文書管理サーバ111およびデータベース110が接続されている。
MFP100は本実施形態において文書の画像読み取り処理と、読み取った画像読み取り信号に対する画像処理を担当する。マネージメントPCは通常のPCであり、内部に画像記憶部、画像処理部、表示部、入力部を有するが、その一部はMFP100に一体化して構成されている。なお、マネージメントPC101の機能は全てMFP100に組み込まれた形で実現されてもよい。
2.MFP100の構成
図2はMFP100の構成図である。図2において、210は画像読み取り部であり、オートドキュメントフィーダ(以降ADFと記す)を含む。画像読み取り部210は束状の或いは1枚の文書を図示しない光源で照射し、文書反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスター状の画像読み取り信号を600DPIの密度のイメージ情報(ビットマップ画像)として得る。通常の複写機能はこのビットマップ画像をデータ処理装置215で印刷用の画像データへ変換し、複数枚複写の場合には記憶装置211に一旦1ページ分の画像データを記憶保持した後、記録装置212に出力して紙上に順次印刷出力する。
一方、クライアントPC102等から印刷出力される印刷データは、LAN107からネットワークI/F214を経て、データ処理装置215で印刷可能な画像データに変換された後、記録装置212で紙上に印刷出力される。
MFP100へのユーザの指示はMFP100に装備されたキー操作部等の入力装置213とマネージメントPC101に接続されたキーボード、マウス等の入力装置とから行われ、これら一連の動作はデータ処理装置215内の図示しない制御部で制御される。
データ処理装置215はCPU、ROM、RAM、ならびに本実施形態に係る制御プログラムおよびデータを備える。
一方、操作入力の状態表示及び処理中の画像データの表示は表示装置216で行われる。なお、記憶装置211はマネージメントPC101からも制御され、これらMFP100とマネージメントPC101とのデータの授受及び制御はネットワークI/F217および直結したLAN109を介して行われる。
3.MFP100における処理の全体概要
次にMFP100において実行される処理の全体概要を図3を用いて説明する。
図3(A)は、MFP100における電子ファイル取得・格納処理の全体フローを示す図であり、図3(B)は、電子ファイル検索・出力処理の全体フローを示す図である。
図3(A)において、ステップS301ではイメージ情報入力処理を実行する。具体的には、MFP100の画像読み取り部210を動作させ1枚ごとに文書をラスター状に走査し、600DPI−8ビットのビットマップ画像を得る。そして該ビットマップ画像に対してデータ処理装置215が前処理を施し、記憶装置211に1ページごとの画像データとして格納する。
ステップS302では、ブロックセレクション処理(領域分割処理)を実行する。具体的には、ステップS301において格納された1ページごとの画像データを先ず、文字/線画部分やハーフトーンの画像部分等、領域ごとに分離する。そして、文字/線画部分については更に段落で塊として纏まっている文字ブロック毎に、或いは、線や表等の図形ブロック毎に分離し各々オブジェクト化する。一方、写真や図画等のハーフトーンの画像部分は、矩形に分離された写真ブロック、図画ブロック毎に独立したオブジェクトに分割する。更に、オブジェクト化された各ブロックについての情報を一覧にまとめることでブロック情報を生成する。このように、属性毎の領域(ブロック)に分割することを、ここではブロックセレクション処理と呼ぶこととする。
ステップS303では、ステップS302で分割されたオブジェクトのそれぞれをコンテンツとして扱うコンテンツ分離処理を実行する。そして、ステップS304では、各コンテンツのうち、文字部分に関してOCRをかけることでテキストデータを取得する。
更に、ステップS305では、当該文書中に電子透かしや2次元バーコード等を用いてデータが記録されていれば、これを当該ページに対する属性データとして検出する。この属性データを埋め込む手法は限定されるものではないが、例えば、不可視の電子透かしを用いたり、可視の2次元バーコードやウォーターマークなどを用いて文書中に記録したりしておくことが可能である。例えば、不可視の電子透かしの手法としては、文字と文字の間隔を微小に変化させることで情報を埋め込む手法や、ハーフトーンの画像部分にイエロードットを打つことで情報を埋め込む手法などを用いることができる。
ステップS306では画像データからベクトルデータへの変換処理(ベクトル化処理)を行う。先ず、ステップS304でOCRをかけることで得られたテキストデータに対しては、更に文字のサイズ、スタイル、字体を認識し、文書をラスター走査して得られた文字に可視的に忠実なフォントデータに変換する。一方、線や表等の図形ブロックに対してはアウトライン化してベクトルデータへ変換する。また、写真、図画ブロックに対しては個別のJPEGファイルとして処理する。
ステップS307では、コンテンツ整合処理を行う。具体的には、ステップS302のブロックセレクション処理にて分離された各オブジェクトについて、前後ページにまたがるコンテンツの結合等を行い、意味のある(セマンティックな)コンテンツごとにまとめる。例えば、本文の文字領域の場合、文章の途中で次の段組や次のページに改行されることがあるが、このような場合、意味的に繋がりがあるかどうか形態素解析や構文解析を行うことで、1つの文章として結合すべきかどうか判断する。
ステップS308では、ステップS302で生成されたブロック情報と、ステップS304で取得されたテキストデータと、ステップS305で検出された属性データとを用いて検索キーワードを作成する。
ステップS309では、コンテンツ整合処理がなされたベクトルデータを電子ファイルとして記憶装置211に格納する。このとき、ステップS308で生成された検索キーワードを該電子ファイルの一部として、ベクトルデータと対応付けて保存する。(例えば、rtf(リッチテキストフォーマット)やPDFやXMLなどのフォーマットに変換して、電子ファイルとして記憶装置211に格納する)。
このようにコンテンツ単位でベクトル化された画像データは、以降、ステップS309でベクトルデータと対応付けて格納された検索キーワードを用いて電子ファイルとして検索することが出来る。
次に、図3(B)の電子ファイル検索・出力処理について説明する。ステップS311において検索キーワードが入力されると、ステップS312では、当該検索キーワードに基づいて、記憶装置211内に格納された電子ファイルを検索する。
ステップS313では、検索された電子ファイルに基づいて、ユーザが所望の集約処理を行い、ステップS314において、該集約後の電子ファイルを印刷出力する。
ステップS314における印刷処理が完了すると、ステップS315では、検索キーワードの修正が必要か否かをユーザの指示に基づいて判定する。
ステップS315において、検索キーワードの修正が必要であると判定された場合には、ステップS316に進み、検索キーワード修正処理を実行する。一方、検索キーワードの修正が必要でないと判定された場合には、処理を終了する。
このように、MFP100には、検索キーワードの修正機能が備えられており、ユーザが検索キーワードを修正することが可能であるため、検索精度の向上が期待できる。
4.電子ファイル取得・格納処理の詳細
以下、上述の電子ファイル取得・格納処理の各ステップの詳細について説明する。
4.1 ブロックセレクション処理
まず、ステップS302で示すブロックセレクション処理の詳細について説明する。
ブロックセレクション処理では、図3のステップS301を介して取得された1ページごとの画像データ(例えば、図4の(A)参照)を、各ブロック毎の塊として認識する。そして、該ブロック各々について文字/図画/写真/線/表等の領域属性毎のブロックに分割する(図4の(B)参照)。
ブロックセレクション処理の具体例を以下に説明する。まず、画像データを白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行い白画素の塊を抽出し、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさおよび形状で分類し、異なるブロックを持つ領域へ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とする。更に、近接する文字が整列良くグループ化可能な部分を文字ブロック、扁平な画素塊を線ブロックとする。更に、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表ブロック、不定形の画素塊が散在しているブロックを写真ブロック、それ以外の任意形状の画素塊を図画ブロック、などとする。
ブロックセレクション処理で得られた各ブロックに対するブロック情報の一例を図5に示す。これらのブロック毎のブロック情報は検索の為の検索キーワードとして用いられる。なお、OCR情報は、ステップS304で取得される。
4.2 属性データ検出処理
次に、ステップS305で示す属性データの検出処理の詳細について説明する。
図6は画像データ中に含まれる2次元バーコード(例えば、QRコード(商標))を復号して、データ文字列を属性データ(処理制限に関する情報)として出力する過程を示すフローチャートである。図7は、2次元バーコードの付加された文書の一例を示す図である。
属性データの検出処理では、まず、記憶装置211に保存された画像データについて、先に説明したブロックセレクション処理の結果から所定のQRコード703の位置を検出する(ステップS601)。QRコードの位置検出パターンは、QRコードの4隅のうち3隅に配置される同一の位置検出要素パターンから構成される。
次に、位置検出パターンに隣接する形式情報を復元し、QRコードに適用されている誤り訂正レベルおよびマスクパターンを得る(ステップS602)。
続いてステップS603においてQRコードの型番を決定した後、形式情報で得られたマスクパターンを使って符号化領域ビットパターンをXOR演算することによってマスク処理を解除する(ステップS604)。
ステップS605では、モデルに対応する配置規則に従い、シンボルキャラクタを読み取り、メッセージのデータ及び誤り訂正コード語を復元する。
ステップS606では、復元されたコード上に、誤りがあるかどうかの検出を行い、誤りが検出された場合には、ステップS607に分岐し、これを訂正する。
ステップS608では、誤り訂正されたデータのモード指示子および文字数指示子に基づいて、データコード語をセグメントに分割する。
最後に、仕様モードに基づいてデータ文字列を復号し、結果を出力する(ステップS609)。
なお、QRコード内に組み込まれたデータ文字列は、そのページの属性データを表わしており、例えば、コピーの可禁や配布制限等、処理制限に関する情報で構成される。
なお、ここでは属性データがQRコードにより付与された文書701を一例として説明したが、本発明は特にこれに限定されない。例えば、直接文字列で属性データが記録される場合は所定のルールに従った文字列のブロックを先のブロックセレクション処理で検出し、該属性データを示す文字列の各文字を文字認識することで、属性データを得るようにしてもよい。
また、図7の文書701の文字ブロック702、或いは704の文字列に対して隣接する文字と文字の間隔に視認し難い程度の変調を加え、該文字間隔の変化を利用して情報を埋め込むことによっても属性データを付与できる。このような不可視の透かし情報は、後述する文字認識処理を行う際に各文字の間隔を検出して復号すれば、属性データとして得ることができる。また、図画705の中に不可視の電子透かしとして属性データを付加することも可能である。
4.3 ベクトル化処理
次に、図3のステップS306で示すベクトル化処理について詳説する。まず、OCRをかけることで得られたテキストデータに対しては各文字に対して文字認識処理を行う。
4.3.1 文字認識処理
文字認識は、文字単位で切り出された画像データに対し、パターンマッチングの一手法を用いて認識を行い、対応する文字コードを得るものである。この文字認識処理は、切り出された画像データから得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルとを比較し、最も距離の近い字種を認識結果として文字コードを出力する処理である。特徴ベクトルの抽出には種々の公知手法があり、たとえば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントする方法が挙げられる。
なお、ブロックセレクション処理(ステップS302)で抽出された文字ブロックに対して文字認識を行う場合は、まず該当ブロックに対し横書き、縦書きの判定を行い、各々対応する方向に行を切り出し、その後文字を切り出して文字画像データを得る。横書き、縦書きについては、該当ブロック内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書きブロックと、垂直射影の分散が大きい場合は縦書きブロックと判断すればよい。文字列および文字への分解は、横書きならば水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことで行う。縦書きの文字ブロックに対しては、水平と垂直を逆にすればよい。尚、この時文字のサイズが検出できる。
4.3.2 フォント認識処理
文字認識の際に用いる、字種数分の辞書特徴ベクトルを、文字形状種すなわちフォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォント情報が認識できる。
4.3.3 文字のベクトル化処理
前記文字認識処理およびフォント認識処理によって得られた、文字コードおよびフォント情報を用いて、各々あらかじめ用意されたアウトラインフォントデータと組み合わせることにより、テキストデータをベクトルデータに変換する。なお、文書がカラーの場合は、カラー画像から各文字の色を抽出してベクトルデータとともに記録する。
以上の処理により、テキストデータに対応する画像データをほぼ形状、大きさ、色が忠実なベクトルデータに変換できる。
4.3.4 文字以外の部分のベクトル化
ブロックセレクション処理(ステップS302)で、線、表ブロックとされたブロックを対象に、ブロック中で抽出された有意な色の画素塊の輪郭をベクトルデータに変換する。具体的には、輪郭をなす画素の点列を角と看倣される点で区切って、各区間を部分的な直線あるいは曲線で近似する。角とは曲率が極大となる点であり、曲率が極大となる点は、図8に図示するように、任意点Piに対し左右k個の離れた点Pi−k、Pi+kの間に弦を引いたとき、この弦とPiの距離が極大となる点として求められる。さらに、Pi−k、Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法など、曲線は3次スプライン関数などを用いてベクトル化することができる。
また、対象が内輪郭を持つ場合、ブロックセレクション処理で抽出した白画素輪郭の点列を用いて、同様に部分的直線あるいは曲線で近似する。
以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。文書がカラーの場合は、カラー画像から図形の色を抽出してベクトルデータとともに記録する。
さらに、図9に示す様に、ある区間で外輪郭と、内輪郭あるいは別の外輪郭が近接している場合、2つの輪郭線をひとまとめにし、太さを持った線として表現することができる。具体的には、ある輪郭の各点Piから別輪郭上で最短距離となる点Qiまで線を引き、各距離PQiが平均的に一定長以下の場合、注目区間はPQi中点を点列として直線あるいは曲線で近似し、その太さはPQiの平均値とする。線や線の集合体である表罫線は、前記のような太さを持つ線の集合として効率よくベクトル表現することができる。
尚、文字ブロックに対する文字認識処理を用いた上記ベクトル化では、該文字認識処理の結果、辞書からの距離が最も近い文字を認識結果として用いることとしたが、この距離が所定値以上の場合は、必ずしも本来の文字に一致しない。このため、形状が類似する文字に誤認識している場合が多い。従って、本実施形態では、この様な文字に対しては、上記した様に、一般的な線画と同じように扱い、該文字画像の輪郭に基づいてアウトライン化する。この結果、従来、文字認識処理で誤認識を起こしていた文字に対しても、誤った文字にベクトル化されず、可視的に画像データに忠実なアウトライン化によるベクトル化を行うことができる。
また、図画、写真と判定されたブロックに対しては本実施形態では、ベクトル化出来ない為、画像データのまま、JPEG等で圧縮することとする。
4.4 コンテンツ整合処理
続いて図3のステップS307で示されるコンテンツ整合処理の詳細について説明する。
図10は、ベクトルデータをコンテンツ毎にグループ化するまでの処理の流れを示すフローチャートを示している。まず、各ベクトルデータの始点、終点を算出する(ステップS1001)。次に各ベクトルデータの始点、終点情報を用いて、図形のオブジェクトを検出する(ステップS1002)。図形のオブジェクトの検出とは、区分線が構成している閉図形を検出することである。検出に際しては、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用し、検出を行う。次に図形のオブジェクト内に存在する他の図形のオブジェクト、もしくは区分線をグループ化し、一つのコンテンツとする(ステップS1003)。また、図形のオブジェクト内に他の図形のオブジェクト、区分線が存在しない場合は図形のオブジェクトを1つのコンテンツとする。
図11は、図形のオブジェクトを検出するフローチャートを示している。先ず、ベクトルデータより両端に連結していない不要なベクトルを除去し、閉図形構成ベクトルを抽出する(ステップS1101)。次に閉図形構成ベクトルの中から該ベクトルの始点を開始点とし、時計回りに順にベクトルを追っていく。開始点に戻るまで行い、通過したベクトルを全て一つの図形のオブジェクトを構成する閉図形としてグループ化する(ステップS1102)。また、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらにまだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。最後に、ステップS1101で除去された不要ベクトルのうち、ステップS1102で閉図形としてグループ化されたベクトルに接合しているものを検出し1つのコンテンツとしてグループ化する(ステップS1103)。
以上によって図形のオブジェクトを個別にキーワード検索可能な個別のコンテンツとして扱うことが可能になる。
また、文字領域のオブジェクトに関しては、先に説明したように、形態素解析や構文解析などを行うことで、意味的に繋がりがあるかどうか判断して、1つの文章として結合すべきかどうか決定するのが望ましい。
4.5 検索キーワード作成処理
図12を用い、図3のステップS308に示される検索キーワード作成処理について詳細を説明する。
まず検索キーワード作成処理の対象となるデータは、コンテンツ分離処理(ステップS303)、ベクトル化処理(ステップS306)、コンテンツ整合処理(ステップS307)を経て得たコンテンツのベクトルデータである。なお、図画・写真コンテンツの場合は画像データである。つまり、それ自体で意味のある(セマンティックな)ベクトルデータである。
本実施形態では、ステップS1201、S1203、S1205、S1207に示す4種類の検索キーワードを機械によって自動で作成している。
ステップS1201では、文書内の各コンテンツのうち、文字部分に関してOCRをかけることで得られたテキストデータから検索キーワードを抽出し、対応するベクトルデータに付加する。なお、ステップS1201は、文書の本文内に含まれるコンテンツを対象としている。具体的には、その画像データが文字ブロックのみからなる場合には、その文字そのものから、線や表等の図形ブロックが含まれる場合には、近傍のタイトルや、図形ブロック内のテキストデータから検索キーワードを抽出する。
ステップS1202では、ステップS1201において付加された検索キーワードに対して修正可/不可の設定を行う。ここでは修正可に設定する。
ステップS1203では、文書の表紙に含まれる文字部分に関してOCRをかけることで得られたテキストデータから検索キーワードを抽出し、該文書内に含まれるコンテンツに対応するベクトルデータ全てに付加する。具体的には、文書の表紙から文書名、作者、作成日などの作成情報を検索キーワードとして抽出し、文書内に含まれるコンテンツのデータに付加する。かかる検索キーワードを抽出することにより、各ベクトルデータを文書名や作者、作成日などの作成情報に基づいて検索することが可能となる。
ステップS1204では、ステップS1203において抽出された検索キーワードに対して修正可/不可の設定を行う。ここでは修正可に設定する。
ステップS1205では、2次元バーコードや透かし等を用いて埋め込まれている属性データを、検索キーワードとして文書内に含まれるコンテンツに対応するベクトルデータ全てに付加する。ただし、属性データは、他の検索キーワードとは区別して付加される。なお、属性データとしては上述のようなQRコードのほか、電子透かし情報、あるいは、紙紋情報、地紋情報なども含まれる。なお、ページ単位でコピー禁止や配布制限が制御されている場合を考慮し、当該2次元バーコード(透かし)が含まれている同一ページ内のデータに限って付加するようにしてもよい。また、2次元バーコード(透かし)が含まれているページが表紙である場合は全ページのコンテンツのデータに付加し、表紙以外のページである場合は各ページ内のコンテンツのデータに対してのみ付加するように切り替えてもよい。
ステップS1206では、ステップS1205において抽出された検索キーワードに対して修正可/不可の設定を行う。ここでは修正不可に設定する。これは、コピー禁止や配布制限などのような処理制限に関する属性データが変更されないようにするための処置である。なお、処理制限に係るデータでないと判断できる場合は、修正可と設定するようにしてもよい。
ステップS1207では、同一ページの他のコンテンツのみに含まれる検索キーワード(属性データ)をコピーして自コンテンツに対応するベクトルデータに検索キーワードとして付加する。なお、ここでは、同一ページの全コンテンツに対応するベクトルデータに検索キーワード(属性データ)をコピーすることとしている。
ステップS1208では、ステップS1207において抽出された検索キーワードに対して修正可/不可の設定を行う。ここでは修正可に設定する。
なお、上記ステップS1202、S1204、S1206、S1208における修正可/不可の設定は、それぞれ検索キーワードの「編集権」を設定する処理である。かかる処理を実行することにより、MFP100では、各コンテンツごとに分離されたベクトルデータに適当な検索キーワードを自動付加することができるだけでなく、更に、その検索キーワードに対する編集権も付加することができる。
このように、MFP100では、検索キーワードの抽出元に応じて編集権を設定することができるよう構成されている。
なお、ステップS1202、S1204、S1206、S1208において修正可能と設定された検索キーワードは、図3(B)の電子ファイル検索・出力処理を実行した際に、ユーザによって適宜修正可能な検索キーワードである。一方、ステップS1202、1204、1206、1208において修正不可と設定された検索キーワードは、ユーザによって修正することが制限された検索キーワードである。上述のように、コピー禁止や配布制限などのような処理制限に関する情報である属性データなどが改ざん防止を目的として、修正不可と設定される。このような修正不可設定されたデータは、システム管理者などの特別の権限を有するユーザ以外は修正できなくなる
なお、図12のフローチャートでは、検索キーワードの4つに区分(ステップS1201、1203、1205、1207)し、各区分ごとに一括して編集権を設定する構成としたが、本発明は特にこれに限られない。例えば、検索キーワードごとに設定できるように構成してもよい。
4.6 電子ファイル格納処理
図13は図3のステップS309に示される電子ファイル格納処理により格納される電子ファイル(コンテンツごとのベクトルデータに対して検索キーワード及び修正可/不可設定等が付加されたファイル)の構造を示した図である。
1301は電子ファイルヘッダであり、1302は検索キーワード個数を格納する検索データヘッダである。1309は属性データ個数を格納する属性データヘッダである。1314はベクトルデータヘッダである。
個々の検索キーワードは、検索キーワードの修正可/不可を示す修正フラグを格納する検索キーワード修正フラグヘッダ1303、1305、1307と、検索キーワード1304、1306、1308とから構成される。
ここで検索キーワード修正フラグヘッダ内の修正フラグが修正可の場合はそのヘッダが指す検索キーワードを修正できるように制御し、逆に修正フラグが修正不可の場合はそのヘッダが指す検索キーワードを修正できないように制御する。
同様に、個々の属性データは、属性データの修正可/不可を示す修正フラグを格納する属性データ修正フラグヘッダ1310、1312と、属性データ1311、1313とから構成される。検索キーワードと同様に、属性データ修正フラグヘッダ内の修正フラグによって、そのヘッダが指す属性データの修正可/不可を制御する。
最後に、ベクトルデータは、ベクトルデータの種類等を格納するベクトルデータヘッダ1314と、ベクトルデータ1315とから構成される。ベクトルデータについても、検索キーワードや属性データと同様な修正の可/不可を制御する場合には、ベクトルデータヘッダにその修正フラグを格納することで制御することが可能となる。
5.電子ファイル検索・出力処理の詳細
次に、電子ファイル検索・出力処理の詳細について説明する。なお、電子ファイル検索・出力処理のうち、検索キーワード修正処理以外の処理については、従来の処理と同様であるため、ここでは、検索キーワード修正処理について詳説する。
図14は検索キーワード修正処理(ステップS316)の流れを示すフローチャートである。
ステップS1401では、検索キーワード修正の対象となる電子ファイルを選択する。ステップS1402では、電子ファイルヘッダ(1301)が指す検索データヘッダ(1302)を読み、検索キーワードが存在するかをチェックする。
ステップS1402において検索キーワードが無いと判断された場合には、検索キーワード修正処理は終了する。一方、検索キーワードがあると判断された場合には、ステップS1403に進み、ユーザが修正しようとする検索キーワードの検索キーワード修正フラグヘッダ(1303)にアクセスし、修正可/不可をチェックする。
ステップS1403において、修正可であったと判定された場合には、ステップS1404に進み、検索キーワードの修正を受け付ける。一方、修正不可であったと判定された場合には、ステップS1405に進む。
ステップS1405では、ユーザが修正しようとする検索キーワードが他にもあると判定された場合には、ステップS1406に進み、該他の検索キーワードを取得し、ステップS1403に戻る。一方、ステップS1405において、修正しようとする検索キーワードが他にないと判定された場合には、検索キーワード修正処理を終了する。
6.ユーザインタフェース
次に、MFP100における、上記電子ファイル検索・出力処理実行時のユーザインタフェースについて説明する。
図15は、MFP100における電子ファイル検索・出力処理において、表示装置216に表示されるユーザインタフェースの一例を示す図である。
図15の(A)は、検索キーワード入力処理(ステップS311)における画面の一例である。1500は検索ウィンドウであり、入力欄1501には検索キーワード(属性データも含む)が入力される。1502は検索ボタンであり、入力欄1501に検索キーワードが入力された状態で該検索ボタン1502が押下されることにより、電子ファイルの検索処理(ステップS312)が開始される。
図15の(B)は、電子ファイル検索処理(ステップS312)が実行されることにより表示された画面の一例である。1510はリスト表示ウィンドウであり、検索処理の結果、適合した電子ファイルがリスト表示される。リスト1511には、適合度1512、種類1513、ファイル名称1514が含まれる。また、リスト1511に表示された電子ファイルのうち、(ステップS1401において)ユーザにより選択された電子ファイルについては、サムネイル表示欄1510に電子ファイルの内容が表示される。なお、リスト1511に表示された電子ファイルの選択は、選択ボタン1515を押下することにより、可能となる。
1516は修正ボタンであり、該修正ボタン1516が押下されることにより、リスト1511に表示された電子ファイルのうち、選択された電子ファイルについての修正処理が開始される。
なお、選択された電子ファイルについて、「編集権」(修正可)が設定されていなかった場合には、修正ボタン1516は押下できないように構成されている。つまり、選択ボタン1515が押下されると、ユーザにより選択された電子ファイルが検索キーワードを有しているか否か、ならびに「編集権」が付加されているか否かの判定を開始する(ステップS1402、1403)。検索キーワードを有しており、かつ「編集権」が付加されていると判定された場合には、修正ボタン1516を押下可能に制御する。一方、付加されていないと判定された場合には、修正ボタン1516を押下不可能に制御する。
修正ボタン1516が押下されると、選択された電子ファイルについての修正が可能となる(ステップS1404)。図15の(C)は、検索キーワード修正処理(ステップS1404)が実行されることより表示される画面の一例である。1520は検索キーワード修正ウィンドウであり、検索キーワード一覧1521には、選択された電子ファイルについて付加された検索キーワードの一覧が表示される。
ユーザは検索キーワード一覧1521の中から、所望の検索キーワードを選択し、修正キーワード入力欄1522に修正キーワードを入力することにより、当該検索キーワードを修正する。
OKボタン1523が押下されると、修正キーワード入力欄1522に入力された修正キーワードが反映され、処理が終了される(ステップS1405)。一方、キャンセルボタン1524が押下されると、修正キーワード入力欄1522に入力された修正キーワードは反映されることなく、処理が終了される(ステップS1405)。
以上の説明から明らかなように、本実施形態にかかる画像処理装置によれば、文書を構成するコンテンツごとにベクトルデータを生成し、検索キーワードを用いて検索可能に格納することができる。
また、ベクトルデータを格納するに際して、検索キーワードごとに編集権(修正可/不可)を設定することができる。
これにより、所望の検索結果が得られず、検索キーワードを修正する場合であっても、無制限に修正が行われないように制御することが可能となり、検索精度の向上と情報セキュリティの保持を両立させることが可能となる。
[第2の実施形態]
上記第1の実施形態では、生成された電子ファイルをMFP100内の記憶装置211に格納することとしたが本発明は特にこれに限定されない。例えば、LAN107を介して、オフィス10内のデータベース105に格納するようにしてもよい。また、インターネット104を介して、オフィス20のデータベース105に格納するようにしてもよい。なお、この場合、電子ファイル検索・出力処理では、記憶装置211のみならず、データベース105も検索処理の対象となる。
また、上記第1の実施形態では、画像読み取り部210により読み取られた文書に含まれるコンテンツを、ベクトル化する対象としたが本発明は特にこれに限定されない。たとえば、オフィス10内の文書管理サーバ106やオフィス20内の文書管理サーバ106内に格納されている文書に含まれるコンテンツを、ベクトル化する対象としてもよい。
[他の実施形態]
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェース機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給するよう構成することによっても達成されることはいうまでもない。この場合、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することにより、上記機能が実現されることとなる。なお、この場合、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フロッピ(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される場合に限られない。例えば、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、前述した実施形態の機能が実現される場合も含まれる。つまり、プログラムコードがメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって実現される場合も含まれる。
本発明の一実施形態にかかる画像処理装置を備える画像処理システムの構成を示す図である。 本発明の一実施形態にかかる画像処理装置(MFP100)の構成を示す図である。 MFP100における全体処理の流れを示すフローチャートである。 ブロックセレクション処理を説明するための図である。 ブロックセレクション処理により取得されたブロック情報の一例を示す図である。 画像データ中に付加された2次元バーコードを復号して、データ文字列を出力する流れを示すフローチャートである。 2次元バーコードが付加された文書の一例を示す図である。 文字以外のブロックのベクトル化処理を説明するための図である。 文字以外のブロックのベクトル化処理を説明するための図である。 ベクトルデータを図形オブジェクトごとにグループ化するまでの処理の流れを示す図である。 図形要素を検出するための処理の流れを示すフローチャートである。 検索キーワード作成処理の流れを示すフローチャートである。 電子ファイル格納処理により格納される電子ファイルの構造を示す図である。 検索キーワード修正処理の流れを示すフローチャートである。 MFP100における、電子ファイル検索・出力処理のためのユーザインタフェースを示す図である。

Claims (15)

  1. 画像データ内に含まれるコンテンツのデータを取得するコンテンツ取得手段と、
    前記画像データからキーワードを抽出する抽出手段と、
    前記抽出手段で抽出したキーワードがどのようにして抽出されたキーワードであるかに応じて、当該キーワードの修正可否を設定する設定手段と、
    前記コンテンツのデータと前記キーワードと前記修正可否設定とを対応付けて格納する格納手段と、を備え
    前記設定手段は、前記抽出手段で抽出したキーワードが、透かし情報、地紋情報、バーコード情報、紙紋情報の少なくともいずれかから抽出されたキーワードである場合、修正否を設定することを特徴とする画像処理装置。
  2. 画像データ内に含まれるコンテンツのデータを取得するコンテンツ取得手段と、
    前記画像データからキーワードを抽出する抽出手段と、
    前記抽出手段で抽出したキーワードがどのようにして抽出されたキーワードであるかに応じて、当該キーワードの修正可否を設定する設定手段と、
    前記コンテンツのデータと前記キーワードと前記修正可否設定とを対応付けて格納する格納手段と、を備え
    前記設定手段は、前記抽出手段で抽出したキーワードが、文書の表紙から抽出されたキーワードである場合、修正可を設定することを特徴とする画像処理装置。
  3. 画像データ内に含まれるコンテンツのデータを取得するコンテンツ取得手段と、
    前記画像データからキーワードを抽出する抽出手段と、
    前記抽出手段で抽出したキーワードがどのようにして抽出されたキーワードであるかに応じて、当該キーワードの修正可否を設定する設定手段と、
    前記コンテンツのデータと前記キーワードと前記修正可否設定とを対応付けて格納する格納手段と、を備え
    前記設定手段は、前記キーワードが、同一ページの他のコンテンツから抽出されたキーワードである場合、修正可を設定することを特徴とする画像処理装置。
  4. 画像データ内に含まれるコンテンツのデータを取得するコンテンツ取得手段と、
    前記画像データからキーワードを抽出する抽出手段と、
    前記抽出手段で抽出したキーワードがどのようにして抽出されたキーワードであるかに応じて、当該キーワードの修正可否を設定する設定手段と、
    前記コンテンツのデータと前記キーワードと前記修正可否設定とを対応付けて格納する格納手段と、を備え
    前記設定手段は、前記抽出手段で前記画像データ内に含まれる第1の種類のコンテンツから抽出されたキーワードに対しては修正可を設定し、前記抽出手段で前記画像データ内に含まれる第2の種類のコンテンツから抽出されたキーワードに対しては修正否を設定することを特徴とする画像処理装置。
  5. 前記第1の種類のコンテンツから抽出されたキーワードは、前記画像データ内に含まれる文字画像を文字認識処理することにより抽出されたキーワードと、前記画像データを構成する文書の表紙から抽出されたキーワードと、前記画像データの同一ページの他のコンテンツから抽出されたキーワードとのうちの少なくともいずれかであり、
    前記第2の種類のコンテンツから抽出されたキーワードは、前記画像データ内に含まれる透かし情報、地紋情報、バーコード情報、紙紋情報の少なくともいずれかから抽出されたキーワードであることを特徴とする請求項4に記載の画像処理装置。
  6. 前記コンテンツのデータに対応付けられているキーワードを修正する修正手段を更に備え、
    前記修正手段は、当該コンテンツデータに対応付けられている前記修正可否設定に応じて、当該キーワードを修正可能にするか修正不可能にするか制御することを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  7. 前記コンテンツ取得手段は、前記コンテンツをベクトルデータ化し、当該得られたコンテンツのベクトルデータを前記コンテンツのデータとして取得することを特徴とする請求項1乃至6のいずれか1項に記載の画像処理装置。
  8. 前記設定手段は、前記抽出手段で抽出したキーワードが、文字画像を文字認識処理することにより抽出されたキーワードである場合、修正可を設定することを特徴とする請求項1に記載の画像処理装置。
  9. 前記コンテンツ取得手段で取得されるコンテンツのデータは、前記画像データをオブジェクトごとに分割し、当該分割されたオブジェクトをコンテンツごとにまとめることにより得られるデータであることを特徴とする請求項に記載の画像処理装置。
  10. 画像処理装置の画像処理方法であって、
    取得手段が、画像データ内に含まれるコンテンツのデータを取得するコンテンツ取得工程と、
    抽出手段が、前記画像データからキーワードを抽出する抽出工程と、
    設定手段が、前記抽出工程で抽出したキーワードがどのようにして抽出されたキーワードであるかに応じて、当該キーワードの修正可否を設定する設定工程と、
    格納制御手段が、前記コンテンツのデータと前記キーワードと前記修正可否設定とを対応付けて格納手段に格納する格納工程と、を備え
    前記設定工程では、前記抽出工程で抽出したキーワードが、透かし情報、地紋情報、バーコード情報、紙紋情報の少なくともいずれかから抽出されたキーワードである場合、修正否を設定することを特徴とする、画像処理装置の画像処理方法。
  11. 画像処理装置の画像処理方法であって、
    取得手段が、画像データ内に含まれるコンテンツのデータを取得するコンテンツ取得工程と、
    抽出手段が、前記画像データからキーワードを抽出する抽出工程と、
    設定手段が、前記抽出工程で抽出したキーワードがどのようにして抽出されたキーワードであるかに応じて、当該キーワードの修正可否を設定する設定工程と、
    格納制御手段が、前記コンテンツのデータと前記キーワードと前記修正可否設定とを対応付けて格納手段に格納する格納工程と、を備え、
    前記設定工程では、前記抽出工程で抽出したキーワードが、文書の表紙から抽出されたキーワードである場合、修正可を設定することを特徴とする、画像処理装置の画像処理方法。
  12. 画像処理装置の画像処理方法であって、
    取得手段が、画像データ内に含まれるコンテンツのデータを取得するコンテンツ取得工程と、
    抽出手段が、前記画像データからキーワードを抽出する抽出工程と、
    設定手段が、前記抽出工程で抽出したキーワードがどのようにして抽出されたキーワードであるかに応じて、当該キーワードの修正可否を設定する設定工程と、
    格納制御手段が、前記コンテンツのデータと前記キーワードと前記修正可否設定とを対応付けて格納手段に格納する格納工程と、を備え、
    前記設定工程では、前記キーワードが、同一ページの他のコンテンツから抽出されたキーワードである場合、修正可を設定することを特徴とする、画像処理装置の画像処理方法。
  13. 画像処理装置の画像処理方法であって、
    取得手段が、画像データ内に含まれるコンテンツのデータを取得するコンテンツ取得工程と、
    抽出手段が、前記画像データからキーワードを抽出する抽出工程と、
    設定手段が、前記抽出工程で抽出したキーワードがどのようにして抽出されたキーワードであるかに応じて、当該キーワードの修正可否を設定する設定工程と、
    格納制御手段が、前記コンテンツのデータと前記キーワードと前記修正可否設定とを対応付けて格納手段に格納する格納工程と、を備え、
    前記設定工程では、前記抽出工程で前記画像データ内に含まれる第1の種類のコンテンツから抽出されたキーワードに対しては修正可を設定し、前記抽出工程で前記画像データ内に含まれる第2の種類のコンテンツから抽出されたキーワードに対しては修正否を設定することを特徴とする、画像処理装置の画像処理方法。
  14. コンピュータを、請求項1乃至のいずれか1項に記載の画像処理装置の各手段として機能させるためのコンピュータプログラム。
  15. コンピュータを、請求項1乃至のいずれか1項に記載の画像処理装置の各手段として機能させるためのコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
JP2006336380A 2006-12-13 2006-12-13 画像処理装置及びその制御方法 Expired - Fee Related JP4854491B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006336380A JP4854491B2 (ja) 2006-12-13 2006-12-13 画像処理装置及びその制御方法
US11/952,903 US8073255B2 (en) 2006-12-13 2007-12-07 Keyword generation process

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006336380A JP4854491B2 (ja) 2006-12-13 2006-12-13 画像処理装置及びその制御方法

Publications (2)

Publication Number Publication Date
JP2008146605A JP2008146605A (ja) 2008-06-26
JP4854491B2 true JP4854491B2 (ja) 2012-01-18

Family

ID=39527304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006336380A Expired - Fee Related JP4854491B2 (ja) 2006-12-13 2006-12-13 画像処理装置及びその制御方法

Country Status (2)

Country Link
US (1) US8073255B2 (ja)
JP (1) JP4854491B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4854491B2 (ja) * 2006-12-13 2012-01-18 キヤノン株式会社 画像処理装置及びその制御方法
KR100886767B1 (ko) * 2006-12-29 2009-03-04 엔에이치엔(주) 지유아이 검색 서비스 제공 방법 및 시스템
JP5159588B2 (ja) * 2008-12-05 2013-03-06 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US9378205B1 (en) * 2009-06-19 2016-06-28 Sureclinical Inc. System and method for managing and sharing pharmaceutical clinical trial regulatory documents
US9870572B2 (en) * 2009-06-29 2018-01-16 Google Llc System and method of providing information based on street address
US8576049B2 (en) * 2009-09-23 2013-11-05 International Business Machines Corporation Document authentication and identification
US8533579B2 (en) * 2009-10-21 2013-09-10 Symantec Corporation Data loss detection method for handling fuzziness in sensitive keywords
US8914767B2 (en) * 2012-03-12 2014-12-16 Symantec Corporation Systems and methods for using quick response codes to activate software applications
CN103699549B (zh) * 2012-09-27 2016-11-23 阿里巴巴集团控股有限公司 一种图形码库更新、查询方法及相关装置
US11310056B2 (en) 2013-12-09 2022-04-19 Sureclinical Inc. System and method for high trust cloud digital signing and workflow automation in health sciences
US11328234B2 (en) 2015-12-11 2022-05-10 Sureclinical Inc. Interactive project progress tracking interface
US11405423B2 (en) 2016-03-11 2022-08-02 Netskope, Inc. Metadata-based data loss prevention (DLP) for cloud resources
US11403418B2 (en) * 2018-08-30 2022-08-02 Netskope, Inc. Enriching document metadata using contextual information
US11463362B2 (en) 2021-01-29 2022-10-04 Netskope, Inc. Dynamic token bucket method adaptive to opaque server limits
US11848949B2 (en) 2021-01-30 2023-12-19 Netskope, Inc. Dynamic distribution of unified policies in a cloud-based policy enforcement system
KR102501117B1 (ko) * 2022-08-17 2023-02-17 주식회사 공유넷연구소 비대면 협업을 위한 업무 공유 시스템

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069503B2 (en) * 2001-06-04 2006-06-27 Murata Kikai Kabushiki Kaisha Device and program for structured document generation data structure of structural document
JP2003016070A (ja) * 2001-07-02 2003-01-17 Ricoh Co Ltd 画像蓄積管理装置及び画像蓄積管理方法
JP2003091552A (ja) * 2001-09-17 2003-03-28 Hitachi Ltd 検索要求情報抽出方法及びその実施システム並びにその処理プログラム
JP2004013599A (ja) * 2002-06-07 2004-01-15 Ricoh Co Ltd 管理サーバ、ウェブページ情報管理方法及びプログラム
JP2004318187A (ja) 2003-02-24 2004-11-11 Matsushita Electric Ind Co Ltd 画像生成装置および画像生成システム
US7487161B2 (en) * 2003-09-12 2009-02-03 Sap Ag Distributing data
JP4681863B2 (ja) * 2004-11-30 2011-05-11 キヤノン株式会社 画像処理装置、および、その制御方法
JP4789516B2 (ja) * 2005-06-14 2011-10-12 キヤノン株式会社 文書変換装置、文書変換方法並びに記憶媒体
US7382933B2 (en) * 2005-08-24 2008-06-03 International Business Machines Corporation System and method for semantic video segmentation based on joint audiovisual and text analysis
KR100661177B1 (ko) * 2005-12-02 2006-12-26 삼성전자주식회사 모바일 컨텐츠 관리장치
US7617231B2 (en) * 2005-12-07 2009-11-10 Electronics And Telecommunications Research Institute Data hashing method, data processing method, and data processing system using similarity-based hashing algorithm
US20080004947A1 (en) * 2006-06-28 2008-01-03 Microsoft Corporation Online keyword buying, advertisement and marketing
JP4854491B2 (ja) * 2006-12-13 2012-01-18 キヤノン株式会社 画像処理装置及びその制御方法
CN101606155B (zh) * 2007-08-09 2013-03-13 松下电器产业株式会社 内容检索装置

Also Published As

Publication number Publication date
US8073255B2 (en) 2011-12-06
JP2008146605A (ja) 2008-06-26
US20080144936A1 (en) 2008-06-19

Similar Documents

Publication Publication Date Title
JP4854491B2 (ja) 画像処理装置及びその制御方法
JP4181892B2 (ja) 画像処理方法
JP4557765B2 (ja) 画像処理装置およびその方法
US7681121B2 (en) Image processing apparatus, control method therefor, and program
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7640269B2 (en) Image processing system and image processing method
US8520006B2 (en) Image processing apparatus and method, and program
JP4502385B2 (ja) 画像処理装置およびその制御方法
JP4393161B2 (ja) 画像処理装置及び画像処理方法
JP2006023945A (ja) 画像処理システム及び画像処理方法
JP2006011714A (ja) 画像処理装置及びその制御方法、プログラム
JP2005167937A (ja) 画像処理システム及び画像処理方法
JP4227432B2 (ja) 画像処理方法
JP4338189B2 (ja) 画像処理システム及び画像処理方法
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2008028716A (ja) 画像処理方法及び装置
JP2005149097A (ja) 画像処理システム及び画像処理方法
JP4310176B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2006134042A (ja) 画像処理システム
JP2006146486A (ja) 画像処理装置
JP2005208872A (ja) 画像処理システム
JP2006195886A (ja) 画像処理システム
JP2008084127A (ja) 画像形成装置
JP2005136729A (ja) 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体
JP2006165783A (ja) 画像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111021

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111025

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141104

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees