JP2010182206A5 - 画像処理装置、画像処理方法、プログラムおよび記録媒体 - Google Patents

画像処理装置、画像処理方法、プログラムおよび記録媒体 Download PDF

Info

Publication number
JP2010182206A5
JP2010182206A5 JP2009026691A JP2009026691A JP2010182206A5 JP 2010182206 A5 JP2010182206 A5 JP 2010182206A5 JP 2009026691 A JP2009026691 A JP 2009026691A JP 2009026691 A JP2009026691 A JP 2009026691A JP 2010182206 A5 JP2010182206 A5 JP 2010182206A5
Authority
JP
Japan
Prior art keywords
metadata
image processing
processing apparatus
identifier
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009026691A
Other languages
English (en)
Other versions
JP5226553B2 (ja
JP2010182206A (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2009026691A priority Critical patent/JP5226553B2/ja
Priority claimed from JP2009026691A external-priority patent/JP5226553B2/ja
Priority to US12/693,280 priority patent/US8493595B2/en
Publication of JP2010182206A publication Critical patent/JP2010182206A/ja
Publication of JP2010182206A5 publication Critical patent/JP2010182206A5/ja
Application granted granted Critical
Publication of JP5226553B2 publication Critical patent/JP5226553B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

すなわち、複数ページからなる文書画像においてオブジェクト検索用のメタデータを生成して外部装置に送信する画像処理装置であって、前記文書画像における各ページを属性に応じた領域に分割する領域分割手段と、前記領域分割手段で分割されたオブジェクトに隣接するキャプション属性の領域に対し、文字認識を行って文字情報を得る文字認識手段と、前記領域分割手段で分割された領域から、前記文字情報と同義の表現を含む領域を検出し、当該検出した領域から前記オブジェクトのメタデータを抽出するメタデータ抽出手段と、前記オブジェクトに対してキャプションを識別する識別子を付与し、前記メタデータに対して該識別子を付与する付与手段と、前記識別子が付与されたオブジェクトの情報を、予め定められた単位で送信する文書画像送信手段と、前記識別子が付与されたメタデータを送信するメタデータ送信手段と、を有することを特徴とする。

Claims (16)

  1. 複数ページからなる文書画像においてオブジェクト検索用のメタデータを生成して外部装置に送信する画像処理装置であって、
    前記文書画像における各ページを属性に応じた領域に分割する領域分割手段と、
    前記領域分割手段で分割されたオブジェクトに隣接するキャプション属性の領域に対し、文字認識を行って文字情報を得る文字認識手段と、
    前記領域分割手段で分割された領域から、前記文字情報と同義の表現を含む領域を検出し、当該検出した領域から前記オブジェクトのメタデータを抽出するメタデータ抽出手段と、
    前記オブジェクトに対してキャプションを識別する識別子を付与し、前記メタデータに対して該識別子を付与する付与手段と、
    前記識別子が付与されたオブジェクトの情報を、予め定められた単位で送信する文書画像送信手段と、
    前記識別子が付与されたメタデータを送信するメタデータ送信手段と、
    を有することを特徴とする画像処理装置。
  2. 前記文書画像送信手段は、前記識別子が付与されたオブジェクトの情報をページ単位で送信することを特徴とする請求項1に記載の画像処理装置。
  3. 前記文書画像送信手段は、前記オブジェクトのページに前記識別子を含ませて送信し、
    前記メタデータ送信手段は、前記メタデータを前記識別子と共に送信する
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記メタデータ送信手段は、前記文書画像送信手段による前記文書画像の全ページのオブジェクトの情報の送信が終了した後に、前記メタデータを送信することを特徴とする請求項1乃至3のいずれか1項に記載の画像処理装置。
  5. さらに、前記文書画像の全ページを保持可能なワークメモリが確保可能な場合に、該ワークメモリを用いて、前記オブジェクトの情報と前記メタデータとが近接するように配置して、前記文書画像の全ページの送信データを作成する送信データ作成手段と、
    前記送信データ作成手段で作成された全ページの送信データを一括して送信する一括送信手段と、
    を有することを特徴とする請求項1に記載の画像処理装置。
  6. さらに、前記オブジェクトのページよりも前のページにおける領域の文字情報を保持する保持手段を有し、
    前記メタデータ抽出手段は、前記保持手段に記憶された前記文字情報から、前記メタデータを抽出することを特徴とする請求項1乃至5のいずれか1項に記載の画像処理装置。
  7. 前記保持手段は、前記オブジェクトのページよりも前のページにおける領域の文字情報が予め定められた予測キャプションの文字列を示す場合に、該文字情報を保持することを特徴とする請求項6に記載の画像処理装置。
  8. 前記領域分割手段で分割された領域のうち、文字からなる領域であり、かつ、前記オブジェクトの上部または下部に近接して存在する領域に対し、前記キャプション属性を付与する付与手段を更に有することを特徴とする請求項1乃至7のいずれか1項に記載の画像処理装置。
  9. 前記付与手段は、前記領域分割手段で分割された領域に対し、表、写真、図面、線画、キャプション、本文、見出し、のいずれかの属性を属性情報として付与することを特徴とする請求項8に記載の画像処理装置。
  10. 前記メタデータ抽出手段は、前記属性情報として前記本文の属性が付与された領域から、前記メタデータを抽出することを特徴とする請求項9に記載の画像処理装置。
  11. 前記文書画像送信手段は、オブジェクトにメタデータを関連付けることが可能なフォーマットで、前記文書画像を送信することを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
  12. 前記領域分割手段で分割されたオブジェクトをベクトルデータに変換する変換手段を更に有し
    前記文書画像送信手段は、ベクトルデータに変換されたオブジェクトの情報を送信することを特徴とする請求項1乃至11のいずれか1項に記載の画像処理装置。
  13. 複数ページからなる文書画像においてオブジェクト検索用のメタデータを生成して外部装置に送信する画像処理装置の画像処理方法であって、
    領域分割手段が、前記文書画像における各ページを属性に応じた領域に分割する領域分割ステップと、
    文字認識手段が、前記領域分割ステップにおいて分割されたオブジェクトに隣接するキャプション属性の領域に対し、文字認識を行って文字情報を得る文字認識ステップと、
    メタデータ抽出手段が、前記領域分割ステップにおいて分割された領域から、前記文字情報と同義の表現を含む領域を検出し、当該検出した領域から前記オブジェクトのメタデータを抽出するメタデータ抽出ステップと、
    付与手段が、前記オブジェクトに対してキャプションを識別する識別子を付与し、前記メタデータに対して該識別子を付与する付与ステップと、
    文書画像送信手段が、前記識別子が付与されたオブジェクトの情報を、予め定められた単位で送信する文書画像送信ステップと、
    メタデータ送信手段が、前記識別子が付与されたメタデータを送信するメタデータ送信ステップと、
    を有することを特徴とする画像処理方法。
  14. 前記文書画像送信ステップにおいては、前記識別子が付与されたオブジェクトの情報をページ単位で送信することを特徴とする請求項13に記載の画像処理方法。
  15. コンピュータを請求項1乃至12のいずれか1項に記載の画像処理装置における各手段として機能させるためのプログラム。
  16. 請求項15に記載のプログラムを記録したコンピュータ可読な記録媒体。
JP2009026691A 2009-02-06 2009-02-06 画像処理装置、画像処理方法、プログラムおよび記録媒体 Active JP5226553B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009026691A JP5226553B2 (ja) 2009-02-06 2009-02-06 画像処理装置、画像処理方法、プログラムおよび記録媒体
US12/693,280 US8493595B2 (en) 2009-02-06 2010-01-25 Image processing apparatus, image processing method, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009026691A JP5226553B2 (ja) 2009-02-06 2009-02-06 画像処理装置、画像処理方法、プログラムおよび記録媒体

Publications (3)

Publication Number Publication Date
JP2010182206A JP2010182206A (ja) 2010-08-19
JP2010182206A5 true JP2010182206A5 (ja) 2012-03-22
JP5226553B2 JP5226553B2 (ja) 2013-07-03

Family

ID=42540204

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009026691A Active JP5226553B2 (ja) 2009-02-06 2009-02-06 画像処理装置、画像処理方法、プログラムおよび記録媒体

Country Status (2)

Country Link
US (1) US8493595B2 (ja)
JP (1) JP5226553B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5528121B2 (ja) * 2010-01-05 2014-06-25 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
RU2589870C2 (ru) * 2010-12-03 2016-07-10 Конинклейке Филипс Электроникс Н.В. Передача данных 3d-изображения
US8823982B2 (en) * 2011-02-10 2014-09-02 Global Graphics Software Limited Systems and methods for remote data storage and processing for use with printers
JP2012168832A (ja) * 2011-02-16 2012-09-06 Konica Minolta Business Technologies Inc 画像処理装置、画像処理方法及びプログラム
JP5652299B2 (ja) * 2011-03-31 2015-01-14 大日本印刷株式会社 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム
JP5788996B2 (ja) * 2011-12-29 2015-10-07 楽天株式会社 画像検索システム、画像検索方法、画像検索装置、プログラム、及び情報記憶媒体
US9535913B2 (en) * 2013-03-08 2017-01-03 Konica Minolta Laboratory U.S.A., Inc. Method and system for file conversion
JP6752442B2 (ja) * 2016-03-28 2020-09-09 ブラザー工業株式会社 プログラム及び端末装置
CN107590366B (zh) * 2016-07-06 2019-11-15 福建福昕软件开发股份有限公司 一种pdf文档按页保护的方法
JP2019204399A (ja) * 2018-05-25 2019-11-28 富士ゼロックス株式会社 情報処理装置及びプログラム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10228473A (ja) * 1997-02-13 1998-08-25 Ricoh Co Ltd 文書画像処理方法、文書画像処理装置および記憶媒体
JPH11306197A (ja) 1998-04-24 1999-11-05 Canon Inc 画像処理装置及びその方法、コンピュータ可読メモリ
US7421448B2 (en) * 2004-12-20 2008-09-02 Sap Ag System and method for managing web content by using annotation tags
US7747676B1 (en) * 2004-12-20 2010-06-29 AudienceScience Inc. Selecting an advertising message for presentation on a page of a publisher web site based upon both user history and page context
JP4789516B2 (ja) * 2005-06-14 2011-10-12 キヤノン株式会社 文書変換装置、文書変換方法並びに記憶媒体
KR100765759B1 (ko) * 2005-09-22 2007-10-15 삼성전자주식회사 웹 브라우징 방법 및 시스템과 그 기록 매체
US7949935B2 (en) * 2007-04-27 2011-05-24 International Business Machines Corporation Selecting and rendering a section of a web page
JP2010129013A (ja) * 2008-11-30 2010-06-10 Rss Kokokusha:Kk 広告配信のためのシステム、方法、装置およびプログラム

Similar Documents

Publication Publication Date Title
JP2010182206A5 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2011221701A5 (ja)
JP2014016785A5 (ja)
JP2012226744A5 (ja)
US20150228045A1 (en) Methods for embedding and extracting a watermark in a text document and devices thereof
JP2017505475A5 (ja)
JP2019531548A5 (ja)
GB2541581A (en) Retrieving multi-generational stored data in a dispersed storage network
JP2018037087A (ja) 手書き装置の文書の入力領域に用いる方法およびシステム
GB2541608A (en) Selection of thumbnails for video segments
JP2010020468A5 (ja)
TW200739371A (en) Information processing apparatus and method, and a computer readable storage medium encoded with a computer program
JP2016535335A5 (ja)
JP2011192145A5 (ja)
EP2746989A3 (en) Document processing device, image processing apparatus, document processing method and computer program product
US20120102393A1 (en) Document generating apparatus, document generating method, computer program and recording medium
EP2806626A3 (en) Print control apparatus
JP2014225085A5 (ja) 文書変換装置、文書変換方法、及びプログラム
JP2020098499A5 (ja)
JP2016162184A5 (ja)
JP2009506394A5 (ja)
JP6262708B2 (ja) 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法
JP2017211936A5 (ja)
JP2010213121A5 (ja)
US20160188612A1 (en) Objectification with deep searchability