JP5111268B2 - 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 - Google Patents
画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 Download PDFInfo
- Publication number
- JP5111268B2 JP5111268B2 JP2008179204A JP2008179204A JP5111268B2 JP 5111268 B2 JP5111268 B2 JP 5111268B2 JP 2008179204 A JP2008179204 A JP 2008179204A JP 2008179204 A JP2008179204 A JP 2008179204A JP 5111268 B2 JP5111268 B2 JP 5111268B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- data
- character code
- image
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
Description
1.大きいサイズのフォントの文字は、アプリケーション、ドライバ、あるいはPDL上で、線分の集まりであるPathデータとして表現され扱われる場合がある。
2.プリンタ側に指定のフォントが無い場合やグラデーションなどを多用した修飾文字の場合は、アプリケーションやドライバ上で文字がイメージデータとして扱われPDLデータとされる場合がある。
3.文字コードだけでは視覚化されるものが何か分からない場合がある(フォントの種類によって視覚化されるものが異なる)。
4.元のテキストの文字列が一文字一文字に分割されて描画コマンドになっている場合には、1文字ずつ別々のテキストデータとして得られてしまい、有意なテキストデータが得られない。
本発明による画像処理装置およびシステムの好適な実施の形態について、以下、図面に基づいて説明する。
はじめに、本発明の一実施形態に係る画像処理システムについて、図1を用いて説明する。図1は、当該画像処理システムの概略構成を示すブロック図である。
続いて、本発明の一実施形態であるMFP100の構成について、図2を用いて説明する。
次に、本実施形態におけるMFPの持つ機能について、図3〜6を用いて説明する。図3は、MFP100のコピー機能・スキャン送信機能・BOX機能を実現する各処理ブロックによる処理の流れを示す図である。図4は、PDLデータに対するPDL処理機能・BOX機能について各処理ブロックによる処理の流れを示している。これらの機能は、一例として図5に示すUI画面500からのユーザー指示によって処理が開始される。
次に、画像格納処理について図7を用いて説明する。
まず、メタデータ付与処理について、図8を用いて説明する。
次に、ベクトル化処理部703でベクトル化されたデータのフォーマットについて、図9を用いて説明する。
<metadata>
<text_index>山田 太郎</text_index>
</metadata>
のように付与すればよい。
次に、オブジェクト分割処理について、図10、11を用いて説明する。
次に、ベクトル化処理部703の処理について、図12を用いて説明する。
次に、グラフィック領域のベクトル化について、図13、14を用いて説明する。
次に、ベクトルデータのグループ化について、図15を用いて説明する。
次に図形要素の検出処理について、図16を用いて説明する。
MFP100は、BOXに保存した文書を、その確認のため、あるいは、検索などの操作のために、表示装置117により表示し、入力装置116などによって操作することができる。以下、このような操作のためのUI表示に関して図17〜21を用いて詳細な説明を行う。
・見た目はテキストデータであるにも係わらず、内部で保持しているデータとしては、Pathデータやイメージデータである場合に文字コードが得られない、
・文字コードだけでは意味が不明なものが得られてしまう、
・もとのテキストの文字列が一文字一文字に分割されて描画コマンドになっている場合には、文字認識後の形態素解析で有意なテキストデータが得られない、
といった問題を解決することができる。
上述の第一の実施形態では、PDLデータがBOXに保存される際に、通常のレンダリングが行われて、そのレンダリング結果をOCR処理する例を説明した。
前述の第一の実施形態および第二の実施形態においては、文字コード情報としてOCR処理の結果から得られるものを使用してメタデータの付与を行う例を説明した。特に第二の実施形態においては文字認識精度を高めるべく、OCR専用のBitmapデータを生成する構成を説明した。本実施形態においては、OCR処理によって得られた文字コード情報と、PDLデータからそのまま抽出される文字コード情報を併用して文字コード情報の信頼性を高める例を図27から29を用いて説明する。
前述の第三の実施形態でMFP100側に導入したテキストオブジェクト変換処理部2201による処理は、プリンタドライバ側で行ってもよい。
前述の第一から第四の実施形態においては、PDLデータがBOXに保存される際には、PDLデータがレンダリングされた画像データをオブジェクト分割して、ベクトル化処理、JPEG圧縮処理、OCR処理がされるものとして説明してきた。しかし、図31に示すように、PDL処理部304で生成されたDisplayList情報をそのまま画像格納処理部200に渡すようにしてもよい。
この場合、記憶媒体から読み出されたプログラムコード自体が、コンピュータに、上述した実施形態の機能を実現させることになる。そのため、このプログラムコード及びプログラムコードを記憶/記録したコンピュータ読み取り可能な記憶媒体も本発明の一つを構成することになる。
101 LAN
102 クライアントPC
103 文書管理サーバ
104 データベース
110 画像読み取り装置
111 読み取り画像処理部
112 出力画像処理部
113 画像記録装置
114 ネットワークI/F
115 記憶部
116 入力装置
117 表示装置
118 CPU
119 RAM
120 ROM
200 画像格納処理部
201 Bitmapスプール
202 画像送信処理部
301 アプリ(アプリケーション)
302 プリンタドライバ
303 PDLデータスプール
304 PDL処理部
305 レンダラ
701 オブジェクト分割処理部
702 JPEG圧縮処理部
703 ベクトル化処理部
704 OCR処理部
705 メタデータ付与部
706 オブジェクト分割処理2部
707 文字コード統合処理部
2201 テキストオブジェクト変換処理部
2202 OCR専用Bitmapスプール
2701 文字コード情報抽出処理部
3000 テキストオブジェクト変換処理2部
3201 DisplayList→ベクトル化データ変換部
Claims (10)
- PDLデータをレンダリングすることにより画像データを得るレンダリング手段と、
前記レンダリング手段で得た画像データの中から文字オブジェクトを抽出する抽出手段と、
前記抽出手段により抽出された文字オブジェクトに対して文字認識処理を実行することにより文字コード情報を得る文字認識手段と、
前記PDLデータに含まれる第2の文字コード情報を抽出する文字コード抽出手段と、
前記文字認識手段により得られた前記文字コード情報と前記文字コード抽出手段によって抽出された前記第2の文字コード情報とを比較し、当該比較結果に従って、より信頼性の高い文字コード情報を採用する統合手段と、
前記統合手段によって採用された前記より信頼性の高い文字コード情報を含むメタデータを前記画像データに付与するメタデータ付与手段と
を備えることを特徴とする画像処理装置。 - 前記レンダリング手段は、前記PDLデータに対する通常のレンダリング処理によりレンダリングした画像データを第1のレンダリングバッファに保存し、前記PDLデータに含まれる文字オブジェクトを変換してレンダリングした画像データを第2のレンダリングバッファに保存し、
前記文字認識手段は、前記第2のレンダリングバッファに保存された画像データに対して文字認識処理を実行することにより文字コード情報を得て、
前記メタデータ付与手段は、前記メタデータを前記第1のレンダリングバッファに保存された画像データに付与する
ことを特徴とする請求項1に記載の画像処理装置。 - 前記レンダリング手段で行われる前記PDLデータに含まれる文字オブジェクトの変換処理は、当該PDLデータに含まれる文字オブジェクトの座標、サイズ、フォント情報、修飾情報のうちの少なくともいずれかを変更する処理であることを特徴とする請求項2に記載の画像処理装置。
- 前記文字コード情報と前記第2の文字コード情報との比較は、各文字コード情報に対して形態素解析を行った結果を比較し、その結果、不明な語がより少ない方の文字コード情報を前記メタデータとして採用することを特徴とする請求項1に記載の画像処理装置。
- 前記メタデータ付与手段は、前記メタデータを、前記画像データ内のオブジェクトに付与することを特徴とする請求項1に記載の画像処理装置。
- 前記画像データ内のオブジェクトをベクトルデータに変換するベクトル化手段を更に備え、
前記メタデータ付与手段は、前記メタデータを、前記ベクトル化手段で変換された前記画像データ内のオブジェクトのベクトルデータに付与する
ことを特徴とする請求項1に記載の画像処理装置。 - 請求項1に記載の画像処理装置と、アプリケーションから描画情報を受け取って該描画情報に基づいて変換したPDLデータを前記画像処理装置に対して送信する機能を持つプリンタドライバを含むホストコンピュータとがネットワークを介して接続した画像処理システムであって、
前記プリンタドライバは、前記アプリケーションから受け取った描画情報をPDLデータに変換する際に、当該PDLデータに含まれる文字オブジェクトの座標、サイズ、フォント情報、修飾情報のうちの少なくともいずれかを変更する変換手段を備える
ことを特徴とする画像処理システム。 - PDLデータをレンダリングすることにより画像データを得るレンダリングステップと、
前記レンダリングステップで得た画像データの中から文字オブジェクトを抽出する抽出ステップと、
前記抽出ステップで抽出された文字オブジェクトに対して文字認識処理を実行することにより文字コード情報を得る文字認識ステップと、
前記PDLデータに含まれる第2の文字コード情報を抽出する文字コード抽出ステップと、
前記文字認識ステップにより得られた前記文字コード情報と前記文字コード抽出ステップによって抽出された前記第2の文字コード情報とを比較し、当該比較結果に従って、より信頼性の高い文字コード情報を採用する統合ステップと、
前記統合ステップによって採用された前記より信頼性の高い文字コード情報を含むメタデータを前記画像データに付与するメタデータ付与ステップと
を含むことを特徴とする画像処理方法。 - コンピュータに、請求項8に記載の方法を実行させるためのプログラム。
- コンピュータに、請求項8に記載の方法を実行させるためのプログラムを格納した、コンピュータが読み取り可能な記録媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008179204A JP5111268B2 (ja) | 2008-07-09 | 2008-07-09 | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 |
US12/496,601 US8320019B2 (en) | 2008-07-09 | 2009-07-01 | Image processing apparatus, image processing method, and computer program thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008179204A JP5111268B2 (ja) | 2008-07-09 | 2008-07-09 | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2010020468A JP2010020468A (ja) | 2010-01-28 |
JP2010020468A5 JP2010020468A5 (ja) | 2011-08-18 |
JP5111268B2 true JP5111268B2 (ja) | 2013-01-09 |
Family
ID=41705305
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008179204A Expired - Fee Related JP5111268B2 (ja) | 2008-07-09 | 2008-07-09 | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8320019B2 (ja) |
JP (1) | JP5111268B2 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10936650B2 (en) | 2008-03-05 | 2021-03-02 | Ebay Inc. | Method and apparatus for image recognition services |
US9495386B2 (en) | 2008-03-05 | 2016-11-15 | Ebay Inc. | Identification of items depicted in images |
US8818978B2 (en) | 2008-08-15 | 2014-08-26 | Ebay Inc. | Sharing item images using a similarity score |
US8825660B2 (en) * | 2009-03-17 | 2014-09-02 | Ebay Inc. | Image-based indexing in a network-based marketplace |
US9164577B2 (en) | 2009-12-22 | 2015-10-20 | Ebay Inc. | Augmented reality system, method, and apparatus for displaying an item image in a contextual environment |
JP5676942B2 (ja) | 2010-07-06 | 2015-02-25 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
JP5249387B2 (ja) | 2010-07-06 | 2013-07-31 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
US10127606B2 (en) | 2010-10-13 | 2018-11-13 | Ebay Inc. | Augmented reality system and method for visualizing an item |
JP5323035B2 (ja) | 2010-12-10 | 2013-10-23 | キヤノン株式会社 | 画像形成装置及びその画像形成方法 |
JP5055418B2 (ja) | 2010-12-10 | 2012-10-24 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
US20120159292A1 (en) * | 2010-12-16 | 2012-06-21 | Oce-Technologies B.V. | Method of processing an object-based image file with content type dependent image processing algorithms |
US8977044B2 (en) * | 2011-02-18 | 2015-03-10 | Fuji Xerox Co., Ltd. | Image processing apparatus for area separation of images, image processing method, and computer readable medium |
JP5285727B2 (ja) * | 2011-02-22 | 2013-09-11 | シャープ株式会社 | 画像形成装置、および、画像形成方法 |
US9449342B2 (en) | 2011-10-27 | 2016-09-20 | Ebay Inc. | System and method for visualization of items in an environment using augmented reality |
JP5984439B2 (ja) * | 2012-03-12 | 2016-09-06 | キヤノン株式会社 | 画像表示装置、画像表示方法 |
US9934522B2 (en) | 2012-03-22 | 2018-04-03 | Ebay Inc. | Systems and methods for batch- listing items stored offline on a mobile device |
US10846766B2 (en) | 2012-06-29 | 2020-11-24 | Ebay Inc. | Contextual menus based on image recognition |
JP5954691B2 (ja) * | 2012-09-28 | 2016-07-20 | ブラザー工業株式会社 | テンプレート処理プログラム及びテンプレート処理方法 |
US9208381B1 (en) * | 2012-12-13 | 2015-12-08 | Amazon Technologies, Inc. | Processing digital images including character recognition using ontological rules |
CN104423900B (zh) * | 2013-08-27 | 2018-04-27 | 北大方正集团有限公司 | 图像打印方法和打印机 |
JP6000992B2 (ja) * | 2014-01-24 | 2016-10-05 | 京セラドキュメントソリューションズ株式会社 | 文書ファイル生成装置及び文書ファイル生成方法 |
US20170161595A1 (en) * | 2015-12-07 | 2017-06-08 | Xerox Corporation | Direct character recognition from page description language document |
TWI608713B (zh) * | 2015-12-31 | 2017-12-11 | 宏正自動科技股份有限公司 | 主動安全防護系統 |
JP6808330B2 (ja) * | 2016-02-26 | 2021-01-06 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP6769045B2 (ja) * | 2016-02-29 | 2020-10-14 | ブラザー工業株式会社 | 画像処理装置、および、コンピュータプログラム |
JP7013182B2 (ja) | 2017-09-21 | 2022-01-31 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
US11087469B2 (en) * | 2018-07-12 | 2021-08-10 | Here Global B.V. | Method, apparatus, and system for constructing a polyline from line segments |
JP7224856B2 (ja) | 2018-11-02 | 2023-02-20 | キヤノン株式会社 | 画像生成装置、画像生成方法、及びプログラム |
JP2022100071A (ja) | 2020-12-23 | 2022-07-05 | キヤノン株式会社 | 画像処理装置、画像処理システム、その制御方法及びプログラム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3683925B2 (ja) | 1994-11-18 | 2005-08-17 | キヤノン株式会社 | 電子ファイリング装置 |
US5907835A (en) * | 1994-11-18 | 1999-05-25 | Canon Kabushiki Kaisha | Electronic filing system using different application program for processing drawing commands for printing |
JPH10228473A (ja) * | 1997-02-13 | 1998-08-25 | Ricoh Co Ltd | 文書画像処理方法、文書画像処理装置および記憶媒体 |
JP2002077609A (ja) * | 2000-09-05 | 2002-03-15 | Canon Inc | 画像判別装置及び複写機及び画像判別方法 |
JP4087191B2 (ja) * | 2002-08-16 | 2008-05-21 | 株式会社リコー | 画像処理装置、画像処理方法および画像処理プログラム |
JP2004272658A (ja) * | 2003-03-10 | 2004-09-30 | Geomic Co Ltd | 携帯情報端末のテキストデータ入力支援方法及び装置 |
JP4266784B2 (ja) * | 2003-11-14 | 2009-05-20 | キヤノン株式会社 | 画像処理システム及び画像処理方法 |
US20060085442A1 (en) * | 2004-10-20 | 2006-04-20 | Kabushiki Kaisha Toshiba | Document image information management apparatus and document image information management program |
JP4928373B2 (ja) * | 2007-07-12 | 2012-05-09 | キヤノン株式会社 | 画像処理装置、画像処理方法、及び、画像処理プログラム |
-
2008
- 2008-07-09 JP JP2008179204A patent/JP5111268B2/ja not_active Expired - Fee Related
-
2009
- 2009-07-01 US US12/496,601 patent/US8320019B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010020468A (ja) | 2010-01-28 |
US8320019B2 (en) | 2012-11-27 |
US20100171999A1 (en) | 2010-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5111268B2 (ja) | 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体 | |
JP4251629B2 (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP5528121B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
JP5376795B2 (ja) | 画像処理装置、画像処理方法、そのプログラム及び記憶媒体 | |
JP4502385B2 (ja) | 画像処理装置およびその制御方法 | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
JP4960817B2 (ja) | 画像処理装置、および画像処理方法 | |
JP4533187B2 (ja) | 画像処理装置およびその制御方法 | |
US20060029293A1 (en) | Image processing system, image forming apparatus, control method for the same, and program for implementing the control method | |
US8384936B2 (en) | System which performs resolution-dependent vectorization of print data | |
US20120250048A1 (en) | Image processing apparatus and image processing method | |
JP2006285612A (ja) | 情報処理装置およびその方法 | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
JP2006243942A (ja) | 画像処理装置およびその方法 | |
JP2005159517A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2009193356A (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
JP2008109394A (ja) | 画像処理装置及びその方法、プログラム | |
JP7262993B2 (ja) | 画像処理システム、画像処理方法、画像処理装置 | |
JP2010074540A (ja) | 画像処理装置 | |
JP2006025129A (ja) | 画像処理システム及び画像処理方法 | |
US8181108B2 (en) | Device for editing metadata of divided object | |
JP2006023944A (ja) | 画像処理システム及び画像処理方法 | |
JP2009211554A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム、および記憶媒体 | |
JP5132347B2 (ja) | 画像処理システム | |
JP7301529B2 (ja) | 画像処理装置、画像処理方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20101106 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110705 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120621 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120911 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121009 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151019 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5111268 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151019 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |