JP2009200622A5 - - Google Patents

Download PDF

Info

Publication number
JP2009200622A5
JP2009200622A5 JP2008037774A JP2008037774A JP2009200622A5 JP 2009200622 A5 JP2009200622 A5 JP 2009200622A5 JP 2008037774 A JP2008037774 A JP 2008037774A JP 2008037774 A JP2008037774 A JP 2008037774A JP 2009200622 A5 JP2009200622 A5 JP 2009200622A5
Authority
JP
Japan
Prior art keywords
image
character
electronic document
before correction
text data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008037774A
Other languages
English (en)
Other versions
JP4902568B2 (ja
JP2009200622A (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from JP2008037774A external-priority patent/JP4902568B2/ja
Priority to JP2008037774A priority Critical patent/JP4902568B2/ja
Priority to EP09152544.4A priority patent/EP2093994B1/en
Priority to KR1020090010901A priority patent/KR101018310B1/ko
Priority to US12/388,417 priority patent/US8532386B2/en
Priority to CN2009100065630A priority patent/CN101515984B/zh
Publication of JP2009200622A publication Critical patent/JP2009200622A/ja
Publication of JP2009200622A5 publication Critical patent/JP2009200622A5/ja
Publication of JP4902568B2 publication Critical patent/JP4902568B2/ja
Application granted granted Critical
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (12)

  1. 補正前の画像の歪みを補正することにより、補正後の画像を得る補正手段と、
    前記補正後の画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る文字認識手段と、
    前記補正前の画像における各文字行のベースラインを求める手段と、
    前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求める手段と、
    前記補正前の画像のデータと前記テキストデータとを含み、且つ前記テキストデータの位置を前記ベースラインからの相対位置で記述した電子文書を生成する生成手段と、
    を備えることを特徴とする電子文書生成装置。
  2. 更に、入力画像を回転させることにより、直立画像を得る回転手段を備え、
    前記補正前の画像は、前記回転手段で得た直立画像であることを特徴とする請求項1に記載の電子文書生成装置。
  3. 前記生成手段は、前記ベースラインからの相対位置で記述されたテキストデータを、前記補正前の画像の上に透明文字として重ねて配置するように記述した電子文書を生成することを特徴とする請求項1または2に記載の電子文書生成装置。
  4. 前記生成手段は、テキストライズの記述を用いて前記ベースラインからの相対位置を記述したテキストデータを含む電子文書を生成することを特徴とする請求項1乃至3のいずれかに記載の電子文書生成装置。
  5. 前記補正後の画像に含まれる文字画像の位置座標を歪み補正逆変換することにより、前記補正前の画像における各文字画像の位置座標を求める逆変換手段を、更に備え、
    前記逆変換手段で求めた前記補正前の画像における各文字画像の位置座標に基づいて、前記ベースラインからの相対位置を求めることを特徴とする請求項1乃至4のいずれかに記載の電子文書生成装置。
  6. 前記文字画像のデフォルト文字幅を求める手段と、
    前記補正前の画像における各文字画像の文字幅と前記デフォルト文字幅との比を求める手段と、を更に備え、
    前記生成手段は、前記テキストデータの位置を前記ベースラインからの相対位置で記述し、更に、前記デフォルト文字幅との比を用いて文字幅を記述したテキストデータを含む電子文書を生成することを特徴とする請求項1乃至5のいずれかに記載の電子文書生成装置。
  7. 前記生成手段で生成される電子文書は、PDF文書あるいはXPS文書であることを特徴とする請求項1乃至6のいずれかに記載の電子文書生成装置。
  8. 補正前の画像の歪みを補正することにより、補正後の画像を得る補正手段と、
    前記補正後の画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、各文字行に属するテキストデータを得る文字認識手段と、
    前記文字認識手段で得たテキストデータに対応する各文字画像について、前記補正前の画像における位置を求める位置決定手段と、
    単語で検索した場合に当該検索した単語に対応する文字画像についての前記補正前の画像における位置を特定できるように、前記補正前の画像のデータと前記文字認識手段で得た各文字行に属するテキストデータと前記位置決定手段で求めた前記テキストデータに対応する各文字画像の前記補正前の画像における位置に関するデータとを記述した電子文書を生成する生成手段と、
    を備えることを特徴とする電子文書生成装置。
  9. 補正手段が、補正前の画像の歪みを補正することにより、補正後の画像を得る補正ステップと、
    文字認識手段が、前記補正後の画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る文字認識ステップと、
    ベースライン決定手段が、前記補正前の画像における各文字行のベースラインを求めるベースライン決定ステップと、
    相対位置決定手段が、前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求める相対位置決定ステップと、
    生成手段が、前記補正前の画像のデータと前記テキストデータとを含み、且つ前記テキストデータの位置を前記ベースラインからの相対位置で記述した電子文書を生成する生成ステップと、
    を含むことを特徴とする電子文書生成方法。
  10. 補正手段が、補正前の画像の歪みを補正することにより、補正後の画像を得る補正ステップと、
    文字認識手段が、前記補正後の画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、各文字行に属するテキストデータを得る文字認識ステップと、
    位置決定手段が、前記文字認識ステップで得たテキストデータに対応する各文字画像について、前記補正前の画像における位置を求める位置決定ステップと、
    生成手段が、単語で検索した場合に当該検索した単語に対応する文字画像についての前記補正前の画像における位置を特定できるように、前記補正前の画像のデータと前記文字認識ステップで得た各文字行に属するテキストデータと前記位置決定ステップで求めた前記テキストデータに対応する各文字画像の前記補正前の画像における位置に関するデータとを記述した電子文書を生成する生成ステップと、
    を含むことを特徴とする電子文書生成方法。
  11. コンピュータを、請求項1乃至8のいずれかに記載されている電子文書生成装置の各手段として機能させるためのコンピュータプログラム。
  12. コンピュータを、請求項1乃至8のいずれかに記載されている電子文書生成装置の各手段として機能させるためのコンピュータプログラムを格納したコンピュータ読取可能な記憶媒体。
JP2008037774A 2008-02-19 2008-02-19 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 Expired - Fee Related JP4902568B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2008037774A JP4902568B2 (ja) 2008-02-19 2008-02-19 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体
EP09152544.4A EP2093994B1 (en) 2008-02-19 2009-02-11 Electronic document producing device, electronic document producing method and storage medium
KR1020090010901A KR101018310B1 (ko) 2008-02-19 2009-02-11 전자 문서 생성장치, 전자 문서 생성방법, 및 기억매체
US12/388,417 US8532386B2 (en) 2008-02-19 2009-02-18 Electronic document producing device, electronic document producing method and storage medium
CN2009100065630A CN101515984B (zh) 2008-02-19 2009-02-19 电子文档生成设备及电子文档生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008037774A JP4902568B2 (ja) 2008-02-19 2008-02-19 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体

Publications (3)

Publication Number Publication Date
JP2009200622A JP2009200622A (ja) 2009-09-03
JP2009200622A5 true JP2009200622A5 (ja) 2011-04-07
JP4902568B2 JP4902568B2 (ja) 2012-03-21

Family

ID=40405096

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008037774A Expired - Fee Related JP4902568B2 (ja) 2008-02-19 2008-02-19 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体

Country Status (5)

Country Link
US (1) US8532386B2 (ja)
EP (1) EP2093994B1 (ja)
JP (1) JP4902568B2 (ja)
KR (1) KR101018310B1 (ja)
CN (1) CN101515984B (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010109448A (ja) 2008-10-28 2010-05-13 Canon Inc 画像処理方法及び画像読取装置
JP5195882B2 (ja) * 2010-12-01 2013-05-15 コニカミノルタビジネステクノロジーズ株式会社 電子文書生成システム、電子文書生成方法およびプログラム
CN102201053B (zh) * 2010-12-10 2013-07-24 上海合合信息科技发展有限公司 一种文本图像的切边方法
KR101294306B1 (ko) * 2011-06-09 2013-08-08 엘지전자 주식회사 휴대 전자기기 및 이의 제어방법
CN105225218B (zh) * 2014-06-24 2018-12-21 佳能株式会社 用于文档图像的畸变校正方法和设备
CN105654082B (zh) * 2014-11-12 2019-04-12 佳能株式会社 字符识别后处理方法、设备及包括该设备的图像拾取设备
CN106156766B (zh) 2015-03-25 2020-02-18 阿里巴巴集团控股有限公司 文本行分类器的生成方法及装置
CN105302626B (zh) * 2015-11-09 2021-07-23 深圳市巨鼎医疗股份有限公司 Xps结构化数据的解析方法
JP2017187988A (ja) * 2016-04-07 2017-10-12 東芝テック株式会社 コード認識装置
CN110807454B (zh) * 2019-09-19 2024-05-14 平安科技(深圳)有限公司 基于图像分割的文字定位方法、装置、设备及存储介质

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4251799A (en) * 1979-03-30 1981-02-17 International Business Machines Corporation Optical character recognition using baseline information
JPS6065668A (ja) 1983-09-20 1985-04-15 Ricoh Co Ltd 画像処理方式
JP3576570B2 (ja) * 1991-11-19 2004-10-13 ゼロックス コーポレイション 比較方法
JP3186246B2 (ja) 1992-09-24 2001-07-11 株式会社日立製作所 文書読取装置
EP0625757B1 (en) * 1993-05-07 2000-08-23 Canon Kabushiki Kaisha Selective document retrieval method and system
EP0677812B1 (en) * 1994-04-15 2001-11-21 Canon Kabushiki Kaisha Document storage and retrieval system
EP0710003B1 (en) * 1994-10-25 2001-08-16 Canon Kabushiki Kaisha Copier apparatus capable of rotating an image
JP3113814B2 (ja) * 1996-04-17 2000-12-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 情報検索方法及び情報検索装置
JP2000322417A (ja) 1999-05-06 2000-11-24 Canon Inc 画像ファイリング装置及び方法及び記憶媒体
JP2002077578A (ja) 2000-08-30 2002-03-15 Minolta Co Ltd 歪み補正装置およびその方法ならびに歪み補正プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002108940A (ja) 2000-09-29 2002-04-12 Toshiba Corp 情報検索方法及び情報検索装置
JP2002358514A (ja) * 2000-12-14 2002-12-13 Ricoh Co Ltd 画像歪み補正装置、プログラム、記憶媒体、画像歪み補正方法、画像読取装置および画像形成装置
GB0104664D0 (en) * 2001-02-23 2001-04-11 Hewlett Packard Co Improvements relating to document capture
US6996290B2 (en) * 2002-01-31 2006-02-07 Hewlett-Packard Development Company, L.P. Binding curvature correction
CN1623164A (zh) * 2002-09-30 2005-06-01 松下电器产业株式会社 图像校正装置及图像校正方法
JP4136860B2 (ja) 2003-02-20 2008-08-20 株式会社リコー 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム
US7602995B2 (en) 2004-02-10 2009-10-13 Ricoh Company, Ltd. Correcting image distortion caused by scanning
JP4760362B2 (ja) * 2005-12-21 2011-08-31 三菱電機株式会社 文字読取装置
US7903876B2 (en) * 2007-02-27 2011-03-08 Seiko Epson Corporation Distortion correction of a captured image

Similar Documents

Publication Publication Date Title
JP2009200622A5 (ja)
JP2010266929A5 (ja)
RU2010102958A (ru) Устройство обработки изображений, способ и компьютерная программа обработки изображений
JP2009009527A5 (ja)
JP2009181045A5 (ja)
JP2017529591A5 (ja)
JP2009193356A5 (ja)
JP2012094156A5 (ja)
JP2006345099A5 (ja)
JP2016519803A5 (ja)
JP2008009646A5 (ja)
JP2012224076A5 (ja)
JP2016015538A5 (ja)
JP2008021315A5 (ja)
JP2014006571A5 (ja)
JP2006107032A5 (ja)
JP2009199557A5 (ja)
JP2009277220A5 (ja)
JP2010074341A5 (ja)
JP2009075972A5 (ja)
WO2016018682A1 (en) Processing image to identify object for insertion into document
JP2009177630A5 (ja)
JP2009005286A5 (ja)
JP2008033764A5 (ja)
JP2009037558A5 (ja)