JP2009200622A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2009200622A5 JP2009200622A5 JP2008037774A JP2008037774A JP2009200622A5 JP 2009200622 A5 JP2009200622 A5 JP 2009200622A5 JP 2008037774 A JP2008037774 A JP 2008037774A JP 2008037774 A JP2008037774 A JP 2008037774A JP 2009200622 A5 JP2009200622 A5 JP 2009200622A5
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- electronic document
- before correction
- text data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000000875 corresponding Effects 0.000 claims 6
- 238000006243 chemical reaction Methods 0.000 claims 3
- 238000004590 computer program Methods 0.000 claims 2
Claims (12)
- 補正前の画像の歪みを補正することにより、補正後の画像を得る補正手段と、
前記補正後の画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る文字認識手段と、
前記補正前の画像における各文字行のベースラインを求める手段と、
前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求める手段と、
前記補正前の画像のデータと前記テキストデータとを含み、且つ前記テキストデータの位置を前記ベースラインからの相対位置で記述した電子文書を生成する生成手段と、
を備えることを特徴とする電子文書生成装置。 - 更に、入力画像を回転させることにより、直立画像を得る回転手段を備え、
前記補正前の画像は、前記回転手段で得た直立画像であることを特徴とする請求項1に記載の電子文書生成装置。 - 前記生成手段は、前記ベースラインからの相対位置で記述されたテキストデータを、前記補正前の画像の上に透明文字として重ねて配置するように記述した電子文書を生成することを特徴とする請求項1または2に記載の電子文書生成装置。
- 前記生成手段は、テキストライズの記述を用いて前記ベースラインからの相対位置を記述したテキストデータを含む電子文書を生成することを特徴とする請求項1乃至3のいずれかに記載の電子文書生成装置。
- 前記補正後の画像に含まれる文字画像の位置座標を歪み補正逆変換することにより、前記補正前の画像における各文字画像の位置座標を求める逆変換手段を、更に備え、
前記逆変換手段で求めた前記補正前の画像における各文字画像の位置座標に基づいて、前記ベースラインからの相対位置を求めることを特徴とする請求項1乃至4のいずれかに記載の電子文書生成装置。 - 前記文字画像のデフォルト文字幅を求める手段と、
前記補正前の画像における各文字画像の文字幅と前記デフォルト文字幅との比を求める手段と、を更に備え、
前記生成手段は、前記テキストデータの位置を前記ベースラインからの相対位置で記述し、更に、前記デフォルト文字幅との比を用いて文字幅を記述したテキストデータを含む電子文書を生成することを特徴とする請求項1乃至5のいずれかに記載の電子文書生成装置。 - 前記生成手段で生成される電子文書は、PDF文書あるいはXPS文書であることを特徴とする請求項1乃至6のいずれかに記載の電子文書生成装置。
- 補正前の画像の歪みを補正することにより、補正後の画像を得る補正手段と、
前記補正後の画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、各文字行に属するテキストデータを得る文字認識手段と、
前記文字認識手段で得たテキストデータに対応する各文字画像について、前記補正前の画像における位置を求める位置決定手段と、
単語で検索した場合に当該検索した単語に対応する文字画像についての前記補正前の画像における位置を特定できるように、前記補正前の画像のデータと前記文字認識手段で得た各文字行に属するテキストデータと前記位置決定手段で求めた前記テキストデータに対応する各文字画像の前記補正前の画像における位置に関するデータとを記述した電子文書を生成する生成手段と、
を備えることを特徴とする電子文書生成装置。 - 補正手段が、補正前の画像の歪みを補正することにより、補正後の画像を得る補正ステップと、
文字認識手段が、前記補正後の画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る文字認識ステップと、
ベースライン決定手段が、前記補正前の画像における各文字行のベースラインを求めるベースライン決定ステップと、
相対位置決定手段が、前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求める相対位置決定ステップと、
生成手段が、前記補正前の画像のデータと前記テキストデータとを含み、且つ前記テキストデータの位置を前記ベースラインからの相対位置で記述した電子文書を生成する生成ステップと、
を含むことを特徴とする電子文書生成方法。 - 補正手段が、補正前の画像の歪みを補正することにより、補正後の画像を得る補正ステップと、
文字認識手段が、前記補正後の画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、各文字行に属するテキストデータを得る文字認識ステップと、
位置決定手段が、前記文字認識ステップで得たテキストデータに対応する各文字画像について、前記補正前の画像における位置を求める位置決定ステップと、
生成手段が、単語で検索した場合に当該検索した単語に対応する文字画像についての前記補正前の画像における位置を特定できるように、前記補正前の画像のデータと前記文字認識ステップで得た各文字行に属するテキストデータと前記位置決定ステップで求めた前記テキストデータに対応する各文字画像の前記補正前の画像における位置に関するデータとを記述した電子文書を生成する生成ステップと、
を含むことを特徴とする電子文書生成方法。 - コンピュータを、請求項1乃至8のいずれかに記載されている電子文書生成装置の各手段として機能させるためのコンピュータプログラム。
- コンピュータを、請求項1乃至8のいずれかに記載されている電子文書生成装置の各手段として機能させるためのコンピュータプログラムを格納したコンピュータ読取可能な記憶媒体。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008037774A JP4902568B2 (ja) | 2008-02-19 | 2008-02-19 | 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 |
EP09152544.4A EP2093994B1 (en) | 2008-02-19 | 2009-02-11 | Electronic document producing device, electronic document producing method and storage medium |
KR1020090010901A KR101018310B1 (ko) | 2008-02-19 | 2009-02-11 | 전자 문서 생성장치, 전자 문서 생성방법, 및 기억매체 |
US12/388,417 US8532386B2 (en) | 2008-02-19 | 2009-02-18 | Electronic document producing device, electronic document producing method and storage medium |
CN2009100065630A CN101515984B (zh) | 2008-02-19 | 2009-02-19 | 电子文档生成设备及电子文档生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008037774A JP4902568B2 (ja) | 2008-02-19 | 2008-02-19 | 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009200622A JP2009200622A (ja) | 2009-09-03 |
JP2009200622A5 true JP2009200622A5 (ja) | 2011-04-07 |
JP4902568B2 JP4902568B2 (ja) | 2012-03-21 |
Family
ID=40405096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008037774A Expired - Fee Related JP4902568B2 (ja) | 2008-02-19 | 2008-02-19 | 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8532386B2 (ja) |
EP (1) | EP2093994B1 (ja) |
JP (1) | JP4902568B2 (ja) |
KR (1) | KR101018310B1 (ja) |
CN (1) | CN101515984B (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010109448A (ja) | 2008-10-28 | 2010-05-13 | Canon Inc | 画像処理方法及び画像読取装置 |
JP5195882B2 (ja) * | 2010-12-01 | 2013-05-15 | コニカミノルタビジネステクノロジーズ株式会社 | 電子文書生成システム、電子文書生成方法およびプログラム |
CN102201053B (zh) * | 2010-12-10 | 2013-07-24 | 上海合合信息科技发展有限公司 | 一种文本图像的切边方法 |
KR101294306B1 (ko) * | 2011-06-09 | 2013-08-08 | 엘지전자 주식회사 | 휴대 전자기기 및 이의 제어방법 |
CN105225218B (zh) * | 2014-06-24 | 2018-12-21 | 佳能株式会社 | 用于文档图像的畸变校正方法和设备 |
CN105654082B (zh) * | 2014-11-12 | 2019-04-12 | 佳能株式会社 | 字符识别后处理方法、设备及包括该设备的图像拾取设备 |
CN106156766B (zh) | 2015-03-25 | 2020-02-18 | 阿里巴巴集团控股有限公司 | 文本行分类器的生成方法及装置 |
CN105302626B (zh) * | 2015-11-09 | 2021-07-23 | 深圳市巨鼎医疗股份有限公司 | Xps结构化数据的解析方法 |
JP2017187988A (ja) * | 2016-04-07 | 2017-10-12 | 東芝テック株式会社 | コード認識装置 |
CN110807454B (zh) * | 2019-09-19 | 2024-05-14 | 平安科技(深圳)有限公司 | 基于图像分割的文字定位方法、装置、设备及存储介质 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4251799A (en) * | 1979-03-30 | 1981-02-17 | International Business Machines Corporation | Optical character recognition using baseline information |
JPS6065668A (ja) | 1983-09-20 | 1985-04-15 | Ricoh Co Ltd | 画像処理方式 |
JP3576570B2 (ja) * | 1991-11-19 | 2004-10-13 | ゼロックス コーポレイション | 比較方法 |
JP3186246B2 (ja) | 1992-09-24 | 2001-07-11 | 株式会社日立製作所 | 文書読取装置 |
EP0625757B1 (en) * | 1993-05-07 | 2000-08-23 | Canon Kabushiki Kaisha | Selective document retrieval method and system |
EP0677812B1 (en) * | 1994-04-15 | 2001-11-21 | Canon Kabushiki Kaisha | Document storage and retrieval system |
EP0710003B1 (en) * | 1994-10-25 | 2001-08-16 | Canon Kabushiki Kaisha | Copier apparatus capable of rotating an image |
JP3113814B2 (ja) * | 1996-04-17 | 2000-12-04 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 情報検索方法及び情報検索装置 |
JP2000322417A (ja) | 1999-05-06 | 2000-11-24 | Canon Inc | 画像ファイリング装置及び方法及び記憶媒体 |
JP2002077578A (ja) | 2000-08-30 | 2002-03-15 | Minolta Co Ltd | 歪み補正装置およびその方法ならびに歪み補正プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002108940A (ja) | 2000-09-29 | 2002-04-12 | Toshiba Corp | 情報検索方法及び情報検索装置 |
JP2002358514A (ja) * | 2000-12-14 | 2002-12-13 | Ricoh Co Ltd | 画像歪み補正装置、プログラム、記憶媒体、画像歪み補正方法、画像読取装置および画像形成装置 |
GB0104664D0 (en) * | 2001-02-23 | 2001-04-11 | Hewlett Packard Co | Improvements relating to document capture |
US6996290B2 (en) * | 2002-01-31 | 2006-02-07 | Hewlett-Packard Development Company, L.P. | Binding curvature correction |
CN1623164A (zh) * | 2002-09-30 | 2005-06-01 | 松下电器产业株式会社 | 图像校正装置及图像校正方法 |
JP4136860B2 (ja) | 2003-02-20 | 2008-08-20 | 株式会社リコー | 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム |
US7602995B2 (en) | 2004-02-10 | 2009-10-13 | Ricoh Company, Ltd. | Correcting image distortion caused by scanning |
JP4760362B2 (ja) * | 2005-12-21 | 2011-08-31 | 三菱電機株式会社 | 文字読取装置 |
US7903876B2 (en) * | 2007-02-27 | 2011-03-08 | Seiko Epson Corporation | Distortion correction of a captured image |
-
2008
- 2008-02-19 JP JP2008037774A patent/JP4902568B2/ja not_active Expired - Fee Related
-
2009
- 2009-02-11 KR KR1020090010901A patent/KR101018310B1/ko active IP Right Grant
- 2009-02-11 EP EP09152544.4A patent/EP2093994B1/en not_active Expired - Fee Related
- 2009-02-18 US US12/388,417 patent/US8532386B2/en active Active
- 2009-02-19 CN CN2009100065630A patent/CN101515984B/zh not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009200622A5 (ja) | ||
JP2010266929A5 (ja) | ||
RU2010102958A (ru) | Устройство обработки изображений, способ и компьютерная программа обработки изображений | |
JP2009009527A5 (ja) | ||
JP2009181045A5 (ja) | ||
JP2017529591A5 (ja) | ||
JP2009193356A5 (ja) | ||
JP2012094156A5 (ja) | ||
JP2006345099A5 (ja) | ||
JP2016519803A5 (ja) | ||
JP2008009646A5 (ja) | ||
JP2012224076A5 (ja) | ||
JP2016015538A5 (ja) | ||
JP2008021315A5 (ja) | ||
JP2014006571A5 (ja) | ||
JP2006107032A5 (ja) | ||
JP2009199557A5 (ja) | ||
JP2009277220A5 (ja) | ||
JP2010074341A5 (ja) | ||
JP2009075972A5 (ja) | ||
WO2016018682A1 (en) | Processing image to identify object for insertion into document | |
JP2009177630A5 (ja) | ||
JP2009005286A5 (ja) | ||
JP2008033764A5 (ja) | ||
JP2009037558A5 (ja) |