JP2009200622A - 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 - Google Patents
電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 Download PDFInfo
- Publication number
- JP2009200622A JP2009200622A JP2008037774A JP2008037774A JP2009200622A JP 2009200622 A JP2009200622 A JP 2009200622A JP 2008037774 A JP2008037774 A JP 2008037774A JP 2008037774 A JP2008037774 A JP 2008037774A JP 2009200622 A JP2009200622 A JP 2009200622A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- electronic document
- correction
- baseline
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 20
- 238000003860 storage Methods 0.000 title claims description 8
- 238000004590 computer program Methods 0.000 title claims description 7
- 238000012937 correction Methods 0.000 claims abstract description 62
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 238000010586 diagram Methods 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000005259 measurement Methods 0.000 description 5
- 238000009877 rendering Methods 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000005452 bending Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T1/00—General purpose image data processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/387—Composing, repositioning or otherwise geometrically modifying originals
- H04N1/3877—Image rotation
- H04N1/3878—Skew detection or correction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Character Input (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Document Processing Apparatus (AREA)
- Processing Or Creating Images (AREA)
Abstract
【解決手段】上記課題を解決するために、本発明は、画像の歪みを補正することにより補正画像を得て、前記補正画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る。次に、前記補正前の画像における各文字行のベースラインを求める。そして、前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求めて、前記補正前の画像上における前記テキストデータの位置を、前記ベースラインからの相対位置で記述した電子文書を生成する。
【選択図】図3
Description
図1は、実施形態1に係る電子文書生成装置の概略を示すブロック図である。
102 ROM
103 RAM
104 外部記憶装置
105 ディスプレイ
106 入力装置
107 ネットワークインターフェース(I/F)
Claims (10)
- 画像の歪みを補正することにより補正画像を得る補正手段と、
前記補正画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る文字認識手段と、
補正前の画像における各文字行のベースラインを求める手段と、
前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求める手段と、
前記補正前の画像上における前記テキストデータの位置を、前記ベースラインからの相対位置で記述した電子文書を生成する生成手段と、
を備えることを特徴とする電子文書生成装置。 - 更に、入力画像を回転させることにより、直立画像を得る回転手段を備え、
前記補正前の画像は、前記回転手段で得た直立画像であることを特徴とする請求項1に記載の電子文書生成装置。 - 前記生成手段は、前記ベースラインからの相対位置で記述されたテキストデータを、前記補正前の画像の上に透明文字として重ねて配置するように記述した電子文書を生成することを特徴とする請求項1または2に記載の電子文書生成装置。
- 前記生成手段は、テキストライズの記述を用いて前記ベースラインからの相対位置を記述したテキストデータを含む電子文書を生成することを特徴とする請求項1乃至3のいずれかに記載の電子文書生成装置。
- 前記補正画像に含まれる各文字画像の位置座標を歪み補正逆変換することにより、前記補正前の画像における各文字画像の位置座標を求める逆変換手段を、更に備え、
前記逆変換手段で求めた前記補正前の画像における各文字画像の位置座標に基づいて、前記ベースラインからの相対位置を求めることを特徴とする請求項1乃至4のいずれかに記載の電子文書生成装置。 - 前記文字画像のデフォルト文字幅を求める手段と、
前記補正前の画像における各文字画像の文字幅と前記デフォルト文字幅との比を求める手段と、を更に備え、
前記生成手段は、前記補正前の画像上におけるテキストデータの位置を、前記ベースラインからの相対位置で記述し、更に、前記デフォルト文字幅との比を用いて文字幅を記述したテキストデータを含む電子文書を生成することを特徴とする請求項1乃至5のいずれかに記載の電子文書生成装置。 - 前記生成手段で生成される電子文書は、PDF文書であることを特徴とする請求項1乃至6のいずれかに記載の電子文書生成装置。
- 補正手段が、画像の歪みを補正することにより補正画像を得る補正ステップと、
文字認識手段が、前記補正画像に含まれる複数の文字画像に対して文字認識処理を実行することにより、テキストデータを得る文字認識ステップと、
生成手段が、補正前の画像における各文字行のベースラインを求め、
前記補正前の画像における各文字画像について、前記ベースラインからの相対位置を求め、
前記補正前の画像上における前記テキストデータの位置を、前記ベースラインからの相対位置で記述した電子文書を生成する生成ステップと、
を備えることを特徴とする電子文書生成方法。 - コンピュータを、請求項1乃至7のいずれかに記載されている各手段として機能させるためのコンピュータプログラム。
- コンピュータを、請求項1乃至7のいずれかに記載されている各手段として機能させるためのコンピュータプログラムを格納したコンピュータ読取可能な記憶媒体。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008037774A JP4902568B2 (ja) | 2008-02-19 | 2008-02-19 | 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 |
KR1020090010901A KR101018310B1 (ko) | 2008-02-19 | 2009-02-11 | 전자 문서 생성장치, 전자 문서 생성방법, 및 기억매체 |
EP09152544.4A EP2093994B1 (en) | 2008-02-19 | 2009-02-11 | Electronic document producing device, electronic document producing method and storage medium |
US12/388,417 US8532386B2 (en) | 2008-02-19 | 2009-02-18 | Electronic document producing device, electronic document producing method and storage medium |
CN2009100065630A CN101515984B (zh) | 2008-02-19 | 2009-02-19 | 电子文档生成设备及电子文档生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008037774A JP4902568B2 (ja) | 2008-02-19 | 2008-02-19 | 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2009200622A true JP2009200622A (ja) | 2009-09-03 |
JP2009200622A5 JP2009200622A5 (ja) | 2011-04-07 |
JP4902568B2 JP4902568B2 (ja) | 2012-03-21 |
Family
ID=40405096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008037774A Expired - Fee Related JP4902568B2 (ja) | 2008-02-19 | 2008-02-19 | 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8532386B2 (ja) |
EP (1) | EP2093994B1 (ja) |
JP (1) | JP4902568B2 (ja) |
KR (1) | KR101018310B1 (ja) |
CN (1) | CN101515984B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102201053A (zh) * | 2010-12-10 | 2011-09-28 | 上海合合信息科技发展有限公司 | 一种文本图像的切边方法 |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010109448A (ja) | 2008-10-28 | 2010-05-13 | Canon Inc | 画像処理方法及び画像読取装置 |
JP5195882B2 (ja) * | 2010-12-01 | 2013-05-15 | コニカミノルタビジネステクノロジーズ株式会社 | 電子文書生成システム、電子文書生成方法およびプログラム |
KR101294306B1 (ko) * | 2011-06-09 | 2013-08-08 | 엘지전자 주식회사 | 휴대 전자기기 및 이의 제어방법 |
CN105225218B (zh) * | 2014-06-24 | 2018-12-21 | 佳能株式会社 | 用于文档图像的畸变校正方法和设备 |
CN105654082B (zh) * | 2014-11-12 | 2019-04-12 | 佳能株式会社 | 字符识别后处理方法、设备及包括该设备的图像拾取设备 |
CN106156766B (zh) | 2015-03-25 | 2020-02-18 | 阿里巴巴集团控股有限公司 | 文本行分类器的生成方法及装置 |
CN105302626B (zh) * | 2015-11-09 | 2021-07-23 | 深圳市巨鼎医疗股份有限公司 | Xps结构化数据的解析方法 |
JP2017187988A (ja) * | 2016-04-07 | 2017-10-12 | 東芝テック株式会社 | コード認識装置 |
CN110807454B (zh) * | 2019-09-19 | 2024-05-14 | 平安科技(深圳)有限公司 | 基于图像分割的文字定位方法、装置、设备及存储介质 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4251799A (en) * | 1979-03-30 | 1981-02-17 | International Business Machines Corporation | Optical character recognition using baseline information |
JPS6065668A (ja) | 1983-09-20 | 1985-04-15 | Ricoh Co Ltd | 画像処理方式 |
JP3576570B2 (ja) * | 1991-11-19 | 2004-10-13 | ゼロックス コーポレイション | 比較方法 |
JP3186246B2 (ja) | 1992-09-24 | 2001-07-11 | 株式会社日立製作所 | 文書読取装置 |
EP0625757B1 (en) | 1993-05-07 | 2000-08-23 | Canon Kabushiki Kaisha | Selective document retrieval method and system |
EP0677812B1 (en) | 1994-04-15 | 2001-11-21 | Canon Kabushiki Kaisha | Document storage and retrieval system |
EP0710003B1 (en) * | 1994-10-25 | 2001-08-16 | Canon Kabushiki Kaisha | Copier apparatus capable of rotating an image |
JP3113814B2 (ja) * | 1996-04-17 | 2000-12-04 | インターナショナル・ビジネス・マシーンズ・コーポレ−ション | 情報検索方法及び情報検索装置 |
JP2000322417A (ja) | 1999-05-06 | 2000-11-24 | Canon Inc | 画像ファイリング装置及び方法及び記憶媒体 |
JP2002077578A (ja) | 2000-08-30 | 2002-03-15 | Minolta Co Ltd | 歪み補正装置およびその方法ならびに歪み補正プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002108940A (ja) | 2000-09-29 | 2002-04-12 | Toshiba Corp | 情報検索方法及び情報検索装置 |
JP2002358514A (ja) * | 2000-12-14 | 2002-12-13 | Ricoh Co Ltd | 画像歪み補正装置、プログラム、記憶媒体、画像歪み補正方法、画像読取装置および画像形成装置 |
GB0104664D0 (en) * | 2001-02-23 | 2001-04-11 | Hewlett Packard Co | Improvements relating to document capture |
US6996290B2 (en) * | 2002-01-31 | 2006-02-07 | Hewlett-Packard Development Company, L.P. | Binding curvature correction |
US20050129333A1 (en) * | 2002-09-30 | 2005-06-16 | Yoshiyuki Matsuyama | Image correction device and image correction method |
JP4136860B2 (ja) | 2003-02-20 | 2008-08-20 | 株式会社リコー | 画像歪み補正装置、画像読取装置、画像形成装置及びプログラム |
US7602995B2 (en) | 2004-02-10 | 2009-10-13 | Ricoh Company, Ltd. | Correcting image distortion caused by scanning |
JP4760362B2 (ja) * | 2005-12-21 | 2011-08-31 | 三菱電機株式会社 | 文字読取装置 |
US7903876B2 (en) * | 2007-02-27 | 2011-03-08 | Seiko Epson Corporation | Distortion correction of a captured image |
-
2008
- 2008-02-19 JP JP2008037774A patent/JP4902568B2/ja not_active Expired - Fee Related
-
2009
- 2009-02-11 KR KR1020090010901A patent/KR101018310B1/ko active IP Right Grant
- 2009-02-11 EP EP09152544.4A patent/EP2093994B1/en not_active Expired - Fee Related
- 2009-02-18 US US12/388,417 patent/US8532386B2/en active Active
- 2009-02-19 CN CN2009100065630A patent/CN101515984B/zh not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102201053A (zh) * | 2010-12-10 | 2011-09-28 | 上海合合信息科技发展有限公司 | 一种文本图像的切边方法 |
CN102201053B (zh) * | 2010-12-10 | 2013-07-24 | 上海合合信息科技发展有限公司 | 一种文本图像的切边方法 |
US9082192B2 (en) | 2010-12-10 | 2015-07-14 | Intsig Information Co., Ltd | Text image trimming method |
Also Published As
Publication number | Publication date |
---|---|
US8532386B2 (en) | 2013-09-10 |
EP2093994B1 (en) | 2016-05-04 |
KR20090089793A (ko) | 2009-08-24 |
KR101018310B1 (ko) | 2011-03-04 |
US20090297027A1 (en) | 2009-12-03 |
CN101515984B (zh) | 2011-08-17 |
CN101515984A (zh) | 2009-08-26 |
EP2093994A1 (en) | 2009-08-26 |
JP4902568B2 (ja) | 2012-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4902568B2 (ja) | 電子文書生成装置、電子文書生成方法、コンピュータプログラム、および記憶媒体 | |
JP6119992B2 (ja) | 画像処理装置およびコンピュータプログラム | |
JP5789719B2 (ja) | 電子文書の表示モードを確定するための方法と装置 | |
JP4631900B2 (ja) | 情報処理装置、情報処理システム、および情報処理プログラム | |
JP2004192307A (ja) | 類似画像抽出装置、類似画像抽出方法および類似画像抽出プログラム | |
CN109658334B (zh) | 一种古籍图像拼接方法及装置 | |
JP5927942B2 (ja) | 画面生成装置、画面生成システム及び画面生成プログラム | |
US8712111B2 (en) | Image processing apparatus | |
JP4177325B2 (ja) | 画像処理装置、画像処理プログラム及び画像処理方法 | |
JP2010066865A (ja) | 差分抽出装置及び差分抽出プログラム | |
JP6194781B2 (ja) | 画像処理装置及びプログラム | |
CN113157275B (zh) | 帧动画的渲染方法、装置、电子设备及存储介质 | |
JP2006237858A (ja) | 画像処理装置、画像処理方法、その方法をコンピュータに実行させるプログラム、および記録媒体 | |
JP2007011529A (ja) | Ocr処理における文字認識位置の決定方法 | |
JP2004054898A (ja) | 印刷データ生成装置、印刷データ生成方法およびそのプログラム | |
JP6414475B2 (ja) | コンピュータプログラム及び制御装置 | |
JP5208043B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2021141497A (ja) | 画像処理システム | |
JP6413450B2 (ja) | 画像処理装置、画像形成装置およびプログラム | |
US20100104131A1 (en) | Document processing apparatus and document processing method | |
KR20210066426A (ko) | 소정 형식의 데이터 및 데이터가 나타내는 정보를 포함하는 인쇄물의 수정 및 출력 | |
JP2007213325A (ja) | 画像処理装置、画像処理方法、及び、画像処理プログラム | |
WO2000075869A1 (en) | Image processing method | |
JP2004272415A (ja) | 光学読取装置 | |
JP2021005753A (ja) | 画像処理装置及び方法、並びに画像表示装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20101106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110217 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110217 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111202 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111228 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4902568 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150113 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |