JP2016170677A - 文書画像処理用のプログラムおよびこのプログラムを用いた画像処理装置ならびに文字認識装置 - Google Patents
文書画像処理用のプログラムおよびこのプログラムを用いた画像処理装置ならびに文字認識装置 Download PDFInfo
- Publication number
- JP2016170677A JP2016170677A JP2015050696A JP2015050696A JP2016170677A JP 2016170677 A JP2016170677 A JP 2016170677A JP 2015050696 A JP2015050696 A JP 2015050696A JP 2015050696 A JP2015050696 A JP 2015050696A JP 2016170677 A JP2016170677 A JP 2016170677A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- image
- character
- character strings
- strings
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims description 40
- 238000003384 imaging method Methods 0.000 abstract description 9
- 239000000284 extract Substances 0.000 abstract description 5
- 238000007781 pre-processing Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
Description
2 画像入力部
3 文字認識部
4 名刺情報認識部
5 認識結果出力部
11 文字成分抽出部
12 文字列抽出部
13 文字列分類処理部
14 名刺画像切り出し部
r1〜r5 名刺領域
g1〜g5 名刺画像
Claims (7)
- それぞれ複数の文字列が記された複数の文書シートを一括で撮像することにより生成された画像が入力されるコンピュータに、当該入力画像から各文書シートの画像を個別に切り出す処理を実行させるためのプログラムであって、
前記入力画像に含まれる文字列をその向きを表すデータと共に一列ずつ抽出する文字列抽出手段、
各文字列の間の前記向きを表すデータの差があらかじめ定めた特定の値に近似しかつ互いの文字列があらかじめ定めた位置関係をもって分布していることを条件として、前記文字列抽出手段により抽出された文字列を前記条件を満たす文字列群毎に分類する文字列分類手段、
前記文字列分類手段により分類された文字列群毎に、その文字列群の文字列が分布する範囲に対応する画像を前記入力画像から切り出す切り出し処理手段、
の各手段として、前記コンピュータを動作させる文書画像処理用のプログラム。 - 前記文字列分類手段は、互いの間の向きの差が0度に近似する関係にある複数の文字列が一定の距離範囲内に分布していることを前記条件として、前記文字列抽出手段により抽出された全ての文字列の中から当該条件を満たす関係にある文字列の組み合わせを抽出する、請求項1に記載された文書画像処理用のプログラム。
- 前記文字列分類手段は、互いの間の向きの差が0度または90度に近似する関係にある複数の文字列が一定の大きさの領域内に分布していることを前記条件として、前記文字列抽出手段により抽出された全ての文字列の中から当該条件を満たす関係にある文字列の組み合わせを抽出する、請求項1に記載された文書画像処理用のプログラム。
- 前記文字列分類手段は、前記文字列抽出手段により抽出された各文字列をそれぞれの長さの降順に従って1つずつ処理対象として、処理対象の文字列に対して前記条件を満たす関係にある他の文字列を検索する、請求項1〜3のいずれかに記載された文書画像処理用のプログラム。
- それぞれ複数の文字列が記された複数の文書シートを一括で撮像することにより生成された画像を入力する画像入力手段と、
前記画像入力手段により入力された画像に含まれる文字列をその向きを表すデータと共に一列ずつ抽出する文字列抽出手段と、
各文字列の間の前記向きを表すデータの差があらかじめ定めた特定の値に近似しかつ互いの文字列があらかじめ定めた位置関係をもって分布していることを条件として、前記文字列抽出手段により抽出された文字列を前記条件を満たす文字列群毎に分類する文字列分類手段と、
前記文字列分類手段により分類された文字列群毎に、その文字列群の文字列が分布する範囲に対応する画像を前記入力画像から切り出す切り出し処理手段と、
前記切り出し処理手段により切り出された各画像を出力する出力手段とを、具備する画像処理装置。 - 請求項5に記載された画像処理装置であって、
前記切り出し処理手段により切り出された各画像が出力手段により出力される前に、それぞれの画像に対応する文字列群の前記向きを表すデータに基づき各画像の傾きを補正する補正手段を備える画像処理装置。 - それぞれ複数の文字列が記された複数の文書シートを一括で撮像することにより生成された画像を入力する画像入力手段と、
前記画像入力手段により入力された画像に含まれる文字列をその向きを表すデータと共に一列ずつ抽出する文字列抽出手段と、
各文字列の間の前記向きを表すデータの差があらかじめ定めた特定の値に近似しかつ互いの文字列があらかじめ定めた位置関係をもって分布していることを条件として、前記文字列抽出手段により抽出された文字列を前記条件を満たす文字列群毎に分類する文字列分類手段と、
前記文字列分類手段により分類された文字列群毎に、その文字列群の文字列が分布する範囲に対応する画像を前記入力画像から切り出す切り出し手段と、
前記切り出し手段により切り出された各画像を、それぞれの画像に対応する文字列群の前記向きを表すデータに基づき補正する補正手段と、
前記補正手段により補正された画像毎に、その画像に含まれる文字列内の各文字を認識してその認識結果に基づき各文字列に対応するテキストデータを作成する文字認識手段とを、具備する文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015050696A JP6435934B2 (ja) | 2015-03-13 | 2015-03-13 | 文書画像処理用のプログラムおよびこのプログラムを用いた画像処理装置ならびに文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015050696A JP6435934B2 (ja) | 2015-03-13 | 2015-03-13 | 文書画像処理用のプログラムおよびこのプログラムを用いた画像処理装置ならびに文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016170677A true JP2016170677A (ja) | 2016-09-23 |
JP6435934B2 JP6435934B2 (ja) | 2018-12-12 |
Family
ID=56983833
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015050696A Expired - Fee Related JP6435934B2 (ja) | 2015-03-13 | 2015-03-13 | 文書画像処理用のプログラムおよびこのプログラムを用いた画像処理装置ならびに文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6435934B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107608604A (zh) * | 2017-09-26 | 2018-01-19 | 维沃移动通信有限公司 | 一种图像显示方法及移动终端 |
JP2019161440A (ja) * | 2018-03-13 | 2019-09-19 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
CN110717483A (zh) * | 2019-09-19 | 2020-01-21 | 浙江善政科技有限公司 | 网络图像识别处理方法,计算机可读存储介质和移动终端 |
JP2021504781A (ja) * | 2017-12-01 | 2021-02-15 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム |
JP2021153276A (ja) * | 2020-03-24 | 2021-09-30 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004038605A (ja) * | 2002-07-04 | 2004-02-05 | Oki Electric Ind Co Ltd | 画像処理装置及び画像処理方法並びに画像処理装置の制御用プログラム |
JP2008160339A (ja) * | 2006-12-22 | 2008-07-10 | Kyocera Mita Corp | 画像形成装置 |
JP2012103755A (ja) * | 2010-11-05 | 2012-05-31 | Ntt Docomo Inc | 文字列出力装置、文字認識システム、プログラム及び文字列出力方法 |
-
2015
- 2015-03-13 JP JP2015050696A patent/JP6435934B2/ja not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004038605A (ja) * | 2002-07-04 | 2004-02-05 | Oki Electric Ind Co Ltd | 画像処理装置及び画像処理方法並びに画像処理装置の制御用プログラム |
JP2008160339A (ja) * | 2006-12-22 | 2008-07-10 | Kyocera Mita Corp | 画像形成装置 |
JP2012103755A (ja) * | 2010-11-05 | 2012-05-31 | Ntt Docomo Inc | 文字列出力装置、文字認識システム、プログラム及び文字列出力方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107608604A (zh) * | 2017-09-26 | 2018-01-19 | 维沃移动通信有限公司 | 一种图像显示方法及移动终端 |
JP2021504781A (ja) * | 2017-12-01 | 2021-02-15 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム |
JP7289047B2 (ja) | 2017-12-01 | 2023-06-09 | インターナショナル・ビジネス・マシーンズ・コーポレーション | ブロックに基づく文書メタデータの抽出のための方法、コンピュータ・プログラム及びシステム |
JP2019161440A (ja) * | 2018-03-13 | 2019-09-19 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7031389B2 (ja) | 2018-03-13 | 2022-03-08 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
CN110717483A (zh) * | 2019-09-19 | 2020-01-21 | 浙江善政科技有限公司 | 网络图像识别处理方法,计算机可读存储介质和移动终端 |
CN110717483B (zh) * | 2019-09-19 | 2023-04-18 | 浙江善政科技有限公司 | 网络图像识别处理方法,计算机可读存储介质和移动终端 |
JP2021153276A (ja) * | 2020-03-24 | 2021-09-30 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
JP7457903B2 (ja) | 2020-03-24 | 2024-03-29 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置 |
Also Published As
Publication number | Publication date |
---|---|
JP6435934B2 (ja) | 2018-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12019675B2 (en) | Recognizing text in image data | |
RU2651144C2 (ru) | Ввод данных с изображений документов с фиксированной структурой | |
RU2668717C1 (ru) | Генерация разметки изображений документов для обучающей выборки | |
AU2014321165B2 (en) | Image searching method and apparatus | |
US9626555B2 (en) | Content-based document image classification | |
US8208765B2 (en) | Search and retrieval of documents indexed by optical character recognition | |
JP6435934B2 (ja) | 文書画像処理用のプログラムおよびこのプログラムを用いた画像処理装置ならびに文字認識装置 | |
US20180189592A1 (en) | Systems and methods for optical character recognition | |
US10949610B2 (en) | Computing machine and template management method | |
WO2018233055A1 (zh) | 保单信息录入的方法、装置、计算机设备及存储介质 | |
US11323577B2 (en) | Image processing device for creating an album | |
CN111444795A (zh) | 票据数据识别方法、电子设备、存储介质及装置 | |
US20150294187A1 (en) | Image search apparatus and control method thereof | |
CN111310426A (zh) | 基于ocr的表格版式恢复方法、装置及存储介质 | |
US11574492B2 (en) | Efficient location and identification of documents in images | |
CN105793867A (zh) | 图像搜索方法及设备 | |
CN109388935B (zh) | 单证验证方法及装置、电子设备及可读存储介质 | |
JP5623574B2 (ja) | 帳票識別装置および帳票識別方法 | |
CN112287763A (zh) | 图像处理方法、装置、设备及介质 | |
US12046067B2 (en) | Optical character recognition systems and methods for personal data extraction | |
JP2006330872A (ja) | 指紋照合装置、方法およびプログラム | |
KR101800975B1 (ko) | 필기체가 인식되어 생성된 전자문서의 공유 방법 및 그 장치 | |
JP2002342343A (ja) | 文書管理システム | |
KR102425032B1 (ko) | 문서종류의 자동 분류장치 및 그 방법 | |
JPWO2020044537A1 (ja) | 画像照合装置、画像照合方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180705 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180807 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181016 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181029 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6435934 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |