JP6900164B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP6900164B2 JP6900164B2 JP2016188375A JP2016188375A JP6900164B2 JP 6900164 B2 JP6900164 B2 JP 6900164B2 JP 2016188375 A JP2016188375 A JP 2016188375A JP 2016188375 A JP2016188375 A JP 2016188375A JP 6900164 B2 JP6900164 B2 JP 6900164B2
- Authority
- JP
- Japan
- Prior art keywords
- item
- keyword
- search
- item value
- item name
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Library & Information Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
キーワード:発行日
項目値:平成XX年XX月XX日
位置関係情報:キーワードの下方向に20mm以内に項目値が存在する
なお、発行日に対する項目値の年、月、日に対する数字は文書により異なる。このように、不定文字(数字)が入る位置には、Xが挿入されている。すなわち、項目値の「平成XX年XX月XX日」のXは、0から9の何れかの整数が入ることを意味する。なお、一般的にこのような表記を正規表記と呼ぶ。
・ 黒画素塊の外接矩形の幅が閾値以上、かつ高さが閾値以下である。または、幅が閾値
以下で高さが閾値以上である。
またCPU111は、以下の全ての条件に該当する黒画素塊を、表の罫線を構成する黒画素塊であると判定する。
・ 黒画素塊の外接矩形の幅、高さが閾値以上(例えば、100画素、0.25cm以上
)である。
・ 外接矩形の内部における黒画素塊の充填率が閾値以下である(例えば、黒画素塊が外
接矩形に占める割合が20%以下)。
・ 黒画素塊の最大幅及び高さと、外接矩形の幅及び高さの差が何れも小さい(例えば、
黒画素塊の最大幅及び高さと、外接矩形の幅及び高さの画素の差がともに10画素以下)。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
110 情報処理装置
111 CPU
Claims (7)
- 画像に含まれる文字を認識する認識手段と、
前記画像に含まれる所定の項目名を前記認識手段による認識結果と所定の文字列との比較に基づいて検索する第1の検索手段と、
前記第1の検索手段によって前記所定の項目名が見つからなかった場合に、前記画像に含まれる項目値を前記認識手段による認識結果と前記項目値のフォーマットに関する検索条件とに基づいて検索する第2の検索手段と、
前記第2の検索手段によって検索された前記項目値に基づいて前記画像に含まれる項目名を、前記項目名と前記項目値との位置関係を示す位置関係情報に基づいて特定する第1の特定手段と、
前記第1の特定手段によって複数の項目名が特定された場合、前記複数の項目名の中で前記第1の検索手段によって検索された前記所定の項目名に最も類似する項目名を決定する決定手段と、
前記第2の検索手段によって検索された項目値を前記決定手段によって決定された項目名に対応する項目値として特定する第2の特定手段とを有することを特徴とする情報処理装置。 - 前記第1の特定手段は、前記第2の検索手段によって検索された項目値の周辺にある前記項目名を、前記項目名と前記項目値との位置関係を示す位置関係情報に基づいて特定することを特徴とする請求項1に記載の情報処理装置。
- 前記決定手段は、前記複数の項目名の中で前記第1の検索手段によって検索された項目名に含まれる文字と一致する文字を最も多く有する項目名を決定することを特徴とする請求項1または2に記載の情報処理装置。
- 前記第1の検索手段が前記所定の項目名を見つけた場合に、前記第2の検索手段は、前記画像に含まれる前記項目値を検索しないことを特徴とする請求項1に記載の情報処理装置。
- 前記画像は、スキャナによって生成される画像であることを特徴とする請求項1乃至4のいずれか1項に記載の情報処理装置。
- 画像に含まれる文字を認識する認識工程と、
前記画像に含まれる所定の項目名を前記認識工程による認識結果と所定の文字列との比較に基づいて検索する第1の検索工程と、
前記第1の検索工程によって前記所定の項目名が見つからなかった場合に、前記画像に含まれる項目値を前記認識工程による認識結果と前記項目値のフォーマットに関する検索条件とに基づいて検索する第2の検索工程と、
前記第2の検索工程で検索された前記項目値に基づいて前記画像に含まれる項目名を、前記項目名と前記項目値との位置関係を示す位置関係情報に基づいて特定する第1の特定工程と、
前記第1の特定工程によって複数の項目名が特定された場合、前記複数の項目名の中で前記第1の検索工程によって検索された前記所定の項目名に最も類似する項目名を決定する決定工程と、
前記第2の検索工程によって検索された項目値を前記決定工程によって決定された項目名に対応する項目値として特定する第2の特定工程とを有することを特徴とする情報処理方法。 - 請求項6に記載された情報処理方法を、コンピュータに実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016188375A JP6900164B2 (ja) | 2016-09-27 | 2016-09-27 | 情報処理装置、情報処理方法及びプログラム |
US15/707,822 US10740899B2 (en) | 2016-09-27 | 2017-09-18 | Image processing apparatus for identifying region within image, information processing method, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016188375A JP6900164B2 (ja) | 2016-09-27 | 2016-09-27 | 情報処理装置、情報処理方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2018055255A JP2018055255A (ja) | 2018-04-05 |
JP2018055255A5 JP2018055255A5 (ja) | 2019-11-07 |
JP6900164B2 true JP6900164B2 (ja) | 2021-07-07 |
Family
ID=61686468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016188375A Active JP6900164B2 (ja) | 2016-09-27 | 2016-09-27 | 情報処理装置、情報処理方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US10740899B2 (ja) |
JP (1) | JP6900164B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6874729B2 (ja) * | 2018-04-02 | 2021-05-19 | 日本電気株式会社 | 画像処理装置、画像処理方法およびプログラム |
CN110874752A (zh) * | 2018-08-31 | 2020-03-10 | 绿源钻石有限公司 | 宝石估价方法及装置、应用程序产品及可读取记录介质 |
JP2020123231A (ja) * | 2019-01-31 | 2020-08-13 | 富士ゼロックス株式会社 | 情報処理装置、及び情報処理プログラム |
JP7408313B2 (ja) * | 2019-08-13 | 2024-01-05 | キヤノン株式会社 | 画像処理装置、その制御方法及びプログラム |
US11568623B2 (en) | 2019-08-22 | 2023-01-31 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
JP7447482B2 (ja) * | 2019-12-24 | 2024-03-12 | 日本電気株式会社 | 画像処理装置、システム、方法、及びプログラム |
JP7520605B2 (ja) * | 2020-07-06 | 2024-07-23 | キヤノン株式会社 | 画像処理装置、画像処理方法、およびプログラム |
CN113176979B (zh) * | 2021-05-24 | 2022-11-04 | 深圳赛安特技术服务有限公司 | 应用程序异常监控方法、装置、计算机设备及存储介质 |
CN113673528B (zh) * | 2021-08-06 | 2024-02-09 | Oppo广东移动通信有限公司 | 文本处理方法、装置、电子设备和可读存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57137976A (en) * | 1981-02-18 | 1982-08-25 | Nec Corp | Zip code discriminating device |
JP4393161B2 (ja) * | 2003-11-20 | 2010-01-06 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
JP4757001B2 (ja) * | 2005-11-25 | 2011-08-24 | キヤノン株式会社 | 画像処理装置、画像処理方法 |
JP2007233913A (ja) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
JP4733577B2 (ja) * | 2006-07-12 | 2011-07-27 | 日立コンピュータ機器株式会社 | 帳票認識装置及び帳票認識プログラム |
JP4590433B2 (ja) * | 2007-06-29 | 2010-12-01 | キヤノン株式会社 | 画像処理装置、画像処理方法、コンピュータプログラム |
JP5621169B2 (ja) | 2010-05-26 | 2014-11-05 | 日立オムロンターミナルソリューションズ株式会社 | 帳票認識装置および帳票認識方法 |
JP5906843B2 (ja) * | 2012-03-14 | 2016-04-20 | オムロン株式会社 | キーワード検出装置、その制御方法および制御プログラム、並びに表示機器 |
JP6003705B2 (ja) * | 2013-02-14 | 2016-10-05 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
JP6463066B2 (ja) * | 2014-07-07 | 2019-01-30 | キヤノン株式会社 | 情報処理装置、情報処理方法、プログラム |
-
2016
- 2016-09-27 JP JP2016188375A patent/JP6900164B2/ja active Active
-
2017
- 2017-09-18 US US15/707,822 patent/US10740899B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018055255A (ja) | 2018-04-05 |
US20180089835A1 (en) | 2018-03-29 |
US10740899B2 (en) | 2020-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JPH10116316A (ja) | 文字認識方法及び装置 | |
JP3943638B2 (ja) | Ocrを利用しない文書画像中のドロップワードの自動認識方法 | |
JPH09179937A (ja) | 文書画像のセンテンスの境界の自動識別方法 | |
JP4785655B2 (ja) | 文書処理装置及び文書処理方法 | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
RU2581786C1 (ru) | Определение преобразований изображения для повышения качества оптического распознавания символов | |
US10984277B2 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
KR102094234B1 (ko) | 지폐 일련번호 인식 장치 및 방법 | |
JP6247103B2 (ja) | 帳票項目認識方法、帳票項目認識装置及び帳票項目認識プログラム | |
JP2898562B2 (ja) | ナンバープレート決定方法 | |
JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2008028716A (ja) | 画像処理方法及び装置 | |
JP2003091730A (ja) | 画像照合装置、画像照合方法および画像照合プログラム | |
JP6624120B2 (ja) | 文字認識装置、文字認識方法、文字認識プログラム、及び文字認識プログラムを記録したコンピューター読み取り可能な記録媒体 | |
JP5414631B2 (ja) | 文字列探索方法、文字列探索装置、記録媒体 | |
JP2020047138A (ja) | 情報処理装置 | |
JP4221960B2 (ja) | 帳票識別装置及びその識別方法 | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム | |
JP4328511B2 (ja) | パターン認識装置、パターン認識方法、プログラムおよび記憶媒体 | |
JP6941331B2 (ja) | 画像認識システム | |
JP5213338B2 (ja) | 文字認識装置、文字認識方法、コンピュータプログラム | |
EP4036871A1 (en) | Image processing apparatus, image processing method, program and storage medium | |
JP3157530B2 (ja) | 文字切り出し方法 | |
JP2007026320A (ja) | テンプレートマッチング方法及びそれを用いた画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190920 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190920 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201022 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201216 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210126 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210301 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210518 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210616 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6900164 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |