JP2020052571A - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP2020052571A JP2020052571A JP2018179373A JP2018179373A JP2020052571A JP 2020052571 A JP2020052571 A JP 2020052571A JP 2018179373 A JP2018179373 A JP 2018179373A JP 2018179373 A JP2018179373 A JP 2018179373A JP 2020052571 A JP2020052571 A JP 2020052571A
- Authority
- JP
- Japan
- Prior art keywords
- confirmation
- recognition
- unit
- necessity
- determined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19167—Active pattern learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/416—Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/06—Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00244—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Databases & Information Systems (AREA)
- Computer Graphics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Geometry (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
図1に示すように、本実施形態に係る情報処理システム90は、サーバ装置10と、確認者用端末装置40A、40B、・・・と、画像読取装置50と、管理者用端末装置60と、を備えている。なお、サーバ装置10は、情報処理装置の一例である。
図2に示すように、本実施形態に係るサーバ装置10は、制御部12と、記憶部14と、表示部16と、操作部18と、通信部20と、を備えている。
図3に示すように、本実施形態に係るサーバ装置10のCPU12Aは、確認制御部30として機能する。なお、確認制御部30は、取得部、設定部、決定部、認識部、及び表示制御部の各々の一例である。また、本実施形態では、文書の一例として帳票を適用し、更に、文書の領域の一例として帳票の項目を適用した場合について説明する。
図4に示すように、本実施形態に係る帳票画像に含まれる項目には、枠線の画像と、文字又は図の画像とが含まれる。なお、ここでいう枠線も、図の一例である。
図5に示すように、本実施形態に係るサーバ装置10は、認識設定部210、認識処理部220、確認処理実施判定部230、確認処理部240、最終確認処理部250、及び認識結果出力部260を備えている。これらの各部は、図3に示す確認制御部30を具体的に示したものである。
図6に示す帳票定義画面62は、管理者用端末装置60に表示され、システム管理者SEにより確認方式情報の入力を受け付けるための画面である。
図7に示す帳票定義画面62は、上述の図6と同様に、管理者用端末装置60に表示され、システム管理者SEにより確認方式情報の入力を受け付けるための画面である。
・文字列内の各文字についての確信度の最小値を文字列の確信度とする。
・文字列内の各文字についての確信度の平均値(最頻値、中央値等)を文字列の確信度とする。
図8に示す必要度合いテーブル14Bでは、複数の項目の各々に対応付けて、システム管理者SE等のユーザにより予め定められた必要度合いが登録されている。
なお、確認作業画面42とは、電子化された文書の一例である帳票内に含まれる文字の認識結果を確認したり訂正したりする作業及び帳票内に含まれる図を確認する作業を行う際に、確認者に対して表示する画面である。
図11に示す確認作業画面42は、確認方式毎の判定結果一覧42Cを含んでいる。なお、図11に示す例では、プレビュー画像42Aの図示を省略している。
12 制御部
12A CPU
12B ROM
12C RAM
12D I/O
14 記憶部
14A 確認処理プログラム
14B 必要度合いテーブル
14C 認識枠情報
16 表示部
18 操作部
20 通信部
30 確認制御部
40、40A、40B 確認者用端末装置
50 画像読取装置
60 管理者用端末装置
90 情報処理システム
210 認識設定部
220 認識処理部
230 確認処理実施判定部
240 確認処理部
250 最終確認処理部
260 認識結果出力部
Claims (8)
- 一文書内に複数の領域を含む文書を電子化したデータである画像データを取得する取得部と、
前記画像データの前記領域内に含まれる文字又は図の確認作業の必要度合いに基づいて、前記領域毎に判断基準を設定する設定部と、
前記判断基準に基づいて前記領域毎に前記確認作業の方式を決定する決定部と、
を備えた情報処理装置。 - 前記必要度合いは、前記一文書内における前記領域毎に対して予め定められた属性情報に基づいて決められる請求項1に記載の情報処理装置。
- 前記領域内に含まれる文字又は図を認識する認識部を更に備え、
前記必要度合いは、前記認識部による認識結果に基づいて決められる請求項1に記載の情報処理装置。 - 前記必要度合いは、前記認識結果に基づき、前記文字又は図の態様が重要であると判定された場合に高く決められる請求項3に記載の情報処理装置。
- 前記必要度合いは、前記認識結果に基づき、前記文字の属性が重要であると判定された場合に高く決められる請求項3に記載の情報処理装置。
- 前記確認作業を行う画面を表示する制御を行う表示制御部を更に備え、
前記表示制御部は、前記認識部による認識結果を前記必要度合いに従って分類して表示する制御を行う請求項3〜5のいずれか1項に記載の情報処理装置。 - 前記判断基準は、前記画像データに含まれる文字の認識結果の確からしさを示す値である確信度と閾値との比較により定められるものであり、
前記設定部は、前記必要度合いに基づいて、前記領域毎に異なる前記閾値を設定する請求項1〜6のいずれか1項に記載の情報処理装置。 - コンピュータを、請求項1〜7のいずれか1項に記載の情報処理装置が備える各部として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018179373A JP7263721B2 (ja) | 2018-09-25 | 2018-09-25 | 情報処理装置及びプログラム |
US16/260,146 US10867168B2 (en) | 2018-09-25 | 2019-01-29 | Information processing apparatus and non-transitory computer readable medium storing program |
CN201910163315.0A CN110942068B (zh) | 2018-09-25 | 2019-03-05 | 信息处理装置、存储介质及信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018179373A JP7263721B2 (ja) | 2018-09-25 | 2018-09-25 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020052571A true JP2020052571A (ja) | 2020-04-02 |
JP7263721B2 JP7263721B2 (ja) | 2023-04-25 |
Family
ID=69884923
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018179373A Active JP7263721B2 (ja) | 2018-09-25 | 2018-09-25 | 情報処理装置及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10867168B2 (ja) |
JP (1) | JP7263721B2 (ja) |
CN (1) | CN110942068B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7243409B2 (ja) * | 2019-04-17 | 2023-03-22 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002046988A1 (fr) * | 2000-12-08 | 2002-06-13 | Fujitsu Limited | Dispositif de transaction automatique et systeme de transaction automatique |
JP2016162211A (ja) * | 2015-03-02 | 2016-09-05 | 大日本印刷株式会社 | 情報処理装置、制御方法及びプログラム |
JP2016212812A (ja) * | 2015-05-14 | 2016-12-15 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2991779B2 (ja) * | 1990-06-11 | 1999-12-20 | 株式会社リコー | 文字認識方法及び装置 |
JP3427692B2 (ja) * | 1996-11-20 | 2003-07-22 | 松下電器産業株式会社 | 文字認識方法および文字認識装置 |
JP3435374B2 (ja) * | 1999-10-04 | 2003-08-11 | 沖電気工業株式会社 | 文字読取装置および文字認識方法 |
JP4655335B2 (ja) * | 2000-06-20 | 2011-03-23 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 |
DE50009493D1 (de) * | 2000-10-26 | 2005-03-17 | Mathias Wettstein | Verfahren zur Erfassung des vollständigen Datensatzes mit Schriftzeichen versehener Formulare |
AU2002230484A1 (en) * | 2000-11-16 | 2002-05-27 | Interlegis, Inc. | System and method of managing documents |
JP2006276911A (ja) * | 2005-03-25 | 2006-10-12 | Fuji Xerox Co Ltd | 電子機器およびプログラム |
JP4992550B2 (ja) * | 2007-05-30 | 2012-08-08 | 富士ゼロックス株式会社 | 情報処理プログラム及び情報処理システム |
CN101515325B (zh) * | 2009-04-08 | 2012-05-23 | 北京邮电大学 | 基于字符切分和颜色聚类的数字视频中的字符提取方法 |
JP5455456B2 (ja) * | 2009-06-09 | 2014-03-26 | キヤノン株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP5561856B2 (ja) * | 2010-05-24 | 2014-07-30 | 株式会社Pfu | 帳票作成装置、帳票作成プログラム、および帳票作成方法 |
JP5339308B2 (ja) * | 2010-08-16 | 2013-11-13 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム及び記録媒体。 |
JP5721539B2 (ja) * | 2011-05-30 | 2015-05-20 | 沖電気工業株式会社 | サーバ、情報処理方法および情報処理システム |
JP2012194879A (ja) * | 2011-03-17 | 2012-10-11 | Pfu Ltd | 情報処理装置、情報処理方法及びプログラム |
JP5597330B2 (ja) * | 2011-08-26 | 2014-10-01 | 京セラドキュメントソリューションズ株式会社 | マーク検出装置 |
JP6903966B2 (ja) * | 2017-03-16 | 2021-07-14 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム及びプログラム |
US11373388B2 (en) * | 2017-07-24 | 2022-06-28 | United States Postal Service | Persistent feature based image rotation and candidate region of interest |
JP7225548B2 (ja) * | 2018-03-22 | 2023-02-21 | セイコーエプソン株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
-
2018
- 2018-09-25 JP JP2018179373A patent/JP7263721B2/ja active Active
-
2019
- 2019-01-29 US US16/260,146 patent/US10867168B2/en active Active
- 2019-03-05 CN CN201910163315.0A patent/CN110942068B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002046988A1 (fr) * | 2000-12-08 | 2002-06-13 | Fujitsu Limited | Dispositif de transaction automatique et systeme de transaction automatique |
JP2016162211A (ja) * | 2015-03-02 | 2016-09-05 | 大日本印刷株式会社 | 情報処理装置、制御方法及びプログラム |
JP2016212812A (ja) * | 2015-05-14 | 2016-12-15 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Non-Patent Citations (1)
Title |
---|
幸田 一輝 他2名: "講義映像配信システムにおける講義映像と資料の対応", 電気学会研究会資料, JPN6022039147, 12 August 2007 (2007-08-12), pages 1 - 5, ISSN: 0004876487 * |
Also Published As
Publication number | Publication date |
---|---|
JP7263721B2 (ja) | 2023-04-25 |
US10867168B2 (en) | 2020-12-15 |
CN110942068B (zh) | 2024-01-23 |
CN110942068A (zh) | 2020-03-31 |
US20200097712A1 (en) | 2020-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7206729B2 (ja) | 情報処理装置及びプログラム | |
US10185701B2 (en) | Unsupported character code detection mechanism | |
US10395131B2 (en) | Apparatus, method and non-transitory storage medium for changing position coordinates of a character area stored in association with a character recognition result | |
US10706581B2 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
US11200450B2 (en) | Information processing apparatus and non-transitory computer readable medium for selecting a proper version of a recognition dictionary that is not necessarily a latest version | |
JP2020052570A (ja) | 情報処理装置及びプログラム | |
KR102282025B1 (ko) | 컴퓨터를 이용한 문서 분류 및 문자 추출 방법 | |
JP2020052571A (ja) | 情報処理装置及びプログラム | |
US20200311408A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2020087112A (ja) | 帳票処理装置および帳票処理方法 | |
US20210042555A1 (en) | Information Processing Apparatus and Table Recognition Method | |
JP7268316B2 (ja) | 情報処理装置及びプログラム | |
JP2021111157A (ja) | 情報処理装置、及び情報処理プログラム | |
JP7268311B2 (ja) | 情報処理装置及びプログラム | |
JP7226136B2 (ja) | 情報処理装置及びプログラム | |
JP2021034778A (ja) | 情報処理装置及び情報処理プログラム | |
US20220198190A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20210064815A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
US10609246B1 (en) | System and method for ascertaining and printing supplemental forms identified from content of a scanned base form | |
US20220198183A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN110909723B (zh) | 信息处理装置及计算机可读存储介质 | |
WO2024057589A1 (ja) | 修正提案方法、修正提案システム、及び修正提案プログラム | |
JP2021033855A (ja) | 情報処理装置及び情報処理プログラム | |
US20210056301A1 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
JP6003677B2 (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210906 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220907 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230327 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7263721 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |