JP2020052571A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2020052571A
JP2020052571A JP2018179373A JP2018179373A JP2020052571A JP 2020052571 A JP2020052571 A JP 2020052571A JP 2018179373 A JP2018179373 A JP 2018179373A JP 2018179373 A JP2018179373 A JP 2018179373A JP 2020052571 A JP2020052571 A JP 2020052571A
Authority
JP
Japan
Prior art keywords
confirmation
recognition
unit
necessity
determined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018179373A
Other languages
English (en)
Other versions
JP7263721B2 (ja
Inventor
晋太郎 西岡
Shintaro Nishioka
晋太郎 西岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2018179373A priority Critical patent/JP7263721B2/ja
Priority to US16/260,146 priority patent/US10867168B2/en
Priority to CN201910163315.0A priority patent/CN110942068B/zh
Publication of JP2020052571A publication Critical patent/JP2020052571A/ja
Application granted granted Critical
Publication of JP7263721B2 publication Critical patent/JP7263721B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19167Active pattern learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Graphics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Geometry (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】一文書内に確認作業の必要性の度合いが異なる複数の領域が混在しているにも係わらず、全ての領域に対して同一の判断基準を用いて確認作業の方式を決定する場合と比較して、領域毎に異なる判断基準を用いて確認作業の方式を適切に決定することができる情報処理装置及びプログラムを提供する。【解決手段】サーバ装置10は、一帳票内に複数の項目を含む帳票を電子化したデータである画像データを取得し、画像データの項目内に含まれる文字又は図の確認作業の必要度合いに基づいて、項目毎に判断基準を設定し、判断基準に基づいて項目毎に確認作業の方式を決定する確認制御部30を備える。【選択図】図3

Description

本発明は、情報処理装置及びプログラムに関する。
例えば、特許文献1には、文書を電子化した画像データに含まれる文字の認識結果の確からしさを示す値である確信度と予め定めた確信度の閾値により、前記画像データ内に含まれる文字の認識結果を確認したり訂正したりする作業及び前記画像データ内に含まれる図を確認する作業である確認作業の方式を決定する技術が開示されている。
特開2016−212812号公報
ところで、一文書内に確認作業の必要性の度合い(以下、「必要度合い」とする。)が異なる複数の領域が混在している場合に、全ての領域に対して同一の判断基準を用いて確認作業の方式を決定すると、上記判断基準の設定次第では、確認作業の必要性が比較的高い領域に対して確認作業が実施されなかったり、確認作業の必要性が比較的低い領域に対して確認作業が実施されたりする懸念がある。
本発明は、一文書内に確認作業の必要性の度合いが異なる複数の領域が混在しているにも係わらず、全ての領域に対して同一の判断基準を用いて確認作業の方式を決定する場合と比較して、領域毎に異なる判断基準を用いて確認作業の方式を適切に決定することができる情報処理装置及びプログラムを提供することを目的とする。
上記目的を達成するために、請求項1に記載の情報処理装置は、一文書内に複数の領域を含む文書を電子化したデータである画像データを取得する取得部と、前記画像データの前記領域内に含まれる文字又は図の確認作業の必要度合いに基づいて、前記領域毎に判断基準を設定する設定部と、前記判断基準に基づいて前記領域毎に前記確認作業の方式を決定する決定部と、を備えている。
また、請求項2に記載の情報処理装置は、請求項1に記載の発明において、前記必要度合いが、前記一文書内における前記領域毎に対して予め定められた属性情報に基づいて決められる。
また、請求項3に記載の情報処理装置は、請求項1に記載の発明において、前記領域内に含まれる文字又は図を認識する認識部を更に備え、前記必要度合いが、前記認識部による認識結果に基づいて決められる。
また、請求項4に記載の情報処理装置は、請求項3に記載の発明において、前記必要度合いが、前記認識結果に基づき、前記文字又は図の態様が重要であると判定された場合に高く決められる。
また、請求項5に記載の情報処理装置は、請求項3に記載の発明において、前記必要度合いが、前記認識結果に基づき、前記文字の属性が重要であると判定された場合に高く決められる。
また、請求項6に記載の情報処理装置は、請求項3〜5のいずれか1項に記載の発明において、前記確認作業を行う画面を表示する制御を行う表示制御部を更に備え、前記表示制御部が、前記認識部による認識結果を前記必要度合いに従って分類して表示する制御を行う。
また、請求項7に記載の情報処理装置は、請求項1〜6のいずれか1項に記載の発明において、前記判断基準が、前記画像データに含まれる文字の認識結果の確からしさを示す値である確信度と閾値との比較により定められるものであり、前記設定部が、前記必要度合いに基づいて、前記領域毎に異なる前記閾値を設定する。
更に、上記目的を達成するために、請求項8に記載のプログラムは、コンピュータを、請求項1〜7のいずれか1項に記載の情報処理装置が備える各部として機能させる。
請求項1及び請求項8に係る発明によれば、一文書内に確認作業の必要性の度合いが異なる複数の領域が混在しているにも係わらず、全ての領域に対して同一の判断基準を用いて確認作業の方式を決定する場合と比較して、領域毎に異なる判断基準を用いて確認作業の方式を適切に決定することができる。
請求項2に係る発明によれば、必要度合いとして属性情報を考慮しない場合と比較して、より適切な方式で確認作業を実施することができる。
請求項3に係る発明によれば、必要度合いとして認識結果を考慮しない場合と比較して、より適切な方式で確認作業を実施することができる。
請求項4に係る発明によれば、文字又は図の態様が重要であるか否かを考慮しない場合と比較して、必要度合いを適切に決めることができる。
請求項5に係る発明によれば、文字の属性が重要であるか否かを考慮しない場合と比較して、必要度合いを適切に決めることができる。
請求項6に係る発明によれば、認識結果を必要度合いに従って分類して表示しない場合と比較して、認識結果を一見して把握することができる。
請求項7に係る発明によれば、領域毎に確信度の閾値を同一にする場合と比較して、判断基準を適切に設定することができる。
実施形態に係る情報処理システムの構成の一例を示す図である。 実施形態に係るサーバ装置の電気的な構成の一例を示すブロック図である。 実施形態に係るサーバ装置の機能的な構成の一例を示すブロック図である。 実施形態に係る項目、枠、及び文字との関係の説明に供する図である。 実施形態に係るサーバ装置の具体的な構成の一例を示すブロック図である。 実施形態に係る帳票定義画面の一例を示す正面図である。 実施形態に係る帳票定義画面の他の例を示す正面図である。 実施形態に係る必要度合いテーブルの一例を示す図である。 実施形態に係る確認処理プログラムによる確認判定処理の流れの一例を示すフローチャートである。 実施形態に係る確認作業画面の一例を示す正面図である。 実施形態に係る確認作業画面の他の例を示す部分図である。 実施形態に係る確認処理プログラムによる認識設定処理の流れの一例を示すフローチャートである。
以下、図面を参照して、本発明を実施するための形態の一例について詳細に説明する。
図1は、本実施形態に係る情報処理システム90の構成の一例を示す図である。
図1に示すように、本実施形態に係る情報処理システム90は、サーバ装置10と、確認者用端末装置40A、40B、・・・と、画像読取装置50と、管理者用端末装置60と、を備えている。なお、サーバ装置10は、情報処理装置の一例である。
サーバ装置10は、ネットワークNを介して、確認者用端末装置40A、40B、・・・、画像読取装置50、及び管理者用端末装置60の各々と通信可能に接続されている。このサーバ装置10には、一例として、サーバコンピュータや、パーソナルコンピュータ(PC:Personal Computer)等の汎用的なコンピュータが適用される。また、このネットワークNには、一例として、インターネットや、LAN(Local Area Network)、WAN(Wide Area Network)等が適用される。
画像読取装置50は、紙媒体の帳票等を光学的に読み取って画像データを取得し、取得した画像データ(以下、「帳票画像」という。)をサーバ装置10に送信する機能を備えている。なお、ここでいう帳票としては、例えば、住所欄や氏名欄等の複数の項目を含む各種の帳票が用いられる。この帳票には、これら複数の項目の各々について手書き文字や、印刷文字等が記入される。なお、帳票は、文書の一例であり、項目は、領域の一例である。サーバ装置10は、具体的には後述するように、画像読取装置50から受信した帳票画像に対して、光学的文字認識処理の一例であるOCR(Optical Character Recognition)処理を行い、複数の項目の各々に対応する画像についての認識結果を取得する。なお、この認識結果には、一例として、1文字以上の文字の連なりを示す文字列等が含まれる。以下、サーバ装置10により手書き文字又は印刷文字等を光学的に読み取って得られた画像を、「認識対象画像」ともいう。なお、本実施形態に係る認識結果とは、OCR処理による認識結果に限定されず、後述するように、文字又は図の態様の認識結果や、文字の属性の認識結果を含むものとする。また、ここでいう図とは、帳票画像のうち、文字認識の対象ではない要素全般を含み、一例として、線や、捺印、ロゴ、写真等を含むものとする。
確認者用端末装置40Aは、確認作業を行う確認者(ユーザ)U1が操作する端末装置であり、確認者用端末装置40Bは、確認作業を行う確認者U2が操作する端末装置である。これら複数の確認者用端末装置40A、40B、・・・を区別して説明する必要がない場合には、確認者用端末装置40A、40B、・・・を総称して確認者用端末装置40ともいう。また、これら複数の確認者U1、U2、・・・を区別して説明する必要がない場合には、確認者U1、U2、・・・を総称して確認者Uともいう。この確認者用端末装置40には、一例として、パーソナルコンピュータ(PC)等の汎用的なコンピュータや、スマートフォン、タブレット端末等の携帯可能な端末装置等が適用される。なお、確認者用端末装置40には、確認者Uが確認作業を行うための確認作業アプリケーション・プログラム(以下、「確認作業アプリ」ともいう。)がインストールされており、確認作業用のUI(User Interface)画面を生成して表示する。
なお、上記の確認作業とは、帳票画像内に含まれる文字の認識結果を確認したり訂正したりする作業や、帳票画像内に含まれる図を確認する作業等を意味する。具体的に、文字の認識結果を確認する作業とは、一例として、OCRによる認識結果に対する承認を行う作業である。文字の認識結果を訂正する作業とは、後述の確認作業画面における訂正入力欄への入力を行う作業である。図を確認する作業とは、一例として、捺印の有無等を確認する作業である。
管理者用端末装置60は、システム管理者SEが操作する端末装置であり、システム管理者SEにより後述する確認方式情報等が入力される。この管理者用端末装置60には、一例として、パーソナルコンピュータ(PC)等の汎用的なコンピュータや、スマートフォン、タブレット端末等の携帯可能な端末装置等が適用される。
図2は、本実施形態に係るサーバ装置10の電気的な構成の一例を示すブロック図である。
図2に示すように、本実施形態に係るサーバ装置10は、制御部12と、記憶部14と、表示部16と、操作部18と、通信部20と、を備えている。
制御部12は、CPU(Central Processing Unit)12A、ROM(Read Only Memory)12B、RAM(Random Access Memory)12C、及び入出力インターフェース(I/O)12Dを備えており、これら各部がバスを介して各々接続されている。
I/O12Dには、記憶部14と、表示部16と、操作部18と、通信部20と、を含む各機能部が接続されている。これらの各機能部は、I/O12Dを介して、CPU12Aと相互に通信可能とされる。
制御部12は、サーバ装置10の一部の動作を制御するサブ制御部として構成されてもよいし、サーバ装置10の全体の動作を制御するメイン制御部の一部として構成されてもよい。制御部12の各ブロックの一部又は全部には、例えば、LSI(Large Scale Integration)等の集積回路又はIC(Integrated Circuit)チップセットが用いられる。上記各ブロックに個別の回路を用いてもよいし、一部又は全部を集積した回路を用いてもよい。上記各ブロック同士が一体として設けられてもよいし、一部のブロックが別に設けられてもよい。また、上記各ブロックのそれぞれにおいて、その一部が別に設けられてもよい。制御部12の集積化には、LSIに限らず、専用回路又は汎用プロセッサを用いてもよい。
記憶部14としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等が用いられる。記憶部14には、本実施形態に係る確認処理を行うための確認処理プログラム14Aが記憶される。なお、この確認処理プログラム14Aは、ROM12Bに記憶されていてもよい。また、記憶部14には、確認処理に用いる必要度合いテーブル14B及び認識枠情報14Cが記憶されている。
確認処理プログラム14Aは、例えば、サーバ装置10に予めインストールされていてもよい。確認処理プログラム14Aは、不揮発性の記憶媒体に記憶して、又はネットワークNを介して配布して、サーバ装置10に適宜インストールすることで実現してもよい。なお、不揮発性の記憶媒体の例としては、CD-ROM(Compact Disc Read Only Memory)、光磁気ディスク、HDD、DVD-ROM(Digital Versatile Disc Read Only Memory)、フラッシュメモリ、メモリカード等が想定される。
表示部16には、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(Electro Luminescence)ディスプレイ等が用いられる。表示部16は、タッチパネルを一体的に有していてもよい。操作部18には、例えば、キーボードやマウス等の操作入力用のデバイスが設けられている。表示部16及び操作部18は、サーバ装置10のユーザから各種の指示を受け付ける。表示部16は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。
通信部20は、インターネットや、LAN、WAN等のネットワークNに接続されており、画像読取装置50や、確認者用端末装置40、管理者用端末装置60との間でネットワークNを介して通信が可能とされる。
ところで、上述したように、一帳票内に確認作業の必要性の度合いが異なる複数の項目が混在している場合、項目毎に適切な方式の確認作業を実施できることが望ましい。
このため、本実施形態に係るサーバ装置10のCPU12Aは、記憶部14に記憶されている確認処理プログラム14AをRAM12Cに書き込んで実行することにより、図3に示す確認制御部30として機能する。
図3は、本実施形態に係るサーバ装置10の機能的な構成の一例を示すブロック図である。
図3に示すように、本実施形態に係るサーバ装置10のCPU12Aは、確認制御部30として機能する。なお、確認制御部30は、取得部、設定部、決定部、認識部、及び表示制御部の各々の一例である。また、本実施形態では、文書の一例として帳票を適用し、更に、文書の領域の一例として帳票の項目を適用した場合について説明する。
本実施形態に係る確認制御部30は、一帳票内に複数の項目を含む帳票を電子化したデータである帳票画像を取得する。確認制御部30は、取得した帳票画像の項目内に含まれる文字又は図の確認作業の必要度合いに基づいて、項目毎に判断基準を設定する。確認制御部30は、設定した判断基準に基づいて項目毎に確認作業の方式(以下、「確認方式」ともいう。)を決定する制御を行う。この必要度合いは、一例として、一帳票内における項目毎に対して予め定められた属性情報に基づいて決められる。この属性情報は、例えば、認識枠情報14Cに含まれており、一例として、上述の確認方式情報として示される。この場合、確認制御部30は、この認識枠情報14Cに含まれる確認方式情報に基づいて、確認方式を決定する制御を行う。なお、認識枠情報14Cとは、帳票画像内の各項目に対して、枠に関する情報を対応付けたものであり、後述するように、一例として、枠の種類、枠の名前、枠の座標、文字種、確信度の閾値、及び確認方式等を含んでいる。
具体的に、確認制御部30は、項目毎の枠に関する認識枠情報14Cを取得する。この認識枠情報14Cは、上述の確認方式情報を項目の属性情報として含んでいる。この確認方式情報は、項目毎に確認方式を判断基準として設定するための情報である。確認方式には、一例として、1人の確認者で確認作業を行う方式(以下、「シングルエントリ方式」ともいう。)、及び、複数人の確認者で確認作業を行う方式(以下、「ダブルエントリ方式」ともいう。)が含まれる。なお、確認方式としては、1人以上の確認者による確認作業が必須とされる方式(以下、「必須方式」ともいう。)、及び、確認者による確認作業が不要とされる方式(以下、「不要方式」ともいう。)を含むようにしてもよい。この必須方式では、一例として、後述する確信度が閾値以上である場合に、シングルエントリ方式が選択され、確信度が閾値未満である場合に、ダブルエントリ方式が選択されるようにしてもよい。また、不要方式では、OCR処理による認識結果がそのまま最終結果として採用される。
また、上述の確認方式情報は、枠の属性(一例として、氏名欄、住所欄等。)とは関係なく、項目毎の枠の位置(本実施形態では座標で示される。)に確認方式が対応付けられていてもよい。この場合、一例として、ある重要な項目の枠の位置についてはダブルエントリ方式を予め対応付けておく等すればよい。
また、上述の認識枠情報14Cに確認方式が予め設定されていない場合、項目内に含まれる文字又は図の認識結果を利用するようにしてもよい。この場合、上述の必要度合いは、この文字又は図の認識結果に基づいて決められる。本実施形態に係る認識結果とは、上述したように、OCR処理による認識結果、文字又は図の態様の認識結果、及び文字の属性の認識結果を含むものとする。例えば、OCR処理で認識された「神奈川県」という文字を含む枠の位置に「住所」という項目が対応付けられている場合、この「神奈川県」は、「住所」という項目に属すると判定される。なお、枠の位置は、認識枠情報14Cから取得される。この場合、「住所」という項目は重要と判定され、必要度合いが高く設定される。ここでいう「高く」とは、文字又は図の認識結果が重要でないと判定された場合の必要度合いと比較して高いことを意味する。この場合、判断基準の一例として、上述のシングルエントリ方式、ダブルエントリ方式、及び必須方式のいずれかが設定される。
図4は、本実施形態に係る項目、枠、及び文字との関係の説明に供する図である。
図4に示すように、本実施形態に係る帳票画像に含まれる項目には、枠線の画像と、文字又は図の画像とが含まれる。なお、ここでいう枠線も、図の一例である。
この場合、上述の必要度合いは、認識結果に基づき、文字又は図の態様が重要であると判定された場合に高く決められる。ここでいう「高く」とは、文字又は図の態様が重要でないと判定された場合の必要度合いと比較して高いことを意味する。文字の態様としては、一例として、文字の色や文字の太さ等が適用され、図の態様としては、一例として、図の色等が適用される。例えば、文字の色が赤色である場合や、図の一例である枠の色が赤色である場合に、その項目は重要な項目と判定され、必要度合いが高く設定される。この場合、判断基準の一例として、上述のシングルエントリ方式、ダブルエントリ方式、及び必須方式のいずれかが設定される。
一方、上述の必要度合いは、認識結果に基づき、文字の属性が重要であると判定された場合に高く決めるようにしてもよい。ここでいう「高く」とは、文字の属性が重要でないと判定された場合の必要度合いと比較して高いことを意味する。文字の属性としては、一例として、氏名属性や住所属性等が適用される。例えば、認識した文字の属性が氏名属性である場合に、その項目は重要な項目と判定され、必要度合いが高く設定される。この場合、判断基準の一例として、上述のシングルエントリ方式、ダブルエントリ方式、及び必須方式のいずれかが設定される。
また、確認制御部30は、一例として、後述の図10、図11に示すように、確認作業を行う画面を表示する制御を行うようにしてもよい。この場合、確認制御部30は、一例として、後述の図11に示すように、認識結果を必要度合いに従って分類して表示する制御を行うようにしてもよい。
また、上述の判断基準を、確認方式そのものではなく、帳票画像に含まれる文字の確信度と閾値との比較により定めるようにしてもよい。一例として、確信度が閾値以上であれば、確認作業が不要と判定され、確信度が閾値未満であれば、確認作業が必要と判定される。この場合、確認制御部30は、上述の必要度合いに基づいて、項目毎に異なる閾値を設定する。一例として、必要度合いが一定以上で高い場合、確信度の閾値を高く(厳しく)し、必要度合いが一定未満で低い場合、確信度の閾値を低く(緩く)する。
また、確認制御部30は、項目についての文字の属性が重要であると判定された場合に、項目についての確認方式が確認の必要な方式であることを表示させる制御を行うようにしてもよい。具体的には、項目毎に重要であるか否かを示すフラグを予め設定しておく方法が考えられる。例えば、「住所」という属性に対して重要であることを示すフラグが設定されていれば、「神奈川県」という文字の属性である「住所」は、重要と判定される。なお、ここでいう「確認の必要な方式」には、一例として、上述のシングルエントリ方式、ダブルエントリ方式、及び必須方式が含まれる。
また、確認制御部30は、項目についての確信度が閾値未満である場合に、項目についての確認方式が確認の必要な方式であることを表示させる制御を行うようにしてもよい。これらの表示の具体的な形態については後述する。
次に、図5を参照して、本実施形態に係るサーバ装置10の具体的な構成について説明する。
図5は、本実施形態に係るサーバ装置10の具体的な構成の一例を示すブロック図である。
図5に示すように、本実施形態に係るサーバ装置10は、認識設定部210、認識処理部220、確認処理実施判定部230、確認処理部240、最終確認処理部250、及び認識結果出力部260を備えている。これらの各部は、図3に示す確認制御部30を具体的に示したものである。
本実施形態に係る認識設定部210は、未記入帳票の帳票画像を入力として、認識設定を行う。認識設定部210は、例えば、図6に示す帳票定義画面62を、管理者用端末装置60に表示させて、確認方式情報の設定を行う。
図6は、本実施形態に係る帳票定義画面62の一例を示す正面図である。
図6に示す帳票定義画面62は、管理者用端末装置60に表示され、システム管理者SEにより確認方式情報の入力を受け付けるための画面である。
図6に示す帳票定義画面62は、未記入帳票のプレビュー画像62Aと、認識枠情報62Cとを含んでいる。この認識枠情報62Cは、一例として、枠の種類、枠の名前、枠の座標、文字種、確信度の閾値、及び確認方式を含み、認識枠情報14Cの一部として記憶部14に記憶される。図6に示す例では、「18歳以下の扶養している児童の氏名」に関する認識枠情報62Cが表示されている。この確認方式は、選択されている状態の設定内容(図6に示す例では「シングルエントリ」、「ダブルエントリ」、「必須」、「不要」、「設定なし」のうち「シングルエントリ」が選択されている。)がハイライト表示される。また、これらの設定内容は、ドロップダウンリストで選択可能に表示され、選択された設定内容が確認方式情報として入力される。
図6に示す例において、「シングルエントリ」、「ダブルエントリ」、及び「必須」は、確認の必要な方式の一例である。なお、「シングルエントリ」は、シングルエントリ方式を示し、「ダブルエントリ」は、ダブルエントリ方式を示している。また、「必須」は、必須方式を示し、「不要」は、不要方式を示している。
図7は、本実施形態に係る帳票定義画面62の他の例を示す正面図である。
図7に示す帳票定義画面62は、上述の図6と同様に、管理者用端末装置60に表示され、システム管理者SEにより確認方式情報の入力を受け付けるための画面である。
図7に示す帳票定義画面62は、未記入帳票のプレビュー画像62Aと、認識枠情報62Dとを含んでいる。この認識枠情報62Dは、一例として、枠の種類、枠の名前、枠の座標、文字種、確信度の閾値、及び確認方式を含み、認識枠情報14Cの一部として記憶部14に記憶される。図7に示す例では、「受給者氏名」に関する認識枠情報62Dが表示されている。この確認方式は、選択されている状態の設定内容(図7に示す例では「シングルエントリ」、「ダブルエントリ」、「必須」、「不要」、「設定なし」のうち「設定なし」が選択されている。)が表示される。また、これらの設定内容は、ドロップダウンリストで選択可能に表示され、選択された設定内容が確認方式情報として入力される。
なお、この「設定なし」は、確信度とその閾値とを比較した結果に基づいて、「不要」、「シングルエントリ」、及び「ダブルエントリ」のいずれかが選択される方式である。この「設定なし」では、一例として、確信度が閾値未満である場合に「シングルエントリ」が選択され、確信度が閾値以上である場合に「不要」が選択される。あるいは、確信度が閾値未満である場合に「ダブルエントリ」が選択され、確信度が閾値以上である場合に「不要」が選択されるようにしてもよい。あるいは、確信度が閾値未満である場合に「ダブルエントリ」が選択され、確信度が閾値以上である場合に「シングルエントリ」が選択されるようにしてもよい。
すなわち、認識設定部210は、認識枠情報14Cの一部として、項目についての確認作業の確認方式を選択的に受け付けるための入力画面の一例である帳票定義画面62を、管理者用端末装置60に表示させる制御を行う。認識設定部210は、帳票定義画面62を介して入力を受け付けた確認方式情報を、一例として、認識枠情報14Cの一部として記憶部14に記憶する。
次に、本実施形態に係る認識処理部220は、記入済帳票の帳票画像を入力として、認識対象画像を受け付け、認識対象画像の認識結果及びその確信度を出力する。認識処理部220は、認識設定部210による設定内容に基づいて、受け付けた認識対象画像に対してOCR処理を行い、文字列等の認識結果を得る。なお、文字列等の認識方法としては、文字列等の認識結果、及び、その確信度を出力する公知の技術を用いればよい。この確信度とは、上述したように、文字列等の確からしさを示す指標であり、確信度の値が高いほど、認識対象画像とその文字列等とが一致する確率が高いことを示している。この確信度の導出方法としては、例えば、特開2016−212812号公報(特許文献1)等に記載の公知の技術を用いればよい。なお、これらの中で、各文字に対する確信度を用いるものがあるが、文字毎の確信度を文字列の確信度に変換する手法としては、下記に示す様々な手法の中から適切なものを選択すればよい。
・文字列内の各文字についての確信度の最大値を文字列の確信度とする。
・文字列内の各文字についての確信度の最小値を文字列の確信度とする。
・文字列内の各文字についての確信度の平均値(最頻値、中央値等)を文字列の確信度とする。
なお、認識処理部220は、上述のOCR処理による認識処理以外にも、文字又は図の態様の認識処理、及び文字の属性の認識処理についても実行する。
本実施形態に係る確認処理実施判定部230は、認識処理部220から出力された認識結果及びその確信度に対して、認識枠情報14Cに含まれる確認方式情報を用いて、認識結果の確認方式を判定する。つまり、確認処理実施判定部230は、認識結果に対応する項目についての確認方式としてシングルエントリ方式が設定されている場合に、認識結果の確信度に係わらず、認識結果の確認方式をシングルエントリ方式と判定する。また、確認処理実施判定部230は、認識結果に対応する項目についての確認方式としてダブルエントリ方式が設定されている場合に、認識結果の確信度に係わらず、認識結果の確認方式をダブルエントリ方式と判定する。また、確認処理実施判定部230は、認識結果に対応する項目についての確認方式が設定なしの場合に、認識結果の確信度に基づいて、認識結果の確認方式を判定する。この場合、確認処理実施判定部230は、一例として、確信度が閾値未満である場合に、認識結果の確認方式をシングルエントリ方式又はダブルエントリ方式と判定し、確信度が閾値以上である場合に、認識結果の確認方式を不要方式と判定する。なお、判定に用いる閾値は、認識枠情報14Cから取得される。そして、確認処理実施判定部230は、判定結果を確認処理部240に出力する。
ここで、上記では、確認方式の判定を、認識枠情報14Cに含まれる確認方式情報を用いて行う場合について説明したが、確認方式の判定を、項目に対する確認作業の必要度合いに基づいて行うようにしてもよい。なお、ここでいう必要度合いとは、認識結果を確認しないことで発生するリスクの大小に応じて項目毎に定められた値である。
図8は、本実施形態に係る必要度合いテーブル14Bの一例を示す図である。
図8に示す必要度合いテーブル14Bでは、複数の項目の各々に対応付けて、システム管理者SE等のユーザにより予め定められた必要度合いが登録されている。
この場合、確認処理実施判定部230は、項目についての必要度合いを、必要度合いテーブル14Bから読み出し、読み出した必要度合いが閾値以上であれば、認識結果の確認方式を必須、つまり、1人以上の確認者で確認作業を行う方式と判定する。一方、必要度合いが閾値未満であれば、認識結果の確認方式を不要、つまり、確認者による確認作業を行わない方式と判定する。なお、必要度合いは、認識結果を確認しないことで発生するリスクが大きい項目ほど、大きな値が登録されている。例えば、図8に示す例の場合、「氏名」、「住所」、及び「認定番号」が含まれているが、「認定番号」は、間違えて認識してしまうと、修正に多大な工数を要したり、多大な損害が発生したりする可能性がある。このため、必要度合いを高くする(図8に示す例では「30」である。)。一方、「住所」は、何らかの照会があった場合に参照するだけなので、間違えて認識しても発生するリスクは小さいと考えられる。このため、必要度合いを低くする(図8に示す例では「10」である。)。
また、確認処理実施判定部230は、上述したように、項目についての必要度合いを、必要度合いテーブル14Bから読み出し、読み出した必要度合いに応じて、確信度の判定に用いる閾値を変化させ、変化させた閾値を用いて、認識結果の確認方式を判定するようにしてもよい。
本実施形態に係る確認処理部240は、確認処理実施判定部230から受け付けた判定結果に基づいて、項目毎に確認方式を切り替え、確認者Uに認識対象画像及び認識結果をフィードバックし、確認者Uに確認作業を行わせる。具体的に、確認処理部240は、認識結果の確認方式がシングルエントリ方式と判定された場合、確認作業を行うための確認画面を、1台の確認者用端末装置40に表示させ、確認画面において、確認作業の対象とする、帳票の項目を強調して表示させる。ここでいう強調には、一例として、項目の画像の色を異ならせる、項目の画像に背景色を付与する、更には、項目の画像に下線や囲み線等の飾りを付与する等が含まれる。この確認画面の具体例については後述する。また、確認処理部240は、認識結果の確認方式がダブルエントリ方式と判定された場合、確認作業を行うための確認画面を、複数台の確認者用端末装置40に表示させ、各確認画面において、確認作業の対象とする、帳票の項目を強調して表示させる。すなわち、確認処理部240は、確認作業を行うための確認画面を、確認方式毎に表示させ、確認者Uに確認作業を行わせる。そして、確認処理部240は、認識対象画像、認識結果、及び確認者Uによる確認結果を最終確認処理部250に出力する。
本実施形態に係る最終確認処理部250は、確認処理部240から受け付けた認識対象画像、認識結果、及び確認者Uによる確認結果に基づいて、確認者Uとは別の確認者Uに最終的な確認作業を行わせる。具体的に、最終確認処理部250は、最終的な確認作業を行うための確認画面を、別の確認者Uが使用する確認者用端末装置40に表示させ、別の確認者Uから最終確認結果を得る。最終確認処理部250は、別の確認者Uからの最終確認結果に基づいて、確認者Uの確認結果に誤りがある場合には、確認処理部240に差し戻し、入力された記入済帳票に不備(一例として、ページ不足等)がある場合には、認識処理部220に差し戻す。そして、最終確認処理部250は、最終的な認識結果を認識結果出力部260に出力する。
本実施形態に係る認識結果出力部260は、最終確認処理部250から受け付けた最終的な認識結果を出力する。最終的な認識結果の出力先は、特に限定されるものではないが、表示部16、確認者用端末装置40、及び管理者用端末装置60の少なくとも1つを出力先としてもよい。
次に、図9を参照して、本実施形態に係るサーバ装置10の作用を説明する。
図9は、本実施形態に係る確認処理プログラム14Aによる確認判定処理の流れの一例を示すフローチャートである。
まず、サーバ装置10に対して、記入済帳票についての確認判定処理の開始が指示されると、確認処理プログラム14Aが起動され、以下の各ステップを実行する。
図9のステップ100では、認識処理部220が、記入済帳票の入力を受け付ける。
ステップ102では、認識処理部220が、記入済帳票の項目毎の画像に対してOCR処理を行うことにより文字認識を行い、項目毎に認識結果及びその確信度を得る。
ステップ104では、確認処理実施判定部230が、一例として、予め定められた順番に従って、項目を特定する。
ステップ106では、確認処理実施判定部230が、ステップ104で特定した項目についての認識枠情報14Cを取得する。
ステップ108では、確認処理実施判定部230が、ステップ106で取得した認識枠情報14Cの「確認方式」を参照する。
ステップ110では、確認処理実施判定部230が、ステップ108で参照した「確認方式」に設定されている設定内容を判定する。「確認方式」に「シングルエントリ」が設定されている場合(「シングルエントリ」の場合)、ステップ112に移行し、「確認方式」に「ダブルエントリ」が設定されている場合(「不要」の場合)、ステップ114に移行し、「確認方式」に「設定なし」が設定されている場合(「なし」の場合)、ステップ116に移行する。
ステップ112では、確認処理実施判定部230が、上記項目に対応する画像の認識結果の確認作業の方式をシングルエントリ方式と判定し、判定結果を確認処理部240に出力する。
一方、ステップ114では、確認処理実施判定部230が、上記項目に対応する画像の認識結果の確認作業の方式をダブルエントリ方式と判定し、判定結果を確認処理部240に出力する。
一方、ステップ116では、確認処理実施判定部230が、確信度を用いて、上記項目に対応する画像の認識結果の確認作業の方式を判定し、判定結果を確認処理部240に出力する。この場合、確認処理実施判定部230は、一例として、確信度が閾値未満である場合に、認識結果の確認作業の方式をシングルエントリ方式又はダブルエントリ方式と判定し、確信度が閾値以上である場合に、認識結果の確認作業の方式を不要方式と判定する。
ステップ118では、確認処理実施判定部230が、最後の項目であるか否かを判定する。最後の項目であると判定した場合(肯定判定の場合)、本確認処理プログラム14Aによる確認判定処理を終了し、最後の項目ではないと判定した場合(否定判定の場合)、ステップ104に戻り処理を繰り返す。
次に、図10及び図11を参照して、確認者Uによる確認作業について説明する。
図10は、本実施形態に係る確認作業画面42の一例を示す正面図である。
なお、確認作業画面42とは、電子化された文書の一例である帳票内に含まれる文字の認識結果を確認したり訂正したりする作業及び帳票内に含まれる図を確認する作業を行う際に、確認者に対して表示する画面である。
図10に示す確認作業画面42は、確認者用端末装置40に表示され、確認者Uにより認識結果の確認作業を行うための画面である。図10に示す確認作業画面42は、確認作業を行う画面の一例である。
図10に示す確認作業画面42は、記入済帳票のプレビュー画像42Aと、判定結果一覧42Bとを含んでいる。判定結果一覧42Bには、プレビュー画像42Aとして表される記入済帳票について、確認方式がシングルエントリ方式と判定された項目と、確認方式が不要方式と判定された項目と、確信度を用いて確認方式が判定された項目と、が一覧で表示されている。
図10に示す例では、項目の一例として、「受給者氏名」、「受給者印」、及び「18歳以下の扶養している児童の氏名1」が表示されている。「受給者氏名」は、「確認方式」が「設定なし」に設定され、かつ、確信度が比較的大きいため確認作業が省略される。このため、対応する認識対象画像(図10に示す例では「富士太郎」である。)のみが表示されている。「受給者印」は、「確認方式」が「不要」に設定されているため確認作業が省略される。このため、対応する認識対象画像(図10に示す例では「富士」である。)のみが表示されている。「18歳以下の扶養している児童の氏名1」は、「確認方式」が「シングルエントリ」に設定されているため確認作業がシングルエントリ方式で実施される。このため、対応する認識対象画像(図10に示す例では「富士みなと」である。)、OCR処理による認識結果、及び認識結果の訂正入力欄が表示されている。なお、「18歳以下の扶養している児童の氏名1」は、確認作業の対象とされるため、項目の色を異ならせて、強調表示されている。
ここで、上述したように、項目についての文字の態様が重要であることを示す態様である場合に、項目についての確認方式が確認の必要な方式であることを表示させるようにしてもよい。これについて図10を参照して説明する。例えば、項目の一例である「住所」についての文字の態様が重要な態様として予め設定されている場合を想定する。ここでいう「文字」は一例として「神奈川県」である。この場合、「住所」についての確認方式が確認の必要な方式(一例として、上述の「シングルエントリ」、「ダブルエントリ」、及び「必須」のいずれかの方式。)であることが自動的に表示される。
また、上述したように、項目についての確信度が閾値未満である場合に、項目についての確認方式が確認の必要な方式であることを表示させる制御を行うようにしてもよい。
一方、図11に示すように、上記の確認作業画面42を確認方式毎に表示するようにしてもよい。
図11は、本実施形態に係る確認作業画面42の他の例を示す部分図である。
図11に示す確認作業画面42は、確認方式毎の判定結果一覧42Cを含んでいる。なお、図11に示す例では、プレビュー画像42Aの図示を省略している。
図11に示す判定結果一覧42Cは、タブを選択することにより確認方式毎に表示される。タブにより選択可能な確認方式は、上述したように、シングルエントリ方式、ダブルエントリ方式、必須方式、及び不要方式とされている。なお、図11に示す例では、シングルエントリ方式のタブが選択された状態を示しており、この場合、シングルエントリ方式と判定された項目が一覧で表示される。
次に、図12を参照して、本実施形態に係るサーバ装置10の別の作用を説明する。
図12は、本実施形態に係る確認処理プログラム14Aによる認識設定処理の流れの一例を示すフローチャートである。
まず、サーバ装置10に対して、未記入帳票についての認識設定処理の開始が指示されると、確認処理プログラム14Aが起動され、以下の各ステップを実行する。
図12のステップ120では、認識設定部210が、未記入帳票の入力を受け付ける。
ステップ122では、認識設定部210が、一例として、予め定められた順番に従って、項目を特定する。
ステップ124では、認識設定部210が、ステップ122で特定された項目に対応付けて確認方式を設定する。本実施形態では、一例として、上述の図6及び図7に示す帳票定義画面62から確認方式の設定を行う。
ステップ126では、認識設定部210が、最後の項目であるか否かを判定する。最後の項目であると判定した場合(肯定判定の場合)、本確認処理プログラム14Aによる認識設定処理を終了し、最後の項目ではないと判定した場合(否定判定の場合)、ステップ122に戻り処理を繰り返す。
このように本実施形態によれば、帳票内に必要性の度合いが異なる複数の項目が混在しているにも係わらず、全ての項目に対して同一の条件を用いて確認作業の方式を切り替える場合と比較して、項目毎に適切な方式の確認作業が実施される。
以上、実施形態に係る情報処理装置の一例としてサーバ装置を例示して説明した。実施形態は、サーバ装置が備える各部の機能をコンピュータに実行させるためのプログラムの形態としてもよい。実施形態は、このプログラムを記憶したコンピュータが読み取り可能な記憶媒体の形態としてもよい。
その他、上記実施形態で説明したサーバ装置の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。
また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
また、上記実施形態では、プログラムを実行することにより、実施形態に係る処理がコンピュータを利用してソフトウェア構成により実現される場合について説明したが、これに限らない。実施形態は、例えば、ハードウェア構成や、ハードウェア構成とソフトウェア構成との組み合わせによって実現してもよい。
10 サーバ装置
12 制御部
12A CPU
12B ROM
12C RAM
12D I/O
14 記憶部
14A 確認処理プログラム
14B 必要度合いテーブル
14C 認識枠情報
16 表示部
18 操作部
20 通信部
30 確認制御部
40、40A、40B 確認者用端末装置
50 画像読取装置
60 管理者用端末装置
90 情報処理システム
210 認識設定部
220 認識処理部
230 確認処理実施判定部
240 確認処理部
250 最終確認処理部
260 認識結果出力部

Claims (8)

  1. 一文書内に複数の領域を含む文書を電子化したデータである画像データを取得する取得部と、
    前記画像データの前記領域内に含まれる文字又は図の確認作業の必要度合いに基づいて、前記領域毎に判断基準を設定する設定部と、
    前記判断基準に基づいて前記領域毎に前記確認作業の方式を決定する決定部と、
    を備えた情報処理装置。
  2. 前記必要度合いは、前記一文書内における前記領域毎に対して予め定められた属性情報に基づいて決められる請求項1に記載の情報処理装置。
  3. 前記領域内に含まれる文字又は図を認識する認識部を更に備え、
    前記必要度合いは、前記認識部による認識結果に基づいて決められる請求項1に記載の情報処理装置。
  4. 前記必要度合いは、前記認識結果に基づき、前記文字又は図の態様が重要であると判定された場合に高く決められる請求項3に記載の情報処理装置。
  5. 前記必要度合いは、前記認識結果に基づき、前記文字の属性が重要であると判定された場合に高く決められる請求項3に記載の情報処理装置。
  6. 前記確認作業を行う画面を表示する制御を行う表示制御部を更に備え、
    前記表示制御部は、前記認識部による認識結果を前記必要度合いに従って分類して表示する制御を行う請求項3〜5のいずれか1項に記載の情報処理装置。
  7. 前記判断基準は、前記画像データに含まれる文字の認識結果の確からしさを示す値である確信度と閾値との比較により定められるものであり、
    前記設定部は、前記必要度合いに基づいて、前記領域毎に異なる前記閾値を設定する請求項1〜6のいずれか1項に記載の情報処理装置。
  8. コンピュータを、請求項1〜7のいずれか1項に記載の情報処理装置が備える各部として機能させるためのプログラム。
JP2018179373A 2018-09-25 2018-09-25 情報処理装置及びプログラム Active JP7263721B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018179373A JP7263721B2 (ja) 2018-09-25 2018-09-25 情報処理装置及びプログラム
US16/260,146 US10867168B2 (en) 2018-09-25 2019-01-29 Information processing apparatus and non-transitory computer readable medium storing program
CN201910163315.0A CN110942068B (zh) 2018-09-25 2019-03-05 信息处理装置、存储介质及信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018179373A JP7263721B2 (ja) 2018-09-25 2018-09-25 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020052571A true JP2020052571A (ja) 2020-04-02
JP7263721B2 JP7263721B2 (ja) 2023-04-25

Family

ID=69884923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018179373A Active JP7263721B2 (ja) 2018-09-25 2018-09-25 情報処理装置及びプログラム

Country Status (3)

Country Link
US (1) US10867168B2 (ja)
JP (1) JP7263721B2 (ja)
CN (1) CN110942068B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7243409B2 (ja) * 2019-04-17 2023-03-22 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002046988A1 (fr) * 2000-12-08 2002-06-13 Fujitsu Limited Dispositif de transaction automatique et systeme de transaction automatique
JP2016162211A (ja) * 2015-03-02 2016-09-05 大日本印刷株式会社 情報処理装置、制御方法及びプログラム
JP2016212812A (ja) * 2015-05-14 2016-12-15 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2991779B2 (ja) * 1990-06-11 1999-12-20 株式会社リコー 文字認識方法及び装置
JP3427692B2 (ja) * 1996-11-20 2003-07-22 松下電器産業株式会社 文字認識方法および文字認識装置
JP3435374B2 (ja) * 1999-10-04 2003-08-11 沖電気工業株式会社 文字読取装置および文字認識方法
JP4655335B2 (ja) * 2000-06-20 2011-03-23 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
DE50009493D1 (de) * 2000-10-26 2005-03-17 Mathias Wettstein Verfahren zur Erfassung des vollständigen Datensatzes mit Schriftzeichen versehener Formulare
AU2002230484A1 (en) * 2000-11-16 2002-05-27 Interlegis, Inc. System and method of managing documents
JP2006276911A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 電子機器およびプログラム
JP4992550B2 (ja) * 2007-05-30 2012-08-08 富士ゼロックス株式会社 情報処理プログラム及び情報処理システム
CN101515325B (zh) * 2009-04-08 2012-05-23 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
JP5455456B2 (ja) * 2009-06-09 2014-03-26 キヤノン株式会社 情報処理装置、情報処理方法、およびプログラム
JP5561856B2 (ja) * 2010-05-24 2014-07-30 株式会社Pfu 帳票作成装置、帳票作成プログラム、および帳票作成方法
JP5339308B2 (ja) * 2010-08-16 2013-11-13 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理方法、プログラム及び記録媒体。
JP5721539B2 (ja) * 2011-05-30 2015-05-20 沖電気工業株式会社 サーバ、情報処理方法および情報処理システム
JP2012194879A (ja) * 2011-03-17 2012-10-11 Pfu Ltd 情報処理装置、情報処理方法及びプログラム
JP5597330B2 (ja) * 2011-08-26 2014-10-01 京セラドキュメントソリューションズ株式会社 マーク検出装置
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
US11373388B2 (en) * 2017-07-24 2022-06-28 United States Postal Service Persistent feature based image rotation and candidate region of interest
JP7225548B2 (ja) * 2018-03-22 2023-02-21 セイコーエプソン株式会社 画像処理装置、画像処理方法および画像処理プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002046988A1 (fr) * 2000-12-08 2002-06-13 Fujitsu Limited Dispositif de transaction automatique et systeme de transaction automatique
JP2016162211A (ja) * 2015-03-02 2016-09-05 大日本印刷株式会社 情報処理装置、制御方法及びプログラム
JP2016212812A (ja) * 2015-05-14 2016-12-15 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
幸田 一輝 他2名: "講義映像配信システムにおける講義映像と資料の対応", 電気学会研究会資料, JPN6022039147, 12 August 2007 (2007-08-12), pages 1 - 5, ISSN: 0004876487 *

Also Published As

Publication number Publication date
JP7263721B2 (ja) 2023-04-25
US10867168B2 (en) 2020-12-15
CN110942068B (zh) 2024-01-23
CN110942068A (zh) 2020-03-31
US20200097712A1 (en) 2020-03-26

Similar Documents

Publication Publication Date Title
JP7206729B2 (ja) 情報処理装置及びプログラム
US10185701B2 (en) Unsupported character code detection mechanism
US10395131B2 (en) Apparatus, method and non-transitory storage medium for changing position coordinates of a character area stored in association with a character recognition result
US10706581B2 (en) Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor
US11200450B2 (en) Information processing apparatus and non-transitory computer readable medium for selecting a proper version of a recognition dictionary that is not necessarily a latest version
JP2020052570A (ja) 情報処理装置及びプログラム
KR102282025B1 (ko) 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
JP2020052571A (ja) 情報処理装置及びプログラム
US20200311408A1 (en) Information processing apparatus and non-transitory computer readable medium
JP2020087112A (ja) 帳票処理装置および帳票処理方法
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
JP7268316B2 (ja) 情報処理装置及びプログラム
JP2021111157A (ja) 情報処理装置、及び情報処理プログラム
JP7268311B2 (ja) 情報処理装置及びプログラム
JP7226136B2 (ja) 情報処理装置及びプログラム
JP2021034778A (ja) 情報処理装置及び情報処理プログラム
US20220198190A1 (en) Information processing apparatus and non-transitory computer readable medium
US20210064815A1 (en) Information processing apparatus and non-transitory computer readable medium
US10609246B1 (en) System and method for ascertaining and printing supplemental forms identified from content of a scanned base form
US20220198183A1 (en) Information processing apparatus and non-transitory computer readable medium
CN110909723B (zh) 信息处理装置及计算机可读存储介质
WO2024057589A1 (ja) 修正提案方法、修正提案システム、及び修正提案プログラム
JP2021033855A (ja) 情報処理装置及び情報処理プログラム
US20210056301A1 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
JP6003677B2 (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221107

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230314

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230327

R150 Certificate of patent or registration of utility model

Ref document number: 7263721

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150