JPWO2020045039A1 - Ocrシステム - Google Patents

Ocrシステム Download PDF

Info

Publication number
JPWO2020045039A1
JPWO2020045039A1 JP2020540225A JP2020540225A JPWO2020045039A1 JP WO2020045039 A1 JPWO2020045039 A1 JP WO2020045039A1 JP 2020540225 A JP2020540225 A JP 2020540225A JP 2020540225 A JP2020540225 A JP 2020540225A JP WO2020045039 A1 JPWO2020045039 A1 JP WO2020045039A1
Authority
JP
Japan
Prior art keywords
ocr
document
information
issuer
mark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020540225A
Other languages
English (en)
Other versions
JP7176566B2 (ja
Inventor
智広 川▲崎▼
智広 川▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Publication of JPWO2020045039A1 publication Critical patent/JPWO2020045039A1/ja
Application granted granted Critical
Publication of JP7176566B2 publication Critical patent/JP7176566B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/109Font handling; Temporal or kinetic typography
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries
    • G06V30/244Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
    • G06V30/245Font recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

OCR処理によって帳票(50)から文字データを取得するOCRシステムは、帳票(50)の発行者の発行者名と、OCR処理において使用するフォントのフォント名とを対応付けるOCR用情報テーブル(34e)を管理し、帳票(50)における発行者記載内容読取対象領域に対してOCR処理を実行する場合に、この帳票(50)の発行者の発行者名にOCR用情報テーブルにおいて対応付けられているフォント名で示されるフォントでOCR処理を実行する(S156)ことを特徴とする。

Description

本発明は、OCR処理によって文書から文字データを取得するOCRシステムに関する。
従来、OCR処理によって文書における特定の領域から文字データを取得するOCRシステムが知られている(例えば、特許文献1参照。)。
特開2010−073201号公報
しかしながら、従来のOCRシステムにおいては、文書における特定の領域内の文字のフォントの種類と、この領域に対するOCR処理において使用するフォントの種類とが異なる場合に、OCR処理における文字の認識の精度が低くなるときがあるという問題がある。
また、従来のOCRシステムにおいては、OCR処理の信頼度が文書毎に異なっていたとしても、文書に対するOCR処理の信頼度を利用者に認識させることができないので、OCR処理によって文書から取得した文字データの修正を受け付ける場合に、文字データの修正作業の負担が大きいという問題がある。
さらに、従来のOCRシステムにおいては、特定の情報として取得されることを利用者が希望する文字列の少なくとも1つの文字に特定情報用目印が重なっていない場合に、特定情報用目印が重なっていない文字を特定の情報の一部としては取得しないので、利用者が希望する文字列を適切に取得することができないという問題がある。
そこで、本発明は、OCR処理における文字の認識の精度を向上することができるOCRシステムを提供することを目的とする。
本発明の他の目的は、OCR処理によって文書から取得した文字データの修正作業の負担を軽減することができるOCRシステムを提供することである。
本発明の更に他の目的は、利用者が希望する文字列を適切に取得する可能性を向上することができるOCRシステムを提供することである。
本発明の第1の観点によれば、OCRシステムは、OCR処理によって文書から文字データを取得するOCRシステムであって、前記文書の発行者の識別情報と、OCR処理において使用するフォントの種類とを対応付けるOCR用情報を管理するOCR用情報管理部と、前記文書に対してOCR処理を実行するOCR実行部とを備え、前記OCR実行部は、前記文書における特定の領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行することを特徴とする。
本発明の第2の観点によれば、OCRシステムは、OCR処理によって文書から文字データを取得するOCRシステムであって、前記文書の発行者の識別情報と、この発行者によって発行される前記文書に対するOCR処理の信頼度とを対応付けるOCR用情報を管理するOCR用情報管理部と、前記文書に対してOCR処理を実行するOCR実行部と、前記文字データの修正を受け付ける修正受付部とを備え、前記OCR実行部は、前記信頼度を示すための信頼度用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記信頼度用目印によって示される前記信頼度を取得し、前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記信頼度を前記OCR用情報に含め、前記修正受付部は、前記文書の前記文字データの修正時に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を実行することを特徴とする。
本発明の第3の観点によれば、OCRシステムは、OCR処理によって文書から文字データを取得するOCRシステムであって、前記文書に対してOCR処理を実行するOCR実行部を備え、前記OCR実行部は、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、内部の互いに隣接する文字同士の間の距離が特定の距離以下である文字列を前記特定の情報として取得することを特徴とする。
本発明のOCRシステムは、OCR処理における文字の認識の精度を向上することができる。
また、本発明のOCRシステムは、OCR処理によって文書から取得した文字データの修正作業の負担を軽減することができる。
さらに、本発明のOCRシステムは、利用者が希望する文字列を適切に取得する可能性を向上することができる。
本発明の第1の実施の形態に係るOCRシステムのブロック図である。 図1に示す帳票データ管理システムによって管理される帳票データに対応する帳票の一例を示す図である。 MFPである場合の図1に示す画像形成装置のブロック図である。 1台のコンピューターによって構成される場合の図1に示す帳票データ管理システムのブロック図である。 図4に示す帳票データベースの一例を示す図である。 図4に示すOCR用情報テーブルの一例を示す図である。 図4に示す修正情報データベースの一例を示す図である。 図1に示す利用者端末のブロック図である。 OCR用情報テーブルを更新する場合の図4に示す帳票データ管理システムの動作のフローチャートである。 特定の目印が付された図2に示す帳票の一例を示す図である。 図9に示す発行者名取得処理のフローチャートである。 図11に示す発行者名取得処理において抽出される発行者名取得用領域の一例を示す図である。 図11に示す発行者名取得処理において検出される位置の一例を示す図である。 一種類のフォントでのOCR処理によって帳票データベースに帳票データを格納する場合の図4に示す帳票データ管理システムの動作の一部のフローチャートである。 図14Aに示す動作の続きの動作のフローチャートである。 図14に示す動作の続きの動作のフローチャートである。 図14Aに示す発行者名特定処理の一部のフローチャートである。 図16Aに示す動作の続きの動作のフローチャートである。 帳票データが確認される場合の図4に示す帳票データ管理システムの動作のフローチャートである。 本発明の第2の実施の形態に係るOCRシステムの帳票データ管理システムに記憶されている修正情報データベースの一例を示す図である。 二種類のフォントでのOCR処理によって帳票データベースに帳票データを格納する場合の、本発明の第2の実施の形態に係るOCRシステムの帳票データ管理システムの動作の一部のフローチャートである。 図19Aに示す動作の続きの動作のフローチャートである。 図19Bに示す動作の続きの動作のフローチャートである。 帳票データが確認される場合の、本発明の第2の実施の形態に係るOCRシステムの帳票データ管理システムの動作のフローチャートである。 特定の目印が付された図2に示す帳票の一例であって、図10に示す例とは異なる例を示す図である。
以下、本発明の実施の形態について、図面を用いて説明する。
(第1の実施の形態)
まず、本発明の第1の実施の形態に係るOCR(Optical Character Recognition)システムの構成について説明する。
図1は、本実施の形態に係るOCRシステム10のブロック図である。
図1に示すように、OCRシステム10は、原稿から画像を読み取る読取デバイスとしての画像形成装置20を備えている。画像形成装置20は、例えば、MFP(Multifunction Peripheral)、スキャナー専用機などの画像形成装置によって構成されている。OCRシステム10は、画像形成装置20以外にも、画像形成装置20と同様の構成の画像形成装置を少なくとも1つ備えることが可能である。
OCRシステム10は、電子化された文書としての帳票のデータ(以下「帳票データ」という。)を管理する帳票データ管理システム30を備えている。帳票データ管理システム30は、1台のコンピューターによって構成されても良いし、複数台のコンピューターによって構成されても良い。帳票データ管理システム30は、クラウド上で動作するシステムでも良い。
図2は、帳票データ管理システム30によって管理される帳票データに対応する帳票50の一例を示す図である。
図2に示す帳票50は、発行者の識別情報としての発行者名51と、発行者のロゴ画像52と、発行者によって記載される特定の内容(以下「発行者記載内容」という。)53とを含んでいる。図2において、発行者名51は、「ABC COMPANY」である。
図1に示すように、OCRシステム10は、帳票データを確認するデータ確認者などの利用者によって使用される利用者端末40を備えている。利用者端末40は、例えば、PC(Personal Computer)などのコンピューターよって構成されている。OCRシステム10は、利用者端末40以外にも、利用者端末40と同様の構成の利用者端末を少なくとも1つ備えることが可能である。
OCRシステム10に含まれる画像形成装置20と、帳票データ管理システム30とは、LAN(Local Area Network)、又はインターネットなどのネットワーク11を介して通信可能である。帳票データ管理システム30と、OCRシステム10に含まれる利用者端末40とは、ネットワーク11を介して通信可能である。
図3は、MFPである場合の画像形成装置20のブロック図である。
図3に示す画像形成装置20は、操作部21と、表示部22と、プリンター23と、スキャナー24と、ファックス通信部25と、通信部26と、記憶部27と、制御部28とを備えている。操作部21は、種々の操作が入力される操作デバイスである。操作デバイスは、例えばボタンなどである。表示部22は、種々の情報を表示する例えばLCD(Liquid Crystal Display)などの表示デバイスである。プリンター23は、用紙などの記録媒体に画像を印刷する印刷デバイスである。スキャナー24は、原稿から画像を読み取る読取デバイスである。ファックス通信部25は、図示していない外部のファクシミリ装置と公衆電話回線などの通信回線経由でファックス通信を行うファックスデバイスである。通信部26は、LAN、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである。記憶部27は、各種の情報を記憶する例えば半導体メモリー、HDD(Hard Disk Drive)などの不揮発性の記憶デバイスである。制御部28は、画像形成装置20全体を制御する。
制御部28は、例えば、CPU(Central Processing Unit)と、プログラムおよび各種のデータを記憶しているROM(Read Only Memory)と、制御部28のCPUの作業領域として用いられるメモリーとしてのRAM(Random Access Memory)とを備えている。制御部28のCPUは、記憶部27または制御部28のROMに記憶されているプログラムを実行する。
図4は、1台のコンピューターによって構成される場合の帳票データ管理システム30のブロック図である。
図4に示す帳票データ管理システム30は、操作部31と、表示部32と、通信部33と、記憶部34と、制御部35とを備えている。操作部31は、種々の操作が入力される操作デバイスである。操作デバイスは、例えば、キーボード、マウスなどである。表示部32は、種々の情報を表示する表示デバイスである。表示デバイスは、例えばLCDなどである。通信部33は、LAN、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである。記憶部34は、各種の情報を記憶する不揮発性の記憶デバイスである。記憶デバイスは、例えば半導体メモリー、又はHDDなどである。制御部35は、帳票データ管理システム30全体を制御する。
記憶部34は、文書OCRプログラムとしての帳票OCRプログラム34aと、OCRソフト34bと、フォントデータベース34cとを記憶している。文書OCRプログラムは、OCR処理によって帳票から文字データを取得するプログラムである。フォントデータベース34cは、OCRソフト34bによって使用されるフォントを格納する。帳票OCRプログラム34a、OCRソフト34bおよびフォントデータベース34cは、それぞれ、例えば、帳票データ管理システム30の製造段階で帳票データ管理システム30にインストールされていても良いし、CD(Compact Disk)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリーなどの外部の記憶媒体から帳票データ管理システム30に追加でインストールされても良いし、ネットワーク上から帳票データ管理システム30に追加でインストールされても良い。
記憶部34は、帳票データを格納する帳票データベース34dを記憶している。
図5は、帳票データベース34dの一例を示す図である。
図5に示す帳票データベース34dは、帳票データの識別情報としての帳票データIDと、帳票データと、を帳票データ毎に対応付けて含んでいる。帳票データは、帳票の画像データと、帳票の文字データとを含んでいる。例えば、図5においては、帳票データID「D001」と、画像データ「D001.JPG」と、文字データ「D001.xlsx」とが対応付けられている。
図4に示すように、記憶部34は、OCR処理のための情報としてのOCR用情報を格納するOCR用情報テーブル34eを記憶している。
図6は、OCR用情報テーブル34eの一例を示す図である。
図6に示すOCR用情報テーブル34eは、発行者名読取対象領域と、帳票の発行者の発行者名と、ロゴ画像と、発行者記載内容読取対象領域と、フォント名と、OCR処理の信頼度とを発行者毎に対応付けて含んでいる。発行者名読取対象領域は、帳票50において発行者名51を読み取るための領域である。ロゴ画像は、発行者名によって示される発行者の画像である。発行者記載内容読取対象領域は、帳票50において発行者記載内容53を読み取るための領域である。フォント名は、帳票50における発行者記載内容読取対象領域内の文字のフォントの種類を示す。OCR処理の信頼度は、発行者名によって示される発行者によって発行される帳票50に対して実行されるOCR処理を信頼する度合いのことである。例えば、図6においては、発行者名読取対象領域「(x1,y1)−(x2,y2)」と、発行者名「ABC COMPAMY」と、ロゴ画像「LOGO1.JPG」と、発行者記載内容読取対象領域「(x3,y3)−(x4,y4)」と、フォント名「Calibri」と、OCR処理の信頼度「高」とが対応付けられている。
発行者名読取対象領域および発行者記載内容読取対象領域は、画像データにおける座標によって表現されている。
ロゴ画像は、データ確認者に帳票データを確認させる責任者によってOCR用情報テーブル34eに登録される。
図4に示すように、記憶部34は、帳票データの修正状況と、帳票の文字データの修正時に注意喚起するための通知の種類(以下「通知種類」という。)とを帳票データ毎に示す修正情報データベース34fを記憶している。
図7は、修正情報データベース34fの一例を示す図である。
図7に示す修正情報データベース34fは、帳票データIDと、帳票データの修正状況と、通知種類と、OCR処理で使用したフォントのフォント名と、文字データとを帳票データ毎に対応付けて含んでいる。文字データは、フォント名で示されるフォントでのOCR処理によって生成されたデータである。例えば、図7においては、帳票データID「D001」と、帳票データの修正状況「未修正」と、通知種類「低信頼」と、OCR処理で使用したフォントのフォント名「Arial」と、フォント名で示されるフォントでのOCR処理によって生成された文字データ「D001a.xlsx」とが対応付けられている。
帳票データの修正状況としては、例えば、「未修正」と、「修正済」とが存在する。
通知種類としては、例えば、「高信頼」と、「低信頼」と、「非最適領域」と、「非最適フォント」と、「非最適領域フォント」とが存在する。「高信頼」は、帳票の最適な領域に対して最適なフォントでOCR処理がなされてOCR処理の信頼度が高い場合を示す。「低信頼」は、帳票の最適な領域に対して最適なフォントでOCR処理がなされたが、OCR処理の信頼度が低い場合を示す。「非最適領域」は、帳票の最適ではない領域に対して最適なフォントでOCR処理がなされた場合を示す。「非最適フォント」は、帳票の最適な領域に対して最適ではないフォントでOCR処理がなされた場合を示す。「非最適領域フォント」は、帳票の最適ではない領域に対して最適ではないフォントでOCR処理がなされた場合を示す。
図4に示す制御部35は、例えば、CPUと、プログラムおよび各種のデータを記憶しているROMと、制御部35のCPUの作業領域として用いられるメモリーとしてのRAMとを備えている。制御部35のCPUは、記憶部34または制御部35のROMに記憶されているプログラムを実行する。
制御部35は、帳票OCRプログラム34aを実行することによって、OCR実行部35aと、OCR用情報管理部35bと、修正受付部35cとを実現する。OCR実行部35aは、帳票50に対してOCRソフト34bによってOCR処理を実行する。OCR用情報管理部35bは、OCR用情報テーブル34eを管理する。修正受付部35cは、OCR処理によって帳票50から取得された文字データの修正を受け付ける。
図8は、利用者端末40のブロック図である。
図8に示すように、利用者端末40は、操作部41と、表示部42と、通信部43と、記憶部44と、制御部45とを備えている。操作部41は、種々の操作が入力される操作デバイスである。操作デバイスは、例えばキーボード、マウスなどである。表示部42は、種々の情報を表示する表示デバイスである。表示デバイスは、例えばLCDなどである。通信部43は、LAN、インターネットなどのネットワーク経由で、または、ネットワークを介さずに有線または無線によって直接に、外部の装置と通信を行う通信デバイスである。記憶部44は、各種の情報を記憶する不揮発性の記憶デバイスである。不揮発性の記憶デバイスは、例えば半導体メモリー、HDDなどである。制御部45は、利用者端末40全体を制御する。
制御部45は、例えば、CPUと、プログラムおよび各種のデータを記憶しているROMと、制御部45のCPUの作業領域として用いられるメモリーとしてのRAMとを備えている。制御部45のCPUは、記憶部44または制御部45のROMに記憶されているプログラムを実行する。
次に、OCRシステム10の動作について説明する。
まず、OCR用情報テーブル34eを更新する場合のOCRシステム10の動作について説明する。
図9は、OCR用情報テーブル34eを更新する場合の帳票データ管理システム30の動作のフローチャートである。
図9に示すように、帳票データ管理システム30のOCR実行部35aは、発行者名を特定するための発行者名用目印(識別情報用目印)が付された帳票50の画像データを受信したと判断するまで、発行者名用目印が付された帳票の画像データを受信したか否かを判断する(S101)。例えば、発行者名用目印が付された帳票50の画像データは、データ確認者に帳票データを確認させる責任者によって紙の帳票50に蛍光ペンなどの筆記具によって特定の目印が付された後、特定の目印が付された帳票50が画像形成装置20のスキャナー24によって読み取られることによって画像データとして生成されてもよい。そして、生成された帳票50の画像データは、画像形成装置20から帳票データ管理システム30に送信されても良い。また、発行者名用目印が付された帳票50の画像データは、帳票50の画像データに特定の目印が、利用者端末40によって画像データ上で付された後、利用者端末40から帳票データ管理システム30に送信されても良い。
図10は、特定の目印が付された帳票50の一例を示す図である。
図10に示す帳票50は、発行者名用目印61と、発行者記載内容用目印62と、OCR信頼度用目印63とを特定の目印として含む目印付文書である。発行者名用目印61は、帳票50のうちから発行者名51を取得するための識別情報用目印である。発行者名用目印61は、帳票50のうちの発行者名51の少なくとも一部に対する特定の蛍光色での塗り潰しである。発行者記載内容用目印62は、帳票50のうちから発行者記載内容読取対象領域を特定するための領域用目印である。発行者記載内容用目印62は、帳票50のうちの発行者記載内容読取対象領域に対する蛍光色での囲みである。OCR信頼度用目印63は、発行者名51で示す発行者によって発行される帳票に対するOCR処理の信頼度を示すための信頼度用目印である。OCR信頼度用目印63は、帳票50のうちの蛍光色で描いた×印である。
発行者名用目印61、発行者記載内容用目印62およびOCR信頼度用目印63は、例えば、データ確認者に帳票データを確認させる責任者によって紙の帳票50又は帳票50の画像データに付される。OCR信頼度用目印63は、例えば、帳票50の発行者が発行した帳票に対する、過去のOCR処理における文字の認識の精度に基づいて付される。OCR信頼度用目印63は、例えば、責任者が紙の帳票50又は帳票50の画像データに付す。
図9に示すように、OCR実行部35aは、発行者名用目印61が付された帳票50の画像データを受信したとS101において判断すると、発行者名を取得する発行者名取得処理を実行する(S102)。
図11は、発行者名取得処理のフローチャートである。
図11に示す動作は、図9のS101において受信したと判断した帳票50の画像データによって示される画像(以下「対象帳票画像」という。)における発行者名の文字列の方向が、対象帳票画像における横方向であって、対象帳票画像における発行者名の文字の高さ方向が、対象帳票画像における縦方向である場合の動作の例である。
図11に示すように、OCR実行部35aは、対象帳票画像のうち、発行者名を取得するための特定の領域(以下「発行者名取得用領域」という。)の画像を抽出する(S131)。発行者名取得用領域は、対象帳票画像における縦方向に延在する一対の対辺と、対象帳票画像における横方向に延在する一対の対辺とを備える矩形の領域である。
発行者名取得用領域の上端の辺の位置は、対象帳票画像における発行者名用目印の縦方向における最上部の位置でも良いし、対象帳票画像における発行者名用目印の縦方向における最上部の位置から特定の距離だけ上側の位置でも良い。ここで、特定の距離は、対象帳票画像における発行者名用目印の縦方向における最上部の位置から最下部の位置までの距離(以下「目印縦幅」という。)に応じた距離でも良いし、目印縦幅に依存しない固定の距離でも良い。
発行者名取得用領域の下端の辺の位置は、対象帳票画像における発行者名用目印の縦方向における最下部の位置でも良いし、対象帳票画像における発行者名用目印の縦方向における最下部の位置から特定の距離だけ下側の位置でも良い。ここで、特定の距離は、目印縦幅に応じた距離でも良いし、目印縦幅に依存しない固定の距離でも良い。
発行者名取得用領域の左端の辺の位置は、対象帳票画像における左端の辺の位置と同一でも良いし、対象帳票画像における発行者名用目印の横方向における最左部の位置から特定の距離だけ左側の位置でも良い。ここで、特定の距離は、対象帳票画像における発行者名用目印の横方向における最左部の位置から最右部の位置までの距離(以下「目印横幅」という。)に応じた距離でも良いし、目印横幅に依存しない固定の距離でも良い。
発行者名取得用領域の右端の辺の位置は、対象帳票画像における右端の辺の位置と同一でも良いし、対象帳票画像における発行者名用目印の横方向における最右部の位置から特定の距離だけ右側の位置でも良い。ここで、特定の距離は、目印横幅に応じた距離でも良いし、目印横幅に依存しない固定の距離でも良い。
図12は、図11に示す発行者名取得処理において抽出される発行者名取得用領域70の一例を示す図である。
図12に示す発行者名取得用領域70において、発行者名51である「DEF COMPANY」のうち、発行者名用目印61と重なっている文字は、「DE」のみである。
図11に示すように、OCR実行部35aは、S131の処理の後、S131において抽出した発行者名取得用領域70の画像において発行者名用目印61と重なっている文字に関して、縦方向における最上部の位置、最下部の位置および中心の位置を検出する(S132)。
図13は、図11に示す発行者名取得処理において検出される位置の一例を示す図である。
図13に示す発行者名取得用領域70において、位置71aは、発行者名用目印61と重なっている文字「DE」の縦方向における最上部の位置である。位置71bは、文字「DE」の縦方向における最下部の位置である。位置71cは、文字「DE」の縦方向における中心の位置である。
図11に示すように、OCR実行部35aは、S132の処理の後、S131において抽出した発行者名取得用領域70の画像に含まれる全ての文字に関して、縦方向における最上部の位置、最下部の位置および中心の位置とを検出する(S133)。
次いで、OCR実行部35aは、S131において抽出した発行者名取得用領域70の画像に含まれる全ての文字のうち、S131において抽出した発行者名取得用領域70の画像において発行者名用目印61と重なっている文字と同一の行の文字を、S132において検出した各位置と、S133において検出した各位置とに基づいて抽出する(S134)。S134の処理は、発行者名用目印61と重なっている文字と同一の行に含まれない文字が、後述のS136の処理によって発行者名の一部として誤って取得されることを防止するための処理である。
OCR実行部35aは、S134の処理の後、S134において抽出した文字によって構成される文字列であって、この文字列内において互いに隣接する文字同士の間の距離が特定の距離以下であり、S131において抽出した発行者名取得用領域70の画像において発行者名用目印61と重なっている文字を含む文字列を抽出する(S135)。ここで、特定の距離は、例えば発行者名用目印61と重なっている文字の5文字分の距離など、文字の幅に応じた距離でも良いし、例えば1cmなど、文字の幅に依存しない固定の距離でも良い。S135の処理は、発行者名用目印61と重なっている文字と同一の行に含まれる文字であるが、明らかに発行者名とは関係ない文字が、後述のS136の処理によって発行者名の一部として誤って取得されることを防止するための処理である。
OCR実行部35aは、S135の処理の後、S135において抽出された文字列をOCRソフト34bによって発行者名として取得して(S136)、図11に示す発行者名取得処理を終了する。
例えば、OCR実行部35aは、図12に示す発行者名取得用領域70から、図11に示す発行者名取得処理によって発行者名として「DEF COMPANY」を取得することができる。
図9に示すように、OCR実行部35aは、S102の発行者名取得処理の後、発行者名取得処理において取得された発行者名の位置に応じて発行者名読取対象領域を決定する(S103)。
OCR実行部35aは、S103の処理の後、対象帳票画像に発行者記載内容用目印62が付されているか否かを判断する(S104)。
OCR実行部35aは、対象帳票画像に発行者記載内容用目印62が付されているとS104において判断すると、発行者記載内容用目印62によって発行者記載内容読取対象領域を特定する(S105)。
次いで、OCR実行部35aは、対象帳票画像のうちS105において特定した発行者記載内容読取対象領域内の文字のフォント名を特定する(S106)。すなわち、OCR実行部35aは、対象帳票画像のうちS105において特定した発行者記載内容読取対象領域に含まれる文字のフォント名を、フォントデータベース34cにおいて探索して特定する。
OCR実行部35aは、対象帳票画像に発行者記載内容用目印62が付されていないとS104において判断するか、S106の処理が終了すると、対象帳票画像にOCR信頼度用目印が付されているか否かを判断する(S107)。
OCR実行部35aは、対象帳票画像にOCR信頼度用目印63が付されているとS107において判断すると、S102の発行者名取得処理によって取得された発行者名によって示される発行者によって発行される帳票50に対するOCR処理の信頼度として「低」を取得する(S108)。
OCR用情報管理部35bは、対象帳票画像にOCR信頼度用目印63が付されていないとS107において判断するか、S108の処理が終了すると、S101〜S108の処理の実行結果をOCR用情報テーブル34eに反映する(S109)。すなわち、OCR用情報管理部35bは、まず、S102の発行者名取得処理において取得した発行者名がOCR用情報テーブル34eに含まれていない場合、S102の発行者名取得処理において取得した発行者名をOCR用情報テーブル34eに登録する。ここで、OCR用情報管理部35bは、発行者名をOCR用情報テーブル34eに登録する場合、この発行者名に対応付けられるOCR処理の信頼度として「高」をOCR用情報テーブル34eに登録する。次いで、OCR用情報管理部35bは、S108におけるOCR処理の信頼度の取得を実行した場合、S102の発行者名取得処理において取得した発行者名に対応付けられるOCR処理の信頼度として「低」をOCR用情報テーブル34eに上書きで登録する。また、OCR用情報管理部35bは、S102の発行者名取得処理において取得した発行者名に対応付けられる発行者名読取対象領域として、S103において特定した発行者名読取対象領域をOCR用情報テーブル34eに上書きで登録する。また、OCR用情報管理部35bは、S105における発行者記載内容読取対象領域の特定を実行した場合、S102の発行者名取得処理において取得した発行者名に対応付けられる発行者記載内容読取対象領域として、S105において特定した発行者記載内容読取対象領域をOCR用情報テーブル34eに上書きで登録する。また、OCR用情報管理部35bは、S106におけるフォント名の特定を実行した場合、S102の発行者名取得処理において取得した発行者名に対応付けられるフォント名として、S106において特定したフォント名をOCR用情報テーブル34eに上書きで登録する。
OCR実行部35aは、S109の処理が終了すると、図9に示すS101の処理を実行する。
次に、一種類のフォントでのOCR処理によって帳票データベース34dに帳票データを格納する場合のOCRシステム10の動作について説明する。
図14A、図14Bおよび図15は、一種類のフォントでのOCR処理によって帳票データベース34dに帳票データを格納する場合の帳票データ管理システム30の動作のフローチャートである。
図14A、図14Bおよび図15に示すように、帳票データ管理システム30のOCR実行部35aは、帳票50の画像データを受信したと判断するまで、帳票50の画像データを受信したか否かを判断する(S151)。例えば、帳票50の画像データは、紙の帳票50が画像形成装置20のスキャナー24によって読み取られることによって画像データとして生成されて、画像形成装置20から帳票データ管理システム30に送信されても良い。また、帳票50の画像データは、図示していないコンピューターにおいて生成されて、図示していないコンピューターから帳票データ管理システム30に送信されても良い。
OCR実行部35aは、帳票50の画像データを受信したとS151において判断すると、S151において受信したと判断した画像データによって示される帳票(以下「対象帳票」という。)の発行者名を特定する発行者名特定処理を実行する(S152)。
図16Aは、図14Aに示す発行者名特定処理の一部のフローチャートである。図16Bは、図16Bに示す動作の続きの動作のフローチャートである。
図16Aに示すように、OCR実行部35aは、OCR用情報テーブル34eに発行者名読取対象領域が登録されているか否かを判断する(S191)。
OCR実行部35aは、OCR用情報テーブル34eに発行者名読取対象領域が登録されているとS191において判断すると、OCR用情報テーブル34eに登録されている未だ対象としていない1つの発行者名読取対象領域のみを対象にする(S192)。
次いで、OCR実行部35aは、S151において受信したと判断した画像データによって示される画像、すなわち、対象帳票画像のうち、現在の対象の発行者名読取対象領域に対して、OCRソフト34bによってOCR処理を実行する(S193)。
次いで、OCR実行部35aは、OCR用情報テーブル34eにおいて現在の対象の発行者名読取対象領域に対応付けられている発行者名が、S193において実行したOCR処理によって取得された文字列に含まれているか否かを判断する(S194)。
OCR実行部35aは、OCR用情報テーブル34eにおいて現在の対象の発行者名読取対象領域に対応付けられている発行者名が、S193において実行したOCR処理によって取得された文字列に含まれているとS194において判断すると、OCR用情報テーブル34eにおいて現在の対象の発行者名読取対象領域に対応付けられている発行者名を、対象帳票の発行者名として特定して(S195)、図16Aに示す発行者名特定処理を終了する。
OCR実行部35aは、OCR用情報テーブル34eにおいて現在の対象の発行者名読取対象領域に対応付けられている発行者名が、S193において実行したOCR処理によって取得された文字列に含まれていないとS194において判断すると、図16Bに示すように、OCR用情報テーブル34eに登録されている未だ対象としていない発行者名読取対象領域が存在するか否かを判断する(S196)。
OCR実行部35aは、OCR用情報テーブル34eに登録されている未だ対象としていない発行者名読取対象領域が存在するとS196において判断すると、S192の処理を実行する。
OCR実行部35aは、OCR用情報テーブル34eに発行者名読取対象領域が登録されていないとS191において判断するか、OCR用情報テーブル34eに登録されている未だ対象としていない発行者名読取対象領域が存在しないとS196において判断すると、OCR用情報テーブル34eに登録されているロゴ画像が対象帳票画像に含まれるか否かを画像マッチング処理によって判断する(S197)。
OCR実行部35aは、OCR用情報テーブル34eに登録されているロゴ画像が対象帳票画像に含まれるとS197において判断すると、対象帳票画像に含まれるとS197において判断したロゴ画像にOCR用情報テーブル34eにおいて対応付けられている発行者名を、対象帳票の発行者名として特定して(S198)、図16Aおよび図16Bに示す発行者名特定処理を終了する。
OCR実行部35aは、OCR用情報テーブル34eに登録されているロゴ画像が対象帳票画像に含まれないとS197において判断すると、図16Aおよび図16Bに示す発行者名特定処理を終了する。
図14Aに示すように、OCR実行部35aは、S152の発行者名特定処理が終了すると、S152の発行者名特定処理において発行者名を特定したか否かを判断する(S153)。
OCR実行部35aは、S152の発行者名特定処理において発行者名を特定したとS153において判断すると、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてフォント名が対応付けられているか否かを判断する(S154)。
OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてフォント名が対応付けられているとS154において判断すると、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているか否かを判断する(S155)。
図14A及び図14Bに示すように、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているとS155において判断すると、対象帳票画像のうち、この発行者記載内容読取対象領域に対して、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名で示されるフォントで、OCRソフト34bによってOCR処理を実行する(S156)。
次いで、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名と、S156において実行されたOCR処理によって取得された文字列とを含む文字データ、及び、S151において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S157)。ここで、OCR実行部35aは、S157において格納する帳票データに帳票データIDを自動で付与する。
次いで、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてOCR処理の信頼度として「低」が対応付けられているか否かを判断する(S158)。
OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてOCR処理の信頼度として「低」が対応付けられていないとS158において判断すると、通知種類としての「高信頼」と、帳票データの修正状況としての「未修正」と、S156におけるOCR処理で使用したフォント名と、S156において実行されたOCR処理によって取得された文字列を含む文字データとを、S157において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース34fに格納して(S159)、S151の処理を実行する。
OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてOCR処理の信頼度として「低」が対応付けられているとS158において判断すると、通知種類としての「低信頼」と、帳票データの修正状況としての「未修正」と、S156におけるOCR処理で使用したフォント名と、S156において実行されたOCR処理によって取得された文字列を含む文字データとを、S157において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース34fに格納して(S160)、S151の処理を実行する。
OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられていないとS155において判断すると、対象帳票画像に対して、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名で示されるフォントで、OCRソフト34bによってOCR処理を実行する(S161)。
次いで、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名と、S161において実行されたOCR処理によって取得された文字列とを含む文字データ、及びS151において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S162)。ここで、OCR実行部35aは、S162において格納する帳票データに帳票データIDを自動で付与する。
次いで、OCR実行部35aは、通知種類としての「非最適領域」と、帳票データの修正状況としての「未修正」と、S161におけるOCR処理で使用したフォント名と、S161において実行されたOCR処理によって取得された文字列を含む文字データとを、S162において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース34fに格納して(S163)、S151の処理を実行する。
図14A及び図15に示すように、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてフォント名が対応付けられていないとS154において判断すると、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているか否かを判断する(S164)。
OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているとS164において判断すると、対象帳票画像のうち、この発行者記載内容読取対象領域に対して、汎用のフォントで、OCRソフト34bによってOCR処理を実行する(S165)。
次いで、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名と、S165において実行されたOCR処理によって取得された文字列とを含む文字データ、及びS151において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S166)。ここで、OCR実行部35aは、S166において格納する帳票データに帳票データIDを自動で付与する。
次いで、OCR実行部35aは、通知種類としての「非最適フォント」と、帳票データの修正状況としての「未修正」と、S165におけるOCR処理で使用したフォント名と、S165において実行されたOCR処理によって取得された文字列を含む文字データとを、S166において帳票データベース34dに格納した帳票データの帳票データIDに関連付けて修正情報データベース34fに格納して(S167)、S151の処理を実行する。
OCR実行部35aは、S152の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられていないとS164において判断すると、対象帳票画像に対して、汎用のフォントで、OCRソフト34bによってOCR処理を実行する(S168)。
次いで、OCR実行部35aは、S152の発行者名特定処理において特定した発行者名、および、S168において実行されたOCR処理によって取得された文字列を含む文字データと、S151において受信したと判断した画像データとを含む帳票データを帳票データベース34dに格納する(S169)。ここで、OCR実行部35aは、S169において格納する帳票データに帳票データIDを自動で付与する。
OCR実行部35aは、S152の発行者名特定処理において発行者名を特定しなかったとS153において判断すると、対象帳票画像に対して、汎用のフォントで、OCRソフト34bによってOCR処理を実行する(S170)。
次いで、OCR実行部35aは、S170において実行されたOCR処理によって取得された文字列を含む文字データと、S151において受信したと判断した画像データとを含む帳票データを帳票データベース34dに格納する(S171)。ここで、OCR実行部35aは、S171において格納する帳票データに帳票データIDを自動で付与する。
OCR実行部35aは、S169またはS171の処理の後、通知種類としての「非最適領域フォント」と、帳票データの修正状況としての「未修正」と、S168またはS170におけるOCR処理で使用したフォント名と、S168またはS170において実行されたOCR処理によって取得された文字列を含む文字データとを、S169またはS171において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース34fに格納して(S172)、S151の処理を実行する。
次に、帳票データが確認される場合のOCRシステム10の動作について説明する。
図17は、帳票データが確認される場合の帳票データ管理システム30の動作のフローチャートである。
データ確認者は、帳票データ管理システム30が管理している帳票データの一覧の表示を利用者端末40の操作部41を介して利用者端末40に指示することができる。利用者端末40の制御部45は、帳票データ管理システム30が管理している帳票データの一覧の表示を指示されると、帳票データ管理システム30が管理している帳票データの一覧の表示を帳票データ管理システム30に要求する。
帳票データ管理システム30の修正受付部35cは、帳票データ管理システム30が管理している帳票データの一覧の表示が利用者端末40から要求されると、図17に示す動作を実行する。
図17に示すように、修正受付部35cは、帳票データベース34dに含まれる帳票データの一覧を示す一覧表示画面を利用者端末40に送信する(S211)。ここで、修正受付部35cは、修正情報データベース34fに含まれる修正状況を一覧表示画面に含める。
利用者端末40の制御部45は、S211において送信されてきた一覧表示画面を受信すると、受信した一覧表示画面を表示部42に表示する。したがって、データ確認者は、データ確認者自身が確認することを希望する帳票データを、表示部42に表示された一覧表示画面から操作部41を介して選択することができる。例えば、データ確認者は、表示部42に表示された一覧表示画面において修正状況が「未修正」である帳票データのいずれか1つを、データ確認者自身が確認することを希望する帳票データとして選択することができる。利用者端末40の制御部45は、一覧表示画面から帳票データが選択されると、選択された帳票データを帳票データ管理システム30に要求する。
帳票データ管理システム30の修正受付部35cは、S211の処理の後、利用者端末40から帳票データが要求されたと判断するまで、利用者端末40から帳票データが要求されたか否かを判断する(S212)。
修正受付部35cは、利用者端末40から帳票データが要求されたとS212において判断すると、利用者端末40から要求されたとS212において判断した帳票データ(以下「対象帳票データ」という。)の確認用画面を利用者端末40に送信する(S213)。ここで、修正受付部35cは、帳票データベース34dに含まれる対象帳票データの画像データによって示される画像と、帳票データベース34dに含まれる対象帳票データの文字データによって示される文字列と、修正情報データベース34fにおいて対象帳票データに対応付けられているフォント名と、修正情報データベース34fにおいて対象帳票データに対応付けられている文字データによって示される文字列と、修正情報データベース34fにおいて対象帳票データに対応付けられている通知種類に応じた通知とを確認用画面に含める。通知種類に応じた通知とは、例えば、通知種類が「高信頼」である場合には「確認してください。」というメッセージである。また、通知種類に応じた通知とは、例えば、通知種類が「低信頼」である場合には「過去に修正ミスの多い帳票です。全項目を十分に確認してください。」というメッセージである。また、通知種類に応じた通知とは、例えば、通知種類が「非最適領域」である場合には「最適ではない領域に対してOCR処理が実行されました。全項目を十分に確認してください。」というメッセージである。また、通知種類に応じた通知とは、例えば、通知種類が「非最適フォント」である場合には「最適ではないフォントでOCR処理が実行されました。全項目を十分に確認してください。」である。また、通知種類に応じた通知とは、例えば、通知種類が「非最適領域フォント」である場合には「最適ではない領域に対して、最適ではないフォントでOCR処理が実行されました。全項目を十分に確認してください。」というメッセージである。
利用者端末40の制御部45は、S213において送信されてきた確認用画面を受信すると、受信した確認用画面を表示部42に表示する。したがって、データ確認者は、表示部42に表示された確認用画面において、帳票データの文字データによって示される文字列が、帳票データの画像データによって示される画像に含まれる文字列と一致するか否かを確認することができる。そして、データ確認者は、例えば、帳票データの文字データによって示される文字列が、帳票データの画像データによって示される画像に含まれる文字列と一致しない場合に、帳票データの文字データの修正を確認用画面から操作部41を介して指示することができる。利用者端末40の制御部45は、帳票データの文字データの修正が指示されると、指示された修正内容を帳票データ管理システム30に通知する。また、データ確認者は、帳票データの確認の終了を確認用画面から操作部41を介して指示することもできる。利用者端末40の制御部45は、帳票データの確認の終了が指示されると、帳票データの確認の終了を帳票データ管理システム30に通知する。
帳票データ管理システム30の修正受付部35cは、S213の処理の後、帳票データの文字データの修正が利用者端末40から指示されたか否かを判断する(S214)。
修正受付部35cは、帳票データの文字データの修正が利用者端末40から指示されたとS214において判断すると、帳票データベース34dにおける対象帳票データの文字データを利用者端末40からの指示の内容に応じて修正した後(S215)、修正情報データベース34fにおいて対象帳票データに対応付けられている修正状況を「修正済」に設定する(S216)。
修正受付部35cは、帳票データの文字データの修正が利用者端末40から指示されていないとS214において判断するか、S216の処理が終了すると、帳票データの確認の終了が利用者端末40から指示されたか否かを判断する(S217)。
修正受付部35cは、帳票データの確認の終了が利用者端末40から指示されていないとS217において判断すると、S214の処理を実行する。
修正受付部35cは、帳票データの確認の終了が利用者端末40から指示されたとS217において判断すると、図17に示す動作を終了する。
以上に説明したように、OCRシステム10は、帳票50の発行者の発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名のフォントで、この帳票50における発行者記載内容読取対象領域に対してOCR処理を実行する(S156)。従って、帳票50における発行者記載内容読取対象領域内の文字のフォントのフォント名(フォントの種類)と、この発行者記載内容読取対象領域に対するOCR処理において使用するフォントのフォント名(フォントの種類)とが同一である可能性を向上することができる。その結果、OCR処理における文字の認識の精度を向上することができる。OCRシステム10は、OCR処理における文字の認識の精度を向上することができる場合、OCR処理によって帳票50から取得した文字データに対するデータ確認者による修正量を低減することができ、データ確認者による文字データの修正の作業時間を短縮することができる。
なお、例えば、フォントに応じてOCR処理における文字の認識の精度がそもそも悪いものである場合、又は、帳票50を印刷した画像形成装置の印刷性能の問題でOCR処理による文字の認識の精度が悪い場合には、帳票50における発行者記載内容読取対象領域内の文字のフォントのフォント名と、この発行者記載内容読取対象領域に対するOCR処理において使用するフォントのフォント名とが同一であったとしても、OCR処理における文字の認識の精度が悪い可能性がある。OCRシステム10は、帳票50の発行者の発行者名にOCR用情報テーブル34eにおいて対応付けられている、OCR処理の信頼度に応じた通知を、この帳票50の文字データの修正時に実行する(S213)。従って、データ確認者による文字データの修正ミスを低減することができる。
OCRシステム10は、帳票50に対するOCR処理によって、この帳票50の発行者の発行者名(識別情報)を取得し(S152)する。そして、取得した発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名のフォントで、この帳票50の発行者記載内容読取対象領域に対してOCR処理を実行する(S156)。従って、利便性を向上することができる。
OCRシステム10は、目印付文書に対してOCR処理を実行することによって、目印付文書において発行者記載内容用目印によって特定される発行者記載内容読取対象領域内の文字のフォントのフォント名(フォントの種類)を特定する(S106)。そして、OCRシステム10は、特定したフォント名(フォントの種類)をOCR用情報テーブル34eに含める(S109)。従って、OCR用情報テーブル34eへのフォントのフォント名の登録を容易化することができる。
OCRシステム10は、目印付文書に対してOCR処理を実行することによって、目印付文書において発行者名用目印によって特定される発行者の発行者名を取得し(S102)する。そして、OCRシステム10は、取得した発行者名をOCR用情報テーブル34eに含める(S109)。従って、OCR用情報テーブル34eへの発行者の発行者名の登録を容易化することができる。
OCRシステム10は、帳票50の文字データの修正時に、この帳票50の発行者の発行者名にOCR用情報テーブル34eにおいて対応付けられている、OCR処理の信頼度に応じた通知を実行する(S213)。従って、OCR処理によって帳票50から取得した文字データの修正作業の負担を軽減することができる。
OCRシステム10は、目印付文書に対してOCR処理を実行することによって、目印付文書においてOCR信頼度用目印によって示される、OCR処理の信頼度を取得する(S108)。そして、OCRシステム10は、取得した信頼度をOCR用情報テーブル34eに含める(S109)。従って、OCR用情報テーブル34eへのOCR処理の信頼度の登録を容易化することができる。
OCRシステム10は、帳票50に対するOCR処理によって、この帳票50の発行者の発行者名を取得し(S152)する。そして、OCRシステム10は、取得した発行者名にOCR用情報テーブル34eにおいて対応付けられている、OCR処理の信頼度に応じた通知を、この帳票50の文字データの修正時に実行する(S213)。従って、利便性を向上することができる。
OCRシステム10は、目印付文書に対してOCR処理を実行することによって、目印付文書において発行者名用目印61(特定情報用目印)によって特定される発行者の発行者名を取得する(S102)。そして、OCRシステム10は、取得した発行者名をOCR用情報テーブル34eに含める(S109)。従って、OCR用情報テーブル34eへの発行者の発行者名の登録を容易化することができる。
OCRシステム10は、目印付文書に対してOCR処理を実行する場合に、発行者名用目印61と重なっている文字と同一の行の少なくとも一部の文字によって構成され、発行者名用目印61と重なっている文字を含む文字列であって、内部の互いに隣接する文字同士の間の距離が特定の距離以下である文字列を発行者名として取得する(S134〜S136)。従って、利用者が希望する文字列、すなわち、発行者名の少なくとも1つの文字に発行者名用目印61が重なっていない場合であっても、発行者名を適切に取得する可能性を向上することができる。
OCRシステム10は、帳票50において発行者名に対する発行者名用目印61の付し方が不完全であっても、発行者名を適切に取得する可能性を向上することができる。従って、間違った発行者名をOCR用情報テーブル34eに登録する可能性を低減することができる。その結果、OCRシステム10は、利用者が帳票50に対して発行者名用目印61を適切に付し直して、発行者名用目印61を適切に付し直した帳票50を画像形成装置のスキャナーに再度読み取らせる必要性を低減することができる。
OCRシステム10は、帳票50の発行者の発行者名にOCR用情報テーブル34eにおいて対応付けられている、OCR処理の信頼度に応じた通知を、この帳票50の文字データの修正時に実行する(S213)。従って、OCR処理によって帳票50から取得した文字データの修正作業の負担を軽減することができる。
(第2の実施の形態)
まず、本発明の第2の実施の形態に係るOCRシステムの構成について説明する。
本実施の形態に係るOCRシステムの構成は、以下に述べる構成を除いて、第1の実施の形態に係るOCRシステム10(図1参照。)の構成と同様である。本実施の形態に係るOCRシステムの構成のうち、OCRシステム10の構成と同様の構成については、OCRシステム10の構成と同一の符号を付して詳細な説明を省略する。
本実施の形態に係るOCRシステムの帳票データ管理システム30は、修正情報データベース34f(図7参照。)に代えて、修正情報データベース334f(図18参照。)を記憶部34に記憶している。
図18は、本実施の形態に係るOCRシステムの帳票データ管理システム30に記憶されている修正情報データベース334fの一例を示す図である。
図18に示す修正情報データベース334fは、OCR処理で使用したフォントのフォント名と、フォント名で示されるフォントでのOCR処理によって生成された文字データとに代えて、OCR処理で使用した第1のフォントのフォント名と、第1のフォントでのOCR処理によって生成された文字データと、OCR処理で使用した第2のフォントのフォント名と、第2のフォントでのOCR処理によって生成された文字データとが、帳票データIDと、帳票データの修正状況と、通知種類とに対応付けられている。例えば、図18においては、帳票データID「D001」と、帳票データの修正状況「未修正」と、通知種類「低信頼」と、OCR処理で使用した第1のフォントのフォント名「Arial」と、第1のフォントでのOCR処理によって生成された文字データ「D001a.xlsx」と、OCR処理で使用した第2のフォントのフォント名「Calibri」と、第2のフォントでのOCR処理によって生成された文字データ「D001b.xlsx」とが対応付けられている。
次に、本実施の形態に係るOCRシステムの動作について説明する。
本実施の形態に係るOCRシステムの動作は、以下に述べる動作を除いて、第1の実施の形態に係るOCRシステム10(図1参照。)の動作と同様である。本実施の形態に係るOCRシステムの動作のうち、OCRシステム10の動作と同様の動作については、詳細な説明を省略する。
まず、二種類のフォントでのOCR処理によって帳票データベース34dに帳票データを格納する場合の本実施の形態に係るOCRシステムの動作について説明する。
図19A、図19Bおよび図20は、二種類のフォントでのOCR処理によって帳票データベース34dに帳票データを格納する場合の帳票データ管理システム30の動作のフローチャートである。
図19A、図19Bおよび図20に示すように、帳票データ管理システム30のOCR実行部35aは、S151〜S155(図14A参照。)の処理と同様のS451〜S455の処理を実行する。
OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているとS455において判断すると、対象帳票画像のうち、この発行者記載内容読取対象領域に対して、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名で示されるフォントである第1のフォントと、第1のフォントとは異なる汎用のフォントである第2のフォントとのそれぞれで、OCRソフト34bによってOCR処理を実行する(S456)。
次いで、OCR実行部35aは、S452の発行者名特定処理において特定した発行者名と、S456において実行された第1のフォントでのOCR処理によって取得された文字列とを含む文字データ、及びS451において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S457)。ここで、OCR実行部35aは、S457において格納する帳票データに帳票データIDを自動で付与する。
次いで、OCR実行部35aは、S158(図14参照。)の処理と同様のS458の処理を実行する。
OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてOCR処理の信頼度として「低」が対応付けられていないとS458において判断すると、通知種類としての「高信頼」と、帳票データの修正状況としての「未修正」と、S456における第1のフォントでのOCR処理で使用したフォント名と、S456において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S456における第2のフォントでのOCR処理で使用したフォント名と、S456において実行された第2のフォントでのOCR処理によって取得された文字列を含む文字データとを、S457において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース334fに格納して(S459)、S451の処理を実行する。
OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてOCR処理の信頼度として「低」が対応付けられているとS458において判断すると、通知種類としての「低信頼」と、帳票データの修正状況としての「未修正」と、S456における第1のフォントでのOCR処理で使用したフォント名と、S456において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S456における第2のフォントでのOCR処理で使用したフォント名と、S456において実行された第2のフォントでのOCR処理によって取得された文字列を含む文字データとを、S457において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース334fに格納して(S460)、S451の処理を実行する。
OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられていないとS455において判断すると、対象帳票画像に対して、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて対応付けられているフォント名で示されるフォントである第1のフォントと、第1のフォントとは異なる汎用のフォントである第2のフォントとのそれぞれで、OCRソフト34bによってOCR処理を実行する(S461)。
次いで、OCR実行部35aは、S452の発行者名特定処理において特定した発行者名と、S461において実行された第1のフォントでのOCR処理によって取得された文字列とを含む文字データ、及びS451において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S462)。ここで、OCR実行部35aは、S462において格納する帳票データに帳票データIDを自動で付与する。
次いで、OCR実行部35aは、通知種類としての「非最適領域」と、帳票データの修正状況としての「未修正」と、S461における第1のフォントでのOCR処理で使用したフォント名と、S461において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S461における第2のフォントでのOCR処理で使用したフォント名と、S461において実行された第2のフォントでのOCR処理によって取得された文字列を含む文字データとを、S462において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース334fに格納して(S463)、S451の処理を実行する。
OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいてフォント名が対応付けられていないとS454において判断すると、S164(図15参照。)の処理と同様のS464の処理を実行する。
OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられているとS464において判断すると、対象帳票画像のうち、この発行者記載内容読取対象領域に対して、汎用のフォントである第1のフォントと、第1のフォントとは異なる汎用のフォントである第2のフォントとのそれぞれで、OCRソフト34bによってOCR処理を実行する(S465)。
次いで、OCR実行部35aは、S452の発行者名特定処理において特定した発行者名、および、S465において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S451において受信したと判断した画像データとを含む帳票データを帳票データベース34dに格納する(S466)。ここで、OCR実行部35aは、S466において格納する帳票データに帳票データIDを自動で付与する。
次いで、OCR実行部35aは、通知種類としての「非最適フォント」と、帳票データの修正状況としての「未修正」と、S465における第1のフォントでのOCR処理で使用したフォント名と、S465において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S465における第2のフォントでのOCR処理で使用したフォント名と、S465において実行された第2のフォントでのOCR処理によって取得された文字列を含む文字データとを、S466において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース334fに格納して(S467)、S451の処理を実行する。
OCR実行部35aは、S452の発行者名特定処理において特定した発行者名にOCR用情報テーブル34eにおいて発行者記載内容読取対象領域が対応付けられていないとS464において判断すると、対象帳票画像に対して、汎用のフォントである第1のフォントと、第1のフォントとは異なる汎用のフォントである第2のフォントとのそれぞれで、OCRソフト34bによってOCR処理を実行する(S468)。
次いで、OCR実行部35aは、S452の発行者名特定処理において特定した発行者名と、S468において実行された第1のフォントでのOCR処理によって取得された文字列とを含む文字データ、及びS451において受信したと判断した画像データを含む帳票データを帳票データベース34dに格納する(S469)。ここで、OCR実行部35aは、S469において格納する帳票データに帳票データIDを自動で付与する。
OCR実行部35aは、S452の発行者名特定処理において発行者名を特定しなかったとS453において判断すると、対象帳票画像に対して、汎用のフォントである第1のフォントと、第1のフォントとは異なる汎用のフォントである第2のフォントとのそれぞれで、OCRソフト34bによってOCR処理を実行する(S470)。
次いで、OCR実行部35aは、S470において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S451において受信したと判断した画像データとを含む帳票データを帳票データベース34dに格納する(S471)。ここで、OCR実行部35aは、S471において格納する帳票データに帳票データIDを自動で付与する。
OCR実行部35aは、S469またはS471の処理の後、通知種類としての「非最適領域フォント」と、帳票データの修正状況としての「未修正」と、S468またはS470における第1のフォントでのOCR処理で使用したフォント名と、S468またはS470において実行された第1のフォントでのOCR処理によって取得された文字列を含む文字データと、S468またはS470における第2のフォントでのOCR処理で使用したフォント名と、S468またはS470において実行された第2のフォントでのOCR処理によって取得された文字列を含む文字データとを、S469またはS471において帳票データベース34dに格納した帳票データの帳票データIDに関連づけて修正情報データベース334fに格納して(S472)、S451の処理を実行する。
次に、帳票データが確認される場合の本実施の形態に係るOCRシステムの動作について説明する。
図21は、帳票データが確認される場合の帳票データ管理システム30の動作のフローチャートである。
帳票データ管理システム30の修正受付部35cは、帳票データ管理システム30が管理している帳票データの一覧の表示が利用者端末40から要求されると、図21に示す動作を実行する。
図21に示すように、修正受付部35cは、S211〜S212(図17参照。)の処理と同様のS511〜S512の処理を実行する。
修正受付部35cは、利用者端末40から帳票データが要求されたとS512において判断すると、利用者端末40から要求されたとS512において判断した帳票データ、すなわち、対象帳票データの確認用画面を利用者端末40に送信する(S513)。ここで、修正受付部35cは、帳票データベース34dに含まれる対象帳票データの画像データによって示される画像と、帳票データベース34dに含まれる対象帳票データの文字データによって示される文字列と、修正情報データベース334fにおいて対象帳票データに対応付けられている第1のフォント名と、修正情報データベース334fにおいて対象帳票データに対応付けられている第1のフォントでのOCR処理によって生成された文字データによって示される文字列と、修正情報データベース334fにおいて対象帳票データに対応付けられている第2のフォント名と、修正情報データベース334fにおいて対象帳票データに対応付けられている第2のフォントでのOCR処理によって生成された文字データによって示される文字列と、修正情報データベース334fにおいて対象帳票データに対応付けられている通知種類に応じた通知とを確認用画面に含める。修正受付部35cは、第1のフォントでのOCR処理によって生成された文字データによって示される文字列と、第2のフォントでのOCR処理によって生成された文字データによって示される文字列との差分の表示を確認用画面に含める。通知種類に応じた通知とは、例えば、通知種類が「高信頼」である場合には「2種類のフォントのそれぞれでのOCR処理によって生成された文字データによって示される文字列の差分のみ確認してください。」というメッセージである。通知種類に応じた通知とは、例えば、通知種類が「低信頼」である場合には「過去に修正ミスの多い帳票です。全項目を十分に確認してください。」というメッセージである。通知種類に応じた通知とは、例えば、通知種類が「非最適領域」である場合には「最適ではない領域に対してOCR処理が実行されました。全項目を十分に確認してください。」というメッセージである。通知種類に応じた通知とは、例えば、通知種類が「非最適フォント」である場合には「最適ではないフォントでOCR処理が実行されました。全項目を十分に確認してください。」というメッセージである。通知種類に応じた通知とは、例えば、通知種類が「非最適領域フォント」である場合には「最適ではない領域に対して、最適ではないフォントでOCR処理が実行されました。全項目を十分に確認してください。」というメッセージである。
帳票データ管理システム30の修正受付部35cは、S513の処理の後、S214〜S217(図17参照。)の処理と同様のS514〜S517の処理を実行して、図21に示す動作を終了する。
発行者名51を特定するための発行者名用目印61は、上述の各実施の形態において発行者名51の少なくとも一部の、特定の蛍光色での塗り潰しであるが、発行者名51の少なくとも一部の、特定の蛍光色での塗り潰し以外のものでも良い。例えば、発行者名用目印61は、発行者名51の少なくとも一部の塗り潰しではなく、発行者名51の少なくとも一部の囲みでも良い。また、発行者名用目印61は、赤、青など、蛍光色以外の色で描かれても良い。発行者名用目印61は、発行者記載内容用目印62と異なる色で描かれても良いし、OCR信頼度用目印63と異なる色で描かれても良い。
発行者記載内容用目印62は、上述の各実施の形態において発行者記載内容読取対象領域の、蛍光色での囲みであるが、発行者記載内容読取対象領域の、蛍光色での囲み以外のものでも良い。例えば、発行者記載内容用目印62は、赤、青など、蛍光色以外の色で描かれても良い。発行者記載内容用目印62は、発行者名用目印61と異なる色で描かれても良いし、OCR信頼度用目印63と異なる色で描かれても良い。
OCR信頼度用目印63は、上述の各実施の形態において蛍光色で描いた×印であるが、蛍光色で描いた×印以外のものでも良い。例えば、OCR信頼度用目印63は、発行者記載内容用目印62によって囲まれた範囲の外部に描かれた星印、チェックマークなどの印でも良いし、例えば、図22に示すように、発行者記載内容用目印62によって囲まれた範囲の内部に描かれた線などの印でも良い。OCR信頼度用目印63は、発行者名用目印61と異なる色で描かれても良いし、発行者記載内容用目印62と異なる色で描かれても良い。OCR信頼度用目印63は、発行者名用目印61および発行者記載内容用目印62の少なくとも一方の色で表されても良い。例えば、OCR信頼度用目印63は、OCR処理の信頼度が高い場合に発行者名用目印61および発行者記載内容用目印62の黄色の蛍光色で表され、OCR処理の信頼度が低い場合に発行者名用目印61および発行者記載内容用目印62のピンクの蛍光色で表されても良い。
OCR信頼度用目印63は、上述の各実施の形態においてOCR処理の信頼度が低いことを示す目印である。しかしながら、OCR信頼度用目印63は、OCR処理の信頼度が高いことを示す目印でも良いし、OCR処理の信頼度が高いことと、低いこととを区別して示す目印でも良い。
帳票データ管理システム30のOCR実行部35aは、上述の各実施の形態において、S131において抽出した画像に含まれる全ての文字のうち、S131において抽出した画像において発行者名用目印61と重なっている文字と同一の行の文字を、S132において検出した各位置と、S133において検出した各位置とに基づいて抽出する(S134)。しかしながら、OCR実行部35aは、S131において抽出した画像に含まれる全ての文字のうち、S131において抽出した画像において発行者名用目印61と重なっている文字と同一の行の文字を、S134における方法以外の方法によって抽出しても良い。
帳票データ管理システム30のOCR実行部35aは、上述の各実施の形態において、発行者名取得処理において発行者名取得用領域を抽出する(S131)ことによって、発行者名取得処理において発行者名取得用領域のみを処理の対象にする。従って、OCR実行部35aは、発行者名取得処理において対象帳票画像全体を処理の対象にする構成と比較して、発行者名取得処理において処理の対象にする領域のサイズを抑えることができる。その結果、発行者名取得処理において使用する、制御部35のRAMのサイズを抑えることができる。しかしながら、OCR実行部35aは、発行者名取得処理において発行者名取得用領域を抽出せずに対象帳票画像全体を処理の対象にしても良い。
帳票データ管理システム30のOCR実行部35aは、上述の各実施の形態において、S134において抽出した文字によって構成される文字列であって、この文字列内において互いに隣接する文字同士の間の距離が特定の距離以下であり、S131において抽出した画像において発行者名用目印61と重なっている文字を含む文字列を抽出し(S135)、S135において抽出された文字列を発行者名として取得する(S136)。しかしながら、OCR実行部35aは、S134において抽出した文字によって構成される文字列であって、この文字列の全長が特定の距離以下であり、S131において抽出した画像において発行者名用目印61と重なっている文字を含む文字列を抽出し、抽出した文字列をS136において発行者名として取得しても良い。ここで、特定の距離は、例えば発行者名用目印61と重なっている文字の20文字分の距離など、文字の幅に応じた距離でも良いし、例えば15cmなど、文字の幅に依存しない固定の距離でも良い。また、OCR実行部35aは、S134において抽出した全ての文字によって構成される文字列をS136において発行者名として取得しても良い。従って、利用者が希望する文字列、すなわち、発行者名の少なくとも1つの文字に発行者名用目印61が重なっていない場合であっても、利用者が希望する文字列を適切に取得する可能性を向上することができる。
上述の各実施の形態において説明した帳票データ管理システム30の少なくとも一部の機能は、帳票データ管理システム30においてではなく、画像形成装置において実現されても良い。同様に、上述の各実施の形態において説明した帳票データ管理システム30の少なくとも一部の機能は、帳票データ管理システム30においてではなく、利用者端末40において実現されても良い。
本発明の文書は、上述の各実施の形態において帳票であるが、帳票以外の文書でも良い。
本願は、さらに以下の付記を開示する。なお、以下の付記は、本発明を限定するものではない。
(付記1)
OCR処理によって文書から文字データを取得するための文書OCRプログラムであって、
前記文書の発行者の識別情報と、OCR処理において使用するフォントの種類とを対応付けるOCR用情報を管理するOCR用情報管理部と、
前記文書に対してOCR処理を実行するOCR実行部と
をコンピューターに実現させ、
前記OCR実行部は、前記文書における特定の領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行することを特徴とする文書OCRプログラム。
(付記2)
OCR処理によって文書から文字データを取得するOCR方法であって、
前記文書の発行者の識別情報と、OCR処理において使用するフォントの種類とを対応付けるOCR用情報を管理するOCR用情報管理ステップと、
前記文書に対してOCR処理を実行するOCR実行ステップと
を備え、
前記OCR実行ステップは、前記文書における特定の領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行するステップであることを特徴とするOCR方法。
(付記3)
OCR処理によって文書から文字データを取得するための文書OCRプログラムであって、
前記文書の発行者の識別情報と、この発行者によって発行される前記文書に対するOCR処理の信頼度とを対応付けるOCR用情報を管理するOCR用情報管理部と、
前記文書に対してOCR処理を実行するOCR実行部と、
前記文字データの修正を受け付ける修正受付部と
をコンピューターに実現させ、
前記OCR実行部は、前記信頼度を示すための信頼度用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記信頼度用目印によって示される前記信頼度を取得し、
前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記信頼度を前記OCR用情報に含め、
前記修正受付部は、前記文書の前記文字データの修正時に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を実行することを特徴とする文書OCRプログラム。
(付記4)
OCR処理によって文書から文字データを取得するOCR方法であって、
前記文書の発行者の識別情報と、この発行者によって発行される前記文書に対するOCR処理の信頼度とを対応付けるOCR用情報を管理するOCR用情報管理ステップと、
前記文書に対してOCR処理を実行するOCR実行ステップと、
前記文字データの修正を受け付ける修正受付ステップと
を備え、
前記OCR実行ステップは、前記信頼度を示すための信頼度用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記信頼度用目印によって示される前記信頼度を取得するステップであり、
前記OCR用情報管理ステップは、前記目印付文書から前記OCR実行ステップによって取得された前記信頼度を前記OCR用情報に含めるステップであり、
前記修正受付ステップは、前記文書の前記文字データの修正時に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を実行するステップであることを特徴とするOCR方法。
(付記5)
OCR処理によって文書から文字データを取得するOCRシステムであって、
前記文書に対してOCR処理を実行するOCR実行部を備え、
前記OCR実行部は、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、全長が特定の距離以下である文字列を前記特定の情報として取得することを特徴とするOCRシステム。
(付記6)
OCR処理によって文書から文字データを取得するための文書OCRプログラムであって、
前記文書に対してOCR処理を実行するOCR実行部をコンピューターに実現させ、
前記OCR実行部は、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、内部の互いに隣接する文字同士の間の距離が特定の距離以下である文字列を前記特定の情報として取得することを特徴とする文書OCRプログラム。
(付記7)
OCR処理によって文書から文字データを取得するための文書OCRプログラムであって、
前記文書に対してOCR処理を実行するOCR実行部をコンピューターに実現させ、
前記OCR実行部は、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、全長が特定の距離以下である文字列を前記特定の情報として取得することを特徴とする文書OCRプログラム。
(付記8)
OCR処理によって文書から文字データを取得するOCR方法であって、
前記文書に対してOCR処理を実行するOCR実行ステップを備え、
前記OCR実行ステップは、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、内部の互いに隣接する文字同士の間の距離が特定の距離以下である文字列を前記特定の情報として取得するステップであることを特徴とするOCR方法。
(付記9)
OCR処理によって文書から文字データを取得するOCR方法であって、
前記文書に対してOCR処理を実行するOCR実行ステップを備え、
前記OCR実行ステップは、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、全長が特定の距離以下である文字列を前記特定の情報として取得するステップであることを特徴とするOCR方法。

Claims (15)

  1. OCR処理によって文書から文字データを取得するOCRシステムであって、
    前記文書の発行者の識別情報と、OCR処理において使用するフォントの種類とを対応付けるOCR用情報を管理するOCR用情報管理部と、
    前記文書に対してOCR処理を実行するOCR実行部と
    を備え、
    前記OCR実行部は、前記文書における特定の領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行することを特徴とするOCRシステム。
  2. 前記文書は、この文書の前記発行者の前記識別情報を含み、
    前記OCR実行部は、前記文書に対するOCR処理によって、この文書の前記発行者の前記識別情報を取得し、取得した前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントで、この文書の前記特定の領域に対してOCR処理を実行することを特徴とする請求項1に記載のOCRシステム。
  3. 前記OCR実行部は、前記特定の領域を特定するための領域用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記領域用目印によって特定される前記特定の領域内の文字のフォントの前記種類を特定し、
    前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって特定された前記種類を前記OCR用情報に含めることを特徴とする請求項1に記載のOCRシステム。
  4. 前記目印付文書は、前記目印付文書の前記発行者の前記識別情報を取得するための識別情報用目印が付され、
    前記OCR実行部は、前記目印付文書に対してOCR処理を実行する場合に、前記識別情報用目印によって特定される前記識別情報を取得し、
    前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記識別情報を前記OCR用情報に含めることを特徴とする請求項3に記載のOCRシステム。
  5. 前記特定の領域の上端の辺の位置は、前記文書における前記識別情報用目印の縦方向における最上部の位置から特定の距離だけ上側の位置であり、
    前記特定の領域の下端の辺の位置は、前記文書における前記識別情報用目印の縦方向における最下部の位置から特定の距離だけ下側の位置であり、
    前記特定の領域の左端の辺の位置は、前記文書における前記識別情報用目印の横方向における最左部の位置から特定の距離だけ左側の位置であり、
    前記特定の領域の右端の辺の位置は、前記文書における前記識別情報用目印の横方向における最右部の位置から特定の距離だけ右側の位置である、請求項4に記載のOCRシステム。
  6. OCR処理によって文書から文字データを取得するOCRシステムであって、
    前記文書の発行者の識別情報と、前記発行者によって発行される前記文書に対するOCR処理の信頼度とを対応付けるOCR用情報を管理するOCR用情報管理部と、
    前記文書に対してOCR処理を実行するOCR実行部と、
    前記文字データの修正を受け付ける修正受付部と
    を備え、
    前記OCR実行部は、前記信頼度を示すための信頼度用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記信頼度用目印によって示される前記信頼度を取得し、
    前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記信頼度を前記OCR用情報に含め、
    前記修正受付部は、前記文書の前記文字データの修正時に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を実行することを特徴とするOCRシステム。
  7. 前記文書は、この文書の前記発行者の前記識別情報が含まれ、
    前記OCR実行部は、前記文書に対するOCR処理によって、この文書の前記発行者の前記識別情報を取得し、
    前記修正受付部は、前記OCR実行部によって前記文書から取得された前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を、この文書の前記文字データの修正時に実行することを特徴とする請求項6に記載のOCRシステム。
  8. 前記目印付文書は、前記目印付文書の前記発行者の前記識別情報を取得するための識別情報用目印が付され、
    前記OCR実行部は、前記目印付文書に対してOCR処理を実行する場合に、前記識別情報用目印によって特定される前記識別情報を取得し、
    前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記識別情報を前記OCR用情報に含めることを特徴とする請求項6に記載のOCRシステム。
  9. 前記OCR用情報は、OCR処理において使用するフォントの種類を、前記識別情報と対応付け、
    前記OCR実行部は、前記文書における特定の領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行することを特徴とする請求項6に記載のOCRシステム。
  10. 前記目印付文書は、前記領域を特定するための領域用目印が付され、
    前記OCR実行部は、前記目印付文書に対してOCR処理を実行する場合に、前記領域用目印によって特定される前記領域内の文字のフォントの前記種類を特定し、
    前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって特定された前記種類を前記OCR用情報に含めることを特徴とする請求項9に記載のOCRシステム。
  11. 前記信頼度用目印は、前記信頼度が低いことを示す目印と、前記信頼度が高いことを示す目印と、前記信頼度が高いことと低いこととを区別して示す目印との少なくとも1つを含む、請求項6に記載のOCRシステム。
  12. OCR処理によって文書から文字データを取得するOCRシステムであって、
    前記文書に対してOCR処理を実行するOCR実行部を備え、
    前記OCR実行部は、特定の情報を取得するための特定情報用目印が付された前記文書である目印付文書に対してOCR処理を実行する場合に、前記特定情報用目印と重なっている文字と同一の行の少なくとも一部の文字によって構成され、前記特定情報用目印と重なっている文字を含む文字列であって、内部の互いに隣接する文字同士の間の距離が特定の距離以下である文字列を前記特定の情報として取得することを特徴とするOCRシステム。
  13. 前記特定の情報は、前記文書の発行者の識別情報であり、
    前記OCRシステムは、前記文書の前記発行者の前記識別情報と、OCR処理において使用するフォントの種類とを対応付けるOCR用情報を管理するOCR用情報管理部を備え、
    前記目印付文書は、この目印付文書における特定の領域を特定するための領域用目印が付され、
    前記OCR実行部は、前記目印付文書に対してOCR処理を実行する場合に、前記領域用目印によって特定される前記領域内の文字のフォントの前記種類を特定し、
    前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって特定された前記種類を前記OCR用情報に含め、
    前記OCR実行部は、前記文書における前記領域に対してOCR処理を実行する場合に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記種類のフォントでOCR処理を実行することを特徴とする請求項12に記載のOCRシステム。
  14. 前記特定の情報は、前記文書の発行者の識別情報であり、
    前記OCRシステムは、
    前記文書の前記発行者の前記識別情報と、この発行者によって発行される前記文書に対するOCR処理の信頼度とを対応付けるOCR用情報を管理するOCR用情報管理部と、
    前記文字データの修正を受け付ける修正受付部と
    を備え、
    前記目印付文書は、前記信頼度を示すための信頼度用目印が付され、
    前記OCR実行部は、前記目印付文書に対してOCR処理を実行する場合に、前記信頼度用目印によって示される前記信頼度を取得し、
    前記OCR用情報管理部は、前記目印付文書から前記OCR実行部によって取得された前記信頼度を前記OCR用情報に含め、
    前記修正受付部は、前記文書の前記文字データの修正時に、この文書の前記発行者の前記識別情報に前記OCR用情報において対応付けられている前記信頼度に応じた通知を実行することを特徴とする請求項12に記載のOCRシステム。
  15. 前記OCR用情報管理部は、前記OCR用情報において、前記文書の前記発行者の前記識別情報と、OCR処理において使用するフォントの種類とを対応付け、
    前記OCR実行部は、前記種類のフォントと、前記種類のフォントと異なるフォントとのそれぞれでOCR処理を実行し、
    前記修正受付部は、前記種類のフォントでのOCR処理によって生成された前記文字データと、前記異なるフォントでのOCR処理によって生成された前記文字データとの差分を含む確認用画面を利用者端末に送信する、請求項14に記載のOCRシステム。
JP2020540225A 2018-08-27 2019-08-08 Ocrシステム Active JP7176566B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
JP2018158183 2018-08-27
JP2018158183 2018-08-27
JP2018158185 2018-08-27
JP2018158182 2018-08-27
JP2018158182 2018-08-27
JP2018158185 2018-08-27
PCT/JP2019/031435 WO2020045039A1 (ja) 2018-08-27 2019-08-08 Ocrシステム

Publications (2)

Publication Number Publication Date
JPWO2020045039A1 true JPWO2020045039A1 (ja) 2021-08-12
JP7176566B2 JP7176566B2 (ja) 2022-11-22

Family

ID=69644220

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020540225A Active JP7176566B2 (ja) 2018-08-27 2019-08-08 Ocrシステム

Country Status (4)

Country Link
US (1) US11972197B2 (ja)
JP (1) JP7176566B2 (ja)
CN (1) CN112639818B (ja)
WO (1) WO2020045039A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115294588B (zh) * 2022-08-17 2024-04-19 湖北鑫英泰系统技术股份有限公司 一种基于rpa流程机器人的数据处理方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0298795A (ja) * 1988-10-06 1990-04-11 Canon Inc 文字認識装置
JPH11306279A (ja) * 1998-04-20 1999-11-05 Oki Electric Ind Co Ltd 文字認識装置および文字認識方法
JP2003303315A (ja) * 2002-04-12 2003-10-24 Hitachi Ltd 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム
JP2007233900A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2017091419A (ja) * 2015-11-16 2017-05-25 富士ゼロックス株式会社 情報処理装置、画像読み取り装置及びプログラム
JP2018124854A (ja) * 2017-02-02 2018-08-09 富士ゼロックス株式会社 画像処理装置および画像処理プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5805747A (en) * 1994-10-04 1998-09-08 Science Applications International Corporation Apparatus and method for OCR character and confidence determination using multiple OCR devices
JP3462970B2 (ja) 1997-04-28 2003-11-05 三菱電機株式会社 メッキ処理装置およびメッキ処理方法
KR100664421B1 (ko) * 2006-01-10 2007-01-03 주식회사 인지소프트 구비된 카메라를 이용한 명함 인식을 위한 휴대용 단말기및 명함 인식 방법
US8228522B2 (en) * 2007-01-29 2012-07-24 Kabushiki Kaisha Toshiba Document data management apparatus to manage document data read and digitized by an image reading apparatus and a technique to improve reliability of various processing using document data
US8014604B2 (en) * 2008-04-16 2011-09-06 International Business Machines Corporation OCR of books by word recognition
JP5464474B2 (ja) 2008-08-20 2014-04-09 株式会社 ハンモック Ocrシステム
CN102567725A (zh) * 2011-12-23 2012-07-11 国网电力科学研究院 一种金融ocr系统手写体数字串的软切分方法
JP6702629B2 (ja) * 2014-12-27 2020-06-03 株式会社 ハンモック 活字ocrシステム
JP6531738B2 (ja) * 2016-08-08 2019-06-19 京セラドキュメントソリューションズ株式会社 画像処理装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0298795A (ja) * 1988-10-06 1990-04-11 Canon Inc 文字認識装置
JPH11306279A (ja) * 1998-04-20 1999-11-05 Oki Electric Ind Co Ltd 文字認識装置および文字認識方法
JP2003303315A (ja) * 2002-04-12 2003-10-24 Hitachi Ltd 帳票読み取りシステム、帳票読み取り方法及びそのためのプログラム
JP2007233900A (ja) * 2006-03-03 2007-09-13 Fuji Xerox Co Ltd 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
JP2017091419A (ja) * 2015-11-16 2017-05-25 富士ゼロックス株式会社 情報処理装置、画像読み取り装置及びプログラム
JP2018124854A (ja) * 2017-02-02 2018-08-09 富士ゼロックス株式会社 画像処理装置および画像処理プログラム

Also Published As

Publication number Publication date
CN112639818B (zh) 2024-06-04
JP7176566B2 (ja) 2022-11-22
CN112639818A (zh) 2021-04-09
WO2020045039A1 (ja) 2020-03-05
US20210319248A1 (en) 2021-10-14
US11972197B2 (en) 2024-04-30

Similar Documents

Publication Publication Date Title
JP5712487B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
WO2018196661A1 (zh) 一种图像处理装置及其图像处理方法
US20190124229A1 (en) Image processing apparatus and non-transitory computer readable medium storing image processing program
US20130290840A1 (en) Document Management Apparatus for Managing a Document Image Including Handwritten Comment Areas
US9614984B2 (en) Electronic document generation system and recording medium
JP7176566B2 (ja) Ocrシステム
US20150254506A1 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium
JP2008052439A (ja) 画像処理システムおよび画像処理プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP6536829B2 (ja) 画像形成装置および文字描画プログラム
JP6536828B2 (ja) 画像形成装置および文字描画プログラム
US20200184075A1 (en) Image forming apparatus, virus checking method and non-transitory computer-readable recording medium encoded with virus checking program
KR20200124536A (ko) 문서의 사용자 고유 정보 입력 영역에 대한 사용자 고유 정보의 삽입
JP2008059255A (ja) 情報入力装置、及びプログラム
JP5860434B2 (ja) 画像形成システム、ログ画像抽出プログラムおよび画像形成装置
JP2019161352A (ja) 情報処理装置及び情報処理プログラム
JP7388176B2 (ja) 情報処理装置及び情報処理プログラム
US20230386234A1 (en) Image processing apparatus and image processing method
US11528382B2 (en) Image processing apparatus generating output data by editing unwanted element needing copyright processing
JP2013111824A (ja) 画像形成装置
JP4360418B2 (ja) 画像処理装置、ビューワ、画像処理プログラム及び画像処理システム
JP2009060216A (ja) 画像処理装置及び画像処理プログラム
JP6535994B2 (ja) ファックス装置、通信プログラム、及び通信システム
JP6606885B2 (ja) 画像処理装置及び画像処理プログラム
JP2021170297A (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A527

Effective date: 20210224

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220708

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221011

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221024

R150 Certificate of patent or registration of utility model

Ref document number: 7176566

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150