JP2021018520A - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム Download PDF

Info

Publication number
JP2021018520A
JP2021018520A JP2019132818A JP2019132818A JP2021018520A JP 2021018520 A JP2021018520 A JP 2021018520A JP 2019132818 A JP2019132818 A JP 2019132818A JP 2019132818 A JP2019132818 A JP 2019132818A JP 2021018520 A JP2021018520 A JP 2021018520A
Authority
JP
Japan
Prior art keywords
character
pattern
cpu
ocr
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019132818A
Other languages
English (en)
Other versions
JP7317612B2 (ja
JP2021018520A5 (ja
Inventor
聡史 河原
Satoshi Kawahara
聡史 河原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019132818A priority Critical patent/JP7317612B2/ja
Priority to US16/928,447 priority patent/US11972208B2/en
Publication of JP2021018520A publication Critical patent/JP2021018520A/ja
Publication of JP2021018520A5 publication Critical patent/JP2021018520A5/ja
Application granted granted Critical
Publication of JP7317612B2 publication Critical patent/JP7317612B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】帳票等の文書におけるOCR処理において、単語辞書に登録できないが重要である、1回性の高いID類(シリアル番号、会員ID、患者ID、等)の文字列をより精度よく文字認識することができる情報処理装置、情報処理方法及びプログラムを提供する。【解決手段】画像処理装置は、文字認識処理の結果の文字列が、単語辞書の単語に合致しない場合で、予め定義されている文字種の並びのパターンに類似するパターンが存在する時は、パターンによる重み付けを行う文字認識処理に変更して、OCR処理を行う。【選択図】図3

Description

本発明は、情報処理装置、情報処理方法及びプログラムに関する。
従来から、複写機又はスキャナで帳票及び一般文書を画像データに変換し、原稿の内容をOCR(optical character recognition)処理する方法が知られている。OCR処理によって予測された候補文字に対して、予め定義しておいた単語リストと照らし合わせて、近しい文字列を見つける「単語マッチング」という方法がある。また個々の文字のOCR精度を上げる方法として、特許文献1では、日本語OCRして英数字がみつかった場合、その前後も含めて英語OCRする方法が検討されている。
特開2004−046315号公報
特に前述の単語リストによれば、事前にわかっている単語、例えば帳票に登場しうる顧客名リスト、を登録しておくことによって、多少OCRの精度が低くても、正解を見つけ出す補正処理が可能になる。しかし、特に帳票類において、特定の項目をOCRして抽出する処理を考えると、この方法が難しい場合がある。例えば、修理サービスの依頼帳票において、修理品のシリアル番号(例:「IXP089OP:3208Q」、「E86IL1103IO」、「0x32−0333−3083A6」等)が記載されており、その文字列を読み取りたいとする。シリアル番号のような多様かつ大量な、1回性の高い文字列を単語リストに登録することは難しい。しかしながら、シリアル番号の管理は重要であるため、OCRの正確性は重要である。このような性質の文字列は、他にも会員ID、患者ID等、多岐にわたるが何れも帳票中の重要な情報である。
本発明の情報処理装置は、単語辞書の単語に合致しない文字認識処理の結果の文字列に、予め定義されている文字種の並びのパターンに類似するパターンが存在する場合、前記パターンに基づいて前記文字列に対する文字認識処理を変更する制御手段を有することを特徴とする。
本発明によれば、1回性の高いID類の文字列を、より精度よく文字認識することができる。
画像処理システムのシステム構成の一例を示す図である。 画像処理装置のハードウェア構成の一例を示す図である。 画像処理装置のOCR処理の一例を示すフローチャートである。 図3のステップS302の詳細なフローチャートである。 単語と文章の一例を示す図である。 図3のステップS310の詳細なフローチャートである。 OCR結果と信頼度を説明するための図である。 文字列パターンの一例を示す図である。 OCR結果と信頼度を説明するための図である。 OCR信頼度と文字列パターンの関係を示す図である。 図3のステップS310の詳細なフローチャートである。
以下、本発明の実施形態について図面に基づいて説明する。
<実施形態1>
(システム構成)
図1は、画像処理システムのシステム構成の一例を示す図である。
図1に示すように、画像処理装置100、PC/サーバー端末101はイーサネット(登録商標)、無線LAN等からなるLAN104に接続され、Internet105に接続されている。また、モバイル端末103は、公衆無線通信網102等からInternet105に接続されている。画像処理装置100、PC/サーバー端末101及び、モバイル端末103は、LAN104又は、公衆無線通信網102からInternet105に接続され、相互に通信可能となっている。PC/サーバー端末101とモバイル端末103に関しては、どちらか一方が画像処理システムに含まれる構成でもよい。また、画像処理装置100がPC/サーバー端末101及びモバイル端末103が何れか又は双方が実施する処理を行ってもよい。
画像処理装置100は操作部、スキャナ部及び、プリンタ部を有する複写複合機である。本実施形態のシステムで、画像処理装置100は、複数枚の名刺、免許証、ハガキ等原稿を読み取るスキャン端末として利用される。特に本実施形態においては、画像処理装置100は、複数枚のレシートを読み取るスキャン端末として利用される。また、画像処理装置100は、原稿を読み取って得られたスキャン画像から原稿ごとの原稿画像を抽出するマルチクロップ処理を実施する。更に、画像処理装置100は、表示部、タッチパネル、ハードボタン等の操作部を有し、エラー通知、指示通知等の表示、スキャン操作、設定操作等の操作を行う。
PC/サーバー端末101は、画像処理装置100で生成された画像を表示する。また、PC/サーバー端末101は、画像処理装置100が生成した原稿画像の保存、OCR(optical character recognition)処理等を実施し、再利用可能なコンテンツデータを生成する。なお、画像処理装置100が実施するマルチクロップ処理をPC/サーバー端末101で実施してもよい。更に、画像処理装置100、及びPC/サーバー端末101は、クラウドやサーバー等の外部ストレージとの通信も可能で、保存した画像、メタデータを外部ストレージへ送信することができる。なお、本実施形態では、画像処理装置100で原稿画像の保存、言語推定後のメタデータ生成を行った後、PC/サーバー端末101へ送信を行う処理を説明するが、PC/サーバー端末101で同機能を備えてもよい。
また、モバイル端末103は、操作部、無線通信部、ウェブブラウザを動作させるアプリ部を有するスマートフォン又はタブレット端末である。本実施形態のシステムで、モバイル端末103は、PC/サーバー端末101と同様に表示端末、操作端末及び、コンテンツデータ生成、保存端末として利用される。なお、PC/サーバー端末101とモバイル端末103は、表示及び操作、メタデータ生成、コンテンツデータ生成及び保存の機能等、どちらか一方の構成でもよい。
以上の構成要素はあくまで例示であり、すべての構成が必要というものではない。
また、モバイル端末103は、操作部、無線通信部、ウェブブラウザを動作させるアプリ部を有するスマートフォン又はタブレット端末である。本実施形態のシステムで、モバイル端末103は、PC/サーバー端末101と同様に表示端末、操作端末及び、コンテンツデータ生成、保存端末として利用される。なお、PC/サーバー端末101とモバイル端末103は、表示及び操作、メタデータ生成、コンテンツデータ生成及び保存の機能等、どちらか一方の構成でもよい。
以上の構成要素はあくまで例示であり、すべての構成が必要というものではない。
(画像処理装置100のハードウェア構成)
図2は、画像処理装置100のハードウェア構成の一例を示す図である。制御部110は、CPU111、記憶装置112、ネットワークI/F部113、スキャナI/F部114、表示・操作部I/F部115で構成され、これらはシステムバス116を介して互いに通信可能に接続されている。制御部110は、画像処理装置100全体の動作を制御する。
CPU111は、記憶装置112に記憶された制御プログラムを読み出して読取制御及び送信制御等の各種制御を行う。
記憶装置112は、プログラム、画像、メタデータ、設定データ及び処理結果データ等を格納し保持する。記憶装置112は、不揮発性メモリであるROM117、揮発性メモリであるRAM118及び、大容量記憶領域であるHDD119等で構成される。
ROM117は、制御プログラム等を保持する。CPU111がROM117又はHDD119に記憶された制御プログラムを読み出し、実行することにより、後述する図3、図6、図8、図9、図11のフローチャートの処理が実現される。
RAM118は、CPU111の主メモリ、ワークエリア等の一時記憶領域として用いられる。
HDD119は、大容量記憶領域であるHDDで、画像、メタデータ等を保存する記憶領域として用いられる。
ネットワークI/F部113は、制御部110又は画像処理装置100をLAN104に接続するインタフェースである。ネットワークI/F部113は、PC/サーバー端末101及びモバイル端末103等のLAN104上の外部装置に画像を送信したり、LAN104上の外部装置から各種情報を受信したりする。
スキャナI/F部114は、スキャナ部120と制御部110を接続するインタフェースである。スキャナ部120は、原稿台上の画像を読み取ってスキャン画像を生成し、スキャナI/F部114を介して制御部110に入力する。
表示・操作部I/F部115は、表示・操作部121と制御部110とを接続するインタフェースである。表示・操作部121には、タッチパネル機能を有する液晶表示部及びテンキー、スタートボタン、キャンセルボタン等のハードキーが備えられている。スタートボタンは、コピー及びスキャンの処理を開始させるためのボタンである。キャンセルボタンは画像処理装置100が実行中の処理を一時停止、又は中止するためのボタンである。
その他、画像処理装置100にはプリンタ部等もあるものがあるが、本実施形態では用いないため説明を省略する。
以上のように、本実施形態に係る画像処理装置100は、図2に示したハードウェア構成によって、画像処理機能を提供することができる。
(OCR処理の概要フローチャート)
図3は、画像処理装置100のOCR処理の一例を示すフローチャートである。OCR処理は画像より文字を認識する文字認識処理の一例である。また、図3のフローチャートは、画像処理装置100の情報処理の一例を示すフローチャートでもある。
ステップS300において、CPU111は、OCR処理のためにまず原稿の画像をレイアウト解析する。レイアウト解析では、一般に画像上の画素がどのようなドキュメント上の意味を有するかを推定する。例えば、CPU111は、「文字」「表」「図」「写真」「罫線」等の要素に、原稿画像の座標領域を分解する。ここでは、特に「文字」という領域を判別できる方法であれば、その手法は問わない。
ステップS300によりレイアウト解析結果を得られたら、ステップS301において、CPU111は、その中から文字の領域を取り出し、更に文字のブロックに分割する。一般にレイアウト解析では、文字領域を分解した場合、段落のような塊で分解することが多い。そのため、後続の処理に有利なようにここでは文字が、一定の距離以内に集まっているブロックになるように、分割する。これは、例えばヒストグラム法等を用いることで実現できるが、文字のブロックが分割できる方法であれば、その手法は問わない。
ステップS301により文字ブロックが分割できたら、ステップS302において、CPU111は、それらのブロックを「文」と「単語」に分別する。ステップS302の処理の詳細は図4を用いて後述する。
ステップS302により文字ブロックが文と単語に分別されたら、ステップS303において、CPU111は、単語に分別された文字ブロックだけを、単語リストとマッチングする。単語リストは、予め登録されている単語の一覧である。単語リストは、単語辞書の一例である。
ステップS304において、CPU111は、文字ブロックが単語リストとマッチングしたか否か、即ち、文字ブロックが単語リストに含まれる単語と合致したか否か、を判定する。CPU111は、文字ブロックが単語リストとマッチングしたと判定すると、処理をステップS305へ進める。ステップS305において、CPU111は、対象単語は通常の単語であり、OCRは成功したとみなしてOCR処理を終了する。一方、CPU111は、文字ブロックが単語リストとマッチングしなかったと判定すると、単語リストに登録されないID類の可能性がある、として、処理をステップS310へ進める。
ステップS310において、CPU111は、文字列パターン検出を行う。ステップS310の処理の詳細は図6を用いて後述する。
ステップS311において、CPU111は、ステップS310の文字列パターン検出において、文字列パターンを検出できたか否かを判定する。CPU111は、文字列パターンを検出できたと判定した場合、処理をステップS312へ進める。文字列パターンを検出できなかったと判定した場合、処理をステップS314へ進める。
ステップS312において、CPU111は、検出した文字列パターンに沿って重み付けOCR処理を行う。ステップS312の処理の詳細は図11を用いて後述する。
ステップS313において、CPU111は、ステップS312にて文字列パターンに適合する結果が重み付けOCRで検出できたか否かを判定する。CPU111は、文字列パターンに適合する結果が重み付けOCRで検出できたと判定した場合、OCR処理を終了する。CPU111は、文字列パターンに適合する結果が重み付けOCRで検出できなかったと判定すると、処理をステップS314へ進める。
ステップS314において、CPU111は、本実施形態の処理でも処理不可能な文字列パターンであると判断する。そして、CPU111は、OCR処理を終了する。
(「文と単語の分別(ステップS302)」の実行フロー)
図4を用いて、図3のステップS302の詳細なフローチャートの処理を説明する。
ステップS400において、CPU111は、ステップS301で分割された文字ブロックを、近接している距離に応じて、文字グループとして分割する。一般的に、横書きの原稿を対象にすると、横方向の文字間隔の連続の分布によって、複数の文字グループへ分割することができる。
例として、図5に、単語と文章の例をあげる。例えば、504と505では、それぞれのグループでは文字間がほとんどなく、連続しているが、501〜503では、それより文字間は開いている。しかし、開いていても文字間が同じで連続している状態なので、501〜503はひとまとまりの文字のグループと判断される。このようなグループ分割の方法は様々な方法が採用でき、本実施形態ではその詳細は問わない。
ステップS401において、このようにして分割した文字グループから、CPU111は、その構成文字ブロックを包含する外接矩形を計算する。ステップS402において、CPU111は、その外接矩形のサイズから、縦横比及び文字数の関係が閾値以上かどうかを判定する。CPU111は、閾値以上である場合、処理をステップS403へ進める。CPU111は、閾値以上でない場合、処理をステップS404へ進める。
ステップS403において、CPU111は、該当の文字グループは「文章である」と判定する。
ステップS404において、CPU111は、該当の文字グループは「単語である」と判定する。
例えば図5の504及び501〜503は単語と判断される例である。505は文章と判断される例である。
(「文字列パターン検出(ステップS310)」の実行フロー)
図6を用いて、図3のステップS310の詳細なフローチャートの処理を説明する。
ステップS304で「単語マッチング」しなかった単語は、CPU111は、ID類のような単語登録のできない単語とみなし、文字列パターンを検出する。
ステップS600において、CPU111は、まず文字グループを通常OCR(特別なバイアスのない一般的な文字OCR)した結果から、各文字をOCRしたときに一般的に計算される「OCR候補文字」を取得する。
OCR候補文字は、一例としては図7のように得られる。OCR対象の画像文字列700に対して、それぞれの文字に対してOCR計算結果として、候補と考えられる文字コードを、信頼度(OCR処理が正答と考える確率)と共に出力することが一般的である。例えば、画像中の「2」という文字に対して、OCR処理は「2」「Z」「S」「s」という文字が考えられ、その確率はそれぞれ「80%」「50%」「30%」「10%」である、ということである。
ステップS601において、CPU111は、この情報から、可能性のある文字列パターンを生成する。
ここで、「文字列パターン」とは、どのような表現でもよいが、例えば図8のような正規表現を使ったものが考えられる。例えば具体的なID文字列801は、一般化した場合、正規表現としては802のように表現できる。同様に郵便番号文字列803は、一般化して正規表現としては804のように表現できる。
ステップS601の目的は、ある文字グループをOCRした結果から、その文字グループが属するかもしれない一般化された文字列パターンを推定することである。
例えば、図7の結果を、信頼度の%数値順にマップすると、図9のようになるが、その内容を文字の種類(数字・英字)ごとに正規表現に置き換え、上位から詰めてパターン化すると図10のようになる。これを単純化すると、最上位(最上列)のOCR候補は「〒[0-9]{3}-[0-9]{3}[A-Z]」と表現できることになる。これは、図8の804と比較すると、最後の「[A-Z]」だけが違っていることになる。
そこで、ステップS602において、CPU111は、このような登録済みの文字列パターン(図8のような定義)と、OCR結果からステップS601で推定したパターンを比較する。登録済みの文字列パターンは、予め定義されている文字種の並びのパターンの一例である。そして、ステップS603において、CPU111は、比較の結果、差分が閾値以下であるかどうかを判定する。CPU111は、差分が閾値以下であると判定すると、処理をステップS606へ進める。CPU111は、差分が閾値以下でないと判定すると、処理をステップS604へ進める。差分が閾値以下であるとは、パターンが類似する一例である。ステップS603において、Yesと判定される処理は、単語辞書の単語に合致しない文字認識処理の結果の文字列に、予め定義されている文字種の並びのパターンに類似するパターンが存在する場合の処理の一例である。
ステップS606において、CPU111は、マッチするパターンが発見された、として、パターン候補に追加する。ステップS603ののち、又はステップS606ののち、ステップS604において、CPU111は、パターン生成のために利用可能な候補文字はまだ残っているかを判定する。ここでやることは、図10の上位の列からたどっていって、下位の候補文字のパターンが変化する点がまだ残っているか、を調べることである。例えば、70%のランクまで落とすと(上から3列目)、パターンは「〒[0-9]{3}-[A-Z]{2}[0-9][A-Z]」となり、変化するため利用可能な候補は残っている、といえる。
CPU111は、利用可能な候補文字は残っていると判定すると、新しい文字列パターンを生成するために、処理をステップS601へ戻す。CPU111は、利用可能な候補文字は残っていないと判定すると、処理をステップS607へ進める。
ステップS607において、CPU111は、パターン候補を呼び出し側に返す。
(「重み付けOCR処理(ステップS312)」の実行フロー)
図11を用いて、図3のステップS310の詳細なフローチャートの処理を説明する。
ステップS1100において、CPU111は、ステップS310で検出した文字列パターンから、ひとつのパターンを選択する。CPU111は、そのパターンから、各文字に対してOCRの計算結果を限定する指定字種を生成する。これは例えば「[0-9]」であれば、「0123456789」という結果のみをOCR結果として出力するように、OCR計算をバイアス化する、というものである。これを「字種限定OCR」というが、その実現方法の詳細は問わない。例えば、OCRのための特徴量比較処理自体を制限することもできるし、OCR結果の候補文字をフィルタリングする、という方法も取れる。ステップS1101において、CPU111は、この字種限定を行って、各文字を再度OCRする。このとき、CPU111は、例えば通常OCRよりも多量の特徴量を利用する等、OCR処理自体の精度をあげる処理を行ってもよい。ステップS1101の処理は、パターンに基づいて文字列に対する文字認識処理を変更する制御処理の一例である。
ステップS1102において、CPU111は、再度OCRした結果、各文字のOCR信頼度が全て閾値(例えば90%等)以上か否かを判定する。CPU111は、各文字のOCR信頼度が全て閾値以上であると判定すると、処理をステップS1106へ進める。CPU111は、各文字のOCR信頼度が全て閾値以上でないと判定すると、処理をステップS1104へ進める。
ステップS1106において、CPU111は、ステップS1101の結果得られたOCR結果を、該当の文字グループに対する最も確からしいOCR結果と確定する。そして、CPU111は、重み付けOCR処理を終了する。
ステップS1104において、CPU111は、候補となる文字列パターンはまだ残っているかを判定する。CPU111は、候補となる文字列パターンがまだ残っている場合は、処理をステップS1100へ戻し、新しい文字列パターンを選択し、ステップS1100からの処理を繰り返す。CPU111は、候補となるパターン文字列が他にない場合は、処理をステップS1107へ進める。ステップS1107において、CPU111は、最終的にパターンマッチできなかったとする。そして、CPU111は、重み付けOCR処理を終了する。
以上、本実施形態によれば、1回性の高いID類の文字列を、より精度よく文字認識することができる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給する。そして、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読み出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の実施形態の一例について詳述したが、本発明は係る特定の実施形態に限定されるものではない。
100 画像処理装置
111 CPU

Claims (5)

  1. 単語辞書の単語に合致しない文字認識処理の結果の文字列に、予め定義されている文字種の並びのパターンに類似するパターンが存在する場合、前記パターンに基づいて前記文字列に対する文字認識処理を変更する制御手段を有することを特徴とする情報処理装置。
  2. 前記文字列に、予め定義されている文字種の並びのパターンに類似するパターンが存在するか否かを判定する判定手段を更に有し、
    前記判定手段により前記文字列に、予め定義されている文字種の並びのパターンに類似するパターンが存在すると判定された場合、前記制御手段は、前記パターンに基づいて前記文字列に対する文字認識処理を変更することを特徴とする請求項1に記載の情報処理装置。
  3. 前記制御手段は、前記パターンに基づいて前記文字列に対する字種限定を行った文字認識処理を行うことを特徴とする請求項1又は2に記載の情報処理装置。
  4. 情報処理装置が実行する情報処理方法であって、
    単語辞書の単語に合致しない文字認識処理の結果の文字列に、予め定義されている文字種の並びのパターンに類似するパターンが存在する場合、前記パターンに基づいて前記文字列に対する文字認識処理を変更する制御工程を含むことを特徴とする情報処理方法。
  5. コンピュータを、請求項1乃至3の何れか1項に記載の情報処理装置の各手段として機能させるためのプログラム。
JP2019132818A 2019-07-18 2019-07-18 情報処理装置、情報処理方法及びプログラム Active JP7317612B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019132818A JP7317612B2 (ja) 2019-07-18 2019-07-18 情報処理装置、情報処理方法及びプログラム
US16/928,447 US11972208B2 (en) 2019-07-18 2020-07-14 Information processing device and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019132818A JP7317612B2 (ja) 2019-07-18 2019-07-18 情報処理装置、情報処理方法及びプログラム

Publications (3)

Publication Number Publication Date
JP2021018520A true JP2021018520A (ja) 2021-02-15
JP2021018520A5 JP2021018520A5 (ja) 2022-07-26
JP7317612B2 JP7317612B2 (ja) 2023-07-31

Family

ID=74343184

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019132818A Active JP7317612B2 (ja) 2019-07-18 2019-07-18 情報処理装置、情報処理方法及びプログラム

Country Status (2)

Country Link
US (1) US11972208B2 (ja)
JP (1) JP7317612B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7234495B2 (ja) * 2018-01-25 2023-03-08 富士フイルムビジネスイノベーション株式会社 画像処理装置及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0589281A (ja) * 1991-09-26 1993-04-09 Fuji Facom Corp 誤読修正・検出方法
US20040086179A1 (en) * 2002-11-04 2004-05-06 Yue Ma Post-processing system and method for correcting machine recognized text
JP2010102668A (ja) * 2008-10-27 2010-05-06 Hitachi Software Eng Co Ltd メタデータ抽出装置およびその方法
JP2014170452A (ja) * 2013-03-05 2014-09-18 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2015138396A (ja) * 2014-01-22 2015-07-30 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2016201013A (ja) * 2015-04-13 2016-12-01 富士ゼロックス株式会社 文字認識装置、文字認識処理システム、およびプログラム
US20170372161A1 (en) * 2016-06-24 2017-12-28 Accenture Global Solutions Limited Intelligent automatic license plate recognition for electronic tolling environments

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3919617B2 (ja) 2002-07-09 2007-05-30 キヤノン株式会社 文字認識装置および文字認識方法、プログラムおよび記憶媒体
US9727804B1 (en) * 2005-04-15 2017-08-08 Matrox Electronic Systems, Ltd. Method of correcting strings
US8340425B2 (en) * 2010-08-10 2012-12-25 Xerox Corporation Optical character recognition with two-pass zoning
US9256795B1 (en) * 2013-03-15 2016-02-09 A9.Com, Inc. Text entity recognition
US9305226B1 (en) * 2013-05-13 2016-04-05 Amazon Technologies, Inc. Semantic boosting rules for improving text recognition
WO2016171901A1 (en) * 2015-04-20 2016-10-27 3M Innovative Properties Company Dual embedded optical character recognition (ocr) engines
US10769200B1 (en) * 2015-07-01 2020-09-08 A9.Com, Inc. Result re-ranking for object recognition
US10621237B1 (en) * 2016-08-01 2020-04-14 Amazon Technologies, Inc. Contextual overlay for documents
US10963717B1 (en) * 2018-12-21 2021-03-30 Automation Anywhere, Inc. Auto-correction of pattern defined strings

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0589281A (ja) * 1991-09-26 1993-04-09 Fuji Facom Corp 誤読修正・検出方法
US20040086179A1 (en) * 2002-11-04 2004-05-06 Yue Ma Post-processing system and method for correcting machine recognized text
JP2010102668A (ja) * 2008-10-27 2010-05-06 Hitachi Software Eng Co Ltd メタデータ抽出装置およびその方法
JP2014170452A (ja) * 2013-03-05 2014-09-18 Fuji Xerox Co Ltd 画像処理装置及びプログラム
JP2015138396A (ja) * 2014-01-22 2015-07-30 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP2016201013A (ja) * 2015-04-13 2016-12-01 富士ゼロックス株式会社 文字認識装置、文字認識処理システム、およびプログラム
US20170372161A1 (en) * 2016-06-24 2017-12-28 Accenture Global Solutions Limited Intelligent automatic license plate recognition for electronic tolling environments

Also Published As

Publication number Publication date
US20210019554A1 (en) 2021-01-21
JP7317612B2 (ja) 2023-07-31
US11972208B2 (en) 2024-04-30

Similar Documents

Publication Publication Date Title
JP4742404B2 (ja) 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
US9098759B2 (en) Image processing apparatus, method, and medium for character recognition
US20060285748A1 (en) Document processing device
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
JP7562292B2 (ja) 情報処理装置、サーバ、システム、情報処理方法、およびプログラム
US11941903B2 (en) Image processing apparatus, image processing method, and non-transitory storage medium
JP7317612B2 (ja) 情報処理装置、情報処理方法及びプログラム
US10984285B2 (en) Information processing apparatus and non-transitory computer readable medium
US10638001B2 (en) Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data
CN101753752B (zh) 图像处理设备和执行图像处理的方法
US20230046344A1 (en) Systems, Methods, and Devices for a Form Converter
JP2020184275A (ja) 画像処理装置、画像処理方法、及びプログラム
US20220207900A1 (en) Information processing apparatus, information processing method, and storage medium
JP7021496B2 (ja) 情報処理装置及びプログラム
US20180307669A1 (en) Information processing apparatus
JP6763173B2 (ja) 文書修正方法、文書修正装置、およびコンピュータプログラム
JP6870159B1 (ja) データ処理装置、データ処理方法及びプログラム
JP2008257543A (ja) 画像処理システム及びプログラム
JP2019057137A (ja) 情報処理装置及び情報処理プログラム
US20210064815A1 (en) Information processing apparatus and non-transitory computer readable medium
US11006015B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP2020135095A (ja) 情報処理装置及びプログラム
US11659106B2 (en) Information processing apparatus, non-transitory computer readable medium, and character recognition system

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220715

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230613

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230719

R151 Written notification of patent or utility model registration

Ref document number: 7317612

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151