JP2020135172A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2020135172A
JP2020135172A JP2019025186A JP2019025186A JP2020135172A JP 2020135172 A JP2020135172 A JP 2020135172A JP 2019025186 A JP2019025186 A JP 2019025186A JP 2019025186 A JP2019025186 A JP 2019025186A JP 2020135172 A JP2020135172 A JP 2020135172A
Authority
JP
Japan
Prior art keywords
character
character string
specific
string
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019025186A
Other languages
English (en)
Other versions
JP7268389B2 (ja
Inventor
公則 吉塚
Kiminori Yoshizuka
公則 吉塚
岡田 茂
Shigeru Okada
茂 岡田
久保 周作
Shusaku Kubo
周作 久保
真太郎 安達
Shintaro Adachi
真太郎 安達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2019025186A priority Critical patent/JP7268389B2/ja
Priority to US16/538,792 priority patent/US10984285B2/en
Publication of JP2020135172A publication Critical patent/JP2020135172A/ja
Application granted granted Critical
Publication of JP7268389B2 publication Critical patent/JP7268389B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】文字認識機能により誤認識されやすい文字が含まれている場合であっても、指定された文字又は文字列を抽出することを可能とする。【解決手段】画像に含まれる文字を認識して文字を示す文字情報を出力する認識手段と、認識手段による認識の精度を示す指標が予め定められた値未満となる第1の特定の文字と、認識手段により第1の特定の文字を認識することによって出力された第2の特定の文字とを関連付けて記憶する記憶手段と、操作者が第1の文字又は文字列を登録する操作をした場合において、第1の文字又は文字列に第1の特定の文字が含まれている場合に、第1の文字又は文字列とともに、第1の文字又は文字列中の第1の特定の文字を第2の特定の文字に替えて構成した第2の文字又は文字列を抽出の対象として登録する登録手段と、文字情報から、抽出の対象として登録された第1の文字又は文字列及び第2の文字又は文字列を抽出する抽出手段とを含む。【選択図】図6

Description

本発明は、情報処理装置及びプログラムに関する。
近年、OCRにより誤認識された文字列を、正しい文字列に補正するための置換辞書を自動的に作成する文書処理装置が提案されている(例えば、特許文献1参照。)。
特許文献1に記載された文書処理装置は、業務文書を画像化したサンプル電子文書データから切り分けた正解文字列と、前記サンプル電子文書データに対してOCRを行った結果得られるOCR後サンプル文書データから切り分けたOCR後文字列と、を比較単位とし、誤認識の判定を行うマッチング処理部と、前記正解文字列を所定の単語単位に切り分け、該切り分けた単語のうち前記マッチング処理部で誤認識と判定された文字を含む単語を誤認識パターン候補として登録する解析処理部と、記憶装置に格納された日本語の単語が登録された日本語辞書データ及び業務で使用される単語が登録された業務単語辞書データに含まれる単語と部分一致または完全一致する単語を前記誤認識パターン候補から削除してフィルタリングし、該フィルタリング後の誤認識パターン候補を誤認識パターンとして前記記憶装置へ格納するフィルタリング処理部とを備える。
特開2011−107966号公報
本発明の課題は、文字認識機能により誤認識されやすい文字が含まれている場合であっても、指定された文字又は文字列を抽出することが可能な情報処理装置及びプログラムを提供することにある。
[1]画像に含まれる文字を認識して前記文字を示す文字情報を出力する認識手段と、
前記認識手段による認識の精度を示す指標が予め定められた値未満となる第1の特定の文字と、前記認識手段により前記第1の特定の文字を認識することによって出力された第2の特定の文字とを関連付けて記憶する記憶手段と、
操作者が、抽出の対象として第1の文字又は文字列を登録する操作をした場合において、前記第1の文字又は文字列に前記第1の特定の文字が含まれている場合に、前記第1の文字又は文字列とともに、前記第1の文字又は文字列中の前記第1の特定の文字を前記第2の特定の文字に替えて構成した第2の文字又は文字列を前記抽出の対象として登録する登録手段と、
前記文字情報から、前記抽出の対象として登録された前記第1の文字又は文字列及び前記第2の文字又は文字列を抽出する抽出手段と、
を備える情報処理装置。
[2]前記登録手段は、前記第1の文字又は文字列と同一の意味を有し、かつ、表記が異なる第3の文字又は文字列を前記抽出の対象としてさらに追加して登録する、
前記[1]に記載の情報処理装置。
[3]前記登録手段は、前記第3の文字又は文字列に前記第1の特定の文字が含まれる場合、前記第3の文字又は文字列中の前記第1の特定の文字を前記第2の文字に替えて構成した第4の文字又は文字列を前記抽出の対象としてさらに追加して登録する、
前記[2]に記載の情報処理装置。
[4]前記抽出の対象に複数の文字又は文字列が登録されている場合に、前記複数の文字又は文字列の順序を入れ替える入替手段をさらに備える、
前記[1]から[3]のいずれか1つに記載の情報処理装置。
[5]前記入替手段は、前記複数の文字又は文字列を構成する文字の数に応じて順序を入れ替える、
前記[4]に記載の情報処理装置。
[6]前記文字情報から抽出された文字又は文字列と前記抽出の対象として登録された文字又は文字列とが一致する度合いが予め定められた値以上の場合に、前記抽出された文字又は文字列と関連付いた値を表示するよう制御する表示制御手段をさらに備える、
前記[1]から[5]のいずれか1つに記載の情報処理装置。
[7]前記度合いが予め定められたしきい値以上の場合に前記抽出された文字又は文字列のうち、前記登録された文字又は文字列に含まれない第3の特定の文字を前記第2の特定の文字として一次的に記録する記録手段をさらに備える、
前記[6]に記載の情報処理装置。
[8]前記記憶手段は、予め定められた個数以上の前記第3の特定の文字が記録された場合に、前記第3の特定の文字を前記第2の特定の文字として記憶するとともに、前記第3の特定の文字に対応する前記第1の特定の文字を前記第2の特定の文字と関連付けてさらに記憶する、
前記[7]に記載の情報処理装置。
[9]前記予め定められた個数を第1の個数とした場合に、
前記記憶手段は、前記抽出された文字又は文字列の前記画像内の位置が予め定められた範囲にあるとき、前記第1の個数よりも小さい第2の個数以上の前記第3の特定の文字が記録された場合に、前記第3の特定の文字を前記第2の特定の文字として、前記第3の特定の文字に対応する前記第1の特定の文字と関連付けてさらに記憶する、
前記[7]に記載の情報処理装置。
[10]画像に含まれる文字を認識して前記文字を示す文字情報を出力する認識手段と、
前記認識手段による認識の精度を示す指標が予め定められた値未満となる第1の特定の文字と、前記認識手段により前記第1の特定の文字を認識することによって出力された第2の特定の文字とを対応付けて記憶する記憶手段と、
前記文字情報から抽出の対象となる第1の文字又は文字列を登録する登録手段と、
前記第1の文字又は文字列に前記第1の特定の文字が含まれている場合に、前記第1の文字又は文字列中の前記第1の特定の文字を前記第2の特定の文字に替えて構成した第2の文字又は文字列を前記抽出の対象として追加する追加手段と、
前記文字情報から前記第1の文字又は文字列及び前記第2の文字又は文字列を抽出する抽出手段と、
を備える、情報処理装置。
[11]コンピュータを、
画像に含まれる文字を認識して前記文字を示す文字情報を出力する認識手段と、
前記認識手段による認識の精度を示す指標が予め定められた値未満となる第1の特定の文字と、前記認識手段により前記第1の特定の文字を認識することによって出力された第2の特定の文字とを関連付けて記憶する記憶手段と、
操作者が、抽出の対象として第1の文字又は文字列を登録する操作をした場合において、前記第1の文字又は文字列に前記第1の特定の文字が含まれている場合に、前記第1の文字又は文字列とともに、前記第1の文字又は文字列中の前記第1の特定の文字を前記第2の特定の文字に替えて構成した第2の文字又は文字列を前記抽出の対象として登録する登録手段、
前記文字情報から、前記抽出の対象として登録された前記第1の文字又は文字列及び第2の文字又は文字列を抽出する抽出手段
として、機能させるためのプログラム。
請求項1〜11に係る発明によれば、文字認識機能により誤認識されやすい文字が含まれている場合であっても、指定された文字又は文字列を抽出することができる。
図1は、本発明の第1の実施の形態に係る情報処理装置の制御系の一例を示すブロック図である。 図2は、誤認識辞書情報の一例を示す図である。 図3は、定義ファイルの一例を示す図である。 図4は、画面の一例を示す図であり、(a)は、選択画面の一例を示す図、(b)は、設定画面の一例を示す図、(c)は、確認画面の一例を示す図である。 図5は、請求書の一例を示す図である。 図6は、図1に示す情報処理装置の動作の一例を模式的に示す図である。 図7は、図1に示す情報処理装置の動作の一例を示すフローチャートである。 図8は、本発明の第2の実施の形態に係る情報処理装置の制御系の一例を示すブロック図である。 図9は、文書の一例を示す図であり、(a)は、第1の請求書の一例を示す図、(b)は、第2の請求書の一例を示す図である。 図10は、定義ファイルの一例を示す図であり、(a)は、キーの順序の入れ替え前の定義ファイルの一例を示す図、(b)は、キーの順序の入れ替え後の定義ファイルの一例を示す図である。 図11は、文字列の抽出の一例を示す図である。 図12は、本発明の第3の実施の形態に係る情報処理装置の制御系の一例を示すブロック図である。 図13は、誤認識候補辞書の一例を示す図である。 図14は、画面の一例を示す図であり、(a)は、候補画面の一例を示す図、(b)は、確認画面63の一例を示す図である。 図15は、誤認識辞書情報の一例を示す図である。 図16は、誤認識候補辞書情報の一例を示す図である。
以下、本発明の実施の形態について図面を参照して説明する。なお、各図中、実質的に同一の機能を有する構成要素については、同一の符号を付してその重複した説明を省略する。
[第1の実施の形態]
(情報処理装置の構成)
図1は、本発明の第1の実施の形態に係る情報処理装置の制御系の一例を示すブロック図である。このような情報処理装置1には、例えば、パーソナルコンピュータ、画像形成装置、タブレッド端末、多機能携帯電話機(スマートフォン)等が含まれる。以下、情報処理装置1として、スキャン機能、プリンタ機能、コピー機能、ファクシミリ機能、電子メール機能等の複数の機能を有する複合機を例に説明するが、情報処理装置1は、複合機に限定されるものではない。
この情報処理装置1は、各部を制御する制御部10と、各種のデータを記憶する記憶部11と、情報の入力及び表示を行う操作表示部12と、原稿から原稿画像を読み取る画像読取部14と、画像を印刷出力する画像出力部15と、外部ファクシミリ装置2に対して公衆回線網4を介してファクシミリ送受信を行うファクシミリ通信部16と、外部装置3との間でネットワーク5を介して通信するネットワーク通信部17とを備える。記憶部11は、記憶手段の一例である。
制御部10は、CPU(Central Processing Unit)、インターフェース等から構成されている。CPUは、記憶部11に記憶されたプログラム110に従って動作することにより、生成手段100、解析手段101、判定手段102、追加手段103、認識手段104、抽出手段105、表示制御手段106等として機能する。生成手段100及び追加手段103は、登録手段の一例である。各手段100〜106の詳細については後述する。
記憶部11は、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスク等から構成され、プログラム110や、形態素情報111、連想辞書情報112、誤認識辞書情報113(図2参照)、定義ファイル114(図3参照)、画面情報115(図4参照)、OCR情報116等の各種データを記憶する。各種データ111〜116の詳細については後述する。
操作表示部12は、例えば、タッチパネルディスプレイであり、液晶ディスプレイ等のディスプレイにタッチパネルを重合配置した構成を有する。
画像読取部14は、原稿から原稿画像を読み取るものであり、原稿台(不図示)上に設けられた自動原稿送り装置(不図示)と、スキャナ(不図示)とを備え、原稿台に配置された原稿、又は自動原稿送り装置により送られた原稿から原稿画像を光学的に読み取る。
画像出力部15は、例えば、電子写真方式、インクジェット方式等によりカラー画像又は白黒画像を用紙等の記録媒体に印刷出力する。
ファクシミリ通信部16は、G3、G4等のファクシミリプロトコルに従ってデータの変復調を行い、公衆回線網4を介してファクシミリ通信を行う。
ネットワーク通信部17は、NIC(Network Interface Card)等によって実現され、ネットワーク5を介して外部装置3との間で信号を送受信する。外部装置3には、例えば、パーソナルコンピュータ、サーバ装置等が含まれる。
ネットワーク5は、例えば、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネット、イントラネット等であり、有線でも無線でもよい。
〔各種データの詳細〕
次に、記憶部11に記憶された各種データの詳細について説明する。形態素情報111は、文字又は文字列の形態素の解析に用いる単語の品詞等の情報である。
連想辞書情報112は、表現の揺らぎの類型を記録した情報である。「表現の揺らぎ」とは、実質的な意味を変更しない表記上の相違をいう。連想辞書情報112には、例えば、以下の類型の表現の揺らぎが記録さていれる。
・類型1:名詞の接頭語(例えば、「お」、「こ」、「御」等)の有無の相違、
・類型2:送り仮名の相違(例えば、「見積」、「見積もり」、「見積り」等)、
・類型3:所有格を示す助詞「の」の有無の相違、及び
・類型4:一定の語句(例えば、「請求」に対して「請求書」)の有無の相違等。
なお、以下、基準となる文字又は文字列と同一の意味を有し、かつ、表記が異なる文字又は文字列を、「基準となる文字又は文字列から派生した、表現の有する文字又は文字列」ともいう。
図2は、誤認識辞書情報113の一例を示す図である。誤認識辞書情報113は、画像に対して後述する認識手段104によってOCR処理を施したときに、画像に記載されている実際の文字と異なる文字として誤って認識されやすい文字をリスト化したテーブルである。具体的には、誤認識辞書情報113には、OCR処理による認識の精度が低い文字と、誤った結果として出力された文字とを関連付けて記録されている。「認識の精度が低い文字」とは、例えば、OCR処理による認識の精度を示す指標が予め定められた値未満となる文字をいう。
ここで、「認識の精度を示す指標」とは、OCR処理によって文字が正しく認識されるか否かを示す度合いをいう。この指標には、例えば、同一の文字に対して複数回のOCR処理を実行した場合における実行したOCR処理の回数に対する正しく認識できた回数の割合(換言すれば、認識の成功率)や、特定の文字に対してOCR処理を実行した場合において出力された文字が当該特定の文字である可能性を示す割合(換言すれば、認識の確率)等が合まれる。この割合は、例えば、OCR情報116に記録された文字と認識された文字との一致率により与えられる。
この誤認識辞書情報113には、図2に示すように、「誤認識文字」欄と、「正解文字」欄と、が設けられている。「誤認識文字」欄には、OCR処理によって誤った結果として出力される文字、すなわち画像に記載されている実際の文字と異なる文字(以下、「誤認識文字」ともいう。)が記録されている。「正解文字」欄には、画像に記載されている実際の文字(以下、「正解文字」ともいう。)が記録されている。正解文字は、第1の特定の文字の一例である。誤認識文字は、第2の特定の文字の一例である。
誤認識文字は、例えば、対応する正解文字と同一の部首(例えば、辺、旁、冠、構等)を有して外観の形状が類似しているものが該当する。一例として、誤認識文字には、正解文字としての「請」に対応する「晴」や、正解文字としての「積」に対応する「責」、正解文字としての「求」に対応する「救」等が含まれる。
図3は、定義ファイル114の一例を示す図である。定義ファイル114は、検索の対象となる文字又は文字列(以下、「キー」又は「key」ともいう。)114aをリスト化して記録したファイルである。
図3に示すように、キー114aには、操作者(以下、単に「ユーザ」ともいう。)の操作に応じて記録された文字又は文字列(以下、「第1のキー」ともいう。)114bと、第1のキー114bに誤認識辞書情報113に記録された正解文字が含まれる場合に、この第1のキー114b中の当該正解文字を、対応する誤認識文字に替えて新たに構成した文字又は文字列(以下、「第2のキー」ともいう。)114cと、第1のキー114bから派生した、表現の揺らぎ含む文字又は文字列(以下、「第3のキー」ともいう。)114dと、第3のキー114dに誤認識辞書情報113に記録された正解文字が含まれる場合に、この第3のキー114d中の当該正解文字を対応する誤認識文字に替えて新たに構成した文字又は文字列(以下、「第4のキー」ともいう。)114eと、が含まれる。なお、第4のキー114eは、第2のキー114cから派生した、表現の揺らぎ含む文字又は文字列でもよい。
キー114aは、抽出の対象の一例である。第1のキー114bは、第1の文字又は文字列の一例である。第2のキー114cは、第2の文字又は文字列の一例である。第3のキー114dは、第3の文字又は文字列の一例である。第4のキー114eは、第4の文字又は文字列の一例である。
画面情報115は、後述する表示制御手段106により操作表示部12の表示面(不図示)に表示される各種画面の情報である。画面情報115について、図4各図を参照して説明する。図4は、画面の一例を示す図であり、(a)は、選択画面の一例を示す図、(b)は、設定画面の一例を示す図、(c)は、確認画面の一例を示す図である。
選択画面61は、ユーザに使用する機能を選択させる画面である。図4(a)に示すように、選択画面61には、請求書の属性を抽出する請求書属性抽出機能を起動する第1の釦611A、見積書の属性を抽出する見積書属性抽出機能を起動する第2の釦611B、請求書内の検索の対象となるキー114aの設定を行う請求書key設定機能を起動する第3の釦612A、及び見積書内の検索の対象となるキー114aの設定を行う見積書key設定機能を起動する第4の釦612Bが含まれる。以下、第1〜第4の釦を総称する場合、単に「操作釦」ともいう。
請求書及び見積書は、読み取りの対象となる文書の一例である。なお、文書は、請求書及び見積書に限定されるものではなく、例えば、申請書、契約書、仕様書、帳票等、文字、図形、画像等、及びこれらのいくつかを組み合わせて構成したものを含む。文書は、原稿の一例である。
設定画面62は、ユーザが上述した第1のキー114bの設定及び登録を行う画面である。図4(b)に示すように、設定画面62には、キー114aの設定を行う設定釦621と、設定されたキー114aを登録する登録釦622とを含んでいる。ここで、「登録」とは、記憶部11の定義ファイル114にキー114aを記録することをいう。
確認画面63は、画像から抽出された文字又は文字列と、この抽出された文字又は文字列に関連付いたバリュー値とを表示する画面である。図4(c)に示すように、確認画面63には、抽出された文字又は文字列が示す内容(すなわち、属性)を示す属性欄631と、各属性に関連付いたバリュー値を示す値欄632とがそれぞれ列ごとに並べて示されている。
OCR情報116は、文字のパターンを辞書化した情報である。OCR情報116は、認識手段104によるOCR処理に用いられる。
〔制御部10の各手段の構成〕
次に、制御部10を構成する各手段の詳細について説明する。生成手段100は、ユーザによる第1のキー114bを設定及び登録する操作に応じて、当該第1のキー114bが記録された定義ファイル114を生成する。
解析手段101は、形態素情報111を参照して定義ファイル114に記録されたキー114aの形態素の解析(以下、単に「形態素解析」ともいう。)を行い、解析の結果を出力する。
判定手段102は、解析手段101により出力された結果を、記憶部11に記憶された誤認識辞書情報113と照合し、定義ファイル114に記録されたキー114aに誤認識辞書情報113に「正解文字」として記録された文字が含まれるか否かを判定する。
追加手段103は、予め定められた規則に従って定義ファイル114に文字又は文字列を追加する。具体的には、追加手段103は、定義ファイル114に記録されたキー114aに誤認識辞書情報113に「正解文字」として記録された文字が含まれる場合に、当該文字を、対応する「誤認識文字」として記録された文字に替えて構成した新たな文字又は文字列(すなわち、第2のキー114c)を定義ファイル114にさらに追加して記録する。
また、追加手段103は、連想辞書情報112を参照して、定義ファイル114に記録されているキー114aから派生した、表現の揺らぎを含む文字又は文字列(すなわち、第3のキー114d及び第4のキー114e)を定義ファイル114にさらに追加して記録する。
認識手段104は、情報処理装置1に取り込まれた画像に含まれる文字を認識して当該文字を示す文字情報を出力する。画像は、例えば、画像読取部14により原稿を読み取って取り込んだものでもよく、予め外部の機器(例えば、スキャナ)で原稿を読み取って取り込んだものでもよい。
文字の認識は、例えば、OCR(Optical Character Recognition)処理により行われる。文字情報には、認識した文字の内容や意味を示す情報(いわゆる、テキスト情報)や、画像内の当該文字の位置を示す情報(例えば、座標値)等が含まれる。
抽出手段105は、定義ファイル114を参照し、認識手段104により出力された文字情報から、定義ファイル114に記録されたキー114aを検索して抽出するとともに、該文字情報から、抽出された当該キー114aに関連付いた値(以下、「バリュー値」ともいう。)を検索して抽出する。
表示制御手段106は、操作表示部12の表示面に、画面情報115等の各種の情報を表示するよう制御する。
(第1の実施の形態の動作)
次に、第1の実施の形態に係る情報処理装置1の動作の一例について説明する。以下の説明では、(1)画像として取り込まれる文書、(2)定義ファイル114の設定及び登録の動作、及び(3)文書を読み取った読取画像(以下、単に「文書画像」ともいう。)から指定された文字又は文字列を抽出する処理(以下、「キーバリュー処理」ともいう。)に係る動作、に分けて説明する。
(1)画像として取り込まれる文書
図5は、動作の説明に用いる文書としての請求書の一例を示す図である。以下では、図5に示すように、第1の請求書7Aは、例えば、請求の番号を示す第1の情報71と、この第1の請求書7Aが発行された発行日を示す第2の情報72と、請求された金額を示す第3の情報73と、振り込み先を示す第4の情報74とを含んでいる。
第1の情報71は、「請求番号」と記載された文字列711と、請求の番号を示す請求番号情報712とを含む。第2の情報72は、「発行日」と記載された文字列721と、発行された日を示す発行日情報722とを含む。第4の情報74は、「口座番号」と記載された文字列741と、口座番号を示す口座番号情報742と、振り込む先の金融機関等の名称を示す振込先情報743とを含む。請求番号、発行日及び口座番号等、数情報と関連付いている文字列711,721,741は、属性の一例である。各番号は及び振込先は、「値」の一例である。
(2)定義ファイル114の設定及び登録の動作
次に、図6及び図7を参照して、定義ファイル114の設定及び登録の動作について説明する。図6は、図1に示す情報処理装置1の動作の一例を模式的に示す図である。図7は、図1に示す情報処理装置1の動作の一例を示すフローチャートである。図6及び図7に示すように、まず、表示制御手段106は、操作表示部12の表示面に選択画面61(図4(a)参照)を表示するよう制御する(S1)。
次に、ユーザにより選択画面61内の操作釦が操作されると(S2:Yes)、表示制御手段106は、操作表示部12の表示面に設定画面62(図4(b)参照)を表示するよう制御する(S3)。なお、図6に示す例では、操作釦として、上述した請求書key設定機能を起動する第3の釦612Aを操作した場合を例に挙げている。
次に、ユーザの設定画面62に対する操作により第1のキー114bが設定及び登録されると、生成手段100は、当該第1のキー114bが記録された定義ファイル(仮)114Aを生成する(S4)。
図6に示す例では、第1のキー114bとして、「請求番号」と記録された場合を例に挙げている。なお、編集中の定義ファイルを、編集後の定義ファイル114と区別して特定するときは、「定義ファイル(仮)114A」ともいう。
次に、解析手段101は、定義ファイル114に記録された第1のキー114bの形態素解析を行う(S5)。追加手段103は、連想辞書情報112を参照して、第1のキー114bから派生した、表現の揺らぎを含む第3のキー114dを定義ファイル(仮)114Aに追加する(S6)。
図6に示す例では、「請求番号」から派生した、表現の揺らぎを含む文字列である、「請求書番号」(上述した類型4に相当するもの)や、「ご請求番号」(類型1に相当するもの)が追加される(図6の定義ファイル(仮)114A内の破線枠参照)。
次に、判定手段102は、定義ファイル(仮)114Aに含まれる第1のキー114b及び第3のキー114dの中に、記憶部11の誤認識辞書情報113に「正解文字」として記録された文字が含まれるものがあるか否かを判定する(S7)。なお、判定手段102は、ユーザの操作により記録された第1のキー114bに対してのみならず、追加手段103により追加された第3のキー114d(すなわち、表現の揺らぎを含む文字又は文字列)に対しても上記の判定を行う。
定義ファイル(仮)114Aに記録された第1のキー114b及び第3のキー114dに「正解文字」が含まれるものがある場合(S7:Yes)、追加手段103は、当該第1のキー114b及び第3のキー114d中の当該正解文字を、対応する誤認識文字に替えてそれぞれ構成した第2のキー114c及び第4のキー114eを定義ファイル(仮)114Aにさらに記録して(S8)、定義ファイル114を完成させる(図6の定義ファイル114中の破線枠参照)。
図6に示す例では、定義ファイル(仮)114Aに記録された「請求番号」、「請求書番号」及び「ご請求番号」のそれぞれに含まれる「請」を「晴」に替えて構成した「晴求番号」、「晴求書番号」及び「ご晴求番号」の文字列がさらに追加される。ここで、「請求番号」は、第1のキー114bの一例であり、請求書番号」及び「ご請求番号」は、第3のキー114dの一例であり、「晴求番号」は、第2のキー114cの一例であり、「晴求書番号」及び「ご晴求番号」は、第4のキー114eの一例である。
(3)キーバリュー処理に係る動作
次に、文書画像からの文字の認識の動作について説明する。まず、画像読取部14は、請求書等の文書を読み取って文書画像を形成する。認識手段104は、文書画像に対してOCR処理を実行して、文書画像に含まれる文字を示す文字情報を出力する。
抽出手段105は、出力された文字情報から、定義ファイル114に記録されたキー114aを検索して抽出するとともに、当該キー114aに関連付いたバリュー値を抽出する。なお、定義ファイル114に複数のキー114aが記録されている場合、抽出手段105は、記録された順にキー114aを検索してもよい。
表示制御手段106は、操作表示部12の表示面に、抽出されたキー114aとそのバリュー値とを含む確認画面63を表示するよう制御する。なお、第2のキー114c又は第4のキー114eが抽出された場合、第2のキー114c又は第4のキー114e(すなわち、誤って認識された文字を含む文字列)をそのまま確認画面63にて表示するのではなく、対応する第1のキー114b(すなわち、誤って認識された文字を含まない文字列)を確認画面63にて表示してもよい。
[第2の実施の形態]
次に本発明の第2の実施の形態について図8から図11を参照して説明する。第2の実施の形態では、制御部10が入替手段107をさらに備える点で第1の実施の形態と相違する。以下、第1の実施の形態と同一の構成要素については同一の符号を付してその詳細な説明を省略し、第1の実施の形態と相違する点を中心に説明する。
図8は、本発明の第2の実施の形態に係る情報処理装置1の制御系の一例を示すブロック図である。図8に示すように、第2の実施の形態では、第1の実施の形態で説明した構成に加えて、制御部10に入替手段107がさらに設けられている。すなわち、制御部10のCPUは、記憶部11に記憶されたプログラム110に従って動作することにより、第1の実施の形態で説明した手段100〜106に加えて、入替手段107等としてさらに機能する。
入替手段107について、図9及び図10を参照して詳細を説明する。入替手段107は、定義ファイル114に記録されたキー114aの記録の順序を変更する。例えば、図9(a)に示すような、請求の番号を意味する単に「番号」と記載された文字列711Aを含む第1の請求書7Aと、図9(b)に示すような、請求の番号を意味する「請求番号」と記載された文字列711Bを含む第2の請求書7Bとから、それぞれ請求番号を抽出する場合を例に挙げて説明する。
ユーザの操作によって生成された定義ファイル(仮)114Aには、上述した第1の請求書7A及び第2の請求書7Bから請求の番号に係る情報をともに抽出するための複数のキー114aが記録されている。
具体的には、この定義ファイル(仮)114Aには、図10(a)に示すように、第1の請求書7Aから請求番号情報712Aを抽出するための「番号」なる第1のキー114bと、第2の請求書7Bから請求番号情報712Bを抽出するための「請求番号」なる第1のキー114bと、に加え、「請求番号」中の「請」を「晴」に替えて構成した第2のキー114c(具体的には、「晴求番号」)と、「請求番号」から派生した、表現の揺らぎを含む第3のキー114d(具体的には、「ご請求番号」)と、第3のキー114d中の「請」を「晴」に替えて構成した第4のキー114e(具体的には、「ご晴求番号」)とがさらに記録されている。なお、図10(a)中に付した番号は、説明の便宜上付したものであり、必ずしも実際の定義ファイル114内に記載されていなくてもよい。
入替手段107は、予め定められた基準に従って、キー114aの順序を入れ替える。予め定められた基準には、例えば、キー114aが示す概念の順位に応じた基準が含まれる。具体的には、入替手段107は、上位の概念のキー114aほど定義ファイル114の下側に位置付けるようにキー114aの順序を入れ替えてもよい。ここで、上位の概念とは、他のキー114aの概念を包含する広い意味を有するものをいう。より具体的には、入替手段107は、例えば、キー114aを構成する文字の数等に応じてキー114aの記録の順序を入れ替えてもよい。
さらにより具体的には、入替手段107は、キー114aを構成する数が少ないキー114aを下側に記録されるように入れ替えてよい。一例として、入替手段107は、図10(b)に示すように、記録されているキー114aの中で最も少ない2文字からなる「番号」をファイルの末尾に入れ替えてもよい。
(実施例)
図11は、文字列の抽出の一例を示す図である。抽出手段105がキー114aの入れ替え前の定義ファイル(仮)114A(図10(a)参照)に記録された順に従って、第2の請求書7Bから「番号」、「請求番号」、「晴求番号」、「ご請求番号」及び「ご晴求番号」の順に文字列を検索すると、図11の破線枠に示すように、「番号」との文字列が含まれる「口座番号」と記載された文字列741とそのバリュー値である口座番号情報742とが抽出されてしまう。
これに対して、抽出手段105がキー114aの入れ替え後の定義ファイル114(図10(b)参照)に記録された順に従って、第2の請求書7Bから「請求番号」、「晴求番号」、「ご請求番号」、「ご晴求番号」及び「番号」の順に文字列を検索すると、「請求番号」と記載された文字列711Bとそのバリュー値である請求番号情報712Bとが抽出される。
なお、記録の順序が入れ替わっても「番号」なるキー114aも定義ファイル114に記録されているため、第1の請求書7Aに対して当該定義ファイル114を適用した場合であっても、「番号」と記載された文字列711Aとそのバリュー値である請求番号情報712Aとが抽出される。
[第3の実施の形態]
次に本発明の第3の実施の形態について図12から図16を参照して説明する。第3の実施の形態では、制御部10が記録手段108をさらに備える点、及び記憶部11が誤認識候補辞書情報117をさらに備える点で第1の実施の形態と相違する。以下、第1の実施の形態と同一の構成要素については同一の符号を付してその詳細な説明を省略し、第1の実施の形態と相違する点を中心に説明する。
図12は、本発明の第3の実施の形態に係る情報処理装置1の制御系の一例を示すブロック図である。図12に示すように、第3の実施の形態では、第1の実施の形態で説明した構成に加えて、制御部10に記録手段108がさらに設けられている。すなわち、制御部10のCPUは、記憶部11に記憶されたプログラム110に従って動作することにより、第1の実施の形態で説明した手段100〜106に加えて、記録手段108等としてさらに機能する。記録手段108の詳細については、後述する。
記憶部11には、第1の実施の形態に係る各種情報に加えて、誤認識候補辞書情報117がさらに記憶されている。図13は、誤認識候補辞書情報117の一例を示す図である。図13に示すように、誤認識候補辞書情報117には、誤認識辞書情報113と同様に、「誤認識文字」欄と、「正解文字」欄と、が設けられている。
第3の実施の形態では、抽出手段105は、文字情報から、定義ファイル114に記録されたキー114aに加えて、これらキー114aと誤認識する候補となる類似する文字列(以下、「候補文字列」ともいう。)をさらに抽出の対象として検索して抽出する。
候補文字列は、例えば、各キー114aとの一致する度合いを示す指標が予め定められた基準値となる文字列をいう。「各キー114aとの一致する度合いを示す指標」は、例えば、キー114aを構成する複数の文字がどの程度含まれるかを示す割合が該当する。「予め定められた基準値」は、例えば、80%としてよい。
具体的には、「請求書番号」を一つのキー114aとする場合、候補文字列には、「請求書番号」を構成する5つの文字(具体的には、「請」、「求」、「書」、「番」及び「号」)のうち、80%に相当する4つの文字(例えば、「請」、「書」、「番」及び「号」)が含まれる文字列(例えば、「請水書番号」等)が含まれる。
記録手段108は、抽出手段105により抽出された候補文字列(上述の例では、「請水書番号」)に対応するキー114a(上述の例では、「請求書番号」)を構成する複数の文字(上述の例では、「請」、「求」、「書」、「番」及び「号」)に含まれない文字(上述の例では、「水」)を、誤認識候補辞書情報117の「誤認識文字」欄に記録する。
また、記録手段108は、キー114aを構成する複数の文字のうち、「誤認識文字」として記録した文字(上述の例では、「水」)に対応する文字(上述の例では、「求」)を「正解文字」欄に記録する。候補文字列に対応するキー114aを構成する複数の文字に含まれない文字は、第3の特定の文字の一例である。
図14は、画面の一例を示す図であり、(a)は、候補画面の一例を示す図であり、(b)は、確認画面63の一例を示す図である。画面情報115には、第1の実施の形態で説明した画面に加えて、候補画面64がさらに含まれる。候補画面64は、確認手段の一例である。
候補画面64は、図14(a)に示すように、抽出手段105により抽出された候補文字列を示す候補文字列表示欄641と、この候補文字列を対応するキー114aとして抽出されたものとして認識させるか否かをユーザ選択させる記録釦642とを含む。記録釦642が操作されると、抽出手段105により抽出された候補文字列(すなわち、誤って認識された文字を含む文字列)が、対応するキー114a(すなわち、誤って認識された文字を含まない文字列)として抽出されたものとして扱われるようになっている。
(第3の実施の形態の動作)
第3の実施の形態の動作は、第1の実施の形態の動作に加えて、以下の動作を含む。抽出手段105は、文字情報から、定義ファイル114に記録されたキー114aに加えて、これらキー114aに対応する候補文字列を検索して抽出する。
抽出手段105が候補文字列を抽出した場合、表示制御手段106は、図14(a)に示すように、候補文字列表示欄641に当該候補文字列を含む候補画面64を操作表示部12の表示面に表示するよう制御する。
ユーザによって登録釦642が操作されると、記録手段108は、図13に示すように、当該候補画面64に表示された候補文字列を構成する複数の文字のうち、対応するキー114aの「請求書番号」に含まれない「水」を、誤認識候補辞書情報117に「誤認識文字」として記録するとともに、「水」に対応する「求」を「正解文字」として記録する。
候補文字列を構成する文字が誤認識候補辞書情報117に記録されると、表示制御手段106は、図14(b)に示すように、当該候補文字列に対応する第1のキー114bを改めて確認画面63にて操作表示部12の表示面に表示するよう制御する。なお、追加手段103は、当該候補文字列を定義ファイル114に追加してもよい。
<変形例1>
図15は、誤認識辞書情報113の一例を示す図である。記録手段108は、候補文字列を構成する誤認識文字と対応する正解文字とが誤認識候補辞書情報117に記録された場合に、当該誤認識文字と正解文字との組み合わせを誤認識辞書情報113にさらに記録してもよい。上述の例では、記録手段108は、図15に示すように、「水」と「求」とを誤認識辞書情報113に追加して記録してもよい(図15の末尾の破線枠参照)。
<変形例2>
また、記録手段108は、予め定められた条件を満たした場合に、候補文字列を構成する誤認識文字と対応する正解文字との組み合わせを誤認識辞書情報113にさらに記録してもよい。すなわち、候補文字列を検索の対象となる第2のキー114cとしてもよい。
予め定められた条件は、例えば、抽出手段105により候補文字列が抽出された回数や候補文字列の画像内の位置を示す位置情報に係る条件が該当する。具体的には、予め定められた条件には、以下の条件を含めてよい。
条件(1)
誤認識候補辞書情報117に同一の文字の組み合わせが予め定められた個数以上記録された場合。このような場合としては、例えば、抽出手段105により同一の候補文字列が予め定められた回数以上抽出された場合が該当する。なお、予め定められた回数及び予め定められた個数は、例えば、5としてよい。
条件(2)
抽出手段105により抽出された候補文字列が画像内の予め定められた特定の範囲にある場合。この場合、予め定められた回数又は個数は、条件(1)に係る回数又は個数よりも少なくてもよく、例えば、2としてよい。また、予め定められた特定の範囲は、例えば、画像の上側等としてよい。
当条件には、例えば、図16に示すように、候補文字列を構成する誤認識文字としての「語」と正解文字としての「請」との組み合わせについて、画像内の位置(例えば、「座標」)が上側の範囲で同一の候補文字列が2回抽出された場合(図16の破線枠参照)が該当する。
以上、本発明の実施の形態を説明したが、本発明の実施の形態は上記実施の形態に限定されるものではなく、本発明の要旨を変更しない範囲内で種々の変形、実施が可能である。例えば、誤認識辞書情報113は、1文字ごとに記録するようにしたが、2つ以上の文字からなる文字列を記録したものでもよい。
また、第1の実施の形態の動作において、第3のキー114dを追加する動作(ステップS6)と、第2のキー114c及び第4のキー114eを追加する動作(ステップS7及びS8)との順序を入れ替えてもよい。換言すれば、誤認識文字を替えて構成した新たな文字列を追加する動作を先に行い、表現の揺らぎ文字列を追加する動作を後に行ってもよい。
また、表示制御手段106は、必ずしも各種画面を操作表示部12の表示面に表示しなくてもよく、例えば、当該情報処理装置1に接続する端末装置(不図示)のディスプレイ等の画面に表示するよう制御してもよい。
また、第2のキー114cは、キー114aに2つ以上の正解文字が含まれている場合に、当該2つ以上の正解文字のいずれも「誤認識文字」に替えて構成したものでもよく、一部のみを替えて構成したものでもよい。具体的には、第1のキー114bが「積算額請求書」のように「積」「請」及び「求」の複数(例えば、3つ)の正解文字を含む場合、3つの全てを替えて構成した「責算額晴救書」でもよく、3つのうちの2つを替えて構成した「責算額晴求書」、「責算額請救書」又は「積算額晴救書」でもよく、3つのうちの1つを替えて構成した「責算額請求書」、「積算額晴求書」又は「積算額請救書」でもよく、これらすべてを第2のキー114cとして記録してもよい。
また、上述のようにキー114aに2つ以上の正解文字が含まれている場合、一度に誤認識文字と入れ替える文字数を制限してもよい。例えば、誤認識文字と入れ替える正解文字の文字数を、キー114aを構成する文字数に対して一定の割合(例えば、半数以内)以下に制限してよい。一例として、「御見積請求書」のような6文字で構成されるキー114aの場合、6文字の半数である3文字以内であれば一度に入れ替えてもよい。
制御部10の各手段は、それぞれ一部又は全部を再構成可能回路(FPGA:Field Programmable Gate Array)、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)等のハードウエア回路によって構成してもよい。
また、本発明の要旨を変更しない範囲内で、上記実施の形態の構成要素の一部を省くことや変更することが可能である。また、本発明の要旨を変更しない範囲内で、上記実施の形態のフローにおいて、ステップの追加、削除、変更、入替え等が可能である。また、上記実施の形態で用いたプログラムをCD−ROM等のコンピュータで読み取り可能な記録媒体に記録して提供することができ、クラウドサーバ等の外部サーバに格納しておき、ネットワークを介して利用することもできる。
1…情報処理装置
10…制御部
100…生成手段
101…解析手段
102…判定手段
103…追加手段
104…認識手段
105…抽出手段
106…表示制御手段
107…入替手段
108…記録手段
11…記憶部
110…プログラム
111…形態素情報
112…連想辞書情報
113…誤認識辞書情報
114…定義ファイル
114A…定義ファイル(仮)
114a…キー
114b…第1のキー
114c…第2のキー
114d…第3のキー
114e…第4のキー
115…画面情報
116…OCR情報
117…誤認識候補辞書情報
12…操作表示部
14…画像読取部
15…画像出力部
16…ファクシミリ通信部
17…ネットワーク通信部
2…外部ファクシミリ装置
3…外部装置
4…公衆回線網
5…ネットワーク
61…選択画面
611A…第1の釦
611B…第2の釦
612A…第3の釦
612B…第4の釦
62…設定画面
621…設定釦
622…登録釦
63…確認画面
631…属性欄
632…値欄
64…候補画面
641…候補文字列表示欄
642…登録釦
7A…第1の請求書
7B…第2の請求書
71…第1の情報
711,711A,711B,721,741…文字列
712,712A,712B…請求番号情報
72…第2の情報
722…発行日情報
73…第3の情報
74…第4の情報
742…口座番号情報
743…振込先情報

Claims (11)

  1. 画像に含まれる文字を認識して前記文字を示す文字情報を出力する認識手段と、
    前記認識手段による認識の精度を示す指標が予め定められた値未満となる第1の特定の文字と、前記認識手段により前記第1の特定の文字を認識することによって出力された第2の特定の文字とを関連付けて記憶する記憶手段と、
    操作者が、抽出の対象として第1の文字又は文字列を登録する操作をした場合において、前記第1の文字又は文字列に前記第1の特定の文字が含まれている場合に、前記第1の文字又は文字列とともに、前記第1の文字又は文字列中の前記第1の特定の文字を前記第2の特定の文字に替えて構成した第2の文字又は文字列を前記抽出の対象として登録する登録手段と、
    前記文字情報から、前記抽出の対象として登録された前記第1の文字又は文字列及び前記第2の文字又は文字列を抽出する抽出手段と、
    を備える情報処理装置。
  2. 前記登録手段は、前記第1の文字又は文字列と同一の意味を有し、かつ、表記が異なる第3の文字又は文字列を前記抽出の対象としてさらに追加して登録する、
    請求項1に記載の情報処理装置。
  3. 前記登録手段は、前記第3の文字又は文字列に前記第1の特定の文字が含まれる場合、前記第3の文字又は文字列中の前記第1の特定の文字を前記第2の文字に替えて構成した第4の文字又は文字列を前記抽出の対象としてさらに追加して登録する、
    請求項2に記載の情報処理装置。
  4. 前記抽出の対象に複数の文字又は文字列が登録されている場合に、前記複数の文字又は文字列の順序を入れ替える入替手段をさらに備える、
    請求項1から3のいずれか1項に記載の情報処理装置。
  5. 前記入替手段は、前記複数の文字又は文字列を構成する文字の数に応じて順序を入れ替える、
    請求項4に記載の情報処理装置。
  6. 前記文字情報から抽出された文字又は文字列と前記抽出の対象として登録された文字又は文字列とが一致する度合いが予め定められた値以上の場合に、前記抽出された文字又は文字列と関連付いた値を表示するよう制御する表示制御手段をさらに備える、
    請求項1から5のいずれか1項に記載の情報処理装置。
  7. 前記度合いが予め定められたしきい値以上の場合に前記抽出された文字又は文字列のうち、前記登録された文字又は文字列に含まれない第3の特定の文字を前記第2の特定の文字として一次的に記録する記録手段をさらに備える、
    請求項6に記載の情報処理装置。
  8. 前記記憶手段は、予め定められた個数以上の前記第3の特定の文字が記録された場合に、前記第3の特定の文字を前記第2の特定の文字として記憶するとともに、前記第3の特定の文字に対応する前記第1の特定の文字を前記第2の特定の文字と関連付けてさらに記憶する、
    請求項7に記載の情報処理装置。
  9. 前記予め定められた個数を第1の個数とした場合に、
    前記記憶手段は、前記抽出された文字又は文字列の前記画像内の位置が予め定められた範囲にあるとき、前記第1の個数よりも小さい第2の個数以上の前記第3の特定の文字が記録された場合に、前記第3の特定の文字を前記第2の特定の文字として、前記第3の特定の文字に対応する前記第1の特定の文字と関連付けてさらに記憶する、
    請求項7に記載の情報処理装置。
  10. 画像に含まれる文字を認識して前記文字を示す文字情報を出力する認識手段と、
    前記認識手段による認識の精度を示す指標が予め定められた値未満となる第1の特定の文字と、前記認識手段により前記第1の特定の文字を認識することによって出力された第2の特定の文字とを対応付けて記憶する記憶手段と、
    前記文字情報から抽出の対象となる第1の文字又は文字列を登録する登録手段と、
    前記第1の文字又は文字列に前記第1の特定の文字が含まれている場合に、前記第1の文字又は文字列中の前記第1の特定の文字を前記第2の特定の文字に替えて構成した第2の文字又は文字列を前記抽出の対象として追加する追加手段と、
    前記文字情報から前記第1の文字又は文字列及び前記第2の文字又は文字列を抽出する抽出手段と、
    を備える、情報処理装置。
  11. コンピュータを、
    画像に含まれる文字を認識して前記文字を示す文字情報を出力する認識手段と、
    前記認識手段による認識の精度を示す指標が予め定められた値未満となる第1の特定の文字と、前記認識手段により前記第1の特定の文字を認識することによって出力された第2の特定の文字とを関連付けて記憶する記憶手段と、
    操作者が、抽出の対象として第1の文字又は文字列を登録する操作をした場合において、前記第1の文字又は文字列に前記第1の特定の文字が含まれている場合に、前記第1の文字又は文字列とともに、前記第1の文字又は文字列中の前記第1の特定の文字を前記第2の特定の文字に替えて構成した第2の文字又は文字列を前記抽出の対象として登録する登録手段、
    前記文字情報から、前記抽出の対象として登録された前記第1の文字又は文字列及び第2の文字又は文字列を抽出する抽出手段
    として、機能させるためのプログラム。
JP2019025186A 2019-02-15 2019-02-15 情報処理装置及びプログラム Active JP7268389B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019025186A JP7268389B2 (ja) 2019-02-15 2019-02-15 情報処理装置及びプログラム
US16/538,792 US10984285B2 (en) 2019-02-15 2019-08-12 Information processing apparatus and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019025186A JP7268389B2 (ja) 2019-02-15 2019-02-15 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020135172A true JP2020135172A (ja) 2020-08-31
JP7268389B2 JP7268389B2 (ja) 2023-05-08

Family

ID=72042609

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019025186A Active JP7268389B2 (ja) 2019-02-15 2019-02-15 情報処理装置及びプログラム

Country Status (2)

Country Link
US (1) US10984285B2 (ja)
JP (1) JP7268389B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021043478A (ja) * 2019-09-06 2021-03-18 キヤノン株式会社 情報処理装置、その制御方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0562020A (ja) * 1991-08-30 1993-03-12 Ricoh Co Ltd 文字認識装置
JP2011107966A (ja) * 2009-11-17 2011-06-02 Hitachi Solutions Ltd 文書処理装置
WO2012157253A1 (ja) * 2011-05-17 2012-11-22 パナソニック株式会社 冷蔵庫の解体方法と冷蔵庫の解体装置および、家電製品の解体方法と家電製品の解体装置
JP2018081451A (ja) * 2016-11-15 2018-05-24 キヤノン株式会社 情報処理装置およびその制御方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9465985B2 (en) * 2013-06-09 2016-10-11 Apple Inc. Managing real-time handwriting recognition
JP6679350B2 (ja) * 2016-03-09 2020-04-15 キヤノン株式会社 情報処理装置、プログラム及び情報処理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0562020A (ja) * 1991-08-30 1993-03-12 Ricoh Co Ltd 文字認識装置
JP2011107966A (ja) * 2009-11-17 2011-06-02 Hitachi Solutions Ltd 文書処理装置
WO2012157253A1 (ja) * 2011-05-17 2012-11-22 パナソニック株式会社 冷蔵庫の解体方法と冷蔵庫の解体装置および、家電製品の解体方法と家電製品の解体装置
JP2018081451A (ja) * 2016-11-15 2018-05-24 キヤノン株式会社 情報処理装置およびその制御方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
藤尾 正和、外3名: ""キーワードを利用した帳票識別のための辞書自動作成"", 電子情報通信学会技術研究報告, vol. 101, no. 425, JPN6023000846, 8 November 2001 (2001-11-08), JP, pages 93 - 98, ISSN: 0005016303 *

Also Published As

Publication number Publication date
US20200265265A1 (en) 2020-08-20
JP7268389B2 (ja) 2023-05-08
US10984285B2 (en) 2021-04-20

Similar Documents

Publication Publication Date Title
EP2779613B1 (en) Document processing apparatus, document processing method, and document processing computer program product
US8630852B2 (en) Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer-readable storage medium for computer program
JP5753828B2 (ja) 画像処理装置及び画像処理プログラム
JP2009193356A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US20220319215A1 (en) Image processing method, device, electronic apparatus, and storage medium
JP7268389B2 (ja) 情報処理装置及びプログラム
US20210287187A1 (en) Image processing apparatus and non-transitory computer readable medium storing program
US11657367B2 (en) Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program
JP2006093917A (ja) 画像読取装置および画像処理装置、画像形成装置
JP4682747B2 (ja) 文書処理装置、ルールデータ生成方法およびプログラム
JP7271987B2 (ja) 情報処理装置及びプログラム
JP4576211B2 (ja) 文書情報検索システム
TWI766360B (zh) 文字候補提案裝置、手寫文字識別系統、手寫文字識別方法及程式
JP2008257543A (ja) 画像処理システム及びプログラム
JP7317612B2 (ja) 情報処理装置、情報処理方法及びプログラム
US20200273462A1 (en) Information processing apparatus and non-transitory computer readable medium
JP7031465B2 (ja) 情報処理装置及びプログラム
JPH0696288A (ja) 文字認識装置及び機械翻訳装置
JP3979288B2 (ja) 文書検索装置および文書検索プログラム
JP2007018158A (ja) 文字処理装置、文字処理方法及び記録媒体
JP2006276904A (ja) ファックス装置
JP2020150319A (ja) 画像形成装置
JPH0721344A (ja) 画像形成記憶装置
JP2012190357A (ja) 画像処理装置、画像処理方法、およびプログラム
US20240193975A1 (en) Image processing apparatus, image processing method, and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220119

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230404

R150 Certificate of patent or registration of utility model

Ref document number: 7268389

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150