JP6795195B2 - 文字種推定システム、文字種推定方法、および文字種推定プログラム - Google Patents

文字種推定システム、文字種推定方法、および文字種推定プログラム Download PDF

Info

Publication number
JP6795195B2
JP6795195B2 JP2017206520A JP2017206520A JP6795195B2 JP 6795195 B2 JP6795195 B2 JP 6795195B2 JP 2017206520 A JP2017206520 A JP 2017206520A JP 2017206520 A JP2017206520 A JP 2017206520A JP 6795195 B2 JP6795195 B2 JP 6795195B2
Authority
JP
Japan
Prior art keywords
text
character type
data
document image
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017206520A
Other languages
English (en)
Other versions
JP2019079347A (ja
Inventor
福光 齊藤
福光 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Net Smile Inc
Original Assignee
Net Smile Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Net Smile Inc filed Critical Net Smile Inc
Priority to JP2017206520A priority Critical patent/JP6795195B2/ja
Publication of JP2019079347A publication Critical patent/JP2019079347A/ja
Application granted granted Critical
Publication of JP6795195B2 publication Critical patent/JP6795195B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、文字種推定システム、文字種推定方法、および文字種推定プログラムに関するものである。
ある帳票識別システムでは、帳票フォーマットテーブルが予めユーザにより作成されており、帳票フォーマットテーブルには、ユーザにより指定された文字認識対象領域の位置、サイズ、文字種などを示すフィールド情報が含まれている。そして、この帳票フォーマット(つまり、フィールド情報)に基づいて、帳票画像の画像データから、帳票内の文字情報(テキストデータ)が取得されている。
特開2016−48444号公報
しかしながら、上述のシステムでは、帳票などの書類のレイアウト(フォーマット)に対応した帳票フォーマットテーブルを予め作成しておかなければならず、フォーマットの互いに異なる複数の書類に対して、その書類の数と同数の帳票フォーマットテーブルを作成する必要があり、様々な書類内の文字情報の抽出を行うことは、帳票フォーマットテーブルの作成の手間を考えると実際上困難である。
本発明は、上記の問題に鑑みなされたものであり、様々な書類内の文字情報の抽出を正確に行える文字種推定システム、文字種推定方法および文字種推定プログラムを得ることを目的とする。
本発明に係る文字種推定システムは、書類画像を取得する書類画像取得部と、その書類画像内の1または複数のテキスト領域の位置・サイズ情報、およびその1または複数のテキスト領域のそれぞれについてテキスト領域内のテキストの文字種を推定する文字種推定部と、推定されたテキスト領域について推定された文字種用の文字認識処理を実行して、推定されたテキスト領域内のテキストをテキストデータとして特定するテキスト特定部とを備える。そして、文字種推定部は、機械学習済みのディープニューラルネットワークを備え、そのディープニューラルネットワークの入力データは、上述の書類画像であり、そのディープニューラルネットワークの出力データは、上述の1または複数のテキスト領域のそれぞれについての上述の位置・サイズ情報および文字種である。
本発明に係る文字種推定方法は、書類画像を取得する書類画像取得ステップと、上述の機械学習済みのディープニューラルネットワークで、その書類画像内の1または複数のテキスト領域の位置・サイズ情報、およびその1または複数のテキスト領域のそれぞれについてテキスト領域内のテキストの文字種を推定する文字種推定ステップと、推定されたテキスト領域について推定された文字種用の文字認識処理を実行して、推定されたテキスト領域内のテキストをテキストデータとして特定するテキスト特定ステップとを備える。
本発明に係る文字種推定プログラムは、コンピュータを、上述の書類画像取得部、上述の文字種推定部、および上述のテキスト特定部として機能させる。
本発明によれば、様々な書類内の文字情報の抽出を正確に行えるようにする文字種推定システム、文字種推定方法および文字種推定プログラムが得られる。
本発明の上記又は他の目的、特徴および優位性は、添付の図面とともに以下の詳細な説明から更に明らかになる。
図1は、本発明の実施の形態に係る文字種推定システムの構成を示すブロック図である。 図2は、書類画像の一例を示す図である。 図3は、図2に示す書類画像に対して推定されるテキスト領域を説明する図である。 図4は、図1に示す文字種推定システムの動作を説明するフローチャートである。
以下、図に基づいて本発明の実施の形態を説明する。
図1は、本発明の実施の形態に係る文字種推定システムの構成を示すブロック図である。図1に示す文字種推定システムは、1台の情報処理装置で構成されているが、後述の処理部を、互いにデータ通信可能な複数の情報処理装置に分散させてもよい。また、そのような複数の情報処理装置には、特定の演算を並列処理するGPU(Graphics Processing Unit)が含まれていてもよい。
図1に示す文字種推定システムは、記憶装置1、通信装置2、画像読取装置3、および演算処理装置4を備える。
記憶装置1は、フラッシュメモリー、ハードディスクなどの不揮発性の記憶装置であって、各種データやプログラムを格納する。
ここでは、記憶装置1には、文字種推定プログラム11が格納されており、また、設定データ(後述のディープニューラルネットワークの係数設定値など)が必要に応じて格納される。なお、文字種推定プログラム11は、CD(Compact Disk)などの可搬性のあるコンピュータ読み取り可能な記録媒体に格納されていてもよい。その場合、例えば、その記録媒体から記憶装置1へプログラム11がインストールされる。また、プログラム11は、1つのプログラムでも、複数のプログラムの集合体でもよい。
通信装置2は、ネットワークインターフェイス、周辺機器インターフェイス、モデムなどのデータ通信可能な装置であって、必要に応じて、他の装置とデータ通信を行う。画像読取装置3は、書類から書類画像を光学的に読み取り、書類画像の画像データ(ラスタイメージデータなど)を生成する。
演算処理装置4は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)などを備えるコンピュータであって、プログラムを、ROM、記憶装置1などからRAMにロードしCPUで実行することで、各種処理部として動作する。
ここでは、プログラム11を実行することで、演算処理装置4は、書類画像取得部21、文字種推定部22、テキスト特定部23、データファイル生成部24、検証部25、および機械学習処理部26として動作する。
書類画像取得部21は、画像データとして書類画像を取得する。書類画像は、領収書(レシートを含む)、請求書、納品書などの帳票類や、その他、企業などの組織において定型な書類などの画像(ラスタイメージ)である。例えば、書類画像取得部21は、記憶装置1に格納されている画像データとしての書類画像を読み出したり、通信装置2により受信された画像データとしての書類画像を取得したり、画像読取装置3により生成された画像データとしての書類画像を取得したりする。
文字種推定部22は、書類画像内の1または複数のテキスト領域(矩形領域)の位置・サイズ情報、およびその1または複数のテキスト領域のそれぞれについて各テキスト領域内のテキストの文字種を推定する。具体的には、文字種推定部22は、機械学習済みのディープニューラルネットワークを備え、そのディープニューラルネットワークで、各テキスト領域の位置・サイズ情報およびそのテキスト領域内のテキストの文字種を推定する。このディープニューラルネットワークの入力データは、書類画像(つまり、書類画像の画素値)であり、このディープニューラルネットワークの出力データは、上述の1または複数のテキスト領域のそれぞれについての位置・サイズ情報および文字種である。
推定される文字種は、ディープニューラルネットワークの機械学習時に使用される訓練データ(入力値と出力値との対)のうちの出力値として使用された文字種のいずれかとなる。
例えば、その文字種は、テキスト自体の特徴(内的属性)を示す、(a)言語種別(日本語、英語など)、(b)表記体系(ひらがな、カタカナ、漢字など)、(c)数字か否か、(d)手書き文字か活字文字か、(e)それらの組み合わせといった分類を含む。
また、その文字種は、上述のテキスト自体の特徴の代わりに、あるいは、上述のテキスト自体の特徴に追加して、テキストの外的属性(つまり、テキストに対して付加される属性)を示すものでもよく、例えば、(f)金額(¥などの通貨マークが付加された数字)、(g)表の見出し(ヘッダー文字など)、(h)電子メール(英語テキストと@マークとドメイン表記テキストの結合)(i)URL(Uniform Resource Locator)、(j)電話番号、(k)住所、(l)日付、(m)印影(円や矩形などの外枠とその外枠の中のテキスト)などの分類を含むようにしてもよい。
さらに、その文字種は、特殊文字種として、テキストを含まない図形の分類(例えば、(a)バーコード、(b)2次元コード、(c)ロゴマーク、(d1)チェックされているチェックボックス、(d2)チェックされていないチェックボックスなど)を含んでもよい。
なお、ここで、ディープニューラルネットワークは、例えば、隠れ層が2つ以上の制限付きボルツマンマシンである。つまり、ディープラーニングで機械学習されたニューラルネットワークである。また、このディープニューラルネットワークの構成および機械学習については、既知のものが使用できる。例えば、このディープニューラルネットワークには、CNN(Convolutional Neural Network)、RNN(Recurrent Neural Network)、RNN(Recursive Neural Network)などを使用してもよい。さらに、そのようなディープニューラルネットワークに、必要に応じて、LSTM(Long Short-Term Memory)法、CTC(Connectionist Temporal Classification)法などを適用してもよい。
また、このディープニューラルネットワークの機械学習には、様々な書類の書類画像について、その書類画像のラスタイメージデータ(つまりビットマップ画像データ)(入力データ)とその書類画像についての1または複数のテキスト領域の位置・サイズ情報および文字種(出力データ)との対がトレーニングデータとして使用される。
図2は、書類画像の一例を示す図である。図3は、図2に示す書類画像に対して推定されるテキスト領域を説明する図である。
図2に示す書類画像101は、納品書の画像である。この書類画像101がディープニューラルネットワークに入力されると、図3における破線矩形で示すように、ディープニューラルネットワークから、テキスト領域の位置・サイズ情報、およびそのテキスト領域の文字種が出力される。なお、テキスト領域の位置・サイズ情報は、例えば、矩形のテキスト領域の対角線上の2点の座標値でもよいし、矩形のテキスト領域の中心点、特定頂点などの代表位置の座標並びにその矩形の縦の長さおよび横の長さでもよい。
例えば図3に示す書類画像101におけるテキスト領域111として、その位置・サイズ情報とともに、文字種「カタカナ」(つまり、日本語の活字体のカタカナ)が推定され、テキスト領域112として、その位置・サイズ情報とともに、文字種「英字」(つまり、英語の活字体のアルファベット)が推定され、テキスト領域113として、その位置・サイズ情報とともに、文字種「数字」(つまり、活字体の数字)が推定され、テキスト領域114として、その位置・サイズ情報とともに、文字種「手書きの漢字」(つまり、日本語の手書きの漢字)が推定される。
テキスト特定部23は、推定された位置・サイズ情報に基づいてテキスト領域の部分画像を書類画像から抽出し、推定されたテキスト領域(つまり、抽出した部分画像)について推定された文字種用の文字認識処理を実行して、推定されたテキスト領域内のテキストをテキストデータ(つまり、文字コード)として特定する。
例えば図3に示す書類画像101では、上述のようにテキスト領域111〜114の文字種が推定され、各テキスト領域111〜114のテキストデータを得るために、テキスト特定部23は、テキスト領域111の画像(部分画像)については、活字体のカタカナ用の文字認識処理を実行し、テキスト領域112の画像(部分画像)については、活字体の英字アルファベット用の文字認識処理を実行し、テキスト領域113の画像(部分画像)については、活字体の数字用の文字認識処理を実行し、テキスト領域114の画像(部分画像)については、日本語の手書き漢字用の文字認識処理を実行する。
なお、特定の文字種用の文字認識処理でも、その他の文字種の文字認識が可能とされている。ただし、その特定の文字種に比べ、文字認識率が低くなったり認識誤り率が高くなったりする可能性がある。
なお、文字種が上述のテキストを含まない特殊文字種である場合、テキスト特定部23は、そのテキスト領域の画像に対して、その特殊文字種に対応した処理を実行するようにしてもよい。例えば、文字種がバーコードや2次元コードである場合には、テキスト特定部23は、そのバーコードや2次元コードをデコードして、そのバーコードや2次元コードをテキストデータやバイナリデータに変換するようにしてもよい。また、例えば、文字種がロゴマークである場合には、テキスト特定部23は、書類画像から、テキスト領域の画像を切り出して、ロゴ画像として出力するようにしてもよい。また、例えば、文字種が、チェックされているチェックボックスかチェックされていないチェックボックスである場合には、テキスト特定部23は、そのテキスト領域のテキストとして、チェックされているチェックボックスまたはチェックされていないチェックボックスに対応する固有のコード(テキストデータまたはバイナリデータ)を出力するようにしてもよい。
データファイル生成部24は、上述の複数のテキスト領域のテキストデータを含むデータファイルを生成する。このデータファイルは、例えばCSV(Comma-Separated Values)データファイルなどの所定のフォーマットのデータファイルである。
例えば、上述のテキストデータは、このデータファイルにおいて、上述の複数のテキスト領域の位置に対応する順序で配列される。この場合、例えば、書類画像における横方向または縦方向における複数のテキスト領域の位置に基づいて、この順序が特定される。あるいは、この場合、データファイル生成部24は、書類画像におけるテキストオブジェクトを自動的に検出するとともに、ユーザ操作に基づいてそのテキストオブジェクトの属性を特定し、そのテキストオブジェクトの位置にその属性を関連付けてテンプレートデータを生成し、テンプレートデータに基づいて、上述のテキスト領域の位置に対応する属性(例えば、テキスト領域の位置に最も近いテキストオブジェクトの位置に関連付けられている属性)を特定し、その属性に対応する順序でテキストデータをデータファイルにおいて配列する。
また、例えば、上述のテキストデータは、このデータファイルにおいて、推定された文字種に対応する順序で配列される。この場合、例えば、文字種として上述のような外的属性(日付など)を示すものを使用し、推定された文字種が示す属性に対応する順序でテキストデータが配列される。
検証部25は、上述の1または複数のテキスト領域のうちの(上述の属性、位置などで指定される)特定のテキスト領域のテキストの有無または特定のテキスト領域のテキストの整合性を検証するようにしてもよい。例えば、上述の特定のテキスト領域が印鑑の押印用の領域である場合、検証部25は、テキスト特定部23によりテキストが特定されたか否かに基づいて、押印の有無を判定し、その判定結果をユーザに報知するようにしてもよいし、その特定のテキスト領域に画像オブジェクトがない場合には、押印がないと判定してもよい。また、例えば、上述の特定のテキスト領域が日付の領域である場合、検証部25は、テキスト特定部23により特定されたテキストが日付の記述フォーマットに適合しているか否かに基づいて整合性を判定し、その判定結果をユーザに報知するようにしてもよい。
機械学習処理部26は、トレーニングデータを生成するアノテーション処理、およびアノテーション処理により生成されたトレーニングデータで文字種推定部22のディープニューラルネットワークを機械学習する機械学習処理を実行する。
なお、例えば、アノテーション処理では、(a)サンプルの書類画像内のテキストオブジェクトが自動的に検出され、(b)各テキストオブジェクトについて、そのテキストオブジェクトのみを囲む矩形領域がテキスト領域とされ、(c)ユーザ操作により、そのテキスト領域内の文字種が付与され、(d)その書類画像(入力データ)と、その書類画像内のテキスト領域の位置・サイズ情報および文字種(出力データ)との対が1つのトレーニングデータとされる。
また、アノテーション処理には、文字種推定部22により推定されたあるテキスト領域の文字種が誤っており、ユーザにより訂正された場合における正当な文字種およびそのテキスト領域の位置・サイズ情報(並びにその書類画像内のその他のテキスト領域の位置・サイズ情報および文字種)が出力データとされ、そのときの書類画像が入力データとされてトレーニングデータを生成する処理も含まれ、そのようにして生成されたトレーニングデータに基づいて、機械学習処理部26は、文字種推定部22のディープニューラルネットワークに対する追加の機械学習を行うようにしてもよい。
なお、上述のデータファイル生成部24、検証部25、機械学習処理部26は、必須のものではなく、必要に応じて設ければよい。
次に、上記文字種推定システムの動作について説明する。図4は、図1に示す文字種推定システムの動作を説明するフローチャートである。
まず、書類画像取得部21は、書類画像を取得する(ステップS1)。
次に、文字種推定部22は、取得された書類画像内の各テキスト領域の位置・サイズ情報、および各テキスト領域内のテキストの文字種を推定する(ステップS2)。このとき、文字種推定部22は、機械学習済みのディープニューラルネットワークを使用して、取得された書類画像(ラスタイメージ)を入力データとしてディープニューラルネットワークに入力し、ディープニューラルネットワークの出力データとして、各テキスト領域の位置・サイズ情報および文字種を取得する。
そして、テキスト特定部23は、推定されたテキスト領域について推定された文字種用の文字認識処理を実行して、推定されたテキスト領域内のテキストをテキストデータとして特定する(ステップS3)。このとき、推定された文字種用の文字認識処理が適用されることで、文字認識率が向上するとともに、認識誤り率が低下する。
各テキスト領域について文字認識処理が実行された後、必要に応じて、検証部25は、特定のテキスト領域についての検証を上述のように行う(ステップS4)。
そして、データファイル生成部24は、各テキスト領域について特定されたテキストデータを含むデータファイルを例えばCSVフォーマットなどで生成する(ステップS5)。例えば、このようにして生成されたデータファイルを使用して、書類画像内の文字情報がテキストデータとしてデータベースに登録される。
以上のように、上記実施の形態によれば、書類画像取得部21は、書類画像を取得し、文字種推定部22は、その書類画像内の1または複数のテキスト領域の位置・サイズ情報、およびその1または複数のテキスト領域のそれぞれについてテキスト領域内のテキストの文字種を推定し、テキスト特定部23は、推定されたテキスト領域について推定された文字種用の文字認識処理を実行して、推定されたテキスト領域内のテキストをテキストデータとして特定する。そして、文字種推定部22は、機械学習済みのディープニューラルネットワークを備え、そのディープニューラルネットワークの入力データは、上述の書類画像であり、そのディープニューラルネットワークの出力データは、上述の1または複数のテキスト領域のそれぞれについての上述の位置・サイズ情報および文字種である。
これにより、事前にユーザが文字種を指定することなく、書類内の各テキストに対して適切な文字認識処理が自動的に実行され、様々な書類内の文字情報の抽出が正確に行われる。
なお、上述の実施の形態に対する様々な変更および修正については、当業者には明らかである。そのような変更および修正は、その主題の趣旨および範囲から離れることなく、かつ、意図された利点を弱めることなく行われてもよい。つまり、そのような変更および修正が請求の範囲に含まれることを意図している。
例えば、上記実施の形態において、上述のシステムは、推定した文字種を他の用途に使用してもよい。例えば、特定の文字種については文字認識を行わないようにしてもよい。
また、上記実施の形態において、上述の処理が完了した後、ただちに、書類画像の画像データを当該システムから消去するようにしてもよい。
本発明は、例えば、帳票読取システムに適用可能である。
11 文字種推定プログラム
21 書類画像取得部
22 文字種推定部
23 テキスト特定部
24 データファイル生成部
25 検証部
26 機械学習処理部

Claims (6)

  1. 書類画像を取得する書類画像取得部と、
    前記書類画像内の1または複数のテキスト領域の位置・サイズ情報、および前記1または複数のテキスト領域のそれぞれについて前記テキスト領域内のテキストの文字種を推定する文字種推定部と、
    推定された前記テキスト領域について推定された前記文字種用の文字認識処理を実行して、推定された前記テキスト領域内のテキストをテキストデータとして特定するテキスト特定部とを備え、
    前記文字種推定部は、機械学習済みのディープニューラルネットワークを備え、
    前記ディープニューラルネットワークの入力データは、前記書類画像であり、
    前記ディープニューラルネットワークの出力データは、前記1または複数のテキスト領域のそれぞれについての前記位置・サイズ情報および前記文字種であること、
    を特徴とする文字種推定システム。
  2. 前記複数のテキスト領域の前記テキストデータを含むデータファイルを生成するデータファイル生成部とをさらに備え、
    前記テキストデータは、前記データファイルにおいて、前記複数のテキスト領域の位置に対応する順序で配列されること、
    を特徴とする請求項1記載の文字種推定システム。
  3. 前記複数のテキスト領域の前記テキストデータを含むデータファイルを生成するデータファイル生成部とをさらに備え、
    前記テキストデータは、前記データファイルにおいて、前記文字種に対応する順序で配列されること、
    を特徴とする請求項1記載の文字種推定システム。
  4. 前記1または複数のテキスト領域のうちの特定のテキスト領域のテキストの有無または前記特定のテキスト領域のテキストの整合性を検証する検証部をさらに備えることを特徴とする請求項1記載の文字種推定システム。
  5. 書類画像を取得する書類画像取得ステップと、
    機械学習済みのディープニューラルネットワークで、前記書類画像内の1または複数のテキスト領域の位置・サイズ情報、および前記1または複数のテキスト領域のそれぞれについて前記テキスト領域内のテキストの文字種を推定する文字種推定ステップと、
    推定された前記テキスト領域について推定された前記文字種用の文字認識処理を実行して、推定された前記テキスト領域内のテキストをテキストデータとして特定するテキスト特定ステップとを備え、
    前記ディープニューラルネットワークの入力データは、前記書類画像であり、
    前記ディープニューラルネットワークの出力データは、前記1または複数のテキスト領域のそれぞれについての前記位置・サイズ情報および前記文字種であること、
    を特徴とする文字種推定方法。
  6. コンピュータを、
    書類画像を取得する書類画像取得部、
    前記書類画像内の1または複数のテキスト領域の位置・サイズ情報、および前記1または複数のテキスト領域のそれぞれについて前記テキスト領域内のテキストの文字種を推定する文字種推定部、並びに
    推定された前記テキスト領域について推定された前記文字種用の文字認識処理を実行して、推定された前記テキスト領域内のテキストをテキストデータとして特定するテキスト特定部として機能させ、
    前記文字種推定部は、機械学習済みのディープニューラルネットワークを備え、
    前記ディープニューラルネットワークの入力データは、前記書類画像であり、
    前記ディープニューラルネットワークの出力データは、前記1または複数のテキスト領域のそれぞれについての前記位置・サイズ情報および前記文字種であること、
    を特徴とする文字種推定プログラム。
JP2017206520A 2017-10-25 2017-10-25 文字種推定システム、文字種推定方法、および文字種推定プログラム Active JP6795195B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017206520A JP6795195B2 (ja) 2017-10-25 2017-10-25 文字種推定システム、文字種推定方法、および文字種推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017206520A JP6795195B2 (ja) 2017-10-25 2017-10-25 文字種推定システム、文字種推定方法、および文字種推定プログラム

Publications (2)

Publication Number Publication Date
JP2019079347A JP2019079347A (ja) 2019-05-23
JP6795195B2 true JP6795195B2 (ja) 2020-12-02

Family

ID=66627784

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017206520A Active JP6795195B2 (ja) 2017-10-25 2017-10-25 文字種推定システム、文字種推定方法、および文字種推定プログラム

Country Status (1)

Country Link
JP (1) JP6795195B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929724A (zh) * 2019-11-28 2020-03-27 上海眼控科技股份有限公司 字符识别方法、装置、计算机设备和存储介质
JP6809731B1 (ja) * 2019-12-05 2021-01-06 ネットスマイル株式会社 ビデオ信号処理システムおよびビデオ信号処理方法
CN111460933B (zh) * 2020-03-18 2022-08-09 哈尔滨拓博科技有限公司 一种实时识别连续手写图形的方法
JP2021090191A (ja) * 2020-11-09 2021-06-10 ネットスマイル株式会社 ビデオ信号処理システムおよびビデオ信号処理方法
CN113762109B (zh) * 2021-08-23 2023-11-07 北京百度网讯科技有限公司 一种文字定位模型的训练方法及文字定位方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2618504B2 (ja) * 1989-12-04 1997-06-11 シャープ株式会社 文字認識装置
JPH04105186A (ja) * 1990-08-24 1992-04-07 Sharp Corp 自動文書入力装置
JP3373008B2 (ja) * 1993-10-20 2003-02-04 オリンパス光学工業株式会社 画像像域分離装置
JPH11338977A (ja) * 1998-05-28 1999-12-10 Canon Inc 文字処理方法及び装置、記憶媒体
JP4385536B2 (ja) * 2001-03-19 2009-12-16 コニカミノルタビジネステクノロジーズ株式会社 文字認識装置、文字認識方法ならびに文字認識プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP2002358521A (ja) * 2001-05-31 2002-12-13 Oki Electric Ind Co Ltd 帳票フォーマット登録・識別装置、方法及びプログラム
JP2005208687A (ja) * 2004-01-19 2005-08-04 Ricoh Co Ltd 多言語文書処理装置及びプログラム

Also Published As

Publication number Publication date
JP2019079347A (ja) 2019-05-23

Similar Documents

Publication Publication Date Title
JP6795195B2 (ja) 文字種推定システム、文字種推定方法、および文字種推定プログラム
CN111476227B (zh) 基于ocr的目标字段识别方法、装置及存储介质
US9626555B2 (en) Content-based document image classification
EP3869385B1 (en) Method for extracting structural data from image, apparatus and device
JP6366024B2 (ja) 画像化された文書からテキストを抽出する方法及び装置
US20170109610A1 (en) Building classification and extraction models based on electronic forms
KR101769918B1 (ko) 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
US20190294912A1 (en) Image processing device, image processing method, and image processing program
JP2012083951A (ja) 情報処理装置、情報処理方法及びプログラム
JP2016048444A (ja) 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法
CN111914597B (zh) 一种文档对照识别方法、装置、电子设备和可读存储介质
US20220222284A1 (en) System and method for automated information extraction from scanned documents
CN114005126A (zh) 表格重构方法、装置、计算机设备及可读存储介质
KR20180126352A (ko) 이미지로부터 텍스트 추출을 위한 딥러닝 기반 인식장치
JP2008282094A (ja) 文字認識処理装置
KR102051655B1 (ko) 통합 이미지의 인식에 기초하여 상품 정보를 제공하는 방법 및 장치
US9135517B1 (en) Image based document identification based on obtained and stored document characteristics
JP4518212B2 (ja) 画像処理装置及びプログラム
CN113742559A (zh) 关键词检测方法和装置、电子设备、存储介质
US9208380B2 (en) Methods and systems for recognizing handwriting in handwritten documents
CN112070092A (zh) 一种验证码参数的获取方法及装置
JP4517822B2 (ja) 画像処理装置及びプログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP2009223391A (ja) 画像処理装置及び画像処理プログラム
JP2020030722A (ja) 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200514

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200514

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200904

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200916

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201029

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201105

R150 Certificate of patent or registration of utility model

Ref document number: 6795195

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250