JP2020144636A - 情報処理装置、学習装置及び学習済モデル - Google Patents
情報処理装置、学習装置及び学習済モデル Download PDFInfo
- Publication number
- JP2020144636A JP2020144636A JP2019041145A JP2019041145A JP2020144636A JP 2020144636 A JP2020144636 A JP 2020144636A JP 2019041145 A JP2019041145 A JP 2019041145A JP 2019041145 A JP2019041145 A JP 2019041145A JP 2020144636 A JP2020144636 A JP 2020144636A
- Authority
- JP
- Japan
- Prior art keywords
- image
- type
- information
- information processing
- voucher
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/63—Scene text, e.g. street names
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19173—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
従来、証憑画像から特定の項目を自動で読み取る手法が知られている。証憑とは、会計取引が事実であることを証明するための書類であり、レシートや請求書を含む。証憑画像とは、スキャナーを用いて証憑を読み取ることによって取得される画像データである。以下、レシートについて説明を行うが、本実施形態の手法は他の証憑に拡張して考えることが可能である。
まず第1の実施形態について説明する。第1の実施形態における区画画像は、証憑画像を行単位で区画することによって取得される画像である。
図4は、第1の実施形態にかかるシステムの構成例を示す図である。図4に示すように、システム1は、スキャナー10、通信装置20、メインサーバー30、ストレージサーバー40を含む。メインサーバー30およびストレージサーバー40は、例えばインターネット等の公衆通信網を通じて、ユーザーにクラウドサービスを提供可能なサーバーである。
2.2.1 学習装置の構成例
図5は、本実施形態の学習装置100の構成例を示す図である。学習装置100は、学習に用いられる訓練データを取得する取得部110と、当該訓練データに基づいて機械学習を行う学習部120を含む。
機械学習の具体例として、ニューラルネットワークを用いた機械学習について説明する。図6は、ニューラルネットワークの基本的な構造例である。ニューラルネットワークは、脳機能を計算機上でシミュレーションする数学モデルである。図6の1つの円をノード又はニューロンと呼ぶ。図6の例では、ニューラルネットワークは、入力層と、2つの中間層と、出力層を有する。入力層がIであり、中間層がH1及びH2であり、出力層がOである。また図6の例においては、入力層のニューロン数が3、中間層のニューロン数がそれぞれ4、出力層のニューロン数が1である。ただし、中間層の層数や、各層に含まれるニューロンの数は種々の変形実施が可能である。入力層に含まれるニューロンは、それぞれ第1中間層であるH1のニューロンと結合される。第1中間層に含まれるニューロンはそれぞれ第2中間層であるH2のニューロンと結合され、第2中間層に含まれるニューロンはそれぞれ出力層のニューロンと結合される。なお中間層は隠れ層と言い換えてもよい。
図7は、学習装置100における処理を説明するフローチャートである。この処理が開始されると、まず学習部120は、取得部110が取得した証憑画像から行画像を切り出す処理を行う(S101)。行画像とは、証憑画像を行ごとに区画した区画画像である。
2.3.1 情報処理装置の構成例
図14は、本実施形態の推論装置の構成例を示す図である。推論装置は、情報処理装置200である。情報処理装置200は、受付部210と、処理部220と、記憶部230を含む。
図15は、情報処理装置200における処理を説明するフローチャートである。この処理が開始されると、まず処理部220は、受付部210が取得した証憑画像を行ごとに区画することによって、区画画像を生成する(S301)。即ち、ここでの区画画像の生成とは、行画像を切り出す処理である。行単位で処理を行うことによって、区画画像の横幅が証憑画像の幅相当の長さに統一されるため、後述する第2の実施形態に比べて、区画画像の生成を容易にすることが可能である。なおS301の処理は、図8を用いて上述した処理と同様である。
次に第2の実施形態について説明する。なお、想定されるシステム1は、図4を用いて上述した例と同様であるため、詳細な説明は省略する。その他、第1の実施形態と同様の箇所については適宜説明を省略する。
第2の実施形態における区画画像は、所与の種別の文字列を含む領域画像である。図17は、電話番号を表す文字列を含む領域画像の例である。領域画像は、「XXXX−XX−XXXX」等のフォーマットに合致する文字列の領域、或いは、当該文字列と「TEL」又は「電話」等の文字を含む領域である。図17と図11を比較すればわかるように、領域画像は電話番号以外の種別の文字列を含まない。例えば、同じ行に店舗名等の他の文字列が存在した場合、第1の実施形態においてはそれらも電話番号の行画像に含まれていたが、第2の実施形態においては店舗名等は領域画像から除外される。また、領域画像では、不必要な空白も除外が可能である。
図20は、情報処理装置200における処理を説明するフローチャートである。この処理が開始されると、まず処理部220は、受付部210が取得した証憑画像の一部の画像を区画画像として抽出する(S401)。具体的には、処理部220は、証憑画像の所与の位置に、所与のサイズの探索ウィンドウを設定し、当該探索ウィンドウによって囲まれる領域を区画画像とする。探索ウィンドウは、具体的には矩形のウィンドウである。そして処理部220は、S401において取得された区画画像と、記憶部230に記憶された学習済モデルに基づいて、当該区画画像の種別を分類する処理を行う(S402)。
以上では、区画画像と種別情報を対応付けたデータセットに基づいて機械学習を行う例について説明した。ただし、学習処理に用いられるデータセットは他の情報を含んでもよい。例えば、レシート内の電話番号や日付は、比較的レシートの上部に位置していることが多い。よって学習部120は、区画画像と、種別情報に加えて位置情報を含むデータセットに基づいて機械学習を行ってもよい。ここでの位置情報は、座標値であってもよいし、上部、中部、下部といった概略的な情報であってもよい。学習部120は、区画画像と位置情報を入力データとし、種別情報を教師データとする機械学習を行うことによって重み付け係数情報を設定する。情報処理装置200の処理部220は、区画画像を生成する際に、当該区画画像の証憑画像における位置情報を求める。そして処理部220は、区画情報と位置情報を学習済モデルに入力することによって、種別を判定する。このように証憑画像における区画画像の位置を考慮することによって、処理精度をさらに高くすることが可能である。
Claims (11)
- 証憑画像を区画した区画画像と、前記区画画像が含む文字列の種別を示す種別情報とを対応付けたデータセットに基づき、前記区画画像と前記種別との関係を機械学習した学習済モデルを記憶する記憶部と、
認識処理の対象となる前記証憑画像の入力を受け付ける受付部と、
入力として受け付けた前記証憑画像を区画することによって、前記区画画像を生成し、前記学習済モデルに基づいて、生成した前記区画画像の前記種別を決定する推論処理を行う処理部と、
を含むことを特徴とする情報処理装置。 - 請求項1に記載の情報処理装置において、
前記処理部は、
前記証憑画像を行ごとに区画することによって、前記区画画像を生成することを特徴とする情報処理装置。 - 請求項1に記載の情報処理装置において、
前記処理部は、
前記証憑画像上に、位置又はサイズが異なる複数の探索ウィンドウを設定し、
設定された前記探索ウィンドウに対応する前記証憑画像の領域を区画することによって、前記区画画像を生成することを特徴とする情報処理装置。 - 請求項1乃至3のいずれか一項に記載の情報処理装置において、
前記処理部は、
所与の種別であると判定された前記区画画像に対して、文字認識処理を行うことを特徴とする情報処理装置。 - 請求項4に記載の情報処理装置において、
前記処理部は、
第1の種別であると判定された前記区画画像に対して、第1の文字認識処理を行い、
前記第1の種別とは異なる第2の種別であると判定された前記区画画像に対して、前記第1の文字認識処理と異なる第2の文字認識処理を行うことを特徴とする情報処理装置。 - 請求項4又は5に記載の情報処理装置において、
前記記憶部は、
文字画像と、前記文字画像に含まれる文字とを対応付けた第2データセットに基づき、前記文字画像に含まれる文字の確度を機械学習した第2学習済モデルを記憶し、
前記処理部は、
前記所与の種別であると判定された前記区画画像と、前記第2学習済モデルとに基づいて、前記区画画像に含まれる文字の確度を判定することによって、前記文字認識処理を行うことを特徴とする情報処理装置。 - 請求項4乃至6のいずれか一項に記載の情報処理装置において、
前記種別情報によって表される前記区画画像の種別は、電話番号、発行日付、及び、合計金額を含むことを特徴とする情報処理装置。 - 請求項1乃至7のいずれか一項に記載の情報処理装置において、
前記区画画像及び前記種別情報を取得する取得部と、
前記区画画像と前記種別情報とを対応付けた前記データセットに基づき、前記区画画像と前記種別との関係を機械学習する学習部と、
を含むことを特徴とする情報処理装置。 - 請求項1乃至8のいずれか一項に記載の情報処理装置において、
前記学習済モデルは、
入力層と中間層と出力層とを有し、
前記区画画像と前記種別情報と、を対応づけた前記データセットに基づき、前記入力層と前記中間層との間の第1重み付け係数、及び前記中間層と前記出力層との間の第2重み付け係数を含む重み付け係数情報が設定されており、
入力として受け付けた前記区画画像のデータを前記入力層に入力し、設定された前記重み付け係数情報に基づく演算を行い、前記出力層から、前記区画画像の前記種別を表すデータを出力するよう、コンピューターを機能させることを特徴とする情報処理装置。 - 証憑画像を区画した区画画像と、前記区画画像が含む文字列の種別を示す種別情報と、を取得する取得部と、
前記区画画像と前記種別情報とを対応付けたデータセットに基づき、前記区画画像と前記種別との関係を機械学習する学習部と、
を含むことを特徴とする学習装置。 - 証憑画像を区画した区画画像の種別を判定する処理を行うための学習済モデルであって、
入力層と中間層と出力層とを有し、
前記区画画像と、前記区画画像が含む文字列の種別を示す種別情報と、を対応づけたデータセットに基づき、前記入力層と前記中間層との間の第1重み付け係数、及び前記中間層と前記出力層との間の第2重み付け係数を含む重み付け係数情報が設定されており、
入力として受け付けた前記区画画像のデータを前記入力層に入力し、設定された前記重み付け係数情報に基づく演算を行い、前記出力層から、前記区画画像の前記種別を表すデータを出力するよう、コンピューターを機能させることを特徴とする学習済モデル。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019041145A JP7077998B2 (ja) | 2019-03-07 | 2019-03-07 | 情報処理装置 |
US16/809,070 US11436816B2 (en) | 2019-03-07 | 2020-03-04 | Information processing device, learning device, and storage medium storing learnt model |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019041145A JP7077998B2 (ja) | 2019-03-07 | 2019-03-07 | 情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020144636A true JP2020144636A (ja) | 2020-09-10 |
JP7077998B2 JP7077998B2 (ja) | 2022-05-31 |
Family
ID=72336408
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019041145A Active JP7077998B2 (ja) | 2019-03-07 | 2019-03-07 | 情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11436816B2 (ja) |
JP (1) | JP7077998B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7037237B1 (ja) * | 2021-08-19 | 2022-03-16 | ファーストアカウンティング株式会社 | データ処理装置、データ処理方法及びプログラム |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04105186A (ja) * | 1990-08-24 | 1992-04-07 | Sharp Corp | 自動文書入力装置 |
JPH0799581A (ja) * | 1992-09-25 | 1995-04-11 | Olympus Optical Co Ltd | 画像処理装置 |
JPH1070652A (ja) * | 1996-08-28 | 1998-03-10 | Minolta Co Ltd | 画像領域属性判別装置 |
JP2006079190A (ja) * | 2004-09-07 | 2006-03-23 | Japan Medical Data Center Co Ltd | 光学式文字読取装置 |
JP2007086954A (ja) * | 2005-09-21 | 2007-04-05 | Fuji Xerox Co Ltd | 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム |
JP2011028370A (ja) * | 2009-07-22 | 2011-02-10 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2011060219A (ja) * | 2009-09-14 | 2011-03-24 | Hiroaki Ono | 文書分類システム、文書分類方法、及びプログラム |
JP2012208589A (ja) * | 2011-03-29 | 2012-10-25 | Hitachi Omron Terminal Solutions Corp | 帳票認識装置、帳票認識方法およびそのためのプログラム |
JP2015005100A (ja) * | 2013-06-20 | 2015-01-08 | 株式会社日立システムズ | 情報処理装置、テンプレート生成方法、およびプログラム |
JP2015118488A (ja) * | 2013-12-17 | 2015-06-25 | 株式会社日本デジタル研究所 | 会計データ入力システム、方法、およびプログラム |
JP2018005462A (ja) * | 2016-06-30 | 2018-01-11 | 株式会社日立ソリューションズ | 認識装置及び認識方法 |
JP2018190064A (ja) * | 2017-04-28 | 2018-11-29 | 株式会社日本デジタル研究所 | 会計処理システム |
JP2019008775A (ja) * | 2017-06-22 | 2019-01-17 | 日本電気株式会社 | 画像処理装置、画像処理システム、画像処理方法、プログラム |
JP6464440B1 (ja) * | 2017-12-27 | 2019-02-06 | 株式会社日本デジタル研究所 | 会計処理装置、会計処理システム、会計処理方法及びプログラム |
JP6465427B1 (ja) * | 2018-08-15 | 2019-02-06 | 株式会社シグマクシス | 文字認識装置、文字認識方法及び文字認識プログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107180264A (zh) * | 2006-07-12 | 2017-09-19 | 柯法克斯公司 | 用于对文档和数据的转导分类方法 |
CN102054171A (zh) * | 2009-10-30 | 2011-05-11 | 株式会社东芝 | 文档文件种类识别装置以及文档文件种类识别方法 |
US9965679B2 (en) * | 2014-11-05 | 2018-05-08 | Accenture Global Services Limited | Capturing specific information based on field information associated with a document class |
JP6743445B2 (ja) | 2016-03-25 | 2020-08-19 | 大日本印刷株式会社 | 携帯型情報装置およびプログラム |
JP6938228B2 (ja) * | 2017-05-31 | 2021-09-22 | 株式会社日立製作所 | 計算機、文書識別方法、及びシステム |
CN109344838B (zh) * | 2018-11-02 | 2023-11-24 | 长江大学 | 发票信息自动快速识别方法、系统以及装置 |
-
2019
- 2019-03-07 JP JP2019041145A patent/JP7077998B2/ja active Active
-
2020
- 2020-03-04 US US16/809,070 patent/US11436816B2/en active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04105186A (ja) * | 1990-08-24 | 1992-04-07 | Sharp Corp | 自動文書入力装置 |
JPH0799581A (ja) * | 1992-09-25 | 1995-04-11 | Olympus Optical Co Ltd | 画像処理装置 |
JPH1070652A (ja) * | 1996-08-28 | 1998-03-10 | Minolta Co Ltd | 画像領域属性判別装置 |
JP2006079190A (ja) * | 2004-09-07 | 2006-03-23 | Japan Medical Data Center Co Ltd | 光学式文字読取装置 |
JP2007086954A (ja) * | 2005-09-21 | 2007-04-05 | Fuji Xerox Co Ltd | 文字認識処理装置、および文字認識処理方法、並びにコンピュータ・プログラム |
JP2011028370A (ja) * | 2009-07-22 | 2011-02-10 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
JP2011060219A (ja) * | 2009-09-14 | 2011-03-24 | Hiroaki Ono | 文書分類システム、文書分類方法、及びプログラム |
JP2012208589A (ja) * | 2011-03-29 | 2012-10-25 | Hitachi Omron Terminal Solutions Corp | 帳票認識装置、帳票認識方法およびそのためのプログラム |
JP2015005100A (ja) * | 2013-06-20 | 2015-01-08 | 株式会社日立システムズ | 情報処理装置、テンプレート生成方法、およびプログラム |
JP2015118488A (ja) * | 2013-12-17 | 2015-06-25 | 株式会社日本デジタル研究所 | 会計データ入力システム、方法、およびプログラム |
JP2018005462A (ja) * | 2016-06-30 | 2018-01-11 | 株式会社日立ソリューションズ | 認識装置及び認識方法 |
JP2018190064A (ja) * | 2017-04-28 | 2018-11-29 | 株式会社日本デジタル研究所 | 会計処理システム |
JP2019008775A (ja) * | 2017-06-22 | 2019-01-17 | 日本電気株式会社 | 画像処理装置、画像処理システム、画像処理方法、プログラム |
JP6464440B1 (ja) * | 2017-12-27 | 2019-02-06 | 株式会社日本デジタル研究所 | 会計処理装置、会計処理システム、会計処理方法及びプログラム |
JP6465427B1 (ja) * | 2018-08-15 | 2019-02-06 | 株式会社シグマクシス | 文字認識装置、文字認識方法及び文字認識プログラム |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7037237B1 (ja) * | 2021-08-19 | 2022-03-16 | ファーストアカウンティング株式会社 | データ処理装置、データ処理方法及びプログラム |
WO2023021636A1 (ja) * | 2021-08-19 | 2023-02-23 | ファーストアカウンティング株式会社 | データ処理装置、データ処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7077998B2 (ja) | 2022-05-31 |
US11436816B2 (en) | 2022-09-06 |
US20200285881A1 (en) | 2020-09-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2699687C1 (ru) | Обнаружение текстовых полей с использованием нейронных сетей | |
US11816165B2 (en) | Identification of fields in documents with neural networks without templates | |
US11256918B2 (en) | Object detection in images | |
CN114155543B (zh) | 神经网络训练方法、文档图像理解方法、装置和设备 | |
US20230102337A1 (en) | Method and apparatus for training recommendation model, computer device, and storage medium | |
JP4618098B2 (ja) | 画像処理システム | |
CN111615702B (zh) | 一种从图像中提取结构化数据的方法、装置和设备 | |
RU2721189C1 (ru) | Детектирование разделов таблиц в документах нейронными сетями с использованием глобального контекста документа | |
US11170249B2 (en) | Identification of fields in documents with neural networks using global document context | |
US20190294921A1 (en) | Field identification in an image using artificial intelligence | |
CN110222330B (zh) | 语义识别方法及装置、存储介质、计算机设备 | |
JP2008537198A (ja) | 人工知能を使用した外来のアプリケーションユーザインタフェースからの情報のインテリジェントインポート | |
CN111797886A (zh) | 通过解析pdl文件为神经网络生成ocr用训练数据 | |
CN108734159B (zh) | 一种图像中敏感信息的检测方法及系统 | |
JP6719399B2 (ja) | 解析装置、解析方法、およびプログラム | |
RU2765884C2 (ru) | Идентификация блоков связанных слов в документах сложной структуры | |
CN112396079A (zh) | 号码识别模型训练方法、号码识别方法及装置 | |
CN113673528B (zh) | 文本处理方法、装置、电子设备和可读存储介质 | |
JP7077998B2 (ja) | 情報処理装置 | |
CN110135218A (zh) | 用于识别图像的方法、装置、设备和计算机存储介质 | |
US11972625B2 (en) | Character-based representation learning for table data extraction using artificial intelligence techniques | |
US10755095B1 (en) | System for scanning solicitations for fraud detection | |
CN113011410A (zh) | 字符识别模型的训练方法、字符识别方法及装置 | |
US20230351783A1 (en) | Application of heuristics to handwritten character recognition to identify names using neural network techniques | |
US20230351778A1 (en) | Third party api integration for feedback system for handwritten character recognition to identify names using neural network techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201020 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20211014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220419 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220502 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7077998 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |