JP2017111500A - 文字認識装置及びプログラム - Google Patents

文字認識装置及びプログラム Download PDF

Info

Publication number
JP2017111500A
JP2017111500A JP2015243401A JP2015243401A JP2017111500A JP 2017111500 A JP2017111500 A JP 2017111500A JP 2015243401 A JP2015243401 A JP 2015243401A JP 2015243401 A JP2015243401 A JP 2015243401A JP 2017111500 A JP2017111500 A JP 2017111500A
Authority
JP
Japan
Prior art keywords
pattern
operator
document
cluster
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015243401A
Other languages
English (en)
Inventor
浅田 一繁
Kazushige Asada
一繁 浅田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2015243401A priority Critical patent/JP2017111500A/ja
Publication of JP2017111500A publication Critical patent/JP2017111500A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】複数のオペレータによる誤り訂正作業を行うためのOCR誤り訂正装置で、今まで以上により作業効率を高めること。【解決手段】オペレータ属性を登録するオペレータ管理装置(105)と、文書の画像データ及び該文書の文書属性を登録する文書属性登録装置(101)と、画像データに基づいて文字認識を行うパターン抽出装置(102)とを備え、オペレータ管理装置(105)は、複数の文書の前記画像データから同じ文字パターンとして文字認識された複数の画像パターン、及び、あらかじめ登録されているオペレータ属性に基づいて、同じ文字パターンとして文字認識された複数の画像パターンの認識結果を確認させるオペレータを選択する。【選択図】図1

Description

本発明は、文字認識装置及びプログラムに関する。
手書き、または、活字による文書をOCR(Optical Character Recognition:光学的文字認識)処理する場合、誤認識を完全に無くすことは困難である。そのため、オペレータが、確認画面上で、目視で認識結果をチェックし、誤認識があれば、それを手作業で、誤り訂正する必要がある。この誤り訂正作業の効率化のために、確認画面に、認識結果の文字が同じであった文字イメージを一括表示する技術が考えられ既に知られている。
例えば、特許文献1には、誤り訂正作業の効率化の目的で、OCR処理の対象となる文字のイメージデータを、認識された文字(カテゴリ)ごとに分類し、さらにイメージデータに含まれる文字の形状に関する特徴量を求め、その特徴量に基づきイメージデータをクラスタに分類し、そのクラスタごとにまとめて画面を生成する構成が開示されている。
しかし、今までのOCR誤り訂正装置では、オペレータの属性が考慮されておらず、オペレータの専門性や経験、得意・不得意が分担に反映されず、誤り訂正作業が効率的に行えないという問題があった。
本発明は、複数のオペレータによる誤り訂正作業を行うためのOCR誤り訂正装置で、今まで以上により作業効率を高めることを目的とする。
上記目的を達成する本発明の一態様は、オペレータ属性を登録するオペレータ属性登録手段と、文書の画像データ及び該文書の文書属性を登録する文書属性登録手段と、前記画像データに基づいて文字認識を行う文字認識手段と、複数の文書の前記画像データから前記文字認識手段により同じ文字パターンとして文字認識された複数の画像パターン、及び、あらかじめ登録されている前記オペレータ属性に基づいて、前記同じ文字パターンとして文字認識された複数の画像パターンの認識結果を確認させるオペレータを選択する選択手段と、を備えることを特徴とする。
本発明によれば、複数のオペレータによる誤り訂正作業を行うためのOCR誤り訂正装置で、今まで以上により作業効率を高めることが可能になる。
実施形態に係るOCR処理装置1の全体構成を示す図である。 各種データベース106の記憶内容を示す図である。 図1の各種装置のハードウェア構成例を示す図である。 文書データベース108を示す図である。 パターンデータベース109を示す図である。 クラスタデータベース110を示す図である。 オペレータデータベース111を示す図である。 文書登録処理を示すフローチャートである。 パターン抽出処理を示すフローチャートである。 パターンデータ登録処理を示すフローチャートである。 クラスタ生成処理を示すフローチャートである。 オペレータ登録処理を示すフローチャートである。 オペレータ割り当て処理を示すフローチャートである。 クラスタデータ選択処理を示すフローチャートである。 誤り訂正画面を示す図である。 前後のパターン画像も合わせて表示する誤り訂正画面を示す図である。
以下の開示は、OCR処理に際して、以下の特徴を有する。
要するに、オペレータの属性(専門性や経験、得意・不得意)を予め登録し、その属性を考慮して、OCR処理結果のクラスタを作成し、OCR誤り訂正作業の分担を決定することが特徴になっている。
また、オペレータの属性を予め登録し、その属性を考慮して、OCR処理結果のクラスタを作成し、OCR誤り訂正作業の分担を決定するので、オペレータの属性(専門性や経験、得意・不得意)に応じて分担することによって、誤り訂正作業を効率的に行うことができる。
以下の実施形態は、OCR処理装置を一例としてサーバ・クライアント・モデルのコンピュータシステムで実施するものである。ここでサーバ・クライアント・モデルとは、ネットワークを介して、あるノードがサーバ、別のあるノードがクライアントとしてそれぞれに割り当てられた情報処理を行うコンピュータシステムのモデルを言うこととする。
本発明は、以下に説明するようなコンピュータシステムでのみ実施可能というものではなく、例えば、図1に示すような各装置が一つの装置内で機能的に実現される場合もある。
図1に、OCR処理装置1のネットワーク構成例を示す。
OCR処理装置1は、文書登録装置101、パターン抽出装置102、クラスタ生成装置103、OCR誤り訂正装置104、オペレータ管理装置105、各種データベース106、オペレータ端末107を備える構成である。各装置及び端末は、ネットワークによって接続される。
図2に、各種データベース106の記憶内容を示す。
各種データベース106は、文書データベース108、パターンデータベース109、クラスタデータベース110、オペレータデータベース111を含んで、これらを記憶する(図2)。
図1に示した各装置、端末、データベース(以下、「図1の各種装置」と呼ぶ。)の具体的な実施態様について付言する。図1の各種装置は、汎用的なコンピュータアーキテクチャを用いるソフトウェアプログラムによる情報処理により、実現することができる。図3にその汎用的なコンピュータアーキテクチャの一例を示す。
図3に示すように、図1の各種装置は、一般的なサーバやPC(Personal Computer)等の情報処理端末と同様の構成を有する。即ち、図1の各種装置は、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、ROM(Read Only Memory)13、HDD(Hard Disk Drive)14及びI/F15がバス18を介して接続されている。また、I/F15にはLCD(Liquid Crystal Display)16及び操作部17が接続されている。
CPU11は演算手段であり、装置全体の動作を制御する。RAM12は、情報の高速な読み書きが可能な揮発性の記憶媒体であり、CPU11が情報を処理する際の作業領域として用いられる。ROM13は、読み出し専用の不揮発性記憶媒体であり、ファームウェア等のプログラムが格納されている。HDD14は、情報の読み書きが可能な不揮発性の記憶媒体であり、OS(Operating System)や各種の制御プログラム、アプリケーション・プログラム等が格納される。
I/F15は、バス18と各種のハードウェアやネットワーク等を接続し制御する。LCD16は、ユーザが装置の状態を確認するための視覚的ユーザインタフェースである。操作部17は、キーボードやマウス等、ユーザが装置に情報を入力するためのユーザインタフェースである。なお、装置がサーバとして運用される場合は、LCD16及び操作部17等のユーザインタフェースの省略が可能である。
このようなハードウェア構成において、ROM13やHDD14若しくは図示しない光学ディスク等の記憶媒体に格納されたプログラムがRAM12に読み出され、CPU11の制御に従って動作することにより、ソフトウェア制御部が構成される。このようにして構成されたソフトウェア制御部と、ハードウェアとの組み合わせによって、本実施形態の機能を実現する機能ブロックが構成される。
上述のようなハードウェアにより例えば実施される図1の各種装置は、以下に述べるような機能を提供する。再び、図1を参照する。
文書登録装置101は、OCR処理すべき文書を受け付け、その文書データを文書データベース108に登録するための装置である。
パターン抽出装置102は、文書データベース108に登録された文書データからパターンを抽出し、そのパターンデータをパターンデータベース109に登録するための装置である。
クラスタ生成装置103は、パターンデータベース109に登録されたパターンデータを、クラスタ属性及びパターン文字列に応じたクラスタデータを生成し、そのクラスタデータをクラスタデータベース110に登録するための装置である。
OCR誤り訂正装置104は、オペレータ端末107からの訂正要求に応じて、パターンデータベース109に登録されているパターンデータのパターン文字列を訂正するための装置である。
オペレータ管理装置105は、オペレータの属性をオペレータデータベース111に登録するための装置である。
オペレータ端末107は、誤り訂正画面を表示し、各オペレータによる誤り訂正の入力を受け付けるための端末である。
以下、まず、図4ないし図7を参照して各種データベース106の内容に対説明する。次に、図8ないし図14のフローチャートを参照して、図1の各装置の情報処理について説明する。最後に、図15及び図16を参照して、オペレータ端末107に表示される画面について説明する。
図4は、文書データベース108について説明する図である。
文書データベース108には、文書ごとに、文書ID、文書画像、文書属性を含む、文書データが登録される。
文書IDは、文書の識別番号である。
文書画像は、文書の画像データを格納したファイルの名前である。
文書属性は、文書の内容がどの分野に関わるものか、また、どの言語で書かれているものかを表す文字列である。
図5は、パターンデータベース109について説明する図である。
パターンデータベース109には、パターンごとに、パターンID、文書ID、パターン属性、パターン画像、パターン文字列、パターン座標を含む、パターンデータが登録される。
パターンIDは、パターンの識別番号である。
文書IDは、パターンの抽出元の文書の識別子である。
パターン属性は、パターンの色及び品詞を表す文字列である。パターン1、2、3,4は、日本語の文書からN−gram方式で抽出されたパターンであり、ここではN=2であり、2文字単位に機械的に切り出された文字列なので、品詞の指定はない。一方、パターン5、6、7は、英語の文書から形態素解析方式で抽出されたパターンであり、文法的な解釈がされた結果の品詞が指定されている。
パターン画像は、パターンのビットマップデータである。
パターン文字列は、パターン画像に対するOCR結果の文字列である。
パターン座標は、抽出元の文書におけるパターンの位置を、左上端を原点としたX座標とY座標をミリ単位で表したものである。
図6は、クラスタデータベース110について説明する図である。
クラスタデータベース110には、クラスタごとに、クラスタID、クラスタ属性、パターン文字列、パターン集合、オペレータIDを含む、クラスタデータが登録される。
クラスタIDは、クラスタの識別番号である。
クラスタ属性は、クラスタに含まれるパターン集合の抽出元である文書の内容がどの分野に関わるものか、また、どの言語で書かれているものかを表す文字列と、パターン集合の要素であるパターンの色と品詞を表す文字列を結合されたものである。
パターン文字列は、クラスタの要素となるパターンのパターン画像に対するOCR結果の文字列である。
パターン集合は、パターンIDの集合である。
オペレータIDは、誤り訂正作業を割り当てられたオペレータの識別番号である。割り当てが完了していない状態では、空値が指定される。
図7は、オペレータデータベース111について説明する図である。
オペレータデータベース111には、オペレータごとに、オペレータID、オペレータ属性を含む、オペレータデータが登録される。
オペレータIDは、オペレータの識別番号である。
オペレータ属性は、オペレータが誤り訂正作業において、得意とする文書の分野、言語、品詞を表す文字列である。
図8は、文書登録処理の流れを示すフローチャートである。
文書登録装置101において、文書ごとに、文書登録を受け付ける(ステップS11)。受付に際しては、文書ID、文書画像、文書属性を含む、文書データが入力され、その文書データを、文書データベース108に登録する(ステップS12)。
図9は、パターン抽出処理の流れを示すフローチャートである。
パターン抽出装置102において、文書データベース108に登録された文書データを取得する(ステップS13)。文書データがあるかチェックし(ステップS14)、文書データがある場合には、その文書データの文書属性に指定された言語に応じて、パターンの抽出方式を選択する(ステップS15)。本実施形態で示す例では、指定された言語が日本語の場合には、N=2のN−gram方式を選択する。また、指定された言語が英語の場合には、形態素解析方式を選択する。さらに、文書データに対して、選択した方式によるパターン抽出プログラムを実行する(ステップS16)。これらの処理(ステップS15及びステップS16)を、文書データベース108に登録されたすべての文書データに対して、実行する。
図10は、パターンデータの取得及び登録処理の流れを示すフローチャートである。
本処理は、図9のパターン抽出プログラム(S16)により実行される。本処理は、パターン抽出装置102が実行する。
パターン抽出プログラムによって、文書データから抽出されたパターンデータを取得する(ステップS17)。パターンデータがあるかチェックし(ステップS18)、パターンデータがある場合には、そのパターンデータを、パターンデータベース109に登録する(S19)。このときパターンデータは、パターンID、文書ID、パターン属性、パターン画像、パターン文字列、パターン座標を含み、これらの値は、パターン抽出装置のパターン抽出プログラムによって設定される。さらに、パターンデータに応じた、クラスタを生成する(ステップS20)。これらの処理(ステップS19及びステップS20)を、文書データから抽出されたすべてのパターンデータに対して、実行する。
図11は、クラスタ生成処理の流れを示すフローチャートである。
クラスタ生成装置103において、パターンデータに応じたクラスタ属性、つまり、パターンデータの抽出元である文書データの文書属性と、パターンデータのパターン属性を結合した文字列を生成する(ステップS21)。そのクラスタ属性と、パターンデータのパターン文字列を検索条件として、クラスタデータベース110を検索し、同じクラスタ属性であり、同じパターン文字列のクラスタがあるかチェックする(ステップS22)。クラスタデータベース110には、クラスタごとに、クラスタID、クラスタ属性、パターン文字列、パターン集合、オペレータIDを含む、クラスタデータが登録されている。
同クラスタ属性、同パターン文字列のクラスタがある場合には(S22,Yes)、そのクラスタのパターン集合に、パターンデータのパターンIDを追加する(ステップS23)。同クラスタ属性、同パターン文字列のクラスタがない場合には(S22,No)、クラスタデータベース110上に新規にクラスタデータを作成し(ステップS24)、そのクラスタデータのパターン集合に、パターンデータのパターンIDを追加する(ステップS23)。
図12は、オペレータ登録処理の流れを示すフローチャートである。
オペレータ管理装置105において、オペレータごとに、オペレータ登録を受け付ける(ステップS25)。受付に際しては、オペレータID、オペレータ属性を含む、オペレータデータが入力される。入力されたオペレータIDを検索条件に、オペレータデータベース111を検索し、対応するオペレータデータがなければ、新規登録とみなして、オペレータデータベース111上にオペレータデータを新規に作成する(ステップS27)。対応するオペレータデータがあれば、オペレータの更新とみなして、オペレータデータベース111上にオペレータデータを更新する(ステップS28)。
図13は、オペレータ割り当て処理の流れを示すフローチャートである。
オペレータ管理装置105において、オペレータ割り当てを受け付ける(ステップS29)。受付に際しては、オペレータIDが入力される。入力されたオペレータIDを検索条件に、オペレータデータベース111を検索し、オペレータデータを取得する(ステップS30)。オペレータデータがあるかチェックし(ステップS31)、オペレータデータがあれば、そのオペレータデータに応じたオペレータに相応しい、誤り訂正対象のクラスタデータを選択する(ステップS32)。そのようなクラスタデータがあるかチェックし(ステップS33)、クラスタデータがあれば、クラスタデータベース110上のクラスタデータのオペレータIDに、入力されたオペレータIDをセットする(ステップS34)。
図14は、クラスタデータ選択処理の流れを示すフローチャートである。
オペレータ管理装置105において、クラスタデータベース110から、オペレータIDがセットされていない、つまり、オペレータが割り当てられていないクラスタデータをすべて取得し、それらを要素とするリストを作成する(ステップS35)。クラスタデータのリストの要素が1以上、つまり、オペレータが割り当てられていないクラスタデータがあるかチェックする(ステップS36)。作成したクラスタデータのリストの中から、オペレータデータに応じたオペレータに相応しい誤り訂正対象のクラスタデータを探すために、オペレータデータのオペレータ属性に指定された分野、言語、品詞がクラスタ属性のクラスタデータが、なおかつ、そうしたクラスタ属性に応じたクラスタデータの中でも、パターン集合の要素数がより多い、つまり、誤り定数作業に要する工数が多いと考えられるものが、より上位になるように、クラスタデータのリストをソートする(ステップS37)。ソートした結果の最上位のクラスタデータを、オペレータデータに応じたオペレータに相応しいものとして選択する(ステップS38)。
図15は、誤り訂正画面の一例を示す図である。
誤り訂正画面は、オペレータ端末107に表示される画面であり、オペレータは、この画面を使って、クラスタデータごとに、誤り訂正作業を行う。図15中、画像a, b, c, d, eは、クラスタデータに属するパターンデータのパターン画像であり、文字列(1)は、各画像に対するOCR結果の文字列である。ここでは、同じクラスタに属しているパターンデータであるから、各文字列は同一である。オペレータは、これらのパターン画像とパターン文字列の組み合わせを目視でチェックし、誤認識があれば、誤った文字列を正しい文字列に修正する。修正された文字列は、パターンデータベース中の該当するパターンデータに反映される。
本実施形態では、OCR結果の文字列が同一であっても、文書属性及びパターン属性が異なれば、それらのパターンデータは、別のクラスタデータに属することになる。これにより、オペレータは、文書の分野や言語、パターンの品詞の情報を参考に、パターン文字列をチェックすることができ、誤り訂正作業の効率化を図ることができる。また、異なる色のパターン画像が混在することが無くなり、目の疲労を低減する効果がある。
図16は、誤り訂正画面の別の一例を示す図である。図16においては、前後のパターン画像も合わせて表示する誤り訂正画面を示している。
誤り訂正作業において、パターン文字列に対応するパターン画像をチェックしただけでは、誤りかどうかが判定できなかったり、正解の文字列が分からなかったりする場合がある。特に、N−gram方式によるパターン抽出では、パターン文字列は機械的に切り出された文字列なので、それだけでは、意味のある文字列になっているかを判定できないことが多い。図16はこうした問題を解消するために、前後のパターン画像も合わせて表示することを特徴とした誤り訂正画面である。例えば、パターン画像である画像aに対して、画像a-1はその前に、画像a+1はその後に位置するパターン画像である。
なお、図15、図16に示した誤り訂正画面は、OCR誤り訂正装置104が構成し、オペレータ端末107に提示するとよい。
1 OCR処理装置
101 文書登録装置
102 パターン抽出装置
103 クラスタ生成装置
104 OCR誤り訂正装置
105 オペレータ管理装置
106 各種データベース
107 オペレータ端末
108 文書データベース
109 パターンデータベース
110 クラスタデータベース
111 オペレータデータベース
特開2005−309608号公報

Claims (5)

  1. オペレータ属性を登録するオペレータ属性登録手段と、
    文書の画像データ及び該文書の文書属性を登録する文書属性登録手段と、
    前記画像データに基づいて文字認識を行う文字認識手段と、
    複数の文書の前記画像データから前記文字認識手段により同じ文字パターンとして文字認識された複数の画像パターン、及び、あらかじめ登録されている前記オペレータ属性に基づいて、前記同じ文字パターンとして文字認識された複数の画像パターンの認識結果を確認させるオペレータを選択する選択手段と、
    を備えることを特徴とする文字認識装置。
  2. 前記選択手段は、さらに、前記複数の画像パターンを含む複数の文書の前記文書属性にも基づいて、前記同じ文字パターンとして文字認識された複数の画像パターンの認識結果を確認させるオペレータを選択することを特徴とする、請求項1に記載の文字認識装置。
  3. 文書内で文字認識された複数の画像パターンと、前記文書属性とが共通する文書群を一つのクラスタとしてクラスタ属性を設定するクラスタ生成手段を有する
    ことを特徴とする請求項2に記載の文字認識装置。
  4. 前記選択手段により選択されたオペレータに、
    前記複数の文書のおのおのについて、
    前記同じ文字パターンとして文字認識された画像パターンの、前後の、前記文字認識手段により文字認識された画像パターンを、
    前記同じ文字パターンとして文字認識された画像パターンと並べて、
    表示した画面を構成する提示手段を有する
    ことを特徴とする、請求項1から3のいずれか1項に記載の文字認識装置。
  5. コンピュータを、
    オペレータ属性を登録するオペレータ属性登録手段と、
    文書の画像データ及び該文書の文書属性を登録する文書属性登録手段と、
    前記画像データに基づいて文字認識を行う文字認識手段と、
    複数の文書の前記画像データから前記文字認識手段により同じ文字パターンとして文字認識された複数の画像パターン、及び、あらかじめ登録されている前記オペレータ属性に基づいて、前記同じ文字パターンとして文字認識された複数の画像パターンの認識結果を確認させるオペレータを選択する選択手段として
    機能させるための、文字認識プログラム。
JP2015243401A 2015-12-14 2015-12-14 文字認識装置及びプログラム Pending JP2017111500A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015243401A JP2017111500A (ja) 2015-12-14 2015-12-14 文字認識装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015243401A JP2017111500A (ja) 2015-12-14 2015-12-14 文字認識装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2017111500A true JP2017111500A (ja) 2017-06-22

Family

ID=59080736

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015243401A Pending JP2017111500A (ja) 2015-12-14 2015-12-14 文字認識装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2017111500A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6294554B1 (ja) * 2017-10-24 2018-03-14 サンネット株式会社 文字表示システム、文字表示装置及び文字表示システムを実現させるためのプログラム
CN110909723A (zh) * 2018-09-14 2020-03-24 富士施乐株式会社 信息处理装置及存储介质
JP2020144781A (ja) * 2019-03-08 2020-09-10 富士通株式会社 手書き文字転送先決定プログラム及び方法、並びに情報処理システム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6294554B1 (ja) * 2017-10-24 2018-03-14 サンネット株式会社 文字表示システム、文字表示装置及び文字表示システムを実現させるためのプログラム
JP2019079262A (ja) * 2017-10-24 2019-05-23 サンネット株式会社 文字表示システム、文字表示装置及び文字表示システムを実現させるためのプログラム
CN110909723A (zh) * 2018-09-14 2020-03-24 富士施乐株式会社 信息处理装置及存储介质
JP2020046734A (ja) * 2018-09-14 2020-03-26 富士ゼロックス株式会社 情報処理装置及びプログラム
JP7247496B2 (ja) 2018-09-14 2023-03-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN110909723B (zh) * 2018-09-14 2024-01-12 富士胶片商业创新有限公司 信息处理装置及计算机可读存储介质
JP2020144781A (ja) * 2019-03-08 2020-09-10 富士通株式会社 手書き文字転送先決定プログラム及び方法、並びに情報処理システム
JP7208453B2 (ja) 2019-03-08 2023-01-19 富士通株式会社 手書き文字転送先決定プログラム及び方法、並びに情報処理システム

Similar Documents

Publication Publication Date Title
JP7398068B2 (ja) ソフトウェアテスト
US8094976B2 (en) One-screen reconciliation of business document image data, optical character recognition extracted data, and enterprise resource planning data
US8015203B2 (en) Document recognizing apparatus and method
US20150242761A1 (en) Interactive visualization of machine-learning performance
WO2019100577A1 (zh) 自动化测试管理方法、装置、终端设备及存储介质
CN108399072B (zh) 应用页面更新方法和装置
CN110888582B (zh) 标记信息处理方法、装置、存储介质和终端
US20200387553A1 (en) Digitization of technical documentation driven by machine learning
US9934422B1 (en) Digitized handwriting sample ingestion systems and methods
US20230048310A1 (en) System and method for identifying members of a dynamic target segment
US20210287029A1 (en) Information processing apparatus and non-transitory computer readable medium
CN113361525A (zh) 基于ocr的页面生成方法、装置、计算机设备及存储介质
CN111047434B (zh) 一种操作记录生成方法、装置、计算机设备和存储介质
JP2017111500A (ja) 文字認識装置及びプログラム
CN111459460B (zh) 一种业务数据处理方法及系统
JP2019101889A (ja) テスト実行装置及びプログラム
JP2020087112A (ja) 帳票処理装置および帳票処理方法
CN115631374A (zh) 控件操作方法、控件检测模型的训练方法、装置和设备
CN114049686A (zh) 签名识别模型训练方法、装置及电子设备
CN113408290A (zh) 一种针对中文文本的智能标注方法及系统
JP2012146147A (ja) 文書処理装置、及び文書処理プログラム
US20160070698A1 (en) Database Management System Tools for An Automated Work to Stage Process
US7080319B1 (en) Technology to translate non-text display generation data representing an indicator into text variables
US20190019054A1 (en) Contact Information Identification System
JPWO2020044537A1 (ja) 画像照合装置、画像照合方法、及びプログラム