JP7082073B2 - 計算機、学習データの生成方法、及び計算機システム - Google Patents

計算機、学習データの生成方法、及び計算機システム Download PDF

Info

Publication number
JP7082073B2
JP7082073B2 JP2019017169A JP2019017169A JP7082073B2 JP 7082073 B2 JP7082073 B2 JP 7082073B2 JP 2019017169 A JP2019017169 A JP 2019017169A JP 2019017169 A JP2019017169 A JP 2019017169A JP 7082073 B2 JP7082073 B2 JP 7082073B2
Authority
JP
Japan
Prior art keywords
data
analysis
computer
output data
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019017169A
Other languages
English (en)
Other versions
JP2020126328A (ja
JP2020126328A5 (ja
Inventor
良介 大館
広 新庄
健太 高野橋
直行 寺下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019017169A priority Critical patent/JP7082073B2/ja
Priority to US16/564,614 priority patent/US20200250578A1/en
Publication of JP2020126328A publication Critical patent/JP2020126328A/ja
Publication of JP2020126328A5 publication Critical patent/JP2020126328A5/ja
Application granted granted Critical
Publication of JP7082073B2 publication Critical patent/JP7082073B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Description

本発明は、機械学習に使用する学習データの生成技術に関する。
機械学習技術の普及により、人の認識及び確認等が伴う作業の自動化が進んでいる。例えば、帳票の読取りは機械学習技術を用いた画像処理とOCRを活用することで、自動化されている。
機械学習技術を用いた識別処理は、(1)事前に収集した学習データを用いた識別器(モデル情報)の学習と、(2)学習済みの識別器を用いて実施する、入力への識別の二つのフェーズに分けられる。識別精度は(1)の学習によって決まる。特に、学習データの数及び質は、識別精度に大きく影響を与える要素の1つである。
ここで、機械学習技術を用いた画処理を例にして、学習データについて説明する。学習データは、例題データと、画像処理の正しい結果を示す教師データとから構成されるデータである。例えば、文字の識別処理における機械学習の例題データは、文字列を含む画像等であり、教師データは画像に含まれる文字列を構成する文字の文字コード等である。また、画像処理の場合、例題データは撮影やスキャンによって取得したままの画像などであり、教師データは例題データを処理して得たい理想状態に加工された画像等である。
また、学習データの質は、例題データの多様さ、教師データの正確性等である。
一般的に、機械学習には多くの学習データが必要である。教師データの作成は人手で行われることが多く、人手による教師データの作成には多くのコスト及び時間を要するため、教師データの作成の効率化が課題である。前述の課題を解決する技術として、特許文献1に記載のような技術が知られている。
特許文献1には、「画像認識用の判定器を生成する画像処理装置であって、第1の撮像画像に基づいて、第1の学習画像及び前記第1の学習画像の画像認識結果を示す第1の学習データを生成する生成手段と、前記第1の学習データを用いた学習を行うことにより、前記第1の学習データと、第2の学習画像及び前記第2の学習画像の画像認識結果を示す予め用意された第2の学習データと、の双方に基づく判定器を生成する学習手段と、を備えることを特徴とする画像処理装置」が記載されている。
特許文献1に記載の技術を用いることによって、学習データの生成に要するコスト及び時間を削減することができる。
特開2018-148367号公報
Chris Tensmeyer and Tony Martinez, "Document Image Binarization with Fully Convolutional Neural Networks", Proceedings of ICDAR 2017,pp.99―104, 2017.
特許文献1に記載の技術では、識別器の処理結果である画像認識結果をそのまま、教師データとして利用している。
識別器の処理結果を利用する処理を含む画像処理の場合、特許文献1に記載の技術では、必ずしも処理精度の向上に貢献する学習データを生成できない。なぜならば、最終的な結果がユーザ要求を満たすか否かが考慮されていないためである。
そのため、最終的な結果がユーザ要求を満たさないような識別器の処理結果が教師データとして設定された場合、処理全体の精度は低下する。
本発明は、ユーザ要求を満たす最終的な結果が得られる識別器を実現する(モデル情報を生成する)ための学習データを効率的に生成する計算機、方法、及びシステムを提供する。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、モデル情報を用いて入力データを処理することによって生成される第1出力データから第2出力データを生成するシステムに設定する、前記モデル情報を生成するための機械学習に用いる学習データを生成する計算機であって、プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるインタフェースを備え、前記プロセッサは、解析用入力データを取得し、任意の生成条件に基づいて、前記解析用入力データから解析用第1出力データを生成し、前記解析用第1出力データから解析用第2出力データを生成し、前記解析用第2出力データを解析し、前記解析用第2出力データがユーザ要求を満たすデータである場合、前記解析用入力データ及び前記解析用第1出力データから構成されるデータを前記学習データとして生成する。
本発明の一形態によれば、ユーザ要求を満たす最終的な結果(第2出力データ)が得られるモデル情報を生成するための学習データを効率的に生成することができる。上記以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
実施例1の計算機の構成例を示す図である。 実施例1の計算機が実行する処理の流れを説明する図である。 実施例1の計算機が候補教師データを生成する処理の流れを説明する図である。 実施例1の計算機が実行する処理の一例を説明するフローチャートである。 実施例2の計算機の構成例を示す図である。 実施例2のモデル管理情報のデータ構造の一例を示す図である。 実施例2の学習データ管理情報のデータ構造の一例を示す図である。 実施例2の画像処理結果情報のデータ構造の一例を示す図である。 実施例2の評価データ管理情報のデータ構造の一例を示す図である。 実施例2の候補教師データ管理情報のデータ構造の一例を示す図である。 実施例2の計算機が実行する処理を説明するフローチャートである。 実施例2の計算機が実行する処理を説明するフローチャートである。 実施例2の計算機が候補教師データを生成する処理の流れを説明する図である。 実施例2の計算機が生成する候補教師データの一例を示す図である。 実施例2の計算機が表示する確認画面の一例を示す図である。 実施例2の計算機が実行する設定処理を説明するフローチャートである。 実施例2の計算機が実行するデグレード評価処理を説明するフローチャートである。
以下、本発明の実施例について、図面を参照して説明する。
なお、実施例を説明する図において、同一の機能を有する箇所には同一の符号を付し、その繰り返しの説明は省略する。なお、以下に説明する実施例は特許請求の範囲にかかる発明を限定するものではない。また実施例において説明されている各要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
また、以下の説明では、情報の一例として「xxxテーブル」といった表現を用いる場合があるが、情報のデータ構造はどのようなものでもよい。すなわち、情報がデータ構造に依存しないことを示すために、「xxxテーブル」を「xxx情報」と言うことができる。また、以下の説明において、各テーブルの構成は一例であり、一つのテーブルは、二つ以上のテーブルに分割されてもよいし、二つ以上のテーブルの全部又は一部が一つのテーブルであってもよい。
実施例1では、本発明の概要について説明する。
図1は、実施例1の計算機の構成例を示す図である。図2は、実施例1の計算機100が実行する処理の流れを説明する図である。図3は、実施例1の計算機100が候補教師データを生成する処理の流れを説明する図である。
計算機100は、プロセッサ101、主記憶装置102、副記憶装置103、入力装置104、及び出力装置105を有する。各ハードウェアは内部バス等を介して互いに接続される。
なお、図1では、各ハードウェアの数は一つであるが、二つ以上でもよい。また、計算機100はネットワークに接続するためのネットワークインタフェースを有してもよい。接続するネットワークの種類は限定されない。
プロセッサ101は、主記憶装置102に格納されるプログラムを実行する。プロセッサ101がプログラムにしたがって処理を実行することによって、特定の機能を実現するモジュール(機能部)として動作する。以降の説明においてモジュールを主語に処理を説明する場合、プロセッサ101が当該モジュールを実現するプログラムを実行していることを示す。
主記憶装置102は、プロセッサ101が実行するプログラム及びプログラムが使用する情報を格納する。また、主記憶装置102は、プログラムが一時的に使用するワークエリアを含む。主記憶装置102は、例えば、メモリ等が考えられる。
主記憶装置102は、必要な一部のモジュールを実現できればよく、すべてのモジュールを実現するプログラム及び情報を格納している必要はない。
副記憶装置103は、データを永続的に格納する。副記憶装置103は、例えば、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等が考えられる。なお、主記憶装置102に格納されるプログラム及び情報は、副記憶装置103に格納されてもよい。この場合、プロセッサ101が、副記憶装置103からプログラム及び情報を読み出し、主記憶装置102にロードする。
入力装置104は、計算機100に対してデータを入力するための装置である。例えば、入力装置104は、キーボード、マウス、及びタッチパネル等の計算機に対する操作を行うための機器を含む。また、入力装置104は、スキャナ、デジタルカメラ、及びスマートフォン等の画像データを取得するための機器も含む。
出力装置105は、データの入力画面及び処理結果等を出力する装置である。出力装置105は、タッチパネル及びディスプレイ等を含む。
ここで、主記憶装置102に格納されるプログラム及び情報について説明する。実施例1の主記憶装置102は、画像処理モジュール111、学習データ生成モジュール112、及び学習モジュール113を実現するプログラムを格納する。また、主記憶装置102は、モデル情報121及び学習データ管理情報122を格納する。
モデル情報121は、画像処理モジュール111が実行する処理に用いる情報である。モデル情報121は、例えば、ニューラルネットワーク又は決定木の構造等に関する情報が含まれる。なお、計算機100に初期設定するモデル情報121は、ユーザが手動で設定してもよいし、学習処理を実行することによって生成されたものでもよい。
学習データ管理情報122は、学習データ205(図2参照)を管理するための情報である。学習データ205は、画像処理の対象となる例題データと、例題データを処理することによって得られる理想的なデータ(教師データ)とから構成される。
画像処理モジュール111は、画像データ201に対して画像処理を実行する。実施例1の画像処理は、第1データ処理及び第2データ処理を含む。第1データ処理では、モデル情報121に基づいて画像データ201を処理することによって処理データ202が生成される。第1データ処理は、例えば、非特許文献1に記載された処理が考えられる。第2データ処理では、処理データ202を処理する第2画像処理を実行し、出力データ203を生成する。
なお、前述の画像処理は一例であって、本発明は、モデル情報121に基づくデータ処理の結果を利用するデータ処理を少なくとも一つ含む画像処理に適用できる。例えば、第1データ処理と第2データ処理との間に、他のデータ処理が含まれる画像処理でもよい。
学習データ生成モジュール112は、解析用画像データ204を用いて学習データ205を生成し、生成された学習データ205を学習データ管理情報122に格納する。学習データ生成モジュール112は候補教師データ生成モジュール115を含む。
候補教師データ生成モジュール115は、解析用画像データ204に対して第3データ処理を実行して、学習データ205を構成する教師データの候補となる候補教師データ301を生成する。また、候補教師データ生成モジュール115は、候補教師データ301を処理する第2画像処理を実行し、解析用出力データ302(図3参照)を生成する。
第3データ処理は、第1データ処理とは異なるアルゴリズムの処理である。第3データ処理ではモデル情報121は用いられない。処理データ202及び候補教師データ301は同じデータ形式のデータである。
学習モジュール113は、学習データ管理情報122に格納される学習データ205を用いて、モデル情報121を生成するための学習処理を実行する。本発明は、学習方法のアルゴリズムに限定されない。
なお、計算機100が備える機能及び情報は、ネットワークを介して又は直接接続される複数の計算機に分散させてもよい。例えば、画像処理モジュール111を有する計算機と、学習データ生成モジュール112を有する計算機と、学習モジュール113を有する計算機とから構成される計算機システムでもよい。
なお、本発明は、扱うデータの種別に限定されない。例えば、テキストデータ、CSV形式のデータ等でも同様の効果を奏する。
ここで、実施例1の目的について説明する。
図2に示すような画像処理に用いるモデル情報121を生成するための教師データは、ユーザ要求を満たす出力データ203が得られるデータである必要がある。本発明の目的は、出力データ203がユーザ要求を満たすことを保証する教師データを生成することである。
なお、ユーザ要求としては、出力される画像の鮮明さ、並びに、算出される予測結果又は認識結果の正確性及び精度等である。
上記目的を達成するために、計算機100は、候補教師データ301を生成し、候補教師データ301から得られる解析用出力データ302の解析結果を利用する。解析用出力データ302がユーザ要求を満たす場合、計算機100は、候補教師データ301が適切な教師データであると判定する。すなわち、最終的に出力されるデータがユーザ要求を満たす場合、計算機100は、候補教師データ301が適切な教師データであると判定する。
図4は、実施例1の計算機100が実行する処理の一例を説明するフローチャートである。
計算機100は、解析用画像データ204の入力を受け付ける(ステップS401)。解析用画像データ204は、入力装置104から取得したデータでもよいし、副記憶装置103又は外部の記憶装置から取得したデータでもよい。なお、入力される解析用画像データ204は、一つでもよし、また、複数でもよい。複数の解析用画像データ204が入力された場合、一つの解析用画像データ204に対して、ステップS402からステップS407までの処理が実行される。
次に、計算機100は、解析用画像データ204から候補教師データ301を生成し(ステップS402)、候補教師データ301から解析用出力データ302を生成する(ステップS403)。
具体的には、学習データ生成モジュール112は、解析用画像データ204を用いて第3データ処理を実行して候補教師データ301を生成し、候補教師データ301に対して第2データ処理を実行して解析用出力データ302を生成する。
次に、計算機100は、候補教師データ301を教師データとして採用できるか否かを判定する(ステップS404)。
具体的には、学習データ生成モジュール112が、解析用出力データ302に関する正確性、精度、及び品質等を解析し、解析結果に基づいて解析用出力データ302がユーザ要求を満たすか否かを判定する。解析用出力データ302がユーザ要求を満たす場合、学習データ生成モジュール112は、候補教師データ301を教師データとして採用できると判定する。
候補教師データ301を教師データとして採用できないと判定された場合、計算機100は処理を終了する。
候補教師データ301を教師データとして採用できると判定された場合、計算機100は学習データ205を生成する(ステップS405)。
具体的には、学習データ生成モジュール112が、解析用画像データ204及び候補教師データ301から構成される学習データ205を生成する。学習データ生成モジュール112は、学習データ205を学習データ管理情報122に格納する。
次に、計算機100は、学習処理を実行し(ステップS406)、その後、処理を終了する。
具体的には、学習モジュール113が、学習データ管理情報122に格納される学習データ205を用いた学習処理を実行し、モデル情報121を更新する。なお、学習データ管理情報122に格納される学習データ205の数が閾値より大きい場合、計算機100は学習処理を実行するようにしてもよい。また、学習データ生成モジュール112が生成した学習データ205の数が閾値より大きい場合、計算機100は学習処理を実行するようにしてもよい。
なお、ステップS403からステップS406までの処理が実行された後に、ステップS402の処理が実行されてもよい。
なお、解析用画像データ204の一部から候補教師データ301が生成されてもよい。この場合、解析用画像データ204の一部と候補教師データ301から構成されるデータが学習データ205として生成される。
実施例1によれば、計算機100は、モデル情報121に基づくデータ処理の出力を用いた処理において、最終的な処理結果がユーザ要求を満たすモデル情報121を生成するための学習データ205を生成できる。
実施例2では、具体的な画像処理を示して、計算機100が実行する処理について説明する。以下、実施例1との差異を中心に実施例2について説明する。
図5は、実施例2の計算機100の構成例を示す図である。
実施例2の計算機100のハードウェア構成は実施例1と同一である。実施例2では、計算機100のソフトウェア構成が一部異なる。
実施例2の計算機100は、画像処理として文字認識処理を実行する。文字認識処理では、画像データ201が二値画像データに変換され、二値画像データに対して文字認識が行われる。実施例2の画像処理では、文字列の認識結果の正確性が、出力データ203に対するユーザ要求として設定される。すなわち、正しい文字列が抽出できた場合、出力データ203はユーザ要求を満たすものと判定され、誤った文字列又は認識できない文字列が抽出された場合、出力データ203はユーザ要求を満たさないものと判定される。
実施例2の計算機100の主記憶装置102は、デグレード評価モジュール511及び学習データ設定モジュール512を実現するプログラムを格納する点が異なる。また、実施例2の計算機100の主記憶装置102は、モデル管理情報521、画像処理結果情報522、評価データ管理情報523、及び候補教師データ管理情報524を格納する点が異なる。
実施例2では、文字列を含む画像データ201及び解析用画像データ204が入力されるものとする。
画像処理モジュール111は、画像データ201又は解析用画像データ204から二値画像データを処理データ202として生成する第1データ処理を実行し、二値画像データを用いた文字認識処理を行って、認識結果を出力データ203として生成する第2データ処理を実行する。
候補教師データ生成モジュール115は、解析用画像データ204から二値画像データを候補教師データ301として生成する第3データ処理を実行し、候補教師データ301を用いた文字認識処理を行って、認識結果を解析用出力データ302として生成する第2データ処理を実行する。
学習モジュール113は、画像データ201から二値画像データを生成するためのモデル情報121を生成するための学習処理を実行する。
デグレード評価モジュール511は、学習処理によって生成されたモデル情報121のデグレードを評価する。
学習データ設定モジュール512は、学習データ生成モジュール112が学習データ205を生成できない場合、ユーザ入力に基づいて学習データ205を生成する。
モデル管理情報521は、学習処理によって生成されたモデル情報121を管理するための情報である。モデル管理情報521には、生成されたモデル情報121が履歴として格納される。モデル管理情報521のデータ構造の詳細は図6を用いて説明する。
学習データ管理情報122のデータ構造の詳細は図7を用いて説明する。
画像処理結果情報522は、画像処理モジュール111が実行した処理の結果を管理するための情報である。画像処理結果情報522のデータ構造の詳細は図8を用いて説明する。
評価データ管理情報523は、デグレード評価モジュール511が使用する評価データを管理するための情報である。評価データ管理情報523のデータ構造の詳細は図9を用いて説明する。評価データは、学習データ205と同一データ構造である。
候補教師データ管理情報524は、候補教師データ301を管理するための情報である。候補教師データ管理情報524のデータ構造の詳細は図10を用いて説明する。
図6は、実施例2のモデル管理情報521のデータ構造の一例を示す図である。
モデル管理情報521は、モデル情報ID601、モデル情報602、及び日時603から構成されるエントリを含む。一つのエントリが一つのモデル情報121に対応する。なお、エントリに含まれるフィールドは一例であって、前述した以外のフィールドを含んでもよい。
モデル情報ID601は、モデル情報121を一意に識別するための識別情報を格納するフィールドである。
モデル情報602は、モデル情報121を格納するフィールドである。なお、モデル情報602には、副記憶装置103等に格納されるモデル情報121を読み出すためのリンク及びパス等が格納されてもよい。
日時603は、モデル情報121を生成するための学習処理が実行された日時を格納するフィールドである。日時603は、モデル情報121の世代を特定するための情報として用いられる。なお、日時603の代わりに、使用した学習データ205のセット、及び作成者等を格納するフィールドを設けてもよい。また、日時603とともに、前述のようなフィールドを設けてもよい。
図7は、実施例2の学習データ管理情報122のデータ構造の一例を示す図である。
学習データ管理情報122は、学習データID701、画像データ702、及び二値画像データ703から構成されるエントリを含む。一つのエントリが一つの学習データ205に対応する。なお、エントリに含まれるフィールドは一例であって、前述した以外のフィールドを含んでもよい。
学習データID701は、学習データ205を一意に識別するための識別情報を格納するフィールドである。
画像データ702は、学習データ205を構成する例題データである画像データを格納するフィールドである。画像データ702には、副記憶装置103等に格納される画像データを読み出すためのリンク及びパス等が格納されてもよい。
二値画像データ703は、教師データである二値画像データを格納するフィールドである。二値画像データ703には、副記憶装置103等に格納される二値画像データを読み出すためのリンク及びパス等が格納されてもよい。
なお、画像データ702が「train.png」である学習データ205は、予め設定されている学習データであり、画像データ702が「retrain.png」である学習データ205は、学習データ生成モジュール112又は学習データ設定モジュール512によって生成された学習データ205を表す。
図8は、実施例2の画像処理結果情報522のデータ構造の一例を示す図である。
画像処理結果情報522は、画像データID801、画像データ802、二値画像データ803、及び文字認識データ804から構成されるエントリを含む。一つの解析用画像データ204に対して一つのエントリが存在する。なお、エントリに含まれるフィールドは一例であって、前述した以外のフィールドを含んでもよい。
画像データID801は、解析用画像データ204を一意に識別するための識別情報を格納するフィールドである。
画像データ802は、解析用画像データ204を格納するフィールドである。画像データ802には、副記憶装置103等に格納される解析用画像データ204を読み出すためのリンク及びパス等が格納されてもよい。
二値画像データ803は、解析用画像データ204に対して第1データ処理を実行することによって生成された二値画像データ(処理データ202)を格納するフィールドである。二値画像データ803には、副記憶装置103等に格納される二値画像データを読み出すためのリンク及びパス等が格納されてもよい。
文字認識データ804は、二値画像データに対して第2データ処理を実行することによって生成された文字認識データ(出力データ203)を格納するフィールドである。文字認識データは文字認識の結果を含むデータである。文字認識データ804には、副記憶装置103等に格納される文字認識データを読み出すためのリンク及びパス等が格納されてもよい。
図9は、実施例2の評価データ管理情報523のデータ構造の一例を示す図である。
評価データ管理情報523は、評価データID901、画像データ902、及び二値画像データ903から構成されるエントリを含む。一つのエントリが一つの評価データに対応する。なお、エントリに含まれるフィールドは一例であって、前述した以外のフィールドを含んでもよい。
評価データID901は、評価データを一意に識別するための識別情報を格納するフィールドである。
画像データ902は、評価用の画像データ201を格納するフィールドである。画像データ902には、副記憶装置103等に格納される評価用の画像データを読み出すためのリンク及びパス等が格納されてもよい。
二値画像データ903は、評価用の教師データを格納するフィールドである。二値画像データ903には、副記憶装置103等に格納される評価用の二値画像データを読み出すためのリンク及びパス等が格納されてもよい。
図10は、実施例2の候補教師データ管理情報524のデータ構造の一例を示す図である。
候補教師データ管理情報524は、画像データID1001、文字列ID1002、文字列1003、座標1004、正解文字列1005、解析用二値画像データ1006、及び解析用文字列1007から構成されるエントリを含む。一つの解析用画像データ204に対して一つのエントリが存在する。
画像データID1001は、解析用画像データ204を一意に識別するための識別情報を格納するフィールドである。
文字列ID1002は、画像処理によって抽出された文字列の識別情報を格納するフィールドである。一つのエントリには、抽出された文字列の数だけ行が存在し、各行は文字列ID1002によって識別される。
文字列1003は、画像処理によって抽出された文字列を格納するフィールドである。なお、認識ができない文字列が抽出された場合、文字列1003は、空欄となる。
座標1004は、画像上の文字列の位置を示す座標を格納するフィールドである。例えば、矩形領域の左上の座標及び右下の座標の組が、座標1004に格納される。
正解文字列1005は、抽出すべき文字列を格納するフィールドである。
解析用二値画像データ1006は、候補教師データ301として生成された二値画像データを格納するフィールドである。
解析用文字列1007は、候補教師データ301として生成された二値画像データに対する文字認識の結果を格納するフィールドである。
座標1004及び正解文字列1005は、解析用画像データ204のメタデータに含めることもできるし、ユーザが画像処理結果を参照して、手動で設定することもできる。
図11A及び図11Bは、実施例2の計算機100が実行する処理を説明するフローチャートである。図12は、実施例2の計算機100が候補教師データを生成する処理の流れを説明する図である。図13は、実施例2の計算機100が生成する候補教師データの一例を示す図である。図14は、実施例2の計算機100が表示する確認画面の一例を示す図である。
計算機100は、解析用画像データ204を受け付ける(ステップS401)。なお、解析用画像データ204のメタデータは解析領域の座標及び正解文字列の組を一つ以上含むものとする。なお、入力される解析用画像データ204は、一つでもよし、また、複数でもよい。複数の解析用画像データ204が入力された場合、一つの解析用画像データ204に対して、ステップS402からステップS406、ステップS1101からステップS1110までの処理が実行される。
次に、計算機100の画像処理モジュール111は、解析用画像データ204に対して第1データ処理を実行することによって二値画像データを処理データ202として生成し(ステップS1101)、二値画像データに対して第2データ処理を実行することによって文字認識データを出力データ203として生成する(ステップS1102)。
次に、計算機100の画像処理モジュール111は、画像処理結果情報522を更新する(ステップS1103)。
具体的には、画像処理モジュール111は、画像処理結果情報522にエントリを追加し、追加されたエントリの画像データID801に解析用画像データ204の識別情報を格納する。また、画像処理モジュール111は、追加されたエントリの画像データ802に解析用画像データ204を格納し、二値画像データ803に処理データ202を格納し、文字認識データ804に出力データ203を格納する。
次に、計算機100の学習データ生成モジュール112は、解析領域を特定する(ステップS1104)。具体的には、以下のような処理が実行される。
学習データ生成モジュール112は、候補教師データ管理情報524にエントリを追加し、追加されたエントリの画像データID1001に解析用画像データ204の識別情報を格納する。
学習データ生成モジュール112は、出力データ203である文字認識データに基づいて、追加されたエントリに文字認識が行われた領域の数だけ行を生成する。一つの行が一つの解析領域として特定される。
学習データ生成モジュール112は、文字認識データに基づいて、生成された各行の文字列ID102、文字列1003、及び座標1004に値を格納する。
学習データ生成モジュール112は、解析用画像データ204のメタデータを参照し、各行の正解文字列1005に値を格納する。なお、手動で設定する場合には、学習データ生成モジュール112は、認識結果を表示する画面を提示し、文字列の入力を受け付ける。以上がステップS110の処理の説明である。
次に、計算機100の学習データ生成モジュール112は、特定された解析領域の中からターゲット解析領域を選択する(ステップS1105)。
次に、計算機100の学習データ生成モジュール112は、第3データ処理を調整するためのパラメータを初期化する(ステップS1106)。
例えば、輝度に対する閾値処理によって画像を二値化する場合、閾値tを0に設定する。なお、閾値tは0から255の範囲で変更することができる。なお、本発明は、二値画像データの生成方法に限定されない。
次に、計算機100の学習データ生成モジュール112は、ターゲット解析領域に含まれる画像に対して第3データ処理を実行することによって、二値画像データを候補教師データ301として生成する(ステップS402)。
例えば、図12に示すような、文字列「金額」を含む解析領域の画像データ1200が入力された場合、候補教師データ生成モジュール115は、図12に示すような二値画像データを候補教師データ301として生成する。
なお、閾値tを調整することによって、図13に示すような様々な候補教師データ301が生成される。候補教師データ301-1は閾値tが0の場合に生成される二値画像データである。候補教師データ301-2は閾値tが32の場合に生成される二値画像データである。候補教師データ301-3は閾値tが64の場合に生成される二値画像データである。候補教師データ301-4は閾値tが96の場合に生成される二値画像データである。候補教師データ301-5は閾値tが128の場合に生成される二値画像データである。候補教師データ301-6は閾値tが192の場合に生成される二値画像データである。候補教師データ301-7は閾値tが256の場合に生成される二値画像データである。
このとき、学習データ生成モジュール112は、ステップS110において候補教師データ管理情報524に追加されたエントリを参照し、ターゲット解析領域に対応する行の解析用二値画像データ1006に、生成された候補教師データ301を格納する。
次に、計算機100の学習データ生成モジュール112は、候補教師データ301に対して第2データ処理を実行することによって、文字認識データを解析用出力データ302として生成する(ステップS403)。
例えば、図12に示すような、文字列「金額」を含む解析領域の画像データ1200が入力された場合、候補教師データ生成モジュール115は、図12に示すような二値画像データを候補教師データ301として生成する。
このとき、学習データ生成モジュール112は、ステップS110において候補教師データ管理情報524に追加されたエントリを参照し、ターゲット解析領域に対応する行の解析用文字列1007に、生成された解析用出力データ302を格納する。
次に、計算機100の学習データ生成モジュール112は、候補教師データ301を教師データとして採用できるか否かを判定する(ステップS404)。
具体的には、学習データ生成モジュール112は、ターゲット解析領域に対応する行の正解文字列1005の文字列と解析用文字列1007の文字列とが一致するか否かを判定する。正解文字列1005の文字列と解析用文字列1007の文字列とが一致する場合、学習データ生成モジュール112は、候補教師データ301を教師データとして採用できると判定する。
例えば、候補教師データ301-4及び候補教師データ301-5等が教師データとして採用できると判定される。
候補教師データ301を教師データとして採用できると判定された場合、計算機100の学習データ生成モジュール112は学習データ205を生成する(ステップS405)。その後、計算機100はステップS1110に進む。
具体的には、学習データ生成モジュール112が、ターゲット解析領域の画像及び候補教師データ301から構成される学習データ205を生成する。学習データ生成モジュール112は、学習データ管理情報12にエントリを追加し、追加されたエントリの学習データID701に識別情報を格納する。また、学習データ生成モジュール112は、追加されたエントリの画像データ702にターゲット解析領域の画像を格納し、二値画像データ703に候補教師データ301を格納する。
候補教師データ301を教師データとして採用できないと判定された場合、計算機100の学習データ生成モジュール112は、パラメータを変更できるか否かを判定する(ステップS1107)。
例えば、学習データ生成モジュール112は、閾値tが255より小さいか否かを判定する。閾値tが255より小さい場合、学習データ生成モジュール112は、パラメータを変更できると判定する。
パラメータを変更できると判定された場合、計算機100の学習データ生成モジュール112は、パラメータを更新し(ステップS1108)、その後、ステップS402に戻る。
パラメータを変更できないと判定された場合、計算機100は設定処理を実行し(ステップS1109)、その後、ステップS1110に進む。
具体的には、学習データ生成モジュール112は、学習データ設定モジュール512に設定処理の実行を指示し、待ち状態に移行する。学習データ生成モジュール112は、学習データ設定モジュール512から完了通知を受け付けた場合、ステップS1110に進む。なお、設定処理の詳細は図15を用いて説明する。
ステップS1110では、計算機100の学習データ生成モジュール112は、全ての解析領域について処理が完了したか否かを判定する(ステップS1110)。
全ての解析領域について処理が完了していないと判定された場合、計算機100の学習データ生成モジュール112は、ステップS1105に戻る。
全ての解析領域について処理が完了したと判定された場合、計算機100の学習モジュール113は、学習処理を実行する(ステップS406)。
このとき、学習モジュール113は、モデル管理情報521にエントリを追加し、追加されたエントリのモデル情報ID601に識別情報を格納する。また、学習モジュール113は、追加されたエントリのモデル情報602に学習処理によって生成されたモデル情報121を格納し、日時603に学習処理の開始時刻等を格納する。
次に、計算機100のデグレード評価モジュール511は、評価データ管理情報523に格納される評価データを用いて、生成されたモデル情報121に対するデグレード評価処理を実行する(ステップS1111)。その後、計算機100は処理を終了する。
具体的には、学習データ生成モジュール112は、デグレード評価モジュール511にデグレード評価処理の実行を指示し、待ち状態に移行する。学習データ生成モジュール112は、デグレード評価モジュール511から完了通知を受け付けた場合、処理を終了する。なお、デグレード評価処理の詳細は図16を用いて説明する。
(バリエーション1)図11A及び図11Bで説明した処理では、一つの解析領域に対して一つの学習データ205が生成されていたが、これに限定されない。
例えば、学習データ生成モジュール112は、解析用画像データ204と、各解析領域の二値画像データを含むデータとから構成される学習データ205を生成してもよい。この場合、ステップS1110の処理の後にステップS405の処理が実行される。
(バリエーション2)図11A及び図11Bで説明した処理では、全ての解析領域に対して学習データ205が生成されていたが、これに限定されない。
例えば、学習データ生成モジュール112は、文字列1103及び正解文字列1005が一致しない解析領域のみを処理の対象としてもよい。すなわち、画像処理モジュール111が認識できなかった解析領域のみを処理の対象としてもよい。誤った文字認識を含む解析領域又は認識不明な解析領域から学習データ205を生成することによって、学習するデータ量を削減しつつ、精度の向上が可能な学習処理を実現できる。
(バリエーション3)計算機100は、ステップS1110の判定結果がYESの場合、生成された学習データ205を提示するための確認画面1400を表示してもよい。ここで、確認画面1400について説明する。
確認画面1400は、例題データ表示欄1401、教師データ表示欄1402、描画モード切り替えボタン1403、カーソルサイズ調整バー1404、データサイズ調整バー1405、前ボタン1406、次ボタン1407、及び削除ボタン1408を含む。
例題データ表示欄1401は、学習データ205を構成する例題データ(解析用画像データ204)を表示する欄である。
教師データ表示欄1402は、学習データ205を構成する教師データ(候補教師データ301)を表示する欄である。図14に示す教師データ表示欄1502には、解析用画像データ204に含まれる各解析領域から生成された二値画像データ(候補教師データ301)が表示される。
教師データ表示欄1402にはカーソル1410が表示される。ユーザは、カーソル1410を操作して二値画像データを修正する領域を選択し、当該領域の二値画像データを修正する。学習データ生成モジュール112は、ユーザの修正内容を受け付けた場合、ユーザが指定した領域に含まれる解析領域を特定し、当該解析領域に対応する行の解析用二値画像データ1006を更新する。
描画モード切り替えボタン1403は、教師データの描画モードを切り替えるためのボタンである。例えば、二値画像データの白及び黒を切り替える操作が考えられる。
カーソルサイズ調整バー1404は、カーソル1410の大きさを調整するためのバーである。
データサイズ調整バー1405は、例題データ及び教師データのサイズを拡大又は縮小するためのバーである。
前ボタン1406は、一つ前の学習データ205を表示するためのボタンである。次ボタン1407は、一つ後の学習データ205を表示するためのボタンである。前ボタン1406及び次ボタン1407のいずれかが操作された場合、例題データ表示欄1401及び教師データ表示欄1402に表示される画像が切り替わる。
削除ボタン1408は、学習データ205を削除するためのボタンである。学習データ生成モジュール112は、削除ボタン1408が操作された場合、学習データ管理情報12から確認画面1400に表示される学習データ205を削除する。
なお、確認画面1400は表示画面の一例であり、これに限定されない。例えば、例題データ及び教師データの差異を見やすくするために、例題データ及び教師データをオーバレイ表示してもよい。
図15は、実施例2の計算機100が実行する設定処理を説明するフローチャートである。
学習データ設定モジュール512は、ユーザによる学習データ205の設定を受け付けるためのAPI(Application Programming Interface)を提供する(ステップS1501)。例えば、図14に示すような画面を入力装置104に表示する。なお、教師データの生成に要する工数を削減するために、教師データ表示欄1402には、特定の領域の二値画像データが含む予め設定された二値画像データを表示してもよい。
学習データ設定モジュール512は、APIを介して、学習データの設定指示を受信したか否かを判定する(ステップS1502)。
学習データの設定指示を受信していないと判定された場合、学習データ設定モジュール512は設定処理を終了する。このとき、学習データ設定モジュール512は、学習データ生成モジュール112に完了通知を送信する。
学習データの設定指示を受信したと判定された場合、学習データ設定モジュール512は、学習データ管理情報122を更新し(ステップS1503)、その後、設定処理を終了する。このとき、学習データ設定モジュール512は、学習データ生成モジュール112に完了通知を送信する。
図16は、実施例2の計算機100が実行するデグレード評価処理を説明するフローチャートである。
デグレード評価モジュール511は、学習処理によって生成されたモデル情報121を学習モジュール113に設定する(ステップS1601)。
次に、評価データ管理情報523に格納される評価データ、及び、学習データ生成モジュール112によって生成された学習データ205を画像処理モジュール111に入力する(ステップS1602)。
次に、デグレード評価モジュール511は、画像処理モジュール111から出力データ203を取得する(ステップS1603)。
次に、デグレード評価モジュール511は、出力データ203等を用いて、モデル情報121の評価指標を算出する(ステップS1604)。例えば、二値画像データに対する文字認識の精度を示す値が評価指標として算出される。なお、本発明は、算出される評価指標の種別及び数に限定されない。
次に、デグレード評価モジュール511は、評価指標に基づいて、基準性能を満たすか否かを判定する(ステップS1605)。例えば、各画像データの白及び黒の画素の再現率及び適合率の平均値(評価指標)が閾値より大きい場合、デグレード評価モジュール511は基準性能を満たすと判定する。なお、本発明は、基準性能の設定に限定されない。
基準性能を満たさないと判定された場合、デグレード評価モジュール511は、現在のモデル情報121を画像処理モジュール111に設定し(ステップS1606)、その後、デグレード評価処理を終了する。この場合、画像処理モジュール111が使用するモデル情報121は更新されない。
基準性能を満たすと判定された場合、デグレード評価モジュール511はデグレード評価処理を終了する。この場合、画像処理モジュール111が使用するモデル情報121は、新たに生成されたモデル情報121に置き換えられる。
実施例2によれば、計算機100は、最終的な処理結果がユーザ要求を満たすモデル情報121を生成するための学習データ205を生成できる。また、ユーザ要求を満たさない処理結果の生成元のデータから学習データ205を生成することによって、効率的な学習処理を実現できる。
上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD-ROM、DVD-ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD-R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、本実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Python、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD-RW、CD-R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
100 計算機
101 プロセッサ
102 主記憶装置
103 副記憶装置
104 入力装置
105 出力装置
111 画像処理モジュール
112 学習データ生成モジュール
113 学習モジュール
115 候補教師データ生成モジュール
121 モデル情報
122 学習データ管理情報
123 学習データ管理情報
201 画像データ
202 処理データ
203 出力データ
204 解析用画像データ
205 学習データ
301 候補教師データ
302 解析用出力データ
511 デグレード評価モジュール
512 学習データ設定モジュール
521 モデル管理情報
522 画像処理結果情報
523 評価データ管理情報
524 候補教師データ管理情報
1400 確認画面

Claims (15)

  1. モデル情報を用いて入力データを処理することによって生成される第1出力データから第2出力データを生成するシステムに設定する、前記モデル情報を生成するための機械学習に用いる学習データを生成する計算機であって、
    プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるインタフェースを備え、
    前記プロセッサは、
    解析用入力データを取得し、
    任意の生成条件に基づいて、前記解析用入力データから解析用第1出力データを生成し、
    前記解析用第1出力データから解析用第2出力データを生成し、
    前記解析用第2出力データを解析し、
    前記解析用第2出力データがユーザ要求を満たすデータである場合、前記解析用入力データ及び前記解析用第1出力データから構成されるデータを前記学習データとして生成することを特徴とする計算機。
  2. 請求項1に記載の計算機であって、
    前記プロセッサは、前記システムから出力され、かつ、ユーザ要求を満たさない前記第2出力データが生成された前記第1出力データの生成元となる前記入力データを前記解析用入力データとして取得することを特徴とする計算機。
  3. 請求項1に記載の計算機であって、
    前記プロセッサは、
    前記解析用入力データに含まれる要素データから前記解析用第1出力データを生成し、
    前記解析用第1出力データから生成された前記解析用第2出力データがユーザ要求を満たすデータである場合、前記要素データ及び前記解析用第1出力データを前記学習データとして生成することを特徴とする計算機。
  4. 請求項1に記載の計算機であって、
    前記プロセッサは、前記モデル情報によって定義されるアルゴリズムとは異なるアルゴリズムに基づいて、前記解析用第1出力データを生成することを特徴とする計算機。
  5. 請求項1に記載の計算機であって、
    前記記憶装置は、評価用入力データを格納し、
    前記プロセッサは、
    前記学習データを用いた学習処理を実行することによって新規モデル情報を生成し、
    前記新規モデル情報を用いて前記評価用入力データを処理することによって生成される前記第1出力データから前記第2出力データを生成し、
    前記第2出力データを解析することによって、前記新規モデル情報の品質を評価する指標を算出し、
    前記指標に基づいて、前記新規モデル情報を保存するか否かを判定することを特徴とする計算機。
  6. 計算機が実行する、モデル情報を用いて入力データを処理することによって生成される第1出力データから第2出力データを生成するシステムに設定する、前記モデル情報を生成するための機械学習に用いる学習データの生成方法であって、
    前記計算機は、プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるインタフェースを有し、
    前記学習データの生成方法は、
    前記プロセッサが、解析用入力データを取得する第1のステップと、
    前記プロセッサが、任意の生成条件に基づいて、前記解析用入力データから解析用第1出力データを生成する第2のステップと、
    前記プロセッサが、前記解析用第1出力データから解析用第2出力データを生成する第3のステップと、
    前記プロセッサが、前記解析用第2出力データを解析する第4のステップと、
    前記プロセッサが、前記解析用第2出力データがユーザ要求を満たすデータである場合、前記解析用入力データ及び前記解析用第1出力データから構成されるデータを前記学習データとして生成する第5のステップと、を含むことを特徴とする学習データの生成方法。
  7. 請求項6に記載の学習データの生成方法であって、
    前記第1のステップは、前記プロセッサが、前記システムから出力され、かつ、ユーザ要求を満たさない前記第2出力データが生成された前記第1出力データの生成元となる前記入力データを前記解析用入力データとして取得するステップを含むことを特徴とする学習データの生成方法。
  8. 請求項6に記載の学習データの生成方法であって、
    前記第2のステップは、前記プロセッサが、前記解析用入力データに含まれる要素データから前記解析用第1出力データを生成するステップを含み、
    前記第5のステップは、前記プロセッサが、前記解析用第1出力データから生成された前記解析用第2出力データがユーザ要求を満たすデータである場合、前記要素データ及び前記解析用第1出力データを前記学習データとして生成するステップを含むことを特徴とする学習データの生成方法。
  9. 請求項6に記載の学習データの生成方法であって、
    前記プロセッサは、前記モデル情報によって定義されるアルゴリズムとは異なるアルゴリズムに基づいて、前記解析用第1出力データを生成することを特徴とする学習データの生成方法。
  10. 請求項6に記載の学習データの生成方法であって、
    前記記憶装置は、評価用入力データを格納し、
    前記学習データの生成方法は、
    前記プロセッサが、
    前記学習データを用いた学習処理を実行することによって新規モデル情報を生成し、
    前記新規モデル情報を用いて前記評価用入力データを処理することによって生成される前記第1出力データから前記第2出力データを生成し、
    前記第2出力データを解析することによって、前記新規モデル情報の品質を評価する指標を算出し、
    前記指標に基づいて、前記新規モデル情報を保存するか否かを判定することを特徴とする学習データの生成方法。
  11. 複数の計算機を備える計算機システムであって、
    前記複数の計算機の各々は、プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるインタフェースを有し、
    前記複数の計算機は、モデル情報を用いて入力データを処理することによって生成される第1出力データから第2出力データを生成する処理を実行する第1計算機と、前記モデル情報を生成するための機械学習に用いる学習データを生成する第2計算機とを含み、
    前記第2計算機は、
    解析用入力データを取得し、
    任意の生成条件に基づいて、前記解析用入力データから解析用第1出力データを生成し、
    前記解析用第1出力データから解析用第2出力データを生成し、
    前記解析用第2出力データを解析し、
    前記解析用第2出力データがユーザ要求を満たすデータである場合、前記解析用入力データ及び前記解析用第1出力データから構成されるデータを前記学習データとして生成することを特徴とする計算機システム。
  12. 請求項11に記載の計算機システムであって、
    前記第2計算機は、前記第1計算機から出力され、かつ、ユーザ要求を満たさない前記第2出力データが生成された前記第1出力データの生成元となる前記入力データを前記解析用入力データとして取得することを特徴とする計算機システム。
  13. 請求項11に記載の計算機システムであって、
    前記第2計算機は、
    前記解析用入力データに含まれる要素データから前記解析用第1出力データを生成し、
    前記解析用第1出力データから生成された前記解析用第2出力データがユーザ要求を満たすデータである場合、前記要素データ及び前記解析用第1出力データを前記学習データとして生成することを特徴とする計算機システム。
  14. 請求項11に記載の計算機システムであって、
    前記第2計算機は、前記モデル情報によって定義されるアルゴリズムとは異なるアルゴリズムに基づいて、前記解析用第1出力データを生成することを特徴とする計算機システム。
  15. 請求項11に記載の計算機システムであって、
    前記第2計算機は、評価用入力データを管理し、
    前記第2計算機は、
    前記学習データを用いた学習処理を実行することによって新規モデル情報を生成し、
    前記評価用入力データを前記第1計算機に出力し、
    前記第1計算機は、前記新規モデル情報に基づいて前記評価用入力データを処理することによって生成される前記第1出力データから前記第2出力データを生成して、前記第2計算機に出力し、
    前記第2計算機は、
    前記評価用入力データから生成された前記第2出力データを解析することによって、前記新規モデル情報の品質を評価する指標を算出し、
    前記指標に基づいて、前記新規モデル情報を適用するか否かを判定することを特徴とする計算機システム。
JP2019017169A 2019-02-01 2019-02-01 計算機、学習データの生成方法、及び計算機システム Active JP7082073B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019017169A JP7082073B2 (ja) 2019-02-01 2019-02-01 計算機、学習データの生成方法、及び計算機システム
US16/564,614 US20200250578A1 (en) 2019-02-01 2019-09-09 Computer, method of generating learning data, and computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019017169A JP7082073B2 (ja) 2019-02-01 2019-02-01 計算機、学習データの生成方法、及び計算機システム

Publications (3)

Publication Number Publication Date
JP2020126328A JP2020126328A (ja) 2020-08-20
JP2020126328A5 JP2020126328A5 (ja) 2021-08-05
JP7082073B2 true JP7082073B2 (ja) 2022-06-07

Family

ID=71837741

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019017169A Active JP7082073B2 (ja) 2019-02-01 2019-02-01 計算機、学習データの生成方法、及び計算機システム

Country Status (2)

Country Link
US (1) US20200250578A1 (ja)
JP (1) JP7082073B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7408973B2 (ja) * 2019-09-18 2024-01-09 富士フイルムビジネスイノベーション株式会社 学習モデル生成装置、画像補正装置、学習モデル生成プログラム、及び画像補正プログラム
JP7502808B2 (ja) 2022-06-24 2024-06-19 株式会社 東京ウエルズ 学習装置、学習方法及び学習プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015228162A (ja) 2014-06-02 2015-12-17 Kddi株式会社 情報検索方法、装置およびプログラム
US20200242154A1 (en) 2019-01-24 2020-07-30 Olympus Corporation Image file generating device and image file generating method
JP2020119322A (ja) 2019-01-24 2020-08-06 オリンパス株式会社 学習依頼装置および学習依頼方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015228162A (ja) 2014-06-02 2015-12-17 Kddi株式会社 情報検索方法、装置およびプログラム
US20200242154A1 (en) 2019-01-24 2020-07-30 Olympus Corporation Image file generating device and image file generating method
JP2020119322A (ja) 2019-01-24 2020-08-06 オリンパス株式会社 学習依頼装置および学習依頼方法

Also Published As

Publication number Publication date
JP2020126328A (ja) 2020-08-20
US20200250578A1 (en) 2020-08-06

Similar Documents

Publication Publication Date Title
KR102247606B1 (ko) 화상처리장치, 그 제어 방법, 및 기억매체
JP4973063B2 (ja) 表データ処理方法及び装置
JP4676225B2 (ja) スキャン・ドキュメントから電子フォームに取り込むための方法および装置
US20200279107A1 (en) Digital image-based document digitization using a graph model
JP6277818B2 (ja) 機械学習装置、機械学習方法、及びプログラム
JP7013182B2 (ja) 情報処理装置、情報処理方法およびプログラム
US10062007B2 (en) Apparatus and method for creating an image recognizing program having high positional recognition accuracy
JP7082073B2 (ja) 計算機、学習データの生成方法、及び計算機システム
EP1300779B1 (en) Form recognition system, form recognition method, program and storage medium
US20200293810A1 (en) Image processing device, machine learning device, and information processing method
CN112000834B (zh) 文档处理方法、装置、系统、电子设备及存储介质
JP2022017202A (ja) レイアウト解析方法、読取り支援デバイス、回路および媒体
JP4498203B2 (ja) メータ認識システム、メータ認識方法、およびメータ認識プログラム
CN105225218A (zh) 用于文档图像的畸变校正方法和设备
JP2022170175A (ja) 情報処理装置、情報処理方法、及びプログラム
CN112383824A (zh) 视频广告过滤方法、设备及存储介质
US20120230589A1 (en) Computer-readable storage medium storing image processing program, image processing method, and image processing device
JP4859351B2 (ja) 事例データベースの構築方法、判別装置の学習方法、データ判別支援装置、データ判別支援プログラム
US11588945B2 (en) Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area
CN116107556A (zh) 一种基于可视化低代码平台的开发方法
US20220406082A1 (en) Image processing apparatus, image processing method, and storage medium
KR101790544B1 (ko) 정보 처리 장치, 정보 처리 방법, 및 기억 매체
US11206336B2 (en) Information processing apparatus, method, and non-transitory computer readable medium
JP4628278B2 (ja) 表認識装置、及びコンピュータプログラム
CN114282559A (zh) 一种光学代码定位方法、装置、图像传感器芯片

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210624

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210624

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220526

R150 Certificate of patent or registration of utility model

Ref document number: 7082073

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150