JP2020126328A5 - - Google Patents

Download PDF

Info

Publication number
JP2020126328A5
JP2020126328A5 JP2019017169A JP2019017169A JP2020126328A5 JP 2020126328 A5 JP2020126328 A5 JP 2020126328A5 JP 2019017169 A JP2019017169 A JP 2019017169A JP 2019017169 A JP2019017169 A JP 2019017169A JP 2020126328 A5 JP2020126328 A5 JP 2020126328A5
Authority
JP
Japan
Prior art keywords
data
analysis
output data
computer
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019017169A
Other languages
English (en)
Other versions
JP2020126328A (ja
JP7082073B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2019017169A priority Critical patent/JP7082073B2/ja
Priority claimed from JP2019017169A external-priority patent/JP7082073B2/ja
Priority to US16/564,614 priority patent/US20200250578A1/en
Publication of JP2020126328A publication Critical patent/JP2020126328A/ja
Publication of JP2020126328A5 publication Critical patent/JP2020126328A5/ja
Application granted granted Critical
Publication of JP7082073B2 publication Critical patent/JP7082073B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

ここで、機械学習技術を用いた画処理を例にして、学習データについて説明する。学習データは、例題データと、画像処理の正しい結果を示す教師データとから構成されるデータである。例えば、文字の識別処理における機械学習の例題データは、文字列を含む画像等であり、教師データは画像に含まれる文字列を構成する文字の文字コード等である。また、画像処理の場合、例題データは撮影やスキャンによって取得したままの画像などであり、教師データは例題データを処理して得たい理想状態に加工された画像等である。
具体的には、学習データ生成モジュール112は、解析用画像データ204を用いて第3データ処理を実行して候補教師データ301を生成し、候補教師データ301に対して第2データ処理を実行して解析用出力データ302を生成する。
具体的には、学習データ生成モジュール112が、解析用画像データ204及び候補教師データ301から構成される学習データ205を生成する。学習データ生成モジュール112は、学習データ205を学習データ管理情報122に格納する。
なお、解析用画像データ204の一部から候補教師データ301が生成されてもよい。この場合、解析用画像データ204の一部と候補教師データ301から構成されるデータが学習データ205として生成される。
実施例2の計算機100は、画像処理として文字認識処理を実行する。文字認識処理では、画像データ201が二値画像データに変換され、二値画像データに対して文字認識が行われる。実施例2の画像処理では、文字列の認識結果の正確性が、出力データ203に対するユーザ要求として設定される。すなわち、正しい文字列が抽出できた場合、出力データ203はユーザ要求を満たすものと判定され、誤った文字列又は認識できない文字列が抽出された場合、出力データ203はユーザ要求を満たさないものと判定される。
画像処理モジュール111は、画像データ201又は解析用画像データ204から二値画像データを処理データ202として生成する第1データ処理を実行し、二値画像データを用いた文字認識処理を行って、認識結果を出力データ203として生成する第2データ処理を実行する。
モデル管理情報521は、学習処理によって生成されたモデル情報121を管理するための情報である。モデル管理情報521には、生成されたモデル情報121が履歴として格納される。モデル管理情報521のデータ構造の詳細は図6を用いて説明する。
日時603は、モデル情報121を生成するための学習処理が実行された日時を格納するフィールドである。日時603は、モデル情報121の世代を特定するための情報として用いられる。なお、日時603の代わりに、使用した学習データ205のセット、及び作成者等を格納するフィールドを設けてもよい。また、日時603とともに、前述のようなフィールドを設けてもよい。
画像処理結果情報522は、画像データID801、画像データ802、二値画像データ803、及び文字認識データ804から構成されるエントリを含む。一つの解析用画像データ204に対して一つのエントリが存在する。なお、エントリに含まれるフィールドは一例であって、前述した以外のフィールドを含んでもよい。
候補教師データ管理情報524は、画像データID1001、文字列ID1002、文字列1003、座標1004、正解文字列1005、解析用二値画像データ1006、及び解析用文字列1007から構成されるエントリを含む。一つの解析用画像データ204に対して一つのエントリが存在する。
学習データ生成モジュール112は、文字認識データに基づいて、生成された各行の文字列ID102、文字列1003、及び座標1004に値を格納する。
学習データ生成モジュール112は、解析用画像データ204のメタデータを参照し、各行の正解文字列1005に値を格納する。なお、手動で設定する場合には、学習データ生成モジュール112は、認識結果を表示する画面を提示し、文字列の入力を受け付ける。以上がステップS110の処理の説明である。
このとき、学習データ生成モジュール112は、ステップS110において候補教師データ管理情報524に追加されたエントリを参照し、ターゲット解析領域に対応する行の解析用二値画像データ1006に、生成された候補教師データ301を格納する。
このとき、学習データ生成モジュール112は、ステップS110において候補教師データ管理情報524に追加されたエントリを参照し、ターゲット解析領域に対応する行の解析用文字列1007に、生成された解析用出力データ302を格納する。
具体的には、学習データ生成モジュール112が、ターゲット解析領域の画像及び候補教師データ301から構成される学習データ205を生成する。学習データ生成モジュール112は、学習データ管理情報12にエントリを追加し、追加されたエントリの学習データID701に識別情報を格納する。また、学習データ生成モジュール112は、追加されたエントリの画像データ702にターゲット解析領域の画像を格納し、二値画像データ703に候補教師データ301を格納する。
(バリエーション2)図11A及び図11Bで説明した処理では、全ての解析領域に対して学習データ205が生成されていたが、これに限定されない。
削除ボタン1408は、学習データ205を削除するためのボタンである。学習データ生成モジュール112は、削除ボタン1408が操作された場合、学習データ管理情報12から確認画面1400に表示される学習データ205を削除する。
学習データの設定指示を受信したと判定された場合、学習データ設定モジュール512は、学習データ管理情報122を更新し(ステップS1503)、その後、設定処理を終了する。このとき、学習データ設定モジュール512は、学習データ生成モジュール112に完了通知を送信する。

Claims (15)

  1. モデル情報を用いて入力データを処理することによって生成される第1出力データから第2出力データを生成するシステムに設定する、前記モデル情報を生成するための機械学習に用いる学習データを生成する計算機であって、
    プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるインタフェースを備え、
    前記プロセッサは、
    解析用入力データを取得し、
    任意の生成条件に基づいて、前記解析用入力データから解析用第1出力データを生成し、
    前記解析用第1出力データから解析用第2出力データを生成し、
    前記解析用第2出力データを解析し、
    前記解析用第2出力データがユーザ要求を満たすデータである場合、前記解析用入力データ及び前記解析用第1出力データから構成されるデータを前記学習データとして生成することを特徴とする計算機。
  2. 請求項1に記載の計算機であって、
    前記プロセッサは、前記システムから出力され、かつ、ユーザ要求を満たさない前記第2出力データが生成された前記第1出力データの生成元となる前記入力データを前記解析用入力データとして取得することを特徴とする計算機。
  3. 請求項1に記載の計算機であって、
    前記プロセッサは、
    前記解析用入力データに含まれる要素データから前記解析用第1出力データを生成し、
    前記解析用第1出力データから生成された前記解析用第2出力データがユーザ要求を満たすデータである場合、前記要素データ及び前記解析用第1出力データを前記学習データとして生成することを特徴とする計算機。
  4. 請求項1に記載の計算機であって、
    前記プロセッサは、前記モデル情報によって定義されるアルゴリズムとは異なるアルゴリズムに基づいて、前記解析用第1出力データを生成することを特徴とする計算機。
  5. 請求項1に記載の計算機であって、
    前記記憶装置は、評価用入力データを格納し、
    前記プロセッサは、
    前記学習データを用いた学習処理を実行することによって新規モデル情報を生成し、
    前記新規モデル情報を用いて前記評価用入力データを処理することによって生成される前記第1出力データから前記第2出力データを生成し、
    前記第2出力データを解析することによって、前記新規モデル情報の品質を評価する指標を算出し、
    前記指標に基づいて、前記新規モデル情報を保存するか否かを判定することを特徴とする計算機。
  6. 計算機が実行する、モデル情報を用いて入力データを処理することによって生成される第1出力データから第2出力データを生成するシステムに設定する、前記モデル情報を生成するための機械学習に用いる学習データの生成方法であって、
    前記計算機は、プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるインタフェースを有し、
    前記学習データの生成方法は、
    前記プロセッサが、解析用入力データを取得する第1のステップと、
    前記プロセッサが、任意の生成条件に基づいて、前記解析用入力データから解析用第1出力データを生成する第2のステップと、
    前記プロセッサが、前記解析用第1出力データから解析用第2出力データを生成する第3のステップと、
    前記プロセッサが、前記解析用第2出力データを解析する第4のステップと、
    前記プロセッサが、前記解析用第2出力データがユーザ要求を満たすデータである場合、前記解析用入力データ及び前記解析用第1出力データから構成されるデータを前記学習データとして生成する第5のステップと、を含むことを特徴とする学習データの生成方法。
  7. 請求項6に記載の学習データの生成方法であって、
    前記第1のステップは、前記プロセッサが、前記システムから出力され、かつ、ユーザ要求を満たさない前記第2出力データが生成された前記第1出力データの生成元となる前記入力データを前記解析用入力データとして取得するステップを含むことを特徴とする学習データの生成方法。
  8. 請求項6に記載の学習データの生成方法であって、
    前記第2のステップは、前記プロセッサが、前記解析用入力データに含まれる要素データから前記解析用第1出力データを生成するステップを含み、
    前記第5のステップは、前記プロセッサが、前記解析用第1出力データから生成された前記解析用第2出力データがユーザ要求を満たすデータである場合、前記要素データ及び前記解析用第1出力データを前記学習データとして生成するステップを含むことを特徴とする学習データの生成方法。
  9. 請求項6に記載の学習データの生成方法であって、
    前記プロセッサは、前記モデル情報によって定義されるアルゴリズムとは異なるアルゴリズムに基づいて、前記解析用第1出力データを生成することを特徴とする学習データの生成方法。
  10. 請求項6に記載の学習データの生成方法であって、
    前記記憶装置は、評価用入力データを格納し、
    前記学習データの生成方法は、
    前記プロセッサが、
    前記学習データを用いた学習処理を実行することによって新規モデル情報を生成し、
    前記新規モデル情報を用いて前記評価用入力データを処理することによって生成される前記第1出力データから前記第2出力データを生成し、
    前記第2出力データを解析することによって、前記新規モデル情報の品質を評価する指標を算出し、
    前記指標に基づいて、前記新規モデル情報を保存するか否かを判定することを特徴とする学習データの生成方法。
  11. 複数の計算機を備える計算機システムであって、
    前記複数の計算機の各々は、プロセッサ、前記プロセッサに接続される記憶装置、及び前記プロセッサに接続されるインタフェースを有し、
    前記複数の計算機は、モデル情報を用いて入力データを処理することによって生成される第1出力データから第2出力データを生成する処理を実行する第1計算機と、前記モデル情報を生成するための機械学習に用いる学習データを生成する第2計算機とを含み、
    前記第2計算機は、
    解析用入力データを取得し、
    任意の生成条件に基づいて、前記解析用入力データから解析用第1出力データを生成し、
    前記解析用第1出力データから解析用第2出力データを生成し、
    前記解析用第2出力データを解析し、
    前記解析用第2出力データがユーザ要求を満たすデータである場合、前記解析用入力データ及び前記解析用第1出力データから構成されるデータを前記学習データとして生成することを特徴とする計算機システム。
  12. 請求項11に記載の計算機システムであって、
    前記第2計算機は、前記第1計算機から出力され、かつ、ユーザ要求を満たさない前記第2出力データが生成された前記第1出力データの生成元となる前記入力データを前記解析用入力データとして取得することを特徴とする計算機システム。
  13. 請求項11に記載の計算機システムであって、
    前記第2計算機は、
    前記解析用入力データに含まれる要素データから前記解析用第1出力データを生成し、
    前記解析用第1出力データから生成された前記解析用第2出力データがユーザ要求を満たすデータである場合、前記要素データ及び前記解析用第1出力データを前記学習データとして生成することを特徴とする計算機システム。
  14. 請求項11に記載の計算機システムであって、
    前記第2計算機は、前記モデル情報によって定義されるアルゴリズムとは異なるアルゴリズムに基づいて、前記解析用第1出力データを生成することを特徴とする計算機システム。
  15. 請求項11に記載の計算機システムであって、
    前記第2計算機は、評価用入力データを管理し、
    前記第2計算機は、
    前記学習データを用いた学習処理を実行することによって新規モデル情報を生成し、
    前記評価用入力データを前記第1計算機に出力し、
    前記第1計算機は、前記新規モデル情報に基づいて前記評価用入力データを処理することによって生成される前記第1出力データから前記第2出力データを生成して、前記第2計算機に出力し、
    前記第2計算機は、
    前記評価用入力データから生成された前記第2出力データを解析することによって、前記新規モデル情報の品質を評価する指標を算出し、
    前記指標に基づいて、前記新規モデル情報を適用するか否かを判定することを特徴とする計算機システム。
JP2019017169A 2019-02-01 2019-02-01 計算機、学習データの生成方法、及び計算機システム Active JP7082073B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019017169A JP7082073B2 (ja) 2019-02-01 2019-02-01 計算機、学習データの生成方法、及び計算機システム
US16/564,614 US20200250578A1 (en) 2019-02-01 2019-09-09 Computer, method of generating learning data, and computer system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019017169A JP7082073B2 (ja) 2019-02-01 2019-02-01 計算機、学習データの生成方法、及び計算機システム

Publications (3)

Publication Number Publication Date
JP2020126328A JP2020126328A (ja) 2020-08-20
JP2020126328A5 true JP2020126328A5 (ja) 2021-08-05
JP7082073B2 JP7082073B2 (ja) 2022-06-07

Family

ID=71837741

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019017169A Active JP7082073B2 (ja) 2019-02-01 2019-02-01 計算機、学習データの生成方法、及び計算機システム

Country Status (2)

Country Link
US (1) US20200250578A1 (ja)
JP (1) JP7082073B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7408973B2 (ja) * 2019-09-18 2024-01-09 富士フイルムビジネスイノベーション株式会社 学習モデル生成装置、画像補正装置、学習モデル生成プログラム、及び画像補正プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6251637B2 (ja) * 2014-06-02 2017-12-20 Kddi株式会社 情報検索方法、装置およびプログラム
JP2020119322A (ja) * 2019-01-24 2020-08-06 オリンパス株式会社 学習依頼装置および学習依頼方法
US20200242154A1 (en) * 2019-01-24 2020-07-30 Olympus Corporation Image file generating device and image file generating method

Similar Documents

Publication Publication Date Title
US11551134B2 (en) Information processing apparatus, information processing method, and storage medium
US20190251471A1 (en) Machine learning device
US9020862B2 (en) Method and system for computer question-answering
CN109409398B (zh) 图像处理装置、图像处理方法以及存储介质
WO2019133862A1 (en) Computer vision for unsuccessful queries and iterative search
US8600172B2 (en) Video based matching and tracking by analyzing one or more image abstractions
US20190303499A1 (en) Systems and methods for determining video content relevance
US20110276523A1 (en) Measuring document similarity by inferring evolution of documents through reuse of passage sequences
JP6985856B2 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
CN111344800A (zh) 训练模型
JP7320280B2 (ja) ラベル収集装置、ラベル収集方法及びラベル収集プログラム
JP2021125003A5 (ja)
JPWO2020026643A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP5311899B2 (ja) パターン検出器の学習装置、学習方法及びプログラム
CN114913942A (zh) 患者招募项目智能匹配方法及装置
JP2020126328A5 (ja)
CN115374788B (zh) 农业病虫害文本命名实体的方法及装置
US20190265954A1 (en) Apparatus and method for assisting discovery of design pattern in model development environment using flow diagram
KR102413588B1 (ko) 학습 데이터에 따른 객체 인식 모델 추천 방법, 시스템 및 컴퓨터 프로그램
Shan et al. Automatic Generation of Piano Score Following Videos.
JP6926279B1 (ja) 学習装置、認識装置、学習方法、認識方法、プログラム、及び再帰型ニューラルネットワーク
US20210174228A1 (en) Methods for processing a plurality of candidate annotations of a given instance of an image, and for learning parameters of a computational model
US11599801B2 (en) Method for solving problem, computing system and program product
JP2021163477A (ja) 画像処理方法及び装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム
CN113282781A (zh) 图像检索方法及装置