WO2023026367A1

WO2023026367A1 - 学習データ選別装置、学習データ選別方法、及びプログラム

Info

Publication number: WO2023026367A1
Application number: PCT/JP2021/031018
Authority: WO
Inventors: 功大山根
Original assignee: 株式会社Pfu
Priority date: 2021-08-24
Filing date: 2021-08-24
Publication date: 2023-03-02
Also published as: JPWO2023026367A1

Abstract

不適切な学習データの混入を抑制する学習データ選別装置を提供する。　学習データ選別装置は、データファイルを取得するファイル取得部と、前記ファイル取得部により取得されたデータファイルに対するユーザの操作を特定する操作特定部と、前記操作特定部により特定されたユーザの操作に基づいて、前記ファイル取得部により取得されたデータファイルを機械学習の学習データとして採用するか否かを判定する判定部とを有する。

Description

学習データ選別装置、学習データ選別方法、及びプログラム

　本発明は、学習データ選別装置、学習データ選別方法、及びプログラムに関する。

　例えば、特許文献１には、評価用データセットを利用して、再学習又は追加学習前の第１識別器、及び再学習又は追加学習後の第２識別器の判定性能を評価し、その評価の結果に基づいて、第２識別器の判定性能が第１識別器と比べて悪化しているか否かを判定する。そして、検査システムは、第２識別器の判定性能が第１識別器と比べて悪化してしまった場合に、第２識別器を利用せずに、第１識別器を利用して、製品の良否を判定する検査システムが開示されている。

　また、特許文献２には、ユーザ環境２において使用する複数の学習済み分類モデルを配置する分類モデル保持手段２２と、分類モデルをユーザ環境２に配信するモデル配信手段２６と、ユーザ環境２から送信されたラベル付のデータを入力として分類を行い、入力データごとの分類正否、正解率を含む分類結果を保持する分類結果保持手段２３と、分類モデルごとの分類結果に基づいて、入力データに対して適切な分類モデルを提示する最適モデル推奨手段２１と、入力データを、分類モデルの教師またはテストデータとして記録する教師データ記録手段２８とを備える機械学習用データ収集システム３が開示されている。

　また、特許文献３には、機械学習の教師データとして用いるための、特定の分野に関するデータを収集する教師データ収集装置であって、予め登録しておいた特定の分野に関する参照データの特徴ベクトルである第１の特徴ベクトルを算出する特徴算出部と、前記第１の特徴ベクトルから、前記特定の分野に関するデータの収集に用いる検索条件を生成する生成部と、生成された前記検索条件をもとに、前記特定の分野に関するデータを収集する収集部と、収集した前記データの特徴ベクトルである第２の特徴ベクトルを前記特徴算出部が算出すると、該第２の特徴ベクトルと前記第１の特徴ベクトルとの類似度を算出する類似度算出部と、前記類似度が所定の範囲内にある収集した前記データを前記教師データとして抽出する抽出部と、を備える教師データ収集装置が開示されている。

特開２０１９－１５８６８４特開２０２０－１９４３５５特開２０１８－１２４６１７

　不適切な学習データの混入を抑制する学習データ選別装置を提供することを目的とする。

　本発明に係る学習データ選別装置は、データファイルを取得するファイル取得部と、前記ファイル取得部により取得されたデータファイルに対するユーザの操作を特定する操作特定部と、前記操作特定部により特定されたユーザの操作に基づいて、前記ファイル取得部により取得されたデータファイルを機械学習の学習データとして採用するか否かを判定する判定部とを有する。

　好適には、各ユーザの操作履歴に基づいて、各ユーザの信頼性を評価するユーザ評価部をさらに有し、前記判定部は、前記操作特定部により特定されたユーザの操作と、前記ユーザ評価部により評価されたユーザの信頼性とに基づいて、前記データファイルを学習データとして採用するか否かを判定する。

　好適には、前記操作特定部は、前記ファイル取得部により取得されたデータファイルの生成時において、連続的な複数回のスキャン処理を指示する操作が行われたか否かを判定し、前記操作特定部により、連続的な複数回のスキャン処理を指示する操作が行われたと判定された場合に、この複数回のスキャン処理により生成された複数のデータファイルの共通性を評価する共通性評価部をさらに有し、前記判定部は、前記共通性評価部による共通性の評価結果に基づいて、前記データファイルを学習データとして採用するか否かを判定する。

　好適には、前記操作特定部は、前記ファイル取得部により取得されたデータファイルのファイル生成時におけるユーザの設定操作を特定し、前記判定部は、前記操作特定部により特定されたユーザの設定操作に基づいて、前記データファイルを学習データとして採用するか否かを判定する。

　好適には、前記ファイル取得部は、前記データファイルとして、画像データが含まれたデータファイルを取得し、前記判定部は、前記データファイルに含まれる画像の向きを判定する向き判定処理に関する学習データの採否を決定する。

　好適には、前記判定部は、前記データファイルに含まれる画像に対する閲覧操作又は修正操作に基づいて、このデータファイルを学習データとして採用するか否かを判定し、前記判定部により学習データとして採用されたデータファイルの特徴量を用いて、向き判定処理に関する機械学習を行う学習部をさらに有する。

　好適には、前記共通性評価部は、前記複数のデータファイルに含まれる画像の向きが一致しているか否かを判定し、前記判定部は、前記共通性評価部により画像の向きが一致していると判定されたデータファイルを学習データとして採用し、前記判定部により学習データとして採用されたデータファイルの特徴量を用いて、向き判定処理に関する機械学習を行う学習部をさらに有する。

　好適には、前記操作特定部は、前記データファイルの自動補正処理に関する設定操作を特定し、前記判定部は、前記操作特定部により前記自動補正処理を無効化する設定操作が特定された場合に、前記データファイルを学習データとして採用する。

　好適には、前記操作特定部は、前記データファイルの向き補正処理に関する設定操作を特定し、前記判定部は、前記操作特定部により前記向き補正処理を無効化する設定操作が特定された場合に、前記データファイルを学習データとして採用し、前記判定部により学習データとして採用されたデータファイルの特徴量を用いて、向き判定処理に関する機械学習を行う学習部をさらに有する。

　また、本発明に係る学習データ選別方法は、データファイルを取得するファイル取得ステップと、前記ファイル取得ステップにより取得されたデータファイルに対するユーザの操作を特定する操作特定ステップと、前記操作特定ステップにより特定されたユーザの操作に基づいて、前記ファイル取得ステップにより取得されたデータファイルを機械学習の学習データとして採用するか否かを判定する判定ステップとを有する。

　また、本発明に係るプログラムは、データファイルを取得するファイル取得ステップと、前記ファイル取得ステップにより取得されたデータファイルに対するユーザの操作を特定する操作特定ステップと、前記操作特定ステップにより特定されたユーザの操作に基づいて、前記ファイル取得ステップにより取得されたデータファイルを機械学習の学習データとして採用するか否かを判定する判定ステップとをコンピュータに実行させる。

　不適切な学習データの混入を抑制する学習データ選別装置を提供できる。

画像処理システム１の全体構成を例示する図である。向き判定処理の学習データを例示する図である。画像処理サーバ２のハードウェア構成を例示する図である。画像処理サーバ２の機能構成を例示する図である。画像処理サーバ２に保存されるデータファイルの画像情報テーブルを例示する図である。サービス提供部３４５により提供される閲覧編集画面を例示する図である。画像処理サーバ２の学習処理（Ｓ１０）を説明するフローチャートである。図７の採否判定処理（Ｓ２０）をより詳細に説明するフローチャートである。

　以下、本発明の実施形態を、図面を参照して説明する。
　図１は、画像処理システム１の全体構成を例示する図である。
　図１に例示するように、画像処理システム１は、画像処理サーバ２と、スキャナ４と、ユーザ端末６とを含み、これらはインターネット７を介して互いに接続している。
　画像処理サーバ２は、例えば、コンピュータ端末であり、スキャナ４から受信した画像ファイルに対して画像処理を施す。画像処理サーバ２は、本発明に係る学習データ選別装置の一例である。
　スキャナ４は、原稿（画像表示媒体）から光学的に画像データを読み取る画像読取装置であり、例えば、読み取られた画像データのデータファイル（画像ファイル）を、インターネット７を介して画像処理サーバ２に送信する。例えば、スキャナ４は、ネットワークスキャナであり、インターネット７などのネットワークに直接接続する。
　ユーザ端末６は、ユーザが操作するコンピュータ端末であり、画像処理サーバ２で管理されている画像データの閲覧及び編集を行う。ユーザ端末６は、例えば、スマートフォンやタブレット端末などのモバイル端末である。
　インターネット７は、例えば、インターネット網である。なお、本例では、インターネット７を介して、スキャナ４から画像処理サーバ２に画像データを送信する形態を具体例として説明するが、これに限定されるものではなく、例えば、ＵＳＢケーブルなどの有線接続により画像ファイルを送受信してもよいし、ＬＡＮ（Local Area Network）などの制限されたネットワークを介して画像ファイルを送受信してもよい。
　また、画像処理サーバ２がスキャナ４に内蔵されていてもよい。

　次に、本発明がなされた背景を説明する。
　近年、機械学習（特に深層学習）の技術発展に伴い、大量のデータを学習することによって画像処理精度を向上する取り組みが一般的になってきている。一例として、CNN(Convolutional Neural Network)と呼ばれる手法で様々な形状パターンの文字画像を学習することで、文字の正しい向きを判別することで画像の向き補正を実現している。
　しかし、機械学習では、正しい正解ラベルの付いた学習データ（以降、有用な学習データ）が重要であり、間違った正解ラベルの付いた学習データが混在すると精度が上がらないが、大量のデータを収集して手作業／目視で正しい正解ラベルを付与するのは大きな労力を要する。またユーザのスキャンされた画像や向き判定結果を利用することでデータ収集を効率化することは可能であるが、プライバシー保護のためユーザのデータを目視で閲覧することはできない。
　このため、人手によらずかつ画像を閲覧することなく有用な学習データを選別する技術が必要とされている。

　例えば、学習データとは、図２に例示するような情報を指す。原稿特徴を示す説明変数が複数存在し、その説明変数に紐づく正解ラベル（今回は「向き」）がセットになったものである。
　このような学習データを収集する際に、以下の課題が存在する。
　クラウドやローカルから取得したデータファイルから有用な学習データを選別することが困難である。すなわち、取得したデータの中には、有用な学習データ以外も含まれる。
　ここで、有用な学習データとは、下記の（データ例１）及び（データ例２）が該当し、それ以外のデータは（データ例３）が該当する。
（データ例１）画像の向きが正しい向きに修正されたデータ（修正データ）
（データ例２）正しい向きであるため、画像の向きが修正されていないデータ（非修正データ）
（データ例３）画像の向きが間違ったまま向きが修正されていないデータ（非修正データ）
　非修正データが（データ例２）であるか（データ例３）であるかを判断する際に、以下の理由により目視で判断することができない。
・開発者は規約上、個人情報が含まれる画像を閲覧できないため
・画像の規模数が大きく、選別作業が困難であるため
　機械学習の際に、（データ例３）が含まれると、間違った正解ラベルのまま学習するため、向き判定処理の精度が低下する。つまり、非修正データの中から（データ例２）と（データ例３）を判別することが課題として挙げられる。

　そこで、本実施形態の画像処理システム１では、データファイルに対するユーザの操作に着目して、有用な学習データであるか否かを判定する。データファイルに対するユーザの操作とは、例えば、データファイル生成時にユーザが行った操作、データファイルの閲覧時又は編集時にユーザが行った操作などであり、本例では、スキャナ４に対してユーザが行った操作や、ユーザ端末６に対してユーザが行った画像の閲覧操作又は編集操作である。なお、本実施形態では、画像の向きを判定する処理を機械学習モデルにより実現する形態を具体例として説明する。

　図３は、画像処理サーバ２のハードウェア構成を例示する図である。
　図３に例示するように、画像処理サーバ２は、ＣＰＵ２００、メモリ２０２、ＨＤＤ２０４、ネットワークインタフェース２０６（ネットワークＩＦ２０６）、表示装置２０８、及び、入力装置２１０を有し、これらの構成はバス２１２を介して互いに接続している。
　ＣＰＵ２００は、例えば、中央演算装置である。
　メモリ２０２は、例えば、揮発性メモリであり、主記憶装置として機能する。
　ＨＤＤ２０４は、例えば、ハードディスクドライブ装置であり、不揮発性の記録装置としてコンピュータプログラム（例えば、図４の画像処理プログラム３）やその他のデータファイルを格納する。
　ネットワークＩＦ２０６は、有線又は無線で通信するためのインタフェースであり、例えば、スキャナ４及びユーザ端末６との通信を実現する。
　表示装置２０８は、例えば、液晶ディスプレイである。
　入力装置２１０は、例えば、キーボード及びマウスである。

　図４は、画像処理サーバ２の機能構成を例示する図である。
　図４に例示するように、本例の画像処理サーバ２には、画像処理プログラム３がインストールされ、動作する。画像処理プログラム３は、例えば、ＣＤ－ＲＯＭ等の記録媒体に格納されており、この記録媒体を介して、画像処理サーバ２にインストールされる。
　画像処理プログラム３は、ファイル取得部３００、操作特定部３０５、ユーザ評価部３１０、向き判定部３１５、自動補正部３２０、共通性評価部３２５、採否判定部３３０、特徴量抽出部３３５、学習部３４０、及びサービス提供部３４５を有する。
　また、画像処理サーバ２には、スキャナ４から受信したデータファイル（画像ファイル）と、データファイルに対する操作履歴が蓄積され、画像情報テーブル（図５を参照して後述）として管理される。
　なお、画像処理プログラム３の一部又は全部は、ＡＳＩＣなどのハードウェアにより実現されてもよく、また、ＯＳ（ＯｐｅｒａｔｉｎｇＳｙｓｔｅｍ）の機能を一部借用して実現されてもよい。

　画像処理プログラム３において、ファイル取得部３００は、データファイルを学習データの候補として取得する。本例のファイル取得部３００は、スキャナ４により生成された画像データが含まれたデータファイルをインターネット７経由で取得する。取得されたデータファイルは、画像処理サーバ２に保存される。

　操作特定部３０５は、ファイル取得部３００により取得されたデータファイルに対するユーザの操作を特定する。例えば、操作特定部３０５は、ファイル取得部３００により取得されたデータファイルに関して、データファイル生成時のユーザの操作、又は、データファイル閲覧／編集時のユーザの操作を特定する。本例の操作特定部３０５は、ファイル取得部３００により取得されたデータファイルに関して、データファイル生成時におけるスキャナ４に対する設定操作や原稿セット枚数、又は、データファイル閲覧／編集時におけるユーザ端末５に対する閲覧操作や画像編集操作を特定する。操作特定部３０５により特定されたユーザの操作は、操作履歴として画像処理サーバ２に保存される。

　ユーザ評価部３１０は、各ユーザの操作履歴に基づいて、各ユーザの信頼性を評価する。ユーザの信頼性を評価するための操作履歴とは、例えば、画像を閲覧した回数、スキャンした画像数に対する閲覧した画像数の割合、画像の向きを手動で修正した回数、スキャンした画像数に対する向き手動修正の割合、画像の向き以外の手動修正の回数、又は、スキャンした画像数に対する向き以外を手動修正した割合などである。閲覧した画像数や割合が大きいユーザほど、画像の向きを確認している可能性が高いからである。
同様に、画像を手動修正した回数や割合が大きいユーザほど、画像の向きを確認している可能性が高いと考えられる。本例のユーザ評価部３１０は、上記画像数又は割合に対して、既定の重み付け係数をかけて、これらの合算値に基づいて、ユーザの信頼性を評価する。

　向き判定部３１５は、ファイル取得部３００により取得されたデータファイルにおける画像の向きを判定する。本例の向き判定部３１５は、学習部３４０により改善された機械学習モデルを用いて、画像の向きを判定する。機械学習モデルへの入力は、図２に例示するように、画像の各領域（左上、右上、左下及び右下）の文字列数と、空白の位置である。

　自動補正部３２０は、ファイル取得部３００により取得されたデータファイルに対して、自動的に補正処理を行う。例えば、自動補正部３２０は、スキャナ４に対する設定操作に応じて、ファイル取得部３００により取得されたデータファイルに対して、画像の向き補正処理、画質補正処理、白紙除去処理、及び、クロップ処理を行う。すなわち、自動補正部３２０は、ユーザの設定操作に応じて、これらの自動補正処理の適用／非適用を切り替えることができる。

　共通性評価部３２５は、連続的な複数回のスキャン処理を指示する操作（スキャナ４の原稿台に複数枚の原稿がセットされ、これらの原稿を１バッチでスキャンさせる操作）が行われたと判定された場合に、この複数回のスキャン処理により生成された複数のデータファイルの共通性を評価する。一般的に、１バッチでスキャンされる原稿は向きが揃っているケースが多い。そこで、1バッチでスキャンされ、かつデータファイルの共通性が高い場合には、ユーザの閲覧有無にかかわらず、有用な学習データであると判断する。本例の共通性評価部３２５は、向き判定部３１５による判定結果に基づいて、１バッチのスキャンで生成された複数のデータファイルに含まれる画像の向きが一致しているか否かを判定する。

　採否判定部３３０は、操作特定部３０５により特定されたユーザの操作に基づいて、ファイル取得部３００により取得されたデータファイルを機械学習の学習データとして採用するか否かを判定する。採否判定部３３０は、本発明に係る判定部の一例である。例えば、採否判定部３３０は、操作特定部３０５により特定された画像に対するユーザの閲覧操作又は修正操作と、ユーザ評価部３１０による評価結果とに基づいて、データファイルを学習データとして採用するか否かを判定する。すなわち、ユーザ端末６から画像の修正を実施したことのあるユーザ（信頼性の高いユーザ）であり、かつ、そのユーザがユーザ端末６で閲覧した画像は、正しい向きをユーザが確認したと考え、有用な学習データと判断する。

　また、採否判定部３３０は、複数枚の原稿が１バッチでスキャンされたことが操作特定部３０５により特定され、かつ、共通性評価部３２５により画像の向きが一致していると判定されたデータファイルを学習データとして採用する。本例では、１バッチで読まれたデータファイルに対して同一のドキュメントＩＤが付与されるため、採否判定部３３０は、同一のドキュメントＩＤが付与されたデータファイルについて、向き判定部３１５の判定結果（向き）を比較することにより、学習データとしての採否を決定できる。

　また、採否判定部３３０は、自動補正部３２０による自動補正処理を無効化する設定操作が操作特定部３０５により特定された場合に、データファイルを学習データとして採用する。本例の採否判定部３３０は、操作特定部３０５により向き補正処理を無効化する設定操作が特定された場合に、この設定のスキャンで生成されたデータファイルを学習データとして採用する。ユーザが自動向き補正のスキャン設定を無効にしてスキャンしたデータファイルは、ユーザが正しい向きで給紙してスキャンする可能性が高く、ユーザの閲覧有無にかかわらず有用な学習データであると判断できる。

　特徴量抽出部３３５は、採否判定部３３０により学習データとして採用されたデータファイルから、学習データとして用いる特徴量を抽出する。本例の特徴量抽出部３３５は、画像の各領域（左上、右上、左下、右下）における文字列数と、空白の位置を抽出する。

　学習部３４０は、採否判定部３３０により学習データとして採用されたデータファイルの特徴量を用いて、向き判定処理に関する機械学習を行う。本例の学習部３４０は、特徴量抽出部３３５により抽出された特徴量と、画像の向きとに基づいて、向き判定処理の機械学習モデルを生成する。

　サービス提供部３４５は、ファイル取得部３００により取得されたデータファイルに対するユーザの閲覧操作又は編集操作に応じて、データファイルの表示又は編集を行う。本例のサービス提供部３４５は、ユーザ端末６からの要求に応じて、Ｗｅｂサービスとして、画像ファイルの閲覧又は編集を提供する。サービス提供部３４５がユーザに提供する編集機能には、画像の向き修正機能に加えて、「傾き補正」機能や「トリミング」機能がある。「傾き補正」機能とは、原稿をスキャンする際に生じる数度の傾き（ズレ）を修正するために用いる機能であり、「トリミング」機能とは、画像内の一部分を切り取るために用いる機能である。これらの機能を用いる際、少なからずユーザは画像の向きを確認していると仮説を立て、特徴の候補に追加している。

　図５は、画像処理サーバ２に保存されるデータファイルの画像情報テーブルを例示する図である。
　図５に例示するように、画像情報テーブルには、ユーザを特定するユーザＩＤ、原稿束（すなわち、バッチ）を特定するドキュメントＩＤ、画像ファイルを特定する画像ＩＤ、手動修正の内容を示す情報、画像の向きを示す情報、自動向き修正の内容を示す情報、画像の閲覧履歴を示す情報、及び、スキャン時の設定を示す設定情報が登録される。すなわち、画像処理サーバ２は、ファイル取得部３００によりデータファイル（画像ファイル）が取得されると、画像情報テーブルに、ユーザＩＤ、ドキュメントＩＤ、画像ＩＤ、及び設定情報を登録し、取得されたデータファイルに対して向き判定処理が行われると、向き判定の結果を追記し、このデータファイルに対してユーザが閲覧、向き修正又は手動修正を行うと、それらのユーザ操作に応じて画像情報テーブルを更新する。
　手動修正の内容を示す情報は、例えば、「-1:未修正、0:向き、1:削除、2:その他」である。画像の向きを示す情報は、向き判定部３１５による判定結果を示す情報であり、例えば、「-1:判定不能、0:0度、1:90度、2:180度、3:270度、99:未判別」である。自動向き修正の内容を示す情報は、自動補正部３２０による画像向き補正の内容を示す情報であり、例えば、「-1:未修正、0:0度、1:90度、2:180度、3:270度」である。画像の閲覧履歴を示す情報は、例えば、「0:未閲覧、1:閲覧済」である。スキャン時の設定を示す設定情報は、例えば、デフォルト設定との差分であり、ユーザが設定変更した内容を示す情報である。

　図６は、サービス提供部３４５により提供される閲覧編集画面を例示し、閲覧履歴等の更新方法を説明する図である。
　図６に例示するように、サービス提供部３４５は、ユーザ端末６に対して、画像（ページ毎）のプレビュー画面を表示させ、操作特定部３０５は、画像が読み込まれた時点で、その画像を閲覧済と判断し、画像情報テーブル（図５）の「閲覧履歴」情報を更新する。このときユーザ端末６の画面内に表示されないページの画像は、サービス提供部３４５が読み込まないことで、ユーザが確認したことの確からしさを高める。
　また、ユーザがユーザ端末６で画像（ページ毎）を手動修正(向き、削除等)して保存した時点で、ユーザは画像を正しい修正操作を行ったと判断し、画像が修正・保存されたタイミングで操作特定部３０５は、図５の画像情報テーブルの「手動修正」情報を更新する。向きが修正された場合は、操作特定部３０５は「向き修正」情報も更新する。ただし、この「向き修正」情報は、データの有用性の判断には用いず、正解ラベルに用いる。
　すなわち、画像処理サーバ２は、ユーザ端末６によるビューア起動時に、画像ファイルの読み込みを行い、読み込んだ画像ファイルに対し、「閲覧履歴」情報を更新する。その後、ユーザ操作で手動修正が行われた際は、画像処理サーバ２は「手動修正」情報を更新する。スクロール動作によりアプリに新規のページが表示される度、画像処理サーバ２は上記の処理を繰り返す。

　図７は、画像処理サーバ２の学習処理（Ｓ１０）を説明するフローチャートである。なお、学習処理（Ｓ１０）は、定期（二週間に一度の頻度）で動作し、蓄積されている画像ファイルが定期的に削除される前提であり、画像ファイルが削除されるタイミングでデータ選別を行うことで、学習部３４０に渡す学習データの重複を回避できる。
　図７に例示するように、ステップ１００（Ｓ１００）において、画像処理サーバ２のファイル取得部３００（図４）は、スキャナ４により読み取られた画像ファイル（データファイル）を順に読み込む。
　ステップ１０５（Ｓ１０５）において、操作特定部３０５は、ファイル取得部３００により読み込まれた画像ファイルについて、画像情報テーブル（図５）を参照して、この画像ファイルに対するユーザの操作を特定する。

　ステップ１１０（Ｓ１１０）において、ユーザ評価部３１０は、画像情報テーブルを参照して、この画像ファイルに関連付けられたユーザを特定し、特定されたユーザの操作履歴に基づいて、ユーザの信頼性を評価する。

　ステップ２０（Ｓ２０）において、採否判定部３３０は、操作特定部３０５により特定されたユーザの操作と、ユーザ評価部３１０により評価されたユーザの信頼性とに基づいて、ファイル取得部３００により読み込まれた画像ファイルを、学習データとして採用するか否かを判定する。
　ステップ１１５（Ｓ１１５）において、画像処理プログラム３は、採否判定部３３０により学習データとして採用した場合に、Ｓ１２０の処理に移行し、採否判定部３３０におり学習データとして不採用となった場合に、Ｓ１３０の処理に移行する。

　ステップ１２０（Ｓ１２０）において、特徴量抽出部３３５は、ファイル取得部３００により読み込まれた画像ファイルから、特徴量を抽出する。
　ステップ１２５（Ｓ１２５）において、特徴量抽出部３３５は、抽出された特徴量と、正解ラベル（画像の向き）を学習データとして学習部３４０に出力する。

　ステップ１３０（Ｓ１３０）において、ファイル取得部３００は、読み込んだ画像ファイルを削除する。
　ステップ１３５（Ｓ１３５）において、画像処理プログラム３は、蓄積されている画像ファイル全てについて処理を完了したか否かを判定し、全ての画像ファイルについて処理が完了した場合に、Ｓ１４０の処理に移行し、未処理の画像ファイルが存在する場合に、Ｓ１００の処理に戻り、次の画像ファイルを読み込む。
　ステップ１４０（Ｓ１４０）において、学習部３４０は、特徴量抽出部３３５から入力された学習データを用いて、向き判定処理の機械学習モデルを生成する。

　図８は、図７の採否判定処理（Ｓ２０）をより詳細に説明するフローチャートである。
　図８に示すように、ステップ２００（Ｓ２００）において、採否判定部３３０は、画像情報テーブル（図５）を参照して、読み込まれた画像ファイルが１バッチでスキャンされた複数の画像ファイルの一つであるか否かを判定する。この判定は、画像情報テーブルにおいて、同一のドキュメントＩＤが付与された他の画像ＩＤが存在するか否かによって行われる。画像処理プログラム３は、採否判定部３３０により１バッチのスキャンされた複数の画像ファイルの一つであると判定された場合に、Ｓ２０５の処理に移行し、これ以外の場合に、Ｓ２１０の処理に移行する。

　ステップ２０５（Ｓ２０５）において、共通性評価部３２５は、１バッチでスキャンされた複数の画像ファイルを比較して、画像の向きが一致しているか否かを判定する。画像の向きは、画像情報テーブル（図５）の「向き」を参照することにより、一致しているか否かを判定できる。画像処理プログラム３は、共通性評価部３２５により画像の向きが一致していると判定された場合に、Ｓ２２５の処理に移行し、画像の向きが一致していないと判定された場合に、Ｓ２１０の処理に移行する。

　ステップ２１０（Ｓ２１０）において、採否判定部３３０は、ユーザ評価部３１０による信頼性の評価値が基準値未満であるか否かを判定する。画像処理プログラム３は、採否判定部３３０により信頼性の評価値が基準値未満であると判定された場合に、Ｓ２３０の処理に移行し、信頼性の評価値が基準値以上であると判定された場合に、Ｓ２１５の処理に移行する。

　ステップ２１５（Ｓ２１５）において、採否判定部３３０は、読み込まれた画像ファイルについてユーザの閲覧又は編集の有無を判定する。画像処理プログラム３は、採否判定部３３０により閲覧又は編集があったと判定された場合に、Ｓ２２５の処理に移行し、閲覧及び編集が無かったと判定された場合に、Ｓ２２０の処理に移行する。

　ステップ２２０（Ｓ２２０）において、採否判定部３３０は、画像情報テーブル（図５）を参照して、スキャナ４の設定において自動向き補正が無効化されていたか否かを判定する。自動向き補正無効化の判定は、設定情報を参照してもよいし、「向き」情報を参照してもよい。画像処理プログラム３は、自動向き補正が無効化されていたと採否判定部３３０に判定された場合に、Ｓ２２５の処理に移行し、自動向き補正が有効であったと判定された場合に、Ｓ２３０の処理に移行する。自動向き補正をユーザが意図的に無効化した場合は有用性が高いと判断するが、スキャン設定が無効であっても原稿によっては正しい向きで給紙できない場合もあるため、ユーザ信頼性も加味して有用な学習データの判断を行う。

　ステップ２２５（Ｓ２２５）において、採否判定部３３０は、読み込まれた画像ファイルを学習データとして採用することを決定する。すなわち、採否判定部３３０は、１バッチでスキャンされた画像ファイルであり、かつ、向き判定結果が全て一致している場合、信頼性の高いユーザによって閲覧又は編集された画像ファイルである場合、又は、信頼性の高いユーザによって自動向き補正が無効化された場合に、学習データとして採用する。
　ステップ２３０（Ｓ２３０）において、採否判定部３３０は、読み込まれた画像ファイルを学習データとして不採用とすることを決定する。

　以上説明したように、本実施形態の画像処理システム１によれば、向き判定処理の学習データとして有用な画像ファイルを、ユーザの操作に基づいて選別することができる。
　すなわち、開発者が収集した大量の画像を閲覧せず、機械学習に有用な学習データのみを選別することができる。それにより安定した学習が可能になり、向き判定精度を向上できる。

　なお、本発明の実施形態を説明したが、上記実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。上記実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。上記実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。

　１　　　画像処理システム
　２　　　画像処理サーバ
　３　　　画像処理プログラム
　４　　　スキャナ装置
　６　　　ユーザ端末

Claims

　データファイルを取得するファイル取得部と、
　前記ファイル取得部により取得されたデータファイルに対するユーザの操作を特定する操作特定部と、
　前記操作特定部により特定されたユーザの操作に基づいて、前記ファイル取得部により取得されたデータファイルを機械学習の学習データとして採用するか否かを判定する判定部と
　を有する学習データ選別装置。
　各ユーザの操作履歴に基づいて、各ユーザの信頼性を評価するユーザ評価部
　をさらに有し、
　前記判定部は、前記操作特定部により特定されたユーザの操作と、前記ユーザ評価部により評価されたユーザの信頼性とに基づいて、前記データファイルを学習データとして採用するか否かを判定する
　請求項１に記載の学習データ選別装置。
　前記操作特定部は、前記ファイル取得部により取得されたデータファイルの生成時において、連続的な複数回のスキャン処理を指示する操作が行われたか否かを判定し、
　前記操作特定部により、連続的な複数回のスキャン処理を指示する操作が行われたと判定された場合に、この複数回のスキャン処理により生成された複数のデータファイルの共通性を評価する共通性評価部
　をさらに有し、
　前記判定部は、前記共通性評価部による共通性の評価結果に基づいて、前記データファイルを学習データとして採用するか否かを判定する
　請求項２に記載の学習データ選別装置。
　前記操作特定部は、前記ファイル取得部により取得されたデータファイルのファイル生成時におけるユーザの設定操作を特定し、
　前記判定部は、前記操作特定部により特定されたユーザの設定操作に基づいて、前記データファイルを学習データとして採用するか否かを判定する
　請求項２に記載の学習データ選別装置。
　前記ファイル取得部は、前記データファイルとして、画像データが含まれたデータファイルを取得し、
　前記判定部は、前記データファイルに含まれる画像の向きを判定する向き判定処理に関する学習データの採否を決定する
　請求項４に記載の学習データ選別装置。
　前記判定部は、前記データファイルに含まれる画像に対する閲覧操作又は修正操作に基づいて、このデータファイルを学習データとして採用するか否かを判定し、
　前記判定部により学習データとして採用されたデータファイルの特徴量を用いて、向き判定処理に関する機械学習を行う学習部
　をさらに有する請求項５に記載の学習データ選別装置。
　前記共通性評価部は、前記複数のデータファイルに含まれる画像の向きが一致しているか否かを判定し、
　前記判定部は、前記共通性評価部により画像の向きが一致していると判定されたデータファイルを学習データとして採用し、
　前記判定部により学習データとして採用されたデータファイルの特徴量を用いて、向き判定処理に関する機械学習を行う学習部
　をさらに有する請求項３に記載の学習データ選別装置。
　前記操作特定部は、前記データファイルの自動補正処理に関する設定操作を特定し、
　前記判定部は、前記操作特定部により前記自動補正処理を無効化する設定操作が特定された場合に、前記データファイルを学習データとして採用する
　請求項４に記載の学習データ選別装置。
　前記操作特定部は、前記データファイルの向き補正処理に関する設定操作を特定し、
　前記判定部は、前記操作特定部により前記向き補正処理を無効化する設定操作が特定された場合に、前記データファイルを学習データとして採用し、
　前記判定部により学習データとして採用されたデータファイルの特徴量を用いて、向き判定処理に関する機械学習を行う学習部
　をさらに有する請求項８に記載の学習データ選別装置。
　データファイルを取得するファイル取得ステップと、
　前記ファイル取得ステップにより取得されたデータファイルに対するユーザの操作を特定する操作特定ステップと、
　前記操作特定ステップにより特定されたユーザの操作に基づいて、前記ファイル取得ステップにより取得されたデータファイルを機械学習の学習データとして採用するか否かを判定する判定ステップと
　を有する学習データ選別方法。
　データファイルを取得するファイル取得ステップと、
　前記ファイル取得ステップにより取得されたデータファイルに対するユーザの操作を特定する操作特定ステップと、
　前記操作特定ステップにより特定されたユーザの操作に基づいて、前記ファイル取得ステップにより取得されたデータファイルを機械学習の学習データとして採用するか否かを判定する判定ステップと
　をコンピュータに実行させるプログラム。