JP7148794B2

JP7148794B2 - 学習データ生成プログラム、学習データ生成装置及び学習データ生成方法

Info

Publication number: JP7148794B2
Application number: JP2018212093A
Authority: JP
Inventors: 正樹石原; 明燮鄭; 信浩宮▲崎▼; 康貴森脇; 昌彦杉村; 浩明武部; 孝之馬場
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2018-11-12
Filing date: 2018-11-12
Publication date: 2022-10-06
Anticipated expiration: 2038-11-12
Also published as: JP2020079984A

Description

本発明は、学習データ生成プログラム、学習データ生成装置及び学習データ生成方法に関する。

近年、ＣＴ（ＣｏｍｐｕｔｅｄＴｏｍｏｇｒａｐｈｙ）画像やＭＲＩ（ＭａｇｎｅｔｉｃＲｅｓｏｎａｎｃｅＩｍａｇｉｎｇ）画像等の時系列画像を用いた病名認識をサポートする情報処理システムの構築が求められている。時系列画像は、例えば、体内における所定の部位を連続して撮影した複数の画像である。

具体的に、上記のような情報処理システムを実現する場合、例えば、大量の学習データ（時系列画像を含む学習データ）を学習することにより、必要な学習モデルの獲得を行う機械学習方式の採用が考えられる。しかしながら、この場合、病名認識を行う体内の位置等によっては、必要な性能を有する学習モデルを獲得するために必要な量の学習データを用意することができない場合がある。

そこで、例えば、一般問題に関する学習データであって大量のサンプルを用意可能な学習データ（以下、ソースデータとも呼ぶ）を用いて学習を行った後、特化問題に関する学習データであって少量のサンプルのみを用意可能な学習データ（以下、ターゲットデータとも呼ぶ）を用いて再度学習を行うことにより、学習モデルを獲得する転移学習方式の採用が考えられる。

しかしながら、ソースデータが文字であってターゲットデータが画像である場合のように、ソースデータとターゲットデータとが異種データである場合、異種データ間における転移学習方式（以下、クロスモーダル転移学習方式とも呼ぶ）を採用した場合であっても、必要な性能を有する学習モデルの獲得が困難である場合がある。

そこで、例えば、ソースデータ及びターゲットデータだけでなく、ソースデータとターゲットデータとの橋渡し役になる学習データ（以下、中間データとも呼ぶ）についても学習を行うクロスモーダル転移学習方式の採用が考えられる。中間データは、ソースデータと同種のデータ（例えば、文字）と、ターゲットデータと同種のデータ（例えば、画像）とをペアにしたデータセットからなる学習データである。

この場合、例えば、文字と通常の画像とを含む中間データを文字と時系列画像とを含む中間データに変換することにより、クロスモーダル転移学習に必要な中間データの生成が行われる。具体的に、例えば、文献に含まれる図の中から、複数の画像をレイアウトした図（以下、複合図とも呼ぶ）を抽出し、抽出した複合図に含まれる画像を時系列画像として用いることによって、中間データの生成を行う。これにより、情報処理システムを構築する事業者は、時系列画像を用いた病名認識を行う際に用いられる学習モデルを獲得することが可能になる（例えば、特許文献１乃至４参照）。

国際公開第２０１７／１０９８５４号特開２０１１－２３９８４３号公報特表２０１１－５２４０３７号公報特開２００６－０１４９２８号公報

しかしながら、上記のような複合図に含まれる画像には、例えば、位置やアングルの違いを表す３次元画像等、時系列画像以外の画像が含まれる場合がある。そのため、事業者は、複合図から抽出した画像を時系列画像として用いる中間データの学習を行う場合、必要な性能を実現可能な学習モデルを獲得することができない可能性がある。

したがって、事業者は、必要な性能を実現可能な学習モデルを獲得するために、例えば、複合図に含まれる画像から時系列画像を精度良く抽出し、抽出した時系列画像が用いられた中間データの学習を行う必要がある。

そこで、一つの側面では、本発明は、時系列画像を精度良く抽出することを可能とする学習データ生成プログラム、学習データ生成装置及び学習データ生成方法を提供することを目的とする。

実施の形態の一態様では、機械学習に用いる学習データを生成する学習データ生成プログラムであって、所定の対応関係を有する複数の画像を文献から取得し、取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定し、前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定し、特定した前記複数の画像を含む学習データを生成する、処理をコンピュータに実行させる。

一つの側面によれば、時系列画像を精度良く抽出することを可能とする。

図１は、情報処理システム１０の構成について説明する図である。図２は、学習データ１３１の具体例を説明する図である。図３は、学習データ１３１の具体例を説明する図である。図４は、学習データ１３１の具体例を説明する図である。図５は、文献に含まれる図から時系列画像を抽出する場合を説明する図である。図６は、情報処理装置１のハードウエア構成を説明する図である。図７は、情報処理装置１の機能のブロック図である。図８は、第１の実施の形態における学習データ生成処理の概略を説明するフローチャート図である。図９は、第１の実施の形態における学習データ生成処理の概略を説明する図である。図１０は、第１の実施の形態における学習データ生成処理の概略を説明する図である。図１１は、第１の実施の形態における学習データ生成処理の詳細を説明するフローチャート図である。図１２は、第１の実施の形態における学習データ生成処理の詳細を説明するフローチャート図である。図１３は、第１の実施の形態における学習データ生成処理の詳細を説明するフローチャート図である。図１４は、第１の実施の形態における学習データ生成処理の詳細を説明するフローチャート図である。図１５は、学習データ生成処理の具体例を説明する図である。図１６は、学習データ生成処理の具体例を説明する図である。図１７は、学習データ生成処理の具体例を説明する図である。図１８は、学習データ生成処理の具体例を説明する図である。図１９は、第２の実施の形態における学習データ生成処理を説明するフローチャート図である。図２０は、第２の実施の形態における学習データ生成処理を説明するフローチャート図である。図２１は、第２の実施の形態における学習データ生成処理を説明するフローチャート図である。図２２は、第３の実施の形態における学習データ生成処理を説明するフローチャート図である。図２３は、第３の実施の形態における学習データ生成処理を説明するフローチャート図である。図２４は、第３の実施の形態における学習データ生成処理を説明するフローチャート図である。図２５は、第３の実施の形態における学習データ生成処理を説明する図である。図２６は、第４の実施の形態における学習データ生成処理を説明するフローチャート図である。図２７は、第４の実施の形態における学習データ生成処理を説明するフローチャート図である。図２８は、第４の実施の形態における学習データ生成処理を説明するフローチャート図である。図２９は、第４の実施の形態における学習データ生成処理を説明する図である。

［情報処理システムの構成］
初めに、情報処理システム１０の構成について説明を行う。図１は、情報処理システム１０の構成について説明する図である。

具体的に、情報処理システム１０は、図１に示すように、情報処理装置１と、事業者が情報の入力等を行う事業者端末２と、学習データ１３１を記憶する記憶部１３０（以下、情報格納領域１３０とも呼ぶ）とを有する。なお、記憶部１３０は、情報処理装置１の内部に設けられているものであってもよい。

事業者端末２は、例えば、目的に応じた学習モデル（図示しない）を獲得するために用いられる学習データ１３１の入力を受け付ける。ここでの学習モデルは、例えば、時系列画像を用いた病名認識を行う際に用いられる学習モデルである。そして、事業者端末２は、学習データ１３１の入力を受け付けた場合、その学習データ１３１を情報処理装置１に送信する。

情報処理装置１は、事業者端末２から送信された学習データ１３１を受け付けた場合、例えば、受け付けた学習データ１３１を情報格納領域１３０に記憶する。その後、情報処理装置１は、情報格納領域１３０に記憶した学習データ１３１の学習を行うことにより、例えば、時系列画像を用いた病名認識を行う際に用いられる学習モデルの獲得を行う。

ここで、上記のような学習モデルの獲得を行う場合、例えば、大量の学習データ１３１（時系列画像を含む学習データ１３１）を学習することにより、学習モデルの獲得を行う機械学習方式の採用が考えられる。しかしながら、病名認識を行う体内の位置等によっては、必要な性能を有する学習モデルを獲得するために必要な量の学習データ１３１を用意することができない場合がある。

そこで、例えば、一般問題に関する学習データ１３１であって大量のサンプルを用意可能な学習データ１３１であるソースデータ１３１ａを用いて学習を行った後、特化問題に関する学習データ１３１であって少量のサンプルのみを用意可能な学習データ１３１であるターゲットデータ１３１ｂを用いて再度学習を行うことにより、学習モデルを獲得する転移学習方式の採用が考えられる。

具体的に、事業者は、この場合、例えば、図２に示すように、一般問題（例えば、一般的ながん）に関する画像ＩＭ１、画像ＩＭ２、画像ＩＭ３及び画像ＩＭ４を含むソースデータ１３１ａを用いた学習を行った後、特化問題（例えば、肝がん）に関する画像ＩＭ４及び画像ＩＭ５を含むターゲットデータ１３１ｂを用いた学習を行う。

しかしながら、例えば、図３に示すように、ソースデータ１３１ａが文字からなるデータであるのに対し、ターゲットデータ１３１ｂが画像ＩＭ６からなるデータである場合、すなわち、ソースデータ１３１ａとターゲットデータ１３１ｂとが異種データである場合、異種データ間における転移学習方式（クロスモーダル転移学習方式）を採用した場合であっても、必要な性能を有する学習モデルの獲得が困難である場合がある。

そこで、例えば、図４に示すように、ソースデータ１３１ａ及びターゲットデータ１３１ｂだけでなく、文字からなるデータと画像ＩＭ７とを含む中間データ１３１ｃ（ソースデータ１３１ａとターゲットデータ１３１ｂとの橋渡し役になる中間データ１３１ｃ）についても学習を行うクロスモーダル転移学習方式の採用が考えられる。

この場合、例えば、文字と通常の画像とを含む中間データ１３１ｃを文字と時系列画像とを含む中間データ１３１ｃに変換することにより、クロスモーダル転移学習に必要な中間データ１３１ｃの生成が行われる。具体的に、例えば、図５に示すように、文献に含まれる図の中から、複数の画像をレイアウトした図である複合図（図５の左側の図）を抽出し、抽出した複合図に対して二値化処理、矩形抽出処理及びラベリング処理等を行うことにより、画像ＩＭ０１、画像ＩＭ０２、画像ＩＭ０３及び画像ＩＭ０４を含む複数の画像（図５の真中の図）を抽出し、さらに、抽出した複数の画像に対応付けられたラベルをＯＣＲ処理等によって読み取って順序付けを行うことにより、文献に含まれる図から時系列画像（図５の右側の図）への変換を行う。

これにより、事業者は、時系列画像を用いた病名認識を行う際に用いられる学習モデルを獲得することが可能になる。

しかしながら、上記のような複合図に含まれる画像には、例えば、位置やアングルの違いを表す３次元画像等、時系列画像以外の画像が含まれる場合がある。そのため、事業者は、複合図から抽出した画像を時系列画像として用いた中間データ１３１ｃの学習を行う場合、必要な性能を実現可能な学習モデルを獲得することができない可能性がある。

したがって、事業者は、必要な性能を実現可能な学習モデルを獲得するために、例えば、複合図に含まれる画像から時系列画像を精度良く抽出し、抽出した時系列画像を用いた中間データ１３１ｃについての学習を行う必要がある。

そこで、本実施の形態における情報処理装置１は、所定の対応関係を有する複数の画像を文献（以下、文献データとも呼ぶ）から取得する。そして、情報処理装置１は、取得した複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定する。

その結果、所定の条件を満たすと判定した場合、情報処理装置１は、取得した複数の画像が時系列画像であると特定する。そして、情報処理装置１は、特定した時系列画像を含む学習データ１３１（中間データ１３１ｃ）を生成する。

すなわち、本実施の形態における情報処理装置１は、文献に含まれる複数の画像のうち、所定の対応関係を有する複数の画像を時系列画像として特定し、所定の対応関係を有しない複数の画像を時系列画像以外の画像（例えば、３次元画像）として特定する。そして、情報処理装置１は、時系列画像として特定した画像を含むように中間データ１３１ｃの生成を行う。

これにより、情報処理装置１は、文献に含まれる複数の画像から、時系列画像を精度良く抽出することが可能になる。そのため、情報処理装置１は、時系列画像が高い確率で含まれる中間データ１３１ｃを生成することが可能になり、必要な性能を実現可能な学習モデルを獲得することが可能になる。

［情報処理システムのハードウエア構成］
次に、情報処理システム１０のハードウエア構成について説明する。図６は、情報処理装置１のハードウエア構成を説明する図である。

情報処理装置１は、図６に示すように、プロセッサであるＣＰＵ１０１と、メモリ１０２と、外部インターフェース（Ｉ／Ｏユニット）１０３と、記憶媒体１０４とを有する。各部は、バス１０５を介して互いに接続される。

記憶媒体１０４は、例えば、学習データ１３１（中間データ１３１ｃ）を生成する処理（以下、学習データ生成処理とも呼ぶ）を行うためのプログラム１１０を記憶するプログラム格納領域（図示しない）を有する。また、記憶媒体１０４は、例えば、学習データ生成処理を行う際に用いられる情報を記憶する情報格納領域１３０を有する。なお、記憶媒体１０４は、例えば、ＨＤＤ（ＨａｒｄＤｉｓｋＤｒｉｖｅ）やＳＳＤ（ＳｏｋｉｄＳｔａｔｅＤｒｉｖｅ）であってよい。

ＣＰＵ１０１は、記憶媒体１０４からメモリ１０２にロードされたプログラム１１０を実行して学習データ生成処理を行う。

また、外部インターフェース１０３は、例えば、ネットワークＮＷを介することによって事業者端末２と通信を行う。

［情報処理システムの機能］
次に、情報処理システム１０の機能について説明を行う。図７は、情報処理装置１の機能のブロック図である。

情報処理装置１は、図７に示すように、情報処理装置１のＣＰＵ１０１やメモリ１０２等のハードウエアとプログラム１１０とが有機的に協働することにより、データ受付部１１１と、文献受付部１１２と、情報管理部１１３と、画像取得部１１４と、条件判定部１１５と、基準値特定部１１６と、画像特定部１１７と、データ生成部１１８とを含む各種機能を実現する。

また、情報処理装置１は、図７に示すように、学習データ１３１と、文献データ１３２とを情報格納領域１３０に記憶する。

データ受付部１１１は、例えば、事業者端末２から送信された学習データ１３１を受け付ける。具体的に、データ受付部１１１は、例えば、事業者が事業者端末２を介して送信したソースデータ１３１ａ及びターゲットデータ１３１ｂを受け付ける。

文献受付部１１２は、例えば、事業者端末２から送信された文献データ１３２を受け付ける。文献データ１３２は、例えば、論文や教科書等であってよい。

情報管理部１１３は、データ受付部１１１が受け付けた学習データ１３１を情報格納領域１３０に記憶する。また、情報管理部１１３は、文献受付部１１２が受け付けた文献データ１３２を情報格納領域１３０に記憶する。

画像取得部１１４は、所定の対応関係を有する複数の画像を、情報格納領域１３０に記憶された文献データ１３２から取得する。具体的に、所定の対応関係を有する複数の画像は、例えば、文献データ１３２に含まれる複数の画像のうち、文献データ１３２に含まれる所定の範囲内において１以上の列を形成した状態で掲載されている複数の画像であってよい。また、所定の対応関係を有する複数の画像は、例えば、文献データ１３２に含まれる複数の画像のうち、文献データ１３２において同一の説明文に対応付けられている複数の画像であってよい。

条件判定部１１５は、画像取得部１１４が取得した複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定する。

具体的に、条件判定部１１５は、例えば、画像取得部１１４が取得した複数の画像から基準画像（以下、第１基準画像とも呼ぶ）を特定し、画像取得部１１４が取得した複数の画像のうちの第１基準画像以外の画像毎に、特定した第１基準画像と一致しない領域の第１割合を特定する。そして、条件判定部１１５は、例えば、特定した第１割合の大きさのそれぞれを特徴量として特定する。その後、条件判定部１１５は、例えば、特定した特徴量のうちの最大値が第１閾値を下回るか否かを判定する。第１閾値は、例えば、事業者によって予め定められた閾値であってよい。

基準値特定部１１６は、例えば、所定の時系列画像から基準画像（以下、第２基準画像とも呼ぶ）を特定し、所定の時系列画像のうちの第２基準画像以外の画像毎に、特定した第２基準画像と一致しない領域の第２割合を特定する。そして、基準値特定部１１６は、例えば、特定した第２割合の大きさのうちの最大値を基準値として特定する。基準値を用いた処理についての説明については後述する。

画像特定部１１７は、条件判定部１１５が所定の条件を満たすと判定した場合、画像取得部１１４が取得した複数の画像が時系列画像であると特定する。具体的に、画像特定部１１７は、例えば、条件判定部１１５が特定した特徴量のうちの最大値が第１閾値を下回ると判定した場合、画像取得部１１４が取得した複数の画像が時系列画像であると特定する。

データ生成部１１８は、画像特定部１１７が特定した時系列画像を含む学習データ１３１（中間データ１３１ｃ）を生成する。

［第１の実施の形態の概略］
次に、第１の実施の形態の概略について説明する。図８は、第１の実施の形態における学習データ生成処理の概略を説明するフローチャート図である。また、図９及び図１０は、第１の実施の形態における学習データ生成処理の概略を説明する図である。

情報処理装置１は、図８に示すように、例えば、データ生成タイミングになるまで待機する（Ｓ１のＮＯ）。データ生成タイミングは、例えば、事業者が事業者端末２に対して中間データ１３１ｃの生成を開始する旨の入力を行ったタイミングであってよい。

そして、データ生成タイミングになった場合（Ｓ１のＹＥＳ）、情報処理装置１は、図９に示すように、所定の対応関係を有する複数の画像を文献データ１３２から取得する（Ｓ２）。

続いて、情報処理装置１は、Ｓ２の処理で取得した複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定する（Ｓ３）。

その結果、所定の条件を満たすと判定した場合（Ｓ４のＹＥＳ）、情報処理装置１は、図１０に示すように、Ｓ２の処理で取得した複数の画像が時系列画像であると特定する（Ｓ５）。

その後、情報処理装置１は、図１０に示すように、Ｓ５の処理で特定した時系列画像を含む学習データ１３１（中間データ１３１ｃ）を生成する（Ｓ６）。そして、情報処理装置１は、例えば、生成した学習データ１３１を情報格納領域１３０に記憶する。

一方、所定の条件を満たさないと判定した場合（Ｓ４のＮＯ）、情報処理装置１は、Ｓ５及びＳ６の処理を行わない。

これにより、情報処理装置１は、文献データ１３２に含まれる複数の画像から、時系列画像を精度良く抽出することが可能になる。そのため、情報処理装置１は、時系列画像が高い確率で含まれる中間データ１３１ｃを生成することが可能になり、必要な性能を実現可能な学習モデルを獲得することが可能になる。

したがって、情報処理装置１は、例えば、必要な量の学習データ１３１を用意することができない場合であっても、必要な性能を実現可能な学習モデルを獲得することが可能になる。

［第１の実施の形態の詳細］
次に、第１の実施の形態の詳細について説明する。図１１から図１４は、第１の実施の形態における学習データ生成処理の詳細を説明するフローチャート図である。また、図１５から図１８は、第１の実施の形態における学習データ生成処理の詳細を説明する図である。

［学習データ受付処理］
初めに、第１の実施の形態における学習データ生成処理のうち、事業者が入力した学習データ１３１（ソースデータ１３１ａ及びターゲットデータ１３１ｂ）を受け付ける処理（以下、学習データ受付処理とも呼ぶ）について説明を行う。図１１は、第１の実施の形態における学習データ受付処理について説明するフローチャート図である。

情報処理装置１のデータ受付部１１１は、図１１に示すように、例えば、事業者が事業者端末２を介して行った学習データ１３１を受け付けるまで待機する（Ｓ１１のＮＯ）。

そして、学習データ１３１を受け付けた場合（Ｓ１１のＹＥＳ）、情報処理装置１の情報管理部１１３は、Ｓ１１の処理で受け付けた学習データ１３１を情報格納領域１３０に記憶する（Ｓ１２）。

［文献データ受付処理］
次に、第１の実施の形態における学習データ生成処理のうち、事業者が入力した文献データ１３２を受け付ける処理（以下、文献データ受付処理とも呼ぶ）について説明を行う。図１２は、第１の実施の形態における文献データ受付処理について説明するフローチャート図である。

情報処理装置１の文献受付部１１２は、図１２に示すように、例えば、事業者が事業者端末２を介して行った文献データ１３２を受け付けるまで待機する（Ｓ２１のＮＯ）。

そして、文献データ１３２を受け付けた場合（Ｓ２１のＹＥＳ）、情報管理部１１３は、Ｓ２１の処理で受け付けた文献データ１３２を情報格納領域１３０に記憶する（Ｓ２２）。

［学習データ生成処理の詳細］
次に、第１の実施の形態における学習データ生成処理の詳細について説明を行う。図１３及び図１４は、第１の実施の形態における学習データ生成処理の詳細について説明するフローチャート図である。

情報処理装置の画像取得部１１４は、図１３に示すように、例えば、データ生成タイミングになるまで待機する（Ｓ３１のＮＯ）。

そして、データ生成タイミングになった場合（Ｓ３１のＹＥＳ）、画像取得部１１４は、所定の対応関係を有する複数の画像を、情報格納領域１３０に記憶された文献データ１３２から取得する（Ｓ３２）。

具体的に、画像取得部１１４は、この場合、例えば、文献データ１３２において所定の配置関係に従って掲載されている複数の画像を取得する。所定の対応関係を有する複数の画像は、例えば、文献データ１３２に含まれる複数の画像のうち、文献データ１３２に含まれる所定の範囲内において１以上の列を形成した状態で掲載されている複数の画像である。

また、所定の対応関係を有する複数の画像は、この場合、例えば、文献データ１３２に含まれる複数の画像のうち、文献データ１３２において同一の説明文に対応付けられている複数の画像である。

その後、情報処理装置１の条件判定部１１５は、Ｓ３２の処理で取得した複数の画像から第１基準画像を特定する（Ｓ３３）。具体的に、条件判定部１１５は、例えば、Ｓ３２の処理で取得した複数の画像からランダムに取得した画像を第１基準画像として特定する。

続いて、条件判定部１１５は、Ｓ３２の処理で取得した複数の画像のうち、Ｓ３３の処理で特定した第１基準画像以外の画像毎に、Ｓ３３の処理で特定した第１基準画像と一致しない領域の第１割合を特定する（Ｓ３４）。

そして、条件判定部１１５は、Ｓ３４の処理で特定した第１割合のそれぞれを特徴量として特定する（Ｓ３５）。

さらに、条件判定部１１５は、図１４に示すように、Ｓ３５の処理で特定した特徴量のうちの最大値が第１閾値を下回るか否かを判定する（Ｓ４１）。

その結果、Ｓ３５の処理で特定した特徴量のうちの最大値が第１閾値を下回ると判定した場合（Ｓ４２のＹＥＳ）、情報処理装置１の画像特定部１１７は、Ｓ３２の処理で取得した複数の画像が時系列画像であると特定する（Ｓ４３）。

続いて、情報処理装置１のデータ生成部１１８は、Ｓ４３の処理で特定した時系列画像を含む学習データ１３１（中間データ１３１ｃ）を生成する（Ｓ４４）。

そして、情報管理部１１３は、例えば、Ｓ４４の処理で生成した学習データ１３１を情報格納領域１３０に記憶する（Ｓ４５）。

その後、情報処理装置１は、情報格納領域１３０に記憶された学習データ１３１（ソースデータ１３１ａ、ターゲットデータ１３１ｂ及び中間データ１３１ｃ）を学習することにより、例えば、医師による病名認識をサポートするための学習モデルを獲得する。

一方、Ｓ３５の処理で特定した特徴量のうちの最大値が第１閾値を下回らないと判定した場合（Ｓ４２のＮＯ）、画像特定部１１７は、Ｓ４３以降の処理を行わない。

これにより、情報処理装置１は、文献データ１３２に含まれる複数の画像から、時系列画像を精度良く抽出することが可能になる。そのため、情報処理装置１は、時系列画像が高い確率で含まれる中間データ１３１ｃを生成することが可能になり、必要な性能を実現可能な学習モデルを獲得することが可能になる。以下、学習データ生成処理の具体例について説明を行う。以下、学習データ生成処理の具体例について説明を行う。

［学習データ生成処理の具体例（１）］
図１５及び図１６は、学習データ生成処理の具体例を説明する図である。

図１５に示す例は、Ｓ３２の処理で取得した複数の画像の具体例であり、画像ＩＭ１０、画像ＩＭ１１、画像ＩＭ１２及び画像ＩＭ１３が含まれている。また、図１５に示す例において、対応点ＰＯは、各画像が変化しているか否かを判定する際の基準となる対応点である。さらに、図１６に示すグラフにおいて、横軸は、時系列画像に含まれる各画像を時系列順に並べた場合における各画像の配置位置を示しており、縦軸は、第１基準画像と各画像との間において一致する領域の割合を示している。以下、画像ＩＭ１０が第１基準画像として特定されているものとして説明を行う。

この場合において、例えば、図１６に示すように、画像ＩＭ１０に含まれる対応点ＰＯのうち、画像ＩＭ１１にも含まれる対応点ＰＯの割合が０．８であり、画像ＩＭ１０に含まれる対応点ＰＯのうち、画像ＩＭ１２にも含まれる対応点ＰＯの割合が０．９であり、画像ＩＭ１０に含まれる対応点ＰＯのうち、画像ＩＭ１３にも含まれる対応点ＰＯの割合が０．７である場合、条件判定部１１５は、Ｓ３５の処理において、画像ＩＭ１１、画像ＩＭ１２及び画像ＩＭ１３に対応する特徴量として、それぞれ０．２、０．１及び０．３を特定する。

そして、例えば、第１閾値が０．５である場合、条件判定部１１５は、Ｓ４１の処理において、特徴量として特定した０．２、０．１及び０．３のうちの最大値である０．３が第１閾値を下回っていると判定する。そのため、条件判定部１１５は、この場合、Ｓ４３の処理において、図１５に示す複数の画像が時系列画像であると判定する。

［学習データ生成処理の具体例（２）］
図１７及び図１８は、学習データ生成処理の具体例を説明する図である。

図１７に示す例は、Ｓ３２の処理で取得した複数の画像の具体例であり、画像ＩＭ２０、画像ＩＭ２１、画像ＩＭ２２及び画像ＩＭ２３が含まれている。以下、画像ＩＭ２０が第１基準画像として特定されているものとして説明を行う。

この場合において、例えば、図１８に示すように、画像ＩＭ２０に含まれる対応点ＰＯのうち、画像ＩＭ２１にも含まれる対応点ＰＯの割合が０．７であり、画像ＩＭ２０に含まれる対応点ＰＯのうち、画像ＩＭ２２にも含まれる対応点ＰＯの割合が０．２であり、画像ＩＭ２０に含まれる対応点ＰＯのうち、画像ＩＭ２３にも含まれる対応点ＰＯの割合が０．１である場合、条件判定部１１５は、Ｓ３５の処理において、画像ＩＭ２１、画像ＩＭ２２及び画像ＩＭ２３に対応する特徴量として、それぞれ０．３、０．８及び０．９を特定する。

そして、例えば、第１閾値が０．５である場合、条件判定部１１５は、Ｓ４１の処理において、特徴量として特定した０．３、０．８及び０．９のうちの最大値である０．９が第１閾値を下回っていないと判定する。そのため、条件判定部１１５は、この場合、Ｓ４３の処理において、図１７に示す複数の画像が時系列画像でないと判定する。

［第２の実施の形態］
次に、第２の実施の形態について説明する。図１９から図２１は、第２の実施の形態における学習データ生成処理を説明するフローチャート図である。なお、第２の実施の形態における学習データ受付処理及び文献データ受付処理については、第１の実施の形態で説明した場合の処理と同じ内容であるため説明を省略する。

［基準値特定処理］
初めに、第２の実施の形態における学習データ生成処理のうち、学習データ生成処理において用いられる基準値の特定を行う処理（以下、基準値特定処理とも呼ぶ）について説明を行う。図１９は、第２の実施の形態における基準値特定処理について説明するフローチャート図である。

情報処理装置１の基準値特定部１１６は、図１９に示すように、基準値特定タイミングまで待機する（Ｓ５１のＮＯ）。基準値特定タイミングは、例えば、事業者が事業者端末２を介して基準値の特定を行う旨の入力を行ったタイミングであってよい。

そして、基準値特定タイミングになった場合（Ｓ５１のＹＥＳ）、基準値特定部１１６は、複数の画像を含む所定の時系列画像（時系列画像であることが予め明らかになっている複数の画像）から第２基準画像を特定する（Ｓ５２）。具体的に、基準値特定部１１６は、例えば、情報格納領域１３０に記憶されたターゲットデータ１３１ｂに含まれる時系列画像から第２基準画像の特定を行う。

続いて、基準値特定部１１６は、所定の時系列画像のうち、Ｓ５２の処理で特定した第２基準画像以外の画像毎に、Ｓ５２の処理で特定した第２基準画像と一致しない領域の第２割合を特定する（Ｓ５３）。

その後、基準値特定部１１６は、Ｓ５３の処理で特定した第２割合のうちの最大値を基準値として特定する（Ｓ５４）。

［学習データ生成処理の詳細］
次に、第２の実施の形態における学習データ生成処理の詳細について説明を行う。図２０及び図２１は、第２の実施の形態における学習データ生成処理の詳細について説明するフローチャート図である。

画像取得部１１４は、図２０に示すように、例えば、データ生成タイミングになるまで待機する（Ｓ６１のＮＯ）。

そして、データ生成タイミングになった場合（Ｓ６１のＹＥＳ）、画像取得部１１４は、所定の対応関係を有する複数の画像を、情報格納領域１３０に記憶された文献データ１３２から取得する（Ｓ６２）。

その後、条件判定部１１５は、Ｓ６２の処理で取得した複数の画像から第１基準画像を特定する（Ｓ６３）。

続いて、条件判定部１１５は、Ｓ６２の処理で取得した複数の画像のうち、Ｓ６３の処理で特定した第１基準画像以外の画像毎に、Ｓ６３の処理で特定した第１基準画像と一致しない領域の第１割合を特定する（Ｓ６４）。

そして、条件判定部１１５は、Ｓ６４の処理で特定した第１割合のそれぞれを特徴量として特定する（Ｓ６５）。

さらに、条件判定部１１５は、図２１に示すように、Ｓ６５の処理で特定した特徴量のうちの最大値と、Ｓ５４の処理で特定した基準値との差分が第２閾値を下回るか否かを判定する（Ｓ７１）。第２閾値は、例えば、事業者によって予め定められた閾値であってよい。

その結果、Ｓ６５の処理で特定した特徴量のうちの最大値と、Ｓ５４の処理で特定した基準値との差分が第２閾値を下回ると判定した場合（Ｓ７２のＹＥＳ）、画像特定部１１７は、Ｓ６２の処理で取得した複数の画像が時系列画像であると特定する（Ｓ７３）。

続いて、データ生成部１１８は、Ｓ７３の処理で特定した時系列画像を含む学習データ１３１（中間データ１３１ｃ）を生成する（Ｓ７４）。

そして、情報管理部１１３は、例えば、Ｓ７４の処理で生成した学習データ１３１を情報格納領域１３０に記憶する（Ｓ７５）。

一方、Ｓ６５の処理で特定した特徴量のうちの最大値と、Ｓ５４の処理で特定した基準値との差分が第２閾値を下回らないと判定した場合（Ｓ７２のＮＯ）、画像特定部１１７は、Ｓ７３以降の処理を行わない。

すなわち、第２の実施の形態における学習データ生成処理では、文献データ１３２から取得した複数の画像から特定した特徴量の最大値と、所定の時系列画像から同じ方法によって特定した基準値とが近似しているか否かを判定する。そして、第２の実施の形態における学習データ生成処理では、これらの値が近似していると判定された場合、文献データ１３２から取得した複数の画像が時系列画像であると判定する。

これにより、情報処理装置１は、文献データ１３２に含まれる複数の画像から、時系列画像をより精度良く抽出することが可能になる。そのため、情報処理装置１は、時系列画像がより高い確率で含まれる中間データ１３１ｃを生成することが可能になり、必要な性能を実現可能な学習モデルを獲得することが可能になる。

［第３の実施の形態］
次に、第３の実施の形態について説明する。図２２から図２４は、第３の実施の形態における学習データ生成処理を説明するフローチャート図である。また、図２５は、第３の実施の形態における学習データ生成処理を説明する図である。なお、第３の実施の形態における学習データ受付処理及び文献データ受付処理については、第１の実施の形態で説明した場合の処理と同じ内容であるため説明を省略する。

［基準値特定処理］
初めに、第３の実施の形態における基準値特定処理について説明を行う。図２２は、第３の実施の形態における基準値特定処理について説明するフローチャート図である。

基準値特定部１１６は、図２２に示すように、基準値特定タイミングまで待機する（Ｓ８１のＮＯ）。

そして、基準値特定タイミングになった場合（Ｓ８１のＹＥＳ）、基準値特定部１１６は、複数の画像を含む所定の時系列画像から第２基準画像を特定する（Ｓ８２）。

続いて、基準値特定部１１６は、所定の時系列画像のうち、Ｓ８２の処理で特定した第２基準画像以外の画像毎に、Ｓ８２の処理で特定した第２基準画像と一致する領域の第４割合を特定する（Ｓ８３）。

その後、基準値特定部１１６は、Ｓ８３の処理で特定した第４割合に対応する平面上の点についての近似直線の傾きを基準値として特定する（Ｓ８４）。

具体的に、基準値特定部１１６は、例えば、図２５に示すように、図１６で説明したグラフと同様のグラフ上において、第２基準画像に対応する点を通り、かつ、画像毎に特定された第４割合に対応する点のそれぞれに近似する近似直線ＳＴを生成する。そして、基準値特定部１１６は、例えば、生成した近似直線ＳＴの傾きを基準値として特定する。

［学習データ生成処理の詳細］
次に、第３の実施の形態における学習データ生成処理の詳細について説明を行う。図２３及び図２４は、第３の実施の形態における学習データ生成処理の詳細について説明するフローチャート図である。

画像取得部１１４は、図２３に示すように、例えば、データ生成タイミングになるまで待機する（Ｓ９１のＮＯ）。

そして、データ生成タイミングになった場合（Ｓ９１のＹＥＳ）、画像取得部１１４は、所定の対応関係を有する複数の画像を、情報格納領域１３０に記憶された文献データ１３２から取得する（Ｓ９２）。

その後、条件判定部１１５は、Ｓ９２の処理で取得した複数の画像から第１基準画像を特定する（Ｓ９３）。

続いて、条件判定部１１５は、Ｓ９２の処理で取得した複数の画像のうち、Ｓ９３の処理で特定した第１基準画像以外の画像毎に、Ｓ９３の処理で特定した第１基準画像と一致する領域の第３割合を特定する（Ｓ９４）。

そして、条件判定部１１５は、Ｓ９４の処理で特定した第３割合の大きさのそれぞれを特徴量として特定する（Ｓ９５）。

さらに、条件判定部１１５は、図２４に示すように、Ｓ９５の処理で特定した特徴量に対応する平面上の点についての近似直線の傾きと、Ｓ８４の処理で特定した基準値との差分が第３閾値を下回るか否かを判定する（Ｓ１０１）。第３閾値は、例えば、事業者によって予め定められた閾値であってよい。

具体的に、基準値特定部１１６は、例えば、図２５で説明した場合と同様に、第１基準画像に対応する点を通り、かつ、画像毎に特定された第３割合に対応する点のそれぞれに近似する近似直線を生成する。そして、基準値特定部１１６は、例えば、生成した近似直線の傾きを基準値として特定する。

その結果、Ｓ９５の処理で特定した特徴量に対応する平面上の点についての近似直線の傾きと、Ｓ８４の処理で特定した基準値との差分が第３閾値を下回ると判定した場合（Ｓ１０２のＹＥＳ）、画像特定部１１７は、Ｓ９２の処理で取得した複数の画像が時系列画像であると特定する（Ｓ１０３）。

続いて、データ生成部１１８は、Ｓ１０３の処理で特定した時系列画像を含む学習データ１３１（中間データ１３１ｃ）を生成する（Ｓ１０４）。

そして、情報管理部１１３は、例えば、Ｓ１０４の処理で生成した学習データ１３１を情報格納領域１３０に記憶する（Ｓ１０５）。

一方、Ｓ９５の処理で特定した特徴量に対応する平面上の点についての近似直線の傾きと、Ｓ８４の処理で特定した基準値との差分が第３閾値を下回らないと判定した場合（Ｓ１０２のＮＯ）、画像特定部１１７は、Ｓ１０３以降の処理を行わない。

すなわち、第３の実施の形態における学習データ生成処理では、文献データ１３２から取得した複数の画像から生成した近似直線の傾きと、時系列画像から生成した近似直線の傾きとが近似しているか否かを判定する。そして、第３の実施の形態における学習データ生成処理では、これらの値が近似していると判定された場合、文献データ１３２から取得した複数の画像が時系列画像であると判定する。

［第４の実施の形態］
次に、第４の実施の形態について説明する。図２６から図２８は、第４の実施の形態における学習データ生成処理を説明するフローチャート図である。また、図２９は、第４の実施の形態における学習データ生成処理を説明する図である。なお、第４の実施の形態における学習データ受付処理及び文献データ受付処理については、第１の実施の形態で説明した場合の処理と同じ内容であるため説明を省略する。

［基準値特定処理］
初めに、第４の実施の形態における基準値特定処理について説明を行う。図２６は、第４の実施の形態における基準値特定処理について説明するフローチャート図である。

基準値特定部１１６は、図２６に示すように、基準値特定タイミングまで待機する（Ｓ１１１のＮＯ）。

そして、基準値特定タイミングになった場合（Ｓ１１１のＹＥＳ）、基準値特定部１１６は、複数の画像を含む所定の時系列画像から第２基準画像を特定する（Ｓ１１２）。

続いて、基準値特定部１１６は、所定の時系列画像のうち、Ｓ１１２の処理で特定した第２基準画像以外の画像毎に、Ｓ１１２の処理で特定した第２基準画像と一致する領域の第４割合を特定する（Ｓ１１３）。

その後、基準値特定部１１６は、Ｓ１１３の処理で特定した第４割合に対応する平面上の点についての二次元の近似曲線の二回微分値を基準値として特定する（Ｓ１１４）。

具体的に、基準値特定部１１６は、例えば、図２９に示すように、図１６で説明したグラフと同様のグラフ上において、第２基準画像に対応する点を通り、かつ、画像毎に特定された第４割合に対応する点のそれぞれに近似する二次元の近似曲線ＣＵを生成する。そして、基準値特定部１１６は、例えば、生成した近似曲線ＣＵの二回微分値を基準値として特定する。

［学習データ生成処理の詳細］
次に、第４の実施の形態における学習データ生成処理の詳細について説明を行う。図２７及び図２８は、第４の実施の形態における学習データ生成処理の詳細について説明するフローチャート図である。

画像取得部１１４は、図２７に示すように、例えば、データ生成タイミングになるまで待機する（Ｓ１２１のＮＯ）。

そして、データ生成タイミングになった場合（Ｓ１２１のＹＥＳ）、画像取得部１１４は、所定の対応関係を有する複数の画像を、情報格納領域１３０に記憶された文献データ１３２から取得する（Ｓ１２２）。

その後、条件判定部１１５は、Ｓ１２２の処理で取得した複数の画像から第１基準画像を特定する（Ｓ１２３）。

続いて、条件判定部１１５は、Ｓ１２２の処理で取得した複数の画像のうち、Ｓ１２３の処理で特定した第１基準画像以外の画像毎に、Ｓ１２３の処理で特定した第１基準画像と一致する領域の第３割合を特定する（Ｓ１２４）。

そして、条件判定部１１５は、Ｓ１２４の処理で特定した第３割合のそれぞれを特徴量として特定する（Ｓ１２５）。

さらに、条件判定部１１５は、図２８に示すように、Ｓ１２５の処理で特定した特徴量に対応する平面上の点についての二次元の近似曲線の二回微分値と、Ｓ１１４の処理で特定した基準値との差分が第４閾値を下回るか否かを判定する（Ｓ１３１）。第４閾値は、例えば、事業者によって予め定められた閾値であってよい。

具体的に、基準値特定部１１６は、例えば、図２９で説明した場合と同様に、第１基準画像に対応する点を通り、かつ、画像毎に特定された第３割合に対応する点のそれぞれに近似する二次元の近似曲線を生成する。そして、基準値特定部１１６は、例えば、生成した近似曲線の二回微分値を基準値として特定する。

その結果、Ｓ１２５の処理で特定した特徴量に対応する平面上の点についての二次元の近似曲線の二回微分値と、Ｓ１１４の処理で特定した基準値との差分が第４閾値を下回ると判定した場合（Ｓ１３２のＹＥＳ）、画像特定部１１７は、Ｓ１２２の処理で取得した複数の画像が時系列画像であると特定する（Ｓ１３３）。

続いて、データ生成部１１８は、Ｓ１３３の処理で特定した時系列画像を含む学習データ１３１（中間データ１３１ｃ）を生成する（Ｓ１３４）。

そして、情報管理部１１３は、例えば、Ｓ１３４の処理で生成した学習データ１３１を情報格納領域１３０に記憶する。

一方、Ｓ１２５の処理で特定した特徴量に対応する平面上の点についての二次元の近似曲線の二回微分値と、Ｓ１１４の処理で特定した基準値との差分が第４閾値を下回らないと判定した場合（Ｓ１３２のＮＯ）、画像特定部１１７は、Ｓ１３３以降の処理を行わない。

すなわち、第４の実施の形態における学習データ生成処理では、文献データ１３２から取得した複数の画像から生成した二次元の近似曲線の二回微分値と、時系列画像から生成した二次元の近似曲線の二回微分値とが近似しているか否かを判定する。そして、第３の実施の形態における学習データ生成処理では、これらの値が近似していると判定された場合、文献データ１３２から取得した複数の画像が時系列画像であると判定する。

以上の実施の形態をまとめると、以下の付記のとおりである。

（付記１）
機械学習に用いる学習データを生成する学習データ生成プログラムであって、
所定の対応関係を有する複数の画像を文献から取得し、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定し、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定し、
特定した前記複数の画像を含む学習データを生成する、
処理をコンピュータに実行させることを特徴とする学習データ生成プログラム。

（付記２）
付記１において、
前記所定の対応関係を有する複数の画像は、前記文献において所定の配置関係に従って掲載されている複数の画像である、
ことを特徴とする学習データ生成プログラム。

（付記３）
付記１において、
前記所定の対応関係を有する複数の画像は、前記文献において同一の説明文に対応付けられて掲載されている複数の画像である、
ことを特徴とする学習データ生成プログラム。

（付記４）
付記１において、
前記判定する処理では、
取得した前記複数の画像から第１基準画像を特定し、
前記複数の画像のうちの前記第１基準画像以外の画像毎に、特定した前記第１基準画像と一致しない領域の割合である第１割合を特定し、
特定した前記第１割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成プログラム。

（付記５）
付記４において、
前記判定する処理では、特定した前記特徴量のうちの最大値が第１閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記特徴量のうちの最大値が前記第１閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。

（付記６）
付記４において、さらに、
複数の画像を含む所定の時系列画像から第２基準画像を特定し、
前記所定の時系列画像のうちの前記第２基準画像以外の画像毎に、特定した前記第２基準画像と一致しない領域の割合である第２割合を特定し、
特定した前記第２割合のうちの最大値を基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、前記特徴量のうちの最大値と前記基準値との差分が第２閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第２閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。

（付記７）
付記１において、
前記判定する処理では、
取得した前記複数の画像から第１基準画像を特定し、
前記複数の画像のうちの前記第１基準画像以外の画像毎に、特定した前記第１基準画像と一致する領域の割合である第３割合を特定し、
特定した前記第３割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成プログラム。

（付記８）
付記７において、さらに
複数の画像を含む所定の時系列画像から第２基準画像を特定し、
前記所定の時系列画像のうちの前記第２基準画像以外の画像毎に、特定した前記第２基準画像と一致する領域の第４割合を特定し、
特定した前記第４割合に対応する平面上の点のそれぞれについての二次元の近似直線を生成し、
生成した前記近似直線の傾きを基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、
特定した前記特徴量のそれぞれについての近似直線を生成し、
生成した前記近似直線の傾きと前記基準値との差分が第３閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第３閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。

（付記９）
付記７において、さらに、
複数の画像を含む所定の時系列画像から第２基準画像を特定し、
前記所定の時系列画像のうちの前記第２基準画像以外の画像毎に、特定した前記第２基準画像と一致する領域の第４割合を特定し、
特定した前記第４割合に対応する平面上の点のそれぞれについての二次元の近似曲線を生成し、
生成した前記近似曲線の二回微分値を基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、
特定した前記特徴量のそれぞれについての二次元の近似曲線を生成し、
生成した前記近似曲線の二回微分値と前記基準値との差分が第４閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第４閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。

（付記１０）
機械学習に用いる学習データを生成する学習データ生成装置であって、
所定の対応関係を有する複数の画像を文献から取得する画像取得部と、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定する条件判定部と、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定する画像特定部と、
特定した前記複数の画像を含む学習データを生成するデータ生成部と、を有する、
ことを特徴とする学習データ生成装置。

（付記１１）
付記１０において、
前記条件判定部は、
取得した前記複数の画像から第１基準画像を特定し、
前記複数の画像のうちの前記第１基準画像以外の画像毎に、特定した前記第１基準画像と一致しない領域の第１割合を特定し、
特定した前記第１割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成装置。

（付記１２）
付記１１において、
前記条件判定部は、特定した前記特徴量のうちの最大値が第１閾値を下回るか否かを判定し、
前記画像特定部は、前記特徴量のうちの最大値が前記第１閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成装置。

（付記１３）
機械学習に用いる学習データを生成する学習データ生成方法であって、
所定の対応関係を有する複数の画像を文献から取得し、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定し、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定し、
特定した前記複数の画像を含む学習データを生成する、
ことを特徴とする学習データ生成方法。

（付記１４）
付記１３において、
前記判定する工程では、
取得した前記複数の画像から第１基準画像を特定し、
前記複数の画像のうちの前記第１基準画像以外の画像毎に、特定した前記第１基準画像と一致しない領域の第１割合を特定し、
特定した前記第１割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成方法。

（付記１５）
付記１４において、
前記判定する工程では、特定した前記特徴量のうちの最大値が第１閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する工程では、前記特徴量のうちの最大値が前記第１閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成方法。

１：情報処理装置２：事業者端末
１３０：情報格納領域１３１：学習データ
ＮＷ：ネットワーク

Claims

機械学習に用いる学習データを生成する学習データ生成プログラムであって、
所定の対応関係を有する複数の画像を文献から取得し、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定し、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定し、
特定した前記複数の画像を含む学習データを生成する、
処理をコンピュータに実行させることを特徴とする学習データ生成プログラム。
請求項１において、
前記所定の対応関係を有する複数の画像は、前記文献において所定の配置関係に従って掲載されている複数の画像である、
ことを特徴とする学習データ生成プログラム。
請求項１において、
前記所定の対応関係を有する複数の画像は、前記文献において同一の説明文に対応付けられて掲載されている複数の画像である、
ことを特徴とする学習データ生成プログラム。
請求項１において、
前記判定する処理では、
取得した前記複数の画像から第１基準画像を特定し、
前記複数の画像のうちの前記第１基準画像以外の画像毎に、特定した前記第１基準画像と一致しない領域の割合である第１割合を特定し、
特定した前記第１割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成プログラム。
請求項４において、
前記判定する処理では、特定した前記特徴量のうちの最大値が第１閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記特徴量のうちの最大値が前記第１閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。
請求項４において、さらに、
複数の画像を含む所定の時系列画像から第２基準画像を特定し、
前記所定の時系列画像のうちの前記第２基準画像以外の画像毎に、特定した前記第２基準画像と一致しない領域の割合である第２割合を特定し、
特定した前記第２割合のうちの最大値を基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、前記特徴量のうちの最大値と前記基準値との差分が第２閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第２閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。
請求項１において、
前記判定する処理では、
取得した前記複数の画像から第１基準画像を特定し、
前記複数の画像のうちの前記第１基準画像以外の画像毎に、特定した前記第１基準画像と一致する領域の割合である第３割合を特定し、
特定した前記第３割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成プログラム。
請求項７において、さらに
複数の画像を含む所定の時系列画像から第２基準画像を特定し、
前記所定の時系列画像のうちの前記第２基準画像以外の画像毎に、特定した前記第２基準画像と一致する領域の第４割合を特定し、
特定した前記第４割合に対応する平面上の点のそれぞれについての二次元の近似直線を生成し、
生成した前記近似直線の傾きを基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、
特定した前記特徴量のそれぞれについての近似直線を生成し、
生成した前記近似直線の傾きと前記基準値との差分が第３閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第３閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。
請求項７において、さらに、
複数の画像を含む所定の時系列画像から第２基準画像を特定し、
前記所定の時系列画像のうちの前記第２基準画像以外の画像毎に、特定した前記第２基準画像と一致する領域の第４割合を特定し、
特定した前記第４割合に対応する平面上の点のそれぞれについての二次元の近似曲線を生成し、
生成した前記近似曲線の二回微分値を基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、
特定した前記特徴量のそれぞれについての二次元の近似曲線を生成し、
生成した前記近似曲線の二回微分値と前記基準値との差分が第４閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第４閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。
機械学習に用いる学習データを生成する学習データ生成装置であって、
所定の対応関係を有する複数の画像を文献から取得する画像取得部と、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定する条件判定部と、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定する画像特定部と、
特定した前記複数の画像を含む学習データを生成するデータ生成部と、を有する、
ことを特徴とする学習データ生成装置。
機械学習に用いる学習データを生成する学習データ生成方法であって、
所定の対応関係を有する複数の画像を文献から取得し、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定し、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定し、
特定した前記複数の画像を含む学習データを生成する、
ことを特徴とする学習データ生成方法。