JP7148794B2 - 学習データ生成プログラム、学習データ生成装置及び学習データ生成方法 - Google Patents
学習データ生成プログラム、学習データ生成装置及び学習データ生成方法 Download PDFInfo
- Publication number
- JP7148794B2 JP7148794B2 JP2018212093A JP2018212093A JP7148794B2 JP 7148794 B2 JP7148794 B2 JP 7148794B2 JP 2018212093 A JP2018212093 A JP 2018212093A JP 2018212093 A JP2018212093 A JP 2018212093A JP 7148794 B2 JP7148794 B2 JP 7148794B2
- Authority
- JP
- Japan
- Prior art keywords
- images
- learning data
- data generation
- image
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Analysis (AREA)
Description
初めに、情報処理システム10の構成について説明を行う。図1は、情報処理システム10の構成について説明する図である。
次に、情報処理システム10のハードウエア構成について説明する。図6は、情報処理装置1のハードウエア構成を説明する図である。
次に、情報処理システム10の機能について説明を行う。図7は、情報処理装置1の機能のブロック図である。
次に、第1の実施の形態の概略について説明する。図8は、第1の実施の形態における学習データ生成処理の概略を説明するフローチャート図である。また、図9及び図10は、第1の実施の形態における学習データ生成処理の概略を説明する図である。
次に、第1の実施の形態の詳細について説明する。図11から図14は、第1の実施の形態における学習データ生成処理の詳細を説明するフローチャート図である。また、図15から図18は、第1の実施の形態における学習データ生成処理の詳細を説明する図である。
初めに、第1の実施の形態における学習データ生成処理のうち、事業者が入力した学習データ131(ソースデータ131a及びターゲットデータ131b)を受け付ける処理(以下、学習データ受付処理とも呼ぶ)について説明を行う。図11は、第1の実施の形態における学習データ受付処理について説明するフローチャート図である。
次に、第1の実施の形態における学習データ生成処理のうち、事業者が入力した文献データ132を受け付ける処理(以下、文献データ受付処理とも呼ぶ)について説明を行う。図12は、第1の実施の形態における文献データ受付処理について説明するフローチャート図である。
次に、第1の実施の形態における学習データ生成処理の詳細について説明を行う。図13及び図14は、第1の実施の形態における学習データ生成処理の詳細について説明するフローチャート図である。
図15及び図16は、学習データ生成処理の具体例を説明する図である。
図17及び図18は、学習データ生成処理の具体例を説明する図である。
次に、第2の実施の形態について説明する。図19から図21は、第2の実施の形態における学習データ生成処理を説明するフローチャート図である。なお、第2の実施の形態における学習データ受付処理及び文献データ受付処理については、第1の実施の形態で説明した場合の処理と同じ内容であるため説明を省略する。
初めに、第2の実施の形態における学習データ生成処理のうち、学習データ生成処理において用いられる基準値の特定を行う処理(以下、基準値特定処理とも呼ぶ)について説明を行う。図19は、第2の実施の形態における基準値特定処理について説明するフローチャート図である。
次に、第2の実施の形態における学習データ生成処理の詳細について説明を行う。図20及び図21は、第2の実施の形態における学習データ生成処理の詳細について説明するフローチャート図である。
次に、第3の実施の形態について説明する。図22から図24は、第3の実施の形態における学習データ生成処理を説明するフローチャート図である。また、図25は、第3の実施の形態における学習データ生成処理を説明する図である。なお、第3の実施の形態における学習データ受付処理及び文献データ受付処理については、第1の実施の形態で説明した場合の処理と同じ内容であるため説明を省略する。
初めに、第3の実施の形態における基準値特定処理について説明を行う。図22は、第3の実施の形態における基準値特定処理について説明するフローチャート図である。
次に、第3の実施の形態における学習データ生成処理の詳細について説明を行う。図23及び図24は、第3の実施の形態における学習データ生成処理の詳細について説明するフローチャート図である。
次に、第4の実施の形態について説明する。図26から図28は、第4の実施の形態における学習データ生成処理を説明するフローチャート図である。また、図29は、第4の実施の形態における学習データ生成処理を説明する図である。なお、第4の実施の形態における学習データ受付処理及び文献データ受付処理については、第1の実施の形態で説明した場合の処理と同じ内容であるため説明を省略する。
初めに、第4の実施の形態における基準値特定処理について説明を行う。図26は、第4の実施の形態における基準値特定処理について説明するフローチャート図である。
次に、第4の実施の形態における学習データ生成処理の詳細について説明を行う。図27及び図28は、第4の実施の形態における学習データ生成処理の詳細について説明するフローチャート図である。
機械学習に用いる学習データを生成する学習データ生成プログラムであって、
所定の対応関係を有する複数の画像を文献から取得し、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定し、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定し、
特定した前記複数の画像を含む学習データを生成する、
処理をコンピュータに実行させることを特徴とする学習データ生成プログラム。
付記1において、
前記所定の対応関係を有する複数の画像は、前記文献において所定の配置関係に従って掲載されている複数の画像である、
ことを特徴とする学習データ生成プログラム。
付記1において、
前記所定の対応関係を有する複数の画像は、前記文献において同一の説明文に対応付けられて掲載されている複数の画像である、
ことを特徴とする学習データ生成プログラム。
付記1において、
前記判定する処理では、
取得した前記複数の画像から第1基準画像を特定し、
前記複数の画像のうちの前記第1基準画像以外の画像毎に、特定した前記第1基準画像と一致しない領域の割合である第1割合を特定し、
特定した前記第1割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成プログラム。
付記4において、
前記判定する処理では、特定した前記特徴量のうちの最大値が第1閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記特徴量のうちの最大値が前記第1閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。
付記4において、さらに、
複数の画像を含む所定の時系列画像から第2基準画像を特定し、
前記所定の時系列画像のうちの前記第2基準画像以外の画像毎に、特定した前記第2基準画像と一致しない領域の割合である第2割合を特定し、
特定した前記第2割合のうちの最大値を基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、前記特徴量のうちの最大値と前記基準値との差分が第2閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第2閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。
付記1において、
前記判定する処理では、
取得した前記複数の画像から第1基準画像を特定し、
前記複数の画像のうちの前記第1基準画像以外の画像毎に、特定した前記第1基準画像と一致する領域の割合である第3割合を特定し、
特定した前記第3割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成プログラム。
付記7において、さらに
複数の画像を含む所定の時系列画像から第2基準画像を特定し、
前記所定の時系列画像のうちの前記第2基準画像以外の画像毎に、特定した前記第2基準画像と一致する領域の第4割合を特定し、
特定した前記第4割合に対応する平面上の点のそれぞれについての二次元の近似直線を生成し、
生成した前記近似直線の傾きを基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、
特定した前記特徴量のそれぞれについての近似直線を生成し、
生成した前記近似直線の傾きと前記基準値との差分が第3閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第3閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。
付記7において、さらに、
複数の画像を含む所定の時系列画像から第2基準画像を特定し、
前記所定の時系列画像のうちの前記第2基準画像以外の画像毎に、特定した前記第2基準画像と一致する領域の第4割合を特定し、
特定した前記第4割合に対応する平面上の点のそれぞれについての二次元の近似曲線を生成し、
生成した前記近似曲線の二回微分値を基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、
特定した前記特徴量のそれぞれについての二次元の近似曲線を生成し、
生成した前記近似曲線の二回微分値と前記基準値との差分が第4閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第4閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。
機械学習に用いる学習データを生成する学習データ生成装置であって、
所定の対応関係を有する複数の画像を文献から取得する画像取得部と、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定する条件判定部と、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定する画像特定部と、
特定した前記複数の画像を含む学習データを生成するデータ生成部と、を有する、
ことを特徴とする学習データ生成装置。
付記10において、
前記条件判定部は、
取得した前記複数の画像から第1基準画像を特定し、
前記複数の画像のうちの前記第1基準画像以外の画像毎に、特定した前記第1基準画像と一致しない領域の第1割合を特定し、
特定した前記第1割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成装置。
付記11において、
前記条件判定部は、特定した前記特徴量のうちの最大値が第1閾値を下回るか否かを判定し、
前記画像特定部は、前記特徴量のうちの最大値が前記第1閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成装置。
機械学習に用いる学習データを生成する学習データ生成方法であって、
所定の対応関係を有する複数の画像を文献から取得し、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定し、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定し、
特定した前記複数の画像を含む学習データを生成する、
ことを特徴とする学習データ生成方法。
付記13において、
前記判定する工程では、
取得した前記複数の画像から第1基準画像を特定し、
前記複数の画像のうちの前記第1基準画像以外の画像毎に、特定した前記第1基準画像と一致しない領域の第1割合を特定し、
特定した前記第1割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成方法。
付記14において、
前記判定する工程では、特定した前記特徴量のうちの最大値が第1閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する工程では、前記特徴量のうちの最大値が前記第1閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成方法。
130:情報格納領域 131:学習データ
NW:ネットワーク
Claims (11)
- 機械学習に用いる学習データを生成する学習データ生成プログラムであって、
所定の対応関係を有する複数の画像を文献から取得し、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定し、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定し、
特定した前記複数の画像を含む学習データを生成する、
処理をコンピュータに実行させることを特徴とする学習データ生成プログラム。 - 請求項1において、
前記所定の対応関係を有する複数の画像は、前記文献において所定の配置関係に従って掲載されている複数の画像である、
ことを特徴とする学習データ生成プログラム。 - 請求項1において、
前記所定の対応関係を有する複数の画像は、前記文献において同一の説明文に対応付けられて掲載されている複数の画像である、
ことを特徴とする学習データ生成プログラム。 - 請求項1において、
前記判定する処理では、
取得した前記複数の画像から第1基準画像を特定し、
前記複数の画像のうちの前記第1基準画像以外の画像毎に、特定した前記第1基準画像と一致しない領域の割合である第1割合を特定し、
特定した前記第1割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成プログラム。 - 請求項4において、
前記判定する処理では、特定した前記特徴量のうちの最大値が第1閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記特徴量のうちの最大値が前記第1閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。 - 請求項4において、さらに、
複数の画像を含む所定の時系列画像から第2基準画像を特定し、
前記所定の時系列画像のうちの前記第2基準画像以外の画像毎に、特定した前記第2基準画像と一致しない領域の割合である第2割合を特定し、
特定した前記第2割合のうちの最大値を基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、前記特徴量のうちの最大値と前記基準値との差分が第2閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第2閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。 - 請求項1において、
前記判定する処理では、
取得した前記複数の画像から第1基準画像を特定し、
前記複数の画像のうちの前記第1基準画像以外の画像毎に、特定した前記第1基準画像と一致する領域の割合である第3割合を特定し、
特定した前記第3割合のそれぞれを前記特徴量として特定する、
ことを特徴とする学習データ生成プログラム。 - 請求項7において、さらに
複数の画像を含む所定の時系列画像から第2基準画像を特定し、
前記所定の時系列画像のうちの前記第2基準画像以外の画像毎に、特定した前記第2基準画像と一致する領域の第4割合を特定し、
特定した前記第4割合に対応する平面上の点のそれぞれについての二次元の近似直線を生成し、
生成した前記近似直線の傾きを基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、
特定した前記特徴量のそれぞれについての近似直線を生成し、
生成した前記近似直線の傾きと前記基準値との差分が第3閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第3閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。 - 請求項7において、さらに、
複数の画像を含む所定の時系列画像から第2基準画像を特定し、
前記所定の時系列画像のうちの前記第2基準画像以外の画像毎に、特定した前記第2基準画像と一致する領域の第4割合を特定し、
特定した前記第4割合に対応する平面上の点のそれぞれについての二次元の近似曲線を生成し、
生成した前記近似曲線の二回微分値を基準値として特定する、
処理をコンピュータに実行させ、
前記判定する処理では、
特定した前記特徴量のそれぞれについての二次元の近似曲線を生成し、
生成した前記近似曲線の二回微分値と前記基準値との差分が第4閾値を下回るか否かを判定し、
前記複数の画像が時系列画像であると特定する処理では、前記差分が前記第4閾値を下回ると判定した場合に、前記複数の画像が時系列画像であると特定する、
ことを特徴とする学習データ生成プログラム。 - 機械学習に用いる学習データを生成する学習データ生成装置であって、
所定の対応関係を有する複数の画像を文献から取得する画像取得部と、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定する条件判定部と、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定する画像特定部と、
特定した前記複数の画像を含む学習データを生成するデータ生成部と、を有する、
ことを特徴とする学習データ生成装置。 - 機械学習に用いる学習データを生成する学習データ生成方法であって、
所定の対応関係を有する複数の画像を文献から取得し、
取得した前記複数の画像における特徴量の一致度合が所定の条件を満たすか否かを判定し、
前記所定の条件を満たすと判定した場合、取得した前記複数の画像が時系列画像であると特定し、
特定した前記複数の画像を含む学習データを生成する、
ことを特徴とする学習データ生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018212093A JP7148794B2 (ja) | 2018-11-12 | 2018-11-12 | 学習データ生成プログラム、学習データ生成装置及び学習データ生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018212093A JP7148794B2 (ja) | 2018-11-12 | 2018-11-12 | 学習データ生成プログラム、学習データ生成装置及び学習データ生成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020079984A JP2020079984A (ja) | 2020-05-28 |
JP7148794B2 true JP7148794B2 (ja) | 2022-10-06 |
Family
ID=70801793
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018212093A Active JP7148794B2 (ja) | 2018-11-12 | 2018-11-12 | 学習データ生成プログラム、学習データ生成装置及び学習データ生成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7148794B2 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017109854A1 (ja) | 2015-12-22 | 2017-06-29 | オリンパス株式会社 | 学習画像自動選別装置、学習画像自動選別方法および学習画像自動選別プログラム |
JP2018124617A (ja) | 2017-01-30 | 2018-08-09 | 三菱重工業株式会社 | 教師データ収集装置、教師データ収集方法、及びプログラム |
-
2018
- 2018-11-12 JP JP2018212093A patent/JP7148794B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017109854A1 (ja) | 2015-12-22 | 2017-06-29 | オリンパス株式会社 | 学習画像自動選別装置、学習画像自動選別方法および学習画像自動選別プログラム |
JP2018124617A (ja) | 2017-01-30 | 2018-08-09 | 三菱重工業株式会社 | 教師データ収集装置、教師データ収集方法、及びプログラム |
Non-Patent Citations (1)
Title |
---|
数藤 恭子,外3名,レシピのテキスト及び画像特徴の学習による画像からの素材・調理法の推定,電子情報通信学会技術研究報告,一般社団法人電子情報通信学会,2013年08月26日,第113巻,第197号,p.195-200 |
Also Published As
Publication number | Publication date |
---|---|
JP2020079984A (ja) | 2020-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101861198B1 (ko) | 디지털 이미지의 시맨틱 태그의 획득 방법 및 장치 | |
Cliche et al. | Scatteract: Automated extraction of data from scatter plots | |
US20160210749A1 (en) | Method and system for cross-domain synthesis of medical images using contextual deep network | |
CN109886928B (zh) | 一种目标细胞标记方法、装置、存储介质及终端设备 | |
US11321559B2 (en) | Document structure identification using post-processing error correction | |
US9501687B2 (en) | Predictive modeling relating molecular imaging modalities | |
CN109086834B (zh) | 字符识别方法、装置、电子设备及存储介质 | |
CN113744394B (zh) | 鞋楦三维建模方法、装置、设备及存储介质 | |
Gutierrez-Becker et al. | Guiding multimodal registration with learned optimization updates | |
CN112102294A (zh) | 生成对抗网络的训练方法及装置、图像配准方法及装置 | |
CN113095187A (zh) | 一种基于图像特征匹配对齐的试卷批改方法 | |
CN112819073A (zh) | 分类网络训练、图像分类方法、装置和电子设备 | |
GB2511686A (en) | Medical-image retrieval method, device, and computer program | |
CN111914841B (zh) | 一种ct图像处理方法和装置 | |
CN107590806B (zh) | 一种基于大脑医学成像的检测方法和系统 | |
JP7148794B2 (ja) | 学習データ生成プログラム、学習データ生成装置及び学習データ生成方法 | |
CN111626313B (zh) | 一种特征提取模型训练方法、图像处理方法及装置 | |
CN109040781B (zh) | 视频认证方法、装置、系统、电子设备及可读介质 | |
CN116597246A (zh) | 模型训练方法、目标检测方法、电子设备及存储介质 | |
US20230130674A1 (en) | Computer-readable recording medium storing learning program, learning method, and information processing apparatus | |
JP6017005B2 (ja) | 画像検索装置、画像検索方法及びプログラム | |
CN114372970A (zh) | 一种手术参考信息生成方法及装置 | |
CN114241198A (zh) | 获取局部影像组学特征的方法、装置、设备以及存储介质 | |
JP5188290B2 (ja) | アノテーション装置、アノテーション方法およびプログラム | |
Zhang et al. | HiCPlus: resolution enhancement of Hi-C interaction heatmap |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220726 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220823 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220905 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7148794 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |