JP2020135432A - 学習データの生成方法、学習データ生成装置及びプログラム - Google Patents
学習データの生成方法、学習データ生成装置及びプログラム Download PDFInfo
- Publication number
- JP2020135432A JP2020135432A JP2019028270A JP2019028270A JP2020135432A JP 2020135432 A JP2020135432 A JP 2020135432A JP 2019028270 A JP2019028270 A JP 2019028270A JP 2019028270 A JP2019028270 A JP 2019028270A JP 2020135432 A JP2020135432 A JP 2020135432A
- Authority
- JP
- Japan
- Prior art keywords
- data
- image
- still image
- still
- combination
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000012549 training Methods 0.000 claims description 62
- 238000003062 neural network model Methods 0.000 claims description 32
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 17
- 238000012217 deletion Methods 0.000 description 11
- 230000037430 deletion Effects 0.000 description 11
- 239000004223 monosodium glutamate Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
==全体構成==
図1に、本発明の一実施形態に係る学習データ生成装置200及びユーザ端末100を含む情報システム1000を示す。学習データ生成装置200及びユーザ端末100は、インターネットやLAN(Local Area Network)、電話網等のネットワーク500を通じて通信可能に接続されている。
1の類似性(相違の程度)を判定し、冗長な静止画像630を特定する。
まずユーザ端末100について図2を参照しながら説明する。
30、記憶装置140、入力装置150、出力装置160、及び記録媒体読取装置170を備えて構成されるスマートフォンやパソコンなどのコンピュータである。
ラッシュメモリ等の不揮発性の記憶装置である。
ダウンロードするようにすることができる。
学習データ生成装置200は、動画データ620から学習データ640を生成するコンピュータである。学習データ生成装置200は、図3に示す様に、CPU210、メモリ220、通信装置230、記憶装置240、入力装置250、出力装置260、及び記録媒体読取装置270を備えて構成される。これらの学習データ生成装置200のハードウェア構成は、ユーザ端末100のハードウェア構成と必ずしも同じではないものの、基本的な構成は共通である。そのため、これらのハードウェア構成についての重複した説明は省略する。
次に学習データ生成装置200の機能構成図の一例を図7に示す。本実施形態に係る学習データ生成装置200は、動画データ取得部201、及び学習データ生成部202の各機能を含む。
次に、本実施形態に係る情報システム1000による処理の流れを、図8〜図15を参照しながら説明する。
620を取得しても良いし、ユーザ端末100からの指示により不図示の他のコンピュータから取得しても良い。
の類似性(相違の程度)を判定する際の判定値である。本実施形態では、2枚の静止画像621の各ベクトルデータ651の差分のノルム(例えば各ベクトルデータ651のユークリッド距離)が閾値A以下である場合に、これら2枚の静止画像621は類似していると判定される。
な静止画像630として取り除かれる静止画像621の枚数が減少し、学習データ640のデータ量が増加する。
により動画データ620から冗長な静止画像630を取り除くことができる。
21)と他の静止画像621(図10において符号j,j+1,…,MAXが付された静止画像621)との組み合わせの中に、2つの静止画像621の相違の程度を表す指標値が所定の判定値(閾値A)以下となる組み合わせがある場合に、上記一の静止画像621を冗長な静止画像630として取り除く処理を、動画データ620に含まれる各静止画像621を順に上記一の静止画像621として繰り返し行うことにより、学習データ640を生成するようにする処理である。
ベクトルデータ651のユークリッド距離を算出する。
装置200は、制御変数jに1を加えて(S2040)、i番目の静止画像621と次のj番目の
静止画像621との間で同様の処理を行う(S2020、S2030)。
静止画像621との比較を終えたので、学習データ生成装置200は、iに1を加える(S2070)。
ークリッド距離が閾値Aよりも小さい場合にi番目の静止画像621を削除する処理を繰
り返し行う。
ータ生成装置200は、それらの組み合わせの中でノルムが最小の組み合わせ(上述した例でαで示した組み合わせ)を特定する(S3020)。
なお、学習データ生成装置200は、図14及び図15に示すような態様で処理を行っても良い。
力し、それぞれのベクトルデータ651を求める(S4020)。そして学習データ生成装置
200は、閾値Aを求める(S4030)。以上の処理は、第1実施形態と同様である。
学習データ生成装置200は、学習データ640をユーザ端末100に送信する。
習を行う際の作業効率をさらに向上させることが可能となる。
110 CPU
120 メモリ
130 通信装置
140 記憶装置
150 入力装置
160 出力装置
170 記録媒体読取装置
200 学習データ生成装置
201 動画データ取得部
202 学習データ生成部
210 CPU
220 メモリ
230 通信装置
240 記憶装置
250 入力装置
260 出力装置
270 記録媒体読取装置
500 ネットワーク
600 ニューラルネットワークモデル
610 画像認識モデル
620 動画データ
621 静止画像
630 冗長な静止画像
640 学習データ
650 特徴量
651 ベクトルデータ
710 ユーザ端末制御プログラム
720 学習データ生成装置制御プログラム
800 記録媒体
1000 情報システム
Claims (8)
- 画像認識用のモデルの学習を行うための学習データの生成方法であって、
コンピュータが、
前記画像認識の対象が撮影されている動画データを取得する処理と、
前記動画データに含まれる各フレームの静止画像の中から2つの静止画像を選ぶ組み合わせ毎に、前記2つの静止画像の相違の程度を表す指標値を求め、前記指標値を元に、前記動画データに含まれる静止画像から冗長な静止画像を取り除くことにより、前記学習データを生成する処理と、
を実行する、学習データの生成方法。 - 請求項1に記載の学習データの生成方法であって、
前記コンピュータが、前記学習データを生成する処理において、前記動画データに含まれる各静止画像の特徴量を求め、前記各組み合わせ毎に、前記組み合わせを成す2つの静止画像の前記特徴量の差分を前記指標値として求める、学習データの生成方法。 - 請求項2に記載の学習データの生成方法であって、
前記画像認識用のモデルは、第1のニューラルネットワークモデルであり、
前記コンピュータが、前記学習データを生成する処理において、前記第1のニューラルネットワークモデルと同じ種類の第2のニューラルネットワークモデルに前記動画データに含まれる各静止画像を入力し、前記第2のニューラルネットワークモデル内の中間層からの出力データを用いて前記特徴量を求める、学習データの生成方法。 - 請求項1に記載の学習データの生成方法であって、
前記コンピュータが、前記学習データを生成する処理において、一の静止画像と他の静止画像との前記組み合わせの中に、前記指標値が所定の判定値以下となる組み合わせがある場合に、前記一の静止画像を前記冗長な静止画像として取り除く処理を、前記動画データに含まれる各静止画像を順に前記一の静止画像として繰り返し行うことにより、前記学習データを生成する、学習データの生成方法。 - 請求項1に記載の学習データの生成方法であって、
前記コンピュータが、前記学習データを生成する処理において、前記各組み合わせの中から、前記指標値が最小の第1の組み合わせを特定した上で、さらに、前記第1の組み合わせを成す2つの静止画像のうちの一つを含む他の組み合わせの中で前記指標値が最小の第2の組み合わせを特定し、前記第1の組み合わせと前記第2の組み合わせに共通する静止画像を、前記冗長な静止画像として取り除く処理を、前記指標値が所定の判定値以下となる組み合わせがなくなるまで繰り返し行うことにより、前記学習データを生成する、学習データの生成方法。 - 請求項1に記載の学習データの生成方法であって、
前記コンピュータが、前記学習データを生成する処理において、前記動画データに含まれる静止画像を時系列順に複数のグループに分け、前記グループ単位に、前記冗長な静止画像を取り除く処理を行うことにより中間データを生成した後に、前記中間データの全体に対してさらに前記冗長な静止画像を取り除く処理を行うことにより、前記学習データを生成する、学習データの生成方法。 - 画像認識用のモデルの学習を行うための学習データを生成する学習データ生成装置であって、
前記画像認識の対象が撮影されている動画データを取得する動画データ取得部と、
前記動画データに含まれる各フレームの静止画像の中から2つの静止画像を選ぶ組み合
わせ毎に、前記2つの静止画像の相違の程度を表す指標値を求め、前記指標値を元に、前記動画データに含まれる静止画像から冗長な静止画像を取り除くことにより、前記学習データを生成する学習データ生成部と、
を備える、学習データ生成装置。 - 画像認識用のモデルの学習を行うための学習データを生成するコンピュータに、
前記画像認識の対象が撮影されている動画データを取得する手順と、
前記動画データに含まれる各フレームの静止画像の中から2つの静止画像を選ぶ組み合わせ毎に、前記2つの静止画像の相違の程度を表す指標値を求め、前記指標値を元に、前記動画データに含まれる静止画像から冗長な静止画像を取り除くことにより、前記学習データを生成する手順と、
を実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019028270A JP7168485B2 (ja) | 2019-02-20 | 2019-02-20 | 学習データの生成方法、学習データ生成装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019028270A JP7168485B2 (ja) | 2019-02-20 | 2019-02-20 | 学習データの生成方法、学習データ生成装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020135432A true JP2020135432A (ja) | 2020-08-31 |
JP7168485B2 JP7168485B2 (ja) | 2022-11-09 |
Family
ID=72263191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019028270A Active JP7168485B2 (ja) | 2019-02-20 | 2019-02-20 | 学習データの生成方法、学習データ生成装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7168485B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113034347A (zh) * | 2021-03-23 | 2021-06-25 | 广东南方数码科技股份有限公司 | 倾斜摄影图像处理方法、装置、处理设备及存储介质 |
WO2022264677A1 (ja) * | 2021-06-16 | 2022-12-22 | パナソニックIpマネジメント株式会社 | 学習データ生成システム、学習データ生成方法、及びプログラム |
WO2024176573A1 (ja) * | 2023-02-21 | 2024-08-29 | 日本電気株式会社 | データ拡張装置、データ拡張方法、及びプログラム |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03196277A (ja) * | 1989-12-25 | 1991-08-27 | Takayama:Kk | データ処理装置のための特徴データ選択方法 |
JPWO2008041401A1 (ja) * | 2006-10-02 | 2010-02-04 | オリンパス株式会社 | 画像処理装置、画像処理方法、および画像処理プログラム |
JP2011008676A (ja) * | 2009-06-29 | 2011-01-13 | Olympus Corp | 画像抽出装置、画像抽出方法および画像抽出プログラム |
JP2017062781A (ja) * | 2015-09-22 | 2017-03-30 | ゼロックス コーポレイションXerox Corporation | 深層cnnプーリング層を特徴として用いる、類似度に基づく重要な対象の検知 |
JP2017224184A (ja) * | 2016-06-16 | 2017-12-21 | 株式会社日立製作所 | 機械学習装置 |
JPWO2017109854A1 (ja) * | 2015-12-22 | 2018-10-11 | オリンパス株式会社 | 学習画像自動選別装置、学習画像自動選別方法および学習画像自動選別プログラム |
JP2018200531A (ja) * | 2017-05-26 | 2018-12-20 | 富士通株式会社 | 教師データ生成装置、教師データ生成方法、教師データ生成プログラム、及び物体検出システム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008041401A (ja) | 2006-08-04 | 2008-02-21 | Toshiba Corp | 燃料電池 |
JP6087417B1 (ja) | 2015-12-18 | 2017-03-01 | 株式会社不二鉄工所 | 繰出装置 |
-
2019
- 2019-02-20 JP JP2019028270A patent/JP7168485B2/ja active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03196277A (ja) * | 1989-12-25 | 1991-08-27 | Takayama:Kk | データ処理装置のための特徴データ選択方法 |
JPWO2008041401A1 (ja) * | 2006-10-02 | 2010-02-04 | オリンパス株式会社 | 画像処理装置、画像処理方法、および画像処理プログラム |
JP2011008676A (ja) * | 2009-06-29 | 2011-01-13 | Olympus Corp | 画像抽出装置、画像抽出方法および画像抽出プログラム |
JP2017062781A (ja) * | 2015-09-22 | 2017-03-30 | ゼロックス コーポレイションXerox Corporation | 深層cnnプーリング層を特徴として用いる、類似度に基づく重要な対象の検知 |
JPWO2017109854A1 (ja) * | 2015-12-22 | 2018-10-11 | オリンパス株式会社 | 学習画像自動選別装置、学習画像自動選別方法および学習画像自動選別プログラム |
JP2017224184A (ja) * | 2016-06-16 | 2017-12-21 | 株式会社日立製作所 | 機械学習装置 |
JP2018200531A (ja) * | 2017-05-26 | 2018-12-20 | 富士通株式会社 | 教師データ生成装置、教師データ生成方法、教師データ生成プログラム、及び物体検出システム |
Non-Patent Citations (1)
Title |
---|
福井 宏 ほか: "Deep Learningを用いた歩行者検出の研究動向", 電子情報通信学会技術研究報告 パターン認識・メディア理解, vol. 116, no. 366, JPN6022027876, 8 December 2016 (2016-12-08), pages 37 - 46, ISSN: 0004817552 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113034347A (zh) * | 2021-03-23 | 2021-06-25 | 广东南方数码科技股份有限公司 | 倾斜摄影图像处理方法、装置、处理设备及存储介质 |
CN113034347B (zh) * | 2021-03-23 | 2023-07-25 | 广东南方数码科技股份有限公司 | 倾斜摄影图像处理方法、装置、处理设备及存储介质 |
WO2022264677A1 (ja) * | 2021-06-16 | 2022-12-22 | パナソニックIpマネジメント株式会社 | 学習データ生成システム、学習データ生成方法、及びプログラム |
WO2024176573A1 (ja) * | 2023-02-21 | 2024-08-29 | 日本電気株式会社 | データ拡張装置、データ拡張方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7168485B2 (ja) | 2022-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110532984B (zh) | 关键点检测方法、手势识别方法、装置及系统 | |
CN109697434B (zh) | 一种行为识别方法、装置和存储介质 | |
CN108140032B (zh) | 用于自动视频概括的设备和方法 | |
CN106934376B (zh) | 一种图像识别方法、装置及移动终端 | |
CN110276406B (zh) | 表情分类方法、装置、计算机设备及存储介质 | |
JP7168485B2 (ja) | 学習データの生成方法、学習データ生成装置及びプログラム | |
US10387804B2 (en) | Implementations of, and methods of use for a pattern memory engine applying associative pattern memory for pattern recognition | |
US10713471B2 (en) | System and method for simulating facial expression of virtual facial model | |
US11704563B2 (en) | Classifying time series image data | |
KR102663375B1 (ko) | 음성 및 영상 자동 포커싱 방법 및 장치 | |
CN112183166A (zh) | 确定训练样本的方法、装置和电子设备 | |
JP2019086475A (ja) | 学習プログラム、検出プログラム、学習方法、検出方法、学習装置および検出装置 | |
WO2021200392A1 (ja) | データ調整システム、データ調整装置、データ調整方法、端末装置及び情報処理装置 | |
US20230316809A1 (en) | Facial Emotion Recognition System | |
KR102274581B1 (ko) | 개인화된 hrtf 생성 방법 | |
JP5436142B2 (ja) | 画像処理装置、画像処理システムおよび画像処理装置の制御方法 | |
JP7205646B2 (ja) | 出力方法、出力プログラム、および出力装置 | |
WO2018211602A1 (ja) | 学習装置、推定装置、学習方法及びプログラム | |
JP6926279B1 (ja) | 学習装置、認識装置、学習方法、認識方法、プログラム、及び再帰型ニューラルネットワーク | |
KR102563522B1 (ko) | 사용자의 얼굴을 인식하는 장치, 방법 및 컴퓨터 프로그램 | |
US11216667B2 (en) | Information processing apparatus, method for information processing, and storage medium | |
JP2019086473A (ja) | 学習プログラム、検出プログラム、学習方法、検出方法、学習装置および検出装置 | |
Vandana et al. | Neural network based biometric attendance system | |
WO2020217425A1 (ja) | 教師データ生成装置 | |
KR102251858B1 (ko) | 딥러닝 기반의 영상분석 방법, 시스템 및 휴대 단말 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210624 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220705 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220707 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221025 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221027 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7168485 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |