JP2021174117A - 学習装置、代表画像抽出装置及びプログラム - Google Patents
学習装置、代表画像抽出装置及びプログラム Download PDFInfo
- Publication number
- JP2021174117A JP2021174117A JP2020075676A JP2020075676A JP2021174117A JP 2021174117 A JP2021174117 A JP 2021174117A JP 2020075676 A JP2020075676 A JP 2020075676A JP 2020075676 A JP2020075676 A JP 2020075676A JP 2021174117 A JP2021174117 A JP 2021174117A
- Authority
- JP
- Japan
- Prior art keywords
- program
- image
- score
- learning
- learning data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims description 49
- 238000013528 artificial neural network Methods 0.000 claims abstract description 104
- 238000004364 calculation method Methods 0.000 claims abstract description 64
- 238000005070 sampling Methods 0.000 claims abstract description 38
- 238000012545 processing Methods 0.000 claims description 53
- 230000015654 memory Effects 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 7
- 238000012549 training Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 abstract description 76
- 238000010586 diagram Methods 0.000 abstract description 17
- 238000000034 method Methods 0.000 description 25
- 238000011176 pooling Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】学習装置1の番組学習データ生成部10は、学習用番組映像をサンプリングした番組画像について、番組HPから取得した静止画との間の類似度を算出し、類似度に基づいて正解スコアを付与し、番組画像及び正解スコアからなる番組学習データを生成する。芸術性学習データ生成部12は、芸術性評価オープンデータを用いて、芸術性評価画像及び正解スコアからなる芸術性学習データを生成する。学習部14のNN部31は、ニューラルネットワークを用いて、番組画像または芸術性評価画像から1次元のスコアを算出し、誤差算出部32は、スコアと正解スコアとの間の誤差を算出する。パラメータ更新部33は、番組画像の誤差及び芸術性評価画像の誤差の和が小さくなるように、ニューラルネットワークのパラメータを更新する。
【選択図】図1
Description
〔学習装置〕
まず、本発明の実施形態による学習装置について説明する。図1は、本発明の実施形態による学習装置の構成例を示すブロック図である。
次に、図1に示した番組学習データ生成部10について詳細に説明する。図2は、番組学習データ生成部10の構成例を示すブロック図であり、図3は、番組学習データ生成部10の処理例を示すフローチャートである。この番組学習データ生成部10は、サンプリング処理部20、ダウンロード処理部21、類似度算出部22及び正解スコア付与部23を備えている。
次に、図1に示した芸術性学習データ生成部12について詳細に説明する。図5は、芸術性学習データ生成部12の構成例を示すブロック図である。この芸術性学習データ生成部12は、正解スコア付与部25を備えている。
次に、図1に示した学習部14について詳細に説明する。図6は、学習部14の構成例を示すブロック図であり、図7は、学習部14の処理例を示すフローチャートである。
次に、図6に示したNN部31について詳細に説明する。図8は、NN部31の構成例を示すブロック図である。このNN部31は、特徴抽出用NN40及びスコア算出用NN41を備えて構成される。
次に、図1に示した学習装置1により学習されたニューラルネットワークを用いて、番組映像から代表画像を抽出する代表画像抽出装置について説明する。図10は、本発明の実施形態による代表画像抽出装置の構成例を示すブロック図である。
次に、図10に示した代表画像抽出装置2を用いた実施例について説明する。図11は、代表画像抽出装置2を用いた第1実施例の番組HP作成システムを説明する図である。この番組HP作成システム3は、番組HPの作成対象である番組についての番組EPG(Electronic Programming Guide:電子番組表)情報及び番組映像を用いて、番組HPを作成するシステムである。
2 代表画像抽出装置
3 番組HP作成システム
4 番組DVD販売HP作成システム
10 番組学習データ生成部
11,13 メモリ
12 芸術性学習データ生成部
14 学習部
20 サンプリング処理部
21 ダウンロード処理部
22 類似度算出部
23,24,25 正解スコア付与部
30 切り替え部
31 NN(ニューラルネットワーク)部
32 誤差算出部
33 パラメータ更新部
40 特徴抽出用NN
41 スコア算出用NN
50 サンプリング処理部
51 スコア算出部
52 選択部
100 要約映像生成部
101,102 自動配置処理部
P1,・・・,PN,Pn 番組画像
P’1,・・・,P’M,P’m 静止画
Sn,m 類似度
B 最大値
Claims (7)
- ニューラルネットワークを学習する学習装置において、
学習用番組映像をサンプリングして得られるフレーム画像を番組画像とし、前記番組画像に付与された複数段階のうちのいずれかの段階のスコアを第1正解スコアとし、所定画像に付与された複数段階のうちのいずれかの段階のスコアを第2正解スコアとし、前記ニューラルネットワークを、前記番組画像及び前記所定画像が交互に入力され、1次元のスコアが出力されるモデルとして、
前記番組画像及び前記第1正解スコアからなる番組学習データ、並びに前記所定画像及び前記第2正解スコアからなる所定学習データが格納されたメモリと、
前記メモリから前記番組学習データ及び前記所定学習データを読み出し、前記番組学習データ及び前記所定学習データを用いて、前記ニューラルネットワークを学習する学習部と、を備え、
前記学習部は、
前記ニューラルネットワークを用いて、前記番組学習データに含まれる前記番組画像から前記番組画像の1次元のスコアを第1スコアとして算出し、前記ニューラルネットワークを用いて、前記所定学習データに含まれる前記所定画像から前記所定画像の1次元のスコアを第2スコアとして算出するニューラルネットワーク部と、
前記ニューラルネットワーク部により算出された前記第1スコアと前記番組学習データに含まれる前記第1正解スコアとの間の誤差を第1誤差として算出し、前記第2スコアと前記所定学習データに含まれる前記第2正解スコアとの間の誤差を第2誤差として算出する誤差算出部と、
前記誤差算出部により算出された前記第1誤差及び前記第2誤差の和が小さくなるように、前記ニューラルネットワークのパラメータを更新するパラメータ更新部と、を備えたことを特徴とする学習装置。 - 請求項1に記載の学習装置において、
さらに、前記番組学習データを生成する番組学習データ生成部を備え、
前記番組学習データ生成部は、
前記学習用番組映像を前記番組画像にサンプリングするサンプリング処理部と、
前記学習用番組映像に対応した番組のホームページのURLへアクセスし、前記番組の静止画をダウンロードするダウンロード処理部と、
前記サンプリング処理部によりサンプリングされた前記番組画像について、前記ダウンロード処理部によりダウンロードされた前記静止画との間の類似度を算出する類似度算出部と、
前記類似度算出部により算出された前記類似度に基づいて、前記番組画像に対して前記第1正解スコアを付与し、前記番組画像及び前記第1正解スコアからなる前記番組学習データを前記メモリに格納する第1正解スコア付与部と、を備えたことを特徴とする学習装置。 - 請求項2に記載の学習装置において、
前記所定学習データを生成する所定学習データ生成部を備え、
前記所定学習データ生成部は、
前記所定画像、及び前記所定画像に対して予め付与された複数段階のうちのいずれかの段階のラベルからなるオープンデータを入力し、前記ラベルを前記第2正解スコアに変換することで、前記所定画像に対して前記第2正解スコアを付与し、前記所定画像及び前記第2正解スコアからなる前記所定学習データを前記メモリに格納する第2正解スコア付与部を備えたことを特徴とする学習装置。 - 請求項1から3までのいずれか一項に記載の学習装置において、
前記番組学習データの数をA個(Aは正の整数)、前記所定学習データの数をB個(Bは正の整数)、A<Bとし、B個からA個を減算した結果を(B−A)として、
前記学習部は、
A個の前記番組学習データ、及び、前記所定学習データに対する前記番組学習データの不足分である(B−A)個のデータであって、A個の前記番組学習データのいずれかまたは全てを用いて補充された前記番組学習データ、並びにB個の前記所定学習データを用いて、前記ニューラルネットワークを学習する、ことを特徴とする学習装置。 - 番組映像から代表画像を抽出する代表画像抽出装置において、
前記番組映像をフレーム画像にサンプリングし、前記フレーム画像を番組画像として出力するサンプリング処理部と、
請求項1から4までのいずれか一項の学習装置により学習されたニューラルネットワークを用いて、前記サンプリング処理部により出力された前記番組画像から、前記番組画像の1次元のスコアを算出するスコア算出部と、
前記スコア算出部により算出された前記スコアに基づいて、前記サンプリング処理部により前記番組映像がサンプリングされて出力された全ての前記番組画像から、前記代表画像を選択する選択部と、を備えたことを特徴とする代表画像抽出装置。 - コンピュータを、請求項1から4までのいずれか一項に記載の学習装置として機能させるためのプログラム。
- コンピュータを、請求項5に記載の代表画像抽出装置として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020075676A JP7441107B2 (ja) | 2020-04-21 | 2020-04-21 | 学習装置、代表画像抽出装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020075676A JP7441107B2 (ja) | 2020-04-21 | 2020-04-21 | 学習装置、代表画像抽出装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021174117A true JP2021174117A (ja) | 2021-11-01 |
JP7441107B2 JP7441107B2 (ja) | 2024-02-29 |
Family
ID=78281852
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020075676A Active JP7441107B2 (ja) | 2020-04-21 | 2020-04-21 | 学習装置、代表画像抽出装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7441107B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230196775A1 (en) * | 2020-05-27 | 2023-06-22 | Nec Corporation | Video processing device, video processing method, training device, training method, and recording medium |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6954219B2 (ja) | 2018-04-09 | 2021-10-27 | トヨタ自動車株式会社 | 機械学習装置 |
JP7011170B2 (ja) | 2018-06-05 | 2022-01-26 | 日本電信電話株式会社 | 提供クレジット表示検出装置、提供クレジット表示検出方法及びプログラム |
-
2020
- 2020-04-21 JP JP2020075676A patent/JP7441107B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230196775A1 (en) * | 2020-05-27 | 2023-06-22 | Nec Corporation | Video processing device, video processing method, training device, training method, and recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP7441107B2 (ja) | 2024-02-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109446430B (zh) | 产品推荐的方法、装置、计算机设备及可读存储介质 | |
CN109117777B (zh) | 生成信息的方法和装置 | |
CN108228703B (zh) | 图像问答方法、装置、系统和存储介质 | |
CN110069709B (zh) | 意图识别方法、装置、计算机可读介质及电子设备 | |
US9910829B2 (en) | Automatic document separation | |
US20160253597A1 (en) | Content-aware domain adaptation for cross-domain classification | |
CN114283350B (zh) | 视觉模型训练和视频处理方法、装置、设备及存储介质 | |
CN109271542A (zh) | 封面确定方法、装置、设备及可读存储介质 | |
CN114443899A (zh) | 视频分类方法、装置、设备及介质 | |
US20200210776A1 (en) | Question answering method, terminal, and non-transitory computer readable storage medium | |
CN109784368A (zh) | 一种应用程序分类的确定方法和装置 | |
CN115115049A (zh) | 神经网络模型的训练方法、装置、设备、介质及程序产品 | |
CN111898704B (zh) | 对内容样本进行聚类的方法和装置 | |
CN118014703B (zh) | 基于数字化平台的可视化智能决策系统及方法 | |
CN111125457A (zh) | 一种深度跨模态哈希检索方法及装置 | |
EP4089568A1 (en) | Cascade pooling for natural language document processing | |
CN118535737B (zh) | 一种基于文本分类进行地址分类的快速微调方法及系统 | |
CN118504663A (zh) | 微调数据筛选方法、装置、计算机设备和可读存储介质 | |
CN110796260A (zh) | 一种基于类扩张学习的神经网络模型优化方法 | |
JP2021174117A (ja) | 学習装置、代表画像抽出装置及びプログラム | |
CN119202826A (zh) | 融合视觉预训练模型的sku智能分类与标签生成方法 | |
CN112528897A (zh) | 人像的年龄估测方法、装置、计算机设备及存储介质 | |
CN115878891A (zh) | 直播内容生成方法、装置、设备以及计算机存储介质 | |
CN111159397B (zh) | 文本分类方法和装置、服务器 | |
JP7594474B2 (ja) | 学習装置、代表画像抽出装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230301 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7441107 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |