JP2016006478A - 顕著度画像生成装置、方法、及びプログラム - Google Patents
顕著度画像生成装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2016006478A JP2016006478A JP2014265444A JP2014265444A JP2016006478A JP 2016006478 A JP2016006478 A JP 2016006478A JP 2014265444 A JP2014265444 A JP 2014265444A JP 2014265444 A JP2014265444 A JP 2014265444A JP 2016006478 A JP2016006478 A JP 2016006478A
- Authority
- JP
- Japan
- Prior art keywords
- image
- saliency
- basic
- time
- acoustic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】画像基礎顕著度画像算出部1は、入力画像の中で各画素について顕著な特性を持つ度合いを表示した基礎顕著度画像の集合を算出する。音響顕著度信号算出部2は、入力音響信号が顕著な特性を持つ度合いを時刻ごとに示した信号である音響顕著度信号を算出する。画像基礎顕著度選択部3は、画像基礎顕著度画像の集合及び音響顕著度信号に基づいて、音響顕著度が大きな時間区間における主要画像基礎顕著度成分を選択する。画像顕著度画像算出部4は、画像基礎顕著度画像の集合、主要画像基礎顕著度成分及び音響顕著度信号に基づいて、入力画像の各画素位置における顕著度を表示した顕著度画像を算出する。顕著度映像算出部5は、各時刻で算出された顕著度画像を連結した顕著度映像を算出する。
【選択図】図1
Description
本発明は上記の状況を鑑みてなされたものであり、以下の2点により上記の問題を解決する注視位置推定を実現するものである。
1.音響信号から算出される顕著性が大きな映像区間を検出し、その映像区間における主要な画像信号成分を選択する。これにより、顕著な音響信号と相関の強い画像信号成分を選択的に抽出することが可能となる。
2.画像信号から顕著性を算出する際に、1.で選択された画像信号成分を強調する。これにより、音響信号に起因する視覚的顕著性の算出を行うことが可能となる。
上記の通り、画像基礎顕著度画像抽出部15は、輝度基礎顕著度画像、色基礎顕著度画像、方向基礎顕著度画像、点滅基礎顕著度画像、及び運動基礎顕著度画像をそれぞれ基礎顕著度画像として、これら基礎顕著度画像の集合を、画像基礎顕著度選択部3及び画像顕著度画像算出部4に出力する(図2及び図4参照)。これにより、図6のステップ15Sの画像基礎顕著度画像抽出処理が終了する。
とする。
まず、準備として、基礎顕著度画像
以上の記号を用いて、時刻tの顕著度画像S(t)は以下のように算出される。
また、画像顕著度画像算出部4が、後述する第3の実施の形態で説明する方法を用いて、顕著度画像を算出してもよい。
次に、第2の実施の形態に係る注視位置推定装置について説明する。なお、第1の実施の形態と同様の構成となる部分には、同一符号を付して説明を省略する。
指数平滑法では,2つの時系列信号が同時正規分布に従って生成されていると仮定して、時系列信号の予測を行う。2つの時系列信号を
画像顕著度画像算出部4は、入力された画像基礎顕著度画像の集合、主要画像基礎顕著度成分及び必要であれば音響顕著度信号に基づいて、入力画像の各位置における顕著度を表示した画像である顕著度画像を出力する。
顕著度画像生成装置及び注視位置推定装置の各々の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、顕著度画像生成装置及び注視位置推定装置の各々に係る上述した種々の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
1 画像基礎顕著度画像算出部
2 音響顕著度信号算出部
3 画像基礎顕著度選択部
4 画像顕著度画像算出部
5 顕著度映像算出部
11 画像基礎特徴量画像抽出部
12 画像多重解像度画像抽出部
13 画像解像度差分画像抽出部
14 画像時間差分画像抽出部
15 画像基礎顕著度画像抽出部
21 音響基礎特徴量抽出部
22 音響顕著度信号抽出部
111 輝度特徴画像抽出部
112 色特徴画像抽出部
113 方向特徴画像抽出部
114 点滅特徴画像抽出部
115 運動特徴画像抽出部
Claims (8)
- 入力映像を構成する各時刻のフレームの入力画像について、複数の特徴種別の各々に対し、前記入力画像における顕著な特性を有する度合いを示す基礎顕著度画像を生成し、基礎顕著度画像の集合とする画像基礎顕著度画像抽出部と、
前記入力映像を構成する音響信号について、各時刻における顕著な特性を有する度合いを示す音響顕著度信号を生成する音響顕著度信号算出部と、
前記複数の特徴種別の各々に対し、各時刻及び各画素について、前記時刻のフレームについての前記基礎顕著度画像の集合に含まれる前記特徴種別に対する基礎顕著度画像の前記画素と、前記時刻における音響顕著度信号との相関を算出し、前記複数の特徴種別の各々に対する、各時刻及び各画素についての前記相関に基づいて、主要画像基礎顕著度成分を生成する画像基礎顕著度選択部と、
各時刻のフレームについての前記基礎顕著度画像の集合と、前記主要画像基礎顕著度成分とに基づいて、各時刻のフレームの入力画像の各位置における顕著度を示す顕著度画像を生成する画像顕著度画像算出部と、
を含む顕著度画像生成装置。 - 前記画像基礎顕著度選択部は、前記複数の特徴種別の各々に対し、各時刻及び各画素について、前記時刻のフレームについての前記基礎顕著度画像の集合に含まれる前記特徴種別に対する基礎顕著度画像の前記画素と、前記時刻における音響顕著度信号との相関を示す相関値を算出し、前記複数の特徴種別の各々に対し、前記相関値が閾値を上回る回数を算出し、前記回数が閾値よりも大きくなる前記特徴種別からなる主要画像基礎顕著度成分を生成する請求項1記載の顕著度画像生成装置。
- 前記画像基礎顕著度選択部は、前記複数の特徴種別の各々に対し、各時刻及び各画素について、前記時刻のフレームについての前記基礎顕著度画像の集合に含まれる前記特徴種別に対する基礎顕著度画像の前記画素と、前記時刻における音響顕著度信号との相関を示す統計量を算出し、前記複数の特徴種別の各々に対する、各時刻及び各画素についての前記統計量に基づいて、前記特徴種別の各々に対する、各時刻及び各画素についての重要度からなる主要画像基礎顕著度成分を生成する請求項1記載の顕著度画像生成装置。
- 前記画像基礎顕著度画像抽出部は、前記入力映像を構成する各時刻のフレームの入力画像について、前記複数の特徴種別の各々に対し、前記入力画像における各画素の前記特徴種別の特徴量を示す画像基礎特徴画像を生成して、画像基礎特徴画像の集合とし、
前記複数の特徴種別の各々に対し、画像基礎特徴画像の集合に含まれる前記特徴種別に対する前記画像基礎特徴画像について、空間的な顕著な特性を有する度合いを示す空間方向の基礎顕著度画像、及び時間的な顕著な特性を有する度合いを示す時間方向の基礎顕著度画像を生成し、前記生成した前記空間方向の基礎顕著度画像及び前記時間方向の基礎顕著度画像に基づいて、前記基礎顕著度画像を所定の時間間隔で生成し、前記基礎顕著度画像の集合とし、
前記音響顕著度信号算出部は、前記入力映像を構成する音響信号について、各時刻における音響基礎特徴量を抽出し、前記抽出された各時刻における音響基礎特徴量に基づいて、前記画像基礎顕著度画像抽出部で基礎顕著度画像を生成した時刻と同じ各時刻における前記音響顕著度信号を前記所定の時間間隔で生成する請求項1又は2記載の顕著度画像生成装置。 - 前記画像基礎顕著度画像抽出部は、前記複数の特徴種別の各々に対し、画像基礎特徴画像の集合に含まれる前記特徴種別に対する前記画像基礎特徴画像について、空間的な顕著な特性を有する度合いを示す空間方向の基礎顕著度画像、及び時間的な顕著な特性を有する度合いを示す時間方向の基礎顕著度画像を生成し、前記生成した前記空間方向の基礎顕著度画像、前記時間方向の基礎顕著度画像、及び予め定められた確率モデルに基づいて、前記基礎顕著度画像を生成し、前記基礎顕著度画像の集合とし、
前記音響顕著度信号算出部は、前記入力映像を構成する音響信号について、各時刻における音響基礎特徴量を抽出し、前記抽出された各時刻における音響基礎特徴量、及び前記予め定められた確率モデルに基づいて、各時刻における前記音響顕著度信号を生成する請求項4記載の顕著度画像生成装置。 - 前記確率モデルを、ガンマ分布とした請求項5記載の顕著度画像生成装置。
- 画像基礎顕著度画像抽出部が、入力映像を構成する各時刻のフレームの入力画像について、複数の特徴種別の各々に対し、前記入力画像における顕著な特性を有する度合いを示す基礎顕著度画像を生成し、基礎顕著度画像の集合とし、
音響顕著度信号算出部が、前記入力映像を構成する音響信号について、各時刻における顕著な特性を有する度合いを示す音響顕著度信号を生成し、
画像基礎顕著度選択部が、前記複数の特徴種別の各々に対し、各時刻及び各画素について、前記時刻のフレームについての前記基礎顕著度画像の集合に含まれる前記特徴種別に対する基礎顕著度画像の前記画素と、前記時刻における音響顕著度信号との相関を算出し、前記複数の特徴種別の各々に対する、各時刻及び各画素についての前記相関に基づいて、主要画像基礎顕著度成分を生成し、
画像顕著度画像算出部が、各時刻のフレームについての前記基礎顕著度画像の集合と、前記主要画像基礎顕著度成分とに基づいて、各時刻のフレームの入力画像の各位置における顕著度を示す顕著度画像を生成する
顕著度画像生成方法。 - コンピュータを、請求項1〜請求項6の何れか1項記載の顕著度画像生成装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014265444A JP6318451B2 (ja) | 2014-05-27 | 2014-12-26 | 顕著度画像生成装置、方法、及びプログラム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014109094 | 2014-05-27 | ||
JP2014109094 | 2014-05-27 | ||
JP2014265444A JP6318451B2 (ja) | 2014-05-27 | 2014-12-26 | 顕著度画像生成装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016006478A true JP2016006478A (ja) | 2016-01-14 |
JP6318451B2 JP6318451B2 (ja) | 2018-05-09 |
Family
ID=55224951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014265444A Active JP6318451B2 (ja) | 2014-05-27 | 2014-12-26 | 顕著度画像生成装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6318451B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019032577A (ja) * | 2017-08-04 | 2019-02-28 | Kddi株式会社 | 注視領域推定装置及びプログラム |
CN109447136A (zh) * | 2018-10-15 | 2019-03-08 | 方玉明 | 一种对于360度图像的显著性检测方法 |
WO2020121382A1 (ja) * | 2018-12-10 | 2020-06-18 | オリンパス株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009003615A (ja) * | 2007-06-20 | 2009-01-08 | Nippon Telegr & Teleph Corp <Ntt> | 注目領域抽出方法、注目領域抽出装置、コンピュータプログラム、及び、記録媒体 |
-
2014
- 2014-12-26 JP JP2014265444A patent/JP6318451B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009003615A (ja) * | 2007-06-20 | 2009-01-08 | Nippon Telegr & Teleph Corp <Ntt> | 注目領域抽出方法、注目領域抽出装置、コンピュータプログラム、及び、記録媒体 |
Non-Patent Citations (3)
Title |
---|
B. SCHAUERTE ET AL.: ""WOW! BAYESIAN SURPRISE FOR SALIENT ACOUSTIC EVENT DETECTION"", PROC. ICASSP2013, JPN6018008309, 26 May 2013 (2013-05-26), pages 6402 - 6406, ISSN: 0003754067 * |
中島次郎 他: ""音声信号を考慮した視覚的顕著性マップモデルの構築"", 情報処理学会研究報告, vol. Vol.2013-CVIM-187,No.18, JPN6018008305, 23 May 2013 (2013-05-23), pages 1 - 8, ISSN: 0003754065 * |
劉玉宇 他: ""音と映像の相関を用いた画像分割による話者領域の切り出し"", 情報処理学会論文誌 コンピュータビジョンとイメージメディア, vol. 1, no. 2, JPN6018008307, 15 November 2008 (2008-11-15), pages 32 - 40, ISSN: 0003754066 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019032577A (ja) * | 2017-08-04 | 2019-02-28 | Kddi株式会社 | 注視領域推定装置及びプログラム |
CN109447136A (zh) * | 2018-10-15 | 2019-03-08 | 方玉明 | 一种对于360度图像的显著性检测方法 |
WO2020121382A1 (ja) * | 2018-12-10 | 2020-06-18 | オリンパス株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JPWO2020121382A1 (ja) * | 2018-12-10 | 2021-10-21 | オリンパス株式会社 | 情報処理装置、情報処理方法、及びプログラム |
JP7171985B2 (ja) | 2018-12-10 | 2022-11-16 | 株式会社エビデント | 情報処理装置、情報処理方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6318451B2 (ja) | 2018-05-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11113842B2 (en) | Method and apparatus with gaze estimation | |
CN110599421B (zh) | 模型训练方法、视频模糊帧转换方法、设备及存储介质 | |
JP2021521993A5 (ja) | ||
CN110073369B (zh) | 时间差分模型的无监督学习技术 | |
JP6045396B2 (ja) | 画像処理装置、画像処理方法、及び画像処理プログラム | |
KR20180105876A (ko) | 색상과 형태를 동시에 고려한 실시간 영상 추적 방법 및 이를 위한 장치 | |
CN108229262B (zh) | 一种色情视频检测方法及装置 | |
GB2581048A (en) | Artificially intelligent ejection fraction determination | |
JP2019526869A5 (ja) | ||
JP2013542046A5 (ja) | ||
JP6318451B2 (ja) | 顕著度画像生成装置、方法、及びプログラム | |
CN110287848A (zh) | 视频的生成方法及装置 | |
CN110517249A (zh) | 超声弹性图像的成像方法、装置、设备及介质 | |
Kim et al. | Deep objective assessment model based on spatio-temporal perception of 360-degree video for VR sickness prediction | |
JP5718494B1 (ja) | 印象推定装置、その方法、及びプログラム | |
WO2017158999A1 (ja) | 関心度推定装置、関心度推定方法、プログラムおよび記録媒体 | |
JP2019028939A (ja) | 推定方法及び推定装置 | |
JP6713422B2 (ja) | 学習装置、イベント検出装置、学習方法、イベント検出方法、プログラム | |
EP4343680A1 (en) | De-noising data | |
JP5025713B2 (ja) | 属性識別装置、および属性識別プログラム | |
Nieto et al. | How video object tracking is affected by in-capture distortions? | |
Dimas et al. | MedGaze: Gaze estimation on WCE images based on a CNN autoencoder | |
JP4750758B2 (ja) | 注目領域抽出方法、注目領域抽出装置、コンピュータプログラム、及び、記録媒体 | |
KR20220116928A (ko) | 라벨링 방법 및 이를 위한 컴퓨팅 장치 | |
JP2020182680A5 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20170424 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180313 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180316 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6318451 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |