JPWO2011148562A1 - 画像情報処理装置 - Google Patents
画像情報処理装置 Download PDFInfo
- Publication number
- JPWO2011148562A1 JPWO2011148562A1 JP2012517103A JP2012517103A JPWO2011148562A1 JP WO2011148562 A1 JPWO2011148562 A1 JP WO2011148562A1 JP 2012517103 A JP2012517103 A JP 2012517103A JP 2012517103 A JP2012517103 A JP 2012517103A JP WO2011148562 A1 JPWO2011148562 A1 JP WO2011148562A1
- Authority
- JP
- Japan
- Prior art keywords
- image
- attention
- map
- tag
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
Abstract
Description
図1に示すように、画像情報処理装置10は、画像記憶部12、オブジェクト抽出部14、算出部16、オブジェクト情報記憶部18、注目ベクトル情報記憶部20、付与条件記憶部22、付与部24、入力I/F(インターフェイス)部26、出力I/F部28、画像タグ記憶部30を備える。なお、各種記憶部12,18,20,22、30はHDD(Hard Disk Drive)やRAM(Random Access Memory)などのハードウェアから構成される。なお、画像情報処理装置10としては、一般的なPC(Personal Computer)を用いることができる。
注目ベクトルの大きさが一定以上(例えば、0.15以上)のものを有効領域として数える。
これに対して、人が小さく写って背景が大きく写った画像は、占有割合は1/3未満となり(S17:1/3未満,S18:1/3未満,S19:1/3未満)、付与部24は、ランドマーク系統のタグを付与することとなる(S21)
なお、ステップS14において、非正面と判断すると、図9のフローに移行する。図9のステップS23は図8のステップS15と同様、ステップS24はステップS16と同様、ステップS25〜S27は、ステップS17と同様、ステップS28はステップS21と同様であるので説明を省略する。
付与部24は、注目ベクトル情報記憶部20から画像Aに対応する注目ベクトル情報(注目ベクトル1,2)を取得する(S12)。
画像Bは、カメラを向いたふたりの人物が並んで写っている画像である。
画像Cは、自転車で移動する複数の人物が写っている画像である。
画像Dは、犬を呼ぶ人物が写っている画像である。
本実施の形態2は、画像内のオブジェクトの注目ベクトルを総合的に考慮し画像内における注目度の高低を算出し、特に注目度が高い領域を抽出する仕組みに関するものである。
実施の形態3は、撮影状況におけるオブジェクトの注目度合いだけではなく、撮影された画像を閲覧する際の情報(例えば顕著性マップ)を考慮することで、より適切なタグ付与を可能にしようとするものである。
実施の形態4は、画像内に多数のオブジェクトが存在する場合に、重要なオブジェクト(そのオブジェクトを含む領域)と、些末なオブジェクト(そのオブジェクトを含む領域)とに選別し、些末なオブジェクトはノイズとみなしてタグの付与の考慮から除外する。
(1)手法1:複数の人物から一部の人物のみを重要なオブジェクトとして選別する。
実施の形態5は、画像から複数の線分を抽出し、抽出された複数の線分が収束する方向に収束領域を設定する。設定した収束領域は、実施の形態2の注目領域と同様、様々な用途に利用することができる。
実施の形態6では、タグを付与した画像のそれぞれに、さらに詳細なインデクスを設定する。設定したインデクスは、個々の画像の分析、評価および画像検索に用いることができる。
実施の形態7は、タグが付与された画像群(図33参照)を対象としたアルバムやスライドショーの生成を支援する。
図35(a)に示すように、テンプレート記憶部52は、アルバムのレイアウト52aとテーブル52bを記憶している。
(2)スライドショーの生成
生成部54は、画像内の人物の領域および注目領域を利用してスライドショーを生成する。
<補足1>
以上、本実施の形態について説明したが、本発明は上記の内容に限定されず、本発明の目的とそれに関連又は付随する目的を達成するための各種形態においても実施可能であり、例えば、以下であっても構わない。
<補足2>
本実施の形態は、次の態様を含むものである。
<参考文献>
(1)参考文献1
藤吉弘亘著「Gradientベースの特徴抽出- SIFTとHOG -」, 情報処理学会 研究報告 CVIM 160, pp. 211-224, 2007
12 画像記憶部
14 オブジェクト抽出部
16 算出部
18 オブジェクト情報記憶部
20 注目ベクトル情報記憶部
22 付与条件記憶部
24 付与部
32 注目度マップ作成部
34 領域設定部
36 顕著性マップ作成部
38 被写界深度マップ作成部
40 検出内容判定部
42 総合関心度マップ作成部
44 選別部
46 エッジ抽出部
48 領域設定部
Claims (18)
- 画像からオブジェクトを抽出する抽出手段と、
抽出されたオブジェクトが向いている方向を算出する算出手段と、
前記画像に、算出された方向に応じてタグを付与する付与手段と、
を備えることを特徴とする画像情報処理装置。
- 前記算出手段は、前記抽出されたオブジェクトが前記画像内において占めている割合の大きさを算出し、
前記付与手段は、算出された方向または大きさを基に、前記画像にタグを付与する
ことを特徴とする請求項1記載の画像情報処理装置。
- 前記抽出手段は、前記画像から人物の顔または人物の体を含む領域を前記オブジェクトとして抽出し、
前記算出手段は、抽出された領域における人物の顔または体の、向きもしくは回転方向に基づいて前記方向を算出するとともに、前記抽出された領域における人物の顔または体が前記画像内において占めている割合に基づいて前記大きさを算出する
ことを特徴とする請求項2に記載の画像情報処理装置。
- 前記抽出手段は、前記画像から複数のオブジェクトを抽出し、
前記算出手段は、抽出されたオブジェクトそれぞれについて、当該オブジェクトが注目している方向と前記画像内において占めている割合の大きさとからなるベクトルを算出し、
算出した複数のベクトルを総合して、前記画像全体のベクトルを計算し、
前記付与手段は、計算された前記画像全体のベクトルの方向または大きさに基づいて、前記画像にタグを付与する
ことを特徴とする請求項2に記載の画像情報処理装置。
- 前記付与手段は、前記画像全体のベクトルの方向が、正面であればポートレートであることを示す第1タグを付与し、正面でなければ前記第1タグとは異なる第2タグを付与する
ことを特徴とする請求項4に記載の画像情報処理装置。
- 前記付与手段は、前記画像全体のベクトルの大きさが、所定値よりも大きければ人物を注目していることを示すタグを付与し、所定値以下であれば背景を注目していることを示すタグを付与する
ことを特徴とする請求項4に記載の画像情報処理装置。
- 前記抽出手段は、前記画像から複数のオブジェクトを抽出し、
前記抽出手段は、前記画像から顔と体を含む人物の領域を前記オブジェクトとして抽出し、
前記付与手段は、抽出手段により抽出されたオブジェクトの数が単数か複数かに応じて付与するタグを異ならせる
ことを特徴とする請求項4に記載の情報処理装置。
- 前記算出された算出された方向と大きさとに基づいて、
前記画像上に、前記オブジェクトが注目している度合いの高低を示す第1マップを作成する作成手段と、
作成された第1マップにおいて、前記度合いが所定値以上の場所を含む領域を設定する設定手段と、
を備えることを特徴とする請求項2に記載の画像情報処理装置。
- 前記作成手段は、前記画像における人の視覚注意の度合いの高低を示す第2マップを作成し、作成後、前記第1マップにおける前記注目している度合いの高低と前記第2マップにおける前記視覚注意の度合いの高低とを総合した度合いを示す総合マップを作成し、
前記設定手段は、作成された総合マップにおける度合いが所定値以上の場所を含む領域を設定する
ことを特徴とする請求項8に記載の画像情報処理装置。
- 前記第2マップは、前記画像の色、輝度および方向性を基にした顕著性マップである
ことを特徴とする請求項9に記載の画像情報処理装置。
- 前記作成手段は、前記画像における被写界深度の深浅を示す第3マップを作成し、作成後、前記第1マップにおける前記注目している度合いの高低と前記第3マップにおける前記被写界深度の深浅とを総合した度合いを示す総合マップを作成し、
前記設定手段は、作成された総合マップにおける度合いが所定値以上の場所を含む領域を設定する
ことを特徴とする請求項8に記載の画像情報処理装置。
- 前記抽出手段は、前記画像から、それぞれ人物を含む複数の領域を前記オブジェクトとして抽出し、
抽出された複数の領域の中から、一部の領域をタグの付与に用いる領域として選別する選別手段を備え、
前記付与手段は、前記一部の領域において人物が向いている方向または人物が画像内において占めている割合に基づいてタグを付与する
ことを特徴とする請求項2に記載の画像情報処理装置。
- 前記選別手段は、抽出された複数の領域それぞれの人物が向いている方向に基づいて、複数の領域の中から、2以上の領域をグループ化し、このグループを構成する領域を前記一部の領域として選別する
ことを特徴とする請求項12に記載の画像情報処理装置。
- 前記抽出手段は、前記画像から複数の線分を抽出し、
前記画像に対して、抽出された複数の線分が収束する方向上に領域を設定する設定手段を備える
ことを特徴とする請求項1に記載の画像情報処理装置。
- 前記設定手段は、抽出された複数の線分をそれぞれ延長した複数の軸を規定し、この複数の軸が交差する位置を囲むように前記領域を設定する
ことを特徴とする請求項14に記載の画像情報処理装置。
- 画像からオブジェクトを抽出する抽出ステップと、
抽出されたオブジェクトが向いている方向を算出する算出ステップと、
前記画像に、算出された方向に応じてタグを付与する付与ステップと、
を含むタグ付与方法。
- 画像からオブジェクトを抽出する抽出ステップと、
抽出されたオブジェクトが向いている方向を算出する算出ステップと、
前記画像に、算出された方向に応じてタグを付与する付与ステップと、
を含むタグ付与処理をコンピュータに実行させることを特徴とするプログラム。
- 画像からオブジェクトを抽出する抽出手段と、
抽出されたオブジェクトが向いている方向を算出する算出手段と、
前記画像に、算出された方向に応じてタグを付与する付与手段と、
を備えることを特徴とする集積回路。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012517103A JP5837484B2 (ja) | 2010-05-26 | 2011-04-15 | 画像情報処理装置 |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010120613 | 2010-05-26 | ||
JP2010120613 | 2010-05-26 | ||
JP2012517103A JP5837484B2 (ja) | 2010-05-26 | 2011-04-15 | 画像情報処理装置 |
PCT/JP2011/002235 WO2011148562A1 (ja) | 2010-05-26 | 2011-04-15 | 画像情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011148562A1 true JPWO2011148562A1 (ja) | 2013-07-25 |
JP5837484B2 JP5837484B2 (ja) | 2015-12-24 |
Family
ID=45003563
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012517103A Active JP5837484B2 (ja) | 2010-05-26 | 2011-04-15 | 画像情報処理装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8908976B2 (ja) |
JP (1) | JP5837484B2 (ja) |
CN (1) | CN102906790B (ja) |
WO (1) | WO2011148562A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5389724B2 (ja) * | 2010-03-31 | 2014-01-15 | 富士フイルム株式会社 | 画像処理装置、画像処理方法およびプログラム |
US8908976B2 (en) * | 2010-05-26 | 2014-12-09 | Panasonic Intellectual Property Corporation Of America | Image information processing apparatus |
TWI459310B (zh) * | 2011-12-30 | 2014-11-01 | Altek Corp | 可簡化影像特徵值組之影像擷取裝置及其控制方法 |
JP6178048B2 (ja) * | 2012-06-06 | 2017-08-09 | ソニー株式会社 | 画像処理装置、画像処理方法、及びプログラム |
CN104284055A (zh) * | 2013-07-01 | 2015-01-14 | 索尼公司 | 图像处理方法、装置以及电子设备 |
JP6271917B2 (ja) * | 2013-09-06 | 2018-01-31 | キヤノン株式会社 | 画像記録装置及び撮像装置 |
US20150154466A1 (en) * | 2013-11-29 | 2015-06-04 | Htc Corporation | Mobile device and image processing method thereof |
CN104899820B (zh) * | 2014-03-11 | 2018-11-20 | 腾讯科技(北京)有限公司 | 为图像添加标签的方法、系统和装置 |
US9773156B2 (en) * | 2014-04-29 | 2017-09-26 | Microsoft Technology Licensing, Llc | Grouping and ranking images based on facial recognition data |
CN105096299B (zh) * | 2014-05-08 | 2019-02-26 | 北京大学 | 多边形检测方法和多边形检测装置 |
KR102330322B1 (ko) * | 2014-09-16 | 2021-11-24 | 삼성전자주식회사 | 영상 특징 추출 방법 및 장치 |
CN105808542B (zh) * | 2014-12-29 | 2019-12-24 | 联想(北京)有限公司 | 信息处理方法以及信息处理装置 |
JP2016191845A (ja) * | 2015-03-31 | 2016-11-10 | ソニー株式会社 | 情報処理装置、情報処理方法及びプログラム |
CN105306678A (zh) * | 2015-09-14 | 2016-02-03 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
CN108229519B (zh) * | 2017-02-17 | 2020-09-04 | 北京市商汤科技开发有限公司 | 图像分类的方法、装置及系统 |
CN107343189B (zh) * | 2017-07-10 | 2019-06-21 | Oppo广东移动通信有限公司 | 白平衡处理方法和装置 |
CN107392982A (zh) * | 2017-07-27 | 2017-11-24 | 深圳章鱼信息科技有限公司 | 在线设计方法、装置及系统 |
US10984536B2 (en) * | 2018-01-25 | 2021-04-20 | Emza Visual Sense Ltd | Motion detection in digital images and a communication method of the results thereof |
CN108399381B (zh) * | 2018-02-12 | 2020-10-30 | 北京市商汤科技开发有限公司 | 行人再识别方法、装置、电子设备和存储介质 |
JP6769475B2 (ja) | 2018-12-04 | 2020-10-14 | 日本電気株式会社 | 情報処理システム、認証対象の管理方法、及びプログラム |
US11373407B2 (en) * | 2019-10-25 | 2022-06-28 | International Business Machines Corporation | Attention generation |
US11450021B2 (en) * | 2019-12-30 | 2022-09-20 | Sensetime International Pte. Ltd. | Image processing method and apparatus, electronic device, and storage medium |
US11381730B2 (en) * | 2020-06-25 | 2022-07-05 | Qualcomm Incorporated | Feature-based image autofocus |
US11790665B2 (en) * | 2021-04-29 | 2023-10-17 | Hitachi Astemo, Ltd. | Data driven dynamically reconfigured disparity map |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6952286B2 (en) | 2000-12-07 | 2005-10-04 | Eastman Kodak Company | Doubleprint photofinishing service with the second print having subject content-based modifications |
JP2003087815A (ja) | 2001-09-06 | 2003-03-20 | Canon Inc | 画像処理装置、画像処理システム、画像処理方法、記憶媒体、及びプログラム |
JP4334898B2 (ja) * | 2003-03-26 | 2009-09-30 | シャープ株式会社 | データベース構築装置、データベース構築プログラム、画像検索装置、画像検索プログラム、及び画像記録再生装置 |
US8593542B2 (en) * | 2005-12-27 | 2013-11-26 | DigitalOptics Corporation Europe Limited | Foreground/background separation using reference images |
US20070201749A1 (en) | 2005-02-07 | 2007-08-30 | Masaki Yamauchi | Image Processing Device And Image Processing Method |
JP4748656B2 (ja) * | 2005-06-14 | 2011-08-17 | キヤノン株式会社 | 画像管理装置及びその制御方法、並びにプログラム及び記憶媒体 |
JP2007041987A (ja) * | 2005-08-05 | 2007-02-15 | Sony Corp | 画像処理装置および方法、並びにプログラム |
US8369570B2 (en) * | 2005-09-28 | 2013-02-05 | Facedouble, Inc. | Method and system for tagging an image of an individual in a plurality of photos |
US8265349B2 (en) | 2006-02-07 | 2012-09-11 | Qualcomm Incorporated | Intra-mode region-of-interest video object segmentation |
US8027541B2 (en) * | 2007-03-15 | 2011-09-27 | Microsoft Corporation | Image organization based on image content |
JP4798042B2 (ja) | 2007-03-29 | 2011-10-19 | オムロン株式会社 | 顔検出装置、顔検出方法及び顔検出プログラム |
JP4983643B2 (ja) | 2008-02-22 | 2012-07-25 | 株式会社ニコン | 撮像装置及び補正プログラム |
JP2009290255A (ja) | 2008-05-27 | 2009-12-10 | Sony Corp | 撮像装置、および撮像装置制御方法、並びにコンピュータ・プログラム |
US8477207B2 (en) | 2008-06-06 | 2013-07-02 | Sony Corporation | Image capturing apparatus, image capturing method, and computer program |
JP5251547B2 (ja) | 2008-06-06 | 2013-07-31 | ソニー株式会社 | 画像撮影装置及び画像撮影方法、並びにコンピュータ・プログラム |
JP5093031B2 (ja) | 2008-09-29 | 2012-12-05 | カシオ計算機株式会社 | 撮像装置及びプログラム |
JP4849163B2 (ja) | 2009-09-29 | 2012-01-11 | ソニー株式会社 | 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム |
JP4968346B2 (ja) | 2010-01-20 | 2012-07-04 | カシオ計算機株式会社 | 撮像装置、画像検出装置及びプログラム |
US8908976B2 (en) * | 2010-05-26 | 2014-12-09 | Panasonic Intellectual Property Corporation Of America | Image information processing apparatus |
-
2011
- 2011-04-15 US US13/696,662 patent/US8908976B2/en active Active
- 2011-04-15 WO PCT/JP2011/002235 patent/WO2011148562A1/ja active Application Filing
- 2011-04-15 CN CN201180025428.6A patent/CN102906790B/zh active Active
- 2011-04-15 JP JP2012517103A patent/JP5837484B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
US8908976B2 (en) | 2014-12-09 |
US20130058579A1 (en) | 2013-03-07 |
CN102906790B (zh) | 2015-10-07 |
JP5837484B2 (ja) | 2015-12-24 |
CN102906790A (zh) | 2013-01-30 |
WO2011148562A1 (ja) | 2011-12-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5837484B2 (ja) | 画像情報処理装置 | |
TWI805869B (zh) | 計算場景的主要分類的系統及方法 | |
US8953895B2 (en) | Image classification apparatus, image classification method, program, recording medium, integrated circuit, and model creation apparatus | |
CN105830092B (zh) | 用于数字合成及/或检索的系统、方法及设备 | |
JP5782404B2 (ja) | 画質評価 | |
JP6023058B2 (ja) | 画像処理装置、画像処理方法、プログラム、集積回路 | |
JP5016541B2 (ja) | 画像処理装置および方法並びにプログラム | |
JP5525757B2 (ja) | 画像処理装置、電子機器、及びプログラム | |
Su et al. | Preference-aware view recommendation system for scenic photos based on bag-of-aesthetics-preserving features | |
US20130326417A1 (en) | Textual attribute-based image categorization and search | |
Farinella et al. | Representing scenes for real-time context classification on mobile devices | |
JP5018614B2 (ja) | 画像処理方法、その方法を実行するプログラム、記憶媒体、撮像機器、画像処理システム | |
CN107836109A (zh) | 电子设备自动聚焦于感兴趣区域的方法 | |
GB2523330A (en) | Method, apparatus and computer program product for segmentation of objects in media content | |
WO2016145844A1 (zh) | 一种图片排序方法和相应的图片存储显示设备 | |
Farinella et al. | Scene classification in compressed and constrained domain | |
CN112215964A (zh) | 基于ar的场景导览方法和设备 | |
JP2009245404A (ja) | 画像処理装置および方法並びにプログラム | |
Qian et al. | POI summarization by aesthetics evaluation from crowd source social media | |
WO2012153744A1 (ja) | 情報処理装置、情報処理方法および情報処理プログラム | |
Kim et al. | Classification and indexing scheme of large-scale image repository for spatio-temporal landmark recognition | |
CN111309957A (zh) | 一种自动生成旅行相册mv的方法 | |
JP6586402B2 (ja) | 画像分類装置、画像分類方法及びプログラム | |
WO2022266878A1 (zh) | 景别确定方法、装置及计算机可读存储介质 | |
JP2021026723A (ja) | 画像処理装置、画像処理方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20131001 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140606 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150303 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151013 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5837484 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |