JP6447992B2 - 画像管理装置及びその制御方法 - Google Patents

画像管理装置及びその制御方法 Download PDF

Info

Publication number
JP6447992B2
JP6447992B2 JP2014216526A JP2014216526A JP6447992B2 JP 6447992 B2 JP6447992 B2 JP 6447992B2 JP 2014216526 A JP2014216526 A JP 2014216526A JP 2014216526 A JP2014216526 A JP 2014216526A JP 6447992 B2 JP6447992 B2 JP 6447992B2
Authority
JP
Japan
Prior art keywords
comment
image
subject
information
management apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2014216526A
Other languages
English (en)
Other versions
JP2016085530A (ja
Inventor
健一 松橋
健一 松橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014216526A priority Critical patent/JP6447992B2/ja
Priority to US14/885,087 priority patent/US10057321B2/en
Publication of JP2016085530A publication Critical patent/JP2016085530A/ja
Application granted granted Critical
Publication of JP6447992B2 publication Critical patent/JP6447992B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25841Management of client data involving the geographical location of the client
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32128Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title attached to the image data, e.g. file header, transmitted message header, information on the same page or in the same computer file as the image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/274Storing end-user multimedia data in response to end-user request, e.g. network recorder
    • H04N21/2743Video hosting of uploaded data from client
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/475End-user interface for inputting end-user data, e.g. personal identification number [PIN], preference data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8146Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
    • H04N21/8153Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics comprising still images, e.g. texture, background image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3226Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3225Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
    • H04N2201/3253Position information, e.g. geographical position at time of capture, GPS data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N2201/3201Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N2201/3278Transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Graphics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Computer Interaction (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Processing Or Creating Images (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Studio Devices (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、画像管理装置及びその制御方法に関する。
画像を管理したりソーシャルメディアへ投稿したりする際に、画像の内容や状況についてのコメントが画像に付加されていると便利である。画像にコメントを付加する方法としては、画像中の被写体の態様や位置関係を解析し、コメントを決定し、画像中に吹き出しとして表示する技術が、特許文献1で提案されている。
特開2013−097773号公報
特許文献1では被写体の属性が人物に限定されている。しかし人物以外の属性の被写体も含む被写体同士の位置関係の情報が画像の状況をより良く示す場合もある。例えば、人物と建物が被写体として存在する画像は、記念や記録として撮影された画像である可能性が高い。この場合は、人物同士の位置関係だけではなく、人物と建物との位置関係や、建物が存在する場所を特定できる情報を組み合わせた方が、画像の状況をより良く表現できる。
本発明はこの点に鑑みてなされたものであり、画像にコメントを自動で付加する画像管理装置において、より画像の状況に即したコメントを生成することを可能にする技術を提供することを目的とする。
本発明は、画像のデータと、前記画像に含まれる被写体の位置情報と、を取得する取得手段と、
前記画像に含まれる複数の被写体の位置情報から、前記複数の被写体間の少なくとも奥行き方向の相対的な位置関係を算出する算出手段と、
前記複数の被写体間の相対的な位置関係に基づき、前記画像の状況を示すコメントを生成する生成手段と、
を有する画像管理装置である。
本発明は、画像のデータと、前記画像に含まれる被写体の位置情報と、を取得する取得工程と、
前記画像に含まれる複数の被写体の位置情報から、前記複数の被写体間の少なくとも奥行き方向の相対的な位置関係を算出する算出工程と、
前記複数の被写体間の相対的な位置関係に基づき、前記画像の状況を示すコメントを生成する生成工程と、
を有する画像管理装置の制御方法である。
本発明によれば、画像にコメントを自動で付加する画像管理装置において、より画像の状況に即したコメントを生成することができる。
実施例1の画像管理システムの構成を示す概念図 実施例1の撮像装置の構成の例示すブロック図 実施例1のサーバ装置及び端末装置の構成を例示するブロック図 連携サイトにおける画像及びコメントが表示されたページを示す概念図 連携サイトへ画像を送信する際の設定画面の例 撮像装置から送信する画像を選択する画面の例 実施例1の撮像装置で生成される画像ファイルを示す概念図 実施例1の位置情報の構成を示す概念図 実施例1の被写体座標の空間的位置を示す図 実施例1の被写体情報を示す概念図 実施例1の被写体位置関係とコメント雛形との対応関係の一例 実施例1の画像に含まれる被写体間の相対位置関係情報の一例 実施例1の撮像装置がサーバ装置へ画像を送信する処理のフローチャート 実施例1のサーバ装置がコメントを生成する処理を示すフローチャート 実施例2のコメント雛形の選択肢を提示する画面の例 実施例2のサーバ装置がコメントを生成する処理を示すフローチャート
以下に、図面を参照して、本発明に係る画像管理装置及びその制御方法の好適な実施例を例示的に詳しく説明する。ただし、この実施例に記載されている構成要素はあくまで例示であり、この発明の範囲をそれらのみに限定する趣旨のものではない。
<実施例1>
図1は、実施例1に係る画像管理システムの構成を示す概念図である。
図1において画像管理システムは、画像を撮影する撮像装置102、撮像装置102からネットワーク104経由で画像データを取得し保管するサーバ装置101、及び端末装置103から構成される。端末装置103は、サーバ装置101の設定を行い、サーバ装置101の状態の取得と内容の表示を行い、撮像装置102から画像データを受信する。サーバ装置101へ格納された画像データ及び付加情報は、ソーシャルメディア等の連携サイト105へ、転送することが可能である。
サーバ装置101の取得手段108は、画像のデータと、当該画像に含まれる被写体の位置情報と、を取得する。実施例1では、取得手段108は、撮像装置102から、ネットワーク104経由で、画像データと被写体の情報(位置情報や付加情報)を取得する。算出手段107は、取得手段108が取得した画像データの画像に含まれる複数の被写体の位置情報から、複数の被写体間の少なくとも奥行き方向の相対的な位置関係を算出する。生成手段106は、算出手段107が算出した複数の被写体間の相対的な位置関係に基づき、画像の状況を示すコメントを生成する。出力手段109は、画像データとコメントを関連付けて表示するための表示データを外部機器へ出力する。実施例1では、出力手段109は、外部機器へネットワーク経由(不図示)で表示データを出力する。実施例1では、外部機器は、表示データに基づき画像データとコメントとを表示するウェブサービスを提供する連携サイト105のウェブサーバである。入力手段111は、端末装置103から、ネットワーク104経由で、画像データとコメントとに関連付けて表示するための任意の情報(ユーザコメント等)をユーザから受け付ける。また、入力手段111は、端末装置103から、ネットワーク104経由で、連携サイト105のウェブサービスにおける画像データとコメントとの表示態様を制御する指示をユーザから受け付ける。
図2は、撮像装置102の構成を示すブロック図である。
図2において、カメラ201は、被写体の光学像を電気信号に変換する。A/D変換器202は、アナログ信号を入力してデジタル信号に変換する。エンコーダ203は、デジタル画像データを圧縮符号化する(例えば、静止画データの場合はJPEG形式等)。画像データ記録部204は、画像データのファイル(画像ファイル)を作成して記憶媒体205に格納(記録)する。記憶媒体205は、ランダムアクセス可能な記憶媒体である。ネットワーク接続部206は、ネットワーク104経由でサーバ装置101に画像データを送信する。システム制御部207は、この撮像装置102の全般的な動作を制御する制御部で、マイクロコンピュータを有する。ROM208は、制御プログラムや撮像設定値ファイル、各種データを保存する。RAM209は、制御プログラムのロード領域等を有する。操作部210は、操作パネルやリモコン等を含み、ユーザにより操作されて各種データやコマンドを撮像装置102へ入力する。位置情報取得部211は、例えばGPSレシーバであり、GPS衛星から受信した情報に基づいて撮像装置102の地球上での現在の位置(地理座標)を算出し、現在位置を表す位置情報を生成する。なお、位置情報取得部211は、撮像装置102の外部に接続されていてもよい。デコーダ212は、圧縮符号化されたデジタルデータを復号する。D/A変換器213は、デジタル信号をアナログ信号に変換する。モニタ214は表示部である。電源電池215は撮像装置102の駆動に必要な電源を供給する。
実施例1に係る各種処理を実現するために必要な制御プログラムは、ROM208に記憶されている。しかし、この制御プログラムがメモリカード等の記憶媒体205に記憶されている形態でも良い。また同様に、ネットワーク上にプログラムがある場合でも本発明は適用される。
撮像装置102はネットワーク接続部206を介してサーバ装置101にアクセスするためのアドレスを含むサーバ情報や、認証を行うためのユーザ情報をROM208に保持している。そして、撮像装置102はサーバ情報に含まれるアドレスを用いてサーバ装置101にアクセスし、サーバ装置101は、ユーザ情報を基に認証を行う。
図3はサーバ装置101と端末装置103の構成をそれぞれ示すブロック図である。図3(A)はサーバ装置101の構成を示し、図2(B)は端末装置103の構成を示す。
サーバ装置101は、CPU306A、ネットワークI/F311A、記憶装置309Aを含み、これらがバス312Aで接続された構成である。不図示の構成要素も有するが、ここでは記載を省略する。記憶装置309Aには、プログラム320Aが記憶されており、CPU306Aがプログラム320Aを実行することで、後述する種々の機能が実現される。なお記憶装置309Aには、オペレーティングシステムや各種データ等も記憶されている。ネットワークI/F311Aは、ネットワーク313を介して、撮像装置102、端末装置103、連携サイト105と情報の通信を行う。なおCPU306Aへのプログラムの提供は、記憶装置309Aに限らず、ネットワークI/F311Aからネットワーク313を介して行われても良いし、不図示のUSBメモリやCDやDVD等の可搬記憶媒体から提供されても良い。
端末装置103は、CPU306B、ネットワークI/F311B、入力装置304B、表示装置301B、記憶装置309Bがバス312Bで接続された構成である。不図示の構成要素も有するが、ここでは記載を省略する。入力装置304Bは、ユーザがユーザ機器に指示や情報を入力する装置であり、キーボード、マウス、タッチパネル等を例示できる。表示装置301Bは、文字や画像を表示する液晶ディスプレイ、有機ELディスプレイ、タッチパネルディスプレイ等である。記憶装置309Bには、プログラム320Bが記憶されており、CPU306Bがプログラム320Bを実行することで、後述する種々の機能が実現される。
なお、サーバ装置101に入力装置や表示装置が備わっていても良いが、実施例1では、サーバ装置101は、主として、ネットワークを介して端末装置103や撮像装置102から指示やデータの入力を受け付ける。また、プログラム320Aの実行結果等は、主として、ネットワークを介してHTTP等のプロトコルを用いてXML等の形式で端末装置103や撮像装置102に送信され、ユーザへの提示は端末装置103の表示装置301B等で行われる。そのため、本明細書では記載を省略した。
端末装置103は、PC、携帯電話、又はスマートフォンのような汎用機器であり、標準的なプロトコルによりネットワーク313を介して情報を送受信可能である。プロトコルを用いた情報の送受信は、端末装置103においてCPU306Bがプログラム320Bを動作させることで実現される。
端末装置103は、CPU306Bがプログラム320Bを動作させることにより、HTTP等のプロトコルを用いてサーバ装置101にアクセスし、XML等の記述言語で作成された情報を送信する。また、端末装置103は、同様に、HTMLやXML等の記述言語で作成された情報を受信する。端末装置103のCPU306Bは、プログラム320Bの指示にしたがい受信した情報を解析し、解析結果を表示装置301Bに表示する。これにより、ユーザが入力装置304Bに入力した指示や情報に対する応答や結果が表示装置301Bに提示される。
なお、実施例1では、端末装置103の各種の処理はCPU306Bがプログラム320Bを実行することにより実現される構成を説明したが、各種の処理専用のハードウェアにより実行しても良いし、専用のアプリケーションにより実行しても良い。また、端末装置103で動作するブラウザでWebサービスを利用することにより各種の処理が実行される構成であってもよい。
図4はサーバ装置101から連携サイト105へ画像データとコメントとを含む表示データが送信され、連携サイト105で表示データをもとに表示されたページを示す概念図である。
図4において、表示枠401は画像及びコメントを含む1送信単位(例えば1つの投稿記事)の表示範囲を示す。画像404と画像内容を示すコメント402、連携サイト105における会員を示すアイコン又は画像403で構成される。連携サイト105は、サーバ装置101から送信される画像データとコメントからなる表示データに基づき、図4に示すような表示を閲覧可能なウェブページを生成し、連携サイト105にアクセスした端末に送信する。連携サイト105がサーバ装置101から受信した画像データ及びコメントに基づきどのようにウェブページを描画するかの指示は、ユーザが端末装置103からサーバ装置101へ送信することもできる。サーバ装置101の入力手段111はユーザから受け付けた指示を画像データ及びコメントとともに連携サイト105へ送信し、連携サイト105は当該指示を解釈してユーザの指示に基づく描画を行うことができる。また、サーバ装置101が生成したコメント(生成コメント)の他に、ユーザが作成したコメント(ユーザコメント)を表示させたい場合に、サーバ装置101の入力手段111はユーザからコメントを受け付ける。サーバ装置101は、ユーザコメントを画像データ及び生成コメントとともに連携サイト105へ送信する。この場合、連携サイト105は、例えば図4のコメント402の次の行や、画像404の下のスペース等に、ユーザコメントを配置するよう描画を行うことができる。
図5は、ユーザコメントや表示設定を端末装置103から送信するために端末装置103に表示される設定画面の例である。
図5において、設定枠501内に、連携サイト105を示すアイコン502、コメント402を入れるか否かを指定する選択枠503、コメント402の他に表示するコメント
を指定するコメント入力欄504がある。さらに、設定又は変更を実行する設定ボタン506、設定を取り消す取り消しボタン505で構成される。端末装置103で表示及び設定された設定値はサーバ装置101に保存され、連携サイト105への画像データ及びコメントの送信時にともに送信される。
図6は撮像装置102のモニタ214上に表示される、サーバ装置101や連携サイト105へ送信する画像データを選択し、送信操作を実行するための操作画面の例である。
図6では、ユーザは、画像602〜609の中から送信する画像を選択し、送信ボタン601により送信を実行する。画像の選択や送信の実行の指示入力は、操作部210を操作することにより行うことができる。
図7は撮像装置102で生成される画像ファイルを示す概念図である。
図7において、画像ファイル701は、画像そのものを示す画像データ703と画像データ703に付帯するメタ情報702(付帯情報)で構成される。メタ情報702はさらに、撮影日時を含む撮影情報704と、画像ごとの固有ID705、画像に含まれる被写体の位置情報(空間座標)を示す位置情報706で構成される。
図8は位置情報706の構成を示す概念図である。
図8において、位置情報706は被写体ごとの座標情報801で構成され、画像に複数の被写体が含まれる場合は被写体の数だけの座標情報804、座標情報805が含まれる。画像806中の被写体807の座標情報801は被写体807を示す被写体ID802と被写体座標803で構成される。被写体808についても、対応する座標情報804に被写体IDと被写体座標が含まれる。
図9は被写体の空間的位置を示す概念図である。
図9において、撮像装置102から見たときに、軸901は2次元軸(奥行き方向に対し垂直の平面内の2軸)であり、垂直方向と水平方向を示し、軸902は奥行き方向を示している。図8の画像806中の被写体808は被写体807よりも撮像装置102から遠い位置にあり、これらの被写体の奥行き方向の位置が座標情報801の被写体座標803及び座標情報804の被写体座標(符号は不図示)に記録されている。このように画像データの付加情報に含まれる複数の被写体の各々の座標情報には、少なくとも奥行き方向の位置情報が含まれる。奥行き方向に垂直の平面内の位置情報がさらに含まれていてもよい。
図10は被写体IDに対応する被写体の詳細内容を記述した被写体情報を示す概念図であり、サーバ装置101に格納され、撮像装置102で共有することも可能である。サーバ装置101の取得手段108は、被写体情報を、画像データの付加情報から取得する構成でも良いし、画像データと関連付けられた画像データとは別のファイルから取得しても良い。
図10において、被写体情報は画像に含まれる被写体の数だけ複数存在することができる。1つの被写体情報1001は、被写体に固有な被写体ID802、被写体の名称1002、被写体が人物、建物、自然景観等かを示す被写体属性1003、被写体に特有な形状特徴を示す被写体特徴量1004で構成される。被写体特徴量1004は例えば、個人認識のため顔特徴データや顔認識結果の情報、人工物や自然物の形状、色、大きさ、被写体の撮影情報等を示すものである。
図11は、被写体の属性と、被写体間の相対的な位置関係と、生成すべきコメントの雛形と、の予め定められた対応関係を示すコメントルール情報であり、サーバ装置101の記憶装置110に記憶されている。サーバ装置101の生成手段106は、コメントルー
ル情報に基づきコメントを生成する。
図11において、コメントルール情報は、コメント番号1101、被写体Aの属性1102、被写体Bの属性1103、被写体Aと被写体Bの奥行き方向の相対的な位置関係1104、属性と位置関係に応じて生成するコメントの雛形1105で構成される。図11の例では、相対的な位置関係1104には、2つの被写体の奥行き方向の位置座標の差分と閾値との大小関係が規定されている。よって、生成手段106は、2つの被写体の位置座標の差分と閾値との大小関係に基づきコメントを生成できる。例えば、撮像装置102に対し、被写体Aは被写体Bよりも遠い位置にあり、かつ被写体Aと被写体Bの奥行き方向の距離が閾値より大きいとする。さらに、2つの被写体の属性がともに人物であるとする。このような条件に適合するコメント雛形は、コメントルール情報におけるコメント番号「2」のコメント雛形「AはBの後ろにいます。」である。
図11では被写体が2つの例をあげたが、3つ以上の場合も定義することができる。図11に示すように、実施例1では、人物の被写体と非人物の被写体(図11の例ではランドマーク)との相対的な位置関係とコメント雛形との対応関係が定められている。よって生成手段106は、人物の被写体と非人物の被写体との相対的な位置関係に基づきコメントを生成することができる。また、図11に示すように、実施例1では、生成手段106は、複数の被写体が人物と人物である場合と、複数の被写体が人物と非人物(図11の例ではランドマーク)である場合とで、相対的な位置関係が同じでも異なるコメントを生成する。図11のコメントルール情報には、被写体の撮像情報や大きさや形状の情報に応じたコメント雛形を定義しておいても良い。そうすることにより、生成手段106は、それらの付加情報に基づきコメントを生成することができる。図11の例では、2つの被写体間の奥行き方向の相対的な位置関係とコメントとの対応関係が予め定められている例を示したが、2つの被写体間の、奥行き方向と垂直の平面内の相対的な位置関係とコメントとの対応関係が定められていても良い。この場合、取得手段108は、各被写体の奥行き方向の位置座標と平面内の位置座標を取得し、算出手段107は、被写体間の奥行き方向の相対的な位置関係及び奥行き方向と垂直の平面内の相対的な位置関係を算出する。生成手段106は、被写体間の奥行き方向の相対的な位置関係及び奥行き方向と垂直の平面内の相対的な位置関係に基づきコメントを生成することができる。
図12は画像に含まれる被写体間の相対位置関係情報の一例であり、この相対位置テーブルはサーバ装置101の記憶装置110に記憶される。相対位置テーブルには、1つの画像ファイル701に含まれる被写体間の相対位置関係の情報が格納される。
図12において、1行が2つの被写体間の相対的な位置関係を示しており、被写体が2つの場合は1行である。この相対的な位置関係は算出手段107が算出してテーブルに格納する。画像に含まれる複数の被写体のうちから選択した2つの被写体の組み合わせとして複数通りの組み合わせがある場合、算出手段107は、当該複数通りの組み合わせの各々について相対的な位置関係を算出し、テーブルに格納する。例えば、画像に含まれる被写体がn個の場合は通りの組み合わせについて相対的な位置関係が算出され、テーブルに格納される。被写体ID1201と被写体ID1202で示される被写体間の相対的な位置関係は、奥行き方向、平面内の水平方向及び垂直方向の3次元座標形式で相対位置1203へ格納される。
次に、撮像装置102から送信された画像データ及び被写体情報から、サーバ装置101がコメントを生成する処理を説明する。
図13は撮像装置102がサーバ装置101へ画像データを送信する処理を示すフローチャートである。
図14はサーバ装置101が撮像装置102から画像データを受信し、コメントを生成
する処理を示すフローチャートである。
ステップS1301において、撮像装置102がサーバ装置101へ画像送信要求を行う。
ステップS1401において、サーバ装置101が要求を受信し、画像受信準備を行う。
ステップS1302において、撮像装置102がサーバ装置101へ画像データを送信する。
ステップS1303において、撮像装置102が全ての画像データを送信したかを判定し、全ての画像データを送信したならば、ステップS1304において、撮像装置102がサーバ装置101へ、画像データの送信完了ステータスを送信する。
ステップS1402において、サーバ装置101は撮像装置102から画像データを受信する。
ステップS1403において、サーバ装置101は撮像装置102からの送信完了ステータスを受信する。
ステップS1404において、サーバ装置101は画像ファイル701に含まれる複数の被写体の相対位置を算出し、図12で示されるテーブルに格納し、サーバ装置101の記憶装置309へ保存する。
ステップS1405において、サーバ装置101は図12のテーブルの各相対位置情報について、被写体間の相対位置1203と、被写体の属性と、に基づき図11のコメントルール情報を参照し、条件に合致するコメント雛形を検索する。
ステップS1406において、サーバ装置101は条件に合致するコメント雛形をコメントルール情報から選択する。
ステップS1407において、サーバ装置101はステップS1406で選択したコメント雛形の被写体の名称に相当する部分を被写体情報1001の被写体名称1002で置き換えて、相対位置情報に応じたコメントを生成する。サーバ装置101は、図12のテーブルの複数通りの被写体の組み合わせに対応する相対位置情報ごとに、コメントルール情報を参照してコメントを生成する。なお、取得手段108が被写体情報として被写体の地球上での位置の情報(例えばGPSにより取得した地理座標)を取得するようにしても良い。この場合、生成手段106は、地理座標情報に基づき、被写体の名称(建物名、地名、ランドマーク名など)を特定し、コメント雛形の被写体名称部分を置き換えるようにしても良い。このような地理座標情報に基づく被写体名称の情報は、撮像装置102で撮像時に撮影データとして画像データに付加される情報を取得して用いるようにしても良い。
なお、図12では、画像に含まれる被写体の組み合わせとして可能な全ての組み合わせの各々について相対位置関係を算出する例を説明したが、全ての組み合わせについて相対位置関係を算出しなくても良い。例えば、画像に含まれる被写体のうち、画像内の大きさが一定以上の被写体同士の組み合わせに限って相対位置関係を算出するようにしても良い。また、図14のステップS1404〜S1407では、図12のように算出した相対位置関係の各々についてコメントルール情報に基づきコメントを生成する例を説明したが、算出した全ての相対位置関係についてコメントを生成しなくても良い。例えば、算出した相対位置関係の各々について重要度を表すスコアを算出し、最もスコアの大きい相対位置関係についてのみコメントを生成するようにしても良い。スコアの算出方法は、スコアに基づき画像の撮影目的を推定できる方法を用いればよい。例えば、2つの被写体それぞれの画像内での面積の和をスコアとすることで、画像内で存在感のある被写体同士の相対位置関係のスコアが大きくなる。スコアの算出方法は既知の技術を用いることができる。
実施例1によれば、撮像装置102で撮影した画像データをソーシャルメディア等の連携サイトに投稿する場合に、画像に含まれる被写体同士の奥行き方向の位置関係に応じたコメントを自動生成して画像に付加することができる。これにより、画像平面内の位置関係のみに応じたコメントに比べて、より画像の状況を的確に表現したコメントを生成することができ、連携サイトにおけるより臨場感のある表示が可能となる。コメントの画像への付加方法は、上述したように連携サイトの投稿タイトル文や画像の説明文などの形式でも良いし、画像上に吹き出し等のアノテーションとして付加する形式でも良いし、その他公知の種々の形式を利用できる。さらに、実施例1によれば、画像内の人物同士の位置関係のみならず、人物と建物、人物と場所の位置関係に基づきコメントを生成することができる。これにより、観光名所等で記念撮影した画像を連携サイトに投稿した場合に、観光名所の情報等に基づくより画像の状況を的確に表現したコメントを付加することができ、連携サイトにおけるより臨場感のある表示が可能となる。
<実施例2>
実施例1では、画像ファイル701の画像に含まれる被写体間の相対的な位置関係に応じてコメントを自動的に生成する例を説明したが、被写体間の相対的な位置関係が同じでも、コメントとしての表現は多種類存在しても良い。
実施例2では、コメント雛形1105を複数定義して、ユーザに選択させる場合の処理を例示する。実施例2では、図11のコメントルール情報において、同じ位置関係に対して、複数のコメントが対応付けられている。サーバ装置101の入力手段111は、同じ位置関係に対応する複数のコメントのうちどれを選択するかの指示をユーザから受け付ける。生成手段106は、ユーザの指示に基づきコメントを生成する。
図15は、実施例2において、コメント雛形の選択肢を端末装置103の表示装置301Bに表示した画面の例である。
図15において、ユーザは、コメント1501、1503、1504のうちから、所望のコメントを中央に移動させ、決定ボタン1502を押下することにより、いずれかのコメントを選択できる。
図16は、実施例2において、サーバ装置101が撮像装置102から画像データを受信し、コメントを生成する処理を示すフローチャート図である。図16のフローチャートにおいて図14と同内容の処理には図14と同じ符号を付して説明を省略する。
ステップS1407において、コメントルール情報に基づき、被写体間の相対的な位置関係の条件に合致する複数のコメント雛形が定義されているとする。この場合、サーバ装置101は、複数のコメント雛形からなる選択肢をユーザに提示する図15のような画面データを端末装置103へ送信する。ステップS1601で、ユーザは端末装置103で所望のコメントを選択する操作を行い、選択されたコメントの情報がサーバ装置101へ送信される。サーバ装置101の入力手段111は、ユーザにより選択されたコメント雛形の情報を受け付け、ステップS1602で選択されたコメント雛形を用いてコメントを生成する。
<その他の実施形態>
本発明は、記憶媒体に記録された、コンピュータにより実行可能な命令を、読み出し実行することで上述した本発明の実施形態に記載した1以上の機能を行うシステムや装置のコンピュータによっても、実施することができる。ここで、記憶媒体は、非一時的にデータを保持するコンピュータ読取可能な記憶媒体である。本発明はまた、システムや装置のコンピュータによって行われる方法であって、例えばコンピュータにより実行可能な命令を記憶媒体から読み出し実行することで上述した本発明の実施形態に記載した1以上の機能が行われる、方法によっても実施することができる。コンピュータは、1以上のCPU
(Central Processing Unit)、MPU(Micro Processing Unit)、その他の回路により構成される。さらに別個の複数のコンピュータや別個のコンピュータプロセッサのネットワークを含んでも良い。コンピュータにより実行可能な命令は、例えば、ネットワークや記憶媒体からコンピュータに提供されても良い。記憶媒体は、例えば、1以上の、ハードディスク、RAM(Random-Access Memory)、ROM(Read Only Memory)、分散コンピューティングシステムの記憶装置を含んでも良い。記憶媒体はまた、光学ディスク(例えばCD(Compact Disc)、DVD(Digital Versatile Disc)、BD(Blu-ray(登録商
標)Disc))、フラッシュメモリ、メモリカードを含んでも良い。実施例を参照して本発明を説明したが、本発明は実施例の開示に限定されないものと解されるべきである。本発明は、実施例に対する本発明の範囲内のあらゆる変形や等価な構造や機能を包含するよう最も広く解釈されるべきものである。
101:画像管理装置、106:生成手段、107:算出手段、108:取得手段

Claims (20)

  1. 画像のデータと、前記画像に含まれる被写体の位置情報と、を取得する取得手段と、
    前記画像に含まれる複数の被写体の位置情報から、前記複数の被写体間の少なくとも奥行き方向の相対的な位置関係を算出する算出手段と、
    前記複数の被写体間の相対的な位置関係に基づき、前記画像の状況を示すコメントを生成する生成手段と、
    を有する画像管理装置。
  2. 前記生成手段は、人物の被写体と非人物の被写体との相対的な位置関係に基づき前記コメントを生成する請求項1に記載の画像管理装置。
  3. 前記取得手段は、被写体の地球上での位置を表す地理座標の情報を取得し、
    前記生成手段は、被写体の地理座標の情報にもさらに基づき前記コメントを生成する請求項1又は2に記載の画像管理装置。
  4. 前記生成手段は、複数の被写体が人物と人物である場合と、複数の被写体が人物と非人物である場合とで、相対的な位置関係が同じでも異なるコメントを生成する請求項1〜3のいずれか1項に記載の画像管理装置。
  5. 前記取得手段は、前記被写体の属性の情報、前記被写体の名称の情報、前記被写体の顔認識結果の情報、前記被写体の撮像情報、及び前記被写体の大きさの情報の少なくともいずれかの付加情報をさらに取得し、
    前記生成手段は、前記付加情報にもさらに基づき前記コメントを生成する請求項1〜4のいずれか1項に記載の画像管理装置。
  6. 前記生成手段は、前記複数の被写体の位置座標の差分と閾値との大小関係に基づき前記コメントを生成する請求項1〜5のいずれか1項に記載の画像管理装置。
  7. 前記算出手段は、前記画像に含まれる複数の被写体のうちから選択した2つの被写体の組み合わせとして複数通りの組み合わせがある場合、当該複数通りの組み合わせの各々について相対的な位置関係を算出する請求項1〜5のいずれか1項に記載の画像管理装置。
  8. 前記生成手段は、被写体間の相対的な位置関係とコメントとの予め定められた対応関係に基づき前記コメントを生成する請求項1〜6のいずれか1項に記載の画像管理装置。
  9. 前記対応関係において、同じ位置関係に対して複数のコメントが対応付けられており、
    同じ位置関係に対応する前記複数のコメントのうちどれを選択するかの指示をユーザから受け付ける手段をさらに有し、
    前記生成手段は、前記ユーザの指示に基づき前記コメントを生成する請求項8に記載の画像管理装置。
  10. 前記取得手段は、前記被写体の名称の情報を取得し、
    前記生成手段は、前記対応関係において定められているコメントにおける被写体の名称に相当する部分を前記取得した被写体の名称で置き換えて前記コメントを生成する請求項8又は9に記載の画像管理装置。
  11. 前記取得手段は、前記画像のデータの付帯情報から前記被写体の情報を取得する請求項1〜10のいずれか1項に記載の画像管理装置。
  12. 前記算出手段は、前記複数の被写体間の奥行き方向の相対的な位置関係及び前記奥行き方向と垂直の平面内の相対的な位置関係を算出する請求項1〜11のいずれか1項に記載の画像管理装置。
  13. 前記取得手段は、撮像装置からネットワーク経由で前記画像のデータと前記被写体の情報とを取得する請求項1〜12のいずれか1項に記載の画像管理装置。
  14. 前記画像のデータと前記コメントとを関連付けて表示するための表示データを外部機器へ出力する出力手段をさらに有する請求項1〜13のいずれか1項に記載の画像管理装置。
  15. 前記画像のデータと前記コメントとに関連付けて表示するための任意の情報をユーザから受け付ける手段をさらに有する請求項14に記載の画像管理装置。
  16. 前記出力手段は、前記外部機器へネットワーク経由で前記表示データを出力する請求項14又は15に記載の画像管理装置。
  17. 前記外部機器は、前記表示データに基づき前記画像のデータと前記コメントとを表示するウェブサービスを提供するウェブサーバである請求項16に記載の画像管理装置。
  18. 前記ウェブサービスにおける前記画像のデータと前記コメントとの表示態様を制御する指示をユーザから受け付ける手段をさらに有する請求項17に記載の画像管理装置。
  19. 画像のデータと、前記画像に含まれる被写体の位置情報と、を取得する取得工程と、
    前記画像に含まれる複数の被写体の位置情報から、前記複数の被写体間の少なくとも奥行き方向の相対的な位置関係を算出する算出工程と、
    前記複数の被写体間の相対的な位置関係に基づき、前記画像の状況を示すコメントを生成する生成工程と、
    を有する画像管理装置の制御方法。
  20. 請求項19に記載の画像管理装置の制御方法の各工程をコンピュータに実行させるプログラム。
JP2014216526A 2014-10-23 2014-10-23 画像管理装置及びその制御方法 Expired - Fee Related JP6447992B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014216526A JP6447992B2 (ja) 2014-10-23 2014-10-23 画像管理装置及びその制御方法
US14/885,087 US10057321B2 (en) 2014-10-23 2015-10-16 Image management apparatus and control method capable of automatically creating comment data relevant to an image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014216526A JP6447992B2 (ja) 2014-10-23 2014-10-23 画像管理装置及びその制御方法

Publications (2)

Publication Number Publication Date
JP2016085530A JP2016085530A (ja) 2016-05-19
JP6447992B2 true JP6447992B2 (ja) 2019-01-09

Family

ID=55793000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014216526A Expired - Fee Related JP6447992B2 (ja) 2014-10-23 2014-10-23 画像管理装置及びその制御方法

Country Status (2)

Country Link
US (1) US10057321B2 (ja)
JP (1) JP6447992B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11160688B2 (en) * 2016-11-10 2021-11-02 Samsung Electronics Co., Ltd. Visual aid display device and method of operating the same
US11197127B1 (en) * 2019-03-14 2021-12-07 United Services Automobile Association (Usaa) System and method for determining physical locations of addresses
JP6830514B2 (ja) * 2019-07-26 2021-02-17 zro株式会社 視覚的な意味属性および非視覚的な意味属性がビジュアルに関連付けられる方法ならびにコンピューティングデバイス

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6690883B2 (en) * 2001-12-14 2004-02-10 Koninklijke Philips Electronics N.V. Self-annotating camera
US7636450B1 (en) * 2006-01-26 2009-12-22 Adobe Systems Incorporated Displaying detected objects to indicate grouping
US20090022403A1 (en) * 2007-07-20 2009-01-22 Fujifilm Corporation Image processing apparatus, image processing method, and computer readable medium
US9959644B2 (en) * 2010-12-21 2018-05-01 Qualcomm Incorporated Computerized method and device for annotating at least one feature of an image of a view
JP2013097773A (ja) 2011-11-07 2013-05-20 Sony Corp 情報処理装置、情報処理方法、及びプログラム
JP2013109578A (ja) * 2011-11-21 2013-06-06 Ricoh Co Ltd 画像処理装置、画像処理プログラム及び画像処理システム
US20130328932A1 (en) * 2012-06-08 2013-12-12 Samsung Electronics Co., Ltd Add social comment keeping photo context
US9202521B2 (en) * 2012-10-10 2015-12-01 JVC Kenwood Corporation Comment creating-displaying device, method of creating and displaying comment, and comment creating and displaying program

Also Published As

Publication number Publication date
US20160119554A1 (en) 2016-04-28
JP2016085530A (ja) 2016-05-19
US10057321B2 (en) 2018-08-21

Similar Documents

Publication Publication Date Title
CN112136099B (zh) 来自远程设备的直接输入
CN112639876B (zh) 活动图像深度预测
US12058434B2 (en) Third-party modifications for a camera user interface
US11758264B2 (en) Camera user interface to generate content for third-party applications
JP6753785B2 (ja) 場所に基づいた情報処理の方法及び装置
CN115695362B (zh) 用于媒体项附接的方法和系统
JP6254577B2 (ja) 情報処理装置、システム、情報処理方法およびプログラム
US12469180B2 (en) Machine learning-based modification of image content
EP3009989A1 (en) System and method for distributed augmented reality
US20100315433A1 (en) Mobile terminal, server device, community generation system, display control method, and program
KR20250117701A (ko) 이벤트 오버레이 초대 메시징 시스템
US11816304B2 (en) Presenting content received from third-party resources
US10074216B2 (en) Information processing to display information based on position of the real object in the image
RU2622843C2 (ru) Способ управления устройством обработки изображения
JPWO2017002505A1 (ja) 情報処理装置、情報処理方法及びプログラム
US12455917B2 (en) Location-based timeline media content system
JP6617547B2 (ja) 画像管理システム、画像管理方法、プログラム
JP2017107529A (ja) 情報処理システム、端末装置及びプログラム
JP6447992B2 (ja) 画像管理装置及びその制御方法
JP6115113B2 (ja) 所定領域管理システム、所定領域管理方法、及びプログラム
JP2015169702A (ja) 感情判断装置および感情判断方法
JP2017182681A (ja) 画像処理システム、情報処理装置、プログラム
JPWO2009110276A1 (ja) 利用者情報提示システム、利用者情報提示装置、利用者情報提示方法、及び利用者情報提示用プログラム
JP2017151632A (ja) サーバ装置、検索方法およびプログラム
US20240290028A1 (en) Non-transitory computer readable medium, information processing apparatus, and information processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171011

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181030

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20181116

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181127

R151 Written notification of patent or utility model registration

Ref document number: 6447992

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees