JP2021035025A - 情報処理装置、情報処理方法、プログラム - Google Patents

情報処理装置、情報処理方法、プログラム Download PDF

Info

Publication number
JP2021035025A
JP2021035025A JP2019157233A JP2019157233A JP2021035025A JP 2021035025 A JP2021035025 A JP 2021035025A JP 2019157233 A JP2019157233 A JP 2019157233A JP 2019157233 A JP2019157233 A JP 2019157233A JP 2021035025 A JP2021035025 A JP 2021035025A
Authority
JP
Japan
Prior art keywords
image
metadata
information processing
item
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019157233A
Other languages
English (en)
Other versions
JP7415376B2 (ja
Inventor
真宏 和田
Masahiro Wada
真宏 和田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2019157233A priority Critical patent/JP7415376B2/ja
Priority to PCT/JP2020/030428 priority patent/WO2021039367A1/en
Publication of JP2021035025A publication Critical patent/JP2021035025A/ja
Application granted granted Critical
Publication of JP7415376B2 publication Critical patent/JP7415376B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • H04N9/8227Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal the additional signal being at least another television signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)

Abstract

【課題】撮像装置で撮像した画像の、メタデータの編集に好適な環境を提供する。【解決手段】情報処理装置である撮像装置の、設定画面で設定可能な設定項目として、画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を行うユーザインタフェース制御部を備える。IPTCフィールド設定項目が選択されると、IPTCフィールド設定画面67が表示される。一つの項目ごとに、項目名表示部220、オン/オフ設定表示部221、編集ボタン222が設けられている。これらを設定することによりメタデータの編集を行うことができる。【選択図】図10

Description

本技術は情報処理装置、情報処理方法、プログラムに関し、特に画像データに付与されるメタデータの編集についての技術に関する。
プロカメラマンや記者など、業務で撮像装置(「カメラ」ともいう)を使用するユーザの場合、撮像装置で撮像した画像を、現場で、その撮像装置の通信機能を用いて新聞社等のサーバ(FTP(File Transfer Protocol)サーバ)にアップロードするということが行われている(例えば特許文献1)。
また、新聞社等においては、複数のユーザから画像データがアップロードされるため、受信する画像データが膨大な量となり得る。新聞社等においては、効率よく目的の画像データを検索するために画像データに付与されたメタデータを活用している。
そのためには、ユーザが撮像装置において画像データにメタデータを付与する操作を行うことが考えられる。
特開2017−138777号公報
ところが、メタデータを付与するためのテキスト入力を行う作業に対して撮像装置が備える入力手段は好適では無く、撮像した画像を速やかにアップロードすることが難しい。
そこで本技術では、例えばプロカメラマンなど、撮像した画像にメタデータを付与した上で速やかにアップロードする必要のあるユーザにとって、メタデータの編集に好適な環境を提供すること目的とする。
本技術に係る情報処理装置は、画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を行うユーザインタフェース制御部を備えたものである。
これにより、メタデータに含まれるフィールドのうちユーザが編集対象とするもののみを表示させるような操作が可能とされている。
上記した情報処理装置における前記ユーザインタフェース制御部は、検出した前記切換操作に基づいて前記メタデータのフィールドの表示可否を制御する処理を行ってもよい。
これにより、ユーザの切換操作の結果が表示に反映される。
上記した情報処理装置においては前記表示可否の設定を記憶する記憶部を備えていてもよい。
これにより、ユーザの切換操作の結果が保存され、表示の際に利用される。
上記した情報処理装置における前記ユーザインタフェース制御部は、前記表示可否に基づいて表示された前記メタデータのフィールドから編集対象のフィールドを選択する操作を検出する処理を行ってもよい。
これにより、ユーザは、編集対象の項目を編集することが可能とされる。
上記した情報処理装置における前記ユーザインタフェース制御部は、前記フィールドごとの表示名を編集可能とするユーザインタフェース処理を行ってもよい。
これにより、メタデータのフィールド名が分かり難い場合などに異なる表示名を付与するための操作が可能とされる。
上記した情報処理装置における前記ユーザインタフェース制御部は、フィールド名の編集ができないように前記ユーザインタフェース処理を行ってもよい。
これにより、例えば仕様で決定されているフィールド名が変更されて、メタデータに基づく画像ファイルの分類処理などが正常に動作しなくなってしまうことが防止される。
上記した情報処理装置における前記ユーザインタフェース制御部は、前記メタデータとしてのテキスト情報を編集する操作を検出する処理を行ってもよい。
これにより、ユーザはメタデータのテキスト情報の編集操作が可能とされる。
上記した情報処理装置は携帯端末装置であってもよい。
撮像装置で撮影した画像をその場で情報処理装置としての携帯端末装置に転送することができ、素早くメタデータの編集を行うことができる。
上記した情報処理装置において、前記メタデータはIPTCメタデータとされていてもよい。
団体等によってフォーマット化されたメタデータとされることにより、上述した技術を広範囲に適用することができる。
本技術の情報処理方法は、画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を情報処理装置が実行するものである。
本技術のプログラムは、画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を情報処理装置に実行させるプログラムである。
これにより、メタデータの編集に好適な環境を提供するための各処理が情報処理装置で実行可能とされる。
本技術の実施の形態の画像ファイル及び音声ファイルの転送及びアップロードの説明図である。 実施の形態で通信を行う撮像装置のブロック図である。 実施の形態で画像データに付加されるIPTCメタデータの説明図である。 実施の形態の情報処理装置のブロック図である。 実施の形態の情報処理装置の機能構成の説明図である。 実施の形態の画像一覧画面の説明図である。 実施の形態のメニュー画面の説明図である。 実施の形態の設定画面の説明図である。 実施の形態のメタデータ編集設定項目画面の説明図である。 実施の形態のIPTCフィールド設定画面の説明図である。 実施の形態のフィールド表示名変更ダイアログの説明図である。 実施の形態のIPTCフィールド設定画面の説明図である。 実施の形態のIPTCフィールド設定画面の説明図である。 実施の形態のキャプション編集画面の説明図である。 実施の形態でボイスメモテキストがキャプションデータに加えられた状態のキャプション編集画面の説明図である。 実施の形態のIPTCメタデータ編集画面の説明図である。 実施の形態のIPTCメタデータ編集画面の説明図である。 実施の形態のボイスメモ自動キャプション付与設定画面の説明図である。 実施の形態の自動アップロード設定画面の自動アップロード設定オフ状態の説明図である。 実施の形態の自動アップロード設定画面の自動アップロード設定オン状態の説明図である。 実施の形態の自動アップロード設定画面の自動アップロード設定オン状態説明図である。 実施の形態の画像取り込みの際の処理例のフローチャートである。 実施の形態の画像取り込みの際の処理例のフローチャートである。 実施の形態のアップロードファイル準備処理のフローチャートである。 実施の形態の画像一覧画面からの処理例のフローチャートである。 実施の形態の画像一覧画面からの処理例のフローチャートである。 実施の形態の画像一覧画面からの処理例のフローチャートである。 実施の形態のアップロード時の処理例のフローチャートである。 実施の形態のIPTCフィールド設定画面に関する処理例のフローチャートである。
以下、実施の形態を次の順序で説明する。
<1.実施の形態の画像取り込みとアップロード>
<2.撮像装置の構成>
<3.情報処理装置の構成>
<4.ユーザインタフェース画面>
<5.画像取り込み時の処理例>
<6.テキスト化及びキャプション編集を含む処理例>
<7.アップロード時の処理例>
<8.IPTCフィールド設定画面に関する処理>
<9.まとめ及び変形例>
<10.本技術>
<1.実施の形態の画像取り込みとアップロード>
本実施の形態の情報処理装置2を含む撮像装置1、FTPサーバ4、テキスト変換エンジン5、ネットワーク6を図1に示す。
撮像装置1としては、ビデオカメラやスチルカメラとしての各種の撮像装置がある。図示する撮像装置1は、カメラマンや記者がスポーツやイベントの会場や取材現場などで用いるカメラを想定している。
情報処理装置2は、ここではスマートフォン等の携帯型端末装置を例示している。
なお情報処理装置の具体例としては、例えばパーソナルコンピュータ装置、タブレット型情報処理装置、携帯電話装置、ゲーム機器、オーディオ機器、ビデオ機器、通信装置、テレビジョン装置、サーバ装置など、各種の例が想定される。情報処理としての演算を行うことのできる装置、例えばマイクロコンピュータを内蔵する装置であれば本開示の情報処理装置として実現可能である。
但し、上述のようにイベント会場等での使用を想定する場合、スマートフォンやタブレット機器などの携帯端末であることが好適である。
撮像装置1と情報処理装置2は、例えばブルートゥース(Bluetooth:登録商標)、WI−FI(登録商標)通信、NFC(Near Field Communication)等の近距離無線通信、赤外線通信により、相互に情報通信が可能とされる。
なお撮像装置1と情報処理装置2が有線接続通信によって相互に通信可能とされてもよい。
また情報処理装置2がFTPサーバ、撮像装置1がFTPクライアントとして機能し、撮像装置1から画像データ等が情報処理装置2にアップロードされる。即ち、撮像装置1には、FTP転送を行うためのFTP設定情報が記憶され、FTP設定情報を用いることにより情報処理装置2をFTPサーバとしたFTP転送が実行される。
本実施の形態の場合、撮像装置1から情報処理装置2には、画像ファイルPFや音声ファイルAFが送信される状況を想定する。
情報処理装置2は撮像装置1から転送された画像ファイルPFや音声ファイルAFを保持し、ユーザに提示したり、メタデータの付与や編集を行ったり、FTPサーバ4へアップロードしたりすることができる。
撮像装置1は、撮像動作により静止画や動画としての画像データを生成する。なお、メタデータの付与は撮像装置1で行うことも可能である。
図1に示す画像ファイルPFとは、この画像データとメタデータを含むデータファイルであるとする。
撮像装置1はボイスメモ機能を備える。これは、ユーザが撮像時に声を入力することで、撮像画像に対する注釈、説明等を音声で付与することができる機能である。例えば1枚の静止画を撮像した際にカメラマンが所定の操作を行いながら画像内容を説明する発声を行ったり、画像を指定した状態で発声を行ったりすることで、その音声が録音され、画像データと関連付けられたボイスメモ(音声メモ)とされる。
図1に示す音声ファイルAFとは、このボイスメモとしての音声データを含むデータファイルであるとする。
なお、動画撮像時には、周囲音声も音声トラックデータとして記録されるが、その音声トラックデータは画像ファイルPFに含まれる音声データであり、音声ファイルAFとは別である。説明上の音声ファイルAFは、あくまでもボイスメモとしての音声データを含むファイルを指すものとする。
以下では、静止画撮像を想定し、画像ファイルPFには静止画像データとメタデータ、音声ファイルAFには静止画撮像に伴って生成されたボイスメモデータが含まれる例で説明していく。
なお、必ずしも全ての画像ファイルPFに音声ファイルAFが関連付けられている訳では無く、あくまでカメラマン等がボイスメモ機能を用いて音声入力を行った場合にのみ、撮像装置1で音声ファイルAFが生成され、画像ファイルPFに関連付けられる。
従って撮像装置1から情報処理装置2へのデータ転送においては、画像ファイルPFと音声ファイルAFが対になって送信される場合と、画像ファイルPFのみが送信される場合がある。
情報処理装置2は、転送された画像ファイルPFや音声ファイルAFをネットワーク6を介してFTPサーバ4にアップロードすることができる。
ネットワーク6は、例えばインターネット、ホームネットワーク、LAN(Local Area Network)、衛星通信網、その他の各種のネットワークが想定される。
FTPサーバ4は、例えば新聞社、放送局、通信社などが運営するサーバが考えられる。もちろんそのようなサーバに限定されない。
FTPサーバ4の形態としてはクラウドサーバ、ホームサーバ、或いはパーソナルコンピュータなどが想定される。
情報処理装置2は、単に撮像装置1から画像ファイルPF等をそのままFTPサーバ4にアップロードだけでなく、メタデータに含まれるキャプションデータを付加・編集したり画像サイズの設定、データ圧縮などを行ったりした上でアップロードすることができる。
また、情報処理装置2は、音声ファイルAFが関連付けられた画像ファイルPFについては、その音声ファイルAFにおける音声データ、即ち上述のボイスメモをテキスト化したテキストデータを取得し、メタデータに付加する処理も行った上で、アップロードすることができる。
特に、本実施の形態の場合、情報処理装置2は、メタデータの編集を容易にするためのインタフェース制御を行う。
具体的には後述するが、メタデータとしての各項目ごとの表示名を使いやすいものに変更する機能や、複数の項目から任意の項目のみを編集対象として表示する機能を提供する。
ボイスメモのテキストデータ化は、情報処理装置2にテキスト変換エンジンが装備されることで、実行されるようにすることが考えられるが、情報処理装置2自体はテキスト変換機能を備えず、外部のテキスト変換エンジン5を用いるようにしてもよい。
例えば情報処理装置2は、ネットワーク6を介してテキスト変換エンジン5にボイスメモの音声データを送信する。
テキスト変換エンジン5は、この音声データをテキスト化する処理を行い、生成したテキストデータを情報処理装置2に送信する。これにより情報処理装置2はボイスメモをテキスト化したテキストデータを取得することができる。
なお説明上、ボイスメモをテキスト化したテキストデータを「ボイスメモテキスト」とも呼ぶこととする。
この図1のような通信システムが構築されることで、例えば撮像装置1のユーザが新聞社の仕事を行うプロカメラマンである場合、次のようなことが可能になる。
即ちカメラマンがイベント会場で撮像した画像を、自分のスマートフォン(情報処理装置2)に転送する。そしてスマートフォン等の情報処理装置2においてキャプション編集などの必要な作業を行った上で、情報処理装置2からFTPサーバ4に撮像画像をアップロードするというようなシステム利用態様が想定される。また、スマートフォン等の情報処理装置2に画像を転送した後、情報処理装置2において自動的にFTPサーバ4へのアップロードが行われてもよい。
このような態様において、ボイスメモがテキスト化されてメタデータに付加され、画像データとともにアップロードされるものとなる。
<2.撮像装置の構成>
撮像装置1の構成例を図2で説明する。
撮像装置1は、例えばレンズ系11、撮像素子部12、カメラ信号処理部13、記録制御部14、表示部15、通信部16、操作部17、カメラ制御部18、メモリ部19、ドライバ部22、センサ部23、音声入力部25、音声処理部26を有する。
レンズ系11は、ズームレンズ、フォーカスレンズ等のレンズや絞り機構などを備える。このレンズ系11により、被写体からの光(入射光)が導かれ撮像素子部12に集光される。
撮像素子部12は、例えば、CMOS(Complementary Metal Oxide Semiconductor)型やCCD(Charge Coupled Device)型などのイメージセンサ12a(撮像素子)を有して構成される。
この撮像素子部12では、イメージセンサ12aで受光した光を光電変換して得た電気信号について、例えばCDS(Correlated Double Sampling)処理、AGC(Automatic Gain Control)処理などを実行し、さらにA/D(Analog/Digital)変換処理を行う。そしてデジタルデータとしての撮像信号を、後段のカメラ信号処理部13やカメラ制御部18に出力する。
カメラ信号処理部13は、例えばDSP(Digital Signal Processor)等により画像処理プロセッサとして構成される。このカメラ信号処理部13は、撮像素子部12からのデジタル信号(撮像画像信号)に対して、各種の信号処理を施す。例えばカメラプロセスとしてカメラ信号処理部13は、前処理、同時化処理、YC生成処理、解像度変換処理、ファイル形成処理等を行う。
前処理では、撮像素子部12からの撮像画像信号に対して、R,G,Bの黒レベルを所定のレベルにクランプするクランプ処理や、R,G,Bの色チャンネル間の補正処理等を行う。
同時化処理では、各画素についての画像データが、R,G,B全ての色成分を有するようにする色分離処理を施す。例えば、ベイヤー配列のカラーフィルタを用いた撮像素子の場合は、色分離処理としてデモザイク処理が行われる。
YC生成処理では、R,G,Bの画像データから、輝度(Y)信号および色(C)信号を生成(分離)する。
解像度変換処理では、各種の信号処理が施された画像データに対して、解像度変換処理を実行する。
ファイル形成処理では、例えば以上の各種処理が施された画像データについて、例えば記録用や通信用の圧縮符号化、フォーマティング、メタデータの生成や付加などを行って記録用や通信用のファイル生成を行う。
例えば静止画ファイルとしてJPEG(Joint Photographic Experts Group)、TIFF(Tagged Image File Format)、GIF(Graphics Interchange Format)等の形式の画像ファイルPFの生成を行う。またMPEG−4準拠の動画・音声の記録に用いられているMP4フォーマットなどとしての画像ファイルPFの生成を行うことも考えられる。
なおロー(RAW)画像データとして画像ファイルPFを生成することも考えられる。
カメラ信号処理部13は、メタデータについては、カメラ信号処理部13内の処理パラメータの情報や、カメラ制御部18から取得する各種制御パラメータ、レンズ系11や撮像素子部12の動作状態を示す情報、モード設定情報、撮像環境情報(日時や場所など)を含むものとして生成する。
特に本実施の形態の場合図3に例示するIPTC(International Press Telecommunications Council)メタデータを含むものとする。
IPTCメタデータは、メディア企業団体が策定したフォーマットによるメタデータであり、図3はその一部の項目のみを例示しているが、「ディスクリプション/キャプション」「ディスクリプションライター」「ヘッドライン」「キーワード」など、多様な情報を記述可能とされる。
記録制御部14は、例えば不揮発性メモリによる記録媒体に対して記録再生を行う。記録制御部14は例えば記録媒体に対し動画データや静止画データ等の画像ファイルやサムネイル画像等を記録する処理を行う。
記録制御部14の実際の形態は多様に考えられる。例えば記録制御部14は、撮像装置1に内蔵されるフラッシュメモリとその書込/読出回路として構成されてもよい。また記録制御部14は、撮像装置1に着脱できる記録媒体、例えばメモリカード(可搬型のフラッシュメモリ等)に対して記録再生アクセスを行うカード記録再生部による形態でもよい。また記録制御部14は、撮像装置1に内蔵されている形態としてHDD(Hard Disk Drive)などとして実現されることもある。
表示部15は撮像者に対して各種表示を行う表示部であり、例えば撮像装置1の筐体に配置される液晶パネル(LCD:Liquid Crystal Display)や有機EL(Electro-Luminescence)ディスプレイ等のディスプレイデバイスによる表示パネルやビューファインダーとされる。
表示部15は、カメラ制御部18の指示に基づいて表示画面上に各種表示を実行させる。
例えば表示部15は、記録制御部14において記録媒体から読み出された画像データの再生画像を表示させる。
また表示部15にはカメラ信号処理部13で表示用に解像度変換された撮像画像の画像データが供給され、表示部15はカメラ制御部18の指示に応じて、当該撮像画像の画像データに基づいて表示を行う場合がある。これにより構図確認中や動画記録中などの撮像画像である、いわゆるスルー画(被写体のモニタリング画像)が表示される。
また表示部15はカメラ制御部18の指示に基づいて、各種操作メニュー、アイコン、メッセージ等、即ちGUI(Graphical User Interface)としての表示を画面上に現出させる。
通信部16は、外部機器との間のデータ通信やネットワーク通信を有線又は無線で行う。
例えば外部の表示装置、記録装置、再生装置等に対して撮像画像データ(静止画ファイルや動画ファイル)の送信出力を行う。
また通信部16はネットワーク通信部として、例えばインターネット、ホームネットワーク、LAN(Local Area Network)等の各種のネットワーク6による通信を行い、ネットワーク上のサーバ、端末等との間で各種データ送受信を行うことができる。例えば図1では記載を省略したが、通信部16は、撮像した画像データ(上述の画像ファイル等)をFTPサーバ4にアップロードする通信処理を行ってもよい。
また本実施の形態の場合、通信部16は、情報処理装置2との間で通信を行い、画像ファイルPFや音声ファイルAFの転送を実行する。
操作部17は、ユーザが各種操作入力を行うための入力デバイスを総括して示している。具体的には操作部17は撮像装置1の筐体に設けられた各種の操作子(キー、ダイヤル、タッチパネル、タッチパッド等)を示している。
操作部17によりユーザの操作が検知され、入力された操作に応じた信号はカメラ制御部18へ送られる。
カメラ制御部18はCPU(Central Processing Unit)を備えたマイクロコンピュータ(演算処理装置)により構成される。
メモリ部19は、カメラ制御部18が処理に用いる情報等を記憶する。図示するメモリ部19としては、例えばROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリなどを包括的に示している。
メモリ部19はカメラ制御部18としてのマイクロコンピュータチップに内蔵されるメモリ領域であってもよいし、別体のメモリチップにより構成されてもよい。
カメラ制御部18はメモリ部19のROMやフラッシュメモリ等に記憶されたプログラムを実行することで、この撮像装置1の全体を制御する。
例えばカメラ制御部18は、撮像素子部12のシャッタースピードの制御、カメラ信号処理部13における各種信号処理の指示、ユーザの操作に応じた撮像動作や記録動作、記録した画像ファイルの再生動作、記録した画像の転送動作やアップロード動作、レンズ鏡筒におけるズーム、フォーカス、絞り調整等のレンズ系11の動作、ユーザインタフェース動作等について、必要各部の動作を制御する。
メモリ部19におけるRAMは、カメラ制御部18のCPUの各種データ処理の際の作業領域として、データやプログラム等の一時的な格納に用いられる。
メモリ部19におけるROMやフラッシュメモリ(不揮発性メモリ)は、CPUが各部を制御するためのOS(Operating System)や、画像ファイル等のコンテンツファイルの他、各種動作のためのアプリケーションプログラムや、ファームウエア、各種の設定情報等の記憶に用いられる。
各種の設定情報としては、上述のFTP設定情報や、撮像動作に関する設定情報としての露出設定、シャッタースピード設定、モード設定や、画像処理に係る設定情報としてのホワイトバランス設定、色設定、画像エフェクトに関する設定や、操作性に係る設定情報としてのカスタムキー設定や表示設定などがある。
ドライバ部22には、例えばズームレンズ駆動モータに対するモータドライバ、フォーカスレンズ駆動モータに対するモータドライバ、絞り機構のモータに対するモータドライバ等が設けられている。
これらのモータドライバはカメラ制御部18からの指示に応じて駆動電流を対応するドライバに印加し、フォーカスレンズやズームレンズの移動、絞り機構の絞り羽根の開閉等を実行させることになる。
センサ部23は、撮像装置に搭載される各種のセンサを包括的に示している。
センサ部23としては例えばIMU(inertial measurement unit:慣性計測装置)が搭載されており、例えばピッチ、ヨー、ロールの3軸の角速度(ジャイロ)センサで角速度を検出し、加速度センサで加速度を検出することができる。
またセンサ部23としては、例えば位置情報センサ、照度センサ、近接センサ等が搭載される場合もある。
音声入力部25は例えばマイクロホン及びマイクアンプ等を有し、周囲音声を集音した音声信号を出力する。
音声処理部26は、音声入力部25で得られた音声信号についてデジタル音声信号に変換する処理や、AGC処理、音質処理、ノイズリダクション処理などを行う。これらの処理を経た音声データはカメラ信号処理部13やカメラ制御部18に出力される。
例えば音声データは、動画撮像時にはカメラ制御部18において動画に付随する音声データとして処理される。
また音声データは、撮像時などにおける、いわゆるボイスメモとしての音声データとして、カメラ信号処理部13或いはカメラ制御部18において音声ファイルAFとしてファイル化されるようにすることもできる。
音声ファイルAFは、記録制御部14において画像ファイルに対応づけられて記録媒体に記録されたり、通信部16から画像ファイルとともに送信出力されたりすることができる。
<3.情報処理装置の構成>
例えば携帯端末装置などとされる情報処理装置2の構成例を図4に示す。
情報処理装置2のCPU71は、ROM72に記憶されているプログラム、または記憶部79からRAM73にロードされたプログラムに従って各種の処理を実行する。RAM73にはまた、CPU71が各種の処理を実行する上において必要なデータなども適宜記憶される。
CPU71、ROM72、およびRAM73は、バス74を介して相互に接続されている。このバス74にはまた、入出力インタフェース75も接続されている。
入出力インタフェース75には、操作子や操作デバイスよりなる入力部76が接続される。
例えば入力部76としては、キーボード、マウス、キー、ダイヤル、タッチパネル、タッチパッド、リモートコントローラ等の各種の操作子や操作デバイスが想定される。
入力部76によりユーザの操作が検知され、入力された操作に応じた信号はCPU71によって解釈される。
また入出力インタフェース75には、LCD或いは有機ELパネルなどよりなる表示部77や、スピーカなどよりなる音声出力部78が一体又は別体として接続される。
表示部77は各種表示を行う表示部であり、例えば情報処理装置2の筐体に設けられるディスプレイデバイスや、情報処理装置2に接続される別体のディスプレイデバイス等により構成される。
表示部77は、CPU71の指示に基づいて表示画面上に各種の画像処理のための画像や処理対象の動画等の表示を実行する。また表示部77はCPU71の指示に基づいて、各種操作メニュー、アイコン、メッセージ等、即ちGUI(Graphical User Interface)としての表示を行う。
入出力インタフェース75には、ハードディスクや固体メモリなどより構成される記憶部79や、モデムなどより構成される通信部80が接続される場合もある。
通信部80は、インターネット等の伝送路を介しての通信処理や、各種機器との有線/無線通信、バス通信などによる通信を行う。
本実施の形態の場合、通信部80は、撮像装置1との間で、例えば上述のFTP通信、ブルートゥース、WI−FI、NFC等の近距離無線通信、赤外線通信、有線接続通信などによる通信を行う機能を備える。
入出力インタフェース75にはまた、必要に応じてドライブ82が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体81が適宜装着される。
ドライブ82により、リムーバブル記録媒体81からは画像ファイル等のデータファイルや、各種のコンピュータプログラムなどを読み出すことができる。読み出されたデータファイルは記憶部79に記憶されたり、データファイルに含まれる画像や音声が表示部77や音声出力部78で出力されたりする。またリムーバブル記録媒体81から読み出されたコンピュータプログラム等は必要に応じて記憶部79にインストールされる。
情報処理装置2にはテキスト変換エンジン83としてのプロセッサが装備される場合がある。
テキスト変換エンジン83は、例えば音声データを解析してテキストデータに変換する処理を行う。
なお、上述のように外部のテキスト変換エンジン5を利用する場合は、情報処理装置2がテキスト変換エンジン83としてのプロセッサを備えていなくてもよい。
この情報処理装置2では、例えば本開示の処理のためのソフトウエアを、通信部80によるネットワーク通信やリムーバブル記録媒体81を介してインストールすることができる。或いは当該ソフトウエアは予めROM72や記憶部79等に記憶されていてもよい。
例えばこのようなソフトウエア(アプリケーションプログラム)によって、図5のような機能構成が情報処理装置2のCPU71において構築される。
図5には情報処理装置2に設けられる機能として、UI(ユーザインタフェース)制御部31、通信制御部32、テキスト取得部33、データ管理部34、アップロード処理部35を示している。
UI制御部31は、撮像装置1から転送されてくる画像ファイルPFや音声ファイルAFをユーザに提示したり、各種情報の設定や編集等のためのユーザ操作を受け付けたりするユーザインタフェース処理を行う。
ユーザインタフェース処理としては、ユーザに対する表示出力や音声出力等の出力を行ってユーザに操作入力環境を提供する処理、ユーザに対して各種情報の提示のための表示出力や音声出力を行う処理、ユーザによる操作を検知する処理、ユーザの意思を検知/推定する処理などがある。
UI制御部31は、例えばユーザに対する表示出力や音声出力等の出力を行ってユーザに操作入力環境を提供する処理を行う。
或いはUI制御部31は、例えばユーザによる操作を検知する処理を行う。
或いはUI制御部31は、例えばユーザに操作入力環境を提供する処理と、ユーザによる操作を検知する処理の両方を行う。
もちろんUI制御部31は他のユーザインタフェース処理を行ってもよい。
UI制御部31は、音声ファイルAFのボイスメモをテキスト化したボイスメモテキストを、自動的に画像データに付加されたメタデータにおけるキャプションデータの一部として追加する処理をオン/オフすることのできるUI環境を提供する。
またUI制御部31は、ボイスメモテキストを画像データに対応するメタデータとする処理を行った後において画像データとメタデータを含む画像ファイルPFをFTPサーバ4にアップロードする処理を自動的に行うか否かを設定できるUI環境を提供する。又、その場合に音声ファイルAFをアップロードするか否かを設定できるようにもする。
またUI制御部31は、ボイスメモテキストを表示させたり音声再生させたりするUI環境も提供する。
なお、本実施の形態におけるUI制御部31は、メタデータの項目(フィールド)ごとの表示/非表示を切り換え可能とするためのユーザインタフェース処理を行う。また、メタデータの項目ごとの表示名を変更する操作を可能とするためのユーザインタフェース処理を行う。
通信制御部32は、通信部80による通信動作を制御する機能である。
この通信制御部32は、撮像装置1との通信を通信部80に実行させる処理を行う。
テキスト取得部33は、撮像装置1から音声ファイルAFが転送されてきた場合に、音声ファイルAFに含まれるボイスメモをテキスト化したボイスメモテキストを取得する処理を行う。
具体的にはテキスト取得部33は、テキスト変換エンジン83にテキスト化処理を実行させ、ボイスメモテキストを取得する。
或いはテキスト取得部33は、ボイスメモとしての音声データを通信部80からテキスト変換エンジン5に送信し、テキスト変換エンジン5から返信されてくるボイスメモテキストを取得する処理を行う。
データ管理部34は、撮像装置1から送信される画像データを含む画像ファイルPF及び関連するボイスメモを含む音声ファイルAFを受信した後に、音声ファイルAFに含まれるボイスメモについてテキスト取得部33で取得したボイスメモテキストを、画像データに対応するメタデータとする処理を行う機能である。
またデータ管理部34は、撮像装置1から送信されてきた画像ファイルPFや音声ファイルAFの記憶、編集等の処理を行う。例えば画像データの編集、メタデータの付加(タグの付加)、各種動作設定に関する処理などを行う。
アップロード処理部35は、通信部80を介したFTPサーバ4へのアップロード処理を行う機能である。
特にアップロード処理部35は、データ管理部34が音声ファイルAFについてのボイスメモテキストを画像データに対応するメタデータとする処理を行った後に、画像ファイルPF(画像データとメタデータ)をFTPサーバ4にアップロードする処理を行う。アップロード処理部35は、画像ファイルPFとともに音声ファイルAFをFTPサーバ4にアップロードする場合もある。
以上の各機能は、例えば情報処理装置2が本開示の処理を実現するアプリケーションソフトウェアをインストールすることで具備される。
情報処理装置2は、以上の機能のうちUI制御部31を備えることで、メタデータの編集を容易にするための各処理が実行される。
<4.ユーザインタフェース画面>
以下、情報処理装置2の表示部77におけるUI画面について説明する。以下の各画面はCPU71がUI制御部31の機能により表示部77において表示させる画面の例である。説明では、例えば情報処理装置2としてスマートフォンを想定し、その筐体上に形成されたディスプレイにおける表示内容を想定している。
図6は画像一覧画面50を示している。
この画像一覧画面50は、撮像装置1から転送された画像ファイルPFの画像データがサムネイル画像により一覧表示される画面である。
画像一覧画面50には画像一覧領域101が設けられ、この画像一覧領域101に撮像装置1から取り込んだ画像データのサムネイル画像103が一覧表示される。なお一覧表示する対象の画像は、取り込んだ全ての画像としたり、プロテクトされた画像のみとしたりするなどを選択できる。画像の数が多く一画面で表示しきれない場合は、スクロールやページ送りなどにより各画像(サムネイル画像103)が表示される。
各サムネイル画像103に対応して画像情報104が表示される。画像情報104には例えば「DSC00000」などの画像データ名や、プロテクト状態を示すアイコン、FTPアップロードに関するアイコンなどが表示される。
また一覧表示される画像データ(画像ファイルPF)の中にはボイスメモとしての音声ファイルAFが関連付けられているものもある。対応するボイスメモが存在する画像データについては、そのサムネイル画像103上にボイスメモマーク105が表示されるようにしている。
画像一覧画面50にはメニューボタン102が表示される。ユーザがメニューボタン102をタップする等の操作を行うと、表示は後述するメニュー画面55に遷移する。
図7は、メニュー画面55の一例である。メニュー画面55にはメニュー画面55を閉じるための閉じるボタン109が設けられている。
メニュー画面55には、メニュー項目として、FTPアップロードプリセット項目141、IPTCメタデータプリセット項目142、キャプションテンプレート項目143、キャプション用語集項目144、FTP取り込み履歴項目145、取り込み項目146、設定項目147、ボイスメモ自動キャプション付与項目148、サポートページ項目149、MACアドレス確認項目150、データ削除項目151、アカウント項目152が設けられている。もちろんこれらは一例に過ぎず、メニュー項目の内容は多様な例が考えられる。また項目数がさらに多くてもよいし、階層化されても良い。項目数が多い場合はスクロールやページ送りにより各項目が表示される。
ここでは、本実施の形態の処理に関する項目として、設定項目147を選択する操作について説明する。
設定項目147が選択されると、図8に示す設定画面56が表示される。設定画面56には設定項目として、キャプション用語集の同期項目201、取り込み項目202、メタデータ編集設定項目203、自動FTPアップロード項目204が表示される。もちろんこれは一例である。例えば、ボイスメモ自動キャプション付与項目148が図8に示す設定画面56で設定可能な設定項目として表示されてもよい。或いは、取り込み項目202に対する選択操作を行った際に遷移する画面で設定可能な設定項目として表示されてもよい。
この設定画面56でユーザがメタデータ編集設定項目203を操作すると、図9に示すメタデータ編集設定項目画面66が表示される。
メタデータ編集設定項目画面66には、IPTCメタデータ埋め込み方法設定項目205とIPTCフィールド設定項目206が表示される。
IPTCフィールド設定項目206は、IPTCメタデータに含まれる各項目の編集が可能である。
IPTCフィールド設定項目206が選択されると、図10に示すIPTCフィールド設定画面67が表示される。
IPTCフィールド設定画面67は、図10に示すように、IPTCメタデータに含まれる各項目が表示されると共に、各項目に対する操作子や表示部が配置されている。
具体的には、一つの項目ごとに、項目名表示部220、オン/オフ設定表示部221、編集ボタン222が設けられている。
項目名表示部220には、図10に示すように、仕様としてIPTCメタデータの項目ごとに予め決定されているフィールド名が表示されている。例えば、「Caption/Description」や「Description Writers」などである。
なお、「Caption/Description」は前述の「ディスクリプション/キャプション」項目のフィールド名である。また、「Description Writers」は前述の「ディスクリプションライター」項目のフィールド名である。
オン/オフ設定表示部221は、各項目の表示のオン状態またはオフ状態が判別可能なアイコン画像が排他的に表示される。即ち、オン状態のアイコン画像とオフ状態のアイコン画像は項目ごとに何れか一方のみが表示される。
また、オン/オフ設定表示部221は、表示のオン状態とオフ状態を変更可能な操作子としても機能する。
ここで、表示のオン状態とオフ状態について説明する。
表示のオン状態とは、後述するIPTCメタデータの編集画面において編集の必要がある項目に対して設定される状態であり、編集画面に表示される項目であることを示す状態である。
表示のオフ状態とは、後述するIPTCメタデータの編集画面において編集しない項目に対して設定される状態であり、編集画面において非表示とされる項目であることを示す状態である。
即ち、ユーザは、項目ごとに表示のオン状態とオフ状態を切り換えることで、編集画面において編集する項目だけを表示することが可能とされる。
なお、確実に編集対象から外れる項目のみがオフ状態となるように操作してもよい。
編集ボタン222は、IPTCメタデータの各項目の表示名を編集するための操作子として設けられている。
ここで、IPTCメタデータの項目ごとのフィールド名と表示名について説明する。
フィールド名は、前述したように仕様により決定されているものであり、変更不可能とされている。但し、フィールド名はユーザにとって分かりにくいものである場合がある。
そこで、本実施の形態においては、情報処理装置2で動作するプログラム(アプリケーション)上ではユーザが設定した任意の名称で各項目を表示することが可能とされている。即ち、ユーザが設定可能な任意の名称が「表示名」である。
図10に示す状態は、各項目がフィールド名で示されており、表示名が未設定である状態を示している。
なお、IPTCメタデータにおける各項目のうち、「ディスクリプション/キャプション」項目における項目名表示部220を項目名表示部220Aとして着目する。また、「ディスクリプション/キャプション」項目における編集ボタン222を編集ボタン222Aとして着目する。
更に、「ヘッドライン」項目におけるオン/オフ設定表示部221をオン/オフ設定表示部221Bとし、「キーワード]項目におけるオン/オフ設定表示部221をオン/オフ設定表示部221Cとして着目する。
ユーザが「ディスクリプション/キャプション」項目における編集ボタン222Aを操作すると、図11に示すフィールド表示名変更ダイアログ68が重畳表示される。
フィールド表示名変更ダイアログ68には、デフォルト適用項目223、表示名入力欄224、変更項目225、キャンセル項目226が表示される。
デフォルト適用項目223は、デフォルトの表示名、即ち、本例であればフィールド名である「Caption/Description」の文字列が表示名に適用される。
表示名入力欄224は、任意の表示名を入力するためのテキストボックスであり、例えば表示名入力欄224をタップ操作することによりフィールド表示名変更ダイアログ68の下方にソフトウェアキーボード131が表示される。ユーザは、ソフトウェアキーボード131に対する操作を行うことにより、表示名入力欄224に文字列を入力することが可能とされる。
変更項目225は、表示名入力欄224に入力された文字列をフィールドの表示名に適用する際に操作される項目である。図11に示す状態で変更項目225が操作された場合、「ディスクリプション/キャプション」項目の表示名が「説明」に設定される。
キャンセル項目226は、表示名の変更をキャンセルする際に操作される項目であり、キャンセル項目226に対する操作を行うと、表示名入力欄224に入力された文字列は無視されて、フィールド表示名変更ダイアログ68が表示される前の状態へと戻る。
デフォルト適用項目223、変更項目225またはキャンセル項目226が操作されると、フィールド表示名変更ダイアログ68の重畳表示が終了し、IPTCフィールド設定画面67が表示される。
図12は、IPTCフィールド設定画面67の一例であるが、図11において表示名入力欄224に「説明」が入力された状態で変更項目225が操作された場合を示している。
図12の項目名表示部220Aでは、表示名が「説明」に変更されると共に、フィールド名が「Caption/Description」であることが示されている。このように、ユーザは各項目の表示名を理解のし易い文字列に変更することが可能である。但し、フィールド名についての変更は許可されていないため、フィールド名は「Caption/Description」のままとされている。
項目名表示部220Aに表示名とフィールド名の双方が表示されることにより、表示のオン/オフの切り換え対象の項目を見つけやすくすると共に、本来の名称(即ちフィールド名)との関係が明確にされるため、切り換えミスを防止することができる。
図12に示すIPTCフィールド設定画面67において、オン/オフ設定表示部221を操作した場合について説明する。
具体的に、図12の「ヘッドライン」項目におけるオン/オフ設定表示部221Bに対するタップ操作と、「キーワード]項目におけるオン/オフ設定表示部221Cに対するタップ操作を行った場合、図13に示すようなIPTCフィールド設定画面67が表示される。
即ち、「Headline」項目がオフ状態からオン状態へと変更され、「キーワード」項目がオン状態からオフ状態へと変更される。
図6に示す画像一覧画面50の説明に戻る。
画像一覧画面50に対してユーザは画像選択操作を行うことができる。例えばユーザはサムネイル画像103のタップ等の操作により特定の画像データを選択できる。
例えば特定の画像データの選択操作により、図14のようなキャプション編集画面52が表示される。
キャプション編集画面52には、画像欄130、キャプション欄132、ボイスメモ欄133が設けられる。また、キャプション編集画面52の下部には、IPTCメタデータ編集ボタン240、FTPアップロードボタン241、キャプション編集ボタン242、共有ボタン243が配置されている。
画像欄130には、サムネイル画像103と送りボタン107が表示される。表示されるサムネイル画像103は、ユーザが選択した画像データのサムネイル画像である。これにより表示されているキャプション編集画面52は、サムネイル画像103で表される画像データについてのキャプションの編集を行う画面であることが明確にされる。
ユーザは、送りボタン107の操作により、画像一覧画面50で前後に配置される画像データが選択された状態へと切り換えることができる。例えば送りボタン107を操作することで、キャプション編集画面52上でサムネイル画像103が切り換えられる。するとそのキャプション編集画面52は、当該新たなサムネイル画像103で表される画像データについてのキャプションの編集を行う画面となる。
またユーザは例えばピンチ操作やタップ操作などにより、サムネイル画像103で示される画像を大きく表示させることができる。
図14のキャプション編集画面52のキャプション欄132には、上述のIPTCメタデータにおける「ディスクリプション/キャプション」の欄に記述されるキャプションデータが表示されキャプションデータの編集が可能とされる。
キャプション編集画面52には、テンプレートボタン138やボイス入力ボタン139が設けられる。
ユーザはテンプレートボタン138を操作することで、キャプションのテンプレートを呼び出してキャプション欄132に表示させることができる。
またユーザはボイス入力ボタン139を操作することで、キャプションデータを音声により入力することができる。この場合に入力された音声のテキスト化は、ボイスメモのテキスト化と同様に行われれば良い。
キャプション編集画面52のボイスメモ欄133にはボイスメモテキスト領域134が設けられ、ボイスメモテキストが表示される。即ち撮像装置1から音声データとして転送されてきたボイスメモがテキスト化され、ボイスメモ欄133に表示される。これによりユーザはキャプション編集画面52でボイスメモの内容を確認できる。
またボイスメモ欄133には、再生ボタン135、コピーボタン136、削除ボタン137が表示され、ボイスメモに関する操作が可能とされる。
ユーザが再生ボタン135を操作すると、ボイスメモの音声再生が開始される。
例えば音声再生中はボイスメモテキスト領域134、再生ボタン135、コピーボタン136、削除ボタン137の表示に代えてシークバー、現在タイム、総再生長、停止ボタン、一時停止ボタンなどが表示される。
また、ユーザが削除ボタン137を操作すると、ボイスメモの削除が行われる。
ユーザがボイスメモ欄133においてユーザがコピーボタン136を操作すると、ボイスメモテキスト領域134に表示されているボイスメモテキストがシステム上のクリップボード領域にコピーされる。
なお、ボイスメモテキスト領域134は、後述する自動キャプション付与の設定により自動的にキャプション欄132に挿入される場合もある。
例えば図15は、キャプション編集画面52が開かれた状態で、ボイスメモテキストとしてのテキストデータが、キャプションデータとして付加されている例を示している。この場合、「エンタイトルツーベース」がキャプションデータとして先に入力されていたテキストであり、その後に続く「田中選手が2回表に打ちました」というテキストデータが、自動挿入されたボイスメモテキストである。
なお、このようにボイスメモテキストがキャプションデータに自動挿入される場合において、先にキャプションデータのテキストが存在している場合、ボイスメモテキストを、そのキャプションの前に挿入するか、後に挿入することが考えられる。自動挿入である場合は、既入力のキャプションの内容を分かりやすくするため、既入力のキャプションの後にボイスメモテキストを追加することが望ましい。
キャプション編集画面52におけるIPTCメタデータ編集ボタン240が操作されると、後述するIPTCメタデータ編集画面69が表示される。
また、FTPアップロードボタン241が操作されると、キャプション編集画面52に表示中の特定の画像データをFTPサーバ4にアップロードする処理などが実行される。なお、アップロードの際には、画像サイズの設定、データ圧縮などを指定することが可能とされる。
キャプション編集ボタン242が操作されると、図11に示すようなソフトウェアキーボード131が表示され、ソフトウェアキーボード131に対する操作を行うことにより任意の文字入力が可能となる。入力された文字列は、キャプションデータとして当該画像データについてのIPTCメタデータのディスクリプション/キャプションの欄に記述されることになる。
共有ボタン243が操作されると、キャプション編集画面52に表示中の特定の画像データをSNS(Social Networking Service)等を通じて他者が閲覧可能な状態でサーバ装置等にアップロードされる。なお、公開設定によっては、自分のみが閲覧可能とされていてもよい。
ここで、IPTCメタデータ編集ボタン240が操作された場合に表示されるIPTCメタデータ編集画面69の一例について、図16及び図17に示す。
図16は、図12のIPTCフィールド設定画面67の設定状態に応じたIPTCメタデータ編集画面69である。即ち、IPTCメタデータの「ディスクリプション/キャプション」項目の表示名として「説明」が設定され、「ヘッドライン」項目がオフ状態とされ「キーワード」項目がオン状態とされている。
図17は、図13のIPTCフィールド設定画面67の設定状態に応じたIPTCメタデータ編集画面69である。即ち、IPTCメタデータの「ディスクリプション/キャプション」項目の表示名として「説明」が表示され、「ヘッドライン」項目がオン状態とされ「キーワード」項目がオフ状態とされている。
このように、IPTCフィールド設定画面67の設定状態に応じてIPTCメタデータ編集画面69の表示態様が異なる。即ち、ユーザは、編集対象の項目だけをIPTCフィールド設定画面67でオン状態に設定することにより、IPTCメタデータ編集画面69上の表示が見やすくなると共に編集作業の効率化を図ることができる。
また、各項目についての表示名をユーザの任意の文字列に変更することが可能とされることにより、編集対象の項目を間違えてしまうことが防止される。従って、項目ごとに適切なテキスト情報を入力することが可能とされる。
更に、各項目に表示名が設定されている場合には、表示名に加えてフィールド名が表示されるように構成してもよい。これにより、表示名とIPTCメタデータの項目の対応関係が明確となり、編集ミスを防止することができる。
図16及び図17に示したIPTCフィールド設定画面67において、ユーザが任意の項目に対する選択操作を行うと、選択された項目のメタデータを編集する画面が表示される。編集画面では、ソフトウェアキーボード131を用いた文字入力や音声を用いた文字入力が可能とされ、メタデータの編集作業を行うことができる。
個別の項目ごとの編集を終えて図16や図17に示すIPTCメタデータ編集画面69に遷移したタイミングで編集されたメタデータが画像データに付与される。或いは、個別の項目ごとの編集を終えIPTCメタデータ編集画面69に戻った後、更にメタデータ編集画面69から他の画面に遷移する操作を受け付けたタイミングで編集されたメタデータが画像データに付与されるようにしてもよい。
なお、図14に示すキャプション編集画面52においては、戻るボタン106が操作されてキャプション編集画面52から他の画面に遷移するタイミングでキャプション編集画面52で入力されたキャプションデータを画像データに付与する。
なお、それ以外のタイミングで画像データにIPTCメタデータを付与してもよい。例えば、アプリケーションプログラムが使用している記憶領域に編集後のメタデータを記憶しておき、編集対象の画像が変更されたタイミングでIPTCメタデータを画像データに付与してもよい。他にも、画像ファイルPFの送信タイミングでIPTCメタデータを画像データに付与してもよい。
続いてボイスメモの処理やアップロードに関する設定のためのインタフェース画面を説明する。
前述したメニュー画面55における各メニュー項目の中から、設定項目147とボイスメモ自動キャプション付与項目148からの操作について説明する。
ボイスメモ自動キャプション付与項目148は、ボイスメモをテキスト化した場合に、そのボイスメモテキストを自動的にキャプションデータに付加するか否かをユーザが選択できるようにした項目である。
ユーザがボイスメモ自動キャプション付与項目148を操作すると図18のボイスメモ自動キャプション付与設定画面53が表示される。ボイスメモ自動キャプション付与設定画面53には設定スイッチ170が表示され、これによってユーザはボイスメモ自動キャプション付与機能のオン/オフを設定できる。
設定スイッチ170がオンとされると、ボイスメモテキストが得られた場合に、図15に示したように、自動的にそのボイスメモテキストがキャプションデータに挿入される。
設定スイッチ170がオフとされると、そのような自動挿入が行われない。
ボイスメモ自動キャプション付与設定画面53には戻るボタン106が設けられ、戻るボタン106が操作されると図7のメニュー画面55に戻る。設定ボタン170のオン/オフ状態は、戻るボタン106が操作されたときの状態で有効化される。
また図7のメニュー画面55において、ユーザが設定項目147を操作すると図8の設定画面56が表示される。設定画面には設定項目として、キャプション用語集の同期項目201、取り込み項目202、メタデータ編集設定項目203、自動FTPアップロード項目204が表示される。
この設定画面56でユーザが自動FTPアップロード項目204を操作すると、図19の自動アップロード設定画面57が表示される。
自動アップロード設定画面57には設定スイッチ171が表示され、これによってユーザは自動アップロードをオン/オフを設定できる。
自動アップロード機能とは、撮像装置1から画像ファイルPFが転送されてきた際に、設定されているFTPサーバ4に対して自動的にアップロードを行う機能である。
この図19は、設定スイッチ171がオフの状態にある場合を示している。
ユーザが設定スイッチ171をオンに操作すると、図20のように自動アップロードの設定のための表示が行われる。即ちアップロード先表示欄175が表示され、またボイスメモ添付に関する設定スイッチ172や、JPEG画質に関する設定スイッチ173が表示される。
図20ではアップロード先表示欄175には、まだアップロード先が指定されていないことが示されている。ユーザが、アップロード先を指定する操作を行うことで、図21のように、例えばユーザがFTP設定の際に付与した名称「XYZ」などにより特定されるアップロード先が表示される。
ボイスメモ添付に関する設定スイッチ172により、ユーザは自動アップロードの際に、ボイスメモとしての音声ファイルAFを画像ファイルPFと共にアップロードする否かを設定することができる。例えば図21のように設定スイッチ172をオンとすると、自動アップロード処理が行われる際、音声ファイルAFもアップロード対象とされる。
JPEG画質に関する設定スイッチ173により、ユーザはアップロードする画像データの圧縮率や画サイズを設定することができる。
設定スイッチ173をオンとすると、図21のように圧縮率設定バー176や長辺ピクセル設定部177及び設定スイッチ174が表示される。
ユーザは圧縮率設定バー176を操作して圧縮率を指定することができる。また設定スイッチ174により長辺のピクセル数の設定を行うことができる。
以上の自動アップロード設定画面57におけるユーザ操作は、戻るボタン106が操作されて図8の設定画面56に戻ることで有効化される。
なお設定画面56において戻るボタン106が操作されると図7のメニュー画面に戻る。
<5.画像取り込み時の処理例>
情報処理装置2が実行する各種処理のうち、まず撮像装置1から画像ファイルPFを取り込む際の処理例について、図22,図23,図24で説明する。
なお以下説明する各処理例はCPU71において、アプリケーションソフトウェアによって実現される図5で説明した機能により実行される処理となる。
図22、図23は一連のフローチャートを分けて示したもので、「C1」で接続関係を示している。
図22のステップS101でCPU71は、撮像装置1から画像ファイルPFの取り込み処理を行う。
撮像装置1からの画像ファイルPFの取り込み処理は、例えば情報処理装置2と撮像装置1の間の通信により行われるが、例えばユーザが情報処理装置2側、或いは撮像装置1側で所定の操作を行うことで、画像ファイルPFの転送が開始される。
撮像装置1は転送対象として選択された画像ファイルPFをFTP通信により情報処理装置2に転送する処理を行う。またこの場合、画像ファイルPFに関連付けられたボイスメモを有する音声ファイルAFが存在する場合、その音声ファイルAFも情報処理装置2に転送する。
情報処理装置2側では、CPU71はステップS101の処理として、順次転送されてくる画像ファイルPF及び音声ファイルAFの取り込み処理を行うことになる。
ここで、撮像装置1と情報処理装置2の間では、画像ファイルPFと関連付けられた音声ファイルAFが存在する場合は、音声ファイルAFを先に送信し、その後に画像ファイルPFを送信するという規則を決めておく。
これによりCPU71は、1つの音声ファイルAFを受信した場合は、その音声ファイルAFは次に受信される画像ファイルPFに関連付けられたものであると判定することができる。ステップS102では、CPU71は、このような規則に則って、受信した音声ファイルAFを受信した画像ファイルPFに紐づけて管理する処理を行う。
なお、これ以外に、例えば画像ファイルPFのメタデータに、関連付けられた音声ファイルAFを特定する情報が含まれるようにしておくことも考えられる。ステップS102では、メタデータを参照して、受信した音声ファイルAFを受信した画像ファイルPFに紐づけて管理する処理を行うようにしてもよい。
1又は複数の画像ファイルPFの取り込みが完了したら、CPU71はステップS103からステップS110に進み、取り込んだ画像ファイルPFについて、音声ファイルAFが関連付けられているものがあるか否かを判定する。
取り込んだファイルが全て画像ファイルPFのみであり、音声ファイルAFが存在しない場合は、CPU71はステップS110から図23のステップS120に進む。
一方、1つでも音声ファイルAFが関連付けられた画像ファイルPFが存在した場合、CPU71は図22のステップS110からステップS111に進む。
ステップS111でCPU71は、今回取り込んだ画像ファイルPFのうちで、音声ファイルAFが関連付けられた1又は複数の画像ファイルPFのうちの1つを処理対象として選択する。
そしてステップS112でCPU71は、処理対象とした画像ファイルPFに関連付けられた音声ファイルAFのボイスメモを対象として、テキスト化処理を行う。
ステップS113では、CPU71はテキスト化が正常に行われたか否かを判定する。
テキスト化が正常に行われボイスメモテキストが取得できた場合、CPU71はステップS113からステップS114に進み、そのボイスメモテキストを、処理対象の画像ファイルPFに対応するボイスメモテキストとして例えば記憶部79に保存する処理を行う。
ステップS115でCPU71は、自動キャプション付与機能がオンとされているか否かを確認する。自動キャプション付与機能は、図18のボイスメモ自動キャプション付与設定画面53によりユーザが任意にオン/オフを設定できる機能である。
自動キャプション付与機能がオンでなければCPU71はステップS117に進む。
自動キャプション付与機能がオンであれば、CPU71はステップS116に進み、ボイスメモテキストをキャプションデータに挿入する処理を行う。即ちIPTCメタデータにおけるディスクリプション/キャプションフィールドにボイスメモテキストを書き込む処理を行う。ディスクリプション/キャプションフィールドに既にキャプションデータが書き込まれている場合は、CPU71は、その後に続けてボイスメモテキストを書き込むようにする。なお、ディスクリプション/キャプションフィールドをボイスメモテキストで上書きするようにしてもよい。また、その場合には、ユーザに対する上書き確認を行ってもよいし、確認を行わずに処理負担を軽減してもよい。更には、ボイスメモテキストの挿入位置や上書きの可否などを選択可能にしてもよいし、編集画面をユーザに提示してもよい。
CPU71は、このような自動キャプション付与の処理を行った上でステップS117に進む。
ステップS112のテキスト化が正常に行われなかった場合、例えば処理エラーや通信エラー等により、ボイスメモテキストが取得できなかった場合は、CPU71はステップS113からステップS117に進む。この場合、特にテキスト化処理のリトライは行わないことで、転送時の処理が長引くことを回避している。後述のように他にもテキスト化の機会はあるためである。但しもちろん所定回数のテキスト化処理のリトライを行うようにしてもよいし、テキスト化せずに処理を進めるか否かをユーザに選択させてもよい。
或る画像ファイルPFについて、以上のテキスト化処理やボイスメモ自動キャプション付与等の処理を行ってステップS117に進んだ場合、或いはテキスト化が正常完了せずにステップS117に進んだ場合、CPU71は、他に同様の処理を行うべき画像ファイルPFが残っているか否かを確認し、残っていればステップS111に戻って、その1つを処理対象とし、上記同様の処理を行う。
音声ファイルAFが関連付けられた全ての画像ファイルPFについて少なくとも1回はステップS112のテキスト化処理を実行することで、ステップS117で全てのテキスト化終了と判定し、図23のステップS120に進む。
ステップS120でCPU71は、自動アップロード機能がオンとされているか否かを確認する。自動アップロード機能は、即ち図19、図20、図21に示した自動アップロード設定画面57でユーザが任意にオン/オフを設定できる機能である。
自動アップロード機能がオンでなければCPU71はステップS120から画像取り込み時の一連の処理を終える。
自動アップロード機能がオンであるときは、CPU71はステップS120からステップS121に進み、アップロードファイルの準備処理を行う。
このアップロードファイルの準備処理を図24に詳しく示す。
図24のステップS141でCPU71は、アップロード対象とする画像ファイルPFの1つを特定する。これは今回撮像装置1から転送されてきた画像ファイルPFのうちの1つを準備処理の対象とするという意味である。
1つの画像ファイルPFを処理対象としたら、CPU71はステップS142で画サイズ指定がされているか否かを確認する。これはユーザが図21の自動アップロード設定画面57における長辺ピクセル設定部177及び設定スイッチ174で設定した内容を確認することになる。画サイズ指定がされていればCPU71はステップS143でそれを反映するピクセル数の変換処理を行う。
ステップS144でCPU71は、圧縮率の指定がされているか否かを確認する。これは図21の自動アップロード設定画面57における圧縮率設定バー176による圧縮率の指定状態を確認することになる。圧縮率が指定されて圧縮が行われる設定とされているときは、CPU71はステップS145で、指定の圧縮率による圧縮処理を行う。
ステップS146でCPU71は、音声ファイルAFの添付有無を確認する。即ち図21の設定スイッチ172のオン/オフによる、ユーザのボイスメモについてのアップロード有無の設定を確認することになる。
音声ファイルAFのアップロードが選択されている場合は、CPU71はステップS147に進み、現在処理対象としている画像ファイルPFについて関連付けられた音声ファイルAFが存在するか否かを確認する。関連する音声ファイルAFが存在する場合は、CPU71はステップS149に進み、現在の処理対象の画像ファイルPF(画像データとメタデータ)、及び音声ファイルAFを、アップロードするファイルとしてセットする。
ステップS146で、ユーザによる設定として音声ファイルAFのアップロードが選択されていないことが確認された場合、或いはステップS147で現在処理対象としている画像ファイルPFについて関連付けられた音声ファイルAFが存在しない場合は、CPU71はステップS148に進み、現在の処理対象の画像ファイルPF(画像データとメタデータ)を、アップロードするファイルとしてセットする。
ステップS150では、今回撮像装置1から取り込んだ全ての画像ファイルPFについて、以上の準備処理が完了したか否かを確認する。残りの画像ファイルPFが存在する場合は、CPU71はステップS141に戻り、残りの画像ファイルPFの1つを処理対象として特定し、同様の処理を行う。
今回撮像装置1から取り込んだ全ての画像ファイルPFについて、以上の準備処理が完了したとステップS150において判定した場合、CPU71は図24に示すアップロードファイルの準備処理を終える。
即ち、CPU71は、図23のステップS122に進む。
ステップS122でCPU71は、自動アップロード設定により指定されたFTPサーバ4に対するFTP接続及びログインの処理を行う。
そしてログインが完了したら、CPU71はステップS123からステップS130に進みFTPアップロード処理を実行する。即ちアップロードファイルの準備処理でアップロードするものとしてセットした画像ファイルPFや音声ファイルAFを、順次FTP送信していく処理を行う。
なおFTPサーバ4と通信ができなかった場合、或いは通信できてもログインできなかった場合は、CPU71はエラーとしてステップS124からステップS125に進み、所定のエラー処理を行う。例えばユーザに自動アップロード処理のエラーを通知する。そして、撮像装置1からの画像ファイルPFの取り込み時の一連の処理を終える。
ステップS130でのFTPアップロードが正常完了した場合は、CPU71はステップS131からステップS133に進み、ユーザに完了通知を行って一連の処理を終える。この場合、撮像装置1からの画像ファイルPFの取り込みの際に、FTPサーバ4へのアップロードまでが自動的に行われたことになる。
さらにボイスメモ自動キャプション付与機能がオンであれば、そのアップロードされる画像ファイルPFにおいては、関連付けられた音声ファイルAFのボイスメモがテキスト化されたボイスメモテキストが、IPTCメタデータに付加されたものとなっていることになる。
FTPサーバ4へのアップロード処理においてエラーが生じ、正常完了できなかった場合は、CPU71はステップS132からステップS134に進み、所定のエラー処理を行う。例えばユーザに自動アップロード処理のエラーを通知する。そして、撮像装置1からの画像ファイルPFの取り込み時の一連の処理を終える。
<6.テキスト化及びキャプション編集を含む処理例>
続いて図6の画像一覧画面50が表示された状態から図14等のキャプション編集画面52に遷移した場合の処理例について、図25,図26,図27で説明する。
なお図25,図26,図27は一連のフローチャートを分けて示したもので、「C2」「C3」「C4」「C5」「C6」で接続関係を示している。
図25のステップS201は、CPU71が画像一覧画面50を表示させている状態とする。
上述のように画像一覧画面50においてユーザがある画像を指定する操作を行うと、その画像データについてのキャプション編集画面52を表示させる。このとき、まだ当該指定された画像データ(画像ファイルPF)についてはボイスメモのテキスト化が未実行であれば、この機会にテキスト化を行うようにしている。
画像一覧画面50においてユーザによる画像指定操作を検知したら、CPU71はステップS202からステップS203に進む。
ステップS203でCPU71は、当該指定された画像データ(画像ファイルPF)について関連付けられた音声ファイルAFが存在するか否かを確認する。
関連付けられた音声ファイルAFが存在しなければステップS220に進み、CPU71は当該指定された画像データについてのキャプション編集画面52を表示させる。この場合は、ボイスメモが存在しないため、キャプション編集画面52においてボイスメモ欄133は表示させなくてもよい。
関連付けられた音声ファイルAFが存在する場合は、CPU71はステップS204に進み、既にボイスメモのテキスト化が行われ、ボイスメモテキストが記憶されているか否かを確認する。既に記憶されていればステップS220に進み、CPU71は当該指定された画像データについてのキャプション編集画面52を表示させる。この場合は、図14のようにボイスメモテキスト領域134を表示したボイスメモ欄133が表示されることになる。また自動キャプション付与機能がオンとされてボイスメモテキストがキャプションデータに挿入されているのであれば、図19のように、キャプション欄132におけるキャプションデータにもボイスメモテキストが追加されている状態となる。
ボイスメモが存在するが未テキスト化であると判定した場合、CPU71はステップS205に進み、指定された画像ファイルPFに関連付けられた音声ファイルAFのボイスメモを対象として、テキスト化処理を行う。例えばボイスメモとしての音声データをテキスト変換エンジン5に送信し、テキスト化されたデータを受信する。或いは、情報処理装置2にテキスト変換エンジン83が搭載されている場合は、テキスト変換エンジン83によりテキスト化処理を行ってもよい。
テキスト化が正常に行われボイスメモテキストが取得できた場合、CPU71はステップS206からステップS207に進み、そのボイスメモテキストを、処理対象の画像ファイルPFに対応するボイスメモテキストとして例えば記憶部79に保存する処理を行う。
ステップS208でCPU71は、自動キャプション付与機能がオンとされているか否かを確認する。自動キャプション付与機能は、図18のボイスメモ自動キャプション付与設定画面53によりユーザが任意にオン/オフを設定できる機能である。
自動キャプション付与機能がオンでなければCPU71はステップS220に進む。この場合、キャプション編集画面52ではボイスメモ欄133が表示され、キャプション欄132では、その時点までに入力されているキャプションデータが表示される。
一方、自動キャプション付与機能がオンであれば、CPU71はステップS209に進み、ボイスメモテキストをキャプションデータに挿入する処理を行う。即ちIPTCメタデータにおけるディスクリプション/キャプションフィールドにボイスメモテキストを書き込む処理を行う。前述したように、ディスクリプション/キャプションフィールドに既にキャプションデータが書き込まれている場合は、CPU71は、その後に続けてボイスメモテキストを書き込むようにする。
CPU71は、このような自動キャプション付与の処理を行った上でステップS220に進む。この場合、キャプション編集画面52は図15のように、キャプション欄132におけるキャプションデータにもボイスメモテキストが追加されている状態となる。
ステップS205のテキスト化が正常に行われなかった場合、CPU71はステップS206からステップS220に進む。この場合は、ボイスメモがテキスト化できていないため、キャプション編集画面52においてボイスメモ欄133を表示させないことが考えられる。但しボイスメモマーク105により、ユーザにボイスメモの存在を明示することが考えられる。
キャプション編集画面52を表示させた状態で、CPU71の処理は図26のステップS221に進む。CPU71は、キャプション編集画面52上での各種のユーザ操作を監視する。即ちステップS221,S222,S223,S224,S225,図27のステップS226,S227,S228,S229のループで各操作を監視する。
図26のステップS221ではCPU71は、戻るボタン106による画面遷移、即ち画像一覧画面50への遷移の操作を監視する。この操作を検知した場合は、CPU71はステップS240でキャプションの保存処理を行って図25のステップS201に戻る。つまりその時点でキャプション欄132に表示されているキャプションデータがIPTCメタデータにおけるディスクリプション/キャプションフィールドのデータとして保存される。
CPU71はステップS222で、キャプション入力に関する操作を監視する。文字入力或いはボイス入力、或いはテンプレート要求など、キャプション入力に関連する操作に応じてCPU71はステップS241で入力対応処理を行う。
入力対応処理では、例えば、ソフトウェアキーボード131の表示処理が行われる。また、ソフトウェアキーボード131の操作に応じた文字入力や削除処理、或いはキャレット位置の変更処理などが行われる。また、コピー操作やペースト操作に応じたコピー処理やペースト処理なども行われる。
CPU71はステップS223でユーザの再生ボタン135の操作を監視する。再生ボタン135の操作を検知した場合、CPU71はステップS242に進み、音声再生を開始させる制御を行う。
CPU71はステップS224でユーザの一時停止ボタンの操作を監視する。一時停止ボタンの操作を検知した場合、CPU71はステップS243に進み、音声再生を一時停止させる制御を行う。なお図示していないが、この場合、一時停止ボタンは再生ボタン135の表示に切り換えられる。
CPU71はステップS225でユーザの停止ボタンの操作を監視する。停止ボタンの操作を検知した場合、CPU71はステップS244に進み、音声再生を停止させる制御を行う。この場合、ボイスメモ欄133の表示は図14の状態に戻すようにする。
CPU71は図27のステップS226でユーザのコピーボタン136の操作を監視する。コピーボタン136の操作を検知した場合、CPU71はステップS245に進み、クリップボードにボイスメモテキストをコピーする処理を行う。そしてステップS246でCPU71は、コピーに関するメッセージの表示を所定時間、或いは次のユーザ操作の検知時点まで行う。
なお、クリップボードにコピーされたボイスメモテキストについては、その後CPU71がステップS222でペースト操作を検知した場合に、ステップS241でキャプションデータとしてペーストされることになる。
CPU71はステップS227でユーザの削除ボタン137の操作を監視する。削除ボタン137の操作を検知した場合、CPU71はステップS247に進み、削除してよいかをユーザに確認するための確認ダイアログを表示させる。削除の許可を示す操作をユーザが行ったことにより、CPU71はステップS248からステップS250へ進み、ボイスメモに関する削除処理を行う。
一方、削除の不許可を示す操作をユーザが行ったことにより、CPU71はステップS248からステップS249へと進み、削除をキャンセルする操作の有無を検出する。ユーザがキャンセルの意思表示をした場合は、CPU71は削除処理を実行せず、ステップS249からステップS221へと戻ることでユーザ操作の監視に戻る。キャンセルの意思表示がなされなかった場合、CPU71は再度ステップS247の処理を実行する。即ち、削除を許可する操作やキャンセルする操作を行わない限り、CPU71はステップS247,S248及びS249の各処理を繰り返す。
CPU71はステップS228で、画像拡大操作を監視する。例えばサムネイル画像103に対するピンチ操作やダブルタップなどとして画像拡大操作が行われたら、個別の画像が拡大して表示される個別画像画面の表示を行う。
フローチャートでの図示は省略するが、個別画像画面に遷移した後は、所定の操作に応じて異なる画像が選択されたり、画像一覧画面50に戻ったり、キャプション編集画面52に遷移するようにされる。
CPU71はステップS229で、他の画像の選択操作を監視する。即ちキャプション編集画面52における送りボタン107の操作を監視する。送りボタン107の操作を検知したら、CPU71は図25のステップS203に進む。つまり前又は後の画像が新たに指定されたとして、その指定された画像データについてのステップS203からステップS209の処理を上記同様に行い、ステップS220で、その画像データについてのキャプション編集画面52の表示を行う。
CPU71はステップS230でIPTCメタデータ編集ボタン240が操作されたか否かを監視する。IPTCメタデータ編集ボタン240に対する操作を検出した場合、CPU71はステップS231において、IPTCメタデータ編集画面69(図16、図17参照)を表示させる処理を行う。IPTCメタデータ編集画面69の表示の際には、例えば記憶部79からIPTCメタデータの各項目の表示のオン/オフ設定を取得し、それに応じた項目の表示を行う。即ち、一部の項目について非表示となるように処理を行う。
以上のように1つの画像データが指定されるときに、テキスト化処理や自動キャプション付与機能の処理が行われる場合がある。またキャプション編集画面52においてはボイスメモテキストの表示、再生、削除、コピー、キャプションデータへのペースト、手動や音声によるキャプション入力などが可能とされる。
<7.アップロード時の処理例>
FTPサーバ4へのアップロード時の処理を図28に示す。例えばユーザによってアップロードする画像ファイルPFやアップロード先のFTPサーバ4が指定され、アップロード実行の指示が行われることにより、図28のアップロード処理が開始される。
CPU71はステップS301でアップロードファイルの準備処理を行う。これは上述した図24と同様の処理となる。
CPU71はステップS322で、ユーザが指定したアップロード先のFTPサーバ4に対するFTP接続及びログインの処理を行う。
そしてログインが完了したら、CPU71はステップS323からステップS330に進みFTPアップロード処理を実行する。即ちアップロードファイルの準備処理でアップロードするものとしてセットした画像ファイルPFや音声ファイルAFを、順次FTP送信していく処理を行う。
なおFTPサーバ4と通信ができなかった場合、或いは通信できてもログインできなかった場合は、CPU71はエラーとしてステップS324からステップS325に進み、所定のエラー処理を行う。例えばユーザにアップロード処理のエラーを通知する。そしてアップロード処理をエラー終了とする。
ステップS330でのFTPアップロードが正常完了した場合は、CPU71はステップS331からステップS333に進み、ユーザに完了通知を行ってアップロード処理を終える。
アップロードされた画像ファイルPFにおいては、ボイスメモテキストが、自動キャプション付与機能により、もしくはユーザのコピー/ペースト操作により、IPTCメタデータにおけるキャプションデータとして反映される状態となっていることが想定される。
またユーザの設定に応じて音声ファイルAFが共にアップロードされる場合も想定される。
FTPサーバ4へのアップロード処理においてエラーが生じ、正常完了できなかった場合は、CPU71はステップS332からステップS334に進み、所定のエラー処理を行う。例えばユーザにアップロード処理のエラーを通知する。そしてアップロード処理をエラー終了とする。
<8.IPTCフィールド設定画面に関する処理>
図10等に示すIPTCフィールド設定画面67が表示された状態において情報処理装置2が実行する処理の一例について、図29を参照して説明する。
CPU71はステップS401でオン/オフ設定表示部221に対する操作を監視する。
オン/オフ設定表示部221に対する操作が行われたと判定した場合、CPU71はステップS402で切換処理を行う。切換処理では、IPTCメタデータの各項目のうち、操作対象の項目についてオン状態とオフ状態を切り換える処理を行う。
切換処理を終えたCPU71は再度ステップS401の処理へと戻る。
CPU71はステップS403において、編集ボタン222に対する操作を監視する。
編集ボタン222に対する操作が行われたと判定した場合、CPU71はステップS404で図11に示すフィールド表示名変更ダイアログ68の表示を行う。これにより、フィールドの表示名を任意の文字列に変更することが可能とされる。
CPU71はステップS404の処理を終えた後、フィールド表示名変更ダイアログ68を表示した状態で行われるユーザの各種操作を検出し対応する処理を行う。例えば、前述したように表示名の入力操作を検出し表示名入力欄224に入力文字を表示させる処理や、入力された文字列を表示名として決定する操作を検出しフィールドの表示名を記憶する処理などを行う。
フィールド表示名変更ダイアログ68の表示を終了させると共に、CPU71は再度ステップS401の処理へと戻る。
CPU71はステップS405において戻るボタン106に対する操作など、画面遷移操作を監視する。
例えば、戻るボタン106が操作されたと判定された場合、CPU71はステップS406においてメタデータ編集設定項目画面66を表示させる処理を行う。なお、IPTCフィールド設定画面67から他の画面へ遷移する際にCPU71は画面上に反映された各種設定状況を記憶部79に記憶する処理を行う。これにより、IPTCメタデータの項目ごとの表示/非表示の設定や、フィールドごとの表示名などが記憶され、図17などのIPTCメタデータ編集画面69の表示の際に、ユーザにとって最適な表示を行うことができる。
CPU71は、IPTCフィールド設定画面67が表示されている間、図29に示す一連の処理を繰り返す。
<9.まとめ及び変形例>
以上の実施の形態では次のような効果が得られる。
実施の形態の情報処理装置2は、画像に付与されるメタデータ(IPTCメタデータなど)のフィールド(項目)ごとの表示のオン/オフ切換操作を検出する処理を行うユーザインタフェース制御部(UI制御部31)を備えている。
これにより、メタデータに含まれるフィールドのうちユーザが編集対象とするもののみを表示させるような操作が可能とされている。
従って、ユーザにとって編集対象のフィールドを探しやすい環境を提供すると共に、メタデータの編集作業の効率化を図ることができる。
図29のIPTCフィールド設定画面67に関する処理例で説明したように、ユーザインタフェース制御部(UI制御部31)は、検出した切換操作に基づいてメタデータ(IPTCメタデータなど)のフィールド(項目)の表示可否を制御する処理を行ってもよい。
これにより、ユーザの切換操作の結果が表示に反映される。
従って、メタデータの編集作業を行うユーザのとって使い勝手のよい表示を行うことができる。
図29のIPTCフィールド設定画面に関する処理例で説明したように、表示可否の設定を記憶する記憶部79を備えていてもよい。
これにより、ユーザの切換操作の結果が保存され、表示の際に利用される。
従って、メタデータの項目ごとになされるユーザの切換操作に応じて、ユーザが編集対象とするもののみが表示される環境を実際に提供することができる。
図16及び図17のIPTCメタデータ編集画面69で説明したように、ユーザインタフェース制御部(UI制御部31)は、表示可否に基づいて表示されたメタデータ(IPTCメタデータなど)のフィールド(項目)から編集対象のフィールド(項目)を選択する操作を検出する処理を行ってもよい。
これにより、ユーザは、編集対象の項目を編集することが可能とされる。特に、編集対象の項目のみを表示するように表示のオン/オフの切り換えが可能とされているため、より編集対象の項目を選択し易くされる。
従って、編集作業の効率化を図ることができる。
図10のIPTCフィールド設定画面67で説明したように、ユーザインタフェース制御部(UI制御部31)は、フィールド(IPTCメタデータの項目など)ごとの表示名を編集可能とするユーザインタフェース処理を行ってもよい。
これにより、メタデータのフィールド名が分かり難い場合などに異なる表示名を付与するための操作が可能とされる。
従って、ユーザが編集対象のフィールドを探しやすい環境を提供すると共に、メタデータの編集作業の効率化を図ることができる。
図12の項目名表示部220Aについて説明したように、ユーザインタフェース制御部(UI制御部31)は、フィールド名の編集ができないようにユーザインタフェース処理を行ってもよい。
これにより、例えば仕様で決定されているフィールド名が変更されて、メタデータに基づく画像ファイルの分類処理などが正常に動作しなくなってしまうことが防止される。
図16及び図17のIPTCフィールド設定画面67で説明したように、ユーザインタフェース制御部(UI制御部31)は、メタデータ(IPTCメタデータなど)としてのテキスト情報を編集する操作を検出する処理を行ってもよい。
これにより、ユーザはメタデータのテキスト情報の編集操作が可能とされる。
従って、編集作業の効率化を図ることができる。
図1を用いて情報処理装置2について説明したように、情報処理装置2は携帯端末装置であることが望ましい。
これにより、撮像装置1で撮影した画像をその場で情報処理装置2としての携帯端末装置に転送することができ、素早くメタデータの編集を行うことができる。特に、編集対象のメタデータの項目のみが編集対象として表示されることにより、編集作業を更に効率化することができる。
図3を用いて説明したように、メタデータはIPTCメタデータとされてもよい。団体等によってフォーマット化されたメタデータとされることにより、上述した技術を広範囲に適用することができる。
図25のフローチャートの説明においては、画像一覧画面50からキャプション編集画面52に遷移する際にボイスメモのテキスト化が済んでいない場合にテキスト化処理を実行する例を説明したが、キャプション編集を速やかに行うために他のタイミングでテキスト化処理を実行するようにしてもよい。
例えば、図22のステップS112において撮像装置からの画像取り込み時におけるテキスト化処理を実行する例を説明した。このとき、ステップS113で正常完了しなかったと判定した場合に、ボイスメモのテキスト化が失敗したことを通知するダイアログ表示を行い、該ダイアログ画面にテキスト化を再度行うためのリトライボタンを配置してもよい。即ち、ユーザがリトライボタンを操作することにより、再度テキスト化処理が実行されるように構成してもよい。
また、上述では、画面遷移以外のタイミングで画像データにIPTCメタデータを付与してもよい旨を記載したが、その際には、IPTCメタデータを付与する画像ファイルPFを選択可能とすることで、任意の数の画像ファイルPFを対象としてIPTCメタデータの付与を行えるようにしてもよい。
例えば、図7のメニュー画面55のIPTCメタデータプリセット項目142を操作することで任意のIPTCメタデータのプリセットデータを作成できる。更に、ユーザは、画像一覧画面50において任意の数の画像を選択した後に所定の操作を行うことにより、選択された複数の画像ファイルPFに一括してIPTCメタデータのプリセットデータを付与することが可能とされる。
IPTCメタデータのプリセットデータの生成は、新規に作成可能である他、既存のプリセットデータを編集することで新規のプリセットデータとすることも可能である。また、プリセットデータの一覧の表示操作や、一部のプリセットデータの削除操作や、作成済みのプリセットデータに対する編集操作などが可能とされていてもよい。
プリセットデータの一覧から任意のプリセットデータを選択し、その後に付与対象の画像ファイルPFを選択することにより、1または複数の画像ファイルPFにIPTCメタデータのプリセットデータを付与可能とされてもよい。
IPTCメタデータは上述したアプリケーションプログラムを用いて生成されるだけでなく、他の情報処理装置などから取得可能とされていてもよい。例えば、他の情報処理装置で生成されたIPTCメタデータのプリセットデータをxmp(Extensible Metadata Platform)ファイルとして情報処理装置2のローカルストレージに取り込み、該ローカルストレージからアプリケーションプログラムが管理する記憶領域(アプリケーションプログラムが使用するDB)にプリセットデータとして記憶することが可能とされる。該記憶領域に記憶されたプリセットデータは、情報処理装置2でアプリケーションプログラムを用いて生成されたプリセットデータと同様に取り扱われる。
アプリケーションプログラムが管理する記憶領域に記憶する際には、IPTCメタデータの各項目のうち、アプリケーションプログラムの処理対象の項目のみがプリセットデータとして記憶される。例えば、IPTCメタデータの仕様改訂によって新たに追加された項目がアプリケーションプログラムで扱うことができない場合には、処理対象外としてもよい。この場合には、処理対象の項目のみがアプリケーションプログラムが管理する記憶領域にプリセットデータとして記憶される。
或いは、未知のツールによって作成された項目などが処理対象外とされることもある。
なお、IPTCメタデータのプリセットデータは、ユーザごと(アカウントごと)に記憶される。例えば、IPTCメタデータのプリセットデータはユーザIDに紐付けられて管理される。ユーザごとのプリセットデータは、共有可能とされることにより他のユーザが使用可能とされてもよい。
IPTCメタデータのプリセットデータの付与において、付与対象の画像ファイルPFにIPTCメタデータが既に付与されている場合は、IPTCメタデータの上書きを行う。なお、IPTCメタデータの上書きの可否をユーザに確認する処理を実行してもよい。また、IPTCメタデータの項目のうち、追記が可能な項目については、プリセットデータの付与前に書き込まれていたメタデータに今回付与するプリセットデータを続けて書き込むことにより、双方の情報が画像ファイルPFに付与されるようにしてもよい。
実施の形態のプログラムは、図22から図29に示す各処理を、例えばCPU、DSP等、或いはこれらを含むデバイスに実行させるプログラムである。
即ち、実施の形態のプログラムは、画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を情報処理装置に実行させるプログラムである。
このようなプログラムにより、上述した情報処理装置2を、例えば携帯端末装置やパーソナルコンピュータ、その他の情報処理が実行できる機器において実現できる。
このような情報処理装置2を実現するプログラムはコンピュータ装置等の機器に内蔵されている記録媒体としてのHDDや、CPUを有するマイクロコンピュータ内のROM等に予め記録しておくことができる。
あるいはまた、フレキシブルディスク、CD−ROM(Compact Disc Read Only Memory)、MO(Magneto Optical)ディスク、DVD(Digital Versatile Disc)、ブルーレイディスク(Blu-ray Disc(登録商標))、磁気ディスク、半導体メモリ、メモリカードなどのリムーバブル記録媒体に、一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は、いわゆるパッケージソフトウェアとして提供することができる。
また、このようなプログラムは、リムーバブル記録媒体からパーソナルコンピュータ等にインストールする他、ダウンロードサイトから、LAN(Local Area Network)、インターネットなどのネットワークを介してダウンロードすることもできる。
またこのようなプログラムによれば、実施の形態の情報処理装置2の広範な提供に適している。例えばスマートフォンやタブレット等の携帯端末装置、携帯電話機、パーソナルコンピュータ、ゲーム機器、ビデオ機器、PDA(Personal Digital Assistant)等にプログラムをダウンロードすることで、当該スマートフォン等を、本開示の情報処理装置2として機能させることができる。
なお、本明細書に記載された効果はあくまでも例示であって限定されるものではなく、また他の効果があってもよい。

<10.本技術>
なお本技術は以下のような構成も採ることができる。
(1)
画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を行うユーザインタフェース制御部を備えた
情報処理装置。
(2)
前記ユーザインタフェース制御部は、検出した前記切換操作に基づいて前記メタデータのフィールドの表示可否を制御する処理を行う
上記(1)に記載の情報処理装置。
(3)
前記表示可否の設定を記憶する記憶部を備えた
上記(2)に記載の情報処理装置。
(4)
前記ユーザインタフェース制御部は、前記表示可否に基づいて表示された前記メタデータのフィールドから編集対象のフィールドを選択する操作を検出する処理を行う
上記(2)から上記(3)の何れかに記載の情報処理装置。
(5)
前記ユーザインタフェース制御部は、前記フィールドごとの表示名を編集可能とするユーザインタフェース処理を行う
上記(1)から上記(4)の何れかに記載の情報処理装置。
(6)
前記ユーザインタフェース制御部は、フィールド名の編集ができないように前記ユーザインタフェース処理を行う
上記(5)に記載の情報処理装置。
(7)
前記ユーザインタフェース制御部は、前記メタデータとしてのテキスト情報を編集する操作を検出する処理を行う
上記(1)から上記(6)の何れかに記載の情報処理装置。
(8)
携帯端末装置である
上記(1)から上記(7)の何れかに記載の情報処理装置。
(9)
前記メタデータはIPTCメタデータとされた
上記(1)から上記(8)の何れかに記載の情報処理装置。
(10)
画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を
情報処理装置が実行する情報処理方法。
(11)
画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を
情報処理装置に実行させるプログラム。
1 撮像装置
2 情報処理装置
4 FTPサーバ
6 ネットワーク
31 UI制御部
67 IPTCフィールド設定画面
68 フィールド表示名変更ダイアログ
69 IPTCメタデータ編集画面
71 CPU
79 記憶部
221 オン/オフ設定表示部
222 編集ボタン

Claims (11)

  1. 画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を行うユーザインタフェース制御部を備えた
    情報処理装置。
  2. 前記ユーザインタフェース制御部は、検出した前記切換操作に基づいて前記メタデータのフィールドの表示可否を制御する処理を行う
    請求項1に記載の情報処理装置。
  3. 前記表示可否の設定を記憶する記憶部を備えた
    請求項2に記載の情報処理装置。
  4. 前記ユーザインタフェース制御部は、前記表示可否に基づいて表示された前記メタデータのフィールドから編集対象のフィールドを選択する操作を検出する処理を行う
    請求項2に記載の情報処理装置。
  5. 前記ユーザインタフェース制御部は、前記フィールドごとの表示名を編集可能とするユーザインタフェース処理を行う
    請求項1に記載の情報処理装置。
  6. 前記ユーザインタフェース制御部は、フィールド名の編集ができないように前記ユーザインタフェース処理を行う
    請求項5に記載の情報処理装置。
  7. 前記ユーザインタフェース制御部は、前記メタデータとしてのテキスト情報を編集する操作を検出する処理を行う
    請求項1に記載の情報処理装置。
  8. 携帯端末装置である
    請求項1に記載の情報処理装置。
  9. 前記メタデータはIPTCメタデータとされた
    請求項1に記載の情報処理装置。
  10. 画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を
    情報処理装置が実行する情報処理方法。
  11. 画像に付与されるメタデータのフィールドごとの表示のオン/オフ切換操作を検出する処理を
    情報処理装置に実行させるプログラム。
JP2019157233A 2019-08-29 2019-08-29 情報処理装置、情報処理方法、プログラム Active JP7415376B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019157233A JP7415376B2 (ja) 2019-08-29 2019-08-29 情報処理装置、情報処理方法、プログラム
PCT/JP2020/030428 WO2021039367A1 (en) 2019-08-29 2020-08-07 Information processing apparatus, information processing method, and program for picture metadata display and editing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019157233A JP7415376B2 (ja) 2019-08-29 2019-08-29 情報処理装置、情報処理方法、プログラム

Publications (2)

Publication Number Publication Date
JP2021035025A true JP2021035025A (ja) 2021-03-01
JP7415376B2 JP7415376B2 (ja) 2024-01-17

Family

ID=72234887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019157233A Active JP7415376B2 (ja) 2019-08-29 2019-08-29 情報処理装置、情報処理方法、プログラム

Country Status (2)

Country Link
JP (1) JP7415376B2 (ja)
WO (1) WO2021039367A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023281955A1 (ja) * 2021-07-07 2023-01-12 キヤノン株式会社 通信装置、撮像装置、制御方法およびプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5142939B2 (ja) 2008-10-16 2013-02-13 キヤノン株式会社 情報処理装置、情報処理方法及びプログラム
US20140115471A1 (en) 2012-10-22 2014-04-24 Apple Inc. Importing and Exporting Custom Metadata for a Media Asset
JP6598136B2 (ja) 2016-02-03 2019-10-30 リコーイメージング株式会社 設定情報管理システム
JP6679409B2 (ja) 2016-05-10 2020-04-15 キヤノン株式会社 撮像装置、遠隔制御装置、制御方法及びプログラム並びに記憶媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023281955A1 (ja) * 2021-07-07 2023-01-12 キヤノン株式会社 通信装置、撮像装置、制御方法およびプログラム

Also Published As

Publication number Publication date
JP7415376B2 (ja) 2024-01-17
WO2021039367A1 (en) 2021-03-04

Similar Documents

Publication Publication Date Title
US8982223B2 (en) Image sending apparatus, image recording apparatus and image recording method using identification information relating reduced image data with original image data
US8583940B2 (en) Electronic camera, storage medium, and data transfer method
US11647132B2 (en) Communication terminal, method for controlling communication terminal, communication system, and storage medium
US7805539B2 (en) Data transfer apparatus and data receiving apparatus, and data transfer system
JP2007081489A (ja) 撮像装置及びその制御方法
JP7415376B2 (ja) 情報処理装置、情報処理方法、プログラム
US9307113B2 (en) Display control apparatus and control method thereof
JP7380025B2 (ja) 撮像装置、情報処理方法、プログラム
WO2021039057A1 (ja) 情報処理装置、情報処理方法、プログラム
WO2021039129A1 (ja) 情報処理装置、情報処理方法、プログラム
JP7334501B2 (ja) 情報処理装置、情報処理方法、プログラム
US20220294972A1 (en) Information processing device, information processing method, and program
JP2017204692A (ja) 撮像装置、遠隔制御装置、制御方法及びプログラム並びに記憶媒体
JP2010098599A (ja) 撮像装置、その制御方法及びプログラム
JP2005175957A (ja) 画像管理装置、デジタルカメラ、及び画像管理方法
JP2020182164A (ja) 撮像装置、その制御方法及びプログラム
WO2023013246A1 (ja) 通信装置およびその制御方法
WO2022070826A1 (ja) 情報処理装置、情報処理方法、プログラム
US20220382512A1 (en) Imaging apparatus, information processing method, and program
JP2008187226A (ja) 撮像装置
JP4776967B2 (ja) 記録再生装置及びその制御方法及びプログラム及び記憶媒体
JP2023009680A (ja) 通信装置、制御方法、プログラム
JP2012034223A (ja) 記録再生装置及び記録再生装置の制御方法
JP2017059888A (ja) 情報記録装置、情報記録方法及び情報記録プログラム
JP2014171147A (ja) 撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230822

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230921

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20230921

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20231205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231218

R151 Written notification of patent or utility model registration

Ref document number: 7415376

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151