JP2007082103A - 情報処理装置、情報処理方法 - Google Patents
情報処理装置、情報処理方法 Download PDFInfo
- Publication number
- JP2007082103A JP2007082103A JP2005270401A JP2005270401A JP2007082103A JP 2007082103 A JP2007082103 A JP 2007082103A JP 2005270401 A JP2005270401 A JP 2005270401A JP 2005270401 A JP2005270401 A JP 2005270401A JP 2007082103 A JP2007082103 A JP 2007082103A
- Authority
- JP
- Japan
- Prior art keywords
- image
- recording
- voice
- audio
- annotation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Television Signal Processing For Recording (AREA)
Abstract
【課題】 画像に対してより簡便に音声アノテーションを付与する為の技術を提供すること。
【解決手段】 第1の画像が選択されている状態で音声が入力された場合、音声のデータを記録する(S110)。この記録動作中に、第1の画像以外の画像が選択された場合には、この記録動作を中断させ(S111)、この記録動作中に記録された音声データを、第1の画像に付与する音声アノテーションデータとして記録する(S113)。
【選択図】 図3
【解決手段】 第1の画像が選択されている状態で音声が入力された場合、音声のデータを記録する(S110)。この記録動作中に、第1の画像以外の画像が選択された場合には、この記録動作を中断させ(S111)、この記録動作中に記録された音声データを、第1の画像に付与する音声アノテーションデータとして記録する(S113)。
【選択図】 図3
Description
本発明は、画像に対して音声アノテーションを付与する為の技術に関するものである。
従来、画像に音声アノテーションを付与する際には、アノテーション付与モードに入ってから画像を選択し、画像の選択中にボタンを押しながら発声した音声を録音し、録音した音声を音声アノテーションとして付与していた。
また、画像の選択中にボタンを押してから発声し、発声が終了してから再度ボタンを押して、ボタンの押下区間中に発声された音声を録音して音声アノテーションとして付与した。このような構成を開示している例として、例えば特許文献1がある。
特開2003−051869号公報
従来の音声アノテーション付与方法では、画像選択モードと音声録音モードとがわかれており、手間がかかるという問題点があった。
本発明は以上の問題に鑑みて成されたものであり、画像に対してより簡便に音声アノテーションを付与する為の技術を提供することを目的とする。
本発明の目的を達成するために、例えば、本発明の情報処理装置は以下の構成を備える。
即ち、画像を一覧表示する表示手段と、
前記表示手段に一覧表示されている画像のうち、所望の画像を選択する選択手段と、
音声情報を取得する取得手段と、
前記選択手段によって第1の画像が選択されている状態で音声情報が入力された場合、当該音声情報に基づくデータを記録する第1の記録手段と、
前記第1の記録手段による記録動作中に、前記第1の画像以外の画像が選択された場合には、前記第1の記録手段による記録動作を中断させると共に、当該記録動作中に記録された音声データを、前記第1の画像に付与する音声アノテーションデータとして記録する第2の記録手段と
を備えることを特徴とする。
前記表示手段に一覧表示されている画像のうち、所望の画像を選択する選択手段と、
音声情報を取得する取得手段と、
前記選択手段によって第1の画像が選択されている状態で音声情報が入力された場合、当該音声情報に基づくデータを記録する第1の記録手段と、
前記第1の記録手段による記録動作中に、前記第1の画像以外の画像が選択された場合には、前記第1の記録手段による記録動作を中断させると共に、当該記録動作中に記録された音声データを、前記第1の画像に付与する音声アノテーションデータとして記録する第2の記録手段と
を備えることを特徴とする。
本発明の目的を達成するために、例えば、本発明の情報処理方法は以下の構成を備える。
即ち、画像を一覧表示する表示工程と、
前記表示工程で一覧表示されている画像のうち、所望の画像を選択する選択工程と、
音声情報を取得する取得工程と、
前記選択工程で第1の画像が選択されている状態で音声情報が入力された場合、当該音声情報に基づくデータを記録する第1の記録工程と、
前記第1の記録工程による記録動作中に、前記第1の画像以外の画像が選択された場合には、前記第1の記録工程による記録動作を中断させると共に、当該記録動作中に記録された音声データを、前記第1の画像に付与する音声アノテーションデータとして記録する第2の記録工程と
を備えることを特徴とする。
前記表示工程で一覧表示されている画像のうち、所望の画像を選択する選択工程と、
音声情報を取得する取得工程と、
前記選択工程で第1の画像が選択されている状態で音声情報が入力された場合、当該音声情報に基づくデータを記録する第1の記録工程と、
前記第1の記録工程による記録動作中に、前記第1の画像以外の画像が選択された場合には、前記第1の記録工程による記録動作を中断させると共に、当該記録動作中に記録された音声データを、前記第1の画像に付与する音声アノテーションデータとして記録する第2の記録工程と
を備えることを特徴とする。
本発明の構成により、画像に対してより簡便に音声アノテーションを付与することができる。
以下添付図面を参照して、本発明を好適な実施形態に従って詳細に説明する。なお、以下の実施形態では、本発明の情報処理装置をディジタルカメラに適用した実施形態について説明するが、適用対象はこのような装置に限定するものではない。
[第1の実施形態]
図1は、本実施形態に係るディジタルカメラの外観を示す図である。同図に示す如く、本実施形態に係るディジタルカメラの一面には、ディスプレイ1、機能キー群2、確定キー3、クリアキー4、カーソルキー5、スピーカ6、マイク7が配置されている。また、上面には、ズームレバー8、シャッターボタン9が配置されている。
図1は、本実施形態に係るディジタルカメラの外観を示す図である。同図に示す如く、本実施形態に係るディジタルカメラの一面には、ディスプレイ1、機能キー群2、確定キー3、クリアキー4、カーソルキー5、スピーカ6、マイク7が配置されている。また、上面には、ズームレバー8、シャッターボタン9が配置されている。
図2は、本実施形態に係るディジタルカメラのハードウェア構成を示すブロック図である。同図に示す如く、本実施形態に係るディジタルカメラは図1に示した各部に加え、更に、撮像部10、メモリ11、制御部12、アノテーション付与部13を有し、同図に示した各部はバス14を介して互いに通信が可能となっている。
本実施形態に係るディジタルカメラを用いて撮像を行う場合には、先ず操作者は、機能キー群2やズームレバー8を操作して各種の撮像設定を行う。設定している内容の一部若しくは全部は、ディスプレイ1に表示される。また、設定された内容はデータとしてメモリ11に格納される。そして操作者がシャッターボタン9を押下すると、制御部12は撮像部10を制御し、画像の撮像を行う。撮像部10は、CCD素子群を含む撮像系を構成するものであり、撮像した画像は画像データとしてメモリ11に格納される。撮像した画像をメモリ11に格納する際には、制御部12は必要に応じてこの画像に対して適宜画像処理を行う。
そして、操作者が機能キー群2を用いて、撮像した画像をディスプレイ1に一覧表示する旨の操作を入力すると、制御部12はメモリ11に格納されている画像群を読み出して、ディスプレイ1に一覧表示する。
以下では、画像の一覧表示後、所望の画像に対して音声アノテーションを付与するために本実施形態に係るディジタルカメラが行う処理について説明する。
図3は、撮像した画像をディスプレイ1に一覧表示し、表示している画像のうち所望の画像に対して音声アノテーションを付与する為の処理のフローチャートである。なお、この処理は制御部12によって行われるのであるが、同図のフローチャートに従った処理を制御部12に実行させるためのプログラムやデータはメモリ11に格納されている。制御部12はこのプログラムやデータを用いて処理を実行するので、本実施形態に係るディジタルカメラは以下説明する各処理を行うことになる。
先ず、操作者がカーソルキー5を用いて音声アノテーションを付与する為のメニューを選択し、その後確定キー3を押下すると、制御部12はこの一連の操作に応じて、音声アノテーションを付与するためのモードを設定する(ステップS101)。このモードを設定する際には、フラグF3を0にセットする。
次に、制御部12はメモリ11に格納されている撮像画像群を読み出し、ディスプレイ1に一覧表示すると共に、画像を選択するためのカーソルを初期位置に表示する(ステップS102)。カーソルの初期位置とは、例えば、表示されている画像のうち、左上隅の画像の表示位置である。
次に、操作者は、音声アノテーションを付与したい所望の画像(以下、第1の画像と呼称する場合がある)を選択すべく、カーソルキー5を操作して、カーソルの位置を第1の画像の表示位置に移動させる。そして第1の画像を選択している状態でマイク7に向かって音声アノテーションとしての音声を入力すると、制御部12はこの音声入力を検知し、マイク7からの音がユーザの発声した音声区間であると判断する(ステップS103)。そして、制御部12は入力された音声を音声情報として受信する。一方、音声入力を検知していない場合には、制御部12は、マイク7からの音がユーザの発声した音声区間ではないと判断する(ステップS103)。
音声入力を検知した場合には処理をステップS104に進め、フラグF1を1にセットする(ステップS104)。一方、音声入力を検知していない場合には処理をステップS105に進め、フラグF1を0にセットする(ステップS105)。
次に、制御部12は現在、カーソルが移動の最中であるのか否かを判断する(ステップS106)。即ち、カーソルキー5が操作されることで、第1の画像以外の画像が選択されたか否かを判断する。その結果、移動中である場合には処理をステップS107に進め、フラグF2を1にセットする(ステップS107)。一方、移動中ではない場合には処理をステップS108に進め、フラグF2を0にセットする(ステップS108)。
次に、制御部12は、フラグF1,F2のそれぞれの値を参照し、フラグF1の値が1であり、且つフラグF2の値が0であるか否かを判断する(ステップS109)。即ち、本ステップでは、現在、音声入力を検知しており、且つ現在カーソルが移動中ではないという状況であるのか否かを判断している。
その結果、F1=1且つF2=0である場合には処理をステップS110に進め、ステップS103で検知した音声をデータとしてメモリ11に記録する処理を行うと共に、フラグF3を1にセットする(ステップS110)。即ち、現在音声入力がなされていて、且つ現在カーソルが移動中ではない場合には、この入力されている音声のデータをメモリ11に記録する。
一方、F1=1且つF2=0という条件が満たされていない場合には処理をステップS111に進め、メモリ11への音声データの記録処理を中断する(ステップS111)。即ち、音声データの記録処理は、カーソルの移動を行わずに、音声を入力している間に行われるものであり、カーソルの移動を検知すると、これをトリガーにして、この記録処理を中断する。
次に、フラグF3の値を参照し(ステップS112)、F3=1、即ち、カーソルの移動を検知する直前まで記録処理を行っていたのであれば、処理をステップS113に進める。そして、ステップS110でメモリ11に記録した音声データを、第1の画像に付与する音声アノテーションデータとしてメモリ11内に記録(管理)する(ステップS113)。
以上の説明により、本実施形態によって、画像の選択後、動作モードを変更することなく、直ちに音声入力を行うことで、この選択画像に対する音声アノテーションを付与することができる。
なお、以上の説明において、選択画像に対する音声アノテーションを付与するための各キー操作については、一例であって、操作方法については特に限定するものではない。また、キーの使用の代わりに音声入力を用いるようにしても良いし、外部装置に備わっているボタンやキーを用いるようにしても良い。
また、本実施形態では、音声データの記録処理を中断させたい場合には、音声入力時にカーソルを移動させていた。しかし、カーソルの移動なしに音声入力を終了させたい場合には、制御部12は無音部分が所定時間続いていれば、音声データの記録処理を中断する、というようにしても良い。
なお、本実施形態では、マイク7はディジタルカメラ本体に配置されているものであったが、ディジタルカメラに対して外付けものであっても良い。その場合、ディジタルカメラ本体には、この外付けマイクをディジタルカメラ本体に接続するための端子や、外付けマイクから端子を介して入力される音声情報をA/D変換などの処理を行う処理デバイス等を設ける必要がある。
そして、この外付けマイクを上記マイク7として扱うことにより、この外付けマイク、端子、処理デバイス等を介して音声(音声情報)をディジタルカメラ本体内に取得することができる。
[第2の実施形態]
本実施形態では、ディスプレイ1に一覧表示されている画像の中に、既に音声アノテーションが付与されたものも含まれている形態について説明する。
本実施形態では、ディスプレイ1に一覧表示されている画像の中に、既に音声アノテーションが付与されたものも含まれている形態について説明する。
図4は、撮像した画像をディスプレイ1に一覧表示し、表示している画像のうち所望の画像に対して音声アノテーションを付与する為の処理のフローチャートである。
ステップS201,S202ではそれぞれ、上記ステップS101,S102と同様の処理を行う。しかし、本実施形態では、既に音声アノテーションが付与されている画像については、付与されていない画像とは異なる表示形態でもって表示する。
図5(a)は、ステップS202における表示例を示す図である。同図に示す如く、音声アノテーションが付与されている画像には「音」なる文字が記されたアイコンがこの画像の下に表示されている。なお、既に音声アノテーションが付与されている画像を、付与されていない画像と異ならせて表示するための表示形態については特に限定するものではない。
次に、制御部12は、現在選択している画像(第1の画像)に音声アノテーションが付与されているのか否かをチェックする(ステップS204)。そして第1の画像に音声アノテーションが付与されていない場合には処理をステップS207に進め、上記ステップS103からステップS113における処理を行う。即ち、この第1の画像に対して、音声アノテーションを付与する処理を行う。
一方、第1の画像に音声アノテーションが付与されている場合には、処理をステップS205に進め、この音声アノテーションのデータに従って音声の再生処理を行う(ステップS205)。再生された音声はスピーカ6を介して出力されることになる。なお、本ステップにおける処理は必須なものではなく省略しても良い。
そして次に、制御部12は、これから入力しようとする音声でもって、この音声アノテーションを更新するのか否かを操作者に確認するための画面をディスプレイ1に表示する(ステップS206)。図5(b)はステップS206で表示する確認画面の表示例を示す図である。
そして、操作者が確定キー3等を用いて、更新する旨の指示を入力した場合には、制御部12はこれを検知し、ステップS207における処理を行う。即ち、第1の画像に付与されている音声アノテーションのデータを、ステップS207における処理で取得した音声データでもって更新する処理を行う(ステップS207)。
一方、操作者が確定キー3等を用いて、更新しない旨の指示を入力した場合には、制御部12はこれを検知し、本処理を終了する。
なお、本実施形態では、音声データの記録処理の前に、音声アノテーションを更新するか否かを確認するための画面を表示し、更新するか否かの指示を受け付けているが、逆の順序でも良い。即ち、とりあえず、音声データの記録処理を行い、記録処理を中断すると、音声アノテーションを更新するか否かを確認するための画面を表示し、更新するか否かの指示を受け付ける。
また、ステップS207で取得した音声データでもって音声アノテーションのデータを更新する以外にも、例えば、この音声データを音声アノテーションのデータの続きに追加するような構成とするようにしても良い。その場合、ステップS206では、更新、追加の何れを行うのかを選択させるようにすれば良い。
以上の説明により、本実施形態によって、音声アノテーションの付いている画像が選択されたならば、音声アノテーションを再生して、音声アノテーションを上書きするか確認することによって、音声アノテーションを誤って上書きすることを防止できる。
[第3の実施形態]
本実施形態では、撮像した画像をディスプレイ1に一覧表示する際に、音声アノテーションが付与されていない画像のみを表示する。
本実施形態では、撮像した画像をディスプレイ1に一覧表示する際に、音声アノテーションが付与されていない画像のみを表示する。
図6は、撮像した画像のうち、音声アノテーションが付与されていない画像をディスプレイ1に一覧表示し、表示している画像のうち所望の画像に対して音声アノテーションを付与する為の処理のフローチャートである。
ステップS301では、ステップS101と同様の処理を行う。次に、ステップS302では、メモリ11に格納されている撮像画像のうち、音声アノテーションが付与されていない撮像画像のみを読み出し、ディスプレイ1に表示する。そしてステップS304における処理、即ち、ステップS103からステップS113における処理を行う。これにより、確実に音声アノテーションが付与されていない画像のみに対して、音声アノテーションを付与することができる。
なお、以上の各実施形態において、音声の入力時には、全てのキーをロックするようにしても良い。このようにすると、所望の画像に音声アノテーションを正確に付けることができる。
また、上記各実施形態は適宜組み合わせて用いるようにしても良い。
[その他の実施形態]
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
また、本発明の目的は、以下のようにすることによって達成されることはいうまでもない。即ち、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記録媒体(または記憶媒体)を、システムあるいは装置に供給する。そして、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムコードを読み出し実行する。この場合、記録媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記録した記録媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実行することにより、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行う。その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記録媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれたとする。その後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明を上記記録媒体に適用する場合、その記録媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
Claims (7)
- 画像を一覧表示する表示手段と、
前記表示手段に一覧表示されている画像のうち、所望の画像を選択する選択手段と、
音声情報を取得する取得手段と、
前記選択手段によって第1の画像が選択されている状態で音声情報が入力された場合、当該音声情報に基づくデータを記録する第1の記録手段と、
前記第1の記録手段による記録動作中に、前記第1の画像以外の画像が選択された場合には、前記第1の記録手段による記録動作を中断させると共に、当該記録動作中に記録された音声データを、前記第1の画像に付与する音声アノテーションデータとして記録する第2の記録手段と
を備えることを特徴とする情報処理装置。 - 前記表示手段は、音声アノテーションが付与されている画像を、音声アノテーションが付与されていない画像とは異なる表示形態でもって表示することを特徴とする請求項1に記載の情報処理装置。
- 前記表示手段は、音声アノテーションが付与されていない画像のみを一覧表示することを特徴とする請求項1に記載の情報処理装置。
- 既に音声アノテーションが付与されている第2の画像が前記選択手段によって選択された場合、当該音声アノテーションを更新するか否かを確認するための画面を前記表示手段に表示する手段を更に備え、
更新する指示が入力された場合、
前記第2の画像が前記選択手段によって選択されている状態で音声情報が入力されると、前記第1の記録手段は、当該音声のデータを記録し、
前記第2の記録手段は、前記第1の記録手段による記録動作中に、前記第2の画像以外の画像が選択された場合には、前記第1の記録手段による記録動作を中断させると共に、当該記録動作中に記録された音声データでもって当該音声アノテーションデータを更新することを特徴とする請求項1に記載の情報処理装置。 - 画像を一覧表示する表示工程と、
前記表示工程で一覧表示されている画像のうち、所望の画像を選択する選択工程と、
音声情報を取得する取得工程と、
前記選択工程で第1の画像が選択されている状態で音声情報が入力された場合、当該音声情報に基づくデータを記録する第1の記録工程と、
前記第1の記録工程による記録動作中に、前記第1の画像以外の画像が選択された場合には、前記第1の記録工程による記録動作を中断させると共に、当該記録動作中に記録された音声データを、前記第1の画像に付与する音声アノテーションデータとして記録する第2の記録工程と
を備えることを特徴とする情報処理方法。 - コンピュータに請求項5に記載の情報処理方法を実行させる為のプログラム。
- 請求項6に記載のプログラムを格納したことを特徴とする、コンピュータ読み取り可能な記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005270401A JP2007082103A (ja) | 2005-09-16 | 2005-09-16 | 情報処理装置、情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005270401A JP2007082103A (ja) | 2005-09-16 | 2005-09-16 | 情報処理装置、情報処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007082103A true JP2007082103A (ja) | 2007-03-29 |
Family
ID=37941885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005270401A Withdrawn JP2007082103A (ja) | 2005-09-16 | 2005-09-16 | 情報処理装置、情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007082103A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016181245A (ja) * | 2015-03-24 | 2016-10-13 | 富士ゼロックス株式会社 | 注視注釈方法及びコンピューティングデバイス |
-
2005
- 2005-09-16 JP JP2005270401A patent/JP2007082103A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016181245A (ja) * | 2015-03-24 | 2016-10-13 | 富士ゼロックス株式会社 | 注視注釈方法及びコンピューティングデバイス |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4659505B2 (ja) | 情報処理方法及び装置 | |
CN101790046B (zh) | 数字拍摄装置及其控制方法 | |
US20050264669A1 (en) | Apparatus and method for image processing | |
JP2007104630A (ja) | 映像監視システム | |
JP2014131217A (ja) | 個人情報の漏洩を抑止する撮影装置、撮影システム、制御方法、及びプログラム。 | |
JP2019096279A (ja) | 電子機器およびその制御方法 | |
JP2006311067A (ja) | 電子カメラ装置及び履歴ファイル作成方法 | |
JP2007082103A (ja) | 情報処理装置、情報処理方法 | |
JPH10171010A (ja) | カメラ及びその接続装置並びにカメラシステム | |
JP2006074732A (ja) | ビデオ信号処理装置及び方法 | |
JP2005293354A (ja) | 携帯端末装置、アプリケーション実行画面表示方法、プログラム、及び記録媒体 | |
CN113687751A (zh) | 智能体控制装置、智能体控制方法、以及非临时性的记录介质 | |
JP4591283B2 (ja) | 画像再生システム、撮像装置及び情報処理装置 | |
JP2004302300A (ja) | 情報処理方法 | |
JP2007080021A (ja) | 指紋照合機能付き電子機器 | |
JP2009048231A (ja) | 多機能情報機器及び多機能情報機器の起動方法 | |
KR100536636B1 (ko) | 이미지 일괄 편집 시스템 | |
JP2014115982A (ja) | 撮影装置、セキュリティ解除方法、及びプログラム | |
JP4383926B2 (ja) | 画像取り込み装置 | |
JP4735938B2 (ja) | カメラ及びその制御方法 | |
KR100681196B1 (ko) | 영상 촬영장치가 포함된 이동 통신 단말기 및 이를 이용한영상 편집 방법 | |
JP2013115691A (ja) | 撮像装置及び撮像装置に用いる制御プログラム | |
JP2023005842A (ja) | 記録装置、およびその制御方法、プログラム | |
JP3623779B2 (ja) | ゲームプログラム | |
TW202340941A (zh) | 虛擬裝置處理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20081202 |