JP2006304257A - Image pickup device, image pickup method, output device, and output method and program - Google Patents
Image pickup device, image pickup method, output device, and output method and program Download PDFInfo
- Publication number
- JP2006304257A JP2006304257A JP2005361061A JP2005361061A JP2006304257A JP 2006304257 A JP2006304257 A JP 2006304257A JP 2005361061 A JP2005361061 A JP 2005361061A JP 2005361061 A JP2005361061 A JP 2005361061A JP 2006304257 A JP2006304257 A JP 2006304257A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- unit
- voice
- imaging
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、撮像装置、撮像方法、出力装置、及びプログラムに関する。特に本発明は、画像を撮像する撮像装置及び撮像方法、並びに画像を出力する出力装置及び出力方法、並びに当該撮像装置及び当該出力装置用のプログラムに関する。 The present invention relates to an imaging device, an imaging method, an output device, and a program. In particular, the present invention relates to an imaging device and an imaging method for capturing an image, an output device and an output method for outputting an image, and a program for the imaging device and the output device.
従来、静止画だけでなく動画もメモリカードに記録することができるデジタルスチルカメラがある。このようなデジタルスチルカメラでは、静止画や動画の撮影記録時にマイクロホンで検出した音声を画像に対応させて記録できる(例えば、特許文献1参照。)。また、デジタルスチルカメラで撮影した静止画や動画を表示しながら、画像に対応させて記録された音声を再生することができる電子フォトスタンドが知られている。
このようなカメラ及び電子フォトスタンドによって、例えば、撮影記録時に周囲で流れていた音楽とともに、撮影した画像を鑑賞することができる。しかし、このようなカメラでは、撮影記録時に流れていた音声しか記録できない。他にも、例えばインターネット、CD等からデジタルデータとして取得することのできる音楽データ等に比べて、マイクロホンから録音された音楽は低音質である場合が多い。このため、ユーザは再生される音楽に不満を持ってしまう場合がある。また、ユーザにとっては画像と音声の編集等の煩雑な作業をすることなく、撮影した画像と音楽とを簡単に鑑賞することができることが望ましい。また、音楽の他にも、波の音、鳥の鳴き声等、撮像時の環境音と同種の音声をより高い音質で画像とともに鑑賞することができることが望ましい。 With such a camera and an electronic photo stand, for example, a photographed image can be viewed together with music that has been flowing around during photographing recording. However, such a camera can only record the sound that was flowing at the time of shooting and recording. In addition, music recorded from a microphone often has lower sound quality than music data that can be acquired as digital data from, for example, the Internet or a CD. For this reason, the user may be dissatisfied with the music to be played. In addition, it is desirable for the user to be able to easily appreciate the captured image and music without performing complicated operations such as editing of the image and sound. In addition to music, it is desirable to be able to appreciate the same kind of sound as the environmental sound at the time of imaging, such as the sound of waves and the sound of birds, together with images with higher sound quality.
そこで本発明は、上記の課題を解決することができる撮像装置、撮像方法、出力装置、出力方法、及びプログラムを提供することを目的とする。この目的は特許請求の範囲における独立項に記載の特徴の組み合わせにより達成される。また従属項は本発明の更なる有利な具体例を規定する。 Accordingly, an object of the present invention is to provide an imaging device, an imaging method, an output device, an output method, and a program that can solve the above-described problems. This object is achieved by a combination of features described in the independent claims. The dependent claims define further advantageous specific examples of the present invention.
本発明の第1の形態における撮像装置は、撮像部と、撮像部の周囲の音声を録音する録音部と、録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部と、複数の種類の音声を格納する音声データベースから、特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部と、音声取得部が取得した音声と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部とを備える。 An imaging apparatus according to a first aspect of the present invention includes an imaging unit, a recording unit that records audio around the imaging unit, and a feature sound extraction unit that extracts a predetermined type of audio from the audio recorded by the recording unit And an audio acquisition unit that acquires the same type of audio as the audio extracted by the feature sound extraction unit from an audio database that stores a plurality of types of audio, and the audio acquired by the audio acquisition unit and the image captured by the imaging unit And a data storage unit that stores the data in association with each other so as to output them synchronously.
特徴音抽出部は、撮像部が画像を撮像した時刻から予め設定された時間内に、録音部が録音した音声から予め定められた種類の音声を抽出してよい。 The feature sound extraction unit may extract a predetermined type of sound from the sound recorded by the recording unit within a preset time from the time when the image capturing unit captures the image.
撮像部が有する受光素子により受光した光の画像を表示する表示部と、表示部が画像を表示している状態の動作モードである撮像モード、又は表示部が画像を表示していない状態の動作モードである非撮像モードに当該撮像装置を設定するモード設定部とをさらに備え、録音部は、モード設定部が撮像モードに設定している場合、及びモード設定部が非撮像モードに設定している場合の双方において、撮像部の周囲の音声を録音してよい。 A display unit that displays an image of light received by the light receiving element of the imaging unit and an imaging mode that is an operation mode in which the display unit displays an image, or an operation in which the display unit does not display an image A mode setting unit that sets the imaging apparatus to the non-imaging mode that is the mode, and the recording unit sets the imaging mode when the mode setting unit is set to the imaging mode, and the mode setting unit sets the imaging mode to the non-imaging mode. In both cases, sound around the imaging unit may be recorded.
特徴音抽出部は、モード設定部が撮像モードに設定している時間を含み、モード設定部が撮像モードに設定している時間より長い、予め設定された時間内に、録音部が録音した音声から予め定められた種類の音声を抽出してよい。音声データベースは、複数の音楽を格納しており、特徴音抽出部は、録音部が録音した音声から音楽を抽出し、音声取得部は、音声データベースから、特徴音抽出部が抽出した音楽と同一の音楽を取得してよい。 The feature sound extraction unit includes the time set by the mode setting unit in the imaging mode, and is recorded by the recording unit within a preset time longer than the time set by the mode setting unit in the imaging mode. A predetermined type of sound may be extracted from The voice database stores a plurality of music, the feature sound extraction unit extracts music from the voice recorded by the recording unit, and the voice acquisition unit is the same as the music extracted by the feature sound extraction unit from the voice database. May get music.
特徴音抽出部が抽出する環境音のそれぞれの種類を特定する条件を予め格納する条件格納部をさらに備え、音声データベースは、環境音の種類別に複数の環境音を格納しており、特徴音抽出部は、条件格納部が格納する条件に一致する環境音を、録音部が録音した音声から抽出し、音声取得部は、音声データベースから、特徴音抽出部が抽出した環境音と同一の種類の環境音を取得し、データ格納部は、音声取得部が取得した環境音と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納してよい。 The feature sound extraction unit further includes a condition storage unit that preliminarily stores a condition for specifying each type of environmental sound extracted by the feature sound extraction unit, and the voice database stores a plurality of environmental sounds for each type of environmental sound. The unit extracts the environmental sound that matches the conditions stored in the condition storage unit from the voice recorded by the recording unit, and the voice acquisition unit extracts the same type of environmental sound from the voice database as the environmental sound extracted by the feature sound extraction unit. The environmental sound may be acquired, and the data storage unit may store the environmental sound acquired by the sound acquisition unit and the image captured by the imaging unit in association with each other so as to be output in synchronization.
音声データベースは、時代別に複数の音楽を格納しており、特徴音抽出部は、録音部が録音した音声から音楽を抽出し、音声取得部は、音声データベースから、特徴音抽出部が抽出した音楽と同じ時代の音楽を取得してよい。音声データベースは、ジャンル別に複数の音楽を格納しており、音声取得部は、音声データベースから、特徴音抽出部が抽出した音楽と同じジャンルの音楽を取得してよい。 The voice database stores a plurality of music by era, the feature sound extraction unit extracts music from the voice recorded by the recording unit, and the voice acquisition unit extracts the music extracted by the feature sound extraction unit from the voice database. May get music of the same era. The audio database stores a plurality of music by genre, and the audio acquisition unit may acquire music of the same genre as the music extracted by the feature sound extraction unit from the audio database.
本発明の第2の形態における撮像方法は、画像を撮像部により撮像する撮像段階と、撮像部の周囲の音声を録音する録音段階と、録音段階において録音された音声から予め定められた種類の音声を抽出する特徴音抽出段階と、複数の種類の音声を格納する音声データベースから、特徴音抽出段階において抽出された音声と同一の種類の音声を取得する音声取得段階と、音声取得段階において取得された音声と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納段階とを備える。 The imaging method according to the second aspect of the present invention includes an imaging stage in which an image is captured by an imaging unit, a recording stage in which sound around the imaging section is recorded, and a predetermined type of sound recorded in the recording stage. Acquired in a feature sound extraction stage for extracting sound, a sound acquisition stage for acquiring the same type of sound as the sound extracted in the feature sound extraction stage, and a sound acquisition stage from a sound database storing a plurality of kinds of sounds A data storage stage for storing the audio and the image captured by the imaging unit in association with each other so as to be output in synchronization.
本発明の第3の形態によると、画像を撮像する撮像装置用のプログラムであって、撮像装置を、画像を撮像する撮像部、撮像部の周囲の音声を録音する録音部、録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部、複数の種類の音声を格納する音声データベースから、特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部、音声取得部が取得した音声と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部として機能させる。 According to a third aspect of the present invention, there is provided a program for an imaging device that captures an image, the imaging device including an imaging unit that captures an image, a recording unit that records sound around the imaging unit, and a recording unit A feature sound extraction unit for extracting a predetermined type of sound from the obtained sound, and a sound acquisition unit for acquiring the same type of sound as the sound extracted by the feature sound extraction unit from a sound database storing a plurality of types of sound The voice acquired by the voice acquisition unit and the image captured by the imaging unit are made to function as a data storage unit that stores them in association with each other so as to be output in synchronization.
本発明の第4の形態における出力装置は、撮像装置によって撮像された画像を格納する画像格納部と、撮像装置によって録音された音声を格納する音声格納部と、音声格納部が格納する音声から予め定められた種類の音声を抽出する特徴音抽出部と、複数の種類の音声を格納する音声データベースから、特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部と、音声取得部が取得した音声と画像格納部が格納する画像とを同期して出力する出力部とを備える。 An output device according to a fourth aspect of the present invention includes an image storage unit that stores an image captured by an imaging device, an audio storage unit that stores audio recorded by the imaging device, and audio stored in the audio storage unit. A feature sound extraction unit that extracts a predetermined type of sound, and a sound acquisition unit that acquires the same type of sound as the sound extracted by the feature sound extraction unit from a sound database that stores a plurality of types of sound; And an output unit that outputs the sound acquired by the sound acquisition unit and the image stored in the image storage unit in synchronization.
画像格納部は、画像に対応づけて当該画像の撮像時刻を格納しており、音声格納部は、音声に対応づけて当該音声の録音時刻を格納しており、特徴音抽出部は、画像が撮像された時刻から予め設定された許容時間内に録音された音声から予め定められた種類の音声を抽出してよい。 The image storage unit stores the imaging time of the image in association with the image, the audio storage unit stores the recording time of the audio in association with the audio, and the feature sound extraction unit stores the image A predetermined type of sound may be extracted from sound recorded within a preset allowable time from the time when the image was taken.
画像格納部が格納する画像の出力要求を取得する出力要求取得部と、出力要求取得部が出力要求を取得した時刻と、画像格納部が格納する画像の撮像時刻との差がより大きい場合に、許容時間をより長く設定する許容時間設定部とをさらに備えてよい。 When the difference between the output request acquisition unit that acquires the output request of the image stored in the image storage unit, the time when the output request acquisition unit acquires the output request, and the imaging time of the image stored in the image storage unit is larger And an allowable time setting unit for setting the allowable time longer.
本発明の第5の形態における出力方法は、撮像装置によって撮像された画像を格納する画像格納段階と、撮像装置によって録音された音声を格納する音声格納段階と、音声格納段階において格納される音声から予め定められた種類の音声を抽出する特徴音抽出段階と、複数の音楽を格納する音声データベースから、特徴音抽出段階において抽出された音声と同一の種類の音声を取得する音声取得段階と、音声取得段階において取得された音声と画像格納段階において格納される画像とを同期して出力する出力段階とを備える。 An output method according to a fifth aspect of the present invention includes an image storage stage for storing an image captured by an imaging apparatus, an audio storage stage for storing sound recorded by the imaging apparatus, and an audio stored in the audio storage stage. A feature sound extraction stage for extracting a predetermined type of voice from the voice acquisition stage for acquiring the same type of voice as the voice extracted in the feature sound extraction stage from a voice database storing a plurality of music; An output stage for synchronizing and outputting the audio acquired in the audio acquisition stage and the image stored in the image storage stage.
本発明の第6の形態によると、画像を出力する出力装置用のプログラムであって、出力装置を、画像を撮像する撮像部、撮像部の周囲の音声を録音する録音部、録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部、複数の種類の音声を格納する音声データベースから、特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部、音声取得部が取得した音声と撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部として機能させる。 According to a sixth aspect of the present invention, there is provided a program for an output device that outputs an image, wherein the output device is recorded by an imaging unit that captures an image, a recording unit that records sound around the imaging unit, and a recording unit A feature sound extraction unit for extracting a predetermined type of sound from the obtained sound, and a sound acquisition unit for acquiring the same type of sound as the sound extracted by the feature sound extraction unit from a sound database storing a plurality of types of sound The voice acquired by the voice acquisition unit and the image captured by the imaging unit are made to function as a data storage unit that stores them in association with each other so as to be output in synchronization.
なお上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではなく、これらの特徴群のサブコンビネーションもまた発明となりうる。 Note that the above summary of the invention does not enumerate all the necessary features of the present invention, and sub-combinations of these feature groups can also be the invention.
本発明によれば、画像を撮像したときに流れていた種類の音声を、画像とともに容易に得ることができる撮像装置及び出力装置を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, the imaging device and output device which can obtain easily the kind of audio | voice which was flowing when the image was imaged with an image can be provided.
以下、発明の実施形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。 Hereinafter, the present invention will be described through embodiments of the invention. However, the following embodiments do not limit the claimed invention, and all combinations of features described in the embodiments are inventions. It is not always essential to the solution.
図1は、本発明の一実施形態に係る音声提供システムの一例を示す。音声提供システムは、撮像装置100、出力装置140、説明音データベース170、音楽データベース172、及び環境音データベース174を有する。この例では、撮像装置100は、観光地において記念写真を撮像する。撮像装置100は、撮像装置100が撮像した画像及び撮像したときの撮像位置を、インターネット等の通信回線150を通じて出力装置140に送信する。音楽データベース172は、複数の音楽を格納している。また、環境音データベース174は、環境音の種類別に複数の環境音を格納している。なお、本実施形態における音楽データベース172及び環境音データベース174は、この発明における音声データベースの一例である。
FIG. 1 shows an example of a voice providing system according to an embodiment of the present invention. The voice providing system includes an
出力装置140は、撮像装置100から受け取った撮像位置に関する音声データ、例えば観光地の特色を説明する音声データを説明音データベース170から取得して、撮像装置100から受け取った画像とともに出力する。なお、撮像装置100は、撮像装置100の周囲の音声を録音しておき、出力装置140は、撮像装置100で録音された音声を受け取ってもよい。そして出力装置140は、当該音声の中から音楽を抽出して、抽出した音楽と同じ音楽を音楽データベース172から取得して、画像とともに出力してもよい。また、出力装置140は、当該音声の中から波の音、鳥の鳴き声等の環境音を抽出して、抽出した環境音と同じ種類の環境音を環境音データベース174から取得して、画像とともに出力してもよい。なお、出力装置140は、説明音データベース170から取得した音声データと、音楽データベース172から取得した音楽又は環境音データベース174から取得した環境音とを同時に出力してもよい。
The
出力装置140は、例えば、HDTV、電子フォトスタンド、コンピュータ等の、画像及び音声を出力する装置であってよい。また、出力装置140は、音声を文字として出力してもよい。例えば、出力装置140は、液晶等の表示デバイスに画像を表示するときに、説明音データベース170から取得した音声及び/又は音楽データベース172から取得した音楽データに含まれる歌詞等を文字として表示デバイスに表示させてよい。なお、出力装置140は、画像を表示させる表示デバイスに文字を表示させてよく、画像を表示させる表示デバイスとは別の表示デバイスに文字を表示させてもよい。他にも、出力装置140は、プリンタ等の画像を印刷する印刷装置であってもよく、画像を印刷するとともに音声を文字として印刷してもよい。
The
撮像装置100は、例えば、デジタルスチルカメラ、カメラ付携帯電話等であってよい。また、撮像装置100が画像及び音声データを記録媒体に記録して、出力装置140は当該記録媒体から画像及び音声データを受け取ってもよい。また、撮像装置100は、画像及び音声データを、通信回線150に接続されたサーバの、ユーザ180毎にそれぞれ設けられたディレクトリ、例えば撮像装置100と関連付けられたディレクトリに格納してもよい。そして出力装置140は、ユーザ180毎にサーバに格納された画像及び音声データを受け取ってもよい。
The
以上説明した出力装置140によれば、撮像装置100で撮像した画像を、撮像した場所に関する音声とともにユーザ180に提供することができる。このため、ユーザ180は、観光地等の特色等を思い出しながら、楽しく画像を鑑賞することができる。また、撮像装置100で撮像したときに周囲で流れていた音楽、周囲の波の音等の環境音等を、ユーザ180に提供することができる。このため、ユーザ180は、観光地等を訪れたときに流行していた音楽を聴きながら、楽しく画像を鑑賞することができる。
According to the
図2は、出力装置140のブロック構成の一例を示す。出力装置140は、画像格納部210、画像選択部278、撮像領域判断部282、撮像期間判断部284、撮像位置分布算出部286、撮像枚数算出部288、出力部224、及び音声取得部262を備える。
FIG. 2 shows an example of a block configuration of the
画像格納部210は、撮像された画像と、当該画像が撮像された位置とを対応づけて格納する。例えば、撮像装置100は、画像を撮像したときの撮像装置100の位置における緯度及び経度情報をGPS衛星から受信する。そして、画像格納部210は、撮像装置100から受け取った画像を、撮像装置100が検出した緯度及び経度情報と対応づけて格納する。
The image storage unit 210 stores the captured image and the position where the image is captured in association with each other. For example, the
画像選択部278は、画像格納部210が格納する画像から、ユーザ180の指示入力に基づいて複数の画像を選択する。撮像領域判断部282は、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域を判断する。
The
具体的には、撮像領域判断部282は、画像選択部278が選択した複数の画像のそれぞれが撮像された複数の位置を含む撮像領域を判断する。例えば、撮像領域判断部282は、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の撮像位置を含む撮像領域の地理的な範囲、例えば緯度及び経度の範囲を判断してよい。
Specifically, the imaging
撮像位置分布算出部286は、撮像領域判断部282が判断した撮像領域内における、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の位置の分布を算出する。撮像枚数算出部288は、撮像領域判断部282が判断した撮像領域に含まれる複数の部分領域毎に、画像格納部210が格納する複数の画像のそれぞれが撮像された撮像枚数を算出する。
The imaging position
音声取得部262は、撮像領域判断部282が判断した撮像領域の広さに応じて説明音データベース170が格納する音声を取得する。具体的には、音声取得部262は、撮像領域判断部282が判断した撮像領域がより狭い場合に、撮像領域判断部282が判断した撮像領域についてのより詳しい説明の音声を取得する。
The voice acquisition unit 262 acquires the voice stored in the
より具体的には、音声取得部262は、撮像位置分布算出部286が算出した分布の偏りが予め定められた偏りより大きい部分領域についての説明の音声を取得する。また、音声取得部262は、撮像枚数算出部288が算出した撮像枚数がより多い場合に、説明音データベース170が格納する部分領域についての詳しさが異なる複数の説明のうちのより詳しい説明の音声を取得する。
More specifically, the sound acquisition unit 262 acquires a description sound for a partial region in which the distribution bias calculated by the imaging position
出力部224は、画像格納部210が格納する複数の画像とともに、音声取得部262が取得した音声を出力する。具体的には、出力部224は、画像選択部278が選択した複数の画像とともに、音声取得部262が取得した音声を出力する。
The
画像格納部210は、撮像された画像に対応づけて、当該画像が撮像された時刻をさらに格納する。撮像期間判断部284は、画像格納部210が格納する複数の画像のそれぞれが撮像された複数の時刻を含む撮像期間を判断する。具体的には、撮像期間判断部284は、画像選択部278が選択した複数の画像が撮像された複数の時刻を含む撮像期間を判断する。
The image storage unit 210 further stores the time when the image was captured in association with the captured image. The imaging
そして、音声取得部262は、撮像期間判断部284が判断した撮像期間の長さにさらに応じて説明音データベース170が格納する音声を取得する。具体的には、音声取得部262は、撮像期間判断部284が判断した撮像期間がより長い場合に、撮像領域判断部282が判断した撮像領域についてのより詳しい説明の音声を取得する。
Then, the voice acquisition unit 262 acquires the voice stored in the
図3は、説明音データベース170が格納するデータの一例をテーブル形式で示す。説明音データベース170は、領域に対応づけて、領域の位置する範囲を示す位置範囲及び領域についての音声データを格納する。位置範囲は、例えば、領域が含まれる領域の起点となる緯度及び経度、並びに、終点となる緯度及び経度を含んでよい。なお、位置範囲には、領域の位置する複数の範囲を含んでよい。音声データは、例えば、各領域についての詳しさの異なる複数の音声データ、例えば概要説明、詳細説明の音声データを含んでよい。また、音声データには、各領域に関するニュース等を含んでもよい。
FIG. 3 shows an example of data stored in the
例えば、日本についての概要説明データとは、日本全体の特色、人口、面積等を説明する音声データであってよい。また、日本についての詳細を説明する音声データとは、日本に含まれる各地域の特色、人口、面積等を説明する音声データであってよく、日本の歴史等を説明する音声データであってもよい。 For example, the outline explanation data about Japan may be voice data explaining characteristics, population, area, etc. of the whole of Japan. Moreover, the audio data explaining the details about Japan may be audio data explaining the characteristics, population, area, etc. of each region included in Japan, or even audio data explaining the history of Japan. Good.
図4は、画像が撮像された位置の分布の一例を示す。図4の例では、画像格納部210は、長崎、広島、京都、静岡、東京、及び北海道で撮像した、それぞれ10枚、9枚、10枚、7枚、8枚、及び6枚の画像を格納している。撮像領域判断部282は、例えば、予め定めた緯度及び経度範囲毎の部分領域に区切り、画像が撮像された位置を含む部分領域を判断する。撮像枚数算出部288は、部分領域のそれぞれで撮像された画像の枚数を算出する。そして、撮像位置分布算出部286は、画像が撮像された位置が含まれる部分領域の分布を判断する。
FIG. 4 shows an example of the distribution of positions at which images are taken. In the example of FIG. 4, the image storage unit 210 captures 10 images, 9 images, 10 images, 7 images, 8 images, and 6 images captured in Nagasaki, Hiroshima, Kyoto, Shizuoka, Tokyo, and Hokkaido, respectively. Storing. The imaging
そして、音声取得部262は、撮像位置が広い範囲に分布しているか否かを判断する。例えば、音声取得部262は、長崎で撮像した画像が画像選択部278によって選択されたときには、撮像位置が狭い範囲に分布していると判断して、日本をより詳しく説明する音声データとして、例えば長崎を説明する音声データを説明音データベース170から取得する。また、長崎、広島、京都、静岡、東京、及び北海道で撮像した画像が画像選択部278によって選択された場合には、撮像位置がより広い範囲に分布していると判断して、撮像領域についての概要を説明する音声データとして、例えば日本を説明する音声データを説明音データベース170から取得する。
Then, the sound acquisition unit 262 determines whether the imaging positions are distributed over a wide range. For example, when the image picked up in Nagasaki is selected by the
なお、撮像枚数算出部288によって算出される枚数がより多い場合には、音声取得部262は、それぞれの撮像領域についてのより詳しい説明の音声データを説明音データベース170から取得し、枚数がより少ない場合は、それぞれの撮像領域についてのより概要を説明する音声データを説明音データベース170から取得してよい。
Note that when the number of images calculated by the imaging
また、音声取得部262は、選択された枚数に対する、特定の部分領域で撮像された画像の枚数の比率を計算して、当該比率が予め定めた比率よりも大きい場合に、当該特定の部分領域について説明する音声データを説明音データベース170から取得する。例えば、画像格納部210が、長崎、広島、京都、東京、及び北海道で撮像した、それぞれ6枚、7枚、30枚、4枚、3枚の合計50枚の画像を格納しており、半数以上の30枚が京都で撮像された画像である場合には、音声取得部262は、京都を説明する音声データを説明音データベース170から取得する。このため、出力装置140は、ユーザ180が特に多く撮像した場所について説明する音声をユーザ180に提供することができる。
In addition, the sound acquisition unit 262 calculates the ratio of the number of images captured in the specific partial area to the selected number, and when the ratio is larger than a predetermined ratio, the specific partial area Is obtained from the
図5は、画像が撮像された時刻の分布の一例を示す。撮像期間判断部284は、画像が撮像された時間範囲を、部分領域毎に判断する。例えば、撮像期間判断部284は、長崎、広島、京都、静岡、東京、及び北海道のそれぞれを含む部分領域で撮像された時間範囲(t1〜t10、t11〜t19、t20〜t29、t30〜t36、t37〜t44、及びt45〜t50)を判断する。
FIG. 5 shows an example of the distribution of times when images are captured. The imaging
そして、音声取得部262は、撮像期間の長さを判断する。例えば、音声取得部262は、長崎で撮像した画像が画像選択部278によって選択されたときには、長崎で撮像された期間(t1〜t10)がより短いと判断して、長崎を説明する音声データを説明音データベース170から取得する。また、長崎、広島、京都、静岡、東京、及び北海道で撮像した画像が画像選択部278によって選択された場合には、撮像された期間(t1〜t50)がより長いと判断して、撮像領域についての詳しい説明の音声データとして、例えば日本の詳しい説明の音声データを説明音データベース170から取得する。
Then, the audio acquisition unit 262 determines the length of the imaging period. For example, when the image picked up in Nagasaki is selected by the
そして、音声取得部262は、選択された画像が撮像された期間に対する、特定の部分領域で撮像された期間の比率を計算して、当該比率が予め定めた比率よりも大きい場合に、当該特定の部分領域について説明する音声データを説明音データベース170から取得する。例えば、画像格納部210が、長崎、広島、京都、東京、及び北海道で撮像した画像を格納している場合に、京都で撮像された期間(t64〜t93)が、選択された画像が撮像された期間の合計(t51〜t56、t57〜t63、t64〜t93、t94〜t97、t98〜t10の合計期間)の半分の期間以上である場合に、音声取得部262は京都について説明する音声データを説明音データベース170から取得する。このため、出力装置140は、ユーザ180が特に長く滞在して撮像した場所について説明する音声をユーザ180に提供することができる。
Then, the sound acquisition unit 262 calculates the ratio of the period when the selected image is captured with respect to the period when the selected image is captured, and if the ratio is greater than a predetermined ratio, The voice data describing the partial area is acquired from the
図6は、撮像装置600のブロック構成の一例を示す。撮像装置600は、図1で説明した撮像装置100の他の例であって、特に撮像された画像とともに録音された音声から音楽、環境音等の特徴的な音声を抽出して格納する機能を有する。撮像装置600は、モード設定部692、撮像部602、表示部670、データ格納部698、録音部650、特徴音抽出部694、条件格納部660、及び音声取得部696を備える。
FIG. 6 shows an example of a block configuration of the
撮像部602は、画像を撮像する。撮像部602は、具体的には、被写体からの光をCCD等の撮像デバイスで受光して、被写体を撮像する。なお、撮像部602は所定の時間間隔で連続的に被写体を撮像してもよい。そして、撮像部602は、連続的に撮像して得られる所定の個数の画像を保持してもよい。そして、撮像部602は、撮像部602が保持している画像のうち、撮像を指示された時刻に最も近いタイミングで撮像された画像を撮像画像としてもよい。
The
表示部670は、撮像部602が有する受光素子により受光した光の画像を表示する。モード設定部692は、表示部670が画像を表示している状態の動作モードである撮像モード、又は表示部670が画像を表示していない状態の動作モードである非撮像モードに当該撮像装置600を設定する。
The
録音部650は、撮像部602の周囲の音声を録音する。なお、録音部650は、モード設定部692が撮像モードに設定している場合、及びモード設定部692が非撮像モードに設定している場合の双方において、撮像部602の周囲の音声を録音する。
The
特徴音抽出部694は、録音部650が録音した音声から予め定められた種類の音声を抽出する。例えば、特徴音抽出部694は、録音部650が録音した音声から音楽を抽出する。この場合、特徴音抽出部694は、音声の周波数スペクトルに基づいて基本周波数を抽出して、音階を決定する。そして、特徴音抽出部694は、決定した音階に基づいて、リズム、テンポ、調性等の音楽の特徴量を判断して、音符データを抽出する。また、特徴音抽出部694は、更に、音符データに基づいて音楽のコード進行を抽出してもよい。
The feature
条件格納部660は、特徴音抽出部694が抽出する環境音のそれぞれの種類を特定する条件を予め格納する。具体的には、条件格納部660は、犬、鳥の鳴き声、虫の鳴き声、波の音等の環境音の種類毎に、それぞれの種類の環境音に特徴的な周波数スペクトルを格納する。そして、特徴音抽出部694は、条件格納部660が格納する条件に一致する環境音を、録音部650が録音した音声から抽出する。例えば、特徴音抽出部694は、条件格納部660が格納する周波数スペクトルに予め定められた一致度以上で一致する環境音を、録音部650が録音した音声から抽出する。なお、条件格納部660は、環境音の音声そのものを、環境音の種類毎に格納してよい。この場合、特徴音抽出部694は、条件格納部660が格納する環境音の音声と録音部650が録音した音声とを比較して、音声の特徴量(例えば、周波数スペクトル等)が最も一致度の高い環境音を抽出して、当該環境音の種類を決定してよい。
The condition storage unit 660 stores in advance conditions for specifying each type of environmental sound extracted by the feature
なお、特徴音抽出部694は、撮像部602が画像を撮像した時刻から予め設定された時間内に、録音部650が録音した音声から予め定められた種類の音声を抽出する。例えば、特徴音抽出部694は、撮像部602が画像を撮像した時刻から予め設定された時間内に、録音部650が録音した音声から音楽又は環境音を抽出する。具体的には、特徴音抽出部694は、モード設定部692が撮像モードに設定している時間を含み、モード設定部692が撮像モードに設定している時間より長い予め設定された時間内に、録音部650が録音した音声から予め定められた種類の音声を抽出する。より具体的には、特徴音抽出部694は、モード設定部692が撮像モードに設定している時間を含み、モード設定部692が撮像モードに設定している時間より長い、予め設定された時間内に、録音部650が録音した音声から音楽又は環境音を抽出する。
The feature
音楽データベース172は、時代別に複数の音楽を格納する。また、音楽データベース172は、ジャンル別に複数の音楽を格納する。具体的には、音楽データベース172は、音楽データに対応づけて、音楽のジャンル及び時代を格納する。また、音楽データベース172は、音楽データに対応づけて、音符データ、リズム、テンポ、調性、及びコード進行等の、音楽の特徴量を格納してよい。他にも、音楽データベース172は、音楽データに対応づけて、当該音楽に関連する人物、例えば作曲者、作詞者、編曲者、演奏者等を格納してもよい。また、音楽データベース172は、音楽データに対応づけて、当該音楽が発信される地域の位置を示す発信位置、発信される発信時刻、及び発信手段を格納してもよい。なお、発信手段とは、例えばラジオ、有線等であってよい。また、発信時刻とは、例えば放送局の番組データ等、音楽が放送されるべき時刻を示す情報であってよい。また、音楽データベース172は、音楽データに対応づけて、当該音楽が複数の地域においてヒットした程度を示す情報を、地域毎及び時代毎に格納してもよい。
The
音声取得部696は、複数の種類の音声を格納する音声データベースから、特徴音抽出部694が抽出した音声と同一の種類の音声を取得する。具体的には、音声取得部696は、音楽データベース172から、特徴音抽出部694が抽出した音楽と同一の音楽を取得する。具体的には、音声取得部696は、特徴音抽出部694が抽出した音符データと一致する音符データを有する音楽を音楽データベース172から取得する。このとき、音声取得部696は、撮像部602が画像を撮像したタイミングにおいて撮像装置600の撮像位置及び撮像時刻を検出し、当該撮像位置を含む発信位置及び当該撮像時刻を含む発信時刻に対応づけて音楽データベース172に格納された音楽データの中から、特徴音抽出部694が抽出した音楽と同一の音楽を取得してよい。このとき、音声取得部696は、音楽データベース172に格納された音楽データのうち、撮像位置を含む地域及び撮像時刻を含む時代においてヒットした程度がより高い音楽を優先して検索し、取得してよい。また、音声取得部696は、音楽が発信されるべき発信手段を撮像位置に基づいて特定して、当該発信手段によって発信される音楽から順に検索してもよい。例えば、音声取得部696は、住宅街で録音された音楽を取得する場合には、ラジオ放送で放送されるべき音楽から順に検索し、遊園地等で録音された音楽を取得する場合には、有線放送によって放送されるべき音楽から順に検索してよい。
The
また、音声取得部696は、複数の音楽を格納する音楽データベース172から、特徴音抽出部694が抽出した音楽と同一の種類の音楽を取得する。具体的には、音声取得部696は、音楽データベース172から、特徴音抽出部694が抽出した音楽と同じ時代の音楽を取得する。また、音声取得部696は、音楽データベース172から、特徴音抽出部694が抽出した音楽と同じジャンルの音楽を取得する。具体的には、音声取得部696は、特徴音抽出部694が抽出したリズム、テンポ、調性、及びコード進行等の特徴量に基づいて音楽のジャンル及び/又は時代を特定して、特定したジャンル及び/又は時代の音楽を音楽データベース172から取得する。他にも、音声取得部696は、特徴音抽出部694が抽出した特徴量に基づいて、当該特徴量の音楽を音楽データベース172を検索することによって、当該音楽に関連する人物を特定して、特定した人物に対応づけられた音楽を音楽データベース172から取得してもよい。なお、音声取得部696は、音楽データベース172に格納された音楽データのうち、撮像位置を含む地域及び撮像時刻を含む期間においてヒットした程度が最も高い音楽を取得してよい。
In addition, the
また、音声取得部696は、環境音データベース174から、特徴音抽出部694が抽出した環境音と同一の種類の環境音を取得する。なお、条件格納部660が環境音そのものを格納している場合には、音声取得部696は、特徴音抽出部694が抽出した音声と同種の音声を条件格納部660から取得してもよい。
In addition, the
データ格納部698は、音声取得部696が取得した音声と撮像部602が撮像した画像とを同期して出力させるべく対応づけて格納する。具体的には、データ格納部698は、音声取得部696が取得した音楽と撮像部602が撮像した画像とを同期して出力させるべく対応づけて格納する。他にも、データ格納部698は、音声取得部696が取得した環境音と撮像部602が撮像した画像とを同期して出力させるべく対応づけて格納する。以上説明した撮像装置600によれば、撮像装置600によって撮像したときに撮像装置600の周囲を流れていたBGMと同じ音楽を、画像とともにユーザ180に提供することができる。また、撮像装置600は、撮像時の周囲の環境音を画像とともにユーザ180に提供することができる。
The
図7は、音楽データベース172が格納するデータの一例をテーブル形式示す。音楽データベース172は、音楽データに対応づけて、時代、音楽が属するジャンル、音楽が有するリズム、音楽が有するテンポ、音楽が有する調性、音楽が有するコード進行、音楽の楽譜を示す音符データ、音楽の原盤権を保有するレコード会社、音楽を制作したレーベル、音楽がヒットしたヒット度を格納する。なお、音楽データベース172が格納する時代とは、音楽が作成された時代、音楽が発表された時代、音楽が流行した時代等であってよい。なお、音楽データベース172は、本図において例示した属性の他に、音楽をプロデュースしたプロデューサ、音楽が含まれる音楽アルバム、音楽をダウンロードする場合に課金される課金情報等、音楽に関連する様々な属性を格納してよいことは言うまでもない。
FIG. 7 shows an example of data stored in the
図8は、撮像装置600が録音する音声と時間範囲の一例を示す。撮像装置600は、動作モードとして、撮像モード、出力モード、及び待機モードを有する。撮像モードとは、撮像装置600が撮像及び/又は録音することのできる動作モードであってよい。また、出力モードは、例えば、撮像装置600が画像及び/又は音声を出力することのできる動作モードであってよい。なお、非撮像モードは、出力モード及び待機モードを含む。そして、撮像装置600は、撮像モードに設定されている期間(t1〜t3)、出力モードに設定されている期間(t3〜t4)、及び待機モードに設定されている期間(t0〜t1及びt4〜t5)における撮像装置600の周囲の音声を録音する。
FIG. 8 shows an example of sound and time range recorded by the
なお、撮像装置600は、起動された直後には撮像装置600は待機モードに設定される。撮像装置600は、動作モードが待機モード又は出力モードに設定されている場合に、ユーザ180によって撮像動作又は録音動作に関する操作がなされた場合に撮像モードに遷移する。撮像動作に関する操作は、例えば、画像を撮像する操作、シャッタスピード、焦点距離等の、撮像条件を調整する操作等を含む。また、録音動作に関する操作は、例えば、音声を録音する操作、録音感度の調整等の、録音条件を調整する操作等を含む。また、撮像装置600は、動作モードが待機モード又は撮像モードに設定されている場合に、ユーザ180によって撮像装置600の出力動作に関する操作がなされた場合に、出力モードに遷移する。出力動作に関する操作は、例えば、画像を出力する操作、出力する画像を選択する操作、出力速度の調節等の、出力条件を調整する操作等を含む。なお、撮像装置600は、撮像装置600が撮像モード又は出力モードに設定されている場合に、ユーザ180による撮像装置600の操作が所定の期間操作されなかったことを条件として、待機モードに遷移してよい。
Note that immediately after the
特徴音抽出部694は、撮像時刻t2から予め定めた時間だけ前又は後の時間範囲において、録音部650で録音された音声から音楽を抽出する。例えば、撮像装置600がユーザ180から時刻t2において撮像するよう指示された場合に、特徴音抽出部694は、撮像時刻t2を含む撮像モードに設定されていた期間(t1〜t3)を含む、待機モード又は出力モードに設定されていた期間、例えば期間(t0〜t5)において録音された音声から音楽を抽出する。
The feature
なお、特徴音抽出部694は、撮像時刻t2を含む、期間(t0〜t5)において録音部650によって録音された音声のうち、撮像時刻t2の最も近い時刻で録音された音声から音楽を抽出してよい。また、特徴音抽出部694は、最も音量の大きい音量の音声の中から音楽を抽出してよい。
Note that the feature
図9は、音楽を取得する手順の一例を示す。特徴音抽出部694は、録音部650が録音した音声から撮像した時刻を含む期間の音声を抽出する(S912)。そして、特徴音抽出部694は、S912で抽出した期間の音声から、音楽の特徴量を抽出する(S914)。音楽の特徴量とは、例えば音符データ、リズム、テンポ、調性、コード進行等であってよい。
FIG. 9 shows an example of a procedure for acquiring music. The feature
そして、音声取得部696は、特徴音抽出部694が抽出した音符データと一致する音楽を音楽データベース172の中から検索する(S916)。そして、特徴音抽出部694は、抽出した音符データと一致する音楽が音楽データベース172に格納されているか否かを判断する(S918)。音声取得部696は、S918において、一致する音楽があると判断した場合には、音楽データベース172の中から一致する音楽を取得する(S920)。
Then, the
音声取得部696は、S918において一致する音楽がないと判断した場合には、特徴音抽出部694がS914で抽出した音楽の特徴量に基づいて、S912で抽出した音楽と同じジャンル及び/又は年代を特定する(S922)。例えば、音声取得部696は、音楽データベース172に格納された音楽の中で、最も類似する特徴量を持つ音楽を最も多く含むジャンル及び/又は時代を特定する。そして、音声取得部696は、S922で特定したジャンル及び/又は年代の音楽を、音楽データベース172に格納された音楽の中から取得する(S924)。また、音声取得部696は、S922において、ジャンル、年代の他にも、類似する特徴量を持つ最も多くの音楽に対応づけて音楽データベース172が格納しているレコード会社又はレーベルを特定してよい。そして、音声取得部696は、S924において、S922において特定したレコード会社又はレーベルの音楽を、音楽データベース172に格納された音楽の中から取得してよい。なお、S924において、音声取得部696は、同じ種類の音楽が複数存在する場合には、音楽データベース172が格納するヒット度が最も高い音楽を取得してよい。
If the
なお、音声取得部696は、S918で同一の音楽と判断された音楽が音楽データベース172から複数検索された場合は、検索された複数の音楽を音楽データベース172から取得してユーザ180に選択させてもよい。また、音声取得部696は、S924においても、音楽データベース172から取得した同じジャンル及び/又は年代の音楽を複数取得して、ユーザ180に選択させてもよい。他にも、音声取得部696は、検索された複数の音楽のうち音楽データベース172が格納するヒット度が最も高い音楽を取得してよい。また、音声取得部696は、複数の音楽が検索された場合には、検索された複数の音楽のうち最も多い数の音楽に対応づけて音楽データベース172が格納しているレコード会社又はレーベルの音楽を特定してよい。そして、音声取得部696は、特定したレコード会社又はレーベルの年代の音楽を、音楽データベース172に格納された音楽の中から取得してよい。なお、S920において音声取得部696は、S918で同一の音楽と判断された音楽と同じレコード会社又はレーベルの音楽を音楽データベース172から取得してもよい。また、音声取得部696は、レコード会社又はレーベルの他にも、S918で同一の音楽と判断された音楽と同じ属性に対応づけて音楽データベース172に格納されている音楽を、音楽データベース172から取得してもよい。
When a plurality of music determined to be the same music in S918 are searched from the
以上、図7から図9にかけて、音声取得部696が音楽データベース172から音楽を取得する動作について説明したが、同様の動作によって、音声取得部696は環境音データベース174から環境音を取得することができる。また、音声取得部696は、音楽、環境音の他にも、画像に対応づけて記録すべき予め定められた様々な種類の音声を、音声データベースから取得してよいことは言うまでもない。
As described above, the operation in which the
図10は、出力装置1040のブロック構成の一例を示す。出力装置1040は、音声提供システムが有する出力装置140の他の一例であってよい。なお、撮像装置100は、撮像した画像及び撮像したときの周囲の音声の他に、周囲の音声を録音した時刻も出力装置1040に送信する。
FIG. 10 shows an example of a block configuration of the
出力装置1040は、画像格納部1010、出力部1024、音声取得部1096、特徴音抽出部1094、条件格納部1060、音声格納部1020、許容時間設定部1043、出力時刻検出部1044、出力要求取得部1048を備える。
The
画像格納部1010は、撮像装置100によって撮像された画像を格納する。また、画像格納部1010は、画像に対応づけて当該画像が撮像された撮像時刻を格納する。
The
音声格納部1020は、撮像装置100によって録音された音声を格納する。音声格納部1020は、音声に対応づけて当該音声の録音時刻を格納する。具体的には、音声格納部1020は、撮像装置100の周囲の音声を格納する。なお、録音時刻とは、音声の録音を開始した時刻であってよく、録音を終了した時刻であってよい。
The
特徴音抽出部1094は、音声格納部1020が格納する音声から予め定められた種類の音声を抽出する。具体的には、音声取得部1096は、複数の種類の音声を格納する音声データベースから、特徴音抽出部1094が抽出した音声と同一の種類の音声を取得する。例えば、特徴音抽出部1094は、音声格納部1020が格納する音声から音楽を抽出する。そして、音声取得部1096は、複数の音楽を格納する音楽データベース172から、特徴音抽出部1094が抽出した音楽と同一の種類の音楽を取得する。他にも、音声取得部1096は、環境音データベース174から、特徴音抽出部1094が抽出した環境音と同一の種類の環境音を取得する。なお、音声取得部1096が音楽又は環境音等の音声を取得する具体的な動作は、図9で説明した音声取得部696の動作と同一であるので、説明を省略する。
The feature
出力要求取得部1048は、画像格納部1010が格納する画像の出力要求を取得する。許容時間設定部1043は、出力要求取得部1048が出力要求を取得した時刻と、画像格納部1010が格納する画像の撮像時刻との差がより大きい場合に、音声を抽出する期間である許容時間をより長く設定する。そして、特徴音抽出部1094は、画像が撮像された時刻から予め設定された許容時間内に録音された音声から音楽を抽出する。出力部1024は、音声取得部1096が取得した音声と画像格納部1010が格納する画像とを同期して出力する。具体的には、出力部1024は、音声取得部1096が取得した音楽又は環境音と、画像格納部1010が格納する画像とを同期して出力する。
The output
本実施形態の出力装置1040によれば、撮像した画像を、当該画像を撮像したときに流れていた音楽、例えば撮像当時に流行していた音楽とともにユーザ180に提供することができる。
According to the
図11は、許容時間設定部1043が設定する許容時間の一例を示す。例えば、ユーザ180から、時刻t12で撮像された画像を出力する指示を時刻t13において受け付けた場合に、許容時間設定部1043は、出力を指示された時刻と出力される画像が撮像された時刻との差(t13−t12)に基づいて、特徴音抽出部1094に音楽を抽出する音声をさせる許容範囲Δt52を決定する。そして、特徴音抽出部1094は、音声格納部1020に格納されている音声のうち、時刻t12からΔt52だけ前又は後の時間範囲(時刻t12―Δt52〜時刻t12+Δt52)に録音された音声の中から音楽を抽出する。
FIG. 11 shows an example of the allowable time set by the allowable
なお、特徴音抽出部1094は、時刻t12から許容範囲Δt52だけ前の時刻から時刻t12までの間に録音された音声の中から音声を抽出してもよいし、時刻t12から許容範囲Δt52だけ後の時刻までの間に録音された音声の中から音声を抽出してもよい。
Note that the feature
また、許容時間設定部1043は、画像格納部1010が格納する撮像画像が撮像された時刻と、出力する指示を受け付けた時刻との差が大きいほど、許容時間をより大きく設定する。図11の例では、許容時間設定部1043は、時刻t12よりも前の時刻t11に撮像された画像を出力するよう時刻t13において指示された場合には、許容範囲Δt52に比べて時間的により長い許容範囲Δt51を設定する。そして、特徴音抽出部1094は、時刻(t11−Δt51)から時刻(t11+Δt51)までの時間範囲内で録音された音声の中から音楽を抽出する。
Further, the allowable
なお、許容時間設定部1043は、撮像された時刻と出力を指示された時刻との間の時間を予め定められた数で割って得られた期間を許容時間として設定してよい。この場合、特徴音抽出部1094は、例えば10日前に撮像した画像を出力するときには、撮像時刻の前後1日の間に録音された音声から音楽を抽出する。また、特徴音抽出部1094は、10年前に撮像した画像を出力するときには、撮像時刻の前後1年の間に録音された音声の中から音楽を抽出する。
The allowable
以上説明した出力装置1040によれば、例えば観光地を移動する車内で聴いたFM放送の音楽、観光地で立ち寄った店内を流れていた有線放送の音楽等、ユーザ180が訪れた場所で流れていた音楽を適切に判断して、その音楽をダウンロードしてきて画像とともに再生することができる。また、出力装置1040は、ユーザ180が訪れた場所の環境音と同種の環境音をダウンロードして画像とともに再生することができる。また、出力装置1040は、より過去に撮像された画像を出力するときには、撮像された時刻を含むより広い時間範囲で録音された音声の中から音楽、環境音を含む音声を選択するので、ユーザ180は撮像当時に最も流行していた音楽を思い出しながら楽しく画像を鑑賞することができる。
According to the
図12は、出力装置140、撮像装置600、及び出力装置1040に係るコンピュータ1500のハードウェア構成の一例を示す。コンピュータ1500は、ホスト・コントローラ1582により相互に接続されるCPU1505、RAM1520、グラフィック・コントローラ1575、及び表示装置1580を有するCPU周辺部と、入出力コントローラ1584によりホスト・コントローラ1582に接続される通信インターフェイス1530、ハードディスクドライブ1540、及びCD−ROMドライブ1560を有する入出力部と、入出力コントローラ1584に接続されるROM1510、フレキシブルディスク・ドライブ1550、及び入出力チップ1570を有するレガシー入出力部とを備える。
FIG. 12 illustrates an example of a hardware configuration of a
ホスト・コントローラ1582は、RAM1520と、高い転送レートでRAM1520をアクセスするCPU1505、及びグラフィック・コントローラ1575とを接続する。CPU1505は、ROM1510、及びRAM1520に格納されたプログラムに基づいて動作し、各部の制御を行う。グラフィック・コントローラ1575は、CPU1505等がRAM1520内に設けたフレーム・バッファ上に生成する画像データを取得し、表示装置1580上に表示させる。これに代えて、グラフィック・コントローラ1575は、CPU1505等が生成する画像データを格納するフレーム・バッファを、内部に含んでもよい。
The
入出力コントローラ1584は、ホスト・コントローラ1582と、比較的高速な入出力装置であるハードディスクドライブ1540、通信インターフェイス1530、CD−ROMドライブ1560を接続する。ハードディスクドライブ1540は、コンピュータ1500内のCPU1505が使用するプログラム、及びデータを格納する。通信インターフェイス1530は、ネットワークを介して出力装置140、撮像装置600、又は出力装置1040と通信し、出力装置140、撮像装置600、又は出力装置1040にプログラム、及びデータを提供する。CD−ROMドライブ1560は、CD−ROM1595からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。
The input /
また、入出力コントローラ1584には、ROM1510と、フレキシブルディスク・ドライブ1550、及び入出力チップ1570の比較的低速な入出力装置とが接続される。ROM1510は、コンピュータ1500が起動時に実行するブート・プログラムや、コンピュータ1500のハードウェアに依存するプログラム等を格納する。フレキシブルディスク・ドライブ1550は、フレキシブルディスク1590からプログラムまたはデータを読み取り、RAM1520を介してハードディスクドライブ1540、及び通信インターフェイス1530に提供する。入出力チップ1570は、フレキシブルディスク・ドライブ1550や、例えばパラレル・ポート、シリアル・ポート、キーボード・ポート、マウス・ポート等を介して各種の入出力装置を接続する。
The input /
RAM1520を介して通信インターフェイス1530に提供されるプログラムは、フレキシブルディスク1590、CD−ROM1595、またはICカード等の記録媒体に格納されて利用者によって提供される。プログラムは、記録媒体から読み出され、RAM1520を介して通信インターフェイス1530に提供され、ネットワークを介して出力装置140、撮像装置600、又は出力装置1040に送信される。出力装置140、撮像装置600、又は出力装置1040に送信されたプログラムは、出力装置140、撮像装置600、又は出力装置1040においてインストールされて実行される。
A program provided to the
出力装置140にインストールされて実行されるプログラムは、出力装置140を図1から図5において説明した出力装置140として機能させる。また、撮像装置600にインストールされて実行されるプログラムは、撮像装置600を、図6から図9において説明した撮像装置600として機能させる。また、出力装置1040にインストールされて実行されるプログラムは、出力装置1040を、図10及び図11において説明した出力装置1040として機能させる。
The program installed and executed in the
以上に示したプログラムは、外部の記憶媒体に格納されてもよい。記憶媒体としては、フレキシブルディスク1590、CD−ROM1595の他に、DVDやPD等の光学記録媒体、MD等の光磁気記録媒体、テープ媒体、ICカード等の半導体メモリ等を用いることができる。また、専用通信ネットワークやインターネットに接続されたサーバシステムに設けたハードディスクまたはRAM等の記憶装置を記録媒体として使用し、ネットワークを介してプログラムをコンピュータ1500に提供してもよい。
The program shown above may be stored in an external storage medium. As the storage medium, in addition to the
以上、実施形態を用いて本発明を説明したが、本発明の技術的範囲は上記実施形態に記載の範囲には限定されない。上記実施形態に、多様な変更又は改良を加えることができる。そのような変更又は改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。 As mentioned above, although this invention was demonstrated using embodiment, the technical scope of this invention is not limited to the range as described in the said embodiment. Various modifications or improvements can be added to the above embodiment. It is apparent from the scope of the claims that the embodiments added with such changes or improvements can be included in the technical scope of the present invention.
100 撮像装置
140 出力装置
150 通信回線
170 説明音データベース
172 音楽データベース
174 環境音データベース
180 ユーザ
210 画像格納部
224 出力部
262 音声取得部
278 画像選択部
282 撮像領域判断部
284 撮像期間判断部
286 撮像位置分布算出部
288 撮像枚数算出部
600 撮像装置
602 撮像部
650 録音部
660 条件格納部
670 表示部
692 モード設定部
694 特徴音抽出部
696 音声取得部
698 データ格納部
1010 画像格納部
1020 音声格納部
1024 出力部
1040 出力装置
1043 許容時間設定部
1048 出力要求取得部
1060 条件格納部
1094 特徴音抽出部
1096 音声取得部
1044 出力時刻検出部
DESCRIPTION OF
Claims (15)
前記撮像部の周囲の音声を録音する録音部と、
前記録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部と、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部と、
前記音声取得部が取得した音声と前記撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部と
を備える撮像装置。 An imaging unit;
A recording unit for recording sound around the imaging unit;
A feature sound extraction unit that extracts a predetermined type of sound from the sound recorded by the recording unit;
A voice acquisition unit that acquires a voice of the same type as the voice extracted by the feature sound extraction unit from a voice database that stores a plurality of types of voice;
An imaging apparatus comprising: a data storage unit that stores the audio acquired by the audio acquisition unit and the image captured by the imaging unit in association with each other so as to be output in synchronization.
請求項1に記載の撮像装置。 The imaging according to claim 1, wherein the characteristic sound extraction unit extracts a predetermined type of sound from the sound recorded by the recording unit within a preset time from the time when the image capturing unit captures an image. apparatus.
前記表示部が画像を表示している状態の動作モードである撮像モード、又は前記表示部が画像を表示していない状態の動作モードである非撮像モードに当該撮像装置を設定するモード設定部と
をさらに備え、
前記録音部は、前記モード設定部が前記撮像モードに設定している場合、及び前記モード設定部が前記非撮像モードに設定している場合の双方において、前記撮像部の周囲の音声を録音する
請求項2に記載の撮像装置。 A display unit for displaying an image of light received by a light receiving element included in the imaging unit;
A mode setting unit that sets the imaging apparatus to an imaging mode that is an operation mode in which the display unit is displaying an image, or a non-imaging mode that is an operation mode in which the display unit is not displaying an image; Further comprising
The recording unit records sound around the imaging unit both when the mode setting unit is set to the imaging mode and when the mode setting unit is set to the non-imaging mode. The imaging device according to claim 2.
請求項3に記載の撮像装置。 The characteristic sound extraction unit includes a time set by the mode setting unit in the imaging mode, and is longer than a time set by the mode setting unit in the imaging mode within a preset time. The imaging apparatus according to claim 3, wherein a predetermined type of sound is extracted from the sound recorded by the recording unit.
前記特徴音抽出部は、前記録音部が録音した音声から音楽を抽出し、
前記音声取得部は、前記音声データベースから、前記特徴音抽出部が抽出した音楽と同一の音楽を取得する
請求項1に記載の撮像装置。 The voice database stores a plurality of music,
The feature sound extraction unit extracts music from the voice recorded by the recording unit,
The imaging apparatus according to claim 1, wherein the voice acquisition unit acquires the same music as the music extracted by the feature sound extraction unit from the voice database.
前記特徴音抽出部は、前記録音部が録音した音声から音楽を抽出し、
前記音声取得部は、前記音声データベースから、前記特徴音抽出部が抽出した音楽と同じ時代の音楽を取得する
請求項1に記載の撮像装置。 The voice database stores a plurality of music by era,
The feature sound extraction unit extracts music from the voice recorded by the recording unit,
The imaging apparatus according to claim 1, wherein the voice acquisition unit acquires music of the same era as the music extracted by the feature sound extraction unit from the voice database.
前記特徴音抽出部は、前記録音部が録音した音声から音楽を抽出し、
前記音声取得部は、前記音声データベースから、前記特徴音抽出部が抽出した音楽と同じジャンルの音楽を取得する
請求項1に記載の撮像装置。 The voice database stores a plurality of music by genre,
The feature sound extraction unit extracts music from the voice recorded by the recording unit,
The imaging apparatus according to claim 1, wherein the voice acquisition unit acquires music of the same genre as the music extracted by the feature sound extraction unit from the voice database.
をさらに備え、
前記音声データベースは、環境音の種類別に複数の環境音を格納しており、
前記特徴音抽出部は、前記条件格納部が格納する条件に一致する環境音を、前記録音部が録音した音声から抽出し、
前記音声取得部は、前記音声データベースから、前記特徴音抽出部が抽出した環境音と同一の種類の環境音を取得し、
前記データ格納部は、前記音声取得部が取得した環境音と前記撮像部が撮像した画像とを同期して出力させるべく対応づけて格納する
請求項1に記載の撮像装置。 A condition storage unit that preliminarily stores conditions for specifying each type of environmental sound extracted by the feature sound extraction unit;
The voice database stores a plurality of environmental sounds for each type of environmental sound,
The characteristic sound extraction unit extracts an environmental sound that matches the condition stored in the condition storage unit from the sound recorded by the recording unit,
The voice acquisition unit acquires the same kind of environmental sound as the environmental sound extracted by the feature sound extraction unit from the voice database,
The imaging apparatus according to claim 1, wherein the data storage unit stores the environmental sound acquired by the audio acquisition unit and the image captured by the imaging unit in association with each other so as to be output in synchronization.
前記撮像部の周囲の音声を録音する録音段階と、
前記録音段階において録音された音声から予め定められた種類の音声を抽出する特徴音抽出段階と、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出段階において抽出された音声と同一の種類の音声を取得する音声取得段階と、
前記音声取得段階において取得された音声と前記撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納段階と
を備える撮像方法。 An imaging stage in which an image is captured by an imaging unit;
A recording stage for recording sound around the imaging unit;
A feature sound extraction step of extracting a predetermined type of sound from the sound recorded in the recording step;
A voice acquisition stage for acquiring a voice of the same type as the voice extracted in the feature sound extraction stage from a voice database storing a plurality of types of voice;
An imaging method comprising: a data storage step of storing the audio acquired in the audio acquisition step and the image captured by the imaging unit in association with each other so as to be output in synchronization.
画像を撮像する撮像部、
前記撮像部の周囲の音声を録音する録音部、
前記録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部、
前記音声取得部が取得した音声と前記撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部
として機能させるプログラム。 A program for an imaging apparatus that captures an image, wherein the imaging apparatus is
An imaging unit for capturing an image;
A recording unit for recording sound around the imaging unit;
A feature sound extraction unit for extracting a predetermined type of sound from the sound recorded by the recording unit;
A voice acquisition unit that acquires a voice of the same type as the voice extracted by the feature sound extraction unit from a voice database that stores a plurality of types of voice;
A program that functions as a data storage unit that stores the audio acquired by the audio acquisition unit and the image captured by the imaging unit in association with each other so as to be output in synchronization.
前記撮像装置によって録音された音声を格納する音声格納部と、
前記音声格納部が格納する音声から予め定められた種類の音声を抽出する特徴音抽出部と、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部と、
前記音声取得部が取得した音声と前記画像格納部が格納する画像とを同期して出力する出力部と
を備える出力装置。 An image storage unit for storing an image captured by the imaging device;
An audio storage unit for storing audio recorded by the imaging device;
A feature sound extraction unit that extracts a predetermined type of sound from the sound stored in the sound storage unit;
A voice acquisition unit that acquires a voice of the same type as the voice extracted by the feature sound extraction unit from a voice database that stores a plurality of types of voice;
An output device comprising: an output unit that outputs the audio acquired by the audio acquisition unit and the image stored in the image storage unit in synchronization.
前記音声格納部は、音声に対応づけて当該音声の録音時刻を格納しており、
前記特徴音抽出部は、画像が撮像された時刻から予め設定された許容時間内に録音された音声から予め定められた種類の音声を抽出する
請求項11に記載の出力装置。 The image storage unit stores the imaging time of the image in association with the image,
The voice storage unit stores the recording time of the voice in association with the voice,
The output device according to claim 11, wherein the characteristic sound extraction unit extracts a predetermined type of sound from sound recorded within a preset allowable time from the time when the image was captured.
前記出力要求取得部が出力要求を取得した時刻と、前記画像格納部が格納する画像の撮像時刻との差がより大きい場合に、前記許容時間をより長く設定する許容時間設定部と
をさらに備える請求項12に記載の出力装置。 An output request acquisition unit for acquiring an output request for an image stored in the image storage unit;
And a permissible time setting unit that sets the permissible time longer when the difference between the time when the output request acquisition unit acquires the output request and the image capture time of the image stored in the image storage unit is larger. The output device according to claim 12.
前記撮像装置によって録音された音声を格納する音声格納段階と、
前記音声格納段階において格納される音声から予め定められた種類の音声を抽出する特徴音抽出段階と、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出段階において抽出された音声と同一の種類の音声を取得する音声取得段階と、
前記音声取得段階において取得された音声と前記画像格納段階において格納される画像とを同期して出力する出力段階と
を備える出力方法。 An image storage stage for storing an image captured by the imaging device;
A voice storage step for storing voice recorded by the imaging device;
A feature sound extraction step of extracting a predetermined type of sound from the sound stored in the sound storage step;
A voice acquisition stage for acquiring a voice of the same type as the voice extracted in the feature sound extraction stage from a voice database storing a plurality of types of voice;
An output method comprising: an output step of outputting the sound acquired in the sound acquisition step and the image stored in the image storage step in synchronization.
画像を撮像する撮像部、
前記撮像部の周囲の音声を録音する録音部、
前記録音部が録音した音声から予め定められた種類の音声を抽出する特徴音抽出部、
複数の種類の音声を格納する音声データベースから、前記特徴音抽出部が抽出した音声と同一の種類の音声を取得する音声取得部、
前記音声取得部が取得した音声と前記撮像部が撮像した画像とを同期して出力させるべく対応づけて格納するデータ格納部
として機能させるプログラム。
A program for an output device for outputting an image, wherein the output device is
An imaging unit for capturing an image;
A recording unit for recording sound around the imaging unit;
A feature sound extraction unit for extracting a predetermined type of sound from the sound recorded by the recording unit;
A voice acquisition unit that acquires a voice of the same type as the voice extracted by the feature sound extraction unit from a voice database that stores a plurality of types of voice;
A program that functions as a data storage unit that stores the audio acquired by the audio acquisition unit and the image captured by the imaging unit in association with each other so as to be output in synchronization.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005361061A JP2006304257A (en) | 2005-03-25 | 2005-12-14 | Image pickup device, image pickup method, output device, and output method and program |
US11/359,517 US7587136B2 (en) | 2005-02-25 | 2006-02-23 | Image capturing apparatus, image capturing method, output apparatus, output method and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005088698 | 2005-03-25 | ||
JP2005361061A JP2006304257A (en) | 2005-03-25 | 2005-12-14 | Image pickup device, image pickup method, output device, and output method and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006304257A true JP2006304257A (en) | 2006-11-02 |
Family
ID=37471969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005361061A Pending JP2006304257A (en) | 2005-02-25 | 2005-12-14 | Image pickup device, image pickup method, output device, and output method and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2006304257A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010198501A (en) * | 2009-02-26 | 2010-09-09 | Pioneer Electronic Corp | Voice information selecting device, voice information selecting method, voice information selection program, and recording medium |
-
2005
- 2005-12-14 JP JP2005361061A patent/JP2006304257A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010198501A (en) * | 2009-02-26 | 2010-09-09 | Pioneer Electronic Corp | Voice information selecting device, voice information selecting method, voice information selection program, and recording medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103714108B (en) | Information processing system, information processor and information processing method | |
US7587136B2 (en) | Image capturing apparatus, image capturing method, output apparatus, output method and program | |
JP2006238220A (en) | Imaging apparatus, imaging method, and program | |
JP2006338553A (en) | Content reproducing device | |
JP2007081681A (en) | Image pickup device and method therefor | |
JP2007164269A (en) | Retrieval device, retrieval/reproducing device, and image reproducing device | |
JP2010021638A (en) | Device and method for adding tag information, and computer program | |
JP5112901B2 (en) | Image reproducing apparatus, image reproducing method, image reproducing server, and image reproducing system | |
JP2006203860A (en) | Imaging apparatus, imaging method, reproducing apparatus, reproducing method and program | |
US9154545B2 (en) | Video information control apparatus and method | |
JP5064917B2 (en) | Electronic album system and electronic album creation method | |
JP2007179368A (en) | Image editing support system, apparatus, method and program | |
JP2004032131A (en) | Imaging apparatus and image processing apparatus | |
JP4350635B2 (en) | Image recording / playback system and electronic album creation system | |
JP2006304257A (en) | Image pickup device, image pickup method, output device, and output method and program | |
JP2006238357A (en) | Output device, output method, program, and voice providing system | |
JP2004152174A (en) | Content reproducing device, content providing system, content retrieving method, and program | |
JPH09163276A (en) | Information recording and reproducing device with marking function | |
JP2010020630A (en) | Video search apparatus, video search method and computer program | |
JP7451999B2 (en) | Recording device, video system, recording method, and program | |
JP2006203670A (en) | Template distribution device | |
US7411123B2 (en) | Method for transforming image into music | |
JP2005191892A (en) | Information acquisition device and multi-media information preparation system using it | |
JP2004104675A (en) | Information recording medium, method for recording image data and image data recording program | |
JP6038256B2 (en) | Image search system and image search method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20061211 |