JP5155092B2 - Camera, playback device, and playback method - Google Patents
Camera, playback device, and playback method Download PDFInfo
- Publication number
- JP5155092B2 JP5155092B2 JP2008263490A JP2008263490A JP5155092B2 JP 5155092 B2 JP5155092 B2 JP 5155092B2 JP 2008263490 A JP2008263490 A JP 2008263490A JP 2008263490 A JP2008263490 A JP 2008263490A JP 5155092 B2 JP5155092 B2 JP 5155092B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- camera
- unit
- sound
- shooting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Studio Devices (AREA)
- Stereoscopic And Panoramic Photography (AREA)
- Television Signal Processing For Recording (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本発明は、カメラおよび再生装置に関し、詳しくは、撮影時に録音可能なカメラおよびこのカメラで撮影した撮影画像の再生装置および再生方法に関する。 The present invention relates to a camera and a playback device, and more particularly, to a camera that can be recorded during shooting, and a playback device and playback method for a shot image shot with this camera.
近年、大画面テレビが普及してきており、撮影画像を大画面テレビに再生表示して楽しむことが行われている。また、テレビの画質も向上してきており、消費電力も低減されてきていることから、撮影画像をポスターのように表示し、画像をインテリアとして楽しむことも行われている。さらに、デジタル画像を表示するためのデジタルフォトフレームも普及してきている。このように、最近では、生活を撮影画像で彩ることが行われている。 In recent years, large screen televisions have become widespread, and captured images are played back and displayed on large screen televisions. Also, since the image quality of televisions has been improved and the power consumption has been reduced, captured images are displayed like posters and the images can be enjoyed as interiors. In addition, digital photo frames for displaying digital images have become widespread. Thus, recently, life has been colored with photographed images.
インテリア感覚での表示にあたっては、画像は押しつけがましいものではなく、雄大な風景や美しい花鳥風月など、癒されるものが求められており、従来のような動画とは異なる撮影方法や、また表示方法が必要となってきている。 When displaying in an interior sensation, images are not intrusive, and there is a need for something that can heal, such as majestic landscapes and beautiful flower-and-birds, and a different shooting method and display method are required. It has become.
また、表示にあたっては、複数の画像を合成し、パノラマ画像表示が提案されている。例えば、特許文献1には、合成対象となる画像の一方のサイズ全体を用いることにより、パノラマ画像全体を表現し、迫力ある表示を行うようにした画像表示装置が開示されている。また、パノラマ画像を利用し、複数の画像を合成し、アスペクト比が16:9の大型画面にパノラマ画像を静止画表示するという提案もなされている。
また、インタリア感覚で撮影画像を表示するにあたって、撮影時に録音された音声を再生すると癒され、また過去の思い出に浸ることもできる。音声を撮影時に録音することは従来よりも種々提案されている。例えば、特許文献2には、モノラル音声画像からステレオ音声画像に変換する音源安定化装置が開示されている。すなわち、この音源安定化装置は、画像知識データベースの情報を用いて、分割された画像から画像内の物体や、その物体の動き(位置)や、カメラの操作等を解析し、物体が発していると考えられる音源を音情報から分離し、分離された音源を映像に適した音場空間に再配置している。
このように、画像合成することにより、大画面に相応しい画像を得ることができ、しかも撮影時に録音された音声を再生することにより、癒し効果や思い出に浸ることが可能となる。しかし、画像合成される個々の画像はそれぞれ指向性で録音していることから、そのまま合成すると、音声の再生時に音源の位置が移動してしまい、画像の鑑賞に相応しい再生とならない。 Thus, by compositing images, it is possible to obtain an image suitable for a large screen, and by reproducing the sound recorded at the time of shooting, it is possible to immerse yourself in healing effects and memories. However, since the individual images to be synthesized are recorded with directivity, if they are synthesized as they are, the position of the sound source moves during the reproduction of the sound, and the reproduction is not suitable for viewing the image.
この点について、前述の特許文献1に開示された画像表示装置には、音声の再生については何ら触れられていない。また、特許文献2に開示の装置では、モノラル音声画像をステレオ音声画像に変換するものであって、画像知識データベースを必要とし、大型化してしまう。また、これまでのカメラは、例えば、運動会や学芸会において、わが子の声を録音できるような用途を想定しており、視野内の音声に合わせるものであって、パノラマ撮影のように、複数の画像を合成する場合を考慮したものではなかった。 In this regard, the image display device disclosed in the above-mentioned Patent Document 1 is silent about the reproduction of sound. The device disclosed in Patent Document 2 converts a monaural sound image into a stereo sound image, requires an image knowledge database, and increases the size. In addition, the conventional cameras are supposed to be used to record the voice of my child at, for example, athletic meet and academy, and match the sound within the field of view. It did not consider the case of compositing images.
本発明は、このような事情を鑑みてなされたものであり、複数の画像に基づいて合成静止画像や動画を再生する際に、違和感のない音響効果となる音声収録を可能としたカメラ、また複数の画像に基づいて合成静止画像や動画を再生する際に、違和感のない音響効果で音声再生する再生装置、および再生方法を提供することを目的とする。 The present invention has been made in view of such circumstances, and a camera that enables audio recording with an acoustic effect without a sense of incongruity when a synthesized still image or video is reproduced based on a plurality of images. It is an object of the present invention to provide a playback apparatus and a playback method for playing back sound with a sound effect that does not cause a sense of incongruity when playing back a composite still image or moving image based on a plurality of images.
上記目的を達成するため第1の発明に係わるカメラは、被写体を連続撮影する撮像部と、被写体方向からの音声の収音範囲を変更可能な収音変更部と、上記撮像部で連続して得られた複数の画像を合成し、合成画像を生成する画像合成部と、上記複数の画像を撮影する際に、上記収音変更部の収音範囲を変更する制御部と、を有し、上記制御部は、上記合成画像を生成する各画像を、右から左に向けて得る場合と、左から右に向けて得る場合に応じて、それぞれ収音範囲を、左から右に、または右から左に変更する。 In order to achieve the above object, a camera according to a first aspect of the invention includes an imaging unit that continuously shoots a subject, a sound collection change unit that can change a sound collection range of sound from the subject direction, and the imaging unit. the resulting combining a plurality of images, an image combining unit for generating a composite image, when taking a plurality of images, have a, and a control unit for changing the sound collection range of the sound collection changing unit, The control unit sets the sound collection range from left to right or right according to the case where each image for generating the composite image is obtained from right to left and from left to right, respectively. Change from to left .
第2の発明に係わるカメラは、カメラ視野を左右に移動させながら連続画像を撮影する撮像部と、上記撮影時に複数の方向の音声を収録する音声取得部と、上記撮像部で連続して得られた複数の画像を合成し、合成画像を生成する画像合成部と、上記複数の画像を合成する際に、上記音声取得部で得られた複数の方向の音声の合成を変更する制御部と、を有し、上記制御部は、上記合成画像を生成する際に、上記合成画像の特定位置の方向に音源位置があるように、各画像における所定の被写体の位置変化に従って音声合成を変更する。 The camera according to the second invention is obtained continuously by an imaging unit that captures continuous images while moving the camera field of view to the left and right, an audio acquisition unit that records audio in a plurality of directions at the time of shooting, and the imaging unit. An image synthesizing unit that synthesizes the plurality of images and generates a synthesized image; and a control unit that changes the synthesis of audio in a plurality of directions obtained by the audio acquisition unit when synthesizing the plurality of images. , have a, the control unit, when generating the composite image, so that there is a direction to the sound source position of the specific position of the combined image, to change the voice synthesized according to the positional change of the predetermined subject in the image .
第3の発明に係わるカメラは、被写体を連続撮影する撮像部と、上記被写体の方向からの音声の収音範囲を変更可能な収音変更部と、カメラの動きを判定する動き判定部と、上記連続撮影する際に、上記動き判定部による判定結果に基づいて、上記収音変更部の収音範囲を変更する制御部と、を有し、上記制御部は、上記連続撮影する際に、上記動き判定部による判定結果が、右から左に向けて動く場合と、左から右に向けて動く場合に応じて、それぞれ収音範囲を、左から右に、または右から左に変更する。 A camera according to a third aspect of the invention includes an imaging unit that continuously shoots a subject, a sound collection changing unit that can change a sound collection range of the sound from the direction of the subject, a motion determination unit that determines the movement of the camera, when the continuous shooting, when based on a determination result of the motion determination unit, have a, and a control unit for changing the sound collection range of the sound collection changing unit, the control unit, for the continuous shooting, The sound collection range is changed from left to right or from right to left, depending on whether the determination result by the motion determination unit moves from right to left or from left to right .
第4の発明に係わるカメラは、上記第3の発明において、上記動き判定部は、上記撮像部から出力される画像データに基づいて判定する。
第5の発明に係わるカメラは、上記第3の発明において、さらに、上記撮像部から出力される画像データに基づいて、上記被写体の顔が存在するか否かを判定する顔検出部を有し、上記制御部は、上記顔検出部によって顔が検出された場合には上記顔に基づいて上記収音変更部の収音範囲を制御する。
In the camera according to a fourth aspect of the present invention, in the third aspect , the motion determination unit makes a determination based on image data output from the imaging unit.
According to a fifth aspect of the present invention, the camera according to the third aspect further includes a face detection unit for determining whether or not the face of the subject exists based on the image data output from the imaging unit. The control unit controls the sound collection range of the sound collection changing unit based on the face when a face is detected by the face detection unit.
第6の発明に係わる再生装置は、連続撮影された画像データと、この連続撮影時にステレオ録音されたステレオ音声データを記憶する記憶部と、上記画像データに基づいて、画像を再生表示する表示部と、上記ステレオ音声データに基づき、左右のバランスを変更して再生可能な音声再生部と、カメラの動きを判定する動き判定部と、上記画像データおよび上記ステレオ音声データの再生時に、上記カメラの動きに基づいて、特定位置に音源位置があるように、上記ステレオ音声データの左右のバランスを制御する制御部と、を有する。 According to a sixth aspect of the present invention, there is provided a playback device that stores continuously captured image data, stereo sound data recorded in stereo during the continuous shooting, and a display unit that reproduces and displays images based on the image data. And an audio playback unit that can be played back by changing the left / right balance based on the stereo audio data, a motion determination unit that determines the movement of the camera, and at the time of playback of the image data and the stereo audio data, And a control unit that controls the left and right balance of the stereo audio data so that the sound source position is at a specific position based on the movement.
第7の発明に係わる再生装置は、上記第6の発明において、上記制御部は、上記カメラの角速度と、上記連続撮影の各コマのタイミングとから補正角を求め、この補正角に応じて上記ステレオ音声データの左右のバランスを制御する。 In the playback apparatus according to a seventh aspect based on the sixth aspect , the control unit obtains a correction angle from the angular velocity of the camera and the timing of each frame of the continuous shooting, and the control unit determines the correction angle according to the correction angle. Controls the left / right balance of stereo audio data.
第8の発明に係わる再生方法は、連続撮影された画像データと、この連続撮影時にステレオ録音されたステレオ音声データを記憶し、カメラの動きを判定し、上記画像データおよび上記ステレオ音声データの再生時に、上記カメラの動きに基づいて、特定位置に音源位置があるように、上記ステレオ音声データの左右のバランスを制御する。 According to an eighth aspect of the present invention, there is provided a reproducing method for storing continuously captured image data and stereo sound data recorded in stereo during the continuous shooting, determining the movement of the camera, and reproducing the image data and the stereo sound data. Sometimes, the left and right balance of the stereo audio data is controlled so that the sound source position is at a specific position based on the movement of the camera.
第9の発明に係わるプログラムは、連続撮影された画像データと、この連続撮影時にステレオ録音されたステレオ音声データを記憶し、カメラの動きを判定し、上記画像データおよび上記ステレオ音声データの再生時に、上記カメラの動きに基づいて、特定位置に音源位置があるように、上記ステレオ音声データの左右のバランスを制御する、
ことをコンピュータに実行させる。
A program according to a ninth aspect of the present invention stores continuously captured image data and stereo sound data recorded in stereo during this continuous shooting, determines camera movement, and reproduces the image data and stereo sound data. Based on the movement of the camera, the left and right balance of the stereo audio data is controlled so that the sound source position is at a specific position .
Let the computer do that.
本発明によれば、複数の画像に基づいて合成静止画像や動画を再生する際に、違和感のない音響効果となる音声収録を可能としたカメラを提供することができる。また複数の画像に基づいて合成静止画像や動画を再生する際に、違和感のない音響効果で音声再生する再生装置、および再生方法を提供することができる。 ADVANTAGE OF THE INVENTION According to this invention, when reproducing | regenerating a synthetic | combination still image and a moving image based on a some image, the camera which enabled the audio | voice recording which becomes an acoustic effect without a sense of incongruity can be provided. In addition, it is possible to provide a playback apparatus and a playback method for playing back sound with a sound effect that does not cause a sense of incongruity when a composite still image or moving image is played back based on a plurality of images.
以下、図面に従って本発明を適用したデジタルカメラを用いて好ましい実施形態について説明する。本実施形態に係わるデジタルカメラは、連続的に撮影しながら、状況に応じた指向性で音声を録音し、再生時に違和感のない音響効果となるようにしている。 Hereinafter, preferred embodiments using a digital camera to which the present invention is applied will be described with reference to the drawings. The digital camera according to the present embodiment records sound with directivity according to the situation while continuously shooting, so that an acoustic effect without a sense of incongruity during reproduction is obtained.
図1は、本発明の第1実施形態に係わるカメラ10と外部機器20の構成を示すブロック図である。カメラ10は、デジタルカメラであり、信号処理及び制御部1、撮像部2、変化判定部3、記録部4、操作判定部6、左右音声収録部7、表示部8、時計部9、および通信部12を有する。 FIG. 1 is a block diagram showing the configuration of a camera 10 and an external device 20 according to the first embodiment of the present invention. The camera 10 is a digital camera, and includes a signal processing and control unit 1, an imaging unit 2, a change determination unit 3, a recording unit 4, an operation determination unit 6, a left / right audio recording unit 7, a display unit 8, a clock unit 9, and a communication. Part 12.
カメラ10内の信号処理及び制御部1は、カメラ10専用の信号処理LSI等から構成され、カメラ10全体を制御するとともに撮像部2から出力される画像データの画像処理を行う。撮像部2は、撮影レンズやこの撮影レンズによって形成された被写体像を画像データに変換する撮像素子等から構成される。 The signal processing and control unit 1 in the camera 10 includes a signal processing LSI dedicated to the camera 10 and controls the entire camera 10 and performs image processing of image data output from the imaging unit 2. The imaging unit 2 includes a photographic lens and an imaging element that converts a subject image formed by the photographic lens into image data.
記録部4は、撮像部2から出力される画像データを、信号処理及び制御部1によって画像処理や圧縮処理された後に記録する。変化判定部3は、撮像部2から出力される画像データを用いて、カメラの視野の変化を判定する。すなわち、カメラ10が右から左に動くと画像が左から右に動き、カメラ10が左から右に動くと画像が右から左に動き、この動きを検出する。変化判定部3による判定結果に基づいて、カメラ10の動きを考慮した音声収録を行う。また、変化判定部3は、画像データを用いて、人物の顔の存在を検出し、顔の部分が存在した場合にはその位置や、また口等の顔パーツ位置の判定をも行う。 The recording unit 4 records the image data output from the imaging unit 2 after being subjected to image processing and compression processing by the signal processing and control unit 1. The change determination unit 3 determines a change in the field of view of the camera using the image data output from the imaging unit 2. That is, when the camera 10 moves from right to left, the image moves from left to right. When the camera 10 moves from left to right, the image moves from right to left, and this movement is detected. Based on the determination result by the change determination unit 3, audio recording is performed in consideration of the movement of the camera 10. Further, the change determination unit 3 detects the presence of a human face using image data, and also determines the position of a face part and the position of a face part such as a mouth when a face part is present.
左右音声収録部7は、ステレオマイク7aを有しており、左右の音声をそれぞれ記録する。また、この左右音声収録部7は、ステレオマイクからの音声信号を信号処理し、音声の収録範囲を変更することができる(すなわち、収音にあたっての指向性を変更できる)。左右音声収録部7から出力される音声データは、信号処理及び制御部1で信号処理を行った後、画像データと共に記録部4に記録される。 The left and right audio recording unit 7 has a stereo microphone 7a, and records left and right audio, respectively. The left and right audio recording unit 7 can process an audio signal from the stereo microphone and change the audio recording range (that is, change directivity in collecting sound). The audio data output from the left and right audio recording unit 7 is signal-processed by the signal processing and control unit 1 and then recorded in the recording unit 4 together with the image data.
操作判定部6は、レリーズ釦等の操作部材とこれに連動するスイッチ等を有する。操作判定部6によって判定された操作状態は、信号処理及び制御部1に送られ、信号処理及び制御部1は、操作状態に応じた処理を実行する。時計部9は、日時等のカレンダー・計時機能を有し、撮影時の撮影日時情報等を出力する。撮影日時情報は、画像データと共に記録部4に記録される。 The operation determination unit 6 includes an operation member such as a release button and a switch linked to the operation member. The operation state determined by the operation determination unit 6 is sent to the signal processing and control unit 1, and the signal processing and control unit 1 executes a process according to the operation state. The clock unit 9 has a calendar / time keeping function such as date and time, and outputs shooting date and time information at the time of shooting. The shooting date / time information is recorded in the recording unit 4 together with the image data.
表示部8は、撮像部2から出力される画像データに基づいて、被写体像をフレーミング用にライブビュー表示し、また、記録部4に記録されている画像データを再生表示する。通信部12は、テレビ等の外部機器20との送信や受信を行う。通信手段としては、無線LAN、近接無線通信、赤外線通信、USBケーブル等による有線通信等によって行い、カメラ10で撮影した画像データや音声データを送信可能である。また、近年は、ハイビジョンのディプレイに画像・音声を送信するためにHDMI等も利用される傾向にあり、通信部12は、HDMI端子を備え、これによる有線通信でも良い。 The display unit 8 performs live view display of the subject image for framing based on the image data output from the imaging unit 2, and reproduces and displays the image data recorded in the recording unit 4. The communication unit 12 performs transmission and reception with an external device 20 such as a television. As communication means, wireless LAN, proximity wireless communication, infrared communication, wired communication using a USB cable or the like can be used, and image data and audio data captured by the camera 10 can be transmitted. In recent years, HDMI and the like tend to be used for transmitting images and sounds to a high-definition display, and the communication unit 12 may include an HDMI terminal and may perform wired communication.
テレビやフォトスタンド等の外部機器20は、信号処理及び制御部21、通信部22、表示・再生部23、表示優先部24、およびリモコン受信部25を有する。信号処理及び制御部21は、カメラ10の信号処理及び制御部1と同様、外部機器20専用の信号処理LSI等から構成され、外部機器20全体を制御するとともに、通信部22を介して受信した画像データや音声データの再生表示の制御を行う。 The external device 20 such as a television or a photo stand includes a signal processing and control unit 21, a communication unit 22, a display / playback unit 23, a display priority unit 24, and a remote control reception unit 25. Similar to the signal processing and control unit 1 of the camera 10, the signal processing and control unit 21 is configured by a signal processing LSI dedicated to the external device 20, etc., and controls the entire external device 20 and received via the communication unit 22. Controls playback and display of image data and audio data.
通信部22は、カメラ10との通信を行い、カメラ10から画像データや音声データを受信する。カメラ10の通信部12と同様、無線LAN、近接無線通信、赤外線通信、USBケーブル、HDMIケーブル等による有線通信等による通信が可能である。表示優先部24は、画像の優先度を判定する。すなわち、カメラ10に内蔵する表示部8に最初に表示する優先画像か否かの判定を行う。 The communication unit 22 communicates with the camera 10 and receives image data and audio data from the camera 10. Similar to the communication unit 12 of the camera 10, communication by wireless LAN, proximity wireless communication, infrared communication, USB cable, HDMI cable, or the like is possible. The display priority unit 24 determines the priority of the image. That is, it is determined whether or not the image is a priority image to be displayed first on the display unit 8 built in the camera 10.
表示・再生部23は、薄型の大画面モニタとスピーカを有し、カメラ10から受信した画像データや音声データの再生表示を行う。再生にあたっては、信号処理及び制御部21は、表示優先部24における優先画像か否かの判定結果に応じて、再生制御を行う。なお、外部機器20がテレビである場合には、通常のテレビ放送等の表示も行う。 The display / playback unit 23 includes a thin large screen monitor and a speaker, and plays back and displays image data and audio data received from the camera 10. In reproduction, the signal processing and control unit 21 performs reproduction control according to the determination result of whether or not the image is the priority image in the display priority unit 24. In addition, when the external device 20 is a television, a normal television broadcast or the like is also displayed.
リモコン受信部25は、赤外線通信により、リモコン装置より指示信号を受信する。リモコン装置によって、例えば、指定された画像や音声をカメラ10から受け取ったり、再生したり、中断することが可能となっている。 The remote control receiving unit 25 receives an instruction signal from the remote control device by infrared communication. For example, the remote controller can receive, reproduce, or interrupt a designated image or sound from the camera 10.
次に、図2を用いて、このカメラ10の使用方法について説明する。ユーザ15は、図2(a)に示すように、カメラ10を構え、撮像部2の撮影レンズを通して被写体像を撮影すると共に、ステレオマイク7aによって、前方からの音声も記録可能となっている。このようにして撮影された画像や音声は、図2(b)に示すように、カメラ10の通信部12、および外部機器20の通信部22を介して、外部機器20に送信される。外部機器20は、受信した画像や音声を、表示・再生部23で再生表示する。 Next, a method of using the camera 10 will be described with reference to FIG. As shown in FIG. 2A, the user 15 holds the camera 10 and shoots a subject image through the photographic lens of the imaging unit 2, and can also record audio from the front by the stereo microphone 7a. As shown in FIG. 2B, the image and the sound thus captured are transmitted to the external device 20 via the communication unit 12 of the camera 10 and the communication unit 22 of the external device 20. The external device 20 reproduces and displays the received image and sound on the display / reproduction unit 23.
次に、図3および図4を用いて、本実施形態におけるカメラ10による撮影と音声記録について説明する。図3は、カメラ10によって撮影および音声収録を行っている様子を示している。ユーザは、最初、カメラ10aの位置で撮影を開始し、カメラ10bの位置に向けてカメラ10を動かし、この間、連続的に撮影を行っている。このとき、得られた複数の画像の類似部を重ね合わせ合成することにより、図4(a)に示すように、静止パノラマ画像を得ることができる。この例では、3枚の画像51a、51b、51cを合成し、静止パノラマ画像を生成している。 Next, shooting and sound recording by the camera 10 in this embodiment will be described with reference to FIGS. 3 and 4. FIG. 3 shows a state where the camera 10 performs shooting and audio recording. The user first starts shooting at the position of the camera 10a, moves the camera 10 toward the position of the camera 10b, and continuously performs shooting during this time. At this time, a still panoramic image can be obtained as shown in FIG. 4A by superimposing and synthesizing similar portions of the obtained images. In this example, three images 51a, 51b, and 51c are combined to generate a still panoramic image.
図4(b)は、図4(a)と同じく3枚の画像51a、51b、51cを合成した静止パノラマ画像である。撮影時に、それぞれの画像51a、51b、51cの画面中央部方向の音声を記録すると、再生時に、音源53a、53b、53cの位置が、左から右へと移動し、不自然な音声再生となる。 FIG. 4B is a still panoramic image obtained by synthesizing three images 51a, 51b, and 51c as in FIG. 4A. When sound in the center of the screen of each image 51a, 51b, 51c is recorded at the time of shooting, the positions of the sound sources 53a, 53b, 53c are moved from left to right during reproduction, resulting in unnatural sound reproduction. .
そこで、本実施形態においては、カメラ10aの位置において撮影する場合には、図3に示すように、画角31aの中では右よりの収音範囲33aで収音し、カメラ10bの位置において撮影する場合には、画角31bの中では左よりの収音範囲33bで収音する。このようにして撮影した画像をパノラマ画像に合成し、音声を再生すると、画像51aの撮影時における音声の音源位置52aと、画像51cの撮影時における音声の音源位置52bは、ほぼパノラマ画像の中央となる。すなわち、図4(c)に示すように、パノラマ画像のほぼ中央の音源位置52cから収音された音声が聞こえてくる。図4(b)で説明したような、音源位置の移動が殆どなく、自然な感じで音声再生を行うことができる。 Therefore, in the present embodiment, when shooting at the position of the camera 10a, as shown in FIG. 3, within the angle of view 31a, sound is picked up in the sound collection range 33a from the right, and shooting is performed at the position of the camera 10b. In this case, sound is collected in the sound collection range 33b from the left in the angle of view 31b. When the images thus captured are combined with the panorama image and the sound is reproduced, the sound source position 52a when the image 51a is captured and the sound source position 52b when the image 51c is captured are substantially at the center of the panorama image. It becomes. That is, as shown in FIG. 4C, the sound collected from the sound source position 52c at the substantially center of the panoramic image is heard. As described with reference to FIG. 4B, there is almost no movement of the sound source position, and sound reproduction can be performed with a natural feeling.
このように本実施形態においては、音声の変化を補正によって抑え、時系列的に撮影した画像を貼り合わせて作成した画像であることを感じさせないようにしている。なお、本実施形態においては、3枚の画像を貼り合わせているが、時間をかけて多数の画像を記録し、この中から複数枚の画像を選んで画像を合成し、音声を再生するようにしても勿論かまわない。 As described above, in the present embodiment, a change in sound is suppressed by correction so that an image created by pasting together images taken in time series is not felt. In this embodiment, three images are pasted together. However, it takes time to record a large number of images, select a plurality of images from these images, synthesize the images, and reproduce the sound. But of course it does n’t matter.
次に、本実施形態における動作を、図5に示すフローチャートを用いて説明する。このフローチャートは、カメラ10の信号処理及び制御部1が司る。 Next, the operation in this embodiment will be described with reference to the flowchart shown in FIG. This flowchart is controlled by the signal processing and control unit 1 of the camera 10.
図5に示すカメラ制御のフローに入ると、まず、撮影モードか否かの判定を行う(S101)。このカメラ10は、撮影モードと再生モードを有している。ステップS101における判定の結果、撮影モードであった場合には、画像の取り込みを行い、顔検出を行う(S102)。このステップでは、ライブビュー表示用に撮像部2から出力されている画像データを取得し、この取得した画像データを用いて、変化判定部3は顔検出を行う。続いて、画像表示を行う(S103)。ここでは、ステップS102で取得した画像データに基づいて、表示部8に被写体像を表示する。撮影者はこの被写体像を見ながらフレーミングを行うことができる。 If the camera control flow shown in FIG. 5 is entered, it is first determined whether or not the camera is in shooting mode (S101). The camera 10 has a shooting mode and a playback mode. If the result of determination in step S101 is shooting mode, image capture is performed and face detection is performed (S102). In this step, the image data output from the imaging unit 2 for live view display is acquired, and the change determination unit 3 performs face detection using the acquired image data. Subsequently, image display is performed (S103). Here, the subject image is displayed on the display unit 8 based on the image data acquired in step S102. The photographer can perform framing while viewing the subject image.
画像表示を行うと、次に、顔を検出したか否かの判定を行う(S104)。ステップS102において顔検出を行っているが、このとき画像の中から顔の部分を検出できたか否かをこのステップで判定する。この判定の結果、顔を検出したと判定した場合には、顔の位置と口等の顔パーツの位置を検出する(S105)。ここで、検出した顔位置は、ピント合わせや露出制御の際に利用する。 Once image display has been performed, it is next determined whether or not a face has been detected (S104). In step S102, face detection is performed. At this time, it is determined in this step whether or not a face portion has been detected from the image. If it is determined that a face has been detected as a result of this determination, the position of the face and the position of a facial part such as a mouth are detected (S105). Here, the detected face position is used for focusing and exposure control.
顔位置や口位置判定を行うと、またはステップS104における判定の結果において、顔が存在しなかったと判定した場合には、次に、記録を開始するか否かの判定を行う(S106)。ここでは、レリーズ釦の操作状態を検出し、動画撮影やパノラマ撮影等を開始するか否かを判定する。この判定の結果、記録開始でなかった場合には、ステップS101に戻り、前述の動作を実行する。 If the face position or mouth position is determined, or if it is determined in step S104 that there is no face, it is next determined whether or not to start recording (S106). Here, the operation state of the release button is detected, and it is determined whether to start moving image shooting, panoramic shooting, or the like. If the result of this determination is that recording has not started, processing returns to step S101 and the aforementioned operation is executed.
ステップS106における判定の結果、記録開始であった場合には、撮影・収音記録を行う(S107)。このサブルーチン内では、画像と音声の記録を連続的に行うと共に、併せて画面の動き検知等を随時行い、この動き検知結果に応じて収音範囲を変更する。撮影・収音動作は、このサブルーチン内において終了判定がなされるまで続行する。この撮影・収音記録のサブルーチンについては、図6に示すフローを用いて後述する。 If the result of determination in step S106 is that recording has started, shooting and sound recording are performed (S107). In this subroutine, image and sound are continuously recorded and screen motion is detected as needed, and the sound collection range is changed according to the motion detection result. The photographing / sound collecting operation continues until an end determination is made in this subroutine. This shooting / sound recording subroutine will be described later with reference to the flowchart shown in FIG.
ステップS101における判定の結果、撮影モードが設定されていなかった場合には、再生モードが設定されているか否かの判定を行う(S112)。この判定の結果、再生モードが設定されていなかった場合には、ステップS101に戻る。一方、ステップS111における判定の結果、再生モードが設定されていた場合には、再生を行う(S112)。 If the result of determination in step S101 is that shooting mode has not been set, it is determined whether or not playback mode has been set (S112). If the result of this determination is that playback mode has not been set, processing returns to step S101. On the other hand, if the result of determination in step S111 is that the playback mode has been set, playback is performed (S112).
このステップS112では、記録部4から記録されている撮影画像を読み出し、表示部8にサムネイル形式で画像を表示し、操作部によって画像が選択されると、その画像を拡大表示する。また、画像の表示と共に、音声データが一緒に記録されていた場合には、これを再生する。なお、カメラ10内にスピーカが設けられていない場合には、画像再生のみとし音声再生は行わない。 In step S112, the photographed image recorded from the recording unit 4 is read out, and the image is displayed on the display unit 8 in a thumbnail format. When an image is selected by the operation unit, the image is enlarged and displayed. Further, when the audio data is recorded together with the display of the image, it is reproduced. If no speaker is provided in the camera 10, only image playback is performed and audio playback is not performed.
再生を行うと、次に、送信を行うか否かの判定を行う(S113)。ここでは、テレビ等の外部機器20に画像送信するために、送信指示用の操作部材が操作されたか否かの判定を行う。この判定の結果、送信であった場合には、表示画像の送信を行う(S114)。このステップでは、ステップS112において表示中の画像を、外部機器20に送信する。なお、複数の画像を選択した場合には、これらの画像をまとめて送信しても良い。表示画像を送信すると、ステップS113における判定の結果、送信でなかった場合、またはステップS107において撮影・収音記録が終わると、カメラ制御のフローを終了し、パワーオンのままであれば、ステップS101に戻り、前述の動作を実行する。 Once reproduction has been performed, it is next determined whether or not transmission is to be performed (S113). Here, it is determined whether or not an operation member for transmission instruction has been operated in order to transmit an image to the external device 20 such as a television. If the result of this determination is transmission, a display image is transmitted (S114). In this step, the image being displayed in step S112 is transmitted to the external device 20. When a plurality of images are selected, these images may be transmitted together. When the display image is transmitted, if the result of determination in step S113 is not transmission, or when shooting / sound recording is completed in step S107, the camera control flow is terminated. Returning to, the above-described operation is executed.
次に、ステップS107における撮影・収音記録のサブルーチンについて、図6に示すフローチャートを用いて説明する。 Next, the photographing / sound recording subroutine in step S107 will be described with reference to the flowchart shown in FIG.
このフローに入ると、まず、パノラマ撮影か否かの判定を行う(S1)。ここでは、ユーザが操作部材によってパノラマ撮影モードを設定したか否かの判定を行う。撮影後にパノラマに相応しい撮影であったかどうかを判定し、パノラマを作成するようにしても良いが、本実施形態においては、フローを単純化するためにパノラマ撮影モードはユーザ設定で行うことで説明する。 If this flow is entered, it is first determined whether or not panoramic shooting is performed (S1). Here, it is determined whether or not the user has set the panoramic shooting mode with the operation member. It may be determined whether or not the shooting is suitable for the panorama after shooting, and the panorama may be created. However, in this embodiment, in order to simplify the flow, the panorama shooting mode is performed by user setting.
ステップS1における判定の結果、パノラマ撮影モードが設定されていなかった場合には、通常の動画等の連続撮影を行う(S11)。続いて、望遠撮影か否かを判定する(S12)。ここでは、ズーミング操作によって望遠側に操作されたかを判定する。この判定の結果、望遠であった場合には、中央集中収音を行い(S13)、一方、判定の結果、望遠でなかった場合には、左右のステレオ感を強調する収音を行う(S14)。すなわち、カメラ10の撮影レンズ2aの画角に応じて、中央を重点的に録音するか、収音範囲を広くとりステレオ感を強調した録音をするか切り換える。なお、この収音範囲の変更は、左右音声収録部7によって行う。 If the result of determination in step S <b> 1 is that panoramic shooting mode has not been set, normal shooting of normal moving images or the like is performed (S <b> 11). Subsequently, it is determined whether or not telephoto shooting is performed (S12). Here, it is determined whether or not the zooming operation is performed on the telephoto side. If the result of this determination is telephoto, centralized sound collection is performed (S13). On the other hand, if the result of determination is not telephoto, sound collection that emphasizes the left and right stereo feeling is performed (S14). ). That is, depending on the angle of view of the photographing lens 2a of the camera 10, the recording is switched between focusing on the center or recording with a wide sound collection range and emphasizing stereo. Note that the change of the sound collection range is performed by the left and right audio recording unit 7.
中央集中録音またはステレオ強調録音を行うと次に、通常撮影を終了するか否かの判定を行う(S15)。ここでは、レリーズ釦によって終了操作がなされたか否かの判定を行う。この判定の結果、終了でなかった場合には、ステップS11に戻り、撮影を続行する。一方、終了であった場合には、撮影・収音記録のサブルーチンを終了し、元のフローに戻る。 If the centralized recording or the stereo emphasized recording is performed, it is next determined whether or not the normal photographing is finished (S15). Here, it is determined whether or not an end operation has been performed with the release button. If the result of this determination is not end, processing returns to step S11 and shooting is continued. On the other hand, if it is finished, the shooting / sound recording subroutine is finished and the flow returns to the original flow.
ステップS1における判定の結果、パノラマ撮影モードであった場合には、最初に撮像を行い、画像端部の像を記録する(S2)。端部画像の記録は、例えば、別のメモリ領域に記録したり、端部の画像の特徴をタグに残す等、後で利用できるように行う。この端部像記録を行うことによって、カメラ10を矢印の方向に動かす場合、画面内の端部の像(図9(b)の例では、木55)が、図9(a)に示すように、画像56a→画像56b→画像56c内を順次移動していき、端部の像(木55)が中心となるようにパノラマ画像を生成することができる。そして、カメラ10を動かしても、常に端部の像(木55)の方向に音声収録の指向性を持たせていく録音(記録像方向録音)を行い、音声再生時の不自然さを軽減している。 If the result of determination in step S1 is panoramic shooting mode, imaging is first performed and an image at the edge of the image is recorded (S2). The edge image is recorded so that it can be used later, for example, in a different memory area or by leaving the feature of the edge image on the tag. When the camera 10 is moved in the direction of the arrow by performing this edge image recording, an image of the edge in the screen (the tree 55 in the example of FIG. 9B) is as shown in FIG. 9A. Then, the panoramic image can be generated so that the end image (tree 55) is centered by sequentially moving through the image 56a → the image 56b → the image 56c. Even when the camera 10 is moved, the recording (recording image direction recording) is performed so that the sound recording directivity is always given in the direction of the image (tree 55) at the end portion, and the unnaturalness at the time of sound reproduction is reduced. doing.
端部像記録を開始し、連続撮影を行う(S3)。続いて、最初に中央に所定の大きさの顔があるか否かを判定する(S4)。ここでは、変化判定部3によって、画面のほぼ中央に所定の大きさの顔、例えば、画面幅の1/5の顔が存在するかを判定する。これは、図7に示すようなシーンの場合、左側から撮影を開始すると、人物57が所定以上の大きさを占める場合には、この人物57が主被写体である可能性が高いからである。 Edge image recording is started, and continuous shooting is performed (S3). Subsequently, it is first determined whether or not there is a face of a predetermined size in the center (S4). Here, the change determination unit 3 determines whether or not a face having a predetermined size, for example, a face having a width of 1/5 of the screen width, exists in the approximate center of the screen. This is because, in the case of the scene shown in FIG. 7, when shooting is started from the left side, if the person 57 occupies a size larger than a predetermined size, the person 57 is likely to be the main subject.
この場合、人物57が風景を見ながら、話す可能性があることから、撮影の最初(ステップS105のタイミング)、顔があることを判定した場合には、ステップS4からステップS21に分岐し、顔方向追尾強調録音を行う(S21)。顔方向追尾強調録音では、カメラ10の動きに合わせて収音範囲58a〜58cを順次変更し、人物57の方向で収音する。人物57を主体にした撮影に相応しい収音を行うことができる。 In this case, since the person 57 may speak while looking at the landscape, when it is determined that there is a face at the beginning of the shooting (timing in step S105), the process branches from step S4 to step S21. Direction tracking emphasis recording is performed (S21). In face direction tracking emphasis recording, the sound collection ranges 58 a to 58 c are sequentially changed in accordance with the movement of the camera 10, and sound is collected in the direction of the person 57. It is possible to collect sound suitable for photographing mainly of the person 57.
ステップS4における判定の結果、最初に中央に所定の大きさの顔がなかった場合には、次に、画面の動き判定を行う(S5)。図9に示すように、カメラ10の狙う方向の変化によって、撮影画像が左から右に動いているのか、右から左に動いているのかを判定する。続いて、画面の動きが左から右であったか否かの判定を行う(S6)。この判定の結果、画面の動きが左から右であった場合には、音声収録の強調方向を右強調から左強調とする(S8)。一方、画面の動きが右から左であった場合には、左強調から右強調録音とする(S7)。 If the result of determination in step S4 is that there is no face of a predetermined size at the center, next, screen motion determination is performed (S5). As shown in FIG. 9, it is determined whether the captured image is moving from left to right or from right to left according to a change in the target direction of the camera 10. Subsequently, it is determined whether or not the screen movement is from left to right (S6). If the result of this determination is that the screen motion is from left to right, the audio recording enhancement direction is changed from right enhancement to left enhancement (S8). On the other hand, when the movement of the screen is from right to left, the recording is made from left enhancement to right enhancement (S7).
ステップS8における右強調から左強調録音の動作について、図10に示すフローチャートを用いて説明する。このフローに入ると、まず、画面右端の像を読み出す(S31)。続いて、記録像方向の録音を行う(S32)。ここでは、図4や図9において説明したように、最初は、画面右側の方向に向けて収音するが、画面の移動に応じて次第に画面の左側に向けた収音を行う。この収音動作は、左右音声収録部7によって行われる。 The operation from right enhancement to left enhancement recording in step S8 will be described with reference to the flowchart shown in FIG. In this flow, first, the image at the right end of the screen is read (S31). Subsequently, recording in the direction of the recording image is performed (S32). Here, as described in FIG. 4 and FIG. 9, sound is initially collected toward the right side of the screen, but sound is gradually collected toward the left side of the screen as the screen moves. This sound collecting operation is performed by the left and right audio recording unit 7.
なお、ステップS7における左強調から右強調録音は、右強調から左強調録音と反対の動作を行えば良い。また、図10に示したフローでは、画面内の像の移動に従って収音方向を移動したが、画面の動きの方向のみを検出し、単純に動きの方向に応じて、120°を数秒で動かす程度で収音範囲を変更するようにしても良い。すなわち、所定の速度でユーザは画角を変えていくと想定し、撮像部2からの画像を利用することなく、音声収録方向切り換えることも可能である。 Note that the left-emphasized to right-emphasized recording in step S7 may be performed in the opposite manner to the right-emphasized to left-emphasized recording. In the flow shown in FIG. 10, the sound collection direction is moved according to the movement of the image in the screen, but only the direction of the screen movement is detected, and 120 ° is simply moved in a few seconds according to the direction of movement. The sound collection range may be changed depending on the degree. That is, assuming that the user changes the angle of view at a predetermined speed, it is also possible to switch the audio recording direction without using the image from the imaging unit 2.
ステップS7、S8、またはS21における強調録音を行うと、次に、撮影の終了か否かを判定する(S10)。このステップでは、レリーズ釦の操作状態を判定する。この判定の結果、撮影終了でなかった場合には、ステップS3に戻り、撮影を続行する。一方、判定の結果、終了であった場合には、撮影・収音記録のサブルーチンを終了し、元のフローに戻る。 If the emphasized recording in step S7, S8 or S21 is performed, it is next determined whether or not the photographing is finished (S10). In this step, the operation state of the release button is determined. If the result of this determination is that photography has not ended, processing returns to step S3 and photography continues. On the other hand, if the result of the determination is that the processing has been completed, the shooting / sound recording subroutine is terminated and the flow returns to the original flow.
以上説明したように、本実施形態に係わるカメラ10は、パノラマ撮影モード等、連続的に画像を撮影する際に、カメラ10の動きに応じて収音範囲を移動させている。このため、画像を合成して再生表示する際に、音声の音源位置が不自然に移動することがなく、違和感のない音響効果で音声再生することができる。 As described above, the camera 10 according to the present embodiment moves the sound collection range according to the movement of the camera 10 when continuously capturing images such as the panoramic shooting mode. For this reason, when the images are combined and reproduced and displayed, the sound source position of the sound does not move unnaturally, and the sound can be reproduced with an acoustic effect without a sense of incongruity.
次に、収音範囲を変化させるための左右音声収録部7の構成と動作について説明する。左右音声収録部7は、図8に示すように、ステレオマイク7a、AD変換器42、加算・乗算器43から構成される。 Next, the configuration and operation of the left and right audio recording unit 7 for changing the sound collection range will be described. The left and right audio recording unit 7 includes a stereo microphone 7a, an AD converter 42, and an adder / multiplier 43, as shown in FIG.
ステレオマイク7aは、右側マイク41aと左側マイク41bとから構成され、カメラ本体10の前面側に配置される。ステレオマイク7aはADコンバータ42に接続され、音声信号がデジタル化される。すなわち、右側マイク41aはADコンバータ42aに、また左側マイク41bはADコンバータ42bに、それぞれ接続されデジタル音声データを出力する。 The stereo microphone 7a includes a right microphone 41a and a left microphone 41b, and is disposed on the front side of the camera body 10. The stereo microphone 7a is connected to the AD converter 42, and the audio signal is digitized. That is, the right microphone 41a is connected to the AD converter 42a, and the left microphone 41b is connected to the AD converter 42b to output digital audio data.
ADコンバータ42の出力端は、加算・乗算器43に接続され、左右の音声の差分が演算される。すなわち、右側マイク41aの音声データを出力するADコンバータ42aは、加算器43aのプラス側入力端と、加算器43dのマイナス側入力端に接続される。また、左側マイク41bの音声データを出力するADコンバータ42bは、加算器43aのマイナス側入力端と、加算器43dのプラス側入力端に接続される。 The output terminal of the AD converter 42 is connected to an adder / multiplier 43 to calculate the difference between the left and right sounds. That is, the AD converter 42a that outputs the audio data of the right microphone 41a is connected to the plus side input end of the adder 43a and the minus side input end of the adder 43d. Further, the AD converter 42b that outputs the audio data of the left microphone 41b is connected to the minus side input end of the adder 43a and the plus side input end of the adder 43d.
加算器43aの出力は乗算器43bの入力端に接続され、加算器43dの出力端は乗算器43eの入力端に、それぞれ接続される。乗算器43bと乗算器43eの制御端は、信号処理及び制御部1に接続され、乗算器43b、43eのゲインを入力する。加算器43cの入力端は、ADコンバータ42aの出力端と乗算器43bの出力端が接続される。加算器43fの入力端は、ADコンバータ42bの出力端と、乗算器43eの出力端が接続される。 The output of the adder 43a is connected to the input terminal of the multiplier 43b, and the output terminal of the adder 43d is connected to the input terminal of the multiplier 43e. Control ends of the multiplier 43b and the multiplier 43e are connected to the signal processing and control unit 1, and input gains of the multipliers 43b and 43e. The input terminal of the adder 43c is connected to the output terminal of the AD converter 42a and the output terminal of the multiplier 43b. The input terminal of the adder 43f is connected to the output terminal of the AD converter 42b and the output terminal of the multiplier 43e.
加算・乗算器43の出力端は、左右音声収録部7としての出力部であり、記録部4に接続される。すなわち、加算器43cの出力端と、加算器43fの出力端は、それぞれ、右側音声データ、左側音声データを出力し、これらの出力端を介して各音声データは記録部4に記録される。 The output terminal of the adder / multiplier 43 is an output unit as the left and right audio recording unit 7 and is connected to the recording unit 4. That is, the output terminal of the adder 43c and the output terminal of the adder 43f output right audio data and left audio data, respectively, and each audio data is recorded in the recording unit 4 via these output terminals.
このように左右音声収録部7は構成されており、ステレオ入力した音声データの左右のいずれかを強調することができる。左右音声収録部7の2つのマイク41a、41bによって入力した音声信号は、ADコンバータ42a、42bによってデジタル音声データに変換され、加算器43aによって、(右側の音声データ)−(左側の音声データ)が演算され、加算器43dによって、(左側の音声データ)−(右側の音声データ)が演算される。すなわち、加算器43a、43bによって、左右の音声データの差分が演算される。ここで、演算された差分は左右の音の差異であり、この差分を強調することにより、右または左側に広がりを強調した音声出力を得ることができ、この加算演算はそのための前処理である。 Thus, the left and right audio recording unit 7 is configured, and can emphasize either left or right of the audio data input in stereo. The audio signals input by the two microphones 41a and 41b of the left and right audio recording unit 7 are converted into digital audio data by the AD converters 42a and 42b, and (right audio data)-(left audio data) by the adder 43a. Is calculated, and (additional left audio data) − (right audio data) is calculated by the adder 43d. That is, the difference between the left and right audio data is calculated by the adders 43a and 43b. Here, the calculated difference is a difference between left and right sounds, and by emphasizing this difference, it is possible to obtain an audio output in which the spread is emphasized to the right or left, and this addition operation is a preprocessing for that purpose. .
加算器43a、43dで求められた差分は、それぞれ乗算器43b、43eにおいて信号処理及び制御部1からのゲインに基づいて乗算し、この乗算結果を、加算器43c、43fにおいて、右側の音声データと左側の音声データに、それぞれ加算する。なお、加算器43a、43dの出力がプラスなので、実質的に加算することになる。ここで、乗算器43b、43eにおけるいずれか一方のゲインを大きくすれば、ゲインの大きい側の音声が強調され、右側または左側に広がりを強調した音声出力を得ることができる。また、両方のゲインを大きくすることにより、中央を重視した音声出力を得ることができる。信号処理及び制御部1は、ステップS7、S8、S13、S14、S21のタイミングにおいて、乗算器43b、43eに対してゲインを制御することにより、広がり感を変えることができる。 The differences obtained by the adders 43a and 43d are multiplied by multipliers 43b and 43e based on the gain from the signal processing and control unit 1, respectively, and the multiplication results are added to the right audio data by the adders 43c and 43f. And the left audio data are added respectively. Since the outputs of the adders 43a and 43d are positive, they are substantially added. Here, if either one of the gains in the multipliers 43b and 43e is increased, the voice having the higher gain is emphasized, and the voice output having the spread enhanced on the right side or the left side can be obtained. Also, by increasing both gains, it is possible to obtain an audio output that emphasizes the center. The signal processing and control unit 1 can change the sense of spread by controlling the gain for the multipliers 43b and 43e at the timings of steps S7, S8, S13, S14, and S21.
このように、本実施形態における左右音声収録部7は、一対の同じ性能のマイクを用いて、収音の範囲の方向を右から左、左から右へと変化させることができる。また、画面の動きを判定して、左右音声収録部7における強調録音を制御するようにしているので、撮影視野が変化しても、擬似的に一定の音源位置から音声が再生されているようすることができる。 In this way, the left and right audio recording unit 7 in the present embodiment can change the direction of the sound collection range from right to left and from left to right using a pair of microphones having the same performance. Further, since the screen motion is determined and the emphasis recording in the left and right audio recording unit 7 is controlled, even if the shooting field of view changes, the sound is reproduced from a pseudo sound source position in a pseudo manner. can do.
以上説明したように、本発明の第1実施形態によれば、画面の動きに合わせて収音範囲を変化させたので、複数の画像に基づいて合成静止画像を再生する際に、違和感のない音響効果で音声再生を行うことが可能となる。 As described above, according to the first embodiment of the present invention, since the sound collection range is changed in accordance with the movement of the screen, there is no sense of incongruity when a composite still image is reproduced based on a plurality of images. It is possible to perform sound reproduction with acoustic effects.
次に、本発明の第2実施形態について、図11乃至図14を用いて説明する。本発明の第1実施形態においては、カメラ10による撮影時にカメラの動きに合わせて収音範囲を変化させていた。第2実施形態においては、撮影時には収音範囲を変化させることなく、ステレオ録音し、パノラマ画像等の合成画像の再生時に、カメラの動きに合わせて音源の位置を変化させるようにした。本実施形態における構成は、図1に示した第1実施形態の構成と同じであるので、説明を省略する。 Next, a second embodiment of the present invention will be described with reference to FIGS. In the first embodiment of the present invention, the sound collection range is changed in accordance with the movement of the camera when shooting with the camera 10. In the second embodiment, stereo recording is performed without changing the sound collection range at the time of shooting, and the position of the sound source is changed in accordance with the movement of the camera at the time of reproducing a composite image such as a panoramic image. The configuration in this embodiment is the same as that of the first embodiment shown in FIG.
本実施形態の動作について、図11に示すカメラ制御のフローチャートを用いて説明する。カメラ制御のフローに入ると、まず撮影モードに設定されているか否かの判定を行う(S201)。ステップS201〜S203は、図5に示した第1実施形態におけるカメラ制御のフローと同じであり、詳しい説明を省略する。ただし、ステップS202における画像取り込みの際に、顔検出を行っていたが、本実施形態においては省略している。もちろん、露出制御や自動焦点調節のために顔検出を行っても良い。 The operation of this embodiment will be described with reference to the flowchart of camera control shown in FIG. If the camera control flow is entered, it is first determined whether or not the shooting mode is set (S201). Steps S201 to S203 are the same as the camera control flow in the first embodiment shown in FIG. However, face detection was performed at the time of image capture in step S202, but this is omitted in this embodiment. Of course, face detection may be performed for exposure control and automatic focus adjustment.
ステップS203において画像表示(ライブビュー表示)を行うと、次に、ステップS106と同様に、記録開始か否かの判定を行う(S204)。ここでは、レリーズ釦が操作されてか否かを判定する。この判定の結果、記録開始でない場合には、ステップS201に戻り、前述の動作を実行する。 If image display (live view display) is performed in step S203, it is next determined whether or not recording is started as in step S106 (S204). Here, it is determined whether or not the release button is operated. If the result of this determination is that recording has not started, processing returns to step S201 and the above-described operation is executed.
ステップS204における判定の結果、記録開始であった場合には、連続撮影を開始し、また同時にステレオ録音を開始する(S206)。次いで、動き判定を行う(S207)。このステップでは、画像データに基づき画像の変化から、カメラ10の動きを判定する。この判定の結果、動きがあった場合には、動きの特徴を記録する(S208)。ここでは、画像データと共に、動きの特徴を記録部4に記録する。 If the result of determination in step S204 is that recording has started, continuous shooting is started, and stereo recording is started simultaneously (S206). Next, motion determination is performed (S207). In this step, the movement of the camera 10 is determined from the image change based on the image data. If there is a motion as a result of this determination, the feature of the motion is recorded (S208). Here, the feature of the motion is recorded in the recording unit 4 together with the image data.
動き特徴記録を行うと、またはステップS207における判定の結果、動きがなかった場合には、次に、記録を終了するか否かの判定を行う(S209)。このステップでは、レリーズ釦の操作状態に基づいて判定する。この判定の結果、記録終了でなければ、ステップS206に戻り、連続撮影を続行する。一方、判定の結果、記録終了であれば、このフローを終了し、再び、ステップS201に戻る。 If motion feature recording is performed or if the result of determination in step S207 is that there is no motion, it is next determined whether or not to end recording (S209). In this step, the determination is made based on the operation state of the release button. If the result of this determination is that recording has not ended, processing returns to step S206 and continuous shooting is continued. On the other hand, if the result of determination is that recording is complete, this flow is terminated, and the flow returns to step S201 again.
ステップS201における判定の結果、撮影モードでなかった場合には、次に再生モードが設定されているか否かの判定を行う(S211)。ここでは、再生釦等の操作部材が操作され、ユーザから再生開始指示がなされか否かを判定する。この判定の結果、再生モードに設定されていなかった場合には、ステップS201に戻る。一方、判定の結果、再生モードが設定されていた場合には、次に、パノラマ再生か否かの判定を行う(S212)。 If the result of determination in step S201 is not shooting mode, it is next determined whether or not playback mode is set (S211). Here, it is determined whether or not an operation member such as a playback button is operated and a playback start instruction is issued from the user. If the result of this determination is that playback mode has not been set, processing returns to step S201. On the other hand, if the result of determination is that the playback mode has been set, it is next determined whether or not panoramic playback is to be performed (S212).
このステップS212では、ステップS208において、画像データと共に動き特徴が記録されているか否かを判定する。すなわち、動き特徴が記録されている場合には、複数コマを合成することによりパノラマ画像を得ることができる。また、パノラマ再生か否かの判定にあたっては、ユーザによってパノラマ再生モードが設定されているか否かを含めて判断するようにしても良い。 In step S212, it is determined in step S208 whether or not a motion feature is recorded together with the image data. That is, when motion features are recorded, a panoramic image can be obtained by combining a plurality of frames. Further, when determining whether or not the panorama playback is performed, it may be determined including whether or not the panorama playback mode is set by the user.
ステップS212における判定の結果、パノラマ再生でなかった場合には、通常の動画再生を行い(S213)、ステレオ再生を行う(S214)。ここでは、ステップS206において録画した動画と、録音した音声を再生する。 If the result of determination in step S212 is not panorama playback, normal movie playback is performed (S213), and stereo playback is performed (S214). Here, the moving image recorded in step S206 and the recorded sound are reproduced.
ステップS212における判定の結果、パノラマ再生であった場合には、画像接続再生を行う(S221)。すなわち、このステップでは、ステップS206において撮影した連続画像の共通部分を貼り合わせて静止画でパノラマ画像を生成する。続いて、パノラマ中央部像の方向音声強調で音声を再生する(S222)。このステップでは、完成されたパノラマ画像の中央部の像を判定し、その像位置と、ステップS208に記録した動き特徴データから、各位置で得られた音声を補正し、パノラマ画像の中央部に音源位置があるように音声再生する。 If the result of determination in step S212 is panorama playback, image connection playback is performed (S221). That is, in this step, a panoramic image is generated as a still image by pasting the common parts of the continuous images taken in step S206. Subsequently, the sound is reproduced with the direction sound enhancement of the panorama central image (S222). In this step, the center image of the completed panoramic image is determined, the sound obtained at each position is corrected from the image position and the motion feature data recorded in step S208, and the panoramic image is displayed in the center of the panoramic image. Play sound as if the sound source is located.
このステップS222における音声強調での音声再生は、図12に示す左右音声収録部7において制御される。ステップS206におけるステレオ録音にあたっては、左右音声収録部7は音声強調を行わず、左右のステレオ音をそのまま記録部4に記録し、ステップS222において音声強調で再生を行う。左右音声収録部7における音声再生については、図12を用いて後述する。 The audio reproduction in the audio enhancement in step S222 is controlled by the left and right audio recording unit 7 shown in FIG. In stereo recording in step S206, the left and right audio recording unit 7 does not perform audio enhancement, records the left and right stereo sounds as they are in the recording unit 4, and performs reproduction with audio enhancement in step S222. The audio reproduction in the left and right audio recording unit 7 will be described later with reference to FIG.
また、ステップS222における音声強調再生にあたって、第1実施形態においては、図9に示したように、画面内の端部の像(図9(b)の例では、木55)を目標にして音声の方向バランスを取るようにしていた。このため、パノラマ画像の中央部に端部像が含まれている必要があった。本実施形態においては、パノラマ画像の中央部に目標となる端部像がない場合でも、カメラの取り扱い時の角速度を検出するセンサ(例えば、ジャイロ等)を利用して音声強調再生を行うようにしている。この音声強調再生については、図13および図14を用いて後述する。 Further, in the audio enhancement reproduction in step S222, in the first embodiment, as shown in FIG. 9, the audio is targeted at the image of the end in the screen (the tree 55 in the example of FIG. 9B). I was trying to balance the direction. For this reason, the end image needs to be included in the center of the panoramic image. In the present embodiment, even when there is no target end image at the center of the panoramic image, audio enhancement playback is performed using a sensor (for example, a gyroscope) that detects an angular velocity during handling of the camera. ing. This voice enhancement reproduction will be described later with reference to FIGS.
ステップS222における音声強調による再生、またはステップS214におけるステレオ再生を行うと、次に、再生終了か否かの判定を行う(S215)。ここでは、再生釦等の操作部材が再度操作される等、ユーザによる再生終了指示がなされたか等に基づいて判定する。この判定の結果、再生終了でなかった場合には、ステップS212に戻り、再生動作を続行する。 If reproduction by voice emphasis in step S222 or stereo reproduction in step S214 is performed, it is next determined whether or not reproduction has ended (S215). Here, the determination is made based on whether or not a reproduction end instruction is given by the user, such as an operation member such as a reproduction button being operated again. If the result of this determination is that playback has not ended, processing returns to step S212 and playback operation continues.
ステップS215における判定の結果、再生終了であった場合には、次に、送信するか否かの判定を行う(S226)。ここでは、送信釦等の操作部材が操作され、表示中の再生画像を外部機器20に送信するか否かを判定する。この判定の結果、送信であった場合には、表示画像を外部機器20に送信する(S277)。表示画像を送信すると、またはステップS226における判定の結果、送信でなかった場合には、カメラ制御のフローを終了し、ステップS201から再び実行する。 If the result of determination in step S215 is that reproduction has ended, it is next determined whether or not to transmit (S226). Here, it is determined whether or not an operation member such as a transmission button is operated to transmit the displayed reproduction image to the external device 20. If the result of this determination is transmission, the display image is transmitted to the external device 20 (S277). If the display image is transmitted or if the result of determination in step S226 is not transmission, the camera control flow is terminated, and the process is executed again from step S201.
次に、ステップS222においてパノラマ中央部像の方向の音声強調の処理を行う左右音声収録部7の構成について、図12を用いて説明する。 Next, the configuration of the left and right audio recording unit 7 that performs audio enhancement processing in the direction of the panoramic central image in step S222 will be described with reference to FIG.
図12は、左右音声収録部7の構成を示すブロック図である。この左右音声収録部7は再生時には、左右の音声再生のバランスを調整し、音声強調処理を行う。図8に示した第1実施形態における構成と比較し、ADコンバータ42と加算・乗算器43の間に記録部4を接続している点が相違しているが、各回路内の構成は、第1実施形態における左右音声収録部7と同じである。 FIG. 12 is a block diagram showing the configuration of the left and right audio recording unit 7. The left and right audio recording unit 7 adjusts the balance of left and right audio reproduction and performs audio enhancement processing during reproduction. Compared with the configuration in the first embodiment shown in FIG. 8, the point that the recording unit 4 is connected between the AD converter 42 and the adder / multiplier 43 is different, but the configuration in each circuit is as follows. This is the same as the left and right audio recording unit 7 in the first embodiment.
すなわち、右側マイク41aの音声信号をAD変換するADコンバータ42aの出力端は記録部4に接続され、このADコンバータ42aによってAD変換され、記録部4に記録された音声データは、加算器43a、43c、43dに出力される。また、左側マイク41bの音声信号をAD変換するADコンバータ42bの出力端は記録部4に接続され、このADコンバータ42bによってAD変換され、記録部4に記録された音声データは、加算器43a、43d、43fに出力される。 That is, the output end of the AD converter 42a for AD converting the audio signal of the right microphone 41a is connected to the recording unit 4, and the AD data is converted by the AD converter 42a, and the audio data recorded in the recording unit 4 is added to the adder 43a, 43c and 43d. Also, the output end of the AD converter 42b for AD converting the audio signal of the left microphone 41b is connected to the recording unit 4, and AD conversion is performed by the AD converter 42b, and the audio data recorded in the recording unit 4 is added to the adder 43a, 43d and 43f.
上述した第1実施形態においては、音声収録部7は撮影時に強調収音を行い、収音範囲を変更していたが、本実施形態においては、撮影時には、ステレオマイク7aからの音声信号をADコンバータによってデジタル化し、この音声データの収音範囲を変更することなく、そのまま記録部4に記録する。そして、再生時に記録部4から読み出された音声データに基づいて、加算・乗算器43によって音声再生の際の左右のバランスを制御している。すなわち、画面の移動に応じて乗算器43b、43eに印加するゲインを変化させ、パノラマ画像の中央部の像の方向に音源があるかのように、音声再生を行う。 In the first embodiment described above, the sound recording unit 7 performs emphasized sound collection at the time of shooting and changes the sound collection range. However, in this embodiment, at the time of shooting, the sound signal from the stereo microphone 7a is AD. It is digitized by a converter and recorded in the recording unit 4 as it is without changing the sound collection range of the audio data. Then, based on the audio data read from the recording unit 4 during reproduction, the adder / multiplier 43 controls the left / right balance during audio reproduction. That is, the gain applied to the multipliers 43b and 43e is changed in accordance with the movement of the screen, and sound reproduction is performed as if there is a sound source in the direction of the image at the center of the panoramic image.
次に、ステップS222におけるパノラマ中央部像の方向の音声強調のサブルーチンについて、図13および図14を用いて説明する。前述したように、第1実施形態においては、パノラマ画像の中央部の像方向を検出するにあたって、画面内の端部の像(木55)を基準にしていた。本実施形態においては、このような端部の像がない場合でも、パノラマ画像の中央部の像方向を検出することができる。 Next, the speech enhancement subroutine in the direction of the panoramic central image in step S222 will be described with reference to FIGS. As described above, in the first embodiment, when detecting the image direction of the center portion of the panoramic image, the image (tree 55) at the end in the screen is used as a reference. In the present embodiment, the image direction of the central portion of the panoramic image can be detected even when there is no such edge image.
図13(a)は、パノラマ画像を生成するために連続的に画像を撮影する様子を示す。すなわち、最初にカメラ10aの位置において(タイミングT1)で、撮影を開始する。このとき、カメラ10で撮影すると、図13(b)に示すように、画角θの画像61aを得ることができる。続いて、途中のタイミングT2において撮影すると、目標物となる木59が映しこまれ、画像61bを得ることができる。そして、終端に達し、カメラ10bの位置において(タイミングT3)、最後の画像を撮影すると、画像61cを得ることができる。なお、これらの画像61a〜61cは、ステップS206(図11参照)において取得し、記録している。 FIG. 13A shows a state in which images are continuously captured in order to generate a panoramic image. That is, first, shooting is started at the timing of the camera 10a (timing T1). At this time, when the image is taken by the camera 10, an image 61a having an angle of view θ can be obtained as shown in FIG. Subsequently, when the image is taken at the timing T2 in the middle, the target tree 59 is reflected and an image 61b can be obtained. When the end is reached and the last image is taken at the position of the camera 10b (timing T3), an image 61c can be obtained. In addition, these images 61a-61c are acquired and recorded in step S206 (refer FIG. 11).
カメラ10によって連続的に取得した画像61a〜61cを並べると、図13(b)に示すようになり、これらを合成することによりパノラマ画像62を得ることができる。このパノラマ画像の中央部には目標となる像としての木59がある。本実施形態においては、パノラマ画像の最初や最後の画像には、共通の像(木59)がなくても、合成して得られたパノラマ画像の中央部に木59があることから、この木が視野に入るまでのタイミングの差異から、音声再生時における方向補正を可能としている。 When images 61a to 61c continuously acquired by the camera 10 are arranged, the result is as shown in FIG. 13B, and a panoramic image 62 can be obtained by combining these images. In the center of this panoramic image, there is a tree 59 as a target image. In the present embodiment, even if there is no common image (tree 59) in the first and last panoramic images, there is a tree 59 in the center of the panoramic image obtained by combining. Because of the difference in timing until the image enters the field of view, it is possible to correct the direction during audio reproduction.
つまり、図13(a)に示すように、カメラ10aがタイミングT1で画角θの画像を得て撮影を開始し、カメラ10bの位置で(タイミングT3)で画角θのパノラマ用画像の最後の画像を得る。これらの間のタイミングT2において、パノラマ画像の中央の像を得る。タイミングT1とタイミングT2の間にどれだけの角度Φ動いたかは、画角θと、画角内を動く像の速さから判定することができる。 That is, as shown in FIG. 13 (a), the camera 10a starts to capture an image having an angle of view θ at timing T1, and the last of the panoramic image having the angle of view θ at the position of the camera 10b (timing T3). Get the image. At the timing T2 between these, the center image of the panoramic image is obtained. The angle Φ moved between the timing T1 and the timing T2 can be determined from the angle of view θ and the speed of the image moving within the angle of view.
画角の端から端まで、像がΔTの時間で移動すると、角速度センサによって取得された角速度vに基づいて、カメラ10をどれだけの角度θ、動かしたかが分かる。この角速度vは、撮影中にステップS208に動き特徴として判定し、画像と共に記録される。したがって、タイミングT1とタイミングT2の差異T2−T1に、角速度vを乗ずることにより、補正すべき収音角度を決定することができる。 When the image moves from the end of the angle of view to the end in the time of ΔT, it can be seen how much angle θ the camera 10 has been moved based on the angular velocity v acquired by the angular velocity sensor. This angular velocity v is determined as a motion feature in step S208 during shooting, and is recorded together with the image. Therefore, the sound collection angle to be corrected can be determined by multiplying the difference T2-T1 between the timing T1 and the timing T2 by the angular velocity v.
次に、パノラマ中央部像の方向の音声強調のサブルーチンについて、図14に示すフローチャートを用いて説明する。このフローに入ると、まず、パノラマ画像を合成する際の中央コマの判定を行う(S501)。このステップでは、図13の例では、パノラマ画像の中央部にあたる画像61bを中央コマとして判定する。続いて、中央コマ撮影タイミングをT2とする(S502)。 Next, a speech enhancement subroutine in the direction of the panorama central image will be described with reference to the flowchart shown in FIG. If this flow is entered, first, determination of the center frame when the panoramic image is synthesized is performed (S501). In this step, in the example of FIG. 13, the image 61b corresponding to the center of the panoramic image is determined as the center frame. Subsequently, the central frame shooting timing is set to T2 (S502).
次に、Tで得られた音声を読み出す(S503)。このステップでは、読み出されている画像データに対応する音声データを記録部4から読み出し、この音声のタイミングをTとする。続いて、補正角を、(T2−T)×θ/ΔT より求める(S504)。このステップでは、図13を用いて説明したように、各タイミングTにおいて中央部との差異(T2−T)に角速度(v=θ/ΔT)を乗算することにより補正角を求める。 Next, the voice obtained at T is read (S503). In this step, audio data corresponding to the read image data is read from the recording unit 4, and the timing of this audio is T. Subsequently, a correction angle is obtained from (T2−T) × θ / ΔT (S504). In this step, as described with reference to FIG. 13, the correction angle is obtained by multiplying the difference (T2−T) from the central portion at each timing T by the angular velocity (v = θ / ΔT).
補正角を演算すると、次に、この補正角を用いて補正角音声強調を行う(S505)。このステップでは、図12に示す左右音声収録部7の乗算器43b、43eに印加するゲインを、補正角に応じて変化させる。これによって、パノラマ画像のほぼ中央部の方向に音源位置があるような強調再生を行うことができる。 Once the correction angle is calculated, the correction angle speech enhancement is performed using the correction angle (S505). In this step, the gain applied to the multipliers 43b and 43e of the left and right audio recording unit 7 shown in FIG. 12 is changed according to the correction angle. As a result, it is possible to perform enhanced reproduction such that the sound source position is in the direction of the substantially central portion of the panoramic image.
補正角音声強調を行うと、次に、終了か否かの判定を行う(S506)。ここでは、再生が終了か否かを再生釦等の操作部材の操作状態に応じて判定する。この判定の結果、終了でなかった場合には、ステップS503に戻り、音声強調による音声再生を続行する。一方、ステップS506における判定の結果、終了であった場合は、元のフローに戻る。 Once the correction angle speech enhancement has been performed, it is next determined whether or not it is finished (S506). Here, whether or not the reproduction is finished is determined according to the operation state of the operation member such as the reproduction button. If the result of this determination is that it has not ended, processing returns to step S503, and audio reproduction by audio enhancement is continued. On the other hand, if the result of determination in step S506 is end, processing returns to the original flow.
以上、説明したように、本発明の第2実施形態においては、撮影時にはステレオ録音しておき、再生時に、画面の動きに応じて音声強調による再生を行い、中央部に音源の位置があるように音声再生を行っている。このため、静止画でパノラマ画像を再生表示した際に、音源の位置が移動し不自然な音声再生となることを防止することができる。 As described above, in the second embodiment of the present invention, stereo recording is performed at the time of shooting, and playback is performed by voice enhancement according to the movement of the screen during playback, so that the position of the sound source is at the center. Audio playback is in progress. For this reason, when a panoramic image is reproduced and displayed as a still image, it is possible to prevent the position of the sound source from moving and unnatural sound reproduction.
また、本実施形態においては、最初と最後の画面内に端部の像(木55)が、存在しなくても補正角を演算により求めることができる。このため、第1実施形態よりも広い範囲のパノラマ撮影時であっても、補正角を演算することができ、撮影方向が大きく変化しても音の変化が気にならない。 Further, in the present embodiment, the correction angle can be obtained by calculation even if there is no end image (tree 55) in the first and last screens. For this reason, even during panoramic shooting in a wider range than in the first embodiment, the correction angle can be calculated, and even if the shooting direction changes greatly, changes in sound are not anxious.
なお、中央部の像の方向に音源があるように音声強調を行っていたが、この方向は、中央部以外であっても、適宜、変更できるようにしても良い。この場合には、T2のタイミングを手動で設定するようにすれば良い。 Note that the speech enhancement is performed so that the sound source is in the direction of the image at the center, but this direction may be changed as appropriate even when the direction is other than the center. In this case, the timing of T2 may be set manually.
次に、本発明の第1および第2実施形態の変形例について図15および図16を用いて説明する。すなわち、第1および第2実施形態においては、連続的に撮影を行い、これによって得た複数の画像を用いてパノラマ画像を合成し、静止画で表示していた。これに対して、本変形例においては、連続撮影した画像を順次再生し、動画のように再生を行う場合を想定している。本変形例によれば、カメラの視野変更に伴う不必要な音の変化を低減することができる。 Next, modifications of the first and second embodiments of the present invention will be described with reference to FIGS. 15 and 16. That is, in the first and second embodiments, continuous shooting is performed, a panoramic image is synthesized using a plurality of images obtained thereby, and is displayed as a still image. On the other hand, in this modified example, it is assumed that the continuously shot images are sequentially reproduced and reproduced like a moving image. According to this modification, it is possible to reduce unnecessary changes in sound due to a change in the visual field of the camera.
図15を用いて、本変形例におけるカメラ10による撮影と音声記録について説明する。図15(a)は、カメラ10によって撮影および音声収録を行っている様子を示している。ユーザ15は、最初、カメラ10bの位置で撮影を開始し、カメラ10aの位置に向けてカメラ10を動かしている。このとき、カメラ10aの位置で画像を撮影すると、図15(b)に示すような画像が得られ、カメラ10bの位置で画像を撮影すると、図15(c)に示すような画像が得られる。 With reference to FIG. 15, photographing and sound recording by the camera 10 in the present modification will be described. FIG. 15A shows a state where shooting and audio recording are performed by the camera 10. The user 15 first starts photographing at the position of the camera 10b and moves the camera 10 toward the position of the camera 10a. At this time, when an image is taken at the position of the camera 10a, an image as shown in FIG. 15B is obtained, and when an image is taken at the position of the camera 10b, an image as shown in FIG. 15C is obtained. .
図15(b)(c)に示すような海辺の広々とした情景を、連写または動画で撮影する際に併せて録音すると、それぞれのカメラ10の位置の前方の画角に相当する狭い範囲の音が収録されることになる。しかし、この範囲では、顔は動かさず、人間の目15a、15bのみを動かすことが可能である。つまり、カメラ10は画面の移り変わりに応じて、前方の音声を有して収音するが、撮影者の耳15cは、可聴範囲35の音を聴いている場合がある。 When a wide seaside scene as shown in FIGS. 15B and 15C is recorded together with continuous shooting or moving image shooting, a narrow range corresponding to the angle of view ahead of the position of each camera 10 is recorded. Will be recorded. However, in this range, it is possible to move only the human eyes 15a and 15b without moving the face. In other words, the camera 10 picks up the sound with a forward sound according to the screen change, but the photographer's ear 15 c may be listening to the sound in the audible range 35.
このような状況下で録音した音声の再生の際に、カメラ10の動きに応じて落ち着きなく変化すると、画像と音声を楽しむには相応しくない。そこで、本変形例においては、画面が動いても、画面内の所定の場所に音源があり、そこから音が聞こえてくるようにしている。 When the sound recorded in such a situation is reproduced, if the sound changes in accordance with the movement of the camera 10, it is not suitable for enjoying the image and sound. Therefore, in this modification, even if the screen moves, there is a sound source at a predetermined location in the screen so that sound can be heard from there.
本変形例は、第1実施形態のように撮影時にも適用できるが、ここでは第2実施形態に応用する例で説明する。この場合、図11に示したカメラ制御のフロー中、ステップS221、S222において静止画パノラマ画像ではなく動画を再生する際に、音声強調再生を行えば良い。すなわち、動画を再生表示しながら、あたかもパノラマ時の画面中央をカメラが向いていた時の音声がずっと記録されていたような再生を行う。 Although this modification can be applied at the time of photographing as in the first embodiment, an example applied to the second embodiment will be described here. In this case, during the camera control flow shown in FIG. 11, audio playback may be performed when playing back a moving image instead of a still image panoramic image in steps S221 and S222. In other words, while reproducing and displaying a moving image, reproduction is performed as if the sound was recorded when the camera was facing the center of the screen during panorama.
例えば、図16に示すように、大木の幹に沿って、下から頂点までゆっくりと見上げながら動画を撮影した場合を考える。この場合、幹に蝉が止まって鳴いていたとすると、一番下を撮影する際には、画面、中央から蝉の声が聞こえてくるが、画面が頂上に向かうにつれ、画面の下側から蝉の声が聞こえてくるように、音声強調再生を行う。これによって、同じ音源位置から蝉の声が聞こえてくることから、不自然な感じを与えることはない。もちろん、第1、第2実施形態と同様に、左右に移動させる連続撮影であっても、同様の効果を得ることができる。
For example, as shown in FIG. 16 , consider a case where a moving image is photographed while slowly looking up from the bottom to the top along the trunk of a large tree. In this case, if the heel stopped on the trunk and it was ringing, when you shoot the bottom, you will hear a crow's voice from the center of the screen. Voice-enhanced playback is performed so that the voice can be heard. As a result, since the voice of the fox is heard from the same sound source position, it does not give an unnatural feeling. Of course, similar to the first and second embodiments, the same effect can be obtained even in continuous shooting that moves left and right.
このような構成を採用し、動作を行うことにより、安定した環境音再生を可能とし、雰囲気豊かな音響効果を持つ音声収録や再生が可能となる。カメラ10のユーザは、必ずしも見ている方向の範囲の音を聴いているわけではない。記憶の再現という観点では、厳密な音の再現より、思い出にふけることができるような音声再生が好ましい。記憶の中に残っている音声を無理なく再現できるような音声収音が望まれる。そこで、本変形例においては、最適な収音を行いながら、撮影者が撮影時に聴いていて記憶に残っているような環境音の記録や再生を重視している。これによって、慌ただしく音声が切り替わることがなく、落ち着いて記憶をひもとくことができ、癒し効果のある画像と音声再生を可能としている。 By adopting such a configuration and performing the operation, it is possible to stably reproduce the environmental sound and to record and reproduce the sound having a rich atmosphere. The user of the camera 10 does not necessarily listen to the sound in the range of the viewing direction. From the viewpoint of reproduction of memory, audio reproduction that can indulge in memories is preferable to accurate reproduction of sound. It is desired to collect sound that can easily reproduce the sound remaining in the memory. Therefore, in this modification, emphasis is placed on the recording and reproduction of environmental sound that the photographer listens at the time of shooting and remains in memory while performing optimum sound collection. As a result, the sound does not change over quickly, and it is possible to calm down and memorize the memory, and it is possible to reproduce images and sound with a healing effect.
以上、説明したように本発明の各実施形態においては、複数の画像に基づいて合成静止画像や動画を再生する際に、音源の位置が一定となるように、連続撮影の際に収音範囲を変更しており、違和感のない音響効果となる音声収録を可能としている。また複数の画像に基づいて合成静止画像や動画を再生する際に、音源の位置が一定となるように、音声の左右のバランスを変更しており、違和感のない音響効果で音声再生を可能としている。 As described above, in each embodiment of the present invention, the sound collection range is obtained during continuous shooting so that the position of the sound source is constant when a synthesized still image or video is reproduced based on a plurality of images. The sound recording which becomes the sound effect without a sense of incongruity is enabled. In addition, when playing back a composite still image or video based on multiple images, the left / right balance of the sound has been changed so that the position of the sound source is constant, making it possible to play sound with a sound effect that does not feel strange. Yes.
なお、本発明の各実施形態においては、画面の移動を、画像データに基づいて検出していたが、これに限らず、例えば、カメラ10内に設けた角速度センサや加速度センサ等によって、カメラ10の動きを直接、検出するようにしても勿論かまわない。 In each embodiment of the present invention, the movement of the screen is detected based on the image data. However, the present invention is not limited to this. For example, the camera 10 may be detected by an angular velocity sensor or an acceleration sensor provided in the camera 10. Of course, it may be possible to detect the movement of the camera directly.
また、本発明の各実施形態においては、左右2チャンネルのステレオ録音を前提に説明したが、これに限らず、さらに多チャンネルの録音であっても勿論、本発明を適用することができる。 In each embodiment of the present invention, the left and right two-channel stereo recording has been described. However, the present invention is not limited to this and can be applied to a multi-channel recording.
さらに、本発明の各実施形態においては、再生表示する場合には、カメラ10の表示部8、またはカメラ10から外部機器20に送信して行っていた。しかし、これに限らず、例えば、記録部4で記録された記録媒体を直接、テレビやパーソナルコンピュータに装填するようにしても良い。 Furthermore, in each embodiment of the present invention, when reproducing and displaying, transmission is performed from the display unit 8 of the camera 10 or the camera 10 to the external device 20. However, the present invention is not limited to this. For example, the recording medium recorded by the recording unit 4 may be directly loaded into a television or personal computer.
また、本発明の各実施形態においては、撮影のための機器として、デジタルカメラを用いて説明したが、カメラとしては、デジタル一眼レフカメラでもコンパクトデジタルカメラでもよく、ビデオカメラ、ムービーカメラのような動画用のカメラでもよく、さらに、携帯電話や携帯情報端末(PDA:Personal Digital Assist)等に内蔵されるカメラでも構わない。いずれにしても、画像と共に音声を記録することのできる撮影のための機器であれば、本発明を適用することができる。 In each embodiment of the present invention, a digital camera has been described as an apparatus for photographing. However, the camera may be a digital single lens reflex camera or a compact digital camera, such as a video camera or a movie camera. It may be a camera for moving images, or may be a camera built in a mobile phone or a personal digital assistant (PDA). In any case, the present invention can be applied to any device for photographing that can record sound together with an image.
本発明は、上記実施形態にそのまま限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素の幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。 The present invention is not limited to the above-described embodiments as they are, and can be embodied by modifying the constituent elements without departing from the scope of the invention in the implementation stage. In addition, various inventions can be formed by appropriately combining a plurality of components disclosed in the embodiment. For example, you may delete some components of all the components shown by embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.
1・・・信号処理及び制御部、2・・・撮像部、3・・・変化判定部、4・・・記録部、6・・・操作判定部、7・・・左右音声収録部、8・・・表示部、9・・・時計部、10・・・カメラ、10a・・・カメラ、10b・・・カメラ、12・・・通信部、15・・・ユーザ(撮影者)、15a・・・目、15b・・・目、15c・・・耳、20・・・外部機器、21・・・信号処理及び制御部、22・・・通信部、23・・・表示・再生部、24・・・表示優先部、25・・・リモコン受信部、31a・・・画角、31b・・・画角、33a・・・収音範囲、33b・・・収音範囲、35・・・可聴範囲、41a・・・右側マイク、41b・・・左側マイク、42a・・・ADコンバータ、42b・・・ADコンバータ、43a・・・加算器、43b・・・加算器、43c・・・乗算器、43d・・・加算器、43e・・・乗算器、43f・・・加算器、51a〜51c・・・画像、52a〜52c・・・音源位置、53a〜53c・・・音源、55・・・木、56a〜56c・・・画像、57・・・人物、58a〜58c・・・収音範囲、59・・・木、61a〜61c・・・画像、62・・・パノラマ画像 DESCRIPTION OF SYMBOLS 1 ... Signal processing and control part, 2 ... Imaging part, 3 ... Change determination part, 4 ... Recording part, 6 ... Operation determination part, 7 ... Left-right audio | voice recording part, 8 Display unit 9 Clock unit 10 Camera 10a Camera 10b Camera 12 Communication unit 15 User (photographer) 15a .. Eye, 15b ... Eye, 15c ... Ear, 20 ... External device, 21 ... Signal processing and control unit, 22 ... Communication unit, 23 ... Display / playback unit, 24 ... Display priority part, 25 ... Remote control receiving part, 31a ... Angle of view, 31b ... Angle of view, 33a ... Sound collection range, 33b ... Sound collection range, 35 ... Audible Range, 41a ... right microphone, 41b ... left microphone, 42a ... AD converter, 42b ... AD converter, 43a ... add 43b ... adder, 43c ... multiplier, 43d ... adder, 43e ... multiplier, 43f ... adder, 51a-51c ... image, 52a-52c ... Sound source position, 53a to 53c ... sound source, 55 ... tree, 56a to 56c ... image, 57 ... person, 58a-58c ... sound collection range, 59 ... tree, 61a- 61c ... image, 62 ... panoramic image
Claims (9)
被写体方向からの音声の収音範囲を変更可能な収音変更部と、
上記撮像部で連続して得られた複数の画像を合成し、合成画像を生成する画像合成部と、
上記複数の画像を撮影する際に、上記収音変更部の収音範囲を変更する制御部と、
を有し、
上記制御部は、上記合成画像を生成する各画像を、右から左に向けて得る場合と、左から右に向けて得る場合に応じて、それぞれ収音範囲を、左から右に、または右から左に変更することを特徴とするカメラ。 An imaging unit for continuously shooting a subject;
A sound collection changer that can change the sound collection range of the sound from the subject direction;
An image combining unit that combines a plurality of images continuously obtained by the imaging unit and generates a combined image;
A control unit that changes a sound collection range of the sound collection change unit when shooting the plurality of images;
I have a,
The control unit sets the sound collection range from left to right or right according to the case where each image for generating the composite image is obtained from right to left and from left to right, respectively. A camera characterized by changing from left to right .
上記撮影時に複数の方向の音声を収録する音声取得部と、
上記撮像部で連続して得られた複数の画像を合成し、合成画像を生成する画像合成部と、
上記複数の画像を合成する際に、上記音声取得部で得られた複数の方向の音声の合成を変更する制御部と、
を有し、
上記制御部は、上記合成画像を生成する際に、上記合成画像の特定位置の方向に音源位置があるように、各画像における所定の被写体の位置変化に従って音声合成を変更することを特徴とするカメラ。 An imaging unit that captures continuous images while moving the camera field of view to the left and right;
An audio acquisition unit that records audio in multiple directions at the time of shooting,
An image combining unit that combines a plurality of images continuously obtained by the imaging unit and generates a combined image;
When synthesizing the plurality of images, a control unit that changes synthesis of audio in a plurality of directions obtained by the audio acquisition unit;
I have a,
The control unit, when generating the synthesized image, changes speech synthesis in accordance with a change in position of a predetermined subject in each image so that the sound source position is in the direction of the specific position of the synthesized image. camera.
上記被写体の方向からの音声の収音範囲を変更可能な収音変更部と、
カメラの動きを判定する動き判定部と、
上記連続撮影する際に、上記動き判定部による判定結果に基づいて、上記収音変更部の収音範囲を変更する制御部と、
を有し、
上記制御部は、上記連続撮影する際に、上記動き判定部による判定結果が、右から左に向けて動く場合と、左から右に向けて動く場合に応じて、それぞれ収音範囲を、左から右に、または右から左に変更することを特徴とするカメラ。 An imaging unit for continuously shooting a subject;
A sound collection changer capable of changing the sound collection range of the sound from the direction of the subject;
A motion determination unit for determining the motion of the camera;
A control unit that changes a sound collection range of the sound collection change unit based on a determination result by the motion determination unit when the continuous shooting is performed;
I have a,
When the continuous shooting is performed, the control unit sets the sound collection range to the left according to whether the determination result by the motion determination unit moves from right to left and from left to right. A camera characterized by changing from right to left or from right to left .
上記画像データに基づいて、画像を再生表示する表示部と、
上記ステレオ音声データに基づき、左右のバランスを変更して再生可能な音声再生部と、
カメラの動きを判定する動き判定部と、
上記画像データおよび上記ステレオ音声データの再生時に、上記カメラの動きに基づいて、特定位置に音源位置があるように、上記ステレオ音声データの左右のバランスを制御する制御部と、
を有することを特徴とする再生装置。 A storage unit for storing continuously captured image data and stereo sound data recorded in stereo during the continuous shooting;
A display unit for reproducing and displaying an image based on the image data;
Based on the stereo audio data, an audio playback unit that can be played by changing the left and right balance;
A motion determination unit for determining the motion of the camera;
A controller that controls the left-right balance of the stereo audio data so that the sound source position is at a specific position based on the movement of the camera when reproducing the image data and the stereo audio data;
A playback apparatus comprising:
カメラの動きを判定し、
上記画像データおよび上記ステレオ音声データの再生時に、上記カメラの動きに基づいて、特定位置に音源位置があるように、上記ステレオ音声データの左右のバランスを制御する、
ことを特徴とする再生方法。 Stores continuously captured image data and stereo audio data recorded in stereo during this continuous shooting.
Judge the camera movement,
When reproducing the image data and the stereo audio data, the left and right balance of the stereo audio data is controlled so that the sound source position is at a specific position based on the movement of the camera.
A reproduction method characterized by the above.
カメラの動きを判定し、
上記画像データおよび上記ステレオ音声データの再生時に、上記カメラの動きに基づいて、特定位置に音源位置があるように、上記ステレオ音声データの左右のバランスを制御する、
ことをコンピュータに実行させることを特徴とするプログラム。 Stores continuously captured image data and stereo audio data recorded in stereo during this continuous shooting.
Judge the camera movement,
When reproducing the image data and the stereo audio data, the left and right balance of the stereo audio data is controlled so that the sound source position is at a specific position based on the movement of the camera.
A program characterized by causing a computer to execute the above.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008263490A JP5155092B2 (en) | 2008-10-10 | 2008-10-10 | Camera, playback device, and playback method |
CN2009101792219A CN101729771B (en) | 2008-10-10 | 2009-10-10 | Camera, sound player and sound playing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008263490A JP5155092B2 (en) | 2008-10-10 | 2008-10-10 | Camera, playback device, and playback method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010093671A JP2010093671A (en) | 2010-04-22 |
JP5155092B2 true JP5155092B2 (en) | 2013-02-27 |
Family
ID=42255940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008263490A Expired - Fee Related JP5155092B2 (en) | 2008-10-10 | 2008-10-10 | Camera, playback device, and playback method |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5155092B2 (en) |
CN (1) | CN101729771B (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016092691A (en) | 2014-11-07 | 2016-05-23 | キヤノン株式会社 | Image processing device, method for controlling the same, program, and storage medium |
CN104616687A (en) * | 2015-01-14 | 2015-05-13 | 小米科技有限责任公司 | Recording method and device |
CN106303187B (en) * | 2015-05-11 | 2019-08-02 | 小米科技有限责任公司 | Acquisition method, device and the terminal of voice messaging |
CN105120155A (en) * | 2015-08-21 | 2015-12-02 | 小米科技有限责任公司 | Panoramic photograph generation method and device |
CN105979469B (en) * | 2016-06-29 | 2020-01-31 | 维沃移动通信有限公司 | recording processing method and terminal |
JP7020024B2 (en) * | 2016-11-30 | 2022-02-16 | 株式会社リコー | Information processing equipment and programs |
JP6819368B2 (en) * | 2017-03-07 | 2021-01-27 | 株式会社リコー | Equipment, systems, methods and programs |
CN110463226B (en) * | 2017-03-14 | 2022-02-18 | 株式会社理光 | Sound recording device, sound system, sound recording method and carrier device |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000295700A (en) * | 1999-04-02 | 2000-10-20 | Nippon Telegr & Teleph Corp <Ntt> | Method and system for sound source localization using image information and storage medium storing program to realize the method |
JP2001036778A (en) * | 1999-07-15 | 2001-02-09 | Mitsubishi Electric Corp | Integrated camera device with sound collecting function |
KR100918126B1 (en) * | 2002-01-31 | 2009-09-17 | 교세라 가부시키가이샤 | Cellular telephone |
JP4232397B2 (en) * | 2002-06-17 | 2009-03-04 | パナソニック株式会社 | Information terminal with voice and information terminal system |
JP4321374B2 (en) * | 2004-06-17 | 2009-08-26 | 株式会社日立製作所 | Panorama video recording and playback device |
JP2006314078A (en) * | 2005-04-06 | 2006-11-16 | Sony Corp | Imaging apparatus, voice recording apparatus, and the voice recording method |
JP2008193196A (en) * | 2007-02-01 | 2008-08-21 | Casio Comput Co Ltd | Imaging device and specified voice output method |
-
2008
- 2008-10-10 JP JP2008263490A patent/JP5155092B2/en not_active Expired - Fee Related
-
2009
- 2009-10-10 CN CN2009101792219A patent/CN101729771B/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN101729771B (en) | 2012-05-30 |
CN101729771A (en) | 2010-06-09 |
JP2010093671A (en) | 2010-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5155092B2 (en) | Camera, playback device, and playback method | |
JP5345025B2 (en) | Image recording apparatus and method | |
JP2009156888A (en) | Speech corrector and imaging apparatus equipped with the same, and sound correcting method | |
KR101398032B1 (en) | Method of creating and reproducing a panoramic sound image, and apparatus for reproducing such an image | |
JP2012100216A (en) | Camera and moving image capturing program | |
WO2013024704A1 (en) | Image-processing device, method, and program | |
JP2009065587A (en) | Voice-recording device and voice-reproducing device | |
JP5214394B2 (en) | camera | |
JP2005311604A (en) | Information processing apparatus and program used for information processing apparatus | |
WO2012086485A1 (en) | Audio control device and image capture device | |
JP2010245695A (en) | Imaging apparatus | |
JP2009218900A (en) | Imaging apparatus, motion picture recording and playback method, and program | |
JP5750668B2 (en) | Camera, playback device, and playback method | |
JP4931198B2 (en) | IMAGING DEVICE AND IMAGING DEVICE CONTROL METHOD | |
WO2010061791A1 (en) | Video control device, and image capturing apparatus and display apparatus which are provided with same | |
JP2005202037A (en) | Stereo camera | |
JP2001326990A (en) | Acoustic signal processor and its processing method | |
WO2021181966A1 (en) | Image processing device, image processing method, and program | |
JP4499537B2 (en) | Electronic camera | |
JP2008278315A (en) | Imaging apparatus and program thereof | |
JP2001008285A (en) | Method and apparatus for voice band signal processing | |
JP4515005B2 (en) | Electronic camera | |
JP4687908B2 (en) | Movie playback apparatus and program thereof | |
JP2006101310A (en) | Photographing apparatus and program therefor | |
JP2011155580A (en) | Imaging apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110930 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120906 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121206 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5155092 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151214 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |