JP2004208276A - Imaging device - Google Patents

Imaging device Download PDF

Info

Publication number
JP2004208276A
JP2004208276A JP2003357810A JP2003357810A JP2004208276A JP 2004208276 A JP2004208276 A JP 2004208276A JP 2003357810 A JP2003357810 A JP 2003357810A JP 2003357810 A JP2003357810 A JP 2003357810A JP 2004208276 A JP2004208276 A JP 2004208276A
Authority
JP
Japan
Prior art keywords
folder
image data
image
unit
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003357810A
Other languages
Japanese (ja)
Inventor
Masashi Inoue
正史 井上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Holdings Corp
Original Assignee
Fuji Photo Film Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Photo Film Co Ltd filed Critical Fuji Photo Film Co Ltd
Priority to JP2003357810A priority Critical patent/JP2004208276A/en
Publication of JP2004208276A publication Critical patent/JP2004208276A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide an imaging device capable of easily performing management of images which have been photographed. <P>SOLUTION: The imaging device produces image data after catching incident subject light with an image pick-up device 110 through an imaging lens 101 in response to an imaging operation, and records the image data into a recording unit 120. The device comprises a microphone 150 for collecting voices of a photographer, a speech recognition unit 142 for outputting character codes after performing the speech recognition from the voice outputted from the microphone 150, and an image processing unit 112 for performing a recording process for recording the image data into a folder when a text string code corresponds to a name code after deciding whether the name code of the folder corresponding to the text string code is existing or not in the recording unit 120 based on the text string code outputted from the speech recognition unit 142. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

本発明は、撮影操作に応じて生成した画像データを記録部に記録する撮像装置に関する。   The present invention relates to an imaging apparatus that records image data generated according to a shooting operation in a recording unit.

従来より、ハンドヘルドの原稿スキャナやデジタルカメラ等の携帯用の取り込み装置において、音声コマンドの受信により操作を実行する技術が知られている(例えば、特許文献1参照)。   2. Description of the Related Art Conventionally, a technique for executing an operation by receiving a voice command in a portable capture device such as a handheld document scanner or a digital camera is known (see, for example, Patent Document 1).

また、従来の電子カメラにおいて、記録部に存在する複数のフォルダを用途別に使い分けるようにした技術もある(例えば、特許文献2参照)。
特開2000−215021号公報(段落番号0021、図1) 特開2001−169222号公報(要約、図1)
In addition, there is a technique in which a plurality of folders existing in a recording unit are selectively used according to applications in a conventional electronic camera (see, for example, Patent Document 2).
JP 2000-215021 (paragraph number 0021, FIG. 1) JP 2001-169222 (Abstract, FIG. 1)

複数のフォルダを用途別に使い分けるためには、撮影操作による画像取り込みのほか記録媒体等の記録部への画像記録のためのフォルダを指定する操作が必要とされる。特許文献2に示すように、従来はこの操作は全てキー操作により行っており、画像記録の都度この操作を行うのでは操作が煩雑で時間がかかるという問題がある。   In order to use a plurality of folders for different purposes, it is necessary to perform an operation for designating a folder for recording an image on a recording unit such as a recording medium in addition to capturing an image by a photographing operation. As shown in Patent Document 2, conventionally, this operation is all performed by key operation, and there is a problem that if this operation is performed every time an image is recorded, the operation is complicated and takes time.

本発明は、上記事情に鑑み、撮影後の画像管理を容易に行えるようにした撮像装置を提供することを目的とする。   In view of the above circumstances, an object of the present invention is to provide an imaging apparatus that can easily perform image management after shooting.

上記目的を達成する本発明の撮像装置は、撮像レンズを経由して入射した被写体光を撮像素子で捉えて撮像操作に応じて画像データを生成し、該画像データを記録部に記録する撮像装置において、
撮像者の音声を集音するマイクロフォンと、
マイクロフォンから出力される音声信号を認識して文字列コードを出力する音声認識部と、
音声認識部からの文字列コードに基づいて上記記録部にその文字列コードに対応するフォルダの名称コードが存在するか否かを判定し、その文字列コードと名称コードが一致するときに当該フォルダへ画像データを記録する処理を行う画像信号処理部とを備えたことを特徴とする。
An imaging apparatus of the present invention that achieves the above object captures subject light incident via an imaging lens by an imaging element, generates image data according to an imaging operation, and records the image data in a recording unit. In
A microphone that collects the voice of the photographer;
A voice recognition unit that recognizes a voice signal output from the microphone and outputs a character string code;
Based on the character string code from the voice recognition unit, it is determined whether or not the name code of the folder corresponding to the character string code exists in the recording unit, and when the character string code matches the name code, the folder And an image signal processing unit that performs processing for recording image data.

本発明の撮像装置では、撮像者がフォルダ名を表す音声をマイクロフォンに入力し、該マイクロフォンからの音声信号を音声認識部で文字列コードに変換し、音声認識部からの文字列コードに基づいて記録部に該文字列コードに対応するフォルダの名称コードが存在するか否かを判定し、文字列コードと名称コードが一致するときに当該フォルダへ画像データを記録する処理を行う。これにより、撮像後の画像管理を音声で行うことが可能となり、画像管理が容易になる。   In the image pickup apparatus of the present invention, the photographer inputs the voice representing the folder name to the microphone, converts the voice signal from the microphone into a character string code by the voice recognition unit, and based on the character string code from the voice recognition unit It is determined whether or not the name code of the folder corresponding to the character string code exists in the recording unit, and when the character string code matches the name code, the image data is recorded in the folder. As a result, it is possible to perform image management after imaging using voice, and image management becomes easy.

この本発明の撮像装置において、上記画像信号処理部は、記録部に上記文字列コードに対応する名称コードのフォルダが存在しないと判定した場合は新規にその文字列コードに基づく名称コードを有するフォルダを作成した後当該フォルダに画像データを記録する処理を行うものであることが好ましい。   In the imaging apparatus of the present invention, when the image signal processing unit determines that there is no name code folder corresponding to the character string code in the recording unit, the folder having a new name code based on the character string code It is preferable to perform a process of recording image data in the folder after creating the file.

これにより、音声データ用のフォルダが存在しない場合でも撮像後の画像管理を音声で行うことが可能となる。   As a result, even when there is no audio data folder, image management after imaging can be performed with audio.

ここで、上記マイクロフォンに入力する音声は、画像の内容を表すキーワードであることが好ましい。   Here, the sound input to the microphone is preferably a keyword representing the content of the image.

以上、説明したように、本発明によれば、撮像後の画像管理をキー操作なしで音声で行うことが可能である。   As described above, according to the present invention, image management after imaging can be performed by voice without key operation.

以下、本発明の実施形態について説明する。   Hereinafter, embodiments of the present invention will be described.

図1は本発明の撮像装置の一実施形態としてのデジタルカメラの外観図であって、(a)は正面図、(b)は背面図である。   1A and 1B are external views of a digital camera as an embodiment of an imaging apparatus of the present invention, where FIG. 1A is a front view and FIG. 1B is a rear view.

図1に示すデジタルカメラ100は、撮像レンズ101からカメラ100内部に配備されているCCD固体撮像素子110まで被写体の像が導かれるようになっている。デジタルカメラ100の背面にはユーザがこのデジタルカメラ100を使用するときに様々な操作を行うための操作部が設けられている。   In the digital camera 100 shown in FIG. 1, an image of a subject is guided from the imaging lens 101 to the CCD solid-state imaging device 110 provided in the camera 100. An operation unit for performing various operations when the user uses the digital camera 100 is provided on the back of the digital camera 100.

この操作部には、操作用のスイッチ群とLCD画面105aが設けられている。操作スイッチ群にはデジタルカメラを作動させるための電源投入用のパワースイッチ102、撮影と再生とを自在に切替える撮影・再生切替レバー103、実行キー106a、キャンセルキー106b、十字キー107および閃光発光部104のポップアップスイッチ108などがある。この十字キー107の内側には表示部107aが設けられていてLCD画面105aに表示される選択メニューの項目が十字キー107によって選択できるようになっている。さらにはLCD画面105aの表示、非表示の切替を行うための表示キー1051も設けられている。また、このデジタルカメラ100の上方にはレリーズ釦109が配備されている。このレリーズ釦109が全押しされると撮影の開始指示がデジタルカメラ内部の後述する信号処理部へと伝えられる。   This operation unit is provided with an operation switch group and an LCD screen 105a. The operation switch group includes a power switch 102 for turning on the power for operating the digital camera, a shooting / playback switching lever 103 for freely switching between shooting and playback, an execution key 106a, a cancel key 106b, a cross key 107, and a flash light emitting unit. 104 pop-up switch 108 and the like. A display unit 107 a is provided inside the cross key 107 so that selection menu items displayed on the LCD screen 105 a can be selected by the cross key 107. Further, a display key 1051 for switching between display and non-display of the LCD screen 105a is also provided. Further, a release button 109 is provided above the digital camera 100. When the release button 109 is fully pressed, an instruction to start shooting is transmitted to a signal processing unit (to be described later) inside the digital camera.

また、このデジタルカメラ100は、撮影・再生切替レバー103によって撮影と再生との切替が自在になっており、撮影を行うときにはユーザによって撮影・再生切替レバー103が撮影側103aに切り替えられ、再生を行うときには撮影・再生切替レバー103が再生側103bに切り替えられる。また、夜間撮影も行えるように閃光発光装置104が配備されている。   The digital camera 100 can be switched between shooting and playback by a shooting / playback switching lever 103. When shooting, the user switches the shooting / playback switching lever 103 to the shooting side 103a to play back. When performing, the photographing / reproduction switching lever 103 is switched to the reproduction side 103b. Also, a flash light emitting device 104 is provided so that night photography can be performed.

さらににまた、このデジタルカメラ100は、マイクロフォン150が内蔵されており、撮影者が音声を入力できるようになっている。   Furthermore, the digital camera 100 has a built-in microphone 150 so that a photographer can input voice.

図2は、デジタルカメラ100の内部に設けられている信号処理回路の一例を示すブロック構成図である。   FIG. 2 is a block configuration diagram illustrating an example of a signal processing circuit provided in the digital camera 100.

本実施形態のデジタルカメラ100ではすべての処理がCPU111によって制御されており、このCPU111の制御のもとにDSP112によってCCD固体撮像素子110で得られた画像データの処理が行われる。このCPU111とDSP112とは図示しないバスで接続されており、このバスを介してデータのやりとりが行われる。また、CPU111にはSDRAM113とFLASHROM114とが接続されており、SDRAM113にはDSP112で処理が行われる画像データが記憶され、FLASHROM114にはCPU111に処理を実行させるためのプログラムが記憶されている。図2には、SDRAM113に記憶された画像データがDSP112側へ読み出されることが矢印で示されている。   In the digital camera 100 of the present embodiment, all processing is controlled by the CPU 111, and processing of image data obtained by the CCD solid-state imaging device 110 is performed by the DSP 112 under the control of the CPU 111. The CPU 111 and the DSP 112 are connected by a bus (not shown), and data is exchanged via this bus. In addition, SDRAM 113 and FLASH ROM 114 are connected to CPU 111, image data to be processed by DSP 112 is stored in SDRAM 113, and a program for causing CPU 111 to execute processing is stored in FLASH ROM 114. In FIG. 2, an arrow indicates that the image data stored in the SDRAM 113 is read out to the DSP 112 side.

このCPU111の入力部には、図1に示した各種キーおよびスイッチからなる操作部115の操作に応じた電気信号が入力される。この操作部115には、図1に示したパワースイッチ102、撮影・再生切替スイッチ103、表示キー1051、実行キー106a、キャンセルキー106b、上キー1071と右キー1072と下キー1073と左キー1074との4つのキーで構成される十字キー107、およびレリーズ釦109の押下により作動するシャッタスイッチなどがある。   An electric signal corresponding to the operation of the operation unit 115 including various keys and switches shown in FIG. 1 is input to the input unit of the CPU 111. The operation unit 115 includes a power switch 102, a shooting / playback switch 103, a display key 1051, an execution key 106a, a cancel key 106b, an up key 1071, a right key 1072, a down key 1073, and a left key 1074 shown in FIG. There are a cross key 107 composed of four keys, and a shutter switch that is actuated when the release button 109 is pressed.

マイクロフォン150からの音声信号は、オーディオインタフェース140を介し、このオーディオインタフェース140でディジタル信号に変換されてDSP112で受け取られ、この受け取られた信号が一旦、DSP112内に記憶され、必要に応じてその記憶された音声信号がオーディオインタフェース120を介しアナログ信号に変換されてスピーカ141へ供給されるようになっている。DSP112内の音声信号処理部は本実施形態のデジタルカメラでムービ撮影が行われる場合などに利用される。   The audio signal from the microphone 150 is converted into a digital signal by the audio interface 140 via the audio interface 140 and received by the DSP 112, and the received signal is temporarily stored in the DSP 112 and stored as necessary. The audio signal thus converted is converted into an analog signal via the audio interface 120 and supplied to the speaker 141. The audio signal processing unit in the DSP 112 is used when movie shooting is performed with the digital camera of this embodiment.

また、この実施形態のデジタルカメラ100では、オーディオインタフェース140の出力は音声認識部142にも入力されて音声認識が行なわれ、その音声認識により得られた文字データもDSP112に入力されるようになっている。   In the digital camera 100 of this embodiment, the output of the audio interface 140 is also input to the voice recognition unit 142 for voice recognition, and character data obtained by the voice recognition is also input to the DSP 112. ing.

さらにまた、本実施形態のデジタルカメラ100は、LCD表示部105に備えられたLCD画面105a(図1参照)に表示メニューの表示が可能な構成になっており、そのメニューで表示される項目の選択が上記十字キー107により行われる。   Furthermore, the digital camera 100 of the present embodiment is configured such that a display menu can be displayed on the LCD screen 105a (see FIG. 1) provided in the LCD display unit 105, and items displayed in the menu are displayed. Selection is performed by the cross key 107.

この十字キー107ではLCD画面105aに表示される選択メニューの、複数の項目の中のいずれかが選択できるようになっている。図1に示した十字キーの4つのキーのうち、上キー1071が押されたらLCD画面105aに表示されたカーソルが上方向へ移動し、右キー1072が押されたらカーソルが右方向へ移動する構成になっている。   With the cross key 107, one of a plurality of items in a selection menu displayed on the LCD screen 105a can be selected. Of the four keys of the cross key shown in FIG. 1, when the up key 1071 is pressed, the cursor displayed on the LCD screen 105a moves upward, and when the right key 1072 is pressed, the cursor moves right. It is configured.

これらのキー1071〜1074が押されたときに、それらのキー1071〜1074が押されたことがCPU111に認識され、CPU111では4つのキー1071〜1074のうち、いずれかのキーが押されたことに基づいてバスを経由させてLCD画面105aへカーソルの移動指示が転送される。そうすると複数表示されている項目の中のいずれかにカーソルが移動してそれらの項目の中のいずれかがその移動したカーソルにより選択される。   When these keys 1071 to 1074 are pressed, the CPU 111 recognizes that the keys 1071 to 1074 have been pressed, and the CPU 111 has pressed any one of the four keys 1071 to 1074. Based on the above, an instruction to move the cursor is transferred to the LCD screen 105a via the bus. Then, the cursor moves to one of the displayed items, and one of these items is selected by the moved cursor.

カーソルが項目の中のいずれかに置かれた状態で実行キー106aが押されればその項目が実行される。したがってユーザはLCD画面105aに表示されたカーソルにより、選択メニューの中の、複数の項目のいずれかを選択することができる。   If the execution key 106a is pressed while the cursor is placed on any of the items, the item is executed. Therefore, the user can select any of a plurality of items in the selection menu with the cursor displayed on the LCD screen 105a.

撮影・再生切替レバー103が再生側103bに切り替えられると記録メディアからの再生が行われる。このときには撮影を行うための指示を行うレリーズ釦などからの信号が入力されても処理は行われない。   When the shooting / playback switching lever 103 is switched to the playback side 103b, playback from the recording medium is performed. At this time, no processing is performed even if a signal from a release button or the like for giving an instruction to perform photographing is input.

次にCPU111の出力部を説明する。   Next, the output unit of the CPU 111 will be described.

CPU111の出力部にはタイミングジェネレータ(以下TGという)116、フォーカスレンズ118を駆動するためのモータドライバ(以下DRVという)117、および閃光発光部104に閃光発光を行わせる閃光発光装置104aが接続されている。   A timing generator (hereinafter referred to as “TG”) 116, a motor driver (hereinafter referred to as “DRV”) 117 for driving the focus lens 118, and a flash light emitting device 104 a that causes the flash light emitting unit 104 to perform flash emission are connected to the output unit of the CPU 111. ing.

撮影を行うときにはLCD画面105a上に被写体像が被写体の動きにあわせて表示されている。この表示されている被写体像を見ながら、ユーザによりフレーミングが行なわれ、レリーズ釦109が押されたら撮影が行なわれる。このレリーズ釦109が押されると、CPU111では撮影開始を指示する信号がTG116へ出力される。TG116ではこの指示を受けてCCD固体撮像素子110へレリーズ釦109が押下されたことを知らせる信号が供給される。この信号を受けてCCD固体撮像素子110ではレリーズ釦109が全押しされたときにCCD固体撮像素子110によって撮像されていた画像データがRGB信号として出力される。   When shooting, a subject image is displayed on the LCD screen 105a in accordance with the movement of the subject. While viewing the displayed subject image, the user performs framing, and when the release button 109 is pressed, shooting is performed. When the release button 109 is pressed, the CPU 111 outputs a signal for instructing start of shooting to the TG 116. In response to this instruction, the TG 116 supplies a signal notifying the CCD solid-state image sensor 110 that the release button 109 has been pressed. In response to this signal, the CCD solid-state image sensor 110 outputs the image data captured by the CCD solid-state image sensor 110 as an RGB signal when the release button 109 is fully pressed.

ここからはCCD固体撮像素子110で撮像された撮像信号がどのように処理されるかを、順を追って説明する。   From here, how the image signal picked up by the CCD solid-state image sensor 110 is processed will be described in order.

CCD固体撮像素子110で得られた撮像信号はRGB信号となってCDSおよびA/D部119へ供給される。このCDSおよびA/D部119で雑音の低減が行われてからデジタル信号に変換され、デジタルのRGB信号となってDSP112へ供給される。このDSP112内には画像信号処理部、圧縮処理部、AE(AutoExposure)検出部、AWB(Auto White Balance)検出部、ビデオエンコーダ、音声信号処理部などの各信号処理部が包含されている。   Imaging signals obtained by the CCD solid-state imaging device 110 are converted to RGB signals and supplied to the CDS and A / D unit 119. Noise is reduced by the CDS and A / D unit 119 and then converted into a digital signal, which is supplied to the DSP 112 as a digital RGB signal. The DSP 112 includes various signal processing units such as an image signal processing unit, a compression processing unit, an AE (Auto Exposure) detection unit, an AWB (Auto White Balance) detection unit, a video encoder, and an audio signal processing unit.

したがってこのDSP112でCCD固体撮像素子110で得られたRGB信号からなる画像データに一連の処理が施され、その処理が施された画像データがLCD画面105aを有するLCD表示部105、記録メディア130が装填されている記録部120といった出力機器へ出力される。音声についてはマイクロフォン150、スピーカ141等の音声入出力機器に必要な音声信号の処理がDSP112で行われる。この実施形態のデジタルカメラ100ではマイクロフォン150からの音声信号がオーディオインタフェース140を介してDSP112で受け取られ、この受け取られた信号が一旦、DSP112内に記憶され、必要に応じてその記憶された音声信号がオーディオインタフェース140を介してスピーカ141へ供給される。DSP112内の音声信号処理部はデジタルカメラでムービ撮影が行われる場合などに利用される。以上がCCD固体撮像素子110により得られた撮影信号の流れである。   Therefore, a series of processing is performed on the image data composed of the RGB signals obtained by the CCD solid-state imaging device 110 by the DSP 112, and the processed image data includes the LCD display unit 105 having the LCD screen 105a and the recording medium 130. The data is output to an output device such as the loaded recording unit 120. As for audio, the DSP 112 processes audio signals necessary for audio input / output devices such as the microphone 150 and the speaker 141. In the digital camera 100 of this embodiment, an audio signal from the microphone 150 is received by the DSP 112 via the audio interface 140, and the received signal is temporarily stored in the DSP 112, and the stored audio signal is stored as necessary. Is supplied to the speaker 141 via the audio interface 140. The audio signal processing unit in the DSP 112 is used when movie shooting is performed with a digital camera. The above is the flow of imaging signals obtained by the CCD solid-state imaging device 110.

前述した撮影・再生切替レバー103が撮影側103aに切り替えられ、撮影が行われるときの画像データの流れを詳細に説明する。   The flow of image data when the above-described shooting / playback switching lever 103 is switched to the shooting side 103a and shooting is performed will be described in detail.

撮影が行われるときには、CPU111の入力部に接続されている撮影・再生切替レバー103が撮影側103aに切り替えられる。   When shooting is performed, the shooting / playback switching lever 103 connected to the input unit of the CPU 111 is switched to the shooting side 103a.

このようなデジタルカメラ100ではレリーズ釦109が押されていなくてもLCD表示部105のLCD画面105aに撮影レンズが向けられた方向の被写体像がスルー画像として常に表示されている。この表示されているスルー画像は、CCD固体撮像素子110から所定の間隔ごとに読み出されるRGB信号から成る画像データがDSP112内の画像信号処理部でYC信号に変換され、そのYC信号がDSP112内のビデオエンコーダを経由してLCD表示部105に供給されて得られるものである。このようなスルー画像の表示が行われているときにはスルー画像ごとにDSP112で露出調節、焦点調節といったカメラ特有の信号処理が行われている。   In such a digital camera 100, the subject image in the direction in which the photographing lens is directed is always displayed as a through image on the LCD screen 105a of the LCD display unit 105 even when the release button 109 is not pressed. In the displayed through image, image data composed of RGB signals read out from the CCD solid-state imaging device 110 at predetermined intervals is converted into YC signals by the image signal processing unit in the DSP 112, and the YC signals are converted into the DSP 112. It is obtained by being supplied to the LCD display unit 105 via a video encoder. When such a through image is displayed, camera-specific signal processing such as exposure adjustment and focus adjustment is performed by the DSP 112 for each through image.

ここで自分が求めている被写体がLCD画面105aにスルー画像として表示されていたら、ユーザによりレリーズ釦109が押下される。ユーザによってレリーズ釦109が押されるとCPU111からTG116に対して撮影の開始指示が出される。この開始指示を受けてCCD固体撮像撮像素子110では記録用の画像データ生成用のRGB信号が出力される。   Here, when the subject that the user wants is displayed as a through image on the LCD screen 105a, the release button 109 is pressed by the user. When the release button 109 is pressed by the user, the CPU 111 issues a shooting start instruction to the TG 116. In response to this start instruction, the CCD solid-state imaging device 110 outputs RGB signals for generating image data for recording.

この出力されたRGB信号はCDSおよびA/D変換部119でデジタル信号に変換され、DSP112内の画像入力コントローラによってDSP112側へ導かれ、その導かれたRGB信号がDSP112内のバスを介してSDRAM121に供給され、SDRAM121にデジタル信号のRGB信号が書き込まれる。そして今回の撮影により生成されるべき画像データに対応するRGB信号の取り込みが完了したら、今度はSDRAM121からRGB信号が読み出されてDSP112に供給される。DSP112ではRGB信号からYC信号への変換が行なわれ、さらにDSP121内で圧縮された画像データがインタフェース120を介して記録部120に供給され、この記録部120に装填されている記録メディア130に画像データがJPEG圧縮ファイルとして記録される。   The output RGB signal is converted into a digital signal by the CDS and A / D conversion unit 119, guided to the DSP 112 side by the image input controller in the DSP 112, and the guided RGB signal is SDRAM 121 via the bus in the DSP 112. And the RGB signal of the digital signal is written in the SDRAM 121. When the capturing of the RGB signal corresponding to the image data to be generated by the current photographing is completed, the RGB signal is read from the SDRAM 121 and supplied to the DSP 112. The DSP 112 performs conversion from RGB signals to YC signals, and the image data compressed in the DSP 121 is supplied to the recording unit 120 via the interface 120, and an image is recorded on the recording medium 130 loaded in the recording unit 120. Data is recorded as a JPEG compressed file.

なおDSP112とCPU111はバスによって接続されており、このバスを介してアドレス、データのやりとりが行われる。CPU111には内部にレジスタが各種用意されており、これらのレジスタの内容が各信号処理部の処理の進行状況に応じて書き換えられる。CPU内111ではこのレジスタの内容を判読してフラッシュROM114内に格納されているプログラムの手順にしたがった処理が行われる。   The DSP 112 and the CPU 111 are connected by a bus, and exchange of addresses and data is performed via this bus. Various registers are prepared in the CPU 111, and the contents of these registers are rewritten according to the progress of processing of each signal processing unit. In the CPU 111, the contents of the register are read and processing according to the procedure of the program stored in the flash ROM 114 is performed.

以上が本実施形態のデジタルカメラ100で撮影が行われるときに記録メディア130に記録されるまでの画像データの流れである。   The above is the flow of image data until recording is performed on the recording medium 130 when shooting is performed with the digital camera 100 of the present embodiment.

本発明のデジタルカメラにおいては、以下に示すように音声操作により撮影操作および画像管理を行えるようになっている。   In the digital camera of the present invention, shooting operation and image management can be performed by voice operation as described below.

図1および図2に示すように、デジタルカメラ100に内蔵されているマイクロホン150はオーディオインタフェース140に接続され、このオーディオインタフェース140の出力は音声認識部142を介してDSP112に入力されるようになっている。   As shown in FIGS. 1 and 2, the microphone 150 built in the digital camera 100 is connected to the audio interface 140, and the output of the audio interface 140 is input to the DSP 112 via the voice recognition unit 142. ing.

図3は、音声による撮影操作および画像管理の動作の流れを示すフローチャートである。   FIG. 3 is a flowchart showing a flow of photographing operation and image management operation using voice.

LCD画面105aに選択メニューを表示させカーソルキー1071〜1074等を操作して音声による操作を行なうモードを選択すると、この図3に示すフローチャートに従った処理が行なわれる。   When the selection menu is displayed on the LCD screen 105a and the cursor keys 1071 to 1074 and the like are operated to select a voice operation mode, processing according to the flowchart shown in FIG. 3 is performed.

音声より操作を行なうモードが選択されている状態において、撮影時にレリーズ釦109の操作に代えて、マイクロフォン150から、例えば「撮影」と音声入力すると、オーディオインタフェース140を介して音声トリガがDSP112に入力され(ステップS1)、CPU111からTG116に対して撮影の開始指示が出され、この開始指示を受けてCCD固体撮像撮像素子110での画像取り込みが行われ(ステップS2)、CCD固体撮像撮像素子110から記録用の画像データの基になるRGB信号が出力される。   In a state where the operation mode is selected from voice, instead of operating the release button 109 at the time of shooting, for example, when “shooting” is input from the microphone 150, an audio trigger is input to the DSP 112 via the audio interface 140. (Step S1), the CPU 111 issues a shooting start instruction to the TG 116. Upon receiving this start instruction, the CCD solid-state imaging device 110 captures an image (Step S2). To output RGB signals which are the basis of image data for recording.

この出力されたRGB信号は、CDSおよびA/D変換部119でデジタル信号に変換され、DSP112内の画像入力コントローラによってDSP112内部へ導かれ、その導かれたRGB信号がDSP112内のバスを介してSDRAM121に供給され、SDRAM121にデジタル信号のRGB信号が書き込まれる(ステップS3)。そして今回の撮影により生成されるべき画像データに対応するRGB信号の取り込みが完了したら、今度はSDRAM121からそのRGB信号が読み出されてDSP112に供給される。DSP112ではRGB信号からYC信号への変換が行なわれ、さらにDSP121内でJPEG圧縮処理が行なわれて、その圧縮処理後の画像データが再度SDRAM121に格納される(ステップS4)。   The output RGB signal is converted into a digital signal by the CDS and A / D conversion unit 119, guided to the inside of the DSP 112 by the image input controller in the DSP 112, and the guided RGB signal is passed through the bus in the DSP 112. This is supplied to the SDRAM 121, and digital RGB signals are written into the SDRAM 121 (step S3). When the capture of the RGB signal corresponding to the image data to be generated by the current photographing is completed, the RGB signal is read from the SDRAM 121 and supplied to the DSP 112. The DSP 112 converts RGB signals into YC signals, and further performs JPEG compression processing in the DSP 121, and the image data after the compression processing is stored again in the SDRAM 121 (step S4).

本実施形態では、記録メディア130に記録する際の処理も音声により行なわれる。すなわち、SDRAM121に圧縮処理後の画像データが格納されている段階において、撮影者がマイクロフォン150からの音声により画像の内容を表すキーワード、例えば、家族写真であれば「家族」と発声し、友人の写真であれば「友人」と発声すると、その音声出力がオーディオインタフェース140から音声認識部142に入り、音声認識部142で文字列コードに変換されてDSP112に入力される(ステップS5)。DSP112では記録部130に装填されている記録メディア上に上記文字列コードに対応する名称コードの音声データ用のフォルダが存在するか否かを判定する(ステップS7)。存在する場合はSDRAM121に記録されている圧縮画像データがDSP112に読み出され、そのDSP112を介して記録部120に送られて、その記録部120に装填されている記録メディア130内の当該フォルダに当該画像データを記録する(ステップS9)。存在しない場合は新規フォルダを作成して(ステップS8)、その後同様の処理を行う。このようにして、JPEG圧縮されている画像データが記録メディア130内にJPEG圧縮ファイルとして記録される。   In the present embodiment, processing when recording on the recording medium 130 is also performed by voice. That is, at the stage where the image data after compression processing is stored in the SDRAM 121, the photographer speaks the keyword representing the content of the image by the sound from the microphone 150, for example, “family” in the case of a family photo, If it is a photograph, when “friend” is uttered, the voice output enters the voice recognition unit 142 from the audio interface 140, is converted into a character string code by the voice recognition unit 142, and is input to the DSP 112 (step S5). The DSP 112 determines whether or not a voice data folder having a name code corresponding to the character string code exists on the recording medium loaded in the recording unit 130 (step S7). If present, the compressed image data recorded in the SDRAM 121 is read out to the DSP 112, sent to the recording unit 120 via the DSP 112, and stored in the folder in the recording medium 130 loaded in the recording unit 120. The image data is recorded (step S9). If it does not exist, a new folder is created (step S8), and thereafter the same processing is performed. In this way, JPEG compressed image data is recorded in the recording medium 130 as a JPEG compressed file.

図4は、記録メディア130のフォルダ階層構造の一例を示す概念図である。フォーマットされた記録メディア130は、ルート(root)の下に画像(DCIM)、音声(dsam)、これ以外(MISC)のフォルダが作成され、DCIMの下に100―fujiというフォルダが用意される。特にフォルダを指示しない通常のモードが選択されている状態においてシャッタ釦109を押すと、そのシャッタ釦109を押すたびにJPEG圧縮処理の行なわれた画像データが生成されて、100―fujiという名称のフォルダに、各画像データを格納したファイル(ここに示す例ではDSCF0001.jpg,DSCF0002.jpg等)が順次作成される。尚、この100―fujiというフォルダ名は、操作に応じて所望の名称に変更することができる。   FIG. 4 is a conceptual diagram showing an example of the folder hierarchical structure of the recording medium 130. In the formatted recording medium 130, an image (DCIM), sound (dsam), and other (MISC) folders are created under the root, and a folder 100-fuji is prepared under the DCIM. In particular, if the shutter button 109 is pressed in a state where the normal mode that does not designate a folder is selected, image data that has been subjected to JPEG compression processing is generated each time the shutter button 109 is pressed, and the name 100-fuji is generated. In the folder, files storing each image data (DSCF0001.jpg, DSCF0002.jpg, etc. in the example shown here) are sequentially created. The folder name 100-fuji can be changed to a desired name according to the operation.

ここで、図4上では既に「家族」という名称のフォルダと「友人」という名称のフォルダが示されているが、これら「家族」、「友人」という名称のフォルダは未だ用意されておらず、以下に説明するようにして音声によりフォルダ名が指定されたときに用意される。   Here, in FIG. 4, a folder named “family” and a folder named “friend” are already shown, but folders named “family” and “friend” have not been prepared yet. Prepared when a folder name is specified by voice as described below.

ここで、音声で撮影指示およびフォルダの指定を行なうモードを選択し、音声による指示で撮影を行なった後、その操作により生成されたJPEG圧縮画像データの格納先のフォルダとして音声で「家族」が発音されると、その「家族」の発音が認識されて「家族」という名称のフォルダが用意され、そのフォルダに、今回の撮影により得られたJPEG圧縮画像データを格納したファイル11が作成される。   Here, after selecting a mode for voice instruction and folder designation, and taking a picture with voice instructions, “family” is voiced as a folder for storing JPEG compressed image data generated by the operation. When the pronunciation is made, the pronunciation of the “family” is recognized and a folder named “family” is prepared, and a file 11 storing the JPEG compressed image data obtained by the current photographing is created in the folder. .

さらにその後音声による指示で次の撮影を行ない、音声でもう一度「家族」と発言すると、「家族」フォルダに、今回の撮影で得られたJPEG圧縮画像データを格納したファイル12が作成される。   Then, the next shooting is performed by voice instructions, and when “family” is spoken again by voice, a file 12 storing JPEG compressed image data obtained by the current shooting is created in the “family” folder.

その後、音声による撮影指示に応じてさらに次の撮影を行ない、今度は音声で「友人」と発音すると、「友人」という名称のフォルダはそれまで存在していないので「友人」のフォルダが新たに用意され、その「友人」フォルダに、今回の撮影により得られたJPEG圧縮画像データのファイル13が作成される。   After that, the next shooting is performed in response to the shooting instruction by voice, and this time when the voice is pronounced as “friend”, a folder named “friend” does not exist so far, so a folder of “friend” is newly added. A file 13 of JPEG compressed image data obtained by the current shooting is created in the “friend” folder.

このようにして、音声により指定した名称のフォルダに画像データが格納されていく。   In this way, image data is stored in a folder having a name designated by voice.

なお、この場合の入力音声は、画像内容を一言で表すようなキーワードであれば、どのような音声でもよい。   The input voice in this case may be any voice as long as it is a keyword that expresses the image content in a single word.

上記の実施形態では、記録メディア130に画像を記録する場合の例を説明したが、本発明は、記録メディアを使用せずに内蔵されている画像記録用のメモリに画像を記録するタイプのカメラにも適用することができ、そのようなタイプのカメラの場合、画像記録用メモリ上のフォルダに同様にして音声で記録できる。   In the above embodiment, an example in which an image is recorded on the recording medium 130 has been described. However, the present invention is a camera of a type that records an image in a built-in image recording memory without using the recording medium. In the case of such a type of camera, audio can be recorded in the same manner in a folder on the image recording memory.

また、ここではデジタルカメラを例に挙げて説明したが、本発明はデジタルカメラ単独の機能を有する装置だけでなく、カメラの機能が搭載された携帯電話やPDA(Personal Data Assistant)など、撮像機能を備えた装置(撮像装置)であればどのような複合形態の装置であっても適用することができる。   Although the digital camera has been described as an example here, the present invention is not limited to a device having a function of a digital camera alone, but an imaging function such as a mobile phone or a PDA (Personal Data Assistant) equipped with a camera function. Any composite apparatus can be applied as long as the apparatus (imaging apparatus) is provided.

本発明の撮像装置の一実施形態であるデジタルカメラの外観図である。1 is an external view of a digital camera that is an embodiment of an imaging apparatus of the present invention. 図1のデジタルカメラ内に配備される信号処理部の構成ブロック図である。FIG. 2 is a configuration block diagram of a signal processing unit provided in the digital camera of FIG. 1. 一実施形態のデジタルカメラの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the digital camera of one Embodiment. 記録メディアのフォルダ階層構造の一例を示す図である。It is a figure which shows an example of the folder hierarchical structure of a recording medium.

符号の説明Explanation of symbols

100 デジタルカメラ
101 撮像レンズ
110 CCD固体撮像素子
111 CPU(信号処理部)
112 DSP(画像信号処理部)
130 記録メディア(記録部)
142 音声認識部
150 マイクロフォン
DESCRIPTION OF SYMBOLS 100 Digital camera 101 Imaging lens 110 CCD solid-state image sensor 111 CPU (signal processing part)
112 DSP (image signal processor)
130 Recording media (recording unit)
142 Voice recognition unit 150 Microphone

Claims (3)

撮像レンズを経由して入射した被写体光を撮像素子で捉えて撮像操作に応じて画像データを生成し、該画像データを記録部に記録する撮像装置において、
撮像者の音声を集音するマイクロフォンと、
該マイクロフォンから出力される音声信号を認識して文字列コードを出力する音声認識部と、
前記音声認識部からの文字列コードに基づいて前記記録部に該文字列コードに対応するフォルダの名称コードが存在するか否かを判定し、該文字列コードと名称コードが一致するときに当該フォルダへ画像データを記録する処理を行う画像信号処理部とを備えたことを特徴とする撮像装置。
In an imaging apparatus that captures subject light incident via an imaging lens with an imaging device, generates image data according to an imaging operation, and records the image data in a recording unit.
A microphone that collects the voice of the photographer;
A voice recognition unit that recognizes a voice signal output from the microphone and outputs a character string code;
Based on the character string code from the voice recognition unit, it is determined whether or not the name code of the folder corresponding to the character string code exists in the recording unit, and when the character string code matches the name code An image pickup apparatus comprising: an image signal processing unit that performs a process of recording image data in a folder.
前記画像信号処理部は、前記記録部に前記文字列コードに対応する名称コードのフォルダが存在しないと判定した場合は新規に該文字列コードに基づく名称コードを有するフォルダを作成した後当該フォルダに画像データを記録する処理を行うものであることを特徴とする請求項1記載の撮像装置。 If it is determined that the name code folder corresponding to the character string code does not exist in the recording unit, the image signal processing unit newly creates a folder having a name code based on the character string code, and then stores the folder in the folder. The imaging apparatus according to claim 1, wherein the imaging apparatus performs processing for recording image data. 前記マイクロフォンにより集音される音声は、画像の内容を表すキーワードであることを特徴とする請求項1記載の撮像装置。 The imaging apparatus according to claim 1, wherein the sound collected by the microphone is a keyword representing the content of an image.
JP2003357810A 2002-12-12 2003-10-17 Imaging device Pending JP2004208276A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003357810A JP2004208276A (en) 2002-12-12 2003-10-17 Imaging device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2002360617 2002-12-12
JP2003357810A JP2004208276A (en) 2002-12-12 2003-10-17 Imaging device

Publications (1)

Publication Number Publication Date
JP2004208276A true JP2004208276A (en) 2004-07-22

Family

ID=32828603

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003357810A Pending JP2004208276A (en) 2002-12-12 2003-10-17 Imaging device

Country Status (1)

Country Link
JP (1) JP2004208276A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011223240A (en) * 2010-04-08 2011-11-04 Nec Corp Mobile information terminal, image registration method, and image classification and organization method
CN104280980A (en) * 2013-07-01 2015-01-14 奥林巴斯株式会社 Electronic device, control method of electronic device
JP2020078900A (en) * 2018-11-13 2020-05-28 コニカミノルタ株式会社 Setting control device, method for controlling setting control device, and program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011223240A (en) * 2010-04-08 2011-11-04 Nec Corp Mobile information terminal, image registration method, and image classification and organization method
CN104280980A (en) * 2013-07-01 2015-01-14 奥林巴斯株式会社 Electronic device, control method of electronic device
JP2020078900A (en) * 2018-11-13 2020-05-28 コニカミノルタ株式会社 Setting control device, method for controlling setting control device, and program
JP7081451B2 (en) 2018-11-13 2022-06-07 コニカミノルタ株式会社 Setting control device, control method of setting control device, and program

Similar Documents

Publication Publication Date Title
KR100770637B1 (en) Digital camera
JP2010219692A (en) Image capturing apparatus and camera
JP4123327B2 (en) Camera with audio playback function
TW200808044A (en) Imaging apparatus and computer readable recording medium
JP2007221570A (en) Imaging apparatus and its program
JP2006203811A (en) Imaging apparatus and its program
JP4639965B2 (en) Imaging apparatus, image processing method, and program
JP2008022306A (en) Imaging device and program thereof
KR20100069497A (en) Photographing control method and appratus for capturing a moment
JP4591120B2 (en) Imaging apparatus, autofocus control method, and autofocus control program
JP2005117369A (en) Moving image recorder, moving image reproducer and digital camera
JP2008085582A (en) System for controlling image, image taking apparatus, image control server and method for controlling image
JP2007226606A (en) Imaging apparatus, image output method, reproduction apparatus, program, and storage medium
JP2005184485A (en) Imaging apparatus, operation control method for the same, and program
JP2004208276A (en) Imaging device
JP5023932B2 (en) Imaging apparatus, image capturing method by scenario, and program
JP2007174278A (en) Image display device, and image displaying method
JP4295540B2 (en) Audio recording method and apparatus, digital camera, and image reproduction method and apparatus
JP2007266661A (en) Imaging apparatus, information processor, and imaging display system
JP2003333470A (en) Data management method for digital camera
KR101156683B1 (en) Composite imaging method for digital image processing device
JP6249771B2 (en) Image processing apparatus, image processing method, and program
JP4485455B2 (en) Karaoke system, music setting method and photographing apparatus
JP2006094200A (en) Imaging apparatus, focusing display method, and program
JP2005278059A (en) Image pickup device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060518

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20061212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080513

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081104

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090310