JP2001298688A - Digital camera device - Google Patents

Digital camera device

Info

Publication number
JP2001298688A
JP2001298688A JP2000111046A JP2000111046A JP2001298688A JP 2001298688 A JP2001298688 A JP 2001298688A JP 2000111046 A JP2000111046 A JP 2000111046A JP 2000111046 A JP2000111046 A JP 2000111046A JP 2001298688 A JP2001298688 A JP 2001298688A
Authority
JP
Japan
Prior art keywords
image file
image
information
camera device
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000111046A
Other languages
Japanese (ja)
Inventor
Hiroyuki Nagai
広行 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2000111046A priority Critical patent/JP2001298688A/en
Publication of JP2001298688A publication Critical patent/JP2001298688A/en
Pending legal-status Critical Current

Links

Landscapes

  • Studio Devices (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

PROBLEM TO BE SOLVED: To clearly and stably take out a voice comment which is added to a still image. SOLUTION: An image file recorded in an external recording medium 16 is stored in a memory 11 through an interface circuit 15. The image file stored in the memory 11 is supplied to a liquid crystal panel 13 through a display circuit 12 so that the image file recorded in the external recording medium 16 is displayed in the liquid crystal panel 13. Besides, voice information, for example, is provided in the image file which is recorded in the external recording medium 16. When voice information is comprised in the image file recorded in the medium 16, the voice information is extracted by a voice processing circuit 5 and converted into an analog voice signal. The converted analog voice signal is discharged from a speaker 7 through an amplifier 6. Then voice information is reproduced, which is provided in the image file which is recorded in the external recording medium 16.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、例えば静止画像の
記録再生に使用して好適なデジタルカメラ装置に関す
る。詳しくは、静止画像に音声情報を付加することによ
って良好な静止画像の再生が行われるようにするもので
ある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a digital camera device suitable for use, for example, for recording and reproducing a still image. More specifically, a good still image is reproduced by adding audio information to the still image.

【0002】[0002]

【従来の技術】例えばデジタルカメラ装置においては、
記録再生される画像ファイルの中に画像以外の情報を合
わせて記録することが可能である。そこで例えば静止画
像に音声情報を付加することで、例えば撮影場所や撮影
日時、被写体の名称などの撮影環境の情報を静止画像の
再生に合わせて音声コメントとして出力することが考え
られている。これによれば、静止画像の再生に合わせて
これらの情報が音声で出力されることで、再生される静
止画像への関心を増加させて、良好な静止画像の再生を
行うことができるものである。
2. Description of the Related Art For example, in a digital camera device,
It is possible to record information other than the image together in the image file to be recorded and reproduced. Therefore, for example, by adding audio information to a still image, it has been considered to output information of an imaging environment such as an imaging location, an imaging date and time, and a subject name as an audio comment in accordance with the reproduction of the still image. According to this, by outputting these pieces of information in audio along with the reproduction of the still image, it is possible to increase interest in the reproduced still image and perform good reproduction of the still image. is there.

【0003】そこでこのような画像情報に音声情報を付
加する方法としては、例えばMPEG(Moving
Picture coding Experts Gr
oup)方式のような動画像ファイルフォーマットを用
いることが考えられる。しかしながらこのMPEG方式
は元々動画像の記録再生用に考えられたものであり、ソ
フトウェア及びハードウェアの構成が大きなものであっ
て、例えば静止画像の記録再生が基本に考えられている
ようなデジタルカメラ装置には容易に採用できるもので
はない。
A method of adding audio information to such image information is, for example, an MPEG (Moving) method.
Picture coding Experts Gr
It is conceivable to use a moving image file format such as the (up) method. However, the MPEG system was originally conceived for recording and reproducing moving images, and has a large software and hardware configuration. For example, a digital camera which is basically considered to record and reproduce still images is used. It cannot be easily adopted in the device.

【0004】また、例えばMPEG方式で画像情報と共
に音声情報を記録するには、画像情報の撮影と同時に音
声情報を記録することになるが、その場合には周囲の雑
音等が混入する可能性があり、音声が不明瞭で聞き取り
難くなったり、音量が不安定になるなどの恐れがある。
これに対して上述の撮影環境等の情報を出力する場合に
は、音声は聞き取りやすく安定したものであることが望
ましい。
In addition, for example, in order to record audio information together with image information by the MPEG system, audio information is recorded at the same time as image information is photographed. In this case, there is a possibility that ambient noise and the like may be mixed. There is a possibility that the voice is indistinct and difficult to hear, and the volume becomes unstable.
On the other hand, when outputting information such as the above-described photographing environment, it is desirable that the sound be easy to hear and stable.

【0005】[0005]

【発明が解決しようとする課題】この出願はこのような
点に鑑みて成されたものであって、解決しようとする問
題点は、静止画像に音声コメントを付加しようとする場
合に、従来の装置で用いられている動画像ファイルフォ
ーマットでは、ソフトウェア及びハードウェアの構成が
大きくなり、また音声が不明瞭になったり音量が不安定
になるなどの恐れがあって、例えば静止画像の記録再生
が基本に考えられているようなデジタルカメラ装置には
容易に採用することができなかったというものである。
SUMMARY OF THE INVENTION The present invention has been made in view of the above points, and the problem to be solved is that when an audio comment is to be added to a still image, a conventional method is used. In the moving image file format used in the device, the software and hardware configuration becomes large, and there is a risk that the sound becomes unclear or the volume becomes unstable. It cannot be easily adopted in a digital camera device which is basically considered.

【0006】[0006]

【課題を解決するための手段】このため本発明において
は、デジタル化された画像情報と共に50音表に従った
音声情報を所定位置に設けた画像ファイルを形成し、こ
の画像ファイル内の音声情報を抽出して音声信号を合成
するようにしたものであって、これによれば、静止画像
に付加された撮影環境等の音声コメントを、簡単な構成
で明瞭且つ安定に取り出すことができる。
Therefore, according to the present invention, an image file in which audio information according to a Japanese syllabary is provided at a predetermined position together with digitized image information, and the audio information in this image file is formed. Is extracted to synthesize an audio signal. According to this, an audio comment such as a shooting environment added to a still image can be clearly and stably extracted with a simple configuration.

【0007】[0007]

【発明の実施の形態】すなわち本発明は、静止画像を撮
影しその画像情報をデジタル化して画像ファイルを形成
すると共に画像ファイルを復元して表示する表示機能が
設けられたデジタルカメラ装置であって、デジタル化さ
れた画像情報と共に50音表に従った音声情報が所定位
置に設けられた画像ファイルが供給され、画像ファイル
内の音声情報を抽出して音声信号を合成する音声合成機
能と、合成された音声信号を出力する出力手段とが設け
られてなるものである。
DESCRIPTION OF THE PREFERRED EMBODIMENTS The present invention relates to a digital camera device provided with a display function for taking a still image, digitizing the image information to form an image file, and restoring and displaying the image file. A voice synthesizing function of synthesizing an audio signal by extracting an audio file in which audio information in accordance with a syllabary table is provided at a predetermined position together with digitized image information and extracting audio information in the image file; And output means for outputting the generated audio signal.

【0008】以下、図面を参照して本発明を説明する
に、図1は本発明を適用したデジタルカメラ装置の一実
施形態の回路構成を示すブロック図である。なお以下の
説明では、例えばMPEG方式を用いて動画像の記録も
行うことのできる実施形態について説明するが、本発明
において動画像の記録は必須ではない。
Hereinafter, the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a circuit configuration of an embodiment of a digital camera device to which the present invention is applied. In the following description, an embodiment in which a moving image can be recorded by using, for example, the MPEG method will be described. However, recording of a moving image is not essential in the present invention.

【0009】図1において、デジタルカメラ装置の外側
に面して撮影部を形成するレンズ1が設けられ、このレ
ンズ1の内側に設けられる撮像素子(CCD)2にて、
例えば静止画像の撮影が行われる。この撮像素子2で撮
影された画像信号が画像処理回路3に供給されて画像フ
ァイルの生成が行われる。また、デジタルカメラ装置の
外側に面してマイクロフォン4が設けられる。そして例
えばMPEG方式での撮影の際にこのマイクロフォン4
で収音された音声信号が音声処理回路5に供給されて音
声情報の生成が行われる。
In FIG. 1, there is provided a lens 1 which faces the outside of a digital camera device and forms a photographing unit. An image pickup device (CCD) 2 provided inside the lens 1
For example, a still image is captured. An image signal captured by the image sensor 2 is supplied to an image processing circuit 3 to generate an image file. Further, a microphone 4 is provided facing the outside of the digital camera device. For example, when shooting in the MPEG system, this microphone 4
Is supplied to the audio processing circuit 5 to generate audio information.

【0010】さらにこの音声処理回路5は、例えば音声
情報をアナログ音声信号に変換する機能も有している。
そしてこの音声処理回路5で変換されたアナログ音声信
号がアンプ6で増幅されて、例えばデジタルカメラ装置
の外側に面して設けられたスピーカ7から放音される。
また電源回路8には、例えばデジタルカメラ装置の外側
から着脱可能に設けられるバッテリーパック9で発生さ
れる入力電圧が供給され、この入力電圧からデジタルカ
メラ装置の内部回路を駆動するための安定化電圧電力が
形成される。
Further, the audio processing circuit 5 has a function of converting, for example, audio information into an analog audio signal.
Then, the analog audio signal converted by the audio processing circuit 5 is amplified by the amplifier 6 and emitted from a speaker 7 provided on the outside of the digital camera device, for example.
The power supply circuit 8 is supplied with an input voltage generated by, for example, a battery pack 9 which is detachably provided from the outside of the digital camera device. A stabilizing voltage for driving an internal circuit of the digital camera device is supplied from the input voltage. Power is formed.

【0011】また、デジタルカメラ装置の外側に面して
操作キー群10が設けられる。そしてこの操作キー群1
0の操作に応答して、例えば画像処理回路3で生成され
た画像ファイルがメモリ11に記憶される。さらにこの
メモリ11に記憶された画像ファイルが表示回路12を
通じて液晶パネル13に供給される。これによって、例
えば撮像素子2で撮影された静止画像が液晶パネル13
に表示される。なおこのような操作キー群10の操作に
対する応答等の制御は、例えばマイクロコンピュータ1
4に設けられるプログラムに従って行われる。
An operation key group 10 is provided facing the outside of the digital camera device. And this operation key group 1
In response to the operation of “0”, for example, an image file generated by the image processing circuit 3 is stored in the memory 11. Further, the image file stored in the memory 11 is supplied to the liquid crystal panel 13 through the display circuit 12. As a result, for example, a still image captured by the
Will be displayed. The control of the response to the operation of the operation key group 10 is performed by, for example, the microcomputer 1.
4 is carried out in accordance with the program provided.

【0012】さらにメモリ11に記憶された画像ファイ
ルが、インターフェース回路15を通じて、例えばデジ
タルカメラ装置の外側から着脱可能に設けられる外部記
録媒体16に記録される。これによって、例えば撮像素
子2で撮影された静止画像が液晶パネル13に表示さ
れ、その静止画像が所望のものであったときに、さらに
操作キー群10を操作することによってその静止画像の
画像ファイルを、インターフェース回路15を通じて外
部記録媒体16に記録させることができる。このように
して画像ファイルの外部記録媒体16への記録が行われ
る。
Further, the image file stored in the memory 11 is recorded via an interface circuit 15 on an external recording medium 16 which is detachably provided, for example, from outside the digital camera device. As a result, for example, a still image captured by the image sensor 2 is displayed on the liquid crystal panel 13, and when the still image is a desired one, the image file of the still image is further operated by operating the operation key group 10. Can be recorded on the external recording medium 16 through the interface circuit 15. Thus, the image file is recorded on the external recording medium 16.

【0013】またこの外部記録媒体16に記録された画
像ファイルは、インターフェース回路15を通じてメモ
リ11に記憶させることもできる。そしてこのメモリ1
1に記憶された画像ファイルが表示回路12を通じて液
晶パネル13に供給されることによって、外部記録媒体
16に記録された画像ファイルを液晶パネル13に表示
することができる。またメモリ11に記憶された画像フ
ァイルが、インターフェース回路15を通じて、例えば
NTSC方式の映像信号の出力端子17に取り出され
る。
The image file recorded on the external recording medium 16 can be stored in the memory 11 through the interface circuit 15. And this memory 1
By supplying the image file stored in 1 to the liquid crystal panel 13 through the display circuit 12, the image file recorded in the external recording medium 16 can be displayed on the liquid crystal panel 13. Further, the image file stored in the memory 11 is taken out through the interface circuit 15 to, for example, an output terminal 17 of an NTSC video signal.

【0014】さらに外部記録媒体16に記録される画像
ファイルには、例えば音声情報を設けることができる。
そこで外部記録媒体16に記録された画像ファイルに音
声情報が含まれていた場合には、この音声情報が音声処
理回路5で抽出されてアナログ音声信号に変換される。
そして変換されたアナログ音声信号がアンプ6を通じて
スピーカ7から放音されると共に、インターフェース回
路15を通じて音声信号の出力端子18に取り出され
る。これによって、外部記録媒体16に記録される画像
ファイルに設けられる音声情報を再生することができ
る。
Further, for example, audio information can be provided in the image file recorded on the external recording medium 16.
Therefore, when audio information is included in the image file recorded on the external recording medium 16, the audio information is extracted by the audio processing circuit 5 and converted into an analog audio signal.
Then, the converted analog audio signal is emitted from the speaker 7 through the amplifier 6 and is taken out to the audio signal output terminal 18 through the interface circuit 15. Thus, the audio information provided in the image file recorded on the external recording medium 16 can be reproduced.

【0015】なお、図2には本発明を適用したデジタル
カメラ装置の一実施形態の外観の構成を示す。すなわち
図2のAは、デジタルカメラ装置の前面及び底面を示し
たものであって、前面にはレンズ1とマイクロフォン4
が外側に面して設けられ、底面にはバッテリーパック9
を着脱可能にするための開閉部が設けられる。また図2
のBは、デジタルカメラ装置の背面、上面及び側面を示
したものであって、背面には液晶パネル13とスピーカ
7が外側に面して設けられる。さらに上面には操作キー
群10と、側面には出力端子17及び18が設けられ
る。
FIG. 2 shows an external configuration of an embodiment of a digital camera device to which the present invention is applied. That is, FIG. 2A shows the front and bottom surfaces of the digital camera device.
Is provided facing the outside, and the battery pack 9 is provided on the bottom.
There is provided an opening / closing unit for making the unit detachable. FIG. 2
B shows the back, top, and side surfaces of the digital camera device, and the liquid crystal panel 13 and the speaker 7 are provided on the back surface facing outward. Further, an operation key group 10 is provided on the upper surface, and output terminals 17 and 18 are provided on the side surface.

【0016】そしてこのデジタルカメラ装置において、
底面には図2のBに示すように外部記録媒体16を着脱
可能にするための開閉部が設けられ、この外部記録媒体
16に撮像素子2で撮影された静止画像の画像ファイル
の記録が行われる。またこの外部記録媒体16に記録さ
れた画像ファイルが再生されて液晶パネル13に表示さ
れる。そしてこれらの外部記録媒体16への画像ファイ
ルの記録、及び外部記録媒体16からの画像ファイルの
再生の制御が、デジタルカメラ装置の上面に設けられる
操作キー群10によって行われる。
In this digital camera device,
As shown in FIG. 2B, an opening / closing unit for detachably attaching the external recording medium 16 is provided on the bottom surface, and an image file of a still image captured by the image sensor 2 is recorded on the external recording medium 16. Will be The image file recorded on the external recording medium 16 is reproduced and displayed on the liquid crystal panel 13. The recording of the image file on the external recording medium 16 and the control of the reproduction of the image file from the external recording medium 16 are controlled by an operation key group 10 provided on the upper surface of the digital camera device.

【0017】すなわちデジタルカメラ装置の上面に設け
られる操作キー群10には、例えば図3に示すように電
源のオンオフを制御する電源キー10a、再生(PLA
Y)と静止画像撮影(STILL)と動画像撮影(MO
VIE)の切替えを行う切替キー10b、シャッターキ
ー10cが設けられる。また再生画像の順送りを行うF
Wキー10d、再生画像の逆送りを行うRVキー10e
が設けられる。さらに音声コメントの出力を制御するコ
メントキー10fが設けられる。そしてこれらの操作キ
ー群10を用いて上述した画像ファイルの記録再生が行
われる。
That is, the operation key group 10 provided on the upper surface of the digital camera device includes, for example, a power key 10a for controlling power on / off as shown in FIG.
Y), still image shooting (STILL), and moving image shooting (MO
VIE) is provided with a switching key 10b and a shutter key 10c. Also, F for performing the sequential advance of the reproduced image
W key 10d, RV key 10e for reverse playback of the reproduced image
Is provided. Further, a comment key 10f for controlling output of a voice comment is provided. The recording and reproduction of the image file described above is performed using the operation key group 10.

【0018】さらにこれらの操作キー群10の操作によ
って外部記録媒体16に記録された画像ファイルに対し
て、例えば任意のパーソナルコンピュータ(図示せず)
を用いて音声情報の書き込みが行われる。すなわちこの
音声情報は、例えば図4に示すような50音表に従っ
て、音声コメントを例えば「フジサンヲハイケイニシテ
サツエイシマシタ」としたい場合には、“1C 35
0B 2E 2D 1A02 09 16 0C 13
0B 12 04 02 0C 1F 0C10 F
F”の16進値データが形成される。
Further, an image file recorded on the external recording medium 16 by the operation of the operation key group 10 is transmitted to, for example, an arbitrary personal computer (not shown).
Is used to write audio information. That is, the voice information is, for example, in accordance with the Japanese syllabary as shown in FIG.
0B 2E 2D 1A02 09 16 0C 13
0B 12 04 02 0C 1F 0C10 F
The hexadecimal value data of F ″ is formed.

【0019】また、この音声コメントでは、例えば1番
目の「フ」、6番目の「ハ」、14〜16番目の「ツエ
イ」、18番目の「マ」、20番目の「タ」の音声にア
クセントを置くと音質を向上させることができる。そこ
でこれらの音声にアクセントを置くための識別として、
例えば16進値の最上位ビットに“1”を加えることに
よって、“9C 35 0B 2E 2D 9A 02
09 16 0C13 0B 92 84 82 0
C 9F 0C 90 FF”の16進値データに変換
される。
In this voice comment, for example, the voices of the first "F", the sixth "C", the 14th to 16th "Tweet", the 18th "MA", and the 20th "TA" are output. Placing accents can improve sound quality. So as an identification to put accents on these sounds,
For example, by adding “1” to the most significant bit of the hexadecimal value, “9C 350 B 2E 2D 9A 02
09 16 0C13 0B 92 84 82 0
It is converted to hexadecimal value data of C 9F 0C 90 FF ".

【0020】一方、外部記録媒体16に記録された画像
ファイルが例えばExifファイル形式の場合には、そ
のファイルフォーマットは例えば図5に示すようになっ
ている。
On the other hand, when the image file recorded on the external recording medium 16 is, for example, in the Exif file format, the file format is as shown in FIG. 5, for example.

【0021】ここでアドレス“00〜15”はExif
ファイルの開始を示す。アドレス“16〜21”はMa
keTagを示す。アドレス“22〜2D”はMode
lTagを示す。アドレス“2E〜39”はOrien
tationTagを示す。アドレス“3A〜46”は
XResolutionTagを示す。アドレス“47
〜52”はYResolutionTagを示す。アド
レス“53〜60”はResolutionUnitT
agを示す。アドレス“6A〜75”はDateTim
eTagを示す。
Here, the addresses "00 to 15" correspond to Exif
Indicates the start of the file. Address "16-21" is Ma
Indicates keTag. Address "22 to 2D" is Mode
Indicates lTag. Address "2E-39" is Orien
Indicates the TationTag. The addresses “3A to 46” indicate the XResolutionTag. Address “47
"52" indicates the YResolutionTag. Address "53-60" indicates the ResolutionUnitT.
ag. Address “6A-75” is DateTime
Indicates eTag.

【0022】またアドレス“76〜81”はYCbCr
PositioningTagを示す。アドレス“82
〜8D”はExifIFDPointerTagを示
す。アドレス“8E〜91”はNextOffsetT
agを示す。アドレス“92〜97”はMakeを示
す。アドレス“98〜A5”はModelを示す。アド
レス“A6〜AD”はXResolutionを示す。
アドレス“AE〜B5”はYResolutionを示
す。アドレス“B6〜C9”は日付であって、この例で
は2000年1月1日を示す。
Addresses "76 to 81" are YCbCr
Indicates PositioningTag. Address "82
88D ”indicates the ExifIFDPointerTag. The address“ 8E〜91 ”indicates the NextOffsetT.
ag. Addresses “92 to 97” indicate Make. Address “98 to A5” indicates Model. The address “A6 to AD” indicates the XResolution.
Addresses “AE to B5” indicate YResolution. The addresses "B6 to C9" are dates, and indicate January 1, 2000 in this example.

【0023】そして通常のフォーマットでは、アドレス
“CA〜F3”には最初にノーマルソフト(NORMA
LSOFT)であることを示す“4E 4F 52 4
D41 4C 53 4F 46 54 30”のデー
タが設けられて、以下のデータは“00”とされる。さ
らにアドレス“F4”以降にExifのファイルデータ
(ExifFD)が設けられる。このようにして例えば
Exifファイル形式の通常の画像ファイルが形成され
る。なお、以上のフォーマットはExifファイル形式
として周知のものである。
In the normal format, addresses "CA to F3" are first set to normal software (NORMA).
LSOFT) "4E 4F 52 4"
D41 4C 53 4F 46 54 30 ”is provided and the following data is set to“ 00. ”Further, Exif file data (ExifFD) is provided after address“ F4. ”In this way, for example, Exif A normal image file in a file format is formed, and the above-mentioned format is known as an Exif file format.

【0024】これに対して音声情報の書き込みを行う場
合には、例えば図6に示すように上述のアドレス“CA
〜F3”の最初に、サウンドソフト(SOUNDSOF
T)であることを示す例えば“53 4F 55 4E
44 53 4F 4654 3A”が設けられる。
そしてこれに続いて上述の音声コメントの“9C35
0B 2E 2D 9A 02 09 16 0C 1
3 0B 9284 82 0C 9F 0C 90
FF”の16進値データが設けられて、以下のデータは
“00”とされる。
On the other hand, when writing audio information, for example, as shown in FIG.
~ F3 ", sound software (SOUNDSOF
T), for example, "53 4F 55 4E
44 53 4F 4654 3A "are provided.
Then, following this, the above-mentioned voice comment “9C35
0B 2E 2D 9A 02 09 16 0C 1
3 0B 9284 82 0C 9F 0C 90
The hexadecimal value data of "FF" is provided, and the following data is set to "00".

【0025】このようにして、例えばExifファイル
形式の画像ファイルの中に音声コメントを形成する音声
情報の書き込みが行われる。そしてさらにこの音声情報
の再生を行う場合には、上述の音声処理回路5で音声情
報をアナログ音声信号に変換する機能として、例えば図
7に示すような構成が設けられる。
In this way, for example, audio information for forming an audio comment is written into an image file in the Exif file format. When the audio information is further reproduced, a configuration as shown in FIG. 7 is provided as a function of converting the audio information into an analog audio signal in the audio processing circuit 5 described above.

【0026】すなわち音声には母音のように声帯の振動
を伴う有声音と、子音のように声帯の振動を伴わない無
声音がある。そこで有声音を発声させる時の音源として
音源パルス発生器71から出力されるパルスデータを使
用し、無声音を発声させる時にはノイズ発生器72から
出力されるノイズデータを使用する。また、口、舌など
の声道に相当するのがフィルタ75である。そして声道
の変化はフィルタ係数の変更に置き換えることができ、
この係数を変更することによって50音及びアクセント
有無を各々任意に音声出力することが可能となる。
That is, voices include voiced sounds with vocal cord vibrations such as vowels and unvoiced sounds without vocal cord vibrations such as consonants. Therefore, the pulse data output from the sound source pulse generator 71 is used as a sound source for generating a voiced sound, and the noise data output from the noise generator 72 is used for generating an unvoiced sound. The filter 75 corresponds to a vocal tract such as a mouth and a tongue. And changes in the vocal tract can be replaced by changes in filter coefficients,
By changing this coefficient, it is possible to arbitrarily output the 50 sounds and the presence or absence of accent.

【0027】そこで上述の音源パルス発生器71からの
パルスデータと、ノイズ発生器72からのノイズデータ
とがスイッチ73に供給され、このスイッチ73が上述
の画像ファイルから抽出される音声情報の有声音と無声
音を表すデジタルデータに従って切り換えられる。さら
にこのスイッチ73で切り換えられた信号が、増幅器7
4を通じてフィルタ75に供給され、このフィルタ75
の係数が、上述の画像ファイルから抽出される音声情報
の50音及びアクセント有無のデジタルデータに従って
変更される。
The pulse data from the sound source pulse generator 71 and the noise data from the noise generator 72 are supplied to a switch 73, and the switch 73 switches the voiced sound of the audio information extracted from the image file. And digital data representing an unvoiced sound. Further, the signal switched by the switch 73 is supplied to the amplifier 7.
4 to the filter 75, and this filter 75
Are changed according to the digital data of the 50 sounds and the presence or absence of accents of the audio information extracted from the image file.

【0028】このようにして、有声音、無声音で構成さ
れる50音及びアクセント有無の発声を可能にする音声
信号のD/A変換を実現することができる。そしてこの
ような音声処理機能が音声処理回路5に設けられること
により、形成されたアナログ音声信号が上述のアンプ6
を通じてスピーカ7から放音されると共に、インターフ
ェース回路15を通じて音声信号の出力端子18に取り
出される。これによって、外部記録媒体16に記録され
る画像ファイルに設けられる音声情報の再生を行うこと
ができる。
In this way, it is possible to realize D / A conversion of an audio signal which enables utterance of 50 tones composed of voiced sounds and unvoiced sounds and the presence or absence of accents. When such an audio processing function is provided in the audio processing circuit 5, the formed analog audio signal is transmitted to the amplifier 6 described above.
The audio signal is output from the speaker 7 through the interface circuit 15 and is output to the audio signal output terminal 18 through the interface circuit 15. As a result, audio information provided in the image file recorded on the external recording medium 16 can be reproduced.

【0029】従ってこの実施形態において、デジタル化
された画像情報と共に50音表に従った音声情報を所定
位置に設けた画像ファイルを形成し、この画像ファイル
内の音声情報を抽出して音声信号を合成することによっ
て、静止画像に付加された撮影環境等の音声コメント
を、簡単な構成で明瞭且つ安定に取り出すことができる
ものである。
Therefore, in this embodiment, an image file in which audio information according to the Japanese syllabary is provided at a predetermined position together with the digitized image information is formed, and the audio information in this image file is extracted to generate an audio signal. By synthesizing, a voice comment such as a shooting environment added to a still image can be clearly and stably extracted with a simple configuration.

【0030】これによって、静止画像に音声コメントを
付加しようとする場合に、従来の装置で用いられている
動画像ファイルフォーマットでは、ソフトウェア及びハ
ードウェアの構成が大きくなり、また音声が不明瞭にな
ったり音量が不安定になるなどの恐れがあって、例えば
静止画像の記録再生が基本に考えられているようなデジ
タルカメラ装置には容易に採用することができなかたも
のを、本発明によればこれらの問題点を容易に解消する
ことができるものである。
As a result, when an audio comment is to be added to a still image, the configuration of software and hardware becomes large and the sound becomes unclear in the moving image file format used in the conventional apparatus. According to the present invention, there is a possibility that the digital camera device that can be easily adopted in a digital camera device, for example, in which recording and reproduction of a still image is basically considered, because These problems can be easily solved.

【0031】なお上述の実施形態において、画像ファイ
ルの形式はExifファイル形式に限らず、例えばJP
EG(Joint Photographic Ima
gecoding Experts Group)方式
においても、そのヘッダー部のアプリケーション領域等
に使用ソフトウェア名または音声情報を記録することが
できる。あるいはその他の画像ファイル形式を用いて上
述の音声情報の記録を行うこともできる。そしてこれら
の記録された音声情報を上述の装置において再生するこ
とができる。
In the above-described embodiment, the format of the image file is not limited to the Exif file format.
EG (Joint Photographic Ima)
Also, in the coding expert group method, a software name or audio information to be used can be recorded in an application area or the like of the header portion. Alternatively, the above-described audio information can be recorded using another image file format. The recorded audio information can be reproduced by the above-described device.

【0032】また上述の実施形態においては、操作キー
群10の中にコメントキー10fが設けられているの
で、例えば音声コメントが不要のときや放音が禁止され
ているときには音声コメントの再生を停止することがで
きる。
In the above-described embodiment, since the comment key 10f is provided in the operation key group 10, the reproduction of the voice comment is stopped when the voice comment is unnecessary or when the sound emission is prohibited. can do.

【0033】さらに上述の実施形態において、画像ファ
イルの中でアドレス“CA〜F3”の最初に設けられる
サウンドソフト(SOUNDSOFT)であることを示
すデータを判別して、音声情報が記録されていることを
示す表示を行うようにしてもよい。こうすることによ
り、例えばノーマルソフトの再生のときに音声情報が再
生されないことによって生じる誤解等の恐れを解消する
ことができる。
Further, in the above-mentioned embodiment, data indicating sound software (SOUNDSOFT) provided at the beginning of the address "CA to F3" in the image file is determined, and audio information is recorded. May be displayed. By doing so, it is possible to eliminate the possibility of misunderstanding or the like caused by the fact that audio information is not reproduced when normal software is reproduced.

【0034】また上述の実施形態において、例えばMP
EG方式を用いて動画像の記録再生も行うことができる
場合には、音声コメントの再生のためのアンプ6やスピ
ーカ7等は、動画像に伴う音声信号の再生に兼用するこ
とができ、回路構成を簡略化することができる。
In the above embodiment, for example, MP
When a moving image can be recorded and reproduced by using the EG method, the amplifier 6 and the speaker 7 for reproducing the audio comment can also be used for reproducing the audio signal accompanying the moving image. The configuration can be simplified.

【0035】こうして上述のデジタルカメラ装置によれ
ば、静止画像を撮影しその画像情報をデジタル化して画
像ファイルを形成すると共に画像ファイルを復元して表
示する表示機能が設けられ、デジタル化された画像情報
と共に50音表に従った音声情報が所定位置に設けられ
た画像ファイルが供給され、画像ファイル内の音声情報
を抽出して音声信号を合成する音声合成機能と、合成さ
れた音声信号を出力する出力手段とが設けられることに
より、静止画像に付加された撮影環境等の音声コメント
を、簡単な構成で明瞭且つ安定に取り出すことができる
ものである。
As described above, according to the digital camera device described above, a display function is provided for photographing a still image, digitizing the image information to form an image file, and restoring and displaying the image file. An image file in which audio information according to the Japanese syllabary is provided at a predetermined position along with the information is supplied. By providing the output means, a voice comment such as a shooting environment added to the still image can be clearly and stably taken out with a simple configuration.

【0036】なお本発明は、上述の説明した実施の形態
に限定されるものではなく、本発明の精神を逸脱するこ
となく種々の変形が可能とされるものである。
The present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the spirit of the present invention.

【0037】[0037]

【発明の効果】従って請求項1の発明によれば、デジタ
ル化された画像情報と共に50音表に従った音声情報を
所定位置に設けた画像ファイルを形成し、この画像ファ
イル内の音声情報を抽出して音声信号を合成することに
よって、静止画像に付加された撮影環境等の音声コメン
トを、簡単な構成で明瞭且つ安定に取り出すことができ
るものである。
Thus, according to the first aspect of the present invention, an image file in which audio information according to the Japanese syllabary is provided at a predetermined position together with digitized image information is formed. By extracting and synthesizing the audio signal, an audio comment such as a shooting environment added to the still image can be clearly and stably extracted with a simple configuration.

【0038】また、請求項2の発明によれば、音声情報
にはアクセントに係わる情報が付加され、音声合成機能
ではアクセントに係わる情報を用いて音声信号の合成が
行われることによって、再生される音声信号音質を向上
させることができるものである。
According to the second aspect of the present invention, information relating to an accent is added to the audio information, and the audio synthesizing function is reproduced by synthesizing the audio signal using the information relating to the accent. The sound quality of the audio signal can be improved.

【0039】さらに請求項3の発明によれば、合成され
た音声信号を出力するか否かを選択する選択手段が設け
られることによって、例えば音声コメントが不要のとき
には音声コメントの再生を停止することができるもので
ある。
Further, according to the third aspect of the present invention, the selection means for selecting whether or not to output the synthesized voice signal is provided. For example, when the voice comment is unnecessary, the reproduction of the voice comment is stopped. Can be done.

【0040】また、請求項4の発明によれば、画像ファ
イル内の音声情報の有無を表示する表示手段が設けられ
ることによって、例えばノーマルソフトの再生のときに
音声情報の無いことによって誤解等が生じる恐れを解消
することができるものである。
According to the fourth aspect of the present invention, the display means for displaying the presence or absence of the audio information in the image file is provided. This can eliminate the fear of occurrence.

【0041】また、請求項5の発明によれば、動画像の
再生機能が設けられ、動画像に付随する音声信号の出力
手段と合成された音声信号の出力手段とが兼用されるこ
とによって、回路構成を簡略化することができるもので
ある。
According to the fifth aspect of the present invention, a function of reproducing a moving image is provided, and an output unit of an audio signal accompanying the moving image and an output unit of a combined audio signal are used. The circuit configuration can be simplified.

【0042】これによって、静止画像に音声コメントを
付加しようとする場合に、従来の装置で用いられている
動画像ファイルフォーマットでは、ソフトウェア及びハ
ードウェアの構成が大きくなり、また音声が不明瞭にな
ったり音量が不安定になるなどの恐れがあって、例えば
静止画像の記録再生が基本に考えられているようなデジ
タルカメラ装置には容易に採用することができなかたも
のを、本発明によればこれらの問題点を容易に解消する
ことができるものである。
As a result, when an audio comment is to be added to a still image, the configuration of software and hardware becomes large and the audio becomes unclear in the moving image file format used in the conventional apparatus. According to the present invention, there is a possibility that the digital camera device that can be easily adopted in a digital camera device, for example, in which recording and reproduction of a still image is basically considered, because These problems can be easily solved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明によるデジタルカメラ装置の一実施形態
を示すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a digital camera device according to the present invention.

【図2】本発明によるデジタルカメラ装置の一実施形態
の外観を示す構成図である。
FIG. 2 is a configuration diagram illustrating an appearance of a digital camera device according to an embodiment of the present invention.

【図3】その説明のための要部の構成図である。FIG. 3 is a configuration diagram of a main part for the explanation.

【図4】その説明のための50音表を示す線図である。FIG. 4 is a diagram showing a Japanese syllabary table for the explanation.

【図5】ノーマルソフトのファイルフォーマットを示す
線図である。
FIG. 5 is a diagram showing a file format of normal software.

【図6】サウンドソフトのファイルフォーマットを示す
線図である。
FIG. 6 is a diagram showing a file format of sound software.

【図7】音声情報をアナログ音声信号に変換する機能の
ブロック図である。
FIG. 7 is a block diagram of a function of converting audio information into an analog audio signal.

【符号の説明】 1…レンズ、2…撮像素子、3…画像処理回路、4…マ
イクロフォン、5…音声処理回路、6…アンプ、7…ス
ピーカ、8…電源回路、9…バッテリーパック、10…
操作キー群、11…メモリ、12…表示回路、13…液
晶パネル、14…マイクロコンピュータ、15…インタ
ーフェース回路、16…外部記録媒体、17…NTSC
方式の映像信号の出力端子、18…音声信号の出力端子
[Description of Signs] 1 ... Lens, 2 ... Image sensor, 3 ... Image processing circuit, 4 ... Microphone, 5 ... Sound processing circuit, 6 ... Amplifier, 7 ... Speaker, 8 ... Power supply circuit, 9 ... Battery pack, 10 ...
Operation key group, 11 memory, 12 display circuit, 13 liquid crystal panel, 14 microcomputer, 15 interface circuit, 16 external recording medium, 17 NTSC
Video signal output terminal, 18 ... Audio signal output terminal

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 5/225 G10L 3/00 Q 5/907 5/04 F 5/91 H04N 5/91 R // H04N 101:00 J Fターム(参考) 5C022 AA13 AB68 AC01 AC13 AC18 AC32 AC69 AC71 AC72 CA00 5C052 AA03 AA17 AB04 CC11 DD02 DD06 EE02 EE03 GA02 GA07 GB07 GC05 5C053 FA10 FA23 FA27 GB11 GB38 JA03 JA16 KA04 KA21 KA24 LA01 5D045 AA09 AB30 ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) H04N 5/225 G10L 3/00 Q 5/907 5/04 F 5/91 H04N 5/91 R // H04N 101: 00 JF term (reference) 5C022 AA13 AB68 AC01 AC13 AC18 AC32 AC69 AC71 AC72 CA00 5C052 AA03 AA17 AB04 CC11 DD02 DD06 EE02 EE03 GA02 GA07 GB07 GC05 5C053 FA10 FA23 FA27 GB11 GB38 JA03 JA16 KA04 KA21 A30 AB01 5A

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 静止画像を撮影しその画像情報をデジタ
ル化して画像ファイルを形成すると共に前記画像ファイ
ルを復元して表示する表示機能が設けられたデジタルカ
メラ装置であって、 前記デジタル化された画像情報と共に50音表に従った
音声情報が所定位置に設けられた前記画像ファイルが供
給され、 前記画像ファイル内の前記音声情報を抽出して音声信号
を合成する音声合成機能と、 前記合成された音声信号を出力する出力手段とが設けら
れたことを特徴とするデジタルカメラ装置。
1. A digital camera device provided with a display function of photographing a still image, digitizing the image information to form an image file, and restoring and displaying the image file, wherein the digitalized The image file in which audio information according to the Japanese syllabary is provided at a predetermined position together with the image information is supplied, a voice synthesizing function of extracting the audio information in the image file and synthesizing an audio signal, And an output means for outputting a sound signal.
【請求項2】 前記音声情報にはアクセントに係わる情
報が付加され、 前記音声合成機能では前記アクセントに係わる情報を用
いて前記音声信号の合成が行われることを特徴とする請
求項1記載のデジタルカメラ装置。
2. The digital signal according to claim 1, wherein information relating to an accent is added to said voice information, and said voice signal is synthesized using said information relating to said accent in said voice synthesizing function. Camera device.
【請求項3】 前記合成された音声信号を出力するか否
かを選択する選択手段が設けられることを特徴とする請
求項1記載のデジタルカメラ装置。
3. The digital camera device according to claim 1, further comprising a selection unit for selecting whether or not to output the synthesized audio signal.
【請求項4】 前記画像ファイル内の前記音声情報の有
無を表示する表示手段が設けられることを特徴とする請
求項1記載のデジタルカメラ装置。
4. The digital camera device according to claim 1, further comprising display means for displaying the presence or absence of said audio information in said image file.
【請求項5】 動画像の再生機能が設けられ、 前記動画像に付随する音声信号の出力手段と前記合成さ
れた音声信号の出力手段とが兼用されることを特徴とす
る請求項1記載のデジタルカメラ装置。
5. The apparatus according to claim 1, further comprising a function of reproducing a moving image, wherein an output unit for outputting an audio signal accompanying the moving image and an output unit for outputting the synthesized audio signal are used. Digital camera device.
JP2000111046A 2000-04-12 2000-04-12 Digital camera device Pending JP2001298688A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000111046A JP2001298688A (en) 2000-04-12 2000-04-12 Digital camera device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000111046A JP2001298688A (en) 2000-04-12 2000-04-12 Digital camera device

Publications (1)

Publication Number Publication Date
JP2001298688A true JP2001298688A (en) 2001-10-26

Family

ID=18623459

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000111046A Pending JP2001298688A (en) 2000-04-12 2000-04-12 Digital camera device

Country Status (1)

Country Link
JP (1) JP2001298688A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100450083B1 (en) * 2002-07-31 2004-09-30 삼성테크윈 주식회사 Method for managing data files within portable digital apparatus, utilizing representative voice
JP2008182712A (en) * 2007-01-25 2008-08-07 Hewlett-Packard Development Co Lp Applying visual effect to image data based on audio data

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100450083B1 (en) * 2002-07-31 2004-09-30 삼성테크윈 주식회사 Method for managing data files within portable digital apparatus, utilizing representative voice
JP2008182712A (en) * 2007-01-25 2008-08-07 Hewlett-Packard Development Co Lp Applying visual effect to image data based on audio data
US7924328B2 (en) 2007-01-25 2011-04-12 Hewlett-Packard Development Company, L.P. Applying visual effect to image data based on audio data

Similar Documents

Publication Publication Date Title
JPH09331502A (en) Information input device
JP2002057930A (en) Digital still camera and its operation control method
TW200305805A (en) Image recording device and method
JP2005520459A (en) Semiconductor chip used in a mobile phone having a text-to-speech conversion system, a method for aurally displaying a notification or text message from a mobile phone, and
JP2001298688A (en) Digital camera device
JP2005044004A (en) Medical image recording device
JP2005249880A (en) Digital picture book system by portable communication terminal
KR19990049718A (en) Digital camera capable of voice recording / playback
JP3743321B2 (en) Data editing method, information processing apparatus, server, data editing program, and recording medium
JP2005051567A (en) Electronic camera device, alarm report method therefor, and program
JP3452788B2 (en) Karaoke device that displays photographic film video on the background of lyrics
JP2007235432A (en) Image sound recorder and image sound recording control program
JP4013433B2 (en) Image reproducing apparatus and digital camera
JP2007267329A (en) Imaging apparatus and program
JP4294502B2 (en) Telephone terminal and image generation method
JP2005323008A (en) Mobile information terminal
JP2004343392A (en) Cellular telephone with minutes function and its minutes generation processing method
JP3852383B2 (en) Video playback device
JP5209510B2 (en) Audio display device and camera
JPH10257463A (en) Method, medium, device for recording electronic conference information, reproducing device, recording and reproducing device, and electronic conference system
JP2005079859A (en) Photographing device
JP5057135B2 (en) REPRODUCTION DEVICE AND REPRODUCTION METHOD, RECORDING DEVICE, RECORDING METHOD, AND PROGRAM
JP2017045017A (en) Singing moving image creation device and singing moving image creation system
JP2000125167A (en) Digital camera
KR20100010151A (en) Filming device having function of playing sound and method for controlling thereof