JPH09252453A - Digital still video camera - Google Patents

Digital still video camera

Info

Publication number
JPH09252453A
JPH09252453A JP8058140A JP5814096A JPH09252453A JP H09252453 A JPH09252453 A JP H09252453A JP 8058140 A JP8058140 A JP 8058140A JP 5814096 A JP5814096 A JP 5814096A JP H09252453 A JPH09252453 A JP H09252453A
Authority
JP
Japan
Prior art keywords
voice
digital still
video camera
voice input
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8058140A
Other languages
Japanese (ja)
Inventor
Kenji Shiraishi
賢二 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP8058140A priority Critical patent/JPH09252453A/en
Publication of JPH09252453A publication Critical patent/JPH09252453A/en
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a camera convenient for circulation and arrangement of a picked-up image or the like to attain electronic mail and facsimile communication. SOLUTION: Voice electric conversion means 111-113 convert a voice input into an electric signal, and a voice recognition means 116 recognizes the voice converted into the electric signal and outputs a character code corresponding to each word. Then the character code is converted into a character string by a code character conversion means 117 and the character string being the recognition result of the voice input is given to a character synthesis means 121, in which the character string is synthesized with an image picked up simultaneously with the voice input or having been already picked up and a data display means 122 displays the recognition result of the image and the voice input or the synthesis result between the image and the character string.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は,静止画,動画,音
声等を入力し,デジタルデータに変換してメモリカード
等の記憶媒体に記録するデジタルスチルビデオカメラに
係り,特に,撮影した画像に音声入力によるコメントを
入れることができ,撮影した画像の閲覧,整理等に便利
なデジタルスチルビデオカメラ,並びに,電子メール通
信,ファクシミリ通信が可能なデジタルスチルビデオカ
メラに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a digital still video camera for inputting still images, moving images, voices, etc., converting them into digital data and recording them in a storage medium such as a memory card, and more particularly to a captured image. The present invention relates to a digital still video camera in which comments can be entered by voice input, which is convenient for viewing and organizing captured images, and a digital still video camera capable of e-mail communication and facsimile communication.

【0002】[0002]

【従来の技術】一般に,デジタルスチルビデオカメラに
おいては,撮影した画像をデジタル画像データに変換し
て圧縮した後に,付属のメモリカード等に記憶させる場
合が多い。また近年では,当該メモリカードの大容量化
及び圧縮技術の進歩等により,1枚のメモリカードに記
録できる画像の枚数が増え,例えば,約500枚ほどの
画像を記憶できるメモリカードも出てきており,メモリ
カードの容量は今後更に増加することは容易に予想でき
る。
2. Description of the Related Art Generally, in a digital still video camera, a captured image is often stored in an attached memory card or the like after being converted into digital image data and compressed. In recent years, the number of images that can be recorded on one memory card has increased due to the increase in the capacity of the memory card and the progress of compression technology. For example, some memory cards can store about 500 images. Therefore, it is easy to predict that the capacity of memory cards will further increase in the future.

【0003】[0003]

【発明が解決しようとする課題】しかしながら,このよ
うなメモリカードに撮影画像を記憶して利用する上記従
来のデジタルスチルビデオカメラにおいては,メモリカ
ードに記録された画像の中から所望の画像を取り出した
い場合には,使用者は,メモリカードに記録されている
画像を1枚ずつ確認しながら見つけ出さなければならな
いという問題があった。
However, in the above-mentioned conventional digital still video camera in which photographed images are stored and used in such a memory card, a desired image is extracted from the images recorded in the memory card. There is a problem that the user must find out the images recorded on the memory card one by one, if desired.

【0004】メモリカードに記録されている画像が少な
ければ問題ないが,記録画像が多くなるにつれて,画像
を確認する作業は使用者の大変な負担となる。また上述
のように,今後メモリカードに記録可能な画像枚数が更
に増える傾向にあるため,使用者が所望の画像を見つけ
出す作業はより困難になっていくことが容易に予想され
る。
There is no problem if the number of images recorded on the memory card is small, but as the number of recorded images increases, the work of checking the images becomes a heavy burden on the user. Further, as described above, the number of images that can be recorded on the memory card tends to further increase in the future, so that it is easily expected that the user will find it more difficult to find a desired image.

【0005】本発明は,上記従来の問題点に鑑みてなさ
れたものであって,撮影した画像に音声入力によるコメ
ントを入れることができ,またメモリカード等の記憶媒
体に記録した画像の中から,所望の画像の画像を容易に
見つけ出すことができ,閲覧,整理等に便利なデジタル
スチルビデオカメラを提供することを目的としている。
The present invention has been made in view of the above-mentioned conventional problems, and it is possible to add a comment by voice input to a photographed image, and to select from among images recorded in a storage medium such as a memory card. The purpose of the present invention is to provide a digital still video camera in which a desired image can be easily found and which is convenient for viewing and organizing.

【0006】また本発明の他の目的は,デジタルスチル
ビデオカメラに通信端末としての機能を持たせ,電子メ
ール通信,ファクシミリ通信が可能なデジタルスチルビ
デオカメラを提供することである。
Another object of the present invention is to provide a digital still video camera capable of performing electronic mail communication and facsimile communication by allowing the digital still video camera to function as a communication terminal.

【0007】[0007]

【課題を解決するための手段】上記課題を解決するため
に,本発明の請求項1に係るデジタルスチルビデオカメ
ラは,音声入力を電気信号に変換する音声電気変換手段
と,電気信号に変換された音声を認識して各言葉に対応
した文字コードを出力する音声認識手段と,前記文字コ
ードを文字列に変換するコードキャラクタ変換手段と,
前記音声入力の認識結果である文字列を,該音声入力と
同時に撮影された画像または既に撮影されている画像と
合成する文字合成手段と,前記画像,前記音声入力の認
識結果または前記画像と文字列の合成結果を表示するデ
ータ表示手段とを備えるものである。
In order to solve the above-mentioned problems, a digital still video camera according to claim 1 of the present invention includes an audio-electrical conversion means for converting an audio input into an electric signal and an audio-electrical conversion means. A voice recognition means for recognizing the voice and outputting a character code corresponding to each word; a code character conversion means for converting the character code into a character string;
A character synthesizing means for synthesizing a character string which is the recognition result of the voice input with an image taken at the same time as the voice input or an image already taken; the image, the recognition result of the voice input or the image and the character And a data display means for displaying the result of combining the columns.

【0008】また,請求項2に係るデジタルスチルビデ
オカメラは,請求項1に記載のデジタルスチルビデオカ
メラにおいて,前記デジタルスチルビデオカメラは,前
記音声入力の認識結果を仮名漢字混じりの文字列のコー
ドに変換する仮名漢字変換手段を備えるものである。
The digital still video camera according to a second aspect of the present invention is the digital still video camera according to the first aspect, wherein the digital still video camera uses the recognition result of the voice input as a code of a character string mixed with kana and kanji. It is provided with a kana-kanji conversion means for converting to.

【0009】また,請求項3に係るデジタルスチルビデ
オカメラは,音声入力を電気信号に変換する音声電気変
換手段と,電気信号に変換された音声を認識して各言葉
に対応した文字コードを出力する音声認識手段と,前記
音声入力の認識結果を仮名漢字混じりの文字列のコード
に変換する仮名漢字変換手段と,前記音声入力の認識結
果を文字コードデータとして保存する記憶手段とを備え
るものである。
The digital still video camera according to a third aspect of the present invention recognizes voice-electric conversion means for converting a voice input into an electric signal and recognizes the voice converted into the electric signal and outputs a character code corresponding to each word. And a kana-kanji conversion means for converting the recognition result of the voice input into a code of a character string containing kana-kanji, and a storage means for storing the recognition result of the voice input as character code data. is there.

【0010】また,請求項4に係るデジタルスチルビデ
オカメラは,音声入力を電気信号に変換する音声電気変
換手段と,電気信号に変換された音声を認識して各言葉
に対応した文字コードを出力する音声認識手段と,電子
メール通信に必要なヘッダー情報の付加,通信動作等を
制御する通信制御手段とを備え,前記音声入力の認識結
果または前記文字コードを電子メールで通信するもので
ある。
Further, the digital still video camera according to a fourth aspect of the present invention recognizes the voice / electric conversion means for converting a voice input into an electric signal and the voice converted into the electric signal and outputs a character code corresponding to each word. The voice recognition means and the communication control means for controlling header information necessary for electronic mail communication and communication operation are provided, and the recognition result of the voice input or the character code is communicated by electronic mail.

【0011】また,請求項5に係るデジタルスチルビデ
オカメラは,請求項4に記載のデジタルスチルビデオカ
メラにおいて,前記デジタルスチルビデオカメラは,前
記音声入力の認識結果を仮名漢字混じりの文字列のコー
ドに変換する仮名漢字変換手段を備えるものである。
The digital still video camera according to a fifth aspect is the digital still video camera according to the fourth aspect, wherein the digital still video camera codes the recognition result of the voice input as a character string containing kana and kanji characters. It is provided with a kana-kanji conversion means for converting to.

【0012】また,請求項6に係るデジタルスチルビデ
オカメラは,請求項5に記載のデジタルスチルビデオカ
メラにおいて,前記デジタルスチルビデオカメラは,前
記文字コードを文字列に変換するコードキャラクタ変換
手段と,前記音声入力の認識結果または前記仮名漢字変
換結果を表示するデータ表示手段とを備えるものであ
る。
The digital still video camera according to a sixth aspect is the digital still video camera according to the fifth aspect, wherein the digital still video camera includes code character conversion means for converting the character code into a character string. Data display means for displaying the recognition result of the voice input or the kana-kanji conversion result.

【0013】また,請求項7に係るデジタルスチルビデ
オカメラは,請求項6に記載のデジタルスチルビデオカ
メラにおいて,前記デジタルスチルビデオカメラは,前
記データ表示手段に表示された仮名漢字変換結果に誤り
があった場合に,該誤りを訂正する訂正手段を備えるも
のである。
The digital still video camera according to a seventh aspect is the digital still video camera according to the sixth aspect, wherein the digital still video camera has an error in the kana-kanji conversion result displayed on the data display means. If there is, a correction means for correcting the error is provided.

【0014】また,請求項8に係るデジタルスチルビデ
オカメラは,音声入力を電気信号に変換する音声電気変
換手段と,電気信号に変換された音声を認識して各言葉
に対応した文字コードを出力する音声認識手段と,認識
された文字コードデータをファクシミリ通信のためのイ
メージデータに変換するイメージ変換手段と,ファクシ
ミリ通信に必要な制御コードの付加や通信動作を制御す
るファクシミリ制御手段とを備え,前記イメージデータ
をファクシミリで通信するものである。
According to another aspect of the digital still video camera of the present invention, the voice / electric conversion means for converting a voice input into an electric signal and the voice converted into the electric signal to output a character code corresponding to each word. Voice recognition means, an image conversion means for converting the recognized character code data into image data for facsimile communication, and a facsimile control means for adding a control code necessary for facsimile communication and controlling communication operation, The image data is communicated by facsimile.

【0015】更に,請求項9に係るデジタルスチルビデ
オカメラは,請求項8に記載のデジタルスチルビデオカ
メラにおいて,前記デジタルスチルビデオカメラは,前
記音声入力の認識結果を仮名漢字混じりの文字列のコー
ドに変換する仮名漢字変換手段と,前記音声入力の認識
結果または前記仮名漢字変換結果を表示するデータ表示
手段と,前記データ表示手段に表示された仮名漢字変換
結果に誤りがあった場合に,該誤りを訂正する訂正手段
とを備えるものである。
Furthermore, the digital still video camera according to a ninth aspect is the digital still video camera according to the eighth aspect, wherein the digital still video camera uses the recognition result of the voice input as a code of a character string mixed with kana and kanji. A kana-kanji conversion means for converting to kana, a data display means for displaying the recognition result of the voice input or the kana-kanji conversion result, and a kana-kanji conversion result displayed on the data display means for error, And a correction means for correcting an error.

【0016】[0016]

【発明の実施の形態】以下,本発明のデジタルスチルビ
デオカメラの概要について,並びに,本発明のデジタル
スチルビデオカメラの実施例について,〔実施例1〕,
〔実施例2〕,〔実施例3〕の順に図面を参照して詳細
に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, an outline of a digital still video camera of the present invention and an embodiment of a digital still video camera of the present invention will be described [Embodiment 1],
[Embodiment 2] and [Embodiment 3] will be described in detail with reference to the drawings.

【0017】〔本発明のデジタルスチルビデオカメラの
概要〕本発明の請求項1に係るデジタルスチルビデオカ
メラでは,図1に示す如く,音声電気変換手段111〜
113により音声入力を電気信号に変換し,音声認識手
段116で電気信号に変換された音声を認識して各言葉
に対応した文字コードを出力し,該文字コードをコード
キャラクタ変換手段117により文字列に変換し,音声
入力の認識結果である文字列を,文字合成手段121に
より,該音声入力と同時に撮影された画像または既に撮
影されている画像と合成して,データ表示手段122に
より,画像,音声入力の認識結果または画像と文字列の
合成結果を表示するようにしている。これにより,音声
入力したデータを音声として再生するだけでなく,撮影
した画像に該音声入力による表題等のコメントを入れる
ことができ,記憶媒体に記録した画像の中から,所望の
画像の画像を容易に見つけ出すことができ,閲覧,整理
等に便利なデジタルスチルビデオカメラを実現すること
ができる。
[Outline of Digital Still Video Camera of the Present Invention] In the digital still video camera according to claim 1 of the present invention, as shown in FIG.
The voice input 113 converts the voice input into an electric signal, the voice recognition unit 116 recognizes the voice converted into the electric signal, outputs a character code corresponding to each word, and the character code is converted into a character string by the code character conversion unit 117. And the character string which is the recognition result of the voice input is synthesized by the character synthesizing means 121 with the image photographed at the same time as the voice input or the image already photographed, and the data display means 122 synthesizes the image, The recognition result of voice input or the combination result of image and character string is displayed. As a result, not only can the voice input data be reproduced as voice, but a comment such as a title by the voice input can be added to the captured image, and the image of the desired image can be selected from the images recorded in the storage medium. It is possible to realize a digital still video camera that can be easily found and is convenient for browsing and organizing.

【0018】また,請求項2に係るデジタルスチルビデ
オカメラでは,図1に示す如く,仮名漢字変換手段11
9により,音声入力の認識結果を仮名漢字混じりの文字
列のコードに変換するようにしている。これにより,撮
影した画像に付加する該音声入力によるコメントとし
て,仮名漢字混じりの日本語等の文字列を使用すること
ができる。
Further, in the digital still video camera according to the second aspect, as shown in FIG.
9, the recognition result of the voice input is converted into a code of a character string containing kana and kanji. As a result, a character string such as Japanese mixed with Kana and Kanji can be used as a comment added to the captured image by the voice input.

【0019】また,請求項3に係るデジタルスチルビデ
オカメラでは,図1に示す如く,音声電気変換手段11
1〜113により音声入力を電気信号に変換し,音声認
識手段116で電気信号に変換された音声を認識して各
言葉に対応した文字コードを出力し,該音声入力の認識
結果を仮名漢字変換手段119により仮名漢字混じりの
文字列のコードに変換し,音声入力の認識結果を文字コ
ードデータとして記憶手段150に保存するようにして
いる。これにより,音声入力によるテキストデータの作
成が可能になり,また,音声入力によるコメントやメモ
等をコード化して保存することができ,保存に使用され
る記憶容量を小さくすることができる。
Further, in the digital still video camera according to the third aspect, as shown in FIG.
1 to 113 convert a voice input into an electric signal, a voice recognition unit 116 recognizes the voice converted into the electric signal, outputs a character code corresponding to each word, and converts the recognition result of the voice input into kana-kanji conversion. The means 119 converts into a code of a character string mixed with kana and kanji, and the recognition result of voice input is stored in the storage means 150 as character code data. As a result, it becomes possible to create text data by voice input, and it is possible to code and save comments, memos, etc. by voice input, and it is possible to reduce the storage capacity used for storage.

【0020】また,請求項4に係るデジタルスチルビデ
オカメラでは,図3に示す如く,音声電気変換手段11
1〜113により音声入力を電気信号に変換し,音声認
識手段116で電気信号に変換された音声を認識して各
言葉に対応した文字コードを出力し,通信制御手段33
1により,電子メール通信に必要なヘッダー情報の付
加,通信動作等を制御して,音声入力の認識結果または
文字コードを電子メールで通信するようにしている。こ
れにより,通信端末としての機能を備え,電子メール通
信が可能なデジタルスチルビデオカメラを実現できる。
Further, in the digital still video camera according to the fourth aspect, as shown in FIG.
1 to 113 convert a voice input into an electric signal, a voice recognition unit 116 recognizes the voice converted into the electric signal, outputs a character code corresponding to each word, and the communication control unit 33.
1, the addition of header information required for e-mail communication, the communication operation, etc. are controlled so that the recognition result of the voice input or the character code is communicated by e-mail. As a result, a digital still video camera having a function as a communication terminal and capable of electronic mail communication can be realized.

【0021】また,請求項5に係るデジタルスチルビデ
オカメラでは,図3に示す如く,仮名漢字変換手段11
9により,音声入力の認識結果を仮名漢字混じりの文字
列のコードに変換するようにしている。これにより,仮
名漢字混じりの日本語等の文字列による電子メール通信
が可能となる。
Further, in the digital still video camera according to the fifth aspect, as shown in FIG.
9, the recognition result of the voice input is converted into a code of a character string containing kana and kanji. As a result, it becomes possible to communicate by e-mail using a character string such as Japanese mixed with Kana and Kanji.

【0022】また,請求項6に係るデジタルスチルビデ
オカメラでは,図3に示す如く,コードキャラクタ変換
手段117により文字コードを文字列に変換し,データ
表示手段322には,音声入力の認識結果または仮名漢
字変換結果を表示するようにしている。これにより,仮
名漢字変換されたデータを確認しながらメールを作成
し,電子メールとして送信することができ,また受信し
たメールを表示することも可能である。
In the digital still video camera according to the sixth aspect, as shown in FIG. 3, the character code is converted into a character string by the code character conversion means 117, and the data display means 322 displays the recognition result of the voice input or The kana-kanji conversion result is displayed. As a result, it is possible to create a mail while checking the Kana-Kanji converted data and send it as an electronic mail, and it is also possible to display the received mail.

【0023】また,請求項7に係るデジタルスチルビデ
オカメラでは,図3に示す如く,データ表示手段322
に表示された仮名漢字変換結果に誤りがあった場合に
は,訂正手段321により該誤りを訂正するようにして
いる。これにより,仮名漢字変換されたデータを確認お
よび誤りの訂正をしながら電子メールによる通信ができ
る。
Further, in the digital still video camera according to the seventh aspect, as shown in FIG.
If there is an error in the kana-kanji conversion result displayed in, the correction means 321 corrects the error. As a result, it is possible to communicate by e-mail while checking the Kana-Kanji converted data and correcting errors.

【0024】また,請求項8に係るデジタルスチルビデ
オカメラでは,図4に示す如く,音声電気変換手段11
1〜113により音声入力を電気信号に変換し,音声認
識手段116で電気信号に変換された音声を認識して各
言葉に対応した文字コードを出力し,該認識された文字
コードデータをイメージ変換手段425によりファクシ
ミリ通信のためのイメージデータに変換して,ファクシ
ミリ通信に必要な制御コードの付加や通信動作を制御す
るファクシミリ制御手段331により,イメージデータ
をファクシミリで通信するようにしている。これによ
り,通信端末としての機能を備え,ファクシミリ通信が
可能なデジタルスチルビデオカメラを実現できる。
Further, in the digital still video camera according to the eighth aspect, as shown in FIG.
1 to 113 convert a voice input into an electric signal, a voice recognition unit 116 recognizes the voice converted into the electric signal, outputs a character code corresponding to each word, and converts the recognized character code data into an image. The means 425 converts the image data into image data for facsimile communication, and the facsimile control means 331 that controls the addition of control codes and communication operation necessary for facsimile communication causes image data to be communicated by facsimile. As a result, a digital still video camera having a function as a communication terminal and capable of facsimile communication can be realized.

【0025】更に,請求項9に係るデジタルスチルビデ
オカメラでは,図4に示す如く,仮名漢字変換手段11
9により,音声入力の認識結果を仮名漢字混じりの文字
列のコードに変換し,音声入力の認識結果または仮名漢
字変換結果をデータ表示手段322に表示して,表示さ
れた仮名漢字変換結果に誤りがあった場合には,該誤り
を訂正手段421により訂正するようにしている。これ
により,仮名漢字変換結果に誤りがないことを確認し,
誤りがあった場合には訂正しながら,仮名漢字混じりの
日本語文章によるファクシミリ通信を行うことができ
る。
Furthermore, in the digital still video camera according to the ninth aspect, as shown in FIG.
9, the recognition result of the voice input is converted into a code of a character string containing kana-kanji characters, the recognition result of the voice input or the kana-kanji conversion result is displayed on the data display means 322, and the displayed kana-kanji conversion result is incorrect. If there is, the correction means 421 corrects the error. This confirmed that the Kana-Kanji conversion results were correct,
If you make an error, you can correct it and perform facsimile communication using Japanese sentences containing Kana and Kanji.

【0026】〔実施例1〕図1は本発明の実施例1に係
るデジタルスチルビデオカメラの構成図である。本実施
例のデジタルスチルビデオカメラの構成は,大別して,
デジタルスチルビデオカメラの本体100と,撮像した
画像及びテキストデータを記録するPCカード150と
を具備して構成されている。
[Embodiment 1] FIG. 1 is a block diagram of a digital still video camera according to Embodiment 1 of the present invention. The structure of the digital still video camera of this embodiment is roughly classified into
The main body 100 of the digital still video camera and a PC card 150 for recording captured images and text data are provided.

【0027】同図において,デジタルスチルビデオカメ
ラ本体100は,レンズユニット101,CCD10
2,CDS回路103,A/D変換器104,デジタル
画像処理部105,画像圧縮・伸長部106,FIFO
107,カードインタフェース回路108,PCカード
インタフェース回路109,音声による日本語文章作成
部110,コードキャラクタ変換部117,CPU12
1,表示装置122,及び操作部123を具備して構成
されている。ここで,音声による日本語文章作成部11
0は,マイク111,フィルタ112,A/D変換器1
13,DRAM114,音声パターンメモリ115,音
声認識部116,辞書118,及び仮名漢字変換部11
9を備えている。
In FIG. 1, a digital still video camera body 100 includes a lens unit 101 and a CCD 10.
2, CDS circuit 103, A / D converter 104, digital image processing unit 105, image compression / decompression unit 106, FIFO
107, a card interface circuit 108, a PC card interface circuit 109, a voiced Japanese sentence creation unit 110, a code character conversion unit 117, and a CPU 12.
1, a display device 122, and an operation unit 123. Here, the Japanese sentence creation part 11 by voice
0 is a microphone 111, a filter 112, an A / D converter 1
13, DRAM 114, voice pattern memory 115, voice recognition unit 116, dictionary 118, and Kana-Kanji conversion unit 11
9 is provided.

【0028】レンズユニット101は,レンズ,及びオ
ートフォーカス(AF)・絞り・フィルター部を含むメ
カ機構等からなり,メカ機構のメカニカルシャッターは
2つのフィールドの同時露光を行う。CCD(電荷結合
素子)102は,レンズユニットを介して入力した映像
を電気信号(アナログ画像データ)に変換する。CDS
(相関2重サンプリング)回路103は,CCD型撮像
素子に対する低雑音化のための回路である。またA/D
変換器104は,CDS回路103を介して入力したC
CD102からのアナログ画像データをデジタル画像デ
ータに変換する。即ち,CCD102の出力信号は,C
DS回路103を通してA/D変換器104で最適なサ
ンプリング周波数(例えば,NTSC信号のサブキャリ
ア周波数の整数倍)にてデジタル信号に変換される。
The lens unit 101 is composed of a lens and a mechanical mechanism including an auto focus (AF) / aperture / filter section, and the mechanical shutter of the mechanical mechanism performs simultaneous exposure of two fields. The CCD (charge coupled device) 102 converts an image input via the lens unit into an electric signal (analog image data). CDS
The (correlated double sampling) circuit 103 is a circuit for reducing noise in the CCD image pickup device. Also A / D
The converter 104 inputs C through the CDS circuit 103
The analog image data from the CD 102 is converted into digital image data. That is, the output signal of the CCD 102 is C
It is converted into a digital signal by the A / D converter 104 through the DS circuit 103 at an optimum sampling frequency (for example, an integral multiple of the subcarrier frequency of the NTSC signal).

【0029】また,デジタル画像処理部105は,A/
D変換器104から入力したデジタル画像データを色差
と輝度に分けて各種処理,補正および画像圧縮・伸長の
ためのデータ処理を施す。画像圧縮・伸長部106は,
例えばJPEG準拠の画像圧縮・伸長の一過程である直
交変換,並びに,JPEG準拠の画像圧縮・伸長の一過
程であるハフマン符号化・複合化等を行う。
Further, the digital image processing unit 105 is
The digital image data input from the D converter 104 is divided into color difference and luminance, and various types of processing, correction, and data processing for image compression / decompression are performed. The image compression / decompression unit 106
For example, orthogonal transformation, which is one process of image compression / expansion conforming to JPEG, and Huffman encoding / compositing, which is one process of image compression / expansion conforming to JPEG, are performed.

【0030】一方,音声は,マイク111等の音声−電
気信号変換素子により電気信号に変換され,フィルタ1
12により増幅され必要帯域以外の周波数成分をカット
オフされた後,A/D変換器113により必要帯域の2
倍以上のサンプリング周波数でデジタル信号に変換され
る。更に,このデジタル信号化された音声データはDR
AM114を介して音声認識部116に送られる。音声
認識部116では,音声特徴抽出が行われ,音声パター
ンメモリ115内の音声パターンと照合しながら音声認
識が行われ,音声データがコード化されてDRAM11
4内に保持される。
On the other hand, the voice is converted into an electric signal by a voice-electric signal conversion element such as the microphone 111, and the filter 1
After being amplified by 12 and the frequency components other than the required band are cut off, the A / D converter 113 reduces the required band to 2
It is converted into a digital signal with a sampling frequency more than double. Furthermore, the audio data converted into digital signals is DR
It is sent to the voice recognition unit 116 via the AM 114. In the voice recognition unit 116, voice feature extraction is performed, voice recognition is performed while matching with the voice pattern in the voice pattern memory 115, voice data is coded, and the DRAM 11
4.

【0031】また仮名漢字変換部119では,DRAM
114内に保持されている認識結果について,表示装置
122上の認識結果の表示に従った操作者の指示に基づ
いて,仮名漢字変換を実行する。即ち,変換指示のあっ
た場合には,仮名漢字変換は,DRAM114より仮名
漢字変換部119に送られた認識結果を,辞書118と
照合しながら仮名漢字混じりの文字列のコードに変換す
ることにより行われる。仮名漢字変換の結果は,再び文
字キャラクタに変換されテキストデータとしてDRAM
114に保持されると共に,表示装置122により表示
される。
In the kana-kanji conversion unit 119, the DRAM is
Kana-Kanji conversion is performed on the recognition result stored in 114 based on the instruction of the operator according to the display of the recognition result on the display device 122. That is, when there is a conversion instruction, the Kana-Kanji conversion is performed by converting the recognition result sent from the DRAM 114 to the Kana-Kanji conversion unit 119 into a code of a character string mixed with Kana-Kanji while collating with the dictionary 118. Done. The result of the Kana-Kanji conversion is converted back into character characters and stored as text data in the DRAM.
It is held by 114 and displayed by the display device 122.

【0032】次にFIFO108は,例えばDRAM,
フラッシュメモリ等で実現されており,圧縮処理された
画像と,音声入力したテキストデータとを一旦蓄える。
FIFO108に保持された圧縮画像データ及び音声入
力テキストデータは,カードインタフェース回路109
を通して読み出され,PCカードインタフェース回路1
10を介して接続されるPCカード150等の記憶媒体
へ記録される。
Next, the FIFO 108 is, for example, a DRAM,
It is realized by a flash memory or the like, and temporarily stores a compressed image and voice-input text data.
The compressed image data and voice input text data held in the FIFO 108 are transferred to the card interface circuit 109.
Read through the PC card interface circuit 1
The data is recorded in a storage medium such as a PC card 150 connected via 10.

【0033】CPU121は,操作部113からの指
示,或いは図示しないリモコン等の外部動作指示に従
い,上記各部の動作を制御する。尚,カメラ電源はバッ
テリ,例えば,NiCd,ニッケル水素,リチウム電池
等から,図示しないDC−DCコンバータに入力され,
当該デジタルスチルビデオカメラ内部に供給される。
The CPU 121 controls the operation of each of the above parts according to an instruction from the operation unit 113 or an external operation instruction such as a remote controller (not shown). It should be noted that the camera power source is input to a DC-DC converter (not shown) from a battery, for example, NiCd, nickel hydrogen, lithium battery, or the like.
It is supplied to the inside of the digital still video camera.

【0034】更に,表示部122は,LCD,LED,
EL等で実現されており,撮影したデジタル画像データ
や,伸長処理された記録画像データを表示すると共に,
DRAM114内の音声入力したコード化されたデータ
や仮名漢字変換後のテキストデータを表示する。また操
作部123は,機能選択,撮影指示,或いはその他の各
種設定を外部から行うためのボタンを備える。
Further, the display unit 122 includes an LCD, an LED,
It is realized by EL, etc., and displays the captured digital image data and the expanded image data.
The voice-input coded data and the kana-kanji converted text data in the DRAM 114 are displayed. The operation unit 123 also includes buttons for externally performing function selection, shooting instruction, and other various settings.

【0035】図1に示した構成において,マイク11
1,フィルタ112及びA/D変換器113が音声電気
変換手段を,音声認識部116及び音声パターンメモリ
115が音声認識手段を,コードキャラクタ変換部11
7がコードキャラクタ変換手段を,仮名漢字変換部11
9及び辞書118が仮名漢字変換手段を,表示装置12
2がデータ表示手段を,PCカード150が記憶手段
を,それぞれ実現し,また文字合成手段及び訂正手段
は,図示しないROM等のメモリに格納されている制御
プログラムを実行するCPU121によって実現されて
いる。
In the configuration shown in FIG. 1, the microphone 11
1, the filter 112 and the A / D converter 113 are the voice electric conversion means, the voice recognition section 116 and the voice pattern memory 115 are the voice recognition means, and the code character conversion section 11
Reference numeral 7 is a code character conversion means, and kana-kanji conversion unit 11
9 and the dictionary 118 are kana-kanji conversion means, and the display device 12
2 is a data display unit, and the PC card 150 is a storage unit. The character synthesizing unit and the correcting unit are realized by the CPU 121 that executes a control program stored in a memory such as a ROM (not shown). .

【0036】次に,本実施例のデジタルスチルビデオカ
メラにおける音声入力によるテキストデータの生成処理
の動作について,図2に示すフローチャートを参照して
説明する。
Next, the operation of text data generation processing by voice input in the digital still video camera of this embodiment will be described with reference to the flowchart shown in FIG.

【0037】先ずステップS201では,マイク111
等の音声−電気信号変換素子により入力音声が電気信号
に変換され,ステップS202では,フィルタ112に
よるフィルタ処理,即ち,電気信号が増幅され必要帯域
以外の周波数成分がカットオフされる。該フィルタ処理
された電気信号は,ステップS203で,A/D変換器
113により必要帯域の2倍以上のサンプリング周波数
でデジタル信号に変換される。
First, in step S201, the microphone 111
The input voice is converted into an electric signal by a voice-electric signal conversion element such as, and in step S202, the filtering process by the filter 112, that is, the electric signal is amplified and frequency components other than the required band are cut off. The filtered electric signal is converted into a digital signal by the A / D converter 113 at a sampling frequency of twice the required band or more in step S203.

【0038】次に,このデジタル信号化された音声デー
タは,ステップS204で,DRAM114に格納され
た後,ステップS205で,音声認識部116に送られ
て,音声特徴抽出が行われ,音声パターンメモリ115
内の音声パターンと照合しながら音声認識が行われ,ス
テップS206で,該音声認識結果がコード化された音
声データとしてDRAM114内に格納される。
Next, the digital signalized voice data is stored in the DRAM 114 in step S204, and then sent to the voice recognition unit 116 in step S205 to perform voice feature extraction and voice pattern memory. 115
The voice recognition is performed while collating with the voice pattern inside, and in step S206, the voice recognition result is stored in the DRAM 114 as encoded voice data.

【0039】次に,ステップS208では,認識結果で
ある各文字に対応したコード化された音声データは,コ
ードキャラクタ変換部117により文字キャラクタに変
換され,表示装置122により表示される。表示された
認識結果が入力した通り(即ち,ステップS209で誤
りがないと判断した場合)であれば,ステップS210
に進んで,操作者は操作部123の変換ボタン(例えば
レリーズボタン)を押下することにより,該認識結果を
仮名漢字変換する。この仮名漢字変換処理は,DRAM
114より仮名漢字変換部119に送られた認識結果を
辞書118と照合しながら,仮名漢字混じりの文字列の
コードに変換することによって行われる。更にステップ
S213では,該仮名漢字変換の結果は,再び文字キャ
ラクタに変換され,テキストデータとしてDRAM11
4に保持されると共に,表示装置122により表示され
る。
Next, in step S208, the coded voice data corresponding to each character which is the recognition result is converted into a character by the code character conversion unit 117 and displayed by the display device 122. If the displayed recognition result is as input (that is, if it is determined that there is no error in step S209), step S210
Then, the operator presses a conversion button (for example, a release button) on the operation unit 123 to convert the recognition result into kana-kanji. This Kana-Kanji conversion process is based on the DRAM
The recognition result sent from 114 to the kana-kanji conversion unit 119 is collated with the dictionary 118 and converted into a code of a character string containing kana-kanji. Further, in step S213, the result of the Kana-Kanji conversion is converted into a character again and the text data is stored in the DRAM 11.
4 and is displayed by the display device 122.

【0040】ステップS214では,表示装置122の
表示内容について操作者が確認する。変換が正しく行わ
れている場合には,操作部123の確定ボタン(例えば
ストロボボタン)により確定する。一方,仮名漢字変換
に誤りがあった場合には,ステップS215に進んで,
操作部123の,例えばズームレバーを選択レバーとし
て,記録モードボタンを選択ボタンとして用い,選択レ
バーで変換する最初と最後に指示ポイントを移動させ,
選択ボタンでそれぞれの位置を決める。そしてレリーズ
ボタンで再変換を行い,確定ボタンで確定する。
In step S214, the operator confirms the display content of the display device 122. If the conversion is performed correctly, the confirmation button (for example, strobe button) of the operation unit 123 is used for confirmation. On the other hand, if there is an error in the kana-kanji conversion, proceed to step S215,
For example, the zoom lever of the operation unit 123 is used as a selection lever, the recording mode button is used as a selection button, and the instruction point is moved to the beginning and end of conversion with the selection lever,
Select each position with the select button. Then, re-convert with the release button and confirm with the confirm button.

【0041】以上の処理が,本実施例における音声入力
によるテキストデータの生成処理の動作である。こうし
て完成したテキストデータは,記憶媒体であるPCカー
ド150に,文字コードデータとして画像データと合成
されて,或いは文字コードデータ単独で,ステップS2
16において保存されたり,また後述する他の実施例の
ように,電子メール等の通信用テキストデータとして用
いられる。
The above-described processing is the operation of text data generation processing by voice input in this embodiment. The text data thus completed is combined with the image data as character code data in the PC card 150 as a storage medium, or as the character code data alone, in step S2.
16 and is used as text data for communication such as e-mail as in other embodiments described later.

【0042】先ず,音声入力したテキストデータのみを
単独でPCカード150に保存する場合について説明す
る。この場合,操作部123の記録モードを”音声入力
テキストモード”に設定する。そして,上述のテキスト
データの生成処理を行ってテキストデータが完成する
と,ステップS216で,該テキストデータの用途の選
択を行う。例えば,テキストデータのみを保存するか画
像と合成するかを,選択レバーと選択ボタンで選択す
る。ここで,”テキストデータのみの保存”を選択する
と,テキストデータはDRAM114から別の記憶素子
FIFO107に送られる。FIFO107に記録され
たテキストデータは,カードインタフェース回路108
を通して読み出され,PCカードインタフェース109
を介してPCカード150へ出力される。
First, a case will be described in which only the voice-inputted text data is individually stored in the PC card 150. In this case, the recording mode of the operation unit 123 is set to the "voice input text mode". When the text data is generated and the text data is completed, the usage of the text data is selected in step S216. For example, the selection lever and the selection button are used to select whether to save only the text data or to combine with the image. Here, if "save only text data" is selected, the text data is sent from the DRAM 114 to another storage element FIFO 107. The text data recorded in the FIFO 107 is stored in the card interface circuit 108.
Read through the PC card interface 109
Is output to the PC card 150 via.

【0043】次に,既に撮影された画像データに音声入
力したテキストデータをコメントとして合成し,PCカ
ード150に保存する場合について説明する。この場
合,操作部123の記録モードを”音声入力テキストモ
ード”にする。そして,上述のテキストデータの生成処
理を行ってテキストデータが完成すると,ステップS2
16で,該テキストデータの用途の選択を行う。ここ
で,操作部123の記憶モードボタンで記憶モードを”
画像との合成モード”とする。
Next, a case will be described in which text data input by voice is combined with already captured image data as a comment and the comment is stored in the PC card 150. In this case, the recording mode of the operation unit 123 is set to the "voice input text mode". When the text data is completed by performing the above-described text data generation processing, step S2
At 16, the usage of the text data is selected. Here, the storage mode button of the operation unit 123
Image composition mode ".

【0044】次に,操作部123により,テキストデー
タによるコメントを合成する画像データを選択する。画
像データは,PCカード150よりカードインタフェー
ス回路108を通して画像圧縮・伸長部106に送られ
て伸長される。この伸長された画像データはテジタル画
像処理部105へ送られ,表示装置122で表示され
る。ここで,選択レバーと選択ボタンで合成する画像を
選択したら,確定ボタンで確定する。画像が確定される
とテキストデータとの合成が開始される。
Next, the operation unit 123 selects the image data to be combined with the comment by the text data. The image data is sent from the PC card 150 to the image compression / expansion unit 106 through the card interface circuit 108 and expanded. The decompressed image data is sent to the digital image processing unit 105 and displayed on the display device 122. Here, when the image to be combined is selected by the selection lever and the selection button, it is confirmed by the confirmation button. When the image is confirmed, the composition with the text data is started.

【0045】DRAM114上にあるテキストデータは
コードキャラクタ変換部117を介してデジタル信号処
理部105に送られ,画像データと合成されて表示装置
122に表示される。このようにして合成されたコメン
ト入り画像データは,再び画像圧縮・伸長部106で圧
縮されFIFO107に送られる。FIFO107に記
録されたコメント入り画像データは,カードインタフェ
ース回路108を通して読み出され,PCインタフェー
ス回路109を介してPCカード150へ出力される。
The text data on the DRAM 114 is sent to the digital signal processing unit 105 via the code character conversion unit 117, and is combined with the image data to be displayed on the display device 122. The commented image data thus synthesized is again compressed by the image compression / decompression unit 106 and sent to the FIFO 107. The commented image data recorded in the FIFO 107 is read through the card interface circuit 108 and output to the PC card 150 through the PC interface circuit 109.

【0046】更に,音声入力と同時に撮影された画像デ
ータに音声入力によるテキストデータをコメントとして
合成し,PCカード150に保存する場合について説明
する。この場合,先ず画像を撮影し,デジタル画像処理
部105によるデジタル画像処理と画像圧縮・伸長部1
06による画像圧縮を行って,画像データは一度PCカ
ード150に書き込まれる。
Further, a case will be described in which image data taken at the same time as voice input is combined with text data by voice input as a comment and the comment is stored in the PC card 150. In this case, first, an image is taken, and the digital image processing by the digital image processing unit 105 and the image compression / expansion unit 1 are performed.
Image data is once written to the PC card 150 by performing image compression according to 06.

【0047】続いて,音声入力によってコメントとすべ
き音声データを入力する。この音声データは,上述のテ
キストデータの生成処理を行うことにより,テキストデ
ータに変換されてDRAM114に記録される。テキス
トデータが完成すると,次にこのテキストデータの用途
の選択を行う。
Then, voice data to be used as a comment is input by voice input. The voice data is converted into text data and recorded in the DRAM 114 by performing the above-described text data generation processing. When the text data is completed, the usage of this text data is selected next.

【0048】操作部123の記憶モードボタンで記憶モ
ードを”画像との合成モード”とすると,撮影された画
像データは再びPCカード150よりカードインタフェ
ース回路108を通して画像圧縮・伸長部106に送ら
れて伸長される。この伸長された画像データはテジタル
画像処理部105に送られ,一方,DRAM114上に
あるテキストデータはコードキャラクタ変換部117を
介してデジタル信号処理部105に送られ,画像データ
と合成されて,コメント入り画像データとして表示装置
122に表示される。
When the storage mode button of the operation unit 123 is used to set the storage mode to "composite mode with image", the captured image data is sent from the PC card 150 to the image compression / decompression unit 106 through the card interface circuit 108 again. It is extended. The decompressed image data is sent to the digital image processing unit 105, while the text data on the DRAM 114 is sent to the digital signal processing unit 105 via the code character conversion unit 117 and is combined with the image data to make a comment. It is displayed on the display device 122 as the input image data.

【0049】このようにして合成されたコメント入り画
像データは,再び画像圧縮・伸長部106で圧縮されF
IFO107に送られる。FIFO107に記録された
コメント入り画像データは,カードインタフェース回路
108を通して読み出され,PCインタフェース回路1
09を介してPCカード150へ出力される。
The comment-added image data thus synthesized is compressed by the image compression / decompression unit 106 again and the F
It is sent to the IFO 107. The commented image data recorded in the FIFO 107 is read out through the card interface circuit 108, and the PC interface circuit 1
It is output to the PC card 150 via 09.

【0050】〔実施例2〕次に,図3は本発明の実施例
2に係るデジタルスチルビデオカメラの構成図である。
本実施例のデジタルスチルビデオカメラは,音声入力に
基づき生成したテキストデータを電子メールとして送信
し,また電子メールを受信するものである。
[Second Embodiment] FIG. 3 is a block diagram of a digital still video camera according to a second embodiment of the present invention.
The digital still video camera according to the present embodiment transmits text data generated based on voice input as an electronic mail and receives the electronic mail.

【0051】本実施例のデジタルスチルビデオカメラの
本体300は,音声による日本語文章作成部310,コ
ードキャラクタ変換部117,CPU321,表示装置
322,操作部123,及び通信制御部331を具備し
て構成されている。ここで,音声による日本語文章作成
部310は,マイク111,フィルタ112,A/D変
換器113,DRAM314,音声パターンメモリ11
5,音声認識部116,辞書118,及び仮名漢字変換
部119を備えている。
The main body 300 of the digital still video camera according to the present embodiment is provided with a voice Japanese sentence creating unit 310, a code character converting unit 117, a CPU 321, a display device 322, an operating unit 123, and a communication control unit 331. It is configured. Here, the voice-based Japanese sentence creation unit 310 includes a microphone 111, a filter 112, an A / D converter 113, a DRAM 314, and a voice pattern memory 11.
5, a voice recognition unit 116, a dictionary 118, and a Kana-Kanji conversion unit 119.

【0052】尚,実施例1と同様にレンズユニット10
1,CCD102,CDS回路103,A/D変換器1
04,デジタル画像処理部105,画像圧縮・伸長部1
06,FIFO107,カードインタフェース回路10
8,及びPCカードインタフェース回路109,並び
に,PCカード150を備えるが,本実施例の特徴がテ
キストデータの電子メール送受信機能にあることから,
これらについては省略した。
The lens unit 10 is the same as in the first embodiment.
1, CCD 102, CDS circuit 103, A / D converter 1
04, digital image processing unit 105, image compression / decompression unit 1
06, FIFO107, card interface circuit 10
8 and the PC card interface circuit 109 and the PC card 150 are provided, but since the feature of the present embodiment is the e-mail transmission / reception function of text data,
These are omitted.

【0053】実施例1の構成に対して新たに付加される
通信制御部331は,当該デジタルスチルカメラ本体3
00をモデム330等の通信装置に接続し,ダイヤルア
ップ接続により当該デジタルスチルカメラをインターネ
ットに接続するものである。
The communication control unit 331, which is newly added to the configuration of the first embodiment, is the digital still camera body 3 concerned.
00 is connected to a communication device such as a modem 330, and the digital still camera is connected to the Internet by dial-up connection.

【0054】図3に示した構成において,マイク11
1,フィルタ112及びA/D変換器113が音声電気
変換手段を,音声認識部116及び音声パターンメモリ
115が音声認識手段を,コードキャラクタ変換部11
7がコードキャラクタ変換手段を,仮名漢字変換部11
9及び辞書118が仮名漢字変換手段を,表示装置32
2がデータ表示手段を,図示しないPCカードが記憶手
段を,それぞれ実現し,また文字合成手段及び訂正手段
は,図示しないROM等のメモリに格納されている制御
プログラムを実行するCPU321によって実現されて
いる。更に,通信制御手段は通信制御部331によって
実現されている。
In the configuration shown in FIG. 3, the microphone 11
1, the filter 112 and the A / D converter 113 are the voice electric conversion means, the voice recognition section 116 and the voice pattern memory 115 are the voice recognition means, and the code character conversion section 11
Reference numeral 7 is a code character conversion means, and kana-kanji conversion unit 11
9 and the dictionary 118 are the kana-kanji conversion means, the display device 32.
2 is a data display unit, a PC card (not shown) is a storage unit, and the character synthesizing unit and the correction unit are realized by a CPU 321 that executes a control program stored in a memory such as a ROM (not shown). There is. Further, the communication control means is realized by the communication control unit 331.

【0055】次に,本実施例のデジタルスチルビデオカ
メラにおけるテキストデータの電子メール送受信の動作
について説明する。尚,テキストデータの生成は実施例
1と同様にして行われる。
Next, an operation of transmitting / receiving an electronic mail of text data in the digital still video camera of this embodiment will be described. The text data is generated in the same manner as in the first embodiment.

【0056】先ず,音声入力に基づき生成したテキスト
データを電子メールとして送信する場合について説明す
る。デジタルスチルビデオカメラ本体300をモデム3
30等の通信装置につなぎ,ダイアルアップ接続により
デジタルスチルビデオカメラをインターネットに接続す
る。接続後,DRAM314に格納されている音声入力
によって作成されたテキストデータのメールを,コード
キャラクタ変換部117で文字コードに変換する。そし
て,通信制御部331によって電子メール通信に必要な
データを付加し,TCP/IPのプロトコルに従い電子
メールを送信する。
First, the case where the text data generated based on the voice input is transmitted as an electronic mail will be described. The digital still video camera body 300 is connected to the modem 3
A digital still video camera is connected to the Internet by connecting to a communication device such as 30 and a dial-up connection. After the connection, the text data mail stored in the DRAM 314 created by voice input is converted into a character code by the code character conversion unit 117. Then, the communication control unit 331 adds data necessary for e-mail communication, and sends the e-mail according to the TCP / IP protocol.

【0057】また,電子メールの受信は次のようにして
行われる。先ず,ダイアルアップ接続によりデジタルス
チルビデオカメラをインターネットに接続する。接続
後,インターネットに接続したときのアドレスネーム宛
にメールが届いている場合は,TCP/IPのプロトコ
ルに従いメールを受信する。受信したデータは一度DR
AM314に格納し,コードキャラクタ変換部117に
よりテキストデータに変換して表示装置322上に表示
する。尚,表示画面のスクロールは,デジタルスチルビ
デオカメラの操作部123にあるズームレバー等で行
う。
The reception of electronic mail is performed as follows. First, connect the digital still video camera to the Internet by dial-up connection. After the connection, if the mail reaches the address name when connecting to the Internet, the mail is received according to the TCP / IP protocol. Received data is once DR
The data is stored in the AM 314, converted into text data by the code character conversion unit 117, and displayed on the display device 322. The display screen is scrolled by a zoom lever or the like in the operation unit 123 of the digital still video camera.

【0058】〔実施例3〕次に,図4は本発明の実施例
3に係るデジタルスチルビデオカメラの構成図である。
本実施例のデジタルスチルビデオカメラは,音声入力に
基づき生成したテキストデータをファクシミリ送信する
ものである。
[Third Embodiment] FIG. 4 is a block diagram of a digital still video camera according to a third embodiment of the present invention.
The digital still video camera of this embodiment is for transmitting text data generated based on voice input by facsimile.

【0059】本実施例のデジタルスチルビデオカメラの
本体400は,音声による日本語文章作成部410,コ
ードキャラクタ変換部117,CPU421,表示装置
322,操作部123,通信制御部331,イメージ生
成部425,及びイメージメモリを具備して構成されて
いる。ここで,音声による日本語文章作成部410は,
マイク111,フィルタ112,A/D変換器113,
DRAM414,音声パターンメモリ115,音声認識
部116,辞書118,及び仮名漢字変換部119を備
えている。
The main body 400 of the digital still video camera according to the present embodiment has a voice Japanese sentence creation unit 410, a code character conversion unit 117, a CPU 421, a display device 322, an operation unit 123, a communication control unit 331, and an image generation unit 425. , And an image memory. Here, the voice-based Japanese sentence creation unit 410
Microphone 111, filter 112, A / D converter 113,
A DRAM 414, a voice pattern memory 115, a voice recognition unit 116, a dictionary 118, and a Kana-Kanji conversion unit 119 are provided.

【0060】尚,実施例1と同様にレンズユニット10
1,CCD102,CDS回路103,A/D変換器1
04,デジタル画像処理部105,画像圧縮・伸長部1
06,FIFO107,カードインタフェース回路10
8,及びPCカードインタフェース回路109,並び
に,PCカード150を備えるが,本実施例の特徴がテ
キストデータのファクシミリ送信機能にあることから,
これらについては省略した。
As in the first embodiment, the lens unit 10
1, CCD 102, CDS circuit 103, A / D converter 1
04, digital image processing unit 105, image compression / decompression unit 1
06, FIFO107, card interface circuit 10
8 and the PC card interface circuit 109 and the PC card 150 are provided, but since the feature of this embodiment is the facsimile transmission function of text data,
These are omitted.

【0061】実施例2の構成に対して新たに付加される
イメージ生成部425は,イメージメモリ426からレ
イアウトフォーマットを読み込んでテキストデータの配
置を決定し,各文字のイメージデータをイメージメモリ
426から読み込み,ファクシミリ通信のためのイメー
ジデータを生成する。
The image generation unit 425, which is newly added to the configuration of the second embodiment, reads the layout format from the image memory 426 to determine the arrangement of text data, and reads the image data of each character from the image memory 426. , Generates image data for facsimile communication.

【0062】図4に示した構成において,マイク11
1,フィルタ112及びA/D変換器113が音声電気
変換手段を,音声認識部116及び音声パターンメモリ
115が音声認識手段を,コードキャラクタ変換部11
7がコードキャラクタ変換手段を,仮名漢字変換部11
9及び辞書118が仮名漢字変換手段を,表示装置32
2がデータ表示手段を,図示しないPCカードが記憶手
段を,それぞれ実現し,また文字合成手段及び訂正手段
は,図示しないROM等のメモリに格納されている制御
プログラムを実行するCPU321によって実現されて
いる。更に,ファクシミリ制御手段は通信制御部331
により,またイメージ変換手段はイメージ生成部425
及びイメージメモリ426によって実現されている。
In the configuration shown in FIG. 4, the microphone 11
1, the filter 112 and the A / D converter 113 are the voice electric conversion means, the voice recognition section 116 and the voice pattern memory 115 are the voice recognition means, and the code character conversion section 11
Reference numeral 7 is a code character conversion means, and kana-kanji conversion unit 11
9 and the dictionary 118 are the kana-kanji conversion means, the display device 32.
2 is a data display unit, a PC card (not shown) is a storage unit, and the character synthesizing unit and the correction unit are realized by a CPU 321 that executes a control program stored in a memory such as a ROM (not shown). There is. Further, the facsimile control means is the communication control unit 331.
In addition, the image conversion means is operated by the image generator 425.
And the image memory 426.

【0063】次に,本実施例のデジタルスチルビデオカ
メラにおけるテキストデータのファクシミリ送信の動作
について説明する。尚,テキストデータの生成は実施例
1と同様にして行われる。
Next, the operation of facsimile transmission of text data in the digital still video camera of this embodiment will be described. The text data is generated in the same manner as in the first embodiment.

【0064】先ず,DRAM414に格納されている音
声入力によって作成されたテキストデータを,イメージ
生成部425に送る。イメージ生成部425では,イメ
ージデータを記憶しているイメージメモリ426からレ
イアウトフォーマットを読み込み,テキストデータの配
置を決定する。次に,各文字のイメージデータをイメー
ジメモリ426から読み込み,イメージデータに変換し
た後,DRAM414に送出し,更にDRAM414よ
り通信制御部331に送る。通信制御部331では,作
成されたイメージデータをファクシミリ信号に変換し
て,モデム330より送出する。
First, the text data stored in the DRAM 414 and created by voice input is sent to the image generation unit 425. The image generation unit 425 reads the layout format from the image memory 426 that stores the image data and determines the arrangement of the text data. Next, the image data of each character is read from the image memory 426, converted into image data, sent to the DRAM 414, and further sent from the DRAM 414 to the communication control unit 331. The communication control unit 331 converts the created image data into a facsimile signal and sends it out from the modem 330.

【0065】[0065]

【発明の効果】以上説明したように,本発明の請求項1
に係るデジタルスチルビデオカメラによれば,音声電気
変換手段により音声入力を電気信号に変換し,音声認識
手段で電気信号に変換された音声を認識して各言葉に対
応した文字コードを出力し,該文字コードをコードキャ
ラクタ変換手段により文字列に変換し,音声入力の認識
結果である文字列を,文字合成手段により,該音声入力
と同時に撮影された画像または既に撮影されている画像
と合成し,データ表示手段により,画像,音声入力の認
識結果または画像と文字列の合成結果を表示することと
したので,撮影した画像に該音声入力による表題等のコ
メントを入れることができ,記憶媒体に記録した画像の
中から,所望の画像の画像を容易に見つけ出すことがで
き,閲覧,整理等に便利なデジタルスチルビデオカメラ
を提供することができる。
As described above, according to the first aspect of the present invention,
According to the digital still video camera of the present invention, the voice / electric conversion means converts the voice input into the electric signal, the voice recognition means recognizes the voice converted into the electric signal, and outputs the character code corresponding to each word, The character code is converted into a character string by the code character converting means, and the character string which is the recognition result of the voice input is combined with the image captured at the same time as the voice input or the image already captured by the character synthesizing means. Since the data display means displays the recognition result of the image or voice input or the combined result of the image and the character string, it is possible to add a comment such as a title by the voice input to the photographed image, and to the storage medium. It is possible to provide a digital still video camera that is easy to find a desired image from recorded images and is convenient for browsing and organizing. Kill.

【0066】また,請求項2に係るデジタルスチルビデ
オカメラによれば,仮名漢字変換手段により,音声入力
の認識結果を仮名漢字混じりの文字列のコードに変換す
ることととしたので,撮影した画像に付加する該音声入
力によるコメントとして,仮名漢字混じりの日本語等の
文字列を使用することができる。
According to the digital still video camera of the second aspect, the kana-kanji conversion means converts the recognition result of the voice input into a code of a character string containing kana-kanji characters. A character string such as Japanese mixed with Kana and Kanji can be used as the comment added by the voice input.

【0067】また,請求項3に係るデジタルスチルビデ
オカメラによれば,音声電気変換手段により音声入力を
電気信号に変換し,音声認識手段で電気信号に変換され
た音声を認識して各言葉に対応した文字コードを出力
し,該音声入力の認識結果を仮名漢字変換手段により仮
名漢字混じりの文字列のコードに変換し,音声入力の認
識結果を文字コードデータとして記憶手段に保存するこ
ととしたので,音声入力によるテキストデータの作成が
可能になり,また,音声入力によるコメントやメモ等を
コード化して保存することができ,保存に使用される記
憶容量を小さくすることができる。
Further, according to the digital still video camera of the third aspect, the voice-electric converting means converts the voice input into an electric signal, and the voice recognizing means recognizes the voice converted into the electric signal to recognize each word. A corresponding character code is output, the recognition result of the voice input is converted into a code of a character string containing kana-kanji characters by the kana-kanji conversion means, and the recognition result of the voice input is stored in the storage means as character code data. Therefore, it is possible to create text data by voice input, and it is possible to code and save comments and memos by voice input, and it is possible to reduce the storage capacity used for storage.

【0068】また,請求項4に係るデジタルスチルビデ
オカメラによれば,音声電気変換手段により音声入力を
電気信号に変換し,音声認識手段で電気信号に変換され
た音声を認識して各言葉に対応した文字コードを出力
し,通信制御手段により,電子メール通信に必要なヘッ
ダー情報の付加,通信動作等を制御して,音声入力の認
識結果または文字コードを電子メールで通信することと
したので,通信端末としての機能を備え,電子メール通
信が可能なデジタルスチルビデオカメラを提供すること
ができる。
According to the digital still video camera of the present invention, the voice / electric conversion means converts the voice input into an electric signal, and the voice recognizing means recognizes the voice converted into the electric signal to recognize each word. Since the corresponding character code is output and the communication control means controls the addition of header information necessary for e-mail communication, the communication operation, etc., the recognition result of the voice input or the character code is communicated by e-mail. , It is possible to provide a digital still video camera having a function as a communication terminal and capable of e-mail communication.

【0069】また,請求項5に係るデジタルスチルビデ
オカメラによれば,仮名漢字変換手段により,音声入力
の認識結果を仮名漢字混じりの文字列のコードに変換す
ることとしたので,仮名漢字混じりの日本語等の文字列
による電子メール通信が可能となる。
Further, according to the digital still video camera of the fifth aspect, the kana-kanji conversion means converts the recognition result of the voice input into a code of a character string containing kana-kanji characters. E-mail communication using character strings such as Japanese becomes possible.

【0070】また,請求項6に係るデジタルスチルビデ
オカメラによれば,コードキャラクタ変換手段により文
字コードを文字列に変換し,データ表示手段には,音声
入力の認識結果または仮名漢字変換結果を表示すること
としたので,仮名漢字変換されたデータを確認しながら
メールを作成し,電子メールとして送信することがで
き,また受信したメールを表示することも可能である。
According to the digital still video camera of the sixth aspect, the character code is converted into a character string by the code character conversion means, and the recognition result of the voice input or the kana-kanji conversion result is displayed on the data display means. Since it is decided to do so, it is possible to compose a mail while checking the data converted into Kana-Kanji and send it as an e-mail, and it is also possible to display the received mail.

【0071】また,請求項7に係るデジタルスチルビデ
オカメラによれば,データ表示手段に表示された仮名漢
字変換結果に誤りがあった場合には,訂正手段により該
誤りを訂正することとしたので,仮名漢字変換されたデ
ータを確認および誤りの訂正をしながら電子メールによ
る通信ができる。
Further, according to the digital still video camera of the present invention, when the kana-kanji conversion result displayed on the data display means has an error, the correction means corrects the error. , You can communicate by e-mail while checking the data converted into Kana-Kanji and correcting the errors.

【0072】また,請求項8に係るデジタルスチルビデ
オカメラによれば,音声電気変換手段により音声入力を
電気信号に変換し,音声認識手段で電気信号に変換され
た音声を認識して各言葉に対応した文字コードを出力
し,該認識された文字コードデータをイメージ変換手段
によりファクシミリ通信のためのイメージデータに変換
して,ファクシミリ通信に必要な制御コードの付加や通
信動作を制御するファクシミリ制御手段により,イメー
ジデータをファクシミリで通信することとしたので,通
信端末としての機能を備え,ファクシミリ通信が可能な
デジタルスチルビデオカメラを提供することができる。
According to the digital still video camera of the present invention, the voice-electric converting means converts the voice input into an electric signal, and the voice recognizing means recognizes the voice converted into the electric signal to recognize each word. Facsimile control means for outputting a corresponding character code, converting the recognized character code data into image data for facsimile communication by an image conversion means, and adding a control code necessary for facsimile communication and controlling communication operation Thus, since the image data is communicated by facsimile, it is possible to provide a digital still video camera having a function as a communication terminal and capable of facsimile communication.

【0073】更に,請求項9に係るデジタルスチルビデ
オカメラによれば,仮名漢字変換手段により,音声入力
の認識結果を仮名漢字混じりの文字列のコードに変換
し,音声入力の認識結果または仮名漢字変換結果をデー
タ表示手段に表示して,表示された仮名漢字変換結果に
誤りがあった場合には,該誤りを訂正手段により訂正す
ることとしたので,仮名漢字変換結果に誤りがないこと
を確認し,誤りがあった場合には訂正しながら,仮名漢
字混じりの日本語文章によるファクシミリ通信を行うこ
とができる。
Further, according to the digital still video camera of claim 9, the kana-kanji conversion means converts the recognition result of the voice input into a code of a character string containing kana-kanji characters, and the recognition result of the voice input or the kana-kanji character. The conversion result is displayed on the data display means, and if the displayed kana-kanji conversion result has an error, the error is corrected by the correction means. It is possible to check and correct if there is an error, and perform facsimile communication using Japanese sentences mixed with Kana and Kanji.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施例1に係るデジタルスチルビデオ
カメラの構成図である。
FIG. 1 is a configuration diagram of a digital still video camera according to Embodiment 1 of the present invention.

【図2】実施例のデジタルスチルビデオカメラにおける
音声入力によるテキストデータの生成処理の動作を説明
するフローチャートである。
FIG. 2 is a flowchart illustrating an operation of text data generation processing by voice input in the digital still video camera according to the embodiment.

【図3】本発明の実施例2に係るデジタルスチルビデオ
カメラの構成図である。
FIG. 3 is a configuration diagram of a digital still video camera according to a second embodiment of the present invention.

【図4】本発明の実施例3に係るデジタルスチルビデオ
カメラの構成図である。
FIG. 4 is a configuration diagram of a digital still video camera according to a third embodiment of the present invention.

【符号の説明】[Explanation of symbols]

100,300,400 デジタルスチルビデオカメラ
本体 101 レンズユニット 102 CCD(電荷結合素子) 103 CDS(相関2重サンプリング)回路 104 A/D変換器 105 デジタル画像処理部 106 画像圧縮・伸長部 107 FIFO 108 カードインタフェース回路 109 PCカードインタフェース回路 110,310,410 音声による日本語文章作成部 111 マイク 112 フィルタ 113 A/D変換器 114,314,414 DRAM 115 音声パターンメモリ 116 音声認識部 117 コードキャラクタ変換部 118 辞書 119 仮名漢字変換部 121,321,421 CPU(文字合成手段,訂正
手段) 122,322 表示装置(データ表示手段) 123 操作部 150 PCカード 330 モデム 331 通信制御部(通信制御手段,ファクシミリ制御
手段) 425 イメージ生成部(イメージ変換手段) 426 イメージメモリ
100, 300, 400 Digital still video camera body 101 Lens unit 102 CCD (charge coupled device) 103 CDS (correlated double sampling) circuit 104 A / D converter 105 Digital image processing unit 106 Image compression / decompression unit 107 FIFO 108 card Interface circuit 109 PC card interface circuit 110, 310, 410 Voice Japanese sentence creation unit 111 Microphone 112 Filter 113 A / D converter 114, 314, 414 DRAM 115 Voice pattern memory 116 Voice recognition unit 117 Code character conversion unit 118 Dictionary 119 Kana-Kanji conversion unit 121, 321, 421 CPU (character synthesis unit, correction unit) 122, 322 display device (data display unit) 123 operation unit 150 PC card 330 model 331 Communication control unit (communication control unit, facsimile control unit) 425 Image generation unit (image conversion unit) 426 Image memory

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 音声入力を電気信号に変換する音声電気
変換手段と,電気信号に変換された音声を認識して各言
葉に対応した文字コードを出力する音声認識手段と,前
記文字コードを文字列に変換するコードキャラクタ変換
手段と,前記音声入力の認識結果である文字列を,該音
声入力と同時に撮影された画像または既に撮影されてい
る画像と合成する文字合成手段と,前記画像,前記音声
入力の認識結果または前記画像と文字列の合成結果を表
示するデータ表示手段と,を有することを特徴とするデ
ジタルスチルビデオカメラ。
1. A voice-electricity conversion means for converting a voice input into an electric signal, a voice recognition means for recognizing the voice converted into the electric signal and outputting a character code corresponding to each word, and the character code as a character. Code character converting means for converting into a sequence, character synthesizing means for synthesizing a character string as a recognition result of the voice input with an image taken at the same time as the voice input or an image already taken, the image, the A digital still video camera, comprising: a data display means for displaying a recognition result of voice input or a combination result of the image and the character string.
【請求項2】 前記デジタルスチルビデオカメラは,前
記音声入力の認識結果を仮名漢字混じりの文字列のコー
ドに変換する仮名漢字変換手段を有することを特徴とす
る請求項1記載のデジタルスチルビデオカメラ。
2. The digital still video camera according to claim 1, further comprising kana-kanji conversion means for converting a recognition result of the voice input into a code of a character string containing kana-kanji characters. .
【請求項3】 音声入力を電気信号に変換する音声電気
変換手段と,電気信号に変換された音声を認識して各言
葉に対応した文字コードを出力する音声認識手段と,前
記音声入力の認識結果を仮名漢字混じりの文字列のコー
ドに変換する仮名漢字変換手段と,前記音声入力の認識
結果を文字コードデータとして保存する記憶手段と,を
有することを特徴とするデジタルスチルビデオカメラ。
3. A voice-electricity conversion means for converting a voice input into an electric signal, a voice recognition means for recognizing the voice converted into the electric signal and outputting a character code corresponding to each word, and recognition of the voice input. A digital still video camera comprising: a kana-kanji conversion means for converting the result into a code of a character string containing kana-kanji characters, and a storage means for storing the recognition result of the voice input as character code data.
【請求項4】 音声入力を電気信号に変換する音声電気
変換手段と,電気信号に変換された音声を認識して各言
葉に対応した文字コードを出力する音声認識手段と,電
子メール通信に必要なヘッダー情報の付加,通信動作等
を制御する通信制御手段と,を有し,前記音声入力の認
識結果または前記文字コードを電子メールで通信するこ
とを特徴とするデジタルスチルビデオカメラ。
4. A voice-electricity conversion means for converting a voice input into an electric signal, a voice recognition means for recognizing the voice converted into the electric signal and outputting a character code corresponding to each word, and necessary for electronic mail communication. And a communication control means for controlling communication operation and the like, and communicates the recognition result of the voice input or the character code by electronic mail.
【請求項5】 前記デジタルスチルビデオカメラは,前
記音声入力の認識結果を仮名漢字混じりの文字列のコー
ドに変換する仮名漢字変換手段を有することを特徴とす
る請求項4記載のデジタルスチルビデオカメラ。
5. The digital still video camera according to claim 4, wherein the digital still video camera has kana-kanji conversion means for converting the recognition result of the voice input into a code of a character string containing kana-kanji. .
【請求項6】 前記デジタルスチルビデオカメラは,前
記文字コードを文字列に変換するコードキャラクタ変換
手段と,前記音声入力の認識結果または前記仮名漢字変
換結果を表示するデータ表示手段と,を有することを特
徴とする請求項5記載のデジタルスチルビデオカメラ。
6. The digital still video camera comprises code character conversion means for converting the character code into a character string, and data display means for displaying the recognition result of the voice input or the kana-kanji conversion result. The digital still video camera according to claim 5.
【請求項7】 前記デジタルスチルビデオカメラは,前
記データ表示手段に表示された仮名漢字変換結果に誤り
があった場合に,該誤りを訂正する訂正手段を有するこ
とを特徴とする請求項6記載のデジタルスチルビデオカ
メラ。
7. The digital still video camera comprises correction means for correcting an error in the Kana-Kanji conversion result displayed on the data display means. Digital still video camera.
【請求項8】 音声入力を電気信号に変換する音声電気
変換手段と,電気信号に変換された音声を認識して各言
葉に対応した文字コードを出力する音声認識手段と,認
識された文字コードデータをファクシミリ通信のための
イメージデータに変換するイメージ変換手段と,ファク
シミリ通信に必要な制御コードの付加や通信動作を制御
するファクシミリ制御手段と,を有し,前記イメージデ
ータをファクシミリで通信することを特徴とするデジタ
ルスチルビデオカメラ。
8. A voice-electricity conversion means for converting a voice input into an electric signal, a voice recognition means for recognizing the voice converted into the electric signal and outputting a character code corresponding to each word, and a recognized character code. Image conversion means for converting data into image data for facsimile communication, and facsimile control means for controlling addition of control code necessary for facsimile communication and communication operation, and communicating the image data by facsimile A digital still video camera featuring.
【請求項9】 前記デジタルスチルビデオカメラは,前
記音声入力の認識結果を仮名漢字混じりの文字列のコー
ドに変換する仮名漢字変換手段と,前記音声入力の認識
結果または前記仮名漢字変換結果を表示するデータ表示
手段と,前記データ表示手段に表示された仮名漢字変換
結果に誤りがあった場合に,該誤りを訂正する訂正手段
と,を有することを特徴とする請求項8記載のデジタル
スチルビデオカメラ。
9. The digital still video camera displays kana-kanji conversion means for converting the recognition result of the voice input into a code of a character string containing kana-kanji, and the recognition result of the voice input or the kana-kanji conversion result. 9. The digital still video according to claim 8, further comprising: a data display unit for executing the operation, and a correction unit for correcting the error when the Kana-Kanji conversion result displayed on the data display unit has an error. camera.
JP8058140A 1996-03-14 1996-03-14 Digital still video camera Pending JPH09252453A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8058140A JPH09252453A (en) 1996-03-14 1996-03-14 Digital still video camera

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8058140A JPH09252453A (en) 1996-03-14 1996-03-14 Digital still video camera

Publications (1)

Publication Number Publication Date
JPH09252453A true JPH09252453A (en) 1997-09-22

Family

ID=13075693

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8058140A Pending JPH09252453A (en) 1996-03-14 1996-03-14 Digital still video camera

Country Status (1)

Country Link
JP (1) JPH09252453A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002290611A (en) * 2001-03-28 2002-10-04 Minolta Co Ltd Portable device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002290611A (en) * 2001-03-28 2002-10-04 Minolta Co Ltd Portable device

Similar Documents

Publication Publication Date Title
JP4842033B2 (en) Image display apparatus and method for portable terminal
US7405754B2 (en) Image pickup apparatus
US20070050433A1 (en) Method of operating a portable terminal in a calculator mode and portable terminal adapted to operate in the calculator mode
JP4112394B2 (en) Image processing device
JP3664335B2 (en) Information input device
US7456893B2 (en) Method of controlling digital image processing apparatus for efficient reproduction and digital image processing apparatus using the method
JP2005175627A (en) System for taking proceedings
JPH09252453A (en) Digital still video camera
JP5023932B2 (en) Imaging apparatus, image capturing method by scenario, and program
JP4295540B2 (en) Audio recording method and apparatus, digital camera, and image reproduction method and apparatus
JP3677563B2 (en) Digital still camera
JP2005184469A (en) Digital still camera
JP2004208276A (en) Imaging device
JP4197419B2 (en) camera
JP2012129887A (en) Imaging apparatus, control method, and program
KR100426127B1 (en) Transmission system for moving pictures
JP4446242B2 (en) Data transmission device, mail data transmission method, and mail data transmission program
JP2010224782A (en) Moving image generation device, moving image generating method, and moving image generation program
JP2006133433A (en) Voice-to-character conversion system, and portable terminal device, and conversion server and control methods of them
KR100800896B1 (en) Apparatus and method message transmission in mobile telephone
JPH09102901A (en) Electronic still camera
JP4355857B2 (en) Movie recording apparatus, file creation method, and program
JP3633264B2 (en) Imaging apparatus and subject data recording method
JPH1051582A (en) Digital still video camera
JPH09200712A (en) Voice/image transmitter

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040803