JP2000235216A - Voice operable camera - Google Patents

Voice operable camera

Info

Publication number
JP2000235216A
JP2000235216A JP11036221A JP3622199A JP2000235216A JP 2000235216 A JP2000235216 A JP 2000235216A JP 11036221 A JP11036221 A JP 11036221A JP 3622199 A JP3622199 A JP 3622199A JP 2000235216 A JP2000235216 A JP 2000235216A
Authority
JP
Japan
Prior art keywords
voice
camera
data
function
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11036221A
Other languages
Japanese (ja)
Inventor
Junichi Ito
順一 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Olympus Corp
Original Assignee
Olympus Optical Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Olympus Optical Co Ltd filed Critical Olympus Optical Co Ltd
Priority to JP11036221A priority Critical patent/JP2000235216A/en
Publication of JP2000235216A publication Critical patent/JP2000235216A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Exposure Control For Cameras (AREA)
  • Details Of Cameras Including Film Mechanisms (AREA)

Abstract

PROBLEM TO BE SOLVED: To make possible surely executing operation required by a user even when a partial phrase showing a command is omitted when the same command is repeated. SOLUTION: This camera is a voice operable camera recognizing a voice command constituted of plural phrases generated from a camera operator and executing the prescribed operation answering to the voice command. At this time, a DSP(digital signal processor) 31 incorporated in a voice command recognition unit 29 is provided with a function recognizing the phrases constituting the voice command, a function storing the recognized phases and a function detecting that the partial phrases constituting the voice command is omitted and complementing the omitted phrases with the stored phrases, and a CPU 17 being the means controlling the camera operation is provided with a function temporarily changing the function of e.g. a release switch 35 according to the command from the DSP 31.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、ユーザの発音した
音声コマンドを認識し、このコマンドに対応した所定の
動作を実行する音声操作可能なカメラに関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a camera capable of recognizing a voice command pronounced by a user and executing a predetermined operation corresponding to the command.

【0002】[0002]

【従来の技術】音声によりカメラの制御を行う音声制御
カメラは、従来より提案されていて、カメラの特定の機
能を実行させるには、その機能に割り付けられた音声制
御命令を発声することにより行うようになっている。
2. Description of the Related Art A voice control camera for controlling a camera by voice has been conventionally proposed, and a specific function of the camera is executed by issuing a voice control command assigned to the function. It has become.

【0003】このような技術手段の一例として、特開昭
64−56428号公報には、カメラの機能を制御する
制御機構において、音声を入力する音声入力手段と、入
力された音声を認識する音声認識手段と、認識結果に対
応する制御内容に基づいてカメラの機能を制御する制御
手段とを有し、カメラを操作する際に、上記音声入力手
段を介して所望の操作に対応する音声を入力し、入力さ
れた音声を上記音声認識手段により認識し、制御部は認
識結果に対応する制御内容に基づいてカメラの機能を制
御する音声によるカメラの制御方式が記載されている。
As an example of such technical means, Japanese Patent Application Laid-Open No. 64-56428 discloses a control mechanism for controlling the function of a camera, a voice input means for inputting a voice, and a voice for recognizing the input voice. A recognition unit, and a control unit that controls a function of the camera based on the control content corresponding to the recognition result. When operating the camera, a voice corresponding to a desired operation is input via the voice input unit. In addition, a description is given of a camera control method based on sound, in which the input sound is recognized by the sound recognition means, and the control unit controls the function of the camera based on the control content corresponding to the recognition result.

【0004】こうした従来の音声制御カメラにおいて
は、カメラに音声認識機能を有し、カメラユーザの音声
に基いてカメラ機能を自由に操作することが可能であ
る。
In such a conventional voice control camera, the camera has a voice recognition function, and the camera function can be freely operated based on the voice of the camera user.

【0005】[0005]

【発明が解決しようとする課題】ところで、音声コマン
ドでカメラを操作する際に、例えばシャッタ速度を示す
シャッタ秒時(以下、Tv値)を3段階アップしようと
すると、「Tv値アップ」「Tv値アップ」「Tv値ア
ップ」と言わなければならない。しかし、ユーザとして
は「Tv値」と言った時、操作すべきパラメータは、T
v値に固定しており、次に操作すべきパラメータ(例え
ば「絞り値」(以下、Av値という))を言うまで「T
v値」に続く「アップ」はTv値に関連づけられている
言葉であることは明白である。したがって上記命令は、
「Tv値アップ」「アップ」「アップ」と言うことで等
価の意味を持つ方が望ましい。しかしながら、上記従来
の音声制御カメラには、命令を構成する言葉の一部が省
略された時の対応方法が示されていない。
By the way, when operating the camera with a voice command, if the shutter speed (hereinafter referred to as Tv value) indicating the shutter speed is to be increased by three steps, for example, "Tv value increase", "Tv value" You have to say "value up" and "Tv value up". However, when the user says “Tv value”, the parameter to be operated is T
The value is fixed at v value, and “T” is used until a parameter to be operated next (for example, “aperture value” (hereinafter, referred to as Av value))
Obviously, "up" following "v-value" is the word associated with the Tv value. Thus, the above instruction:
It is desirable that the terms “Tv value up”, “up”, and “up” have equivalent meanings. However, the above-mentioned conventional voice control camera does not show a method for dealing with a case where some of the words constituting the command are omitted.

【0006】前後の言葉の流れから明らかに言葉の一部
を省略しても言葉の意味が判明できるならば、カメラユ
ーザとしては、言葉を省略して、より少ない言葉のみの
発音でカメラの動作を指示したいと考える。
[0006] If the meaning of a word can be determined even if a part of the word is clearly omitted from the flow of the words before and after, the camera user operates the camera by omitting the word and using only a few words. I want to tell you.

【0007】そこで、本発明は上記事情に鑑みてなされ
たものであり、同一命令を繰り返すような場合に命令を
示す言葉の一部が省略されても、ユーザが望む動作を確
実に実行させることができる音声操作可能なカメラを提
供することを目的としている。
The present invention has been made in view of the above circumstances, and in the case where the same command is repeated, even if a part of a word indicating the command is omitted, an operation desired by the user is surely executed. It is an object of the present invention to provide a camera capable of voice operation.

【0008】[0008]

【課題を解決するための手段】上記の目的を達成するた
めに、第1の発明は、音声データを認識すると共に、認
識された音声データに基いて所定の設定動作を行う音声
操作可能なカメラであって、特定話者の音声を予めテー
ブルとして有してなり、入力音声とこのテーブルとを照
合して入力音声を認識して音声データに変換する認識手
段と、上記音声データと複数のカメラ操作部材の一つと
を関連付ける第1の解析手段と、上記音声データと上記
操作部材を操作する方向の一つとを関連付ける第2の解
析手段と、上記第1、第2の解析手段の出力をそれぞれ
一つずつ更新記憶する記憶手段と、上記記憶手段に記憶
された情報に基いて、上記操作部材と当該操作部材の操
作方向とを画定し、この情報に応じてカメラを作動させ
る手段と、を具備したものである。
In order to achieve the above object, a first invention is a camera capable of recognizing voice data and performing a predetermined setting operation based on the recognized voice data. A recognition means for preliminarily storing the voice of the specific speaker as a table, recognizing the input voice by comparing the input voice with the table and recognizing the input voice, and converting the voice data into voice data; First analysis means for associating one of the operation members, second analysis means for associating the voice data with one of the directions in which the operation member is operated, and outputs of the first and second analysis means, respectively. Storage means for updating and storing one by one, and means for defining the operation member and the operation direction of the operation member based on the information stored in the storage means, and activating the camera according to the information. Preparation Those were.

【0009】また、第2の発明は、上記第1の発明によ
る音声操作可能なカメラにおいて、第1の解析手段から
データが得られない場合、上記記憶手段に記憶されてい
る当該記憶データを、上記第1の解析手段で得られなか
ったデータとして処理するようにしたことを特徴とする
ものである。
According to a second aspect of the present invention, in the camera capable of voice operation according to the first aspect, when data cannot be obtained from the first analyzing means, the stored data stored in the storing means is replaced with The data is processed as data not obtained by the first analysis means.

【0010】さらに、第3の発明は、上記第1の発明に
よる音声操作可能なカメラにおいて、上記第1の解析手
段の出力に応じた特定の操作部材の機能を、一時的に変
更する手段をさらに備えたことを特徴とするものであ
る。
[0010] Further, a third invention is the camera capable of voice operation according to the first invention, wherein the means for temporarily changing the function of a specific operation member according to the output of the first analysis means is provided. It is further characterized by being provided.

【0011】[0011]

【発明の実施の形態】発明の実施の形態について図面を
参照して説明する。図1は本発明の一実施の形態の音声
操作可能なカメラの構成を示すブロック図である。
Embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of a camera capable of voice operation according to an embodiment of the present invention.

【0012】図1において、撮影レンズは1群,2群,
3群の3つのレンズ群11,12,13より構成されて
いる。2群レンズ群12の位置を変更することにより撮
影レンズの焦点距離が変更できる。2群レンズ群12は
ズームモータ14が駆動源である。ズームモータ14の
回転運動がズーム駆動機構15によって2群レンズ群1
2の光軸上の運動へ変換される。ズームモータ14はズ
ームモータ駆動回路16から電力が供給される。さら
に、カメラシステム全体の制御(撮影動作制御も含む)
を行う制御手段たるCPU(Central Processing Uni
t)17によってズームモータ駆動回路16が制御され
る。CPU17は、カメラの動作を制御する機能のほ
か、特定の操作部材例えばレリーズスイッチ35の機能
である撮影動作開始機能を一時的に他の機能(ズーム機
能,シャッタ速度可変機能,または絞り値可変機能な
ど)に変更する機能を有している。
In FIG. 1, the photographing lenses are group 1, group 2,
It comprises three lens groups 11, 12, and 13 of three groups. By changing the position of the second lens group 12, the focal length of the taking lens can be changed. The second group lens group 12 is driven by a zoom motor 14. The rotational movement of the zoom motor 14 is controlled by the zoom drive
2 on the optical axis. The zoom motor 14 is supplied with power from a zoom motor drive circuit 16. In addition, control of the entire camera system (including shooting operation control)
CPU (Central Processing Uni
The zoom motor drive circuit 16 is controlled by t) 17. In addition to the function of controlling the operation of the camera, the CPU 17 temporarily switches a specific operation member, for example, a shooting operation start function which is a function of the release switch 35, to another function (a zoom function, a shutter speed variable function, or an aperture value variable function). Etc.).

【0013】3群レンズ群13の位置を変更することに
よって被写体に対してピントを合わせることができる。
3群レンズ群13はフォーカスモータ18が駆動源であ
る。フォーカスモータ18の回転運動がフォーカス駆動
機構19によって3群レンズ群13の光軸上の運動へ変
換される。フォーカスモータ18はフォーカス駆動回路
20から電力が供給される。フォーカスモータ駆動回路
20はCPU17によって制御される。撮影レンズ20
の焦点面にはCCD等に代表される撮像素子21が配置
されている。撮像素子21は画像処理回路22によって
制御される。画像処理回路22はCPU17からの指令
に基いて、撮像素子21から画像データを取り込み画像
メモリ23へ記憶する。表示回路24は画像データを表
示するための回路である。ユーザは表示回路24の表示
する画像データによって被写体像の確認ができる。測距
回路25は被写体まで距離を測定するための回路であ
り、被写体に向けて測光用光速を投射する投光素子(L
EDなど)(図示せず)と被写体からの反射光速を受光
する受光素子(図示せず)が接続されている。上記測距
回路25が検出した被写体距離に応じてCPU17が出
力する駆動制御信号に基づきフォーカスモータ駆動回路
20がフォーカスモータ18を制御することによりフォ
ーカス用の3群レンズ群13を合焦位置へ移動させるこ
とができる。撮影レンズの光量を制御する絞り26は、
ステップモータ27によって駆動される。CPU17
は、ステップモータ駆動回路28によってステップモー
タ27を制御する。
By changing the position of the third lens group 13, the object can be focused.
The third group 13 is driven by a focus motor 18. The rotational movement of the focus motor 18 is converted by the focus drive mechanism 19 into movement of the third lens group 13 on the optical axis. The focus motor 18 is supplied with power from a focus drive circuit 20. The focus motor drive circuit 20 is controlled by the CPU 17. Shooting lens 20
An image sensor 21 typified by a CCD or the like is arranged on the focal plane of. The image sensor 21 is controlled by an image processing circuit 22. The image processing circuit 22 captures image data from the image sensor 21 and stores it in the image memory 23 based on a command from the CPU 17. The display circuit 24 is a circuit for displaying image data. The user can confirm the subject image based on the image data displayed by the display circuit 24. The distance measuring circuit 25 is a circuit for measuring a distance to a subject, and is a light projecting element (L) that projects a light speed for photometry toward the subject.
(For example, ED) (not shown) and a light receiving element (not shown) for receiving the speed of light reflected from the subject. The focus motor drive circuit 20 controls the focus motor 18 based on the drive control signal output by the CPU 17 according to the subject distance detected by the distance measurement circuit 25, thereby moving the focus third lens group 13 to the in-focus position. Can be done. The aperture 26 for controlling the light amount of the taking lens is
It is driven by a step motor 27. CPU17
Controls the step motor 27 by the step motor drive circuit 28.

【0014】音声コマンド認識ユニット29は、カメラ
ユーザが発音する音声コマンドを認識して、CPU17
へカメラの動作を示すコマンドを出力する。コマンドは
通信ライン34を通してCPU17へ転送される。音声
コマンド認識ユニット29は、ルックアップテーブルと
しての音声メモリ30、音声処理手段であるDSP(Di
gital Signal Processor)31、音声入力回路32、マ
イク33を含んでいる。
The voice command recognition unit 29 recognizes voice commands pronounced by the camera user, and
To output a command indicating the operation of the camera. The command is transferred to the CPU 17 through the communication line 34. The voice command recognition unit 29 includes a voice memory 30 as a lookup table and a DSP (Di
Gital Signal Processor) 31, an audio input circuit 32, and a microphone 33.

【0015】DSP31は、音声メモリ30とともに音
声コマンドを構成する言葉を認識する機能を形成するほ
か、認識した言葉を記憶する機能と、音声コマンドを構
成する言葉の一部が省略されたことを検知して、上記記
憶された言葉で省略された言葉を補完する機能を有して
おり、CPU17は、音声コマンドの一部が省略されて
いてもDSP31からの補完されたコマンドに基づいて
カメラに所定の動作を行わせることになる。或いは、D
SP31は、入力音声を認識し音声データに変換する認
識手段と、上記音声データと複数のカメラ操作部材(又
はカメラ操作部位)の一つとを転送データ1(図2参
照)を用いて関連付ける第1の解析手段と、上記音声デ
ータと上記操作部材(又は操作部位)を操作(動作)す
る方向の一つとを転送データ2(図2参照)を用いて関
連付ける第2の解析手段と、第1,第2の解析手段の出
力をそれぞれ一つずつDSP内部のレジスタを用いて更
新記憶する記憶手段と、この記憶手段に記憶された情報
に基いて上記操作部材(又は操作部位)と当該操作部材
(又は操作部位)の操作方向とを画定する手段とを有し
ており、CPU17は、確定した上記操作部材(又は操
作部位)と当該操作部材(又は操作部位)の操作方向の
情報に応じてカメラに所定の動作を行わせることにな
る。
The DSP 31 forms a function of recognizing the words constituting the voice command together with the voice memory 30, and also has a function of storing the recognized words and a function of detecting that some of the words constituting the voice command have been omitted. In addition, the CPU 17 has a function of complementing the abbreviated words with the stored words. Even if a part of the voice command is omitted, the CPU 17 sends a predetermined command to the camera based on the complemented command from the DSP 31. Operation is performed. Or D
The SP 31 associates a recognition unit that recognizes an input voice and converts the voice data into voice data, and associates the voice data with one of a plurality of camera operation members (or camera operation parts) using transfer data 1 (see FIG. 2). Analysis means for associating the voice data with one of the directions in which the operation member (or operation part) is operated (operated) using transfer data 2 (see FIG. 2); A storage means for updating and storing one output of each of the second analysis means by using a register in the DSP, and the operation member (or the operation part) and the operation member (or the operation member) based on the information stored in the storage means. Or means for defining an operation direction of the operating member (or the operating part), and the CPU 17 controls the camera in accordance with the determined operation member (or operating part) and information on the operating direction of the operating member (or the operating part). Thereby to perform a predetermined operation.

【0016】ユーザの発音する音声コマンドはマイク3
3が電気信号へ変換し音声入力回路32を介してDSP
31へ出力する。音声入力回路32は、増幅器とA/D
変換器を備え、マイク33からの電気信号を増幅し、A
/D変換器を用いて、デジタル信号へ変換する。DSP
31ではこのデジタル信号と音声メモリ30にテーブル
として記憶されたユーザの音声情報との照合を行う。そ
して照合結果に基いて所定の動作を行わせるためのコマ
ンド(CPU17が判別可能なコマンドコード)をCP
U17へ出力する。
The voice command that the user pronounces is the microphone 3
3 converts the signal into an electric signal, and the DSP
Output to 31. The audio input circuit 32 includes an amplifier and an A / D
A converter for amplifying an electric signal from the microphone 33;
The signal is converted into a digital signal using a / D converter. DSP
At 31, the digital signal is collated with the user's voice information stored as a table in the voice memory 30. Then, a command (command code that can be determined by the CPU 17) for causing a predetermined operation to be performed based on the collation result is output to the CP.
Output to U17.

【0017】図2によりDSP31とCPU17との通
信方法について説明する。通信ライン34は4つの信号
線RQ,EN,DT,CKより構成される。信号の流れ
(←)はDSP31が信号を出力し、CPU17が受け
ることを示す。信号の流れ(→)は、CPU17が信号
を出力し、DSP31が受けることを示している。
A communication method between the DSP 31 and the CPU 17 will be described with reference to FIG. The communication line 34 includes four signal lines RQ, EN, DT, and CK. The signal flow (←) indicates that the DSP 31 outputs a signal and the CPU 17 receives the signal. The signal flow (→) indicates that the CPU 17 outputs a signal and the DSP 31 receives the signal.

【0018】通信は以下のごとく行われる。DSP31
は、信号線RQの電圧レベルをハイ(High)からロー
(Low )へ変化させ、CPU17に対してコマンドの転
送動作の許可を求める。CPU17は信号線RQのこの
変化を検出すると、信号線ENをハイ(High)からロー
(Low)へ変化させ、コマンドの転送動作を許可する。
DSP31は、信号線ENのこの変化を検出すると信号
線CKへクロック信号を出力し、このクロック信号に同
期させて信号線DTに2バイトのデータ(各1バイトの
転送データ1,2)で構成されるコマンドを出力する。
CPU17は、この2バイトのコマンドデータを入力す
ると信号線ENをロー(Low )からハイ(High)へ変化
させることでコマンドの受信が終了したことをDSP3
1へ伝える。DSP31は信号線ENのこの変化を受け
て信号線RQをハイ(High)へ戻す。表1は、DSP3
1がCPU17へ出力するコマンド(転送データ1,
2)とCPU17の動作との対応を示したものである。
表中、HEXは16進を表す。
Communication is performed as follows. DSP31
Changes the voltage level of the signal line RQ from high (High) to low (Low), and requests the CPU 17 to permit the command transfer operation. When detecting this change of the signal line RQ, the CPU 17 changes the signal line EN from high to low and permits the command transfer operation.
When the DSP 31 detects this change of the signal line EN, it outputs a clock signal to the signal line CK and synchronizes with the clock signal to form two-byte data (one-byte transfer data 1 and 2) on the signal line DT. Output the command to be executed.
When receiving the 2-byte command data, the CPU 17 changes the signal line EN from low (Low) to high (High) to notify the DSP 3 that the reception of the command has been completed.
Tell 1 The DSP 31 returns the signal line RQ to high in response to the change of the signal line EN. Table 1 shows DSP3
1 to the CPU 17 (the transfer data 1,
3 shows the correspondence between 2) and the operation of the CPU 17.
In the table, HEX represents hexadecimal.

【0019】[0019]

【表1】 レリーズスイッチ(以下、レリーズSW)35は、2つ
のSW(1RSWと2RSW)より構成されたスイッチ
である。レリーズSW35をユーザが軽く押す(半押
し)と1RSWのみがオンする。さらにレリーズSW3
5を押し込む(深押し)と1RSWとともに2RSWも
オンする。レリーズSW35は、ユーザがカメラに対し
て露出動作を実行させたい時即ち撮影動作を開始したい
時に操作するスイッチである。本発明のカメラシステム
では、露出動作を指令するためのスイッチとしてのレリ
ーズSW35の機能を、音声コマンドによって機能変更
し他の機能を実行する際のスイッチとして利用すること
も可能である。この点については後述する。
[Table 1] The release switch (hereinafter, release SW) 35 is a switch composed of two SWs (1RSW and 2RSW). When the user presses the release SW 35 lightly (half-press), only the 1RSW is turned on. Release SW3
When 5 is pushed in (deeply pushed), 2RSW is turned on together with 1RSW. The release SW 35 is a switch that is operated when the user wants the camera to perform an exposure operation, that is, starts a shooting operation. In the camera system of the present invention, the function of the release SW 35 as a switch for instructing an exposure operation can be used as a switch when the function is changed by a voice command and another function is executed. This will be described later.

【0020】図3と図4はDSP31の動作を示したフ
ローチャートである。図3と図4は本来1つの図面であ
るが、記載上2つに分割したものである。
FIGS. 3 and 4 are flowcharts showing the operation of the DSP 31. 3 and 4 are originally one drawing, but are divided into two for the sake of description.

【0021】ステップS200 では、ユーザが音声コマン
ドにより、音声入力を行うまで待機する。ユーザがカメ
ラへ音声コマンドを発声すると、音声入力回路32は、
マイク33の出力する音声信号をデジタル信号へ変換
し、音声データとしてDSP31へ出力する。S201 に
おいてDSP31はこの音声データを入力する。S202
では音声データと音声メモリ30に記憶された言葉を照
合して、ユーザの発音した音声コマンドを認識する。カ
メラの動作を指示する音声コマンドは、基本的には2つ
の単語より構成される。S203 では音声コマンドを構成
する第一単語が「露光」であるか判定する。露出動作を
指示する音声コマンドは第一単語のみである。第一単語
が「露光」ならばS204 へ移行する。S204 では、CP
U17に対して所定のデータを2バイト出力する。これ
は表1の#1で示された。通信形式である。第一単語が
「露光」でなけばS203 からS210 へ移行する。そして
第一単語が「レリーズSW」の時は、S211 へ移行し、
そうでなければS220 へ移行する。S211 では第二単語
が「ZOOM」であるか判定する。「ZOOM」ならば
S212 へ移行し、表1の#2で示された所定のデータを
CPU17へ転送する。このデータを受信したCPU1
7はレリーズSW35を撮影レンズの焦点距離を変更す
るためのSW(スイッチ)として機能させるS211 で
「ZOOM」でなければS213 へ移行する。S213 へ移
行すると、第二単語が「Tv値」であるか判定する。
「Tv値」ならばS214 へ移行し、表1の#3で示され
た所定のデータをCPU17へ転送する。このデータを
受信したCPU17はレリーズSW35をシャッタ秒時
(撮像素子21の電荷積分時間に対応する)を設定する
ためのSWとして機能させる。
In step S200, the process waits until the user inputs a voice by voice command. When the user utters a voice command to the camera, the voice input circuit 32
The audio signal output from the microphone 33 is converted into a digital signal and output to the DSP 31 as audio data. In step S201, the DSP 31 inputs the audio data. S202
Then, the voice data is compared with the words stored in the voice memory 30 to recognize the voice command pronounced by the user. A voice command for instructing the operation of the camera is basically composed of two words. In S203, it is determined whether the first word constituting the voice command is “exposure”. The voice command instructing the exposure operation is only the first word. If the first word is "exposure", the process proceeds to S204. In S204, the CP
Two bytes of predetermined data are output to U17. This is indicated by # 1 in Table 1. Communication format. If the first word is not "exposure", the process moves from S203 to S210. When the first word is "release SW", the process goes to S211 and
If not, proceed to S220. In S211, it is determined whether the second word is "ZOOM". If it is “ZOOM”, the flow shifts to S212, and the predetermined data indicated by # 2 in Table 1 is transferred to the CPU 17. CPU 1 that has received this data
In step S211 the release SW 35 functions as a SW (switch) for changing the focal length of the photographing lens. If "ZOOM" is not set, the flow advances to step S213. In S213, it is determined whether the second word is “Tv value”.
If the value is “Tv value”, the process proceeds to S214, and the predetermined data indicated by # 3 in Table 1 is transferred to the CPU 17. Upon receiving this data, the CPU 17 causes the release SW 35 to function as a SW for setting the shutter time (corresponding to the charge integration time of the image sensor 21).

【0022】S213 で「Tv値」でなければS215 へ移
行する。S215 へ移行すると第二単語が「Av値」であ
るか判定する。「Av値」ならばS216 へ移行し、表1
の#4で示された所定のデータをCPU17へ転送す
る。このデータを受信したCPU17はレリーズSW3
5を絞り値を設定するためのSWとして機能させる。
If it is not "Tv value" in S213, the process proceeds to S215. In S215, it is determined whether the second word is “Av value”. If "Av value", the process proceeds to S216, and Table 1
Is transferred to the CPU 17. Upon receiving this data, the CPU 17 releases the release SW3
5 functions as a switch for setting the aperture value.

【0023】S210 からS220 へ移行すると第一単語が
「ZOOM」であるか判定する。「ZOOM」ならばS
221 へ移行し、そうでなければ、S230 へ移行する。S
221では第二単語が「Up」であるか判定する。「U
p」ならばS222 へ移行し、表1の#5で示された所定
のデータをCPU17へ転送する。このデータを受信し
たCPU17は、撮影レンズの焦点距離をワイド(Wid
e)側からテレ(Tele)側へ所定量変更する。データの
転送が終了するとS245 へ移行する。S245 では第一単
語をDSP31内部のレジスタへ記憶する。当該DSP
31内のレジスタは操作部材(又は操作部位)を示す言
葉を記憶する記憶手段として機能する。記憶する理由
は、ユーザがカメラに対して音声コマンドにより動作指
示をする時、第一単語を省略する場合があるからであ
る。第一単語が省略された時は、このレジスタに記憶さ
れた単語が代用されることになる。〔なお、表1の#5
で示された所定のデータ(これは操作部材又は部位を操
作する方向を示す言葉である第二単語「Up」を含んで
いる)をCPU17へ転送するためには、第二単語につ
いても一時的にDSP31内部の別のレジスタに記憶す
ることが必要なことは勿論である。〕S221 で「Up」
でなければS223 へ移行する。S223 へ移行すると第二
単語が「Down」であるか判定する。「Down」な
らばS224 へ移行し、表1の#6で示された所定のデー
タをCPU17へ転送する。このデータを入力したCP
U17は、撮影レンズの焦点距離をテレ(Tele)側から
ワイド(Wide)側へ所定量変更する。データの転送が終
了するとS245 において第一単語「ZOOM」をDSP
31内のレジスタへ記憶する。S220 で第一単語が「Z
OOM」でなくS230 へ移行すると第一単語が「Tv
値」であるか判定する。「Tv値」ならばS231 へ移行
し、そうでなければS240 へ移行する。S231 では第二
単語が「Up」であるか判定する。「Up」ならばS23
2 へ移行し、表1の#7に示した所定のデータをCPU
17へ転送する。このデータを受信したCPU17は、
シャッタ秒時を高速側へ+1段変更する。S232 の動作
終了後S245 へ移行して第一単語「Tv」をDSP31
内のレジスタへ記憶する。S231 で「Up」でなければ
S233 へ移行する。S233 へ移行すると第二単語「Do
wn」であるか判定する。「Down」ならばS234 へ
移行し、表1の#8に示したデータをCPU17へ転送
する。CPU17はこのデータを受信すると、シャッタ
秒時を低速側へ1段変更する。S234 の動作終了後、第
一単語「Tv値」をDSP31内のレジスタへ記憶する
ため、S245 へ移行する。S230 で第一単語が「Tv
値」でなくS240 へ移行すると、第一単語が「Av値」
であるか判定する。「Av値」ならばS241 へ移行し、
そうでなければ、S250 へ移行する。S241 では第二単
語が「Up」であるか判定する。「Up」ならばS242
へ移行し、表1の#9に示されたデータがCPU17へ
転送される。CPU17はデータを受信すると絞り値を
プラス1段変更する。S242 の処理が終了すると第一単
語「Av値」をDSP31内に記憶するためS245 へ移
行する。S241 で「Up」でなくS243 へ移行すると第
二単語が「Down」であるか判定する。「Down」
ならばS244 へ移行し、表1の#10で示されるデータ
をCPU17へ出力する。このデータを入力したCPU
17は、絞り値をマイナス1段変更する。S244 の処理
終了後、第一単語「Av値」をDSP31内に記憶する
ためS245 へ移行する。S240 で第一単語が「Av値」
でないため、S240 からS250 へ移行すると第一単語が
「Up」であるか判定する。「Up」ならばS251 へ移
行する。第一単語が「Up」の時は、ユーザは本来第一
単語として発音すべき言葉を省略していることを示す。
この場合はすでにユーザが省略なしに発音した音声コマ
ンドに含まれた第一単語が必要となる。
When the process proceeds from S210 to S220, it is determined whether the first word is "ZOOM". S for "ZOOM"
The process proceeds to 221; otherwise, the process proceeds to S230. S
At 221, it is determined whether the second word is “Up”. "U
If "p", the flow shifts to S222, and the predetermined data indicated by # 5 in Table 1 is transferred to the CPU 17. Upon receiving this data, the CPU 17 sets the focal length of the taking lens to wide (Wid).
e) Change a predetermined amount from the Tele side to the Tele side. Upon completion of the data transfer, the flow shifts to S245. In S245, the first word is stored in a register inside the DSP 31. The DSP
The register in 31 functions as storage means for storing words indicating operation members (or operation parts). The reason for storing is that the first word may be omitted when the user gives an operation instruction to the camera by a voice command. If the first word is omitted, the word stored in this register will be substituted. [Note that # 5 in Table 1
In order to transfer to the CPU 17 the predetermined data (including the second word “Up”, which is a word indicating the direction in which the operating member or the part is operated), the second word is also temporarily stored. Needless to say, it is necessary to store the data in another register inside the DSP 31. ] "Up" in S221
If not, the process proceeds to S223. In S223, it is determined whether the second word is “Down”. If it is "Down", the flow shifts to S224, where predetermined data indicated by # 6 in Table 1 is transferred to the CPU 17. CP that input this data
U17 changes the focal length of the photographing lens by a predetermined amount from the tele side to the wide side. When the data transfer is completed, the first word “ZOOM” is sent to the DSP in S245.
31 is stored in a register. In S220, the first word is "Z
If you move to S230 instead of "OM", the first word will be "Tv
Value ”. If "Tv value", the process proceeds to S231; otherwise, the process proceeds to S240. In S231, it is determined whether the second word is "Up". S23 if "Up"
2 and the predetermined data shown in # 7 of Table 1 is transferred to the CPU.
Transfer to 17. Upon receiving this data, the CPU 17
Change the shutter speed to +1 step to the high speed side. After the operation of S232 is completed, the process proceeds to S245 and the first word “Tv” is added to the DSP 31.
To the register inside. If it is not "Up" in S231, the flow shifts to S233. When the process proceeds to S233, the second word “Do
wn ”. If it is "Down", the flow shifts to S234, and the data shown in # 8 of Table 1 is transferred to the CPU 17. When receiving this data, the CPU 17 changes the shutter speed by one stage to a lower speed side. After the operation of S234 ends, the process moves to S245 to store the first word “Tv value” in a register in the DSP 31. In S230, the first word is “Tv
If you go to S240 instead of “Value”, the first word will be “Av value”
Is determined. If "Av value", the process proceeds to S241,
Otherwise, shift to S250. In S241, it is determined whether the second word is “Up”. S242 if "Up"
Then, the data indicated by # 9 in Table 1 is transferred to the CPU 17. When receiving the data, the CPU 17 changes the aperture value by one step. When the process of S242 is completed, the process moves to S245 to store the first word “Av value” in the DSP 31. If the process proceeds to S243 instead of "Up" in S241, it is determined whether the second word is "Down". "Down"
If so, the flow shifts to S244, where data indicated by # 10 in Table 1 is output to the CPU 17. CPU that input this data
A step 17 changes the aperture value by one step. After the process of S244, the process proceeds to S245 to store the first word “Av value” in the DSP 31. In S240, the first word is “Av value”
Therefore, when the process proceeds from S240 to S250, it is determined whether the first word is “Up”. If "Up", the process proceeds to S251. When the first word is “Up”, it indicates that the user has omitted the word that should be pronounced as the first word.
In this case, the first word included in the voice command already pronounced by the user without omission is required.

【0024】S251 ではDSP31内部のレジスタに記
憶された第一単語を読み出す、この単語はS245 におい
て記憶されたものである。S252 では記憶されていた第
一単語が「ZOOM」であるか判定する。「ZOOM」
ならばユーザは「ZOOMUp」を「Up」と省略した
ことを意味する。「ZOOM」ならば、S253 において
表1の#5に示されたデータをCPU17へ転送する。
そして次の音声コマンドを入力するためS200へ移行
する。S252 からS254 へ移行した時は、記憶されてい
た単語が「Tv値」であるか判定する。「Tv値」なら
ば「Tv値Up」を「Up」と省略したことを意味す
る。「Tv値」ならばS255 において表1の#7の示さ
れたデータをCPU17へ転送する。S254 からS256
へ移行した時は、記憶された単語が「Av値」であるか
判定する。「Av値」ならば「Av値Up」と本来言う
べきコマンドを「Up」と省略したことを意味する。
「Av値」ならばS257 において表1の#9に示された
データをCPU17へ転送する。
In S251, the first word stored in the register inside the DSP 31 is read. This word is the one stored in S245. In S252, it is determined whether the stored first word is "ZOOM". "ZOOM"
Then, it means that the user has omitted "ZOOMUp" as "Up". If it is "ZOOM", the data indicated by # 5 in Table 1 is transferred to the CPU 17 in S253.
Then, the process proceeds to S200 to input the next voice command. When shifting from S252 to S254, it is determined whether the stored word is a “Tv value”. “Tv value” means that “Tv value Up” is abbreviated as “Up”. If "Tv value", the data indicated by # 7 in Table 1 is transferred to the CPU 17 in S255. S254 to S256
When the process proceeds to, it is determined whether the stored word is “Av value”. “Av value” means that a command that should be originally called “Av value Up” is abbreviated as “Up”.
If "Av value", the data indicated by # 9 in Table 1 is transferred to the CPU 17 in S257.

【0025】S250 で第一単語が「Up」でない時は、
S250 からS260 へ移行し、第一単語が「Down」で
ないか判定する。第一単語が「Down」ならば、音声
コマンドの一部を省略したことを意味する。省略された
言葉はすでに発音された音声コマンドに含まれている。
すでに発音した言葉は、S245 においてDSP31の記
憶手段の一部であるレジスタ中に記憶した。S260 で第
一単語が「Down」でなければS261 へ移行する。
If the first word is not "Up" in S250,
The process shifts from S250 to S260 to determine whether the first word is “Down”. If the first word is “Down”, it means that part of the voice command has been omitted. The abbreviated words are already included in the pronounced voice command.
The words already pronounced are stored in a register which is a part of the storage means of the DSP 31 in S245. If the first word is not "Down" in S260, the process proceeds to S261.

【0026】S261 ではDSP31内部のレジスタに記
憶されている省略された第一単語を読み出す。S262 で
は記憶されていた単語が「ZOOM」であるか判定す
る。「ZOOM」ならばユーザは「ZOOM Dow
n」を「Down」と省略したことを意味する。「ZO
OM」ならばS263 において表1の#6に示されたデー
タをCPU17へ転送する。そして次の音声コマンドを
入力するためS200 へ移行する。S262 からS264 へ移
行した時は、記憶されていた第一単語が「Tv値」であ
るか判定する。「Tv値」ならば「Tv値 Down」
を「Down」と省略したことを意味する。「Tv値」
ならばS265 において、表1の#8に示されたデータを
CPU17へ転送する。S264 からS266 へ移行した時
は、記憶された第一単語が「Av値」であるか判定す
る。「Av値」ならば「Av値 Down」と本来言う
べきコマンドを「Down」と省略したことを意味す
る。「Av値」ならばS267 において表1の#10に示
されたデータをCPU17へ転送する。
In S261, the omitted first word stored in the register inside the DSP 31 is read. In S262, it is determined whether the stored word is "ZOOM". If "ZOOM", the user is "ZOOM Dow
n "is abbreviated as" Down ". "ZO
If "OM", the data indicated by # 6 in Table 1 is transferred to the CPU 17 in S263. Then, the process proceeds to S200 to input the next voice command. When the process proceeds from S262 to S264, it is determined whether the stored first word is a “Tv value”. If "Tv value", "Tv value Down"
Is abbreviated as “Down”. "Tv value"
If so, in S265, the data indicated by # 8 in Table 1 is transferred to the CPU 17. When the process proceeds from S264 to S266, it is determined whether the stored first word is “Av value”. “Av value” means that the command that should be originally called “Av value Down” is abbreviated as “Down”. If "Av value", the data indicated by # 10 in Table 1 is transferred to the CPU 17 in S267.

【0027】図5はCPU17の動作を示したフローチ
ャートである。すでに説明したように、DSP31は音
声コマンドを検出すると、コマンドに応じた2バイトの
データをCPU17へ出力する。このデータはS100 に
おいて受信される。DSP31からのデータを入力した
時は、S101 からS110 へ移行し、DSP31からのデ
ータがない時は、S101 からS102 へ移行する。S110
では、DSP31からの通信データに応じた分岐動作が
行われる。DSP31から転送されるデータの1バイト
目が10[HEX]ならばS111 へ移行し、ここでDS
P31から転送されるデータの2バイト目がCPU17
内のSW機能レジスタへ格納される。SW機能レジスタ
は、DSP31からのコマンドに応じて特定の操作部材
であるレリーズスイッチ35の機能を一時的に変更する
手段として機能する。このCPU内のSW機能レジスタ
の作用によって、レリーズSW35を本来定められた機
能以外の利用が可能となる。これについては後述する。
FIG. 5 is a flowchart showing the operation of the CPU 17. As described above, when detecting the voice command, the DSP 31 outputs 2-byte data corresponding to the command to the CPU 17. This data is received at S100. When data from the DSP 31 has been input, the process proceeds from S101 to S110, and when there is no data from the DSP 31, the process proceeds from S101 to S102. S110
Then, a branch operation according to communication data from the DSP 31 is performed. If the first byte of the data transferred from the DSP 31 is 10 [HEX], the flow shifts to S111, where DS
The second byte of the data transferred from P31 is the CPU 17
Is stored in the SW function register inside. The SW function register functions as a means for temporarily changing the function of the release switch 35, which is a specific operation member, in response to a command from the DSP 31. By the operation of the SW function register in the CPU, the release SW 35 can be used for functions other than the originally determined function. This will be described later.

【0028】CPU17内のSW機能レジスタの設定が
終了すると次の指令を受けるため前記S100 へ移行す
る。
When the setting of the SW function register in the CPU 17 is completed, the process shifts to S100 to receive the next command.

【0029】DSP31からのデータが2001[HE
X]ならばS112 へ移行する。S112 では、ズームモー
タ14を制御して撮影レンズの焦点距離を長焦点側へ所
定量変更する。DSP31からのデータが2002[H
EX]ならばS113 へ移行する。S113 では撮影レンズ
の焦点距離を短焦点側へ所定量変更する。DSP31か
らのデータがb001[HEX]ならばS114 へ移行す
る。S114 ではシャッタ秒時を1段高速側へ変更する。
DSP31からのデータが4001[HEX]ならばS
115 へ移行する。S115 では、絞りの設定値を絞り込む
方向へ1段変更する。DSP31からのデータがb00
2[HEX]ならばS116 へ移行する。S116 ではシャ
ッタ秒時を1段低速側へ変更する。DSP31からのデ
ータが4002[HEX]ならばS117 へ移行する。S
117 では、絞りの設定値を開放側へ1段変更する。DS
P31からのデータが8080[HEX]ならばS118
へ移行する。
The data from the DSP 31 is 2001 [HE
X], the flow shifts to S112. In step S112, the zoom motor 14 is controlled to change the focal length of the taking lens by a predetermined amount toward the long focal length. The data from the DSP 31 is 2002 [H
[EX], the process proceeds to S113. In S113, the focal length of the taking lens is changed by a predetermined amount toward the short focal length. If the data from the DSP 31 is b001 [HEX], the process proceeds to S114. In S114, the shutter speed is changed to the one-step high-speed side.
If the data from the DSP 31 is 4001 [HEX], S
Move to 115. In S115, the aperture setting value is changed by one step in the direction of narrowing down. The data from the DSP 31 is b00
If it is 2 [HEX], the flow shifts to S116. In S116, the shutter speed is changed to the one-step lower speed side. If the data from the DSP 31 is 4002 [HEX], the flow shifts to S117. S
At 117, the aperture setting is changed by one step toward the open side. DS
If the data from P31 is 8080 [HEX], S118
Move to.

【0030】S118 では、測距回路25から被写体まで
の距離情報を入力する。この距離情報に基いてフォーカ
スモータ18を制御し、被写体像を撮像素子21上へ結
像させる。S119 では設定された絞り値に基いてステッ
プモータ27を制御する。そして設定されたシャッタ秒
時に基いて撮像素子21を制御して、画像データを取り
込む。
In step S118, distance information from the distance measuring circuit 25 to the subject is input. The focus motor 18 is controlled based on the distance information to form a subject image on the image sensor 21. In S119, the step motor 27 is controlled based on the set aperture value. Then, the image sensor 21 is controlled based on the set shutter time to capture image data.

【0031】S101 で音声コマンド入力がなければS10
2 へ移行する。S102 へ移行すると、カメラの操作SW
の1つであるレリーズSW35の状態を入力する。レリ
ーズSW35に変化がない時は、S103 からS100 へ移
行し、スイッチの変化を検出した時は、S103 からS10
4 へ移行する。S104 では、CPU17内のSW機能レ
ジスタの設定値に応じた分岐動作が行われる。CPU1
7内のSW機能レジスタの値が00[HEX]ならばS
120 へ、20[HEX]ならばS130 へ、b0[HE
X]ならば、S140 へ、40[HEX]ならばS150 へ
それぞれ分岐する。CPU17内のSW機能レジスタの
作用によって、レリーズSW35は本来の機能以外の機
能をもつことになる。このような機能を設けた理由は以
下に説明する。
If there is no voice command input in S101, S10
Move to 2. When the process proceeds to step S102, the operation switch
, The state of the release SW 35 is input. If there is no change in the release SW 35, the process proceeds from S103 to S100, and if a change in the switch is detected, the process proceeds from S103 to S10.
Move to 4. In S104, a branch operation according to the set value of the SW function register in the CPU 17 is performed. CPU1
If the value of the SW function register in 7 is 00 [HEX], S
120, if 20 [HEX], go to S130, b0 [HE
X], the flow branches to S140, and if it is 40 [HEX], the flow branches to S150. By the function of the SW function register in the CPU 17, the release SW 35 has a function other than the original function. The reason for providing such a function will be described below.

【0032】従来のカメラシステムでは、複雑な動作を
指示するため、あるいは撮影に必要なパラメータ、条件
を決定するためには多数のスイッチ(SW)が必要であ
った。しかし、SWの数が増えると操作が煩雑になり、
ユーザにとって使用しずらいカメラとなる。またカメラ
を小型化する上で、SWの数が多いことは障害となる。
そこで1つのSWで多数の機能が設定できることはこれ
らの問題を解決する上で重要である。SWの機能を設定
する際に、SWを使用せずに設定できればより操作性が
向上する。例えば片手しか使用できないユーザにとって
は、カメラを保持しながら操作することができるSWの
数は非常に限られたものである。しかし、操作可能な限
られたSWの機能を、音声コマンドによって様々な機能
へ変更できれば、ユーザメリットは測り難いものとな
る。本実施の形態ではレリーズSW35を音声コマンド
によってさまざま機能設定が可能なように構成してい
る。しかし、カメラに存在する操作SWすべてに対して
このような構成は可能であり、レリーズSW35は1つ
の代表でしかない。CPU17内のSW機能レジスタが
00[HEX]の時、レリーズSW35は本来の機能と
しての働きをする。S120 では1RSWがオン(ON)
しているか判定する。1RSWがオンしている時は、S
121 において焦点調整動作が行われる。そして焦点調整
動作終了後、S122 において2RSWの状態の判定を行
う。2RSWがオンしている時は、S123において撮影
動作が行われる。
In a conventional camera system, a large number of switches (SW) were required to instruct a complicated operation or to determine parameters and conditions necessary for photographing. However, the operation becomes complicated when the number of SWs increases,
This makes the camera hard to use for the user. Also, in reducing the size of the camera, a large number of SWs is an obstacle.
Therefore, it is important to be able to set many functions with one SW in order to solve these problems. When the function of the SW is set, if the setting can be performed without using the SW, the operability is further improved. For example, for a user who can use only one hand, the number of SWs that can be operated while holding the camera is very limited. However, if the limited functions of the operable SW can be changed to various functions by voice commands, the user's merit becomes difficult to measure. In the present embodiment, the release SW 35 is configured so that various functions can be set by voice commands. However, such a configuration is possible for all operation switches existing in the camera, and the release SW 35 is only one representative. When the SW function register in the CPU 17 is 00 [HEX], the release SW 35 functions as an original function. In S120, 1RSW is on (ON)
Determine whether you are. When 1RSW is on, S
At 121, a focus adjustment operation is performed. After the end of the focus adjustment operation, the state of the 2RSW is determined in S122. When the 2RSW is on, a shooting operation is performed in S123.

【0033】S104 でSW機能レジスタが20[HE
X]ならばS130 へ移行する。S130では1RSWのみ
がオン(ON)しているか判定する。オンしている時
は、S131 へ移行しテレ(Tele)側からワイド(Wide)
側へ所定量、焦点距離を変更する。そして、S144 へ移
行しSW機能レジスタを初期化する。レジスタの値は、
00[HEX]になり、レリーズSW35は本来の機能
を有することになる。そしてS100 へ移行する。SW機
能レジスタが20[HEX]で1RSWと2RSWが両
方ともオン(ON)している時は、S132 からS133 へ
移行し、ワイド(Wide)側からテレ(Tele)側へ焦点距
離を変更する。そしてS144 へ移行し、レジスタ値が0
0[HEX]に初期化される。つまり、SW機能レジス
タが20[HEX]ならば、レリーズSW35はZOO
M操作SWへ機能変更される。
In S104, the SW function register sets 20 [HE].
X], the flow shifts to S130. In S130, it is determined whether only 1RSW is ON. When the switch is on, the process proceeds to step S131, and from the tele side, the width is wide.
The focal length is changed by a predetermined amount to the side. Then, the flow shifts to S144, where the SW function register is initialized. The register value is
00 [HEX], and the release SW 35 has the original function. Then, control goes to a step S100. When the SW function register is 20 [HEX] and both the 1RSW and the 2RSW are on (ON), the process goes from S132 to S133 to change the focal length from the wide side to the tele side. Then, the flow shifts to S144, where the register value is 0.
Initialized to 0 [HEX]. That is, if the SW function register is 20 [HEX], the release SW 35 is
The function is changed to the M operation switch.

【0034】S104 でSW機能レジスタがb0[HE
X]ならばS140 へ移行する。S140では1RSWのみ
がオン(ON)しているか判定する。オンしている時
は、S141 においてTv値が高速側へ1段変更される。
そしてS144 のレジスタの初期化へ移行する。1RSW
と2RSWの両方がオン(ON)している時は、S142
からS143 へ移行する。S143 では、Tv値が低速側へ
1段変更される。そしてS144 のレジスタ初期化へ移行
する。つまり、SW機能レジスタがb0[HEX]なら
ば、レリーズSW35はTv値変更SWへ機能変更され
る。
In S104, the SW function register sets b0 [HE
X], the flow shifts to S140. In S140, it is determined whether only 1RSW is on (ON). When the switch is on, the Tv value is changed by one step to the high speed side in S141.
Then, the flow shifts to initialization of the register in S144. 1RSW
When both and 2RSW are on (ON), S142
Then, the flow shifts to S143. In S143, the Tv value is changed by one stage to the lower speed side. Then, the flow shifts to register initialization in S144. That is, if the SW function register is b0 [HEX], the function of the release SW 35 is changed to a Tv value change SW.

【0035】S104 でSW機能レジスタが40[HE
X]ならばS150 へ移行する。S150では、1RSWの
みがオン(ON)しているか判定する。オンしている時
は、S151 へ移行し、Av値をプラス1段変更する。そ
してS144 のレジスタ初期化へ移行する。1RSWと2
RSWの両方がオン(ON)している時は、S152 から
S153 へ移行する。S153 ではAv値をマイナス1段変
更する。そしてS144 のレジスタ初期化へ移行する。つ
まり、SW機能レジスタが40[HEX]ならば、レリ
ーズSW35はAv値変更SWへ機能変更される。
In S104, the SW function register sets 40 [HE].
X], the flow shifts to S150. In S150, it is determined whether only 1RSW is ON. If the switch is on, the process shifts to S151 to change the Av value by one step. Then, the flow shifts to register initialization in S144. 1RSW and 2
When both of the RSWs are on (ON), the process proceeds from S152 to S153. In S153, the Av value is changed by one step. Then, the flow shifts to register initialization in S144. That is, if the SW function register is 40 [HEX], the function of the release SW 35 is changed to the Av value change SW.

【0036】上記実施の形態では電子的撮影動作が可能
なカメラシステムを想定したが、銀塩フィルムを用いる
カメラシステムにも応用可能である。またカメラシステ
ムにかかわりない音声操作可能な電子機器においても本
発明に示された技術を有効に利用することができる。
In the above embodiment, a camera system capable of performing an electronic photographing operation is assumed, but the present invention is also applicable to a camera system using a silver halide film. In addition, the technology described in the present invention can be effectively used in electronic devices that can perform voice operations regardless of the camera system.

【0037】さらに、本実施の形態中の音声コマンドは
第一,第二の2つの単語〔すなわち操作部材又は操作部
位を示す言葉と、操作部材又は操作部位を操作(動作)
する方向を示す言葉〕より構成されているが、さらに多
くの単語(言葉)により構成される音声コマンドに対し
ても、本発明の技術は有効である。
Furthermore, the voice command in the present embodiment is composed of two words, a first word and a second word (ie, a word indicating an operation member or an operation portion, and an operation member (operation).
Word indicating the direction in which the command is performed), but the technology of the present invention is also effective for voice commands composed of more words (words).

【0038】[付記] (1) カメラ操作者の発生する複数の言葉より構成さ
れる音声コマンドを認識し、音声コマンドに対応する所
定の動作を実行する音声操作可能なカメラであって、音
声コマンドを構成する言葉を認識する認識手段と、上記
認識手段が認識した言葉を記憶する記憶手段と、音声コ
マンドを構成する言葉の一部が省略されたことを検知し
て、上記記憶手段に記憶された言葉で省略された言葉を
補完する手段とを具備することを特徴とする音声操作可
能なカメラ。
[Supplementary Notes] (1) A camera capable of recognizing a voice command composed of a plurality of words generated by a camera operator and executing a predetermined operation corresponding to the voice command. Recognizing means for recognizing words constituting the language, storing means for storing the words recognized by the recognizing means, and detecting that a part of the words constituting the voice command is omitted, and storing the words in the storing means. Means capable of supplementing words abbreviated with words.

【0039】(2) カメラ操作者が発音した操作部位
もしくは撮影条件を示す第1の単語とカメラ操作者が発
音した操作部位の操作方向もしくは撮影条件の変更を示
す第2の単語とに基いて所定の動作を行う音声操作可能
なカメラであって、第1の単語及び第2の単語を認識す
る認識手段と、上記認識手段により認識された単語を記
憶する記憶手段と、上記認識手段が第1、第2の単語を
認識した際に、これら2つの単語に基いて動作指示デー
タを生成し、上記認識手段が第2の単語のみを認識した
際には、第2の単語と上記記憶手段に記憶された第1の
単語とに基いて動作指示データを生成する手段とを具備
することを特徴とする音声操作可能なカメラ。
(2) A first word indicating an operation part or a shooting condition pronounced by the camera operator and a second word indicating a change in the operation direction or the shooting condition of the operation part pronounced by the camera operator. A camera operable by voice to perform a predetermined operation, comprising: recognition means for recognizing a first word and a second word; storage means for storing a word recognized by the recognition means; 1. When the second word is recognized, operation instruction data is generated based on these two words. When the recognition means recognizes only the second word, the second word and the storage means are generated. Means for generating operation instruction data based on the first word stored in the camera.

【0040】従って、付記(1)の発明によれば、ユー
ザが発音する音声コマンドを構成する言葉を認識する認
識手段を持っている。そして認識された言葉を記憶する
手段があり、ユーザが音声コマンドの一部を省略した時
は、記憶された言葉をユーザが省略した言葉として扱う
ことでユーザが意図した音声コマンドを構成する。そし
て、この音声コマンドに基いて所定の動作を行うことが
できる。
Therefore, according to the invention of the supplementary note (1), there is a recognition means for recognizing the words constituting the voice command pronounced by the user. Then, there is means for storing the recognized words. When the user omits a part of the voice command, the stored words are treated as the user's abbreviated words to compose the voice command intended by the user. Then, a predetermined operation can be performed based on the voice command.

【0041】[0041]

【発明の効果】以上述べたように本発明によれば、同一
の命令を反復して実行する時、音声コマンドの一部を省
略しても、ユーザが望む動作を実行できることになる。
このことは、同じ言葉を何回も発音する際にユーザが感
じる煩雑感を低減できる。
As described above, according to the present invention, when the same command is repeatedly executed, the operation desired by the user can be performed even if a part of the voice command is omitted.
This can reduce the complexity of the user perceiving the same word many times.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明は一実施の形態の音声操作可能なカメラ
の構成を示すブロック図。
FIG. 1 is a block diagram showing a configuration of a camera capable of voice operation according to an embodiment of the present invention.

【図2】図1の実施の形態におけるDSPとCPUとの
通信方法を説明するタイミングチャート。
FIG. 2 is a timing chart illustrating a communication method between a DSP and a CPU in the embodiment of FIG.

【図3】図1の実施の形態におけるDSPの動作を示す
フローチャート。
FIG. 3 is a flowchart showing the operation of the DSP in the embodiment of FIG. 1;

【図4】図1の実施の形態におけるDSPの動作を示す
フローチャート。
FIG. 4 is a flowchart showing the operation of the DSP in the embodiment of FIG. 1;

【図5】図1の実施の形態におけるCPUの動作を示す
フローチャート。
FIG. 5 is a flowchart showing the operation of the CPU in the embodiment of FIG. 1;

【符号の説明】[Explanation of symbols]

14…ズームモータ 17…CPU(カメラを動作させる手段、制御手段、特
定の操作部材の機能を一時的に変更する手段、) 18…フォーカスモータ 22…画像処理回路 29…音声コマンド認識ユニット(音声コマンドの出力
手段) 30…音声メモリ 31…DSP(認識手段、第1,第2の解析手段、記憶
手段) 32…音声入力回路 33…マイク 35…レリーズスイッチ(特定の操作部材)
14 zoom motor 17 CPU (means for operating the camera, control means, means for temporarily changing the function of a specific operation member) 18 focus motor 22 image processing circuit 29 voice command recognition unit (voice command) 30 ... Voice memory 31 ... DSP (recognition means, first and second analysis means, storage means) 32 ... Voice input circuit 33 ... Microphone 35 ... Release switch (specific operation member)

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 音声データを認識すると共に、認識され
た音声データに基いて所定の設定動作を行う音声操作可
能なカメラであって、 特定話者の音声を予めテーブルとして有してなり、入力
音声とこのテーブルとを照合して入力音声を認識して音
声データに変換する認識手段と、 上記音声データと複数のカメラ操作部材の一つとを関連
付ける第1の解析手段と、 上記音声データと上記操作部材を操作する方向の一つと
を関連付ける第2の解析手段と、 上記第1、第2の解析手段の出力をそれぞれ一つずつ更
新記憶する記憶手段と、 上記記憶手段に記憶された情報に基いて、上記操作部材
と当該操作部材の操作方向とを画定し、この情報に応じ
てカメラを作動させる手段とを具備することを特徴とす
る音声操作可能なカメラ。
1. A camera capable of recognizing voice data and performing a predetermined setting operation based on the recognized voice data, the camera having a voice of a specific speaker in advance as a table, Recognizing means for recognizing the input voice by recognizing the voice with the table and converting the input voice into voice data; first analyzing means for associating the voice data with one of a plurality of camera operating members; Second analysis means for associating one of the directions in which the operating member is operated; storage means for updating and storing one output of each of the first and second analysis means; and information stored in the storage means. A camera capable of voice operation, comprising: means for defining the operation member and the operation direction of the operation member, and activating the camera in accordance with the information.
【請求項2】 上記第1の解析手段からデータが得られ
ない場合、上記記憶手段に記憶されている当該記憶デー
タを、上記第1の解析手段で得られなかったデータとし
て処理するようにしたことを特徴とする請求項1に記載
の音声操作可能なカメラ。
2. When no data is obtained from the first analysis means, the stored data stored in the storage means is processed as data not obtained by the first analysis means. The camera of claim 1, wherein the camera is operable by voice.
【請求項3】 上記第1の解析手段の出力に応じた特定
の操作部材の機能を、一時的に変更する手段をさらに備
えたことを特徴とする請求項1に記載の音声操作可能な
カメラ。
3. The camera according to claim 1, further comprising means for temporarily changing a function of a specific operation member according to an output of said first analysis means. .
JP11036221A 1999-02-15 1999-02-15 Voice operable camera Withdrawn JP2000235216A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11036221A JP2000235216A (en) 1999-02-15 1999-02-15 Voice operable camera

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11036221A JP2000235216A (en) 1999-02-15 1999-02-15 Voice operable camera

Publications (1)

Publication Number Publication Date
JP2000235216A true JP2000235216A (en) 2000-08-29

Family

ID=12463727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11036221A Withdrawn JP2000235216A (en) 1999-02-15 1999-02-15 Voice operable camera

Country Status (1)

Country Link
JP (1) JP2000235216A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US8467672B2 (en) 2005-10-17 2013-06-18 Jeffrey C. Konicek Voice recognition and gaze-tracking for a camera
WO2019138593A1 (en) * 2018-01-09 2019-07-18 法仁 藤原 Imaging device

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8923692B2 (en) 2005-10-17 2014-12-30 Cutting Edge Vision Llc Pictures using voice commands and automatic upload
US8824879B2 (en) 2005-10-17 2014-09-02 Cutting Edge Vision Llc Two words as the same voice command for a camera
US7697827B2 (en) 2005-10-17 2010-04-13 Konicek Jeffrey C User-friendlier interfaces for a camera
US8818182B2 (en) 2005-10-17 2014-08-26 Cutting Edge Vision Llc Pictures using voice commands and automatic upload
US9485403B2 (en) 2005-10-17 2016-11-01 Cutting Edge Vision Llc Wink detecting camera
US8831418B2 (en) 2005-10-17 2014-09-09 Cutting Edge Vision Llc Automatic upload of pictures from a camera
US8897634B2 (en) 2005-10-17 2014-11-25 Cutting Edge Vision Llc Pictures using voice commands and automatic upload
US9936116B2 (en) 2005-10-17 2018-04-03 Cutting Edge Vision Llc Pictures using voice commands and automatic upload
US8467672B2 (en) 2005-10-17 2013-06-18 Jeffrey C. Konicek Voice recognition and gaze-tracking for a camera
US7933508B2 (en) 2005-10-17 2011-04-26 Jeffrey Konicek User-friendlier interfaces for a camera
US8917982B1 (en) 2005-10-17 2014-12-23 Cutting Edge Vision Llc Pictures using voice commands and automatic upload
US10063761B2 (en) 2005-10-17 2018-08-28 Cutting Edge Vision Llc Automatic upload of pictures from a camera
US10257401B2 (en) 2005-10-17 2019-04-09 Cutting Edge Vision Llc Pictures using voice commands
US11818458B2 (en) 2005-10-17 2023-11-14 Cutting Edge Vision, LLC Camera touchpad
US11153472B2 (en) 2005-10-17 2021-10-19 Cutting Edge Vision, LLC Automatic upload of pictures from a camera
JP2019120840A (en) * 2018-01-09 2019-07-22 法仁 藤原 Imaging device
WO2019138593A1 (en) * 2018-01-09 2019-07-18 法仁 藤原 Imaging device

Similar Documents

Publication Publication Date Title
EP0702355B1 (en) Speech recognition method and apparatus
CN110164421B (en) Voice decoding method, device and storage medium
EP0926526A2 (en) Optical device and method for selecting object of focus
JP3420542B2 (en) Optical device, optical device drive unit and camera system
JP3450795B2 (en) Optical device, optical device drive unit, information writing device, preset information setting system, and camera system
CN113329166A (en) Image capturing apparatus, device, control method, and computer-readable storage medium
JP2000235216A (en) Voice operable camera
US5300978A (en) Camera with display for displaying a control operation to be executed
JPH09139876A (en) Digital still video camera and image data for the same
JP2000231142A (en) Camera
JP2003287672A (en) Optical device, optical device drive unit, and camera system
JP4284430B2 (en) Lens operation device
JP2001124977A (en) Optical device, optical device drive unit, and camera system
JP2776737B2 (en) Image processing device
JP4159270B2 (en) Digital camera
JP3673773B2 (en) OPTICAL DEVICE, OPTICAL DEVICE DRIVE UNIT, AND CAMERA SYSTEM
US20040119878A1 (en) Electronic flash control
JP3673774B2 (en) OPTICAL DEVICE, OPTICAL DEVICE DRIVE UNIT, AND CAMERA SYSTEM
JP2000078448A (en) Device and method for selecting camera function and storage medium
JP2007058112A (en) Camera with interchangeable lenses, lens unit, its lens focus setting method, and program
JP3021476B2 (en) Image editing device
JPH0969974A (en) Image pickup device
JPH11341336A (en) Device and method for controlling camera, and storage medium
JP2023028994A (en) Arithmetic unit, imaging apparatus, control method, and program
JP4040121B2 (en) Pan / tilt apparatus and pan / tilt method

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060509