JP7483421B2 - 撮像装置、制御方法、及びプログラム - Google Patents
撮像装置、制御方法、及びプログラム Download PDFInfo
- Publication number
- JP7483421B2 JP7483421B2 JP2020043327A JP2020043327A JP7483421B2 JP 7483421 B2 JP7483421 B2 JP 7483421B2 JP 2020043327 A JP2020043327 A JP 2020043327A JP 2020043327 A JP2020043327 A JP 2020043327A JP 7483421 B2 JP7483421 B2 JP 7483421B2
- Authority
- JP
- Japan
- Prior art keywords
- video
- word
- recording
- control unit
- system control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 81
- 238000003384 imaging method Methods 0.000 title claims description 45
- 230000007704 transition Effects 0.000 claims description 5
- 230000015654 memory Effects 0.000 description 80
- 230000008569 process Effects 0.000 description 61
- 238000012545 processing Methods 0.000 description 51
- 230000008859 change Effects 0.000 description 45
- 230000005236 sound signal Effects 0.000 description 15
- 230000006870 function Effects 0.000 description 12
- 238000012217 deletion Methods 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 238000013528 artificial neural network Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000003825 pressing Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 229910005580 NiCd Inorganic materials 0.000 description 1
- 229910005813 NiMH Inorganic materials 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229920001690 polydopamine Polymers 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000002834 transmittance Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/66—Remote control of cameras or camera parts, e.g. by remote control devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/50—Constructional details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/62—Control of parameters via user interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/65—Control of camera operation in relation to power supply
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/667—Camera operation mode switching, e.g. between still and video, sport and normal or high- and low-resolution modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L2025/783—Detection of presence or absence of voice signals based on threshold decision
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- Studio Devices (AREA)
- Television Signal Processing For Recording (AREA)
Description
-タッチオン:接触体が、動かずにタッチパネル70aに接触している状態であること
-タッチムーブ:接触体が、タッチパネル70aに接触したまま移動していること
-タッチアップ:タッチパネル70aに接触していた接触体が、タッチパネル70aから離れたこと
-タッチオフ:接触体が、タッチパネル70aに接触していないこと
タッチダウンが検出されると、同時にタッチオンも検出される。タッチダウンの後、タッチアップが検出されない限り、通常はタッチオンが検出され続ける。タッチムーブは、タッチオンが検出されている状態において検出される。タッチオンが検出されていても、タッチ位置が移動していなければタッチムーブは検出されない。タッチしていた全ての接触帯がタッチアップしたことが検出された後、タッチオフが検出される。
以上の実施形態は多様に変形される。具体的な変形の態様を以下に例示する。以上の実施形態及び以下の例示から任意に選択された2以上の態様は、相互に矛盾しない限り適宜に併合され得る。
50 システム制御部(制御手段)
90 音声入力部(音声入力手段)
100 デジタルカメラ(撮像装置)
101 シャッター(撮像手段)
103 撮影レンズ(撮像手段)
Claims (15)
- 動画を取得する撮像手段と、
音声を集音する音声入力手段と、
前記音声入力手段が集音した前記音声に含まれるウェイクワード及び制御ワードに基づいて前記動画の記録を制御する制御手段と、を備え、
前記動画の記録を停止することを指示する前記制御ワードが前記音声に含まれる場合、前記制御手段は、前記動画の記録を停止すると共に、前記ウェイクワードの開始時刻までの動画データを動画ファイルとして記録させる、ことを特徴とする撮像装置。 - 前記動画の記録停止のためのウェイクワードをユーザが設定でき、
前記ウェイクワードの前記開始時刻までの前記動画データを前記動画ファイルとして記録させる設定と、前記制御ワードの前記開始時刻までの前記動画データを前記動画ファイルとして記録させる設定とを、前記ユーザが切り替えられる、ことを特徴とする請求項1に記載の撮像装置。 - 前記動画の記録停止のためのウェイクワード及び前記制御ワードをユーザが設定でき、
前記ウェイクワードの前記開始時刻までの前記動画データを前記動画ファイルとして記録させる設定と、前記動画の記録が停止された時刻までの前記動画データを前記動画ファイルとして記録させる設定とを、前記ユーザが切り替えられる、ことを特徴とする請求項1に記載の撮像装置。 - 前記ウェイクワードの前記開始時刻までの前記動画データを前記動画ファイルとして記録させる設定と、前記制御ワードの前記開始時刻までの前記動画データを前記動画ファイルとして記録させる設定と、前記動画の記録が停止された時刻までの前記動画データを前記動画ファイルとして記録させる設定とを、ユーザが切り替えられる、ことを特徴とする請求項1に記載の撮像装置。
- 動画を取得する撮像手段と、
音声を集音する音声入力手段と、
前記音声入力手段が集音した前記音声に含まれるウェイクワード及び制御ワードに基づいて前記動画の記録を制御する制御手段と、を備え、
前記動画の記録を停止することを指示する前記制御ワードが前記音声に含まれる場合、前記制御手段は、前記動画の記録を停止すると共に、前記ウェイクワードの開始時刻に対応する動画データ内のフレームに参照情報を付与して、動画データを動画ファイルとして記録させる、ことを特徴とする撮像装置。 - 前記動画の記録停止のためのウェイクワードをユーザが設定でき、
前記ウェイクワードの前記開始時刻に対応する前記フレームに前記参照情報を付与した前記動画データを前記動画ファイルとして記録させる設定と、前記制御ワードの前記開始時刻に対応する前記フレームに前記参照情報を付与した前記動画データを前記動画ファイルとして記録させる設定とを、前記ユーザが切り替えられる、ことを特徴とする請求項5に記載の撮像装置。 - 前記動画の記録停止のためのウェイクワード及び前記制御ワードをユーザが設定でき、
前記ウェイクワードの前記開始時刻に対応する前記フレームに前記参照情報を付与した前記動画データを前記動画ファイルとして記録させる設定と、前記動画データに前記参照情報を付与せずに前記動画ファイルとして記録させる設定とを、前記ユーザが切り替えられる、ことを特徴とする請求項5に記載の撮像装置。 - 前記ウェイクワードの前記開始時刻に対応する前記フレームに前記参照情報を付与した前記動画データを前記動画ファイルとして記録させる設定と、前記制御ワードの前記開始時刻に対応する前記フレームに前記参照情報を付与した前記動画データを前記動画ファイルとして記録させる設定と、前記動画データに前記参照情報を付与せずに前記動画ファイルとして記録させる設定とを、ユーザが切り替えられる、ことを特徴とする請求項5に記載の撮像装置。
- 前記制御手段は、前記開始時刻を示す前記参照情報が付与された前記フレーム以降の前記動画データを前記動画ファイルから削除する、ことを特徴とする請求項5から請求項8のいずれか1項に記載の撮像装置。
- 動画を取得する撮像手段と、
音声を集音する音声入力手段と、
前記音声入力手段が集音した前記音声に含まれるウェイクワード及び制御ワードに基づいて前記動画の記録を制御する制御手段と、を備え、
前記動画の記録を停止することを指示する前記制御ワードが前記音声に含まれる場合に、前記動画の記録を停止すると共に前記ウェイクワードの開始時刻までの動画データを動画ファイルとして記録させる設定と、前記動画の記録を停止すると共に前記ウェイクワードの開始時刻に対応する動画データ内のフレームに参照情報を付与して動画データを動画ファイルとして記録させる設定とを、ユーザが切り替えられる、ことを特徴とする撮像装置。 - 前記制御手段は、前記音声入力手段を介して前記ウェイクワードが入力されると前記制御ワードを受付可能な状態に遷移する、ことを特徴とする請求項1から請求項10のいずれか1項に記載の撮像装置。
- 動画を取得する撮像手段と、
音声を集音する音声入力手段と、を備える撮像装置の制御方法であって、
前記音声入力手段が集音した前記音声に含まれるウェイクワード及び制御ワードに基づいて前記動画の記録を制御することと、
前記動画の記録を停止することを指示する前記制御ワードが前記音声に含まれる場合、前記動画の記録を停止すると共に、前記ウェイクワードの開始時刻までの動画データを動画ファイルとして記録させることと、を備えることを特徴とする制御方法。 - 動画を取得する撮像手段と、
音声を集音する音声入力手段と、を備える撮像装置の制御方法であって、
前記音声入力手段が集音した前記音声に含まれるウェイクワード及び制御ワードに基づいて前記動画の記録を制御することと、
前記動画の記録を停止することを指示する前記制御ワードが前記音声に含まれる場合、前記動画の記録を停止すると共に、前記ウェイクワードの開始時刻に対応する動画データ内のフレームに参照情報を付与して、動画データを動画ファイルとして記録させることと、を備えること特徴とする制御方法。 - 動画を取得する撮像手段と、
音声を集音する音声入力手段と、を備える撮像装置の制御方法であって、
前記音声入力手段が集音した前記音声に含まれるウェイクワード及び制御ワードに基づいて前記動画の記録を制御することと、
前記動画の記録を停止することを指示する前記制御ワードが前記音声に含まれる場合に、前記動画の記録を停止すると共に前記ウェイクワードの開始時刻までの動画データを動画ファイルとして記録させる設定と、前記動画の記録を停止すると共に前記ウェイクワードの開始時刻に対応する動画データ内のフレームに参照情報を付与して動画データを動画ファイルとして記録させる設定とを切り替えることと、を備えること特徴とする制御方法。 - コンピュータを、請求項1乃至11のいずれか1項に記載された撮像装置の各手段として機能させるためのプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020043327A JP7483421B2 (ja) | 2020-03-12 | 2020-03-12 | 撮像装置、制御方法、及びプログラム |
US17/191,149 US11570349B2 (en) | 2020-03-12 | 2021-03-03 | Image pickup apparatus that controls operations based on voice, control method, and storage medium |
CN202110266795.0A CN113395443A (zh) | 2020-03-12 | 2021-03-11 | 基于语音来控制操作的摄像设备、控制方法和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020043327A JP7483421B2 (ja) | 2020-03-12 | 2020-03-12 | 撮像装置、制御方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021145256A JP2021145256A (ja) | 2021-09-24 |
JP7483421B2 true JP7483421B2 (ja) | 2024-05-15 |
Family
ID=77617487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020043327A Active JP7483421B2 (ja) | 2020-03-12 | 2020-03-12 | 撮像装置、制御方法、及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US11570349B2 (ja) |
JP (1) | JP7483421B2 (ja) |
CN (1) | CN113395443A (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230402068A1 (en) * | 2022-06-10 | 2023-12-14 | Lemon Inc. | Voice-controlled content creation |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002027396A (ja) | 2000-07-10 | 2002-01-25 | Matsushita Electric Ind Co Ltd | 付加情報入力方法および映像編集方法並びに当該方法を用いる装置およびシステム |
WO2019032462A1 (en) | 2017-08-07 | 2019-02-14 | Sonos, Inc. | REMOVAL OF AWAKENING WORD DETECTION |
JP2019086535A (ja) | 2017-11-01 | 2019-06-06 | ソフトバンク株式会社 | 送信制御装置及びプログラム |
JP2019113636A (ja) | 2017-12-22 | 2019-07-11 | オンキヨー株式会社 | 音声認識システム |
JP2020030739A (ja) | 2018-08-24 | 2020-02-27 | キヤノン株式会社 | 通信装置、その制御方法、およびそのプログラム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001203974A (ja) * | 2000-01-19 | 2001-07-27 | Matsushita Electric Ind Co Ltd | 音声制御型音声映像記録装置及び音声制御方法 |
JP4919993B2 (ja) * | 2008-03-12 | 2012-04-18 | 株式会社日立製作所 | 情報記録装置 |
-
2020
- 2020-03-12 JP JP2020043327A patent/JP7483421B2/ja active Active
-
2021
- 2021-03-03 US US17/191,149 patent/US11570349B2/en active Active
- 2021-03-11 CN CN202110266795.0A patent/CN113395443A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002027396A (ja) | 2000-07-10 | 2002-01-25 | Matsushita Electric Ind Co Ltd | 付加情報入力方法および映像編集方法並びに当該方法を用いる装置およびシステム |
WO2019032462A1 (en) | 2017-08-07 | 2019-02-14 | Sonos, Inc. | REMOVAL OF AWAKENING WORD DETECTION |
JP2019086535A (ja) | 2017-11-01 | 2019-06-06 | ソフトバンク株式会社 | 送信制御装置及びプログラム |
JP2019113636A (ja) | 2017-12-22 | 2019-07-11 | オンキヨー株式会社 | 音声認識システム |
JP2020030739A (ja) | 2018-08-24 | 2020-02-27 | キヤノン株式会社 | 通信装置、その制御方法、およびそのプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20210289123A1 (en) | 2021-09-16 |
US11570349B2 (en) | 2023-01-31 |
JP2021145256A (ja) | 2021-09-24 |
CN113395443A (zh) | 2021-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104754208B (zh) | 电子装置及其控制方法 | |
JP7129294B2 (ja) | 電子機器および領域選択方法 | |
JP6494215B2 (ja) | 電子機器、その制御方法およびプログラム | |
JP7483421B2 (ja) | 撮像装置、制御方法、及びプログラム | |
JP4916403B2 (ja) | 画像処理装置及びその制御方法 | |
JP6180285B2 (ja) | 撮像装置、撮像方法、及びプログラム | |
JP4498169B2 (ja) | 画像処理装置及びその制御方法 | |
JP4682097B2 (ja) | 撮像装置及びその制御方法及びプログラム及び記憶媒体 | |
US11954935B2 (en) | Electronic device improved in object detection performance, image capturing apparatus, method of controlling electronic device, and storage medium | |
JP7463071B2 (ja) | 電子機器および電子機器の制御方法 | |
JP7532052B2 (ja) | 撮像装置およびその制御方法 | |
JP7482640B2 (ja) | 音声入力装置およびその制御方法ならびにプログラム | |
JP4810485B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
JP6407017B2 (ja) | 表示制御装置およびその制御方法 | |
JP7098495B2 (ja) | 画像処理装置及びその制御方法 | |
JP5893341B2 (ja) | 表示制御装置、表示制御装置の制御方法およびプログラム | |
JP6742833B2 (ja) | 情報処理装置及び情報処理方法 | |
JP2020057845A (ja) | 編集装置、その制御方法、及びプログラム | |
JP4701297B2 (ja) | 画像処理装置、方法および記録媒体 | |
US20230396731A1 (en) | Image reproduction apparatus, control method thereof, and storage medium | |
JP7086722B2 (ja) | 表示制御装置およびその制御方法 | |
JP4721417B2 (ja) | 撮像装置およびその制御方法 | |
JP2016082276A (ja) | 撮像装置 | |
CN117176887A (zh) | 图像再现设备及其控制方法和存储介质 | |
JP2013219502A (ja) | 画像再生装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230307 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240501 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7483421 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |