JP2021124975A - 音声入力装置およびその制御方法ならびにプログラム - Google Patents
音声入力装置およびその制御方法ならびにプログラム Download PDFInfo
- Publication number
- JP2021124975A JP2021124975A JP2020018211A JP2020018211A JP2021124975A JP 2021124975 A JP2021124975 A JP 2021124975A JP 2020018211 A JP2020018211 A JP 2020018211A JP 2020018211 A JP2020018211 A JP 2020018211A JP 2021124975 A JP2021124975 A JP 2021124975A
- Authority
- JP
- Japan
- Prior art keywords
- voice
- input device
- voice command
- voice input
- command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 97
- 238000004891 communication Methods 0.000 claims description 100
- 230000008569 process Effects 0.000 claims description 69
- 238000003384 imaging method Methods 0.000 claims description 18
- 230000003287 optical effect Effects 0.000 claims description 9
- 238000012545 processing Methods 0.000 abstract description 34
- 238000001514 detection method Methods 0.000 description 38
- 230000006870 function Effects 0.000 description 14
- 210000003811 finger Anatomy 0.000 description 13
- 210000001508 eye Anatomy 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 7
- 230000007257 malfunction Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 210000005252 bulbus oculi Anatomy 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000011514 reflex Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- WHXSMMKQMYFTQS-UHFFFAOYSA-N Lithium Chemical compound [Li] WHXSMMKQMYFTQS-UHFFFAOYSA-N 0.000 description 1
- 229910005580 NiCd Inorganic materials 0.000 description 1
- 229910005813 NiMH Inorganic materials 0.000 description 1
- 241001504424 Zosteropidae Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000005674 electromagnetic induction Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 229910052744 lithium Inorganic materials 0.000 description 1
- 210000004932 little finger Anatomy 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 210000001747 pupil Anatomy 0.000 description 1
- 238000001028 reflection method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000002834 transmittance Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/66—Remote control of cameras or camera parts, e.g. by remote control devices
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B17/00—Details of cameras or camera bodies; Accessories therefor
- G03B17/02—Bodies
-
- G—PHYSICS
- G03—PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
- G03B—APPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
- G03B31/00—Associated working of cameras or projectors with sound-recording or sound-reproducing means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/002—Specific input/output arrangements not covered by G06F3/01 - G06F3/16
- G06F3/005—Input arrangements through a video camera
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
- G06F3/012—Head tracking input arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/50—Constructional details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/62—Control of parameters via user interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Networks & Wireless Communication (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Studio Devices (AREA)
Abstract
【解決手段】実施形態に係る音声入力装置は、音声を入力する音声入力手段と、音声入力装置に対する音声による操作を有効にするための第1の音声命令が入力された後の一定の期間に、音声入力装置を操作するための第2の音声命令が入力された場合に、第2の音声命令に対応する処理を実行する制御手段とを有する。ここで、制御手段は、所定のユーザが第2の音声命令を発したと推定した場合には、第1の音声命令が入力されていない場合であっても、第2の音声命令が入力されると、第2の音声命令に対応する処理を実行する。
【選択図】図3
Description
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
図1(a)及び図1(b)は、本実施形態に係る音声入力装置の一例としてのデジタルカメラ100の外観図を示している。図1(a)はデジタルカメラ100の前面斜視図であり、図1(b)はデジタルカメラ100の背面斜視図である。表示部28は画像や各種情報を表示する、カメラ背面に設けられた表示部である。タッチパネル70aは、表示部28の表示面(操作面)に対するタッチ操作を検出することができる。ファインダー外表示部43は、カメラ上面に設けられた表示部であり、シャッター速度や絞りをはじめとするカメラの様々な設定値が表示される。シャッターボタン61は撮影指示を行うための操作部である。モード切替スイッチ60は各種モードを切り替えるための操作部である。端子カバー40は外部機器との接続ケーブルとデジタルカメラ100とを接続するコネクタ(不図示)を保護するカバーである。
・接眼部16に接眼したユーザの視線が新たに入力(検出)されたこと。すなわち、視線入力の開始。
・接眼部16に接眼したユーザの視線入力がある状態であること。
・接眼部16に接眼したユーザが注視している状態であること。
・接眼部16に接眼したユーザが入力していた視線を外したこと。すなわち、視線入力の終了。
・接眼部16に接眼したユーザが何も視線入力していない状態。
ここで述べた注視とは、ユーザの視線位置が所定時間内に所定の移動量を超えなかった場合のことを指す。
・タッチパネル70aにタッチしていなかった指やペンが新たにタッチパネル70aにタッチしたこと。すなわち、タッチの開始(以下、タッチダウン(Touch−Down)と称する)。
・タッチパネル70aを指やペンでタッチしている状態であること(以下、タッチオン(Touch−On)と称する)。
・タッチパネル70aを指やペンでタッチしたまま移動していること(以下、タッチムーブ(Touch−Move)と称する)。
・タッチパネル70aへタッチしていた指やペンを離したこと。すなわち、タッチの終了(以下、タッチアップ(Touch−Up)と称する)。
・タッチパネル70aに何もタッチしていない状態(以下、タッチオフ(Touch−Off)と称する)。
次に、本実施形態に係るメイン処理について図3を参照して説明する。メイン処理の動作は、ユーザからの音声を認識して音声操作が完了するまでの動作である。なお、メイン処理の各処理は、システム制御部50が不揮発性メモリ56に格納されたプログラムをシステムメモリ52に展開して実行することにより実現される。また、ウェイクワードは、デジタルカメラ100に対する音声による操作を有効にするための特定の音声命令である。
次に、図4を参照して、S302で実行されるウェイクワード省略処理の一連の動作について説明する。ウェイクワード省略処理の動作は、画像から認識した被写体の位置情報と認識した音声の音声方向に基づいて、デジタルカメラ100の状態をウェイクワード省略状態に制御する動作である。なお、ウェイクワード省略処理は、メイン処理と同様に、システム制御部50が不揮発性メモリ56に格納されたプログラムをシステムメモリ52に展開して実行することにより実現される。
次に実施形態2について説明する。実施形態2では、近距離無線通信を用いてユーザ(他の通信装置)との相対的な方向と距離を測位し、相対的な方向や距離を考慮してウェイクワード省略状態や、音声命令有効状態へ状態を制御する。このため、本実施形態のデジタルカメラ600の構成は、実施形態1の構成に更に近距離無線通信部を有するが、その他の構成は実施形態1と同一又は実質的に同一である。また、本実施形態では、実施形態1のウェイクワード省略処理、及びメイン処理の一部が実施形態1と異なるが他の処理は同一又は実質的に同一である。従って、同一である構成及び同一の処理については説明を省略し、相違点について重点的に説明する。
図6は、本実施形態に係る音声入力装置の一例としてのデジタルカメラ600の機能構成例を示している。
上述のように、近距離無線通信を用いた相対的な方向と距離の測位には、相手方の通信装置が必要となる。図7を参照して、本実施形態の通信装置の一例である携帯電話機700の機能構成例について説明する。なお、以下の説明では、通信装置の一例として携帯電話機を例に説明するが、通信装置はこれに限らない。例えば通信装置は、無線通信の可能なデジタルカメラ、タブレットデバイス、あるいはパーソナルコンピュータなどであってもよい。
次に、図8を参照して、デジタルカメラ600とユーザが近距離かつ向かい合っている場合に、デジタルカメラの状態をウェイクワード省略状態にする、ウェイクワード省略処理の一連の動作について説明する。なお、この一連の動作は、システム制御部50が不揮発性メモリ56に格納されたプログラムをシステムメモリ52に展開して実行することにより実現される。また、この一連の動作は、例えば、図9に示す本実施形態に係るメイン処理において、音声命令を受信したと判定された場合(S301においてYes)に開始される(図9におけるS901に対応する)。
図9は、本実施形態におけるメイン処理の一連の動作を示している。上述のウェイクワード省略処理のほか、実施形態1におけるメイン処理とは、ウェイクワードとユーザの位置を利用して、デジタルカメラ100の状態を音声命令有効状態に設定する点が異なる。すなわち、実施形態1におけるメイン処理とは、S306における判定処理の後にS902の処理が行われる点が異なる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (15)
- 音声入力装置であって、
音声を入力する音声入力手段と、
前記音声入力装置に対する音声による操作を有効にするための第1の音声命令が入力された後の一定の期間に、前記音声入力装置を操作するための第2の音声命令が入力された場合に、前記第2の音声命令に対応する処理を実行する制御手段とを有し、
前記制御手段は、所定のユーザが第2の音声命令を発したと推定した場合には、前記第1の音声命令が入力されていない場合であっても、前記第2の音声命令が入力されると、前記第2の音声命令に対応する処理を実行する、ことを特徴とする音声入力装置。 - 前記所定のユーザを被写体として含んだ撮影画像を出力する撮像手段を更に有し、
前記制御手段は、
前記撮影画像に基づいて前記音声入力装置からの前記所定のユーザへの方向を表す第1の方向を算出すると共に、前記第2の音声命令に基づいて前記第2の音声命令が発せられた方向を第2の方向として算出し、
前記第1の方向と前記第2の方向とが一致する場合には、前記所定のユーザが前記第2の音声命令を発したと推定する、ことを特徴とする請求項1に記載の音声入力装置。 - 前記所定のユーザを被写体として含んだ撮影画像を出力する撮像手段を更に有し、
前記制御手段は、
前記第2の音声命令に基づいて前記音声入力装置から前記所定のユーザまでの距離を算出すると共に、前記撮影画像の前記被写体の顔の向きを第3の方向として算出し、
前記所定のユーザまでの距離が閾値以下であり、且つ、前記音声入力装置の向きである第4の方向と前記第3の方向とが向かい合うと判定した場合には、前記所定のユーザが前記第2の音声命令を発したと推定する、ことを特徴とする請求項1に記載の音声入力装置。 - 前記所定のユーザを被写体として含んだ撮影画像を出力する撮像手段と、
前記所定のユーザの通信装置と近距離無線通信を行う通信手段とを更に有し、
前記制御手段は、
前記通信装置との間の近距離無線通信に基づいて前記音声入力装置から前記通信装置への距離を算出すると共に、前記撮影画像の前記被写体の顔の向きを第3の方向として算出し、
前記所定のユーザまでの距離が閾値以下であり、且つ、前記音声入力装置の向きである第4の方向と前記第3の方向とが向かい合うと判定した場合には、前記所定のユーザが前記第2の音声命令を発したと推定する、ことを特徴とする請求項1に記載の音声入力装置。 - 前記制御手段は、前記撮像手段の光軸の向きで定められる前記第4の方向と前記第3の方向との角度差が所定の角度閾値以下である場合、前記音声入力装置の向きである第4の方向と前記第3の方向とが向かい合うと判定する、ことを特徴とする請求項3又は4に記載の音声入力装置。
- 前記制御手段は、前記撮像手段の光軸の向きで定められる前記第4の方向と前記第3の方向との角度差が所定の角度閾値以下であり、且つ、前記角度差が該所定の角度閾値以下である時間が所定の時間閾値以上である場合、前記音声入力装置の向きである第4の方向と前記第3の方向とが向かい合うと判定する、ことを特徴とする請求項5に記載の音声入力装置。
- 前記制御手段は、前記音声入力装置から前記ユーザまでの距離が、前記所定の距離閾値以下でない場合、前記第2の音声命令が入力されても、前記第2の音声命令に対応する処理を実行しない、ことを特徴とする請求項3から6のいずれか1項に記載の音声入力装置。
- 前記撮影画像の前記被写体の顔、又は、前記第2の音声命令の声に基づいて、前記所定のユーザが登録されたユーザであるかを判定する判定手段を更に有し、
前記制御手段は、前記所定のユーザが登録されたユーザであると判定され、且つ、前記所定のユーザが前記第2の音声命令を発したと推定される場合に、前記第1の音声命令が入力されていない場合であっても、前記第2の音声命令が入力されると、前記第2の音声命令に対応する処理を実行する、ことを特徴とする請求項2から7のいずれか1項に記載の音声入力装置。 - 前記制御手段は、前記音声入力装置が撮影を行うモードに設定されていなければ、前記第2の音声命令に対応する処理を実行しない、ことを特徴とする請求項2から8のいずれか1項に記載の音声入力装置。
- 前記制御手段は、前記第2の音声命令が撮影命令でなければ、前記第2の音声命令に対応する処理を実行しない、ことを特徴とする請求項9に記載の音声入力装置。
- 前記撮像手段は、前記音声入力装置の正面側、又は、背面側の少なくともいずれかに配置される、ことを特徴とする請求項2から10のいずれか1項に記載の音声入力装置。
- 前記制御手段は、前記第2の音声命令の声量が一定の声量以上でなければ、前記第2の音声命令に対応する処理を実行しない、ことを特徴とする請求項1から11のいずれか1項に記載の音声入力装置。
- 前記音声入力手段は、外部装置で入力された音声を前記外部装置から取得するように構成される、請求項1から12のいずれか1項に記載の音声入力装置。
- 音声を入力する音声入力手段を有する音声入力装置の制御方法であって、
前記音声入力装置に対する音声による操作を有効にするための第1の音声命令が入力された後の一定の期間に、前記音声入力装置を操作するための第2の音声命令が入力された場合に、前記第2の音声命令に対応する処理を実行する制御工程を有し、
前記制御工程では、所定のユーザが第2の音声命令を発したと推定した場合には、前記第1の音声命令が入力されていない場合であっても、前記第2の音声命令が入力されると、前記第2の音声命令に対応する処理を実行する、ことを特徴とする音声入力装置の制御方法。 - コンピュータを、請求項1から13のいずれか1項に記載の音声入力装置の各手段として機能させるためのプログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020018211A JP7442330B2 (ja) | 2020-02-05 | 2020-02-05 | 音声入力装置およびその制御方法ならびにプログラム |
US17/163,884 US11394862B2 (en) | 2020-02-05 | 2021-02-01 | Voice input apparatus, control method thereof, and storage medium for executing processing corresponding to voice instruction |
KR1020210013887A KR20210100020A (ko) | 2020-02-05 | 2021-02-01 | 음성입력장치, 그 제어 방법 및 음성명령에 대응한 처리를 실행하는 기억 매체 |
EP21154514.0A EP3863013A1 (en) | 2020-02-05 | 2021-02-01 | Voice input apparatus, control method thereof, and computer program for executing processing corresponding to voice instruction |
CN202110136235.3A CN113225474A (zh) | 2020-02-05 | 2021-02-01 | 语音输入设备、其控制方法及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020018211A JP7442330B2 (ja) | 2020-02-05 | 2020-02-05 | 音声入力装置およびその制御方法ならびにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021124975A true JP2021124975A (ja) | 2021-08-30 |
JP7442330B2 JP7442330B2 (ja) | 2024-03-04 |
Family
ID=74494769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020018211A Active JP7442330B2 (ja) | 2020-02-05 | 2020-02-05 | 音声入力装置およびその制御方法ならびにプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11394862B2 (ja) |
EP (1) | EP3863013A1 (ja) |
JP (1) | JP7442330B2 (ja) |
KR (1) | KR20210100020A (ja) |
CN (1) | CN113225474A (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7482640B2 (ja) * | 2020-02-05 | 2024-05-14 | キヤノン株式会社 | 音声入力装置およびその制御方法ならびにプログラム |
JP7442331B2 (ja) | 2020-02-05 | 2024-03-04 | キヤノン株式会社 | 音声入力装置およびその制御方法ならびにプログラム |
CN115297478A (zh) * | 2022-07-27 | 2022-11-04 | 四川虹美智能科技有限公司 | 一种通过语音同时给多个语音设备配网的方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2807241B2 (ja) | 1988-11-11 | 1998-10-08 | 株式会社東芝 | 音声認識装置 |
JP2011118822A (ja) | 2009-12-07 | 2011-06-16 | Nec Casio Mobile Communications Ltd | 電子機器、発話検出装置、音声認識操作システム、音声認識操作方法及びプログラム |
US20120259638A1 (en) | 2011-04-08 | 2012-10-11 | Sony Computer Entertainment Inc. | Apparatus and method for determining relevance of input speech |
DE102013001219B4 (de) * | 2013-01-25 | 2019-08-29 | Inodyn Newmedia Gmbh | Verfahren und System zur Sprachaktivierung eines Software-Agenten aus einem Standby-Modus |
US9510094B2 (en) * | 2014-04-09 | 2016-11-29 | Apple Inc. | Noise estimation in a mobile device using an external acoustic microphone signal |
JP6440513B2 (ja) * | 2014-05-13 | 2018-12-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 音声認識機能を用いた情報提供方法および機器の制御方法 |
JP6233650B2 (ja) | 2014-05-20 | 2017-11-22 | パナソニックIpマネジメント株式会社 | 操作補助装置および操作補助方法 |
JP2016076799A (ja) | 2014-10-03 | 2016-05-12 | シャープ株式会社 | 家電管理システム、家電、リモコン装置、ロボット |
JP6504808B2 (ja) | 2014-12-22 | 2019-04-24 | キヤノン株式会社 | 撮像装置、音声コマンド機能の設定方法、コンピュータプログラム、及び記憶媒体 |
JP6562790B2 (ja) | 2015-09-11 | 2019-08-21 | 株式会社Nttドコモ | 対話装置および対話プログラム |
US20180293221A1 (en) * | 2017-02-14 | 2018-10-11 | Microsoft Technology Licensing, Llc | Speech parsing with intelligent assistant |
EP3588491A4 (en) | 2017-02-24 | 2020-07-22 | Sony Mobile Communications Inc. | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING PROCESS AND COMPUTER PROGRAM |
JP6543676B2 (ja) | 2017-11-01 | 2019-07-10 | ソフトバンク株式会社 | 送信制御装置及びプログラム |
WO2019093123A1 (ja) | 2017-11-07 | 2019-05-16 | ソニー株式会社 | 情報処理装置および電子機器 |
JP7442331B2 (ja) | 2020-02-05 | 2024-03-04 | キヤノン株式会社 | 音声入力装置およびその制御方法ならびにプログラム |
-
2020
- 2020-02-05 JP JP2020018211A patent/JP7442330B2/ja active Active
-
2021
- 2021-02-01 US US17/163,884 patent/US11394862B2/en active Active
- 2021-02-01 EP EP21154514.0A patent/EP3863013A1/en active Pending
- 2021-02-01 KR KR1020210013887A patent/KR20210100020A/ko active Search and Examination
- 2021-02-01 CN CN202110136235.3A patent/CN113225474A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
EP3863013A1 (en) | 2021-08-11 |
US11394862B2 (en) | 2022-07-19 |
CN113225474A (zh) | 2021-08-06 |
KR20210100020A (ko) | 2021-08-13 |
US20210243354A1 (en) | 2021-08-05 |
JP7442330B2 (ja) | 2024-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11394862B2 (en) | Voice input apparatus, control method thereof, and storage medium for executing processing corresponding to voice instruction | |
JP7321786B2 (ja) | 電子機器およびその制御方法 | |
CN113301247B (zh) | 一种摄像设备、其控制方法以及存储介质 | |
JP7208128B2 (ja) | 撮像装置およびその制御方法 | |
JP7467071B2 (ja) | 電子機器、電子機器の制御方法、プログラム、記憶媒体 | |
JP2020204915A (ja) | 電子機器およびその制御方法 | |
JP2024050779A (ja) | 電子機器およびその制御方法、プログラム、並びに記憶媒体 | |
JP2021141573A (ja) | 電子機器 | |
JP2022068749A (ja) | 電子機器及びその制御方法及びプログラム及び記録媒体 | |
JP2022018244A (ja) | 電子機器およびその制御方法 | |
JP2021156950A (ja) | 撮像制御装置およびその制御方法 | |
JP2021069008A (ja) | 電子機器、電子機器の制御方法、プログラム及び記憶媒体 | |
US11735181B2 (en) | Voice input apparatus, control method thereof, and storage medium for executing processing corresponding to voice instruction | |
JP2021140589A (ja) | 電子機器、電子機器の制御方法、プログラム、記憶媒体 | |
CN112040095A (zh) | 电子装置、电子装置的控制方法及存储介质 | |
US11711606B2 (en) | Display control apparatus, control method for controlling the same, and storage medium | |
WO2022131252A1 (ja) | 電子機器及びその制御方法及びプログラム及び記録媒体 | |
US20230291995A1 (en) | Electronic apparatus, method for controlling electronic apparatus, and storage medium | |
JP2022095306A (ja) | 表示制御装置及びその制御方法 | |
JP2021152744A (ja) | 電子機器及びその制御方法 | |
JP2022095264A (ja) | 表示制御装置及びその制御方法 | |
JP2021018634A (ja) | 電子機器およびその制御方法 | |
JP2023160103A (ja) | 電子機器 | |
JP2022067578A (ja) | 撮像装置及びその制御方法及びプログラム及び記録媒体 | |
JP2021029011A (ja) | 撮像制御装置、撮像制御装置の制御方法、プログラム、記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230131 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230922 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231120 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240122 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240220 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7442330 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |