JP2019186929A - カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体 - Google Patents
カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体 Download PDFInfo
- Publication number
- JP2019186929A JP2019186929A JP2019067340A JP2019067340A JP2019186929A JP 2019186929 A JP2019186929 A JP 2019186929A JP 2019067340 A JP2019067340 A JP 2019067340A JP 2019067340 A JP2019067340 A JP 2019067340A JP 2019186929 A JP2019186929 A JP 2019186929A
- Authority
- JP
- Japan
- Prior art keywords
- sound source
- camera
- sound
- angle
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000004590 computer program Methods 0.000 claims description 24
- 238000003384 imaging method Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000004891 communication Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000003491 array Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 102100032912 CD44 antigen Human genes 0.000 description 1
- 101000868273 Homo sapiens CD44 antigen Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
- H04N7/147—Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/69—Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/186—Determination of attitude
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/61—Control of cameras or camera modules based on recognised objects
- H04N23/611—Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/695—Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
Abstract
Description
音声が検出された場合、前記音声にキーワードがあるか否かを識別することと、
前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定することと、
前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御することと、を含む。
音声が検出された場合、前記音声にキーワードがあるか否かを識別するためのキーワード識別ユニットと、
前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定するための音源位置決めユニットと、
前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御するための第一撮影制御ユニットと、を含む。
実施例一:
図1は、本発明の実施例によるカメラ撮影制御方法示すフローチャートである。当該方法フローは、ステップS101乃至S103を含む。各ステップの具体的な実現原理は以下のとおりである。
ステップS101では、音声が検出された場合、前記音声にキーワードがあるか否かを識別する。
A1、音声が検出された場合、前記音声をテキスト情報に変換する。
A2、前記テキスト情報に基づいて単語分割を行う。具体的には、文法の格式でテキスト情報を単語に分割し、さらに、音声情報から分割された単語を単語ベクトルとして記憶し、前記単語ベクトルにはさらに、当該単語ベクトルに対応する音声を識別するための識別ビットが設けられる。
本発明の実施例において、前記音声に指定したキーワードがある場合、マイクロホンアレイアルゴリズムによって前記音声の音源方向を取得することができる。単一のマイクロホンは音声情報のみを取得できるが、複数のマイクロホンにより一定の幾何学的位置に応じて配置されたマイクロホンアレイは、音声情報だけでなく音声の空間的情報を取得することもできる。マイクロホンアレイアルゴリズムとは、一定の幾何学的位置に応じて配置されたマイクロホンアレイを用いて、ある音源から各マイクロホンまでの相対遅延時間および音波の到達時間差を算出することで、当該音源の音源方向を位置決めする。本発明の実施例において、マイクロホンアレイの個数と配列方式は制限されるものではなく、水平に並び替えてもよく、垂直に並び替えてもよく、又は、ランダムに並び替えてもよいが、マイクロホンアレイの個数と配列方式が確定された場合、マイクロホンアレイにおける各マイクロホンユニットの位置が確定される。
本発明の実施例において、検出された音声にキーワードがあることを識別した場合、カメラのステアリングをトリガーし、そして前記音声の音源角度によって前記カメラの回転に必要な方向を確定し、撮影効果を向上させるために、カメラを前記音声の音源に回転させる場合、前記音源に対応する音源対象が前記カメラの撮影する画面の中央にあるようにする。さらに、インテリジェント装置(又はカメラ)が前記音源に対応する音源対象に近い場合、カメラの光学的パラメータを、前記音源に対応する音源対象の顔が前記カメラの撮影する画面の中央にあるように調整する。
B1、前記カメラの現在の角度を取得する。
B2、前記音源角度と前記カメラの現在の角度との角度差を算出し、前記音源角度と前記カメラの現在の角度はいずれも相対角度を指す。
B31、前記音源角度と前記カメラの現在の角度との角度差によって、第一回転速度で前記カメラを前記音源に回転させるように制御する。
B32、顔を検出し、顔が検出された場合、第二回転速度に基づいて、前記音声を出す音源対象を前記カメラの撮影する画面の中央に位置させるように、前記カメラのステアリングを制御し、ここで、前記第一回転速度は、前記第二回転速度よりも大きい。前記第一回転速度と第二回転速度はいずれも電機速度である。
上記実施例一に提供されるカメラ撮影制御方法に基づいて、本発明の別の実施例を提出し、図2は、当該実施例二に係るカメラ撮影制御方法を示すフローチャートであり、その詳細は次のとおりである。
ステップS202では、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定する。
ステップS203では、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御する。
ステップS204では、前記音声を出す音源対象が前記カメラの撮影する画面にある場合、前記音声の音声特徴および前記音声を出す音源対象に対応する音源角度を記録して関連付ける。
ステップS205では、新しい音声が検出された場合、前記新しい音声を出す音源対象の音源角度を確定する。
ステップS206では、前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲内にあるか否かを判断する。
ステップS207では、前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあれば、前記記録された音源対象に対応する音源角度によって、前記新しい音声の音源角度に対応する音源対象を前記カメラの撮影する画面の中央に位置させるように、前記カメラのステアリングを制御する。
上記実施例二に提供されるカメラ撮影制御方法に基づいて、図4示は当該実施例三に係るカメラ撮影制御方法を示すフローチャートであり、その詳細は次のとおりである。
ステップS401、音声が検出された場合、前記音声にキーワードがあるか否かを識別する。
ステップS402、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定する。
ステップS403、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御する。
ステップS404、前記音声を出す音源対象が前記カメラの撮影する画面中にある場合、前記音声の音声特徴および前記音声を出す音源対象に対応する音源角度を記録して関連付ける。
ステップS405、新しい音声が検出された場合、前記新しい音声の音声特徴が記録された音声特徴と同じであるか否かを判断する。前記音声特徴は、音声周波数、音色、音声音響インテンシティおよびピッチを含むが、これらに限定されない。
ステップS406、前記新しい音声の音声特徴が記録の音声特徴と同じであれば、前記音声特徴に関連する音源対象に対応する音源角度を取得する。
ステップS407、前記音声特徴に関連する音源対象に対応する音源角度によって、前記カメラを前記音源対象に回転させるように制御する。
具体的には、前記音声特徴に関連する音源対象に対応する音源角度によって、予め設定された回転速度で前記カメラを迅速に回転させて前記音源対象にアライメントする。
以上の実施例に記載のカメラ撮影制御方法に対応して、図5は本発明の実施例に係るカメラ撮影制御装置の構造を示すブロック図であり、該装置はインテリジェント装置に応用することができ、該インテリジェント装置は無線アクセスネットワークRANを経由して一つまたは複数のコアネットワークと通信するユーザー装置を含むことができ、該ユーザー装置は携帯電話(または「セル」電話と呼ばれる)またはモバイル機器を備えるコンピュータ等であってよく、例えば、ユーザー装置は携帯式、コンパクト式、手持ち式、コンピュータ内蔵装置であってもよく、それらは無線アクセスネットワークと音声および/またはデータを交換することができる。なお、例えば、該ユーザー装置は知能スピーカー、知能ロボット等であってもよい。説明の便宜上、本発明の実施例に関連する部分のみを示す。
図5を参照し、当該カメラ撮影制御装置は、キーワード識別ユニット51、音源位置決めユニット52、第一撮影制御ユニット53を含み、ここで、
キーワード識別ユニット51は、音声が検出された場合、前記音声にキーワードがあるか否かを識別するために用いられ、
音源位置決めユニット52は、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定するために用いられ、
第一撮影制御ユニット53は、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御するために用いられる。
前記カメラの現在の角度を取得するための角度取得モジュールと、
前記音源角度と前記カメラの現在の角度との角度差を算出するための角度算出モジュールと、
前記音源角度と前記カメラの現在の角度との角度差によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、予め設定された回転速度に基づいて前記カメラのステアリングを制御するための回転制御モジュールと、を含む。
前記音源角度と前記カメラの現在の角度との角度差によって、第一回転速度に基づいて前記カメラを前記音源に回転させるように制御するための第一回転子モジュールと、
顔を検出し、顔が検出された場合、第二回転速度に基づいて、前記音声を出す音源対象を前記カメラの撮影する画面の中央に位置させるように、前記カメラのステアリングを制御するための第二回転子モジュールと、ここで、前記第一回転速度は、前記第二回転速度よりも大きい、を含む。
前記音声を出す音源対象が前記カメラの撮影する画面の中央にある場合、前記音声の音声特徴および前記音声を出す音源対象に対応する音源角度を記録して関連付けるための関連付け記録ユニット54、をさらに含む。
新しい音声が検出された場合、前記新しい音声の音声特徴が記録された音声特徴と同じであるか否かを判断するための第一判断ユニット55と、
前記第一判断ユニット55はさらに、前記新しい音声の音声特徴が記録された音声特徴と同じであれば、前記音声特徴に関連する音源対象に対応する音源角度を取得するために用いられ、
前記音声特徴に関連する音源対象に対応する音源角度によって、前記カメラを前記音源対象に回転させるように制御するための第二撮影制御ユニット56と、をさらに含む。
新しい音声が検出された場合、前記新しい音声を出す音源対象の音源角度を確定するための角度確定ユニット57と、
前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあるか否かを判断するための第二判断ユニット58と、
前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあれば、前記記録された音源対象に対応する音源角度によって、前記新しい音声の音源角度に対応する音源対象を前記カメラの撮影する画面中に位置させるように、前記カメラのステアリングを制御するための第三撮影制御ユニット59と、をさらに含む。
図6は本発明の一つの実施例に係るインテリジェント装置の模式図である。図6に示すように、当該実施例のインテリジェント装置6は、プロセッサ60と、メモリ61と、前記メモリ61に記憶され、前記プロセッサ60で実行可能なコンピュータプログラム62、例えば撮影制御プログラムとを含む。前記プロセッサ60は前記コンピュータプログラム62を実行する時、上記各カメラ撮影制御方法の実施例におけるステップ、例えば図1に示すステップ101乃至103を実現する。または、前記プロセッサ60は前記コンピュータプログラム62を実行する時、上記各装置実施例における各モジュール/ユニットの機能、例えば図5に示すユニット51乃至53の機能を実現する。
キーワード識別ユニットは、音声が検出された場合、前記音声にキーワードがあるか否かを識別するために用いられ、
音源位置決めユニットは、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定するために用いられ、
第一撮影制御ユニットは、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御するために用いられる。
当業者は、本説明書に開示される実施例と関連付けて説明した各例示的なユニットおよびアルゴリズムステップは、電子ハードウェア、またはコンピュータソフトウェアおよび電子ハードウェアの組み合わせによって実現することができる、ということを意識することができる。これらの機能はいったいハードウェア方式またはソフトウェア方式で実行しているか否かということに関して、技術的解決手段の特定の応用および設計上の制約条件に依存する。当業者は各特定の応用につき、異なる方法によって説明された機能を実現することができるが、これらの実現は本発明の範囲を逸脱するものと思われるべきではない。
52 音源位置決めユニット
53 第一撮影制御ユニット
6 インテリジェント装置
60 プロセッサ
61 メモリ
62 コンピュータプログラム
Claims (14)
- 音声が検出された場合、前記音声にキーワードがあるか否かを識別することと、
前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定することと、
前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御することとを含むことを特徴とするカメラ撮影制御方法。 - 前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御するステップは、
前記カメラの現在の角度を取得することと、
前記音源角度と前記カメラの現在の角度との角度差を算出することと、
前記音源角度と前記カメラの現在の角度との角度差によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、予め設定された回転速度に基づいて前記カメラのステアリングを制御することと、を含むことを特徴とする請求項1に記載のカメラ撮影制御方法。 - 前記音源角度と前記カメラの現在の角度との角度差によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、予め設定された回転速度に基づいて前記カメラの方向回転を制御するステップは、
前記音源角度と前記カメラの現在の角度との角度差によって、第一回転速度に基づいて前記カメラを前記音源に回転させるように制御することと、
顔を検出し、顔が検出された場合、前記音声を出す音源対象を前記カメラの撮影する画面の中央に位置させるように、第二回転速度に基づいて前記カメラのステアリングを制御することと、ここで、前記第一回転速度は、前記第二回転速度よりも大きい、を含むことを特徴とする請求項2に記載のカメラ撮影制御方法。 - 前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラの方向回転を制御するステップの後にはさらに、
前記音声を出す音源対象が前記カメラの撮影する画面にある場合、前記音声の音声特徴および前記音声を出す音源対象の音源角度を記録して関連付けることを含むことを特徴とする請求項1〜3のいずれか一項に記載のカメラ撮影制御方法。 - 前記音声特徴は音声特徴を含み、前記カメラ撮影制御方法は、
新しい音声が検出された場合、前記新しい音声の音声特徴が記録された音声特徴と同じであるか否かを判断することと、
前記新しい音声の音声特徴が記録された音声特徴と同じであれば、前記音声特徴に関連する音源対象に対応する音源角度を取得することと、
前記音声特徴に関連する音源対象に対応する音源角度によって、前記カメラを前記音源対象に回転させるように制御することとをさらに含むことを特徴とする請求項4に記載のカメラ撮影制御方法。 - 前記カメラ撮影制御方法は、
新しい音声が検出された場合、前記新しい音声を出す音源対象の音源角度を確定することと、
前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあるか否かを判断することと、
前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあれば、前記記録された音源対象に対応する音源角度によって、前記新しい音声の音源角度に対応する音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御することと、をさらに含むことを特徴とする請求項4に記載のカメラ撮影制御方法。 - 音声が検出された場合、前記音声にキーワードがあるか否かを識別するためのキーワード識別ユニットと、
前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定するための音源位置決めユニットと、
前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御するための第一撮影制御ユニットと、を含むことを特徴とするカメラ撮影制御装置。 - 前記第一撮影制御ユニットは、
前記カメラの現在の角度を取得するための角度取得モジュールと、
前記音源角度と前記カメラの現在の角度との角度差を算出するための角度算出モジュールと、
前記音源角度と前記カメラの現在の角度との角度差によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、予め設定された回転速度に基づいて前記カメラのステアリングを制御するための回転制御モジュールと、を含むことを特徴とする請求項7に記載のカメラ撮影制御装置。 - 前記回転制御モジュールは、
前記音源角度と前記カメラの現在の角度との角度差によって、第一回転速度に基づいて 前記カメラを前記音源に回転させるように制御するための第一回転子モジュールと、
顔を検出し、顔が検出された場合、第二回転速度に基づいて、前記音声を出す音源対象を前記カメラの撮影する画面の中央に位置させるように、前記カメラのステアリングを制御するための第二回転子モジュールと、ここで、前記第一回転速度は、前記第二回転速度よりも大きい、を含むことを特徴とする請求項8に記載のカメラ撮影制御装置。 - 前記装置は、
前記音声を出す音源対象が前記カメラの撮影する画面の中央にある場合、前記音声の音声特徴および前記音声を出す音源対象に対応する音源角度を記録して関連付けるための関連付け記録ユニットをさらに含むことを特徴とする請求項8に記載のカメラ撮影制御装置。 - 前記装置は、
新しい音声が検出された場合、前記新しい音声の音声特徴が記録された音声特徴と同じであるか否かを判断するための第一判断ユニットと、
前記音声特徴に関連する音源対象に対応する音源角度によって、前記カメラを前記音源対象に回転させるように制御するための第二撮影制御ユニットと、をさらに含むことを特徴とする請求項8に記載のカメラ撮影制御装置。 - 前記装置は、
新しい音声が検出された場合、前記新しい音声を出す音源対象の音源角度を確定するための角度確定ユニットと、
前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあるか否かを判断するための第二判断ユニットと、
前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあれば、前記記録された音源対象に対応する音源角度によって、前記新しい音声の音源角度に対応する音源対象を前記カメラの撮影する画面中に位置させるように、前記カメラのステアリングを制御するための第三撮影制御ユニットと、をさらに含むことを特徴とする請求項8に記載のカメラ撮影制御装置。 - メモリーと、プロセッサと、前記メモリーに記憶され、前記プロセッサで実行可能なコンピュータプログラムとを含むインテリジェント装置であって、前記プロセッサが前記コンピュータプログラムを実行する時、請求項1〜6のいずれか一項に記載のカメラ撮影制御方法のステップを実現することを特徴とするインテリジェント装置。
- コンピュータプログラムが記憶されるコンピュータ読み取り可能な記憶媒体であって、 前記コンピュータプログラムがプロセッサによって実行される時、請求項1〜6のいずれか一項に記載のカメラ撮影制御方法のステップを実現することを特徴とするコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810299510.1 | 2018-04-04 | ||
CN201810299510.1A CN108737719A (zh) | 2018-04-04 | 2018-04-04 | 摄像头拍摄控制方法、装置、智能设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019186929A true JP2019186929A (ja) | 2019-10-24 |
JP6785908B2 JP6785908B2 (ja) | 2020-11-18 |
Family
ID=63940700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019067340A Active JP6785908B2 (ja) | 2018-04-04 | 2019-03-29 | カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体 |
Country Status (4)
Country | Link |
---|---|
US (1) | US10917577B2 (ja) |
EP (1) | EP3550827A1 (ja) |
JP (1) | JP6785908B2 (ja) |
CN (1) | CN108737719A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113284490A (zh) * | 2021-04-23 | 2021-08-20 | 歌尔股份有限公司 | 电子设备的控制方法、装置、设备及可读存储介质 |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108391057B (zh) * | 2018-04-04 | 2020-10-16 | 深圳市冠旭电子股份有限公司 | 摄像头拍摄控制方法、装置、智能设备及计算机存储介质 |
CN109817240A (zh) * | 2019-03-21 | 2019-05-28 | 北京儒博科技有限公司 | 信号分离方法、装置、设备及存储介质 |
CN111756986A (zh) * | 2019-03-27 | 2020-10-09 | 上海博泰悦臻电子设备制造有限公司 | 一种摄像头控制方法、存储介质、装置及具有其的电子设备 |
CN113747069A (zh) | 2019-05-15 | 2021-12-03 | 深圳市大疆创新科技有限公司 | 一种拍摄控制方法、装置及控制设备、拍摄设备 |
CN110232925A (zh) * | 2019-06-28 | 2019-09-13 | 百度在线网络技术(北京)有限公司 | 生成会议记录的方法、装置和会议终端 |
CN110213492B (zh) * | 2019-06-28 | 2021-03-02 | Oppo广东移动通信有限公司 | 设备成像方法、装置、存储介质及电子设备 |
CN112311999A (zh) * | 2019-07-26 | 2021-02-02 | 上海龙旗科技股份有限公司 | 智能视频音箱设备及其摄像头视角调整方法 |
CN111768785B (zh) * | 2019-10-22 | 2022-12-27 | 广东小天才科技有限公司 | 一种智能手表的控制方法及智能手表 |
CN111047758A (zh) * | 2019-11-29 | 2020-04-21 | 深圳市云天智能终端有限公司 | 一种智能电子设备的唤醒方法及系统 |
CN111251307B (zh) * | 2020-03-24 | 2021-11-02 | 北京海益同展信息科技有限公司 | 应用于机器人的语音采集方法和装置、一种机器人 |
CN112866772B (zh) * | 2020-08-21 | 2022-08-12 | 海信视像科技股份有限公司 | 一种显示设备及声像人物定位追踪方法 |
CN114098387B (zh) * | 2020-08-27 | 2024-02-27 | 阿里巴巴集团控股有限公司 | 镜子调节方法、装置、镜子、电子设备及计算机可读介质 |
CN111988671B (zh) * | 2020-09-07 | 2022-06-03 | 北京达佳互联信息技术有限公司 | 图像处理方法及图像处理装置 |
JP2022071984A (ja) * | 2020-10-29 | 2022-05-17 | キヤノン株式会社 | 撮像装置、制御方法、およびプログラム |
CN112333391A (zh) * | 2020-11-03 | 2021-02-05 | 深圳创维-Rgb电子有限公司 | 基于声音的人像自动追踪方法、装置、智能终端及介质 |
CN112492207B (zh) * | 2020-11-30 | 2023-04-18 | 深圳卡多希科技有限公司 | 一种基于声源定位控制摄像头转动的方法和装置 |
CN112487246A (zh) * | 2020-11-30 | 2021-03-12 | 深圳卡多希科技有限公司 | 一种多人视频中发言人的识别方法和装置 |
TWI826768B (zh) * | 2021-01-22 | 2023-12-21 | 圓展科技股份有限公司 | 視訊會議系統與方法 |
US11310465B1 (en) * | 2021-03-17 | 2022-04-19 | Ampula Inc. | Video conference teminal and system there of |
CN113395373A (zh) * | 2021-04-06 | 2021-09-14 | 上海福赛梦扬科技有限公司 | 一种摄像头控制方法及装置 |
CN114449252B (zh) * | 2022-02-12 | 2023-08-01 | 北京蜂巢世纪科技有限公司 | 基于解说音频的现场视频动态调整方法、装置、设备、系统和介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7336169B2 (en) | 2005-03-23 | 2008-02-26 | Lake Star Consulting Llc | Method and real time emergency response surveillance system |
CN101534413B (zh) | 2009-04-14 | 2012-07-04 | 华为终端有限公司 | 一种远程呈现的系统、装置和方法 |
US20110175999A1 (en) * | 2010-01-15 | 2011-07-21 | Mccormack Kenneth | Video system and method for operating same |
US8395653B2 (en) * | 2010-05-18 | 2013-03-12 | Polycom, Inc. | Videoconferencing endpoint having multiple voice-tracking cameras |
EP2882180A4 (en) | 2013-09-29 | 2015-10-14 | Zte Corp | CONTROL METHOD, CONTROL APPARATUS AND CONTROL DEVICE |
CN106888361A (zh) * | 2015-12-11 | 2017-06-23 | 深圳市轻生活科技有限公司 | 视频交互控制方法和装置 |
CN105611167B (zh) * | 2015-12-30 | 2020-01-31 | 联想(北京)有限公司 | 一种对焦平面调整方法及电子设备 |
CN107800967A (zh) * | 2017-10-30 | 2018-03-13 | 维沃移动通信有限公司 | 一种拍摄方法及移动终端 |
CN107809596A (zh) * | 2017-11-15 | 2018-03-16 | 重庆科技学院 | 基于麦克风阵列的视频会议跟踪系统及方法 |
-
2018
- 2018-04-04 CN CN201810299510.1A patent/CN108737719A/zh active Pending
-
2019
- 2019-03-29 JP JP2019067340A patent/JP6785908B2/ja active Active
- 2019-04-03 US US16/373,883 patent/US10917577B2/en active Active
- 2019-04-03 EP EP19166967.0A patent/EP3550827A1/en not_active Ceased
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113284490A (zh) * | 2021-04-23 | 2021-08-20 | 歌尔股份有限公司 | 电子设备的控制方法、装置、设备及可读存储介质 |
CN113284490B (zh) * | 2021-04-23 | 2022-09-09 | 歌尔股份有限公司 | 电子设备的控制方法、装置、设备及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US10917577B2 (en) | 2021-02-09 |
JP6785908B2 (ja) | 2020-11-18 |
US20190313031A1 (en) | 2019-10-10 |
CN108737719A (zh) | 2018-11-02 |
EP3550827A1 (en) | 2019-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019186929A (ja) | カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体 | |
CN103327170B (zh) | 用于蜂窝电话机的对接台 | |
JP6759406B2 (ja) | カメラ撮影制御方法、装置、インテリジェント装置およびコンピュータ記憶媒体 | |
CN107950018B (zh) | 图像生成方法和系统、以及计算机可读介质 | |
CN108900787B (zh) | 图像显示方法、装置、系统及设备、可读存储介质 | |
CN104580992A (zh) | 一种控制方法及移动终端 | |
CN111901524B (zh) | 对焦方法、装置和电子设备 | |
KR101508092B1 (ko) | 화상 회의를 지원하는 방법 및 시스템 | |
CN108632536B (zh) | 一种相机控制方法及装置、终端、存储介质 | |
US9565356B2 (en) | Optimizing capture of focus stacks | |
WO2020035080A1 (zh) | 一种追踪摄像方法、装置及终端设备 | |
CN112689221B (zh) | 录音方法、录音装置、电子设备及计算机可读存储介质 | |
WO2017128750A1 (zh) | 一种图像采集方法和图像采集装置 | |
WO2018121385A1 (zh) | 一种信息处理方法、装置和计算机存储介质 | |
US11308732B2 (en) | Face recognition method and apparatus | |
US10250803B2 (en) | Video generating system and method thereof | |
CN109495689A (zh) | 一种拍摄方法、装置、电子设备及存储介质 | |
CN108063909A (zh) | 视频会议系统、图像跟踪采集方法及装置 | |
CN104967777A (zh) | 一种控制摄像头拍摄方法及终端 | |
US10097747B2 (en) | Multiple camera autofocus synchronization | |
WO2021130548A1 (en) | Gesture recognition method and apparatus, electronic device, and storage medium | |
US11902754B2 (en) | Audio processing method, apparatus, electronic device and storage medium | |
CN104780341A (zh) | 一种信息处理方法以及信息处理装置 | |
CN112073639A (zh) | 拍摄控制方法及装置、计算机可读介质和电子设备 | |
CN108924405B (zh) | 基于距离的拍照聚焦修正和图像处理方法、设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200316 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200611 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200811 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201012 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201027 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6785908 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |