JP2019186929A - カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体 - Google Patents

カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体 Download PDF

Info

Publication number
JP2019186929A
JP2019186929A JP2019067340A JP2019067340A JP2019186929A JP 2019186929 A JP2019186929 A JP 2019186929A JP 2019067340 A JP2019067340 A JP 2019067340A JP 2019067340 A JP2019067340 A JP 2019067340A JP 2019186929 A JP2019186929 A JP 2019186929A
Authority
JP
Japan
Prior art keywords
sound source
camera
sound
angle
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019067340A
Other languages
English (en)
Other versions
JP6785908B2 (ja
Inventor
忠▲海▼ ▲張▼
忠▲海▼ ▲張▼
zhong hai Zhang
▲海▼全 ▲呉▼
▲海▼全 ▲呉▼
Hai Quan Qu
恩勤 ▲張▼
恩勤 ▲張▼
en qin Zhang
磊 曹
Lei Cao
磊 曹
瑞文 ▲師▼
瑞文 ▲師▼
Ruiwen Shi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Grandsun Electronics Co Ltd
Original Assignee
Shenzhen Grandsun Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Grandsun Electronics Co Ltd filed Critical Shenzhen Grandsun Electronics Co Ltd
Publication of JP2019186929A publication Critical patent/JP2019186929A/ja
Application granted granted Critical
Publication of JP6785908B2 publication Critical patent/JP6785908B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/69Control of means for changing angle of the field of view, e.g. optical zoom objectives or electronic zooming
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01SRADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
    • G01S5/00Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
    • G01S5/18Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
    • G01S5/186Determination of attitude
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/61Control of cameras or camera modules based on recognised objects
    • H04N23/611Control of cameras or camera modules based on recognised objects where the recognised objects include parts of the human body
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems

Abstract

【課題】本発明は、通信技術分野に適用され、カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体を提供する。【解決手段】当該方法は、音声が検出された場合、前記音声にキーワードがあるか否かを識別することと、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定することと、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御することと、を含む。上記方法によって、複数の人が同時に発言する時にカメラの頻繁な回転による振れを効果的に回避することができる。【選択図】図1

Description

本発明は、通信技術分野に属し、特にカメラ撮影制御方法、装置、インテリジェント装置および記憶媒体に関する。
インターネット技術の台頭は、人々の交流方式を大いに充実させ、異なる地域にいる人の間の交流が益々便利になる。そこで、遠隔ビデオ会議システムは重要な遠隔交流技術として、その便利さと高い効率のため、企業の稼働効率を大幅に向上させる。従来の技術では、ビデオ会議を行う場合、参加者が頻繁に討論することがあり、参加者Aが観点を発表すると、システムは検出された音声によってAの位置を算出してカメラを参加者Aにアライメントするように起動するが、Aの発言はもう終わってカメラがまだAにアライメントしない恐れがあり、その時参加者Bが言い始め、システムは検出されたBの音声によってBの位置を算出すると同時に、カメラをBの所在方向へ回転させるように制御し、その時Cが発言しまたは複数の参加者が同時に発言する場合があり、このように従来の簡単なカメラ追従を採用されば、カメラは異なる参加者の間に振れることを引き起こしてしまう。要約すると、従来のビデオ会議技術では、カメラによる追従撮影が間に合わず、複数の人が同時に発言する時にカメラの頻繁なステアリングによる振れを引き起こし、ビデオ撮影効率が低下するという問題がある。
これに鑑みて、本発明の実施例は、カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体を提供し、従来のビデオ会議技術ではカメラによる追従撮影が間に合わず、複数の人が同時に発言する時にカメラの頻繁なステアリングによる振れを引き起こし、ビデオ撮影効率が低下するという問題を解決する。
本発明の第一態様第一態様はカメラ撮影制御方法を提供し、前記カメラ撮影制御方法は、
音声が検出された場合、前記音声にキーワードがあるか否かを識別することと、
前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定することと、
前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御することと、を含む。
本発明の態様第二態様はカメラ撮影制御装置を提供し、前記カメラ撮影制御装置は、
音声が検出された場合、前記音声にキーワードがあるか否かを識別するためのキーワード識別ユニットと、
前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定するための音源位置決めユニットと、
前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御するための第一撮影制御ユニットと、を含む。
本発明の第三態様は、メモリーと、プロセッサと、前記メモリーに記憶され、前記プロセッサで実行可能なコンピュータプログラムとを含み、前記プロセッサは前記コンピュータプログラムを実行する時に前記第一態様に記載のカメラ撮影制御方法のステップを実現する。
本発明の第四態様は、コンピュータ読み取り可能な記憶媒体を提供し、前記コンピュータ読み取り可能な記憶媒体にはコンピュータプログラムが記憶されており、前記コンピュータプログラムがプロセッサによって実行される時に上記第一態様に記載のカメラ撮影制御方法のステップを実現する。
本発明の実施例は従来技術と比較して、以下の有益な効果を有する、すなわち、音声が検出された場合、先ず、前記音声にキーワードがあるか否かを識別し、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定し、次に、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御し、カメラを効果的に回転させて音源対象を撮影することによって、複数の人が発言する時にカメラの頻繁な回転による振れを引き起こすことを回避し、さらにビデオ撮影の正確率を高め、ユーザーエクスペリエンスを向上させる。
本発明の実施例における技術的解決手段をより明確に説明するために、以下、実施例または従来技術の説明で使用される図面を簡単に紹介する。当然のことながら、以下の説明における図面は、本発明のいくつかの実施例に過ぎず、当業者であれば、創造的労働を要することなく、これらの図面に基づく他の図面を得ることができる。
本発明の実施例によるカメラ撮影制御方法を実現するフローチャートである。 本発明の実施例による音源対象に対応する音源角度の記録を含むカメラ撮影制御方法を実現するフローチャートである。 本発明の実施例による音源対象の再撮影場合を含むカメラ撮影制御方法を実現するフローチャートである。 本発明の実施例によるカメラ撮影制御方法の応用シーンの模式図である。 本発明の別の実施例によるカメラ撮影制御方法を実現するフローチャートである。 本発明の実施例によるカメラ撮影制御装置の構造を示すブロック図である。 本発明の実施例によるインテリジェント装置の模式図である。
以下の説明では、本発明の実施例を完全に理解するために提供される特定のシステム構造、技術などの詳細は、単なる例示に過ぎず、本発明を制限するものではない。しかしながら、当業者には、これらの具体的な詳細なしに他の実施例において本発明を実施できることが明らかであろう。その他の場合、本発明の説明を妨害しないために、周知のシステム、装置、回路および方法の詳細は省略する。
本発明の実施例は、複数の人が同時に発言する場合に撮影対象を正確に確定し、カメラの頻繁な回転による振れを回避するために、カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体を提供し、主に、音声が検出された場合、前記音声にキーワードがあるか否かを識別し、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定し、前記音源対象の音源角度によって、前記音源対象を前記カメラが撮影する画面の中央に位置させるように、前記カメラのステアリングを制御する。上記カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体を具体的に説明するために、以下、具体的な実施例を挙げて説明する。
本発明に記載の技術的解決手段を説明するために、以下、具体的な実施例を挙げて説明する。
実施例一
図1は、本発明の実施例によるカメラ撮影制御方法示すフローチャートである。当該方法フローは、ステップS101乃至S103を含む。各ステップの具体的な実現原理は以下のとおりである。
ステップS101では、音声が検出された場合、前記音声にキーワードがあるか否かを識別する。
本発明の実施例において、ビデオ電話又はビデオ会議を必要とする場合、インテリジェント装置を用いて音源対象を追跡して撮影する。インテリジェント装置は起動後にリアルタイムで現在シーンの音声を収集し始める。具体的には、マイクロホンアレイによりあらゆる方向にリアルタイムで音声をピックアップし、現在シーンの誰かからの音声を受ける。前記インテリジェント装置はスマートロボットであってもよく、回転可能なカメラを有するスマートスピーカーであってもよく、スマートスピーカーのマイクロホンアレイによって音声をピックアップし、回転可能なカメラによってビデオを撮影する。マイクロホンアレイが音声をピックアップした場合に、音声にキーワードがあるか否かを識別し、前記キーワードとはユーザーによって事前指定された単語又は文を指し、カメラの回転をトリガーするために用いられ、前記キーワードはユーザーによってリセットされる。
好ましくは、本発明の実施例において、音声におけるキーワードを正確に識別するために、前記ステップS101は以下を含む、すなわち、
A1、音声が検出された場合、前記音声をテキスト情報に変換する。
A2、前記テキスト情報に基づいて単語分割を行う。具体的には、文法の格式でテキスト情報を単語に分割し、さらに、音声情報から分割された単語を単語ベクトルとして記憶し、前記単語ベクトルにはさらに、当該単語ベクトルに対応する音声を識別するための識別ビットが設けられる。
A3、分割された単語と予め設定されたキーワードを整合し、前記音声にキーワードがあるか否かを確定し、具体的には、分割された単語と予め設定されたキーワードを照合整合すれば、前記音声にキーワードがあることを確定し、分割された単語が予め設定されたキーワードと整合しなければ、前記音声にキーワードがないことを確定する。
本発明の実施例において、音声をテキスト情報に変換して単語分割処理を行い、分割された単語を予め設定されたキーワードで一つずつ整合することによって、音声にキーワードがあるか否かを確定し、キーワード識別の正確率を高めることができる。
好ましくは、検出された音声を意味識別して音声の意味を識別することができ、識別された音声の意味が予め設定されたキーワードの意味と同じであれば、前記音声にキーワードがあることを確定し、カメラの回転をトリガーすることができ、前記音声の意味が予め設定されたキーワードの意味と同じでなければ、前記音声にキーワードがないことを確定し、即ち、カメラの回転をトリガーすることができない。
ステップS102では、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定する。
本発明の実施例において、前記音声に指定したキーワードがある場合、マイクロホンアレイアルゴリズムによって前記音声の音源方向を取得することができる。単一のマイクロホンは音声情報のみを取得できるが、複数のマイクロホンにより一定の幾何学的位置に応じて配置されたマイクロホンアレイは、音声情報だけでなく音声の空間的情報を取得することもできる。マイクロホンアレイアルゴリズムとは、一定の幾何学的位置に応じて配置されたマイクロホンアレイを用いて、ある音源から各マイクロホンまでの相対遅延時間および音波の到達時間差を算出することで、当該音源の音源方向を位置決めする。本発明の実施例において、マイクロホンアレイの個数と配列方式は制限されるものではなく、水平に並び替えてもよく、垂直に並び替えてもよく、又は、ランダムに並び替えてもよいが、マイクロホンアレイの個数と配列方式が確定された場合、マイクロホンアレイにおける各マイクロホンユニットの位置が確定される。
ステップS103では、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御する。
本発明の実施例において、検出された音声にキーワードがあることを識別した場合、カメラのステアリングをトリガーし、そして前記音声の音源角度によって前記カメラの回転に必要な方向を確定し、撮影効果を向上させるために、カメラを前記音声の音源に回転させる場合、前記音源に対応する音源対象が前記カメラの撮影する画面の中央にあるようにする。さらに、インテリジェント装置(又はカメラ)が前記音源に対応する音源対象に近い場合、カメラの光学的パラメータを、前記音源に対応する音源対象の顔が前記カメラの撮影する画面の中央にあるように調整する。
好ましくは、前記ステップS103は以下を含む、すなわち、
B1、前記カメラの現在の角度を取得する。
B2、前記音源角度と前記カメラの現在の角度との角度差を算出し、前記音源角度と前記カメラの現在の角度はいずれも相対角度を指す。
B3、前記音源角度と前記カメラの現在の角度との角度差によって、予め設定された回転速度に基づいて、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御する。具体的には、予め設定された回転速度は電機の速度を指す。本発明の実施例において、回転速度を予め設定することによって、カメラがステアリングする時に回転速度が速すぎることに起因する撮影画面の不安定、または回転速度が遅すぎることに起因する時間遅れを回避し、効率を向上させる。
好ましくは、前記B3は具体的には、以下を含む、すなわち、
B31、前記音源角度と前記カメラの現在の角度との角度差によって、第一回転速度で前記カメラを前記音源に回転させるように制御する。
B32、顔を検出し、顔が検出された場合、第二回転速度に基づいて、前記音声を出す音源対象を前記カメラの撮影する画面の中央に位置させるように、前記カメラのステアリングを制御し、ここで、前記第一回転速度は、前記第二回転速度よりも大きい。前記第一回転速度と第二回転速度はいずれも電機速度である。
本発明の実施例において、前記音源角度は前記音源に対応する音源対象の正確な角度ではなく、方向角であるため、前記音源角度と前記カメラの現在の角度との角度差によって、時間を節約するために、カメラを前記音源に迅速に回転させてから、電機速度を遅くさせ、顔検出技術を起動してカメラが撮影する画面における音源対象の顔を取得し、カメラの向きを、顔が撮影する画面の中央にあるように正確に調整する。
本発明第一実施例において、音声が検出された場合、先ず、前記音声にキーワードがあるか否かを識別し、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定し、次に、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御し、時間を節約するために、カメラを前記音声の音源の所在方向に迅速に回転させてから、回転速度を低減し、カメラの角度を前記音源に対応する音源対象が前記カメラが撮影する画面の中央にあるように正確に調整することによって、カメラを効果的に回転させて音源対象を撮影し、複数の人が発言する時にカメラの頻繁な回転による振れを引き起こすることを回避し、さらにビデオ撮影の正確率を高め、ユーザーエクスペリエンスを向上させる。
実施例二
上記実施例一に提供されるカメラ撮影制御方法に基づいて、本発明の別の実施例を提出し、図2は、当該実施例二に係るカメラ撮影制御方法を示すフローチャートであり、その詳細は次のとおりである。
ステップS201では、音声が検出された場合、前記音声にキーワードがあるか否かを識別する。
ステップS202では、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定する。
ステップS203では、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御する。
本実施例において、ステップS201乃至ステップS203の具体的なステップは実施例一のステップS101乃至ステップS103を参照し、ここで再度の説明を省略する。
ステップS204では、前記音声を出す音源対象が前記カメラの撮影する画面にある場合、前記音声の音声特徴および前記音声を出す音源対象に対応する音源角度を記録して関連付ける。
具体的には、前記音源に対応する音源対象が前記カメラの撮影する画面の中央にある場合、前記音源対象に対応する音源角度を記録し、前記音源対象に対応する音源角度は音源対象が前記カメラの撮影する画面の中央にある場合のカメラの角度(すなわち基準点に対する電機の正確な角度)であり、さらに前記音声の音声特徴、例えば音源角度、音声特徴等が記録され、ここで、音声特徴は音源対象を表すための特徴であり、音色、音声周波数および音声音響インテンシティ等を含む。記録された前記音源対象に対応する音源角度を前記音声の音声特徴に関連付け、さらに、記録された前記音源対象に対応する音源角度および前記音声の音声特徴を二次元配列として記憶し、すなわち一つの二次元配列には一つの音源対象に対応する音源角度および音源対象の音声特徴が記憶される。
当然のことながら、前記二次元配列に記憶されたのは音源対象に対応する音源角度を含む度数区間、例えば、前記音源対象に対応する音源角度が一定の度数で上下に浮動した後の度数区間であってもよい。新しい音声の音源角度が記録された度数区間内にあると検出された場合、カメラを迅速に回転させ前記音源対象にアライメントすることができる。
好ましくは、図3に示すように、前記ステップS204の後、さらに以下を含む、すなわち、
ステップS205では、新しい音声が検出された場合、前記新しい音声を出す音源対象の音源角度を確定する。
ステップS206では、前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲内にあるか否かを判断する。
ステップS207では、前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあれば、前記記録された音源対象に対応する音源角度によって、前記新しい音声の音源角度に対応する音源対象を前記カメラの撮影する画面の中央に位置させるように、前記カメラのステアリングを制御する。
一つの応用シーンを例として、ビデオ会議中、四つのマイクロホンアレイを備えるカメラ付きのスマートスピーカーを用い、三つの音源対象A、BおよびCの所在位置は図3Aに示すように、キーワードとして“Smart boy”を予め設定し、Aが発言する時、マイクロホンアレイを使用してAの発言をシステムに録音し、システムはキーワード識別アルゴリズムによってAがキーワードを話すか否かを検出し、Aの音声にキーワードの“Smart boy”があることが検出された場合、マイクロホンアレイアルゴリズムによってAの音声中の音源角度を取得し、それにより、取得した前記音源角度に基づいてAがMIC4位置の近くにあることを確定し、電機を起動し、カメラをMic4の近くに迅速に回転させてから、電機の速度を遅くさせ、顔検出し、顔が検出されると、カメラの角度を低速で調整し、検出された顔がカメラの撮影する画像の中央位置に位置するまで、電機を停止し、カメラの位置を固定し、かつAの正確な位置、および確定された音源角度を記録し、次のビデオ会議中、再びAの発言が検出された場合、カメラを迅速に回転させてAにアライメントし、調整時間を低減し、ユーザーエクスペリエンスの向上させることができる。
本発明第二実施例において、音声が検出された場合、先ず、前記音声にキーワードがあるか否かを識別し、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定し、次に、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御し、カメラを効果的に回転させて音源対象を撮影することによって、複数の人が発言する時にカメラの頻繁な回転による振れを引き起こすことを回避し、さらにビデオ撮影の正確率を高め、前記音声を出す音源対象が前記カメラの撮影する画面の中央にある場合、前記音声の音声特徴および前記音声を出す音源対象に対応する音源角度を記録して関連付け、それにより、同じ音源対象が再び発言する時にカメラを迅速かつ正確に回転させて当該音源対象にアライメントし、撮影効率をさらに上昇させ、ユーザーエクスペリエンスを向上させる。
実施例三
上記実施例二に提供されるカメラ撮影制御方法に基づいて、図4示は当該実施例三に係るカメラ撮影制御方法を示すフローチャートであり、その詳細は次のとおりである。
ステップS401、音声が検出された場合、前記音声にキーワードがあるか否かを識別する。
ステップS402、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定する。
ステップS403、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御する。
ステップS404、前記音声を出す音源対象が前記カメラの撮影する画面中にある場合、前記音声の音声特徴および前記音声を出す音源対象に対応する音源角度を記録して関連付ける。
本実施例において、ステップS401乃至ステップS404の具体的なステップは実施例二ステップS201乃至ステップS204を参照し、ここで再度の説明を省略する。
ステップS405、新しい音声が検出された場合、前記新しい音声の音声特徴が記録された音声特徴と同じであるか否かを判断する。前記音声特徴は、音声周波数、音色、音声音響インテンシティおよびピッチを含むが、これらに限定されない。
ステップS406、前記新しい音声の音声特徴が記録の音声特徴と同じであれば、前記音声特徴に関連する音源対象に対応する音源角度を取得する。
具体的には、前記新しい音声の音声特徴が記録された音声特徴と同じであれば、前記記録から前記音声特徴に関連する音源対象に対応する音源角度、すなわち音源対象が初めて発言する時に記録されたカメラの角度を検索する。
ステップS407、前記音声特徴に関連する音源対象に対応する音源角度によって、前記カメラを前記音源対象に回転させるように制御する。
具体的には、前記音声特徴に関連する音源対象に対応する音源角度によって、予め設定された回転速度で前記カメラを迅速に回転させて前記音源対象にアライメントする。
本発明第三実施例において、音声が検出された場合、先ず、前記音声にキーワードがあるか否かを識別し、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定し、次に、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御し、カメラを効果的に回転させて音源対象を撮影することによって、複数の人が発言する時にカメラの頻繁な回転による振れを引き起こすことを回避し、さらにビデオ撮影の正確率を高め、ユーザーエクスペリエンスを向上させる。
上記実施例における各ステップの順番の大きさは実行順序の優位性を意味するものではなく、各過程の実行順序はその機能および内部論理によって確定され、本発明の実施例の実施過程を制限するものではないことを理解すべきである。
実施例五
以上の実施例に記載のカメラ撮影制御方法に対応して、図5は本発明の実施例に係るカメラ撮影制御装置の構造を示すブロック図であり、該装置はインテリジェント装置に応用することができ、該インテリジェント装置は無線アクセスネットワークRANを経由して一つまたは複数のコアネットワークと通信するユーザー装置を含むことができ、該ユーザー装置は携帯電話(または「セル」電話と呼ばれる)またはモバイル機器を備えるコンピュータ等であってよく、例えば、ユーザー装置は携帯式、コンパクト式、手持ち式、コンピュータ内蔵装置であってもよく、それらは無線アクセスネットワークと音声および/またはデータを交換することができる。なお、例えば、該ユーザー装置は知能スピーカー、知能ロボット等であってもよい。説明の便宜上、本発明の実施例に関連する部分のみを示す。
説明の便宜上、本発明の実施例に関連する部分のみを示す。
図5を参照し、当該カメラ撮影制御装置は、キーワード識別ユニット51、音源位置決めユニット52、第一撮影制御ユニット53を含み、ここで、
キーワード識別ユニット51は、音声が検出された場合、前記音声にキーワードがあるか否かを識別するために用いられ、
音源位置決めユニット52は、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定するために用いられ、
第一撮影制御ユニット53は、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御するために用いられる。
好ましくは、前記第一撮影制御ユニット53は具体的に、
前記カメラの現在の角度を取得するための角度取得モジュールと、
前記音源角度と前記カメラの現在の角度との角度差を算出するための角度算出モジュールと、
前記音源角度と前記カメラの現在の角度との角度差によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、予め設定された回転速度に基づいて前記カメラのステアリングを制御するための回転制御モジュールと、を含む。
好ましくは、前記回転制御モジュールは具体的に、
前記音源角度と前記カメラの現在の角度との角度差によって、第一回転速度に基づいて前記カメラを前記音源に回転させるように制御するための第一回転子モジュールと、
顔を検出し、顔が検出された場合、第二回転速度に基づいて、前記音声を出す音源対象を前記カメラの撮影する画面の中央に位置させるように、前記カメラのステアリングを制御するための第二回転子モジュールと、ここで、前記第一回転速度は、前記第二回転速度よりも大きい、を含む。
好ましくは、前記カメラ撮影制御装置は、
前記音声を出す音源対象が前記カメラの撮影する画面の中央にある場合、前記音声の音声特徴および前記音声を出す音源対象に対応する音源角度を記録して関連付けるための関連付け記録ユニット54、をさらに含む。
好ましくは、前記カメラ撮影制御装置は、
新しい音声が検出された場合、前記新しい音声の音声特徴が記録された音声特徴と同じであるか否かを判断するための第一判断ユニット55と、
前記第一判断ユニット55はさらに、前記新しい音声の音声特徴が記録された音声特徴と同じであれば、前記音声特徴に関連する音源対象に対応する音源角度を取得するために用いられ、
前記音声特徴に関連する音源対象に対応する音源角度によって、前記カメラを前記音源対象に回転させるように制御するための第二撮影制御ユニット56と、をさらに含む。
好ましくは、前記カメラ撮影制御装置は、
新しい音声が検出された場合、前記新しい音声を出す音源対象の音源角度を確定するための角度確定ユニット57と、
前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあるか否かを判断するための第二判断ユニット58と、
前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあれば、前記記録された音源対象に対応する音源角度によって、前記新しい音声の音源角度に対応する音源対象を前記カメラの撮影する画面中に位置させるように、前記カメラのステアリングを制御するための第三撮影制御ユニット59と、をさらに含む。
本発明の第五実施例において、音声が検出された場合、先ず、前記音声にキーワードがあるか否かを識別し、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定し、次に、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御し、カメラを効果的に回転させて音源対象を撮影することによって、複数の人が発言する時にカメラの頻繁な回転による振れを引き起こすことを回避し、さらにビデオ撮影の正確率を高め、ユーザーエクスペリエンスを向上させる。
実施例六:
図6は本発明の一つの実施例に係るインテリジェント装置の模式図である。図6に示すように、当該実施例のインテリジェント装置6は、プロセッサ60と、メモリ61と、前記メモリ61に記憶され、前記プロセッサ60で実行可能なコンピュータプログラム62、例えば撮影制御プログラムとを含む。前記プロセッサ60は前記コンピュータプログラム62を実行する時、上記各カメラ撮影制御方法の実施例におけるステップ、例えば図1に示すステップ101乃至103を実現する。または、前記プロセッサ60は前記コンピュータプログラム62を実行する時、上記各装置実施例における各モジュール/ユニットの機能、例えば図5に示すユニット51乃至53の機能を実現する。
例示的には、前記コンピュータプログラム62は一つまたは複数のモジュール/ユニットに分割されてよく、前記一つ又は複数のモジュール/ユニットは前記メモリ61に記憶され、かつ前記プロセッサ60によって実行され、本発明に至った。前記一つ又は複数のモジュール/ユニットは、特定の機能を達成できる一連のコンピュータプログラム命令セグメントであってよく、該命令セグメントは前記コンピュータプログラム62の前記インテリジェント装置6での実行過程を記述するためのものである。例えば、前記コンピュータプログラム62はキーワード識別ユニット、音源位置決めユニット、第一撮影制御ユニットに分割されてよく、各ユニットの具体的な機能について、
キーワード識別ユニットは、音声が検出された場合、前記音声にキーワードがあるか否かを識別するために用いられ、
音源位置決めユニットは、前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定するために用いられ、
第一撮影制御ユニットは、前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御するために用いられる。
前記インテリジェント装置7はスマートスピーカー、スマートカメラおよびスマートロボット等のインテリジェント装置であってもよい。前記インテリジェント装置6は、プロセッサ60と、メモリー61とを含むが、それらに制限されない。当業者であれば、図6はインテリジェント装置6を例示するためのものに過ぎず、インテリジェント装置6を制限するものではなく、図示よりも多くの部品又は少ない部品、またはある部品の組み合わせ、または異なる部品を含んでよく、例えば前記インテリジェント装置はさらに入出力装置、ネットワークアクセスデバイス、バス等を含んでよい、ということを理解すべきである。
所謂プロセッサ60は中央処理装置(Central Processing Unit、CPU)であってよく、ほかの汎用プロセッサ、ディジタル信号プロセッサ(Digital Signal Processor、DSP)、特定用途向け集積回路(Application Specific Integrated Circuit、ASIC)、フィールドプログラマブルゲートアレイ(Field−Programmable Gate Array、FPGA)又はほかのプログラマブルロジックデバイス、ディスクリートゲートやトランジスタロジックデバイス、ディスクリートハードウェアコンポーネント等であってもよい。汎用プロセッサはマイクロプロセッサであってよく、または該プロセッサは任意の通常のプロセッサ等であってもよい。
前記メモリ61は前記インテリジェント装置6の内部ストレージユニット、例えばインテリジェント装置6のハードディスクまたは内部メモリであってよい。前記メモリ61は前記インテリジェント装置6の外部ストレージ装置、例えば前記インテリジェント装置6に配置される差し込み接続式ハードディスク、スマートメディアカード(Smart Media Card、SMC)、セキュアデジタル(Secure Digital、SD)カード、フラッシュカード(Flash Card)等であってもよい。さらに、前記メモリ61は前記インテリジェント装置6の内部ストレージユニットを含み、さらに外部ストレージ装置を含んでもよい。前記メモリ61は前記コンピュータプログラムおよび前記インテリジェント装置に必要なほかのプログラムおよびデータを記憶するために用いられる。前記メモリ61はさらに出力済みまたは出力しようとするデータを一時記憶するために用いられる。
当業者であれば、説明しやすくおよび簡潔にするために、上述の各機能ユニット、モジュールの分けのみが例示されているが、実際の応用で、需要に応じて上記機能配分は異なる機能ユニット、モジュールによって完成されて分け、即ち前記装置の内部構造を異なる機能ユニットやモジュールに分けして上述機能の全部または一部を実現できることは明確に理解できるであろう。実施例における各機能ユニット、モジュールは一つの処理ユニットに統合されていてもよく、物理的に別々に存在していてもよく、二つ以上のユニットが一つのユニットに統合されてもよいが、上記統合ユニットは、ハードウェアの形態またはソフトウェア機能ユニットの形態を採用できる。また、各機能ユニット、モジュールの具体的な名称は、互いに区別することのみを目的とし、本出願の保護範囲を制限するものではない。上述のシステムにおけるユニット、モジュールの具体的な作業プロセスについては、前記の方法実施例における対応するプロセスを参照することができ、ここで再度の説明を省略する。
上記の実施例では、各実施例にそれぞれ重点を置いて説明したが、ある実施例では詳しく説明または記載しない部分について、ほかの実施例の関連説明を参照することができる。
当業者は、本説明書に開示される実施例と関連付けて説明した各例示的なユニットおよびアルゴリズムステップは、電子ハードウェア、またはコンピュータソフトウェアおよび電子ハードウェアの組み合わせによって実現することができる、ということを意識することができる。これらの機能はいったいハードウェア方式またはソフトウェア方式で実行しているか否かということに関して、技術的解決手段の特定の応用および設計上の制約条件に依存する。当業者は各特定の応用につき、異なる方法によって説明された機能を実現することができるが、これらの実現は本発明の範囲を逸脱するものと思われるべきではない。
本発明が提供する実施例において、開示される装置および方法はほかの方式で実行され得ることを理解すべきである。例えば、以上に記載のシステムの実施例は例示に過ぎず、例えば、前記モジュールまたはユニットの分割はただ論理機能の分割であり、実際に実現する場合、例えば複数のユニットまたはコンポーネントを組み合わせたり、ほかのシステムに集積したり、一部の特徴を無視したり、実行したりしないなど、ほかの分割方法も採用できる。さらに、表示または討論される相互の結合または直接結合または通信接続はあるインターフェース、装置またはユニットを経由する間接結合または通信接続であり、電気的、機械的またはほかの形式であってもよい。
前記分割部品として説明されるユニットは物理的に分離されてもよいし、物理的に分離されなくてもよいが、ユニットとして表示される部品は物理ユニットであってもなくてもよく、即ちある場合に位置してよく、または複数のネットワークユニットに分布してもよい。実際の需要に応じてそのユニットの一部または全部を選択して本実施例の解決手段の目的を実現することができる。
また、本発明の各実施例における各機能ユニットは一つのプロセシングユニットに集積されてよく、各ユニットは単独で物理的に存在してもよく、二つまたは二つ以上のユニットは一つのユニットに集積されてもよい。上記集積されるユニットはハードウェアの形式で実現してよく、ソフトウェア機能ユニットの形式で実現してもよい。
前記集積されるユニットはソフトウェア機能ユニットの形式で実現しかつ独立製品として販売または使用する場合、一つのコンピュータ読み取り可能な記憶媒体に記憶することができる。これらの理解に基づいて、本発明の上記実施例を実現する方法における全部または一部のフローは、コンピュータプログラムによって関連するハードウェアを命令して完成させてもよく、前記コンピュータプログラムはコンピュータ読み取り可能な記憶媒体に記憶することができ、該コンピュータプログラムはプロセッサにより実行される時、上記各方法の実施例のステップを実現することができる。そのうち、前記コンピュータプログラムはコンピュータプログラムコードを含み、前記コンピュータプログラムコードはソースコード形式、目的コード形式、実行ファイルまたはある中間型等であってよい。前記コンピュータ可読媒体は前記コンピュータプログラムコードを携帯可能な任意の実体または装置、記録媒体、Uディスク、携帯型ハードディスク、磁気ディスク、光ディスク、コンピュータメモリ、読み出し専用メモリ(ROM、Read−Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、電気搬送波信号、電気信号およびソフトウェア分散媒体等を含んでよい。前記コンピュータ可読媒体に含まれる内容は裁判管轄区での法規および特許実施上の要求に基づいて適当に増減することができ、例えばある裁判管轄区では、法規および特許実施に基づいて、コンピュータ可読媒体は電気搬送波信号および電気通信信号を含まない、ということを説明すべきである。
以上に記載の実施例は本発明の技術的解決手段を説明するものであって、これを制限するものではなく、前記実施例を参照しながら本発明を詳細に説明したが、当業者であれば、それは依然として前記各実施例に記載の技術的解決手段を修正し、又はそのうち一部の技術特徴に対して均等物による置換を行うことができるが、これらの修正又は置換は、対応する技術的解決手段の本質を本発明の各実施例の技術的解決手段の精神と範疇から逸脱させるものではなく、それらは全て本発明の保護範囲に属する、ということを理解すべきである。
51 キーワード識別ユニット
52 音源位置決めユニット
53 第一撮影制御ユニット
6 インテリジェント装置
60 プロセッサ
61 メモリ
62 コンピュータプログラム

Claims (14)

  1. 音声が検出された場合、前記音声にキーワードがあるか否かを識別することと、
    前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定することと、
    前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御することとを含むことを特徴とするカメラ撮影制御方法。
  2. 前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御するステップは、
    前記カメラの現在の角度を取得することと、
    前記音源角度と前記カメラの現在の角度との角度差を算出することと、
    前記音源角度と前記カメラの現在の角度との角度差によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、予め設定された回転速度に基づいて前記カメラのステアリングを制御することと、を含むことを特徴とする請求項1に記載のカメラ撮影制御方法。
  3. 前記音源角度と前記カメラの現在の角度との角度差によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、予め設定された回転速度に基づいて前記カメラの方向回転を制御するステップは、
    前記音源角度と前記カメラの現在の角度との角度差によって、第一回転速度に基づいて前記カメラを前記音源に回転させるように制御することと、
    顔を検出し、顔が検出された場合、前記音声を出す音源対象を前記カメラの撮影する画面の中央に位置させるように、第二回転速度に基づいて前記カメラのステアリングを制御することと、ここで、前記第一回転速度は、前記第二回転速度よりも大きい、を含むことを特徴とする請求項2に記載のカメラ撮影制御方法。
  4. 前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラの方向回転を制御するステップの後にはさらに、
    前記音声を出す音源対象が前記カメラの撮影する画面にある場合、前記音声の音声特徴および前記音声を出す音源対象の音源角度を記録して関連付けることを含むことを特徴とする請求項1〜3のいずれか一項に記載のカメラ撮影制御方法。
  5. 前記音声特徴は音声特徴を含み、前記カメラ撮影制御方法は、
    新しい音声が検出された場合、前記新しい音声の音声特徴が記録された音声特徴と同じであるか否かを判断することと、
    前記新しい音声の音声特徴が記録された音声特徴と同じであれば、前記音声特徴に関連する音源対象に対応する音源角度を取得することと、
    前記音声特徴に関連する音源対象に対応する音源角度によって、前記カメラを前記音源対象に回転させるように制御することとをさらに含むことを特徴とする請求項4に記載のカメラ撮影制御方法。
  6. 前記カメラ撮影制御方法は、
    新しい音声が検出された場合、前記新しい音声を出す音源対象の音源角度を確定することと、
    前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあるか否かを判断することと、
    前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあれば、前記記録された音源対象に対応する音源角度によって、前記新しい音声の音源角度に対応する音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御することと、をさらに含むことを特徴とする請求項4に記載のカメラ撮影制御方法。
  7. 音声が検出された場合、前記音声にキーワードがあるか否かを識別するためのキーワード識別ユニットと、
    前記音声にキーワードがあれば、前記音声を出す音源対象の音源角度を確定するための音源位置決めユニットと、
    前記音声を出す音源対象の音源角度によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、前記カメラのステアリングを制御するための第一撮影制御ユニットと、を含むことを特徴とするカメラ撮影制御装置。
  8. 前記第一撮影制御ユニットは、
    前記カメラの現在の角度を取得するための角度取得モジュールと、
    前記音源角度と前記カメラの現在の角度との角度差を算出するための角度算出モジュールと、
    前記音源角度と前記カメラの現在の角度との角度差によって、前記音声を出す音源対象を前記カメラの撮影する画面に位置させるように、予め設定された回転速度に基づいて前記カメラのステアリングを制御するための回転制御モジュールと、を含むことを特徴とする請求項7に記載のカメラ撮影制御装置。
  9. 前記回転制御モジュールは、
    前記音源角度と前記カメラの現在の角度との角度差によって、第一回転速度に基づいて 前記カメラを前記音源に回転させるように制御するための第一回転子モジュールと、
    顔を検出し、顔が検出された場合、第二回転速度に基づいて、前記音声を出す音源対象を前記カメラの撮影する画面の中央に位置させるように、前記カメラのステアリングを制御するための第二回転子モジュールと、ここで、前記第一回転速度は、前記第二回転速度よりも大きい、を含むことを特徴とする請求項8に記載のカメラ撮影制御装置。
  10. 前記装置は、
    前記音声を出す音源対象が前記カメラの撮影する画面の中央にある場合、前記音声の音声特徴および前記音声を出す音源対象に対応する音源角度を記録して関連付けるための関連付け記録ユニットをさらに含むことを特徴とする請求項8に記載のカメラ撮影制御装置。
  11. 前記装置は、
    新しい音声が検出された場合、前記新しい音声の音声特徴が記録された音声特徴と同じであるか否かを判断するための第一判断ユニットと、
    前記音声特徴に関連する音源対象に対応する音源角度によって、前記カメラを前記音源対象に回転させるように制御するための第二撮影制御ユニットと、をさらに含むことを特徴とする請求項8に記載のカメラ撮影制御装置。
  12. 前記装置は、
    新しい音声が検出された場合、前記新しい音声を出す音源対象の音源角度を確定するための角度確定ユニットと、
    前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあるか否かを判断するための第二判断ユニットと、
    前記新しい音声を出す音源対象の音源角度が記録された音源対象に対応する音源角度の予め設定された範囲にあれば、前記記録された音源対象に対応する音源角度によって、前記新しい音声の音源角度に対応する音源対象を前記カメラの撮影する画面中に位置させるように、前記カメラのステアリングを制御するための第三撮影制御ユニットと、をさらに含むことを特徴とする請求項8に記載のカメラ撮影制御装置。
  13. メモリーと、プロセッサと、前記メモリーに記憶され、前記プロセッサで実行可能なコンピュータプログラムとを含むインテリジェント装置であって、前記プロセッサが前記コンピュータプログラムを実行する時、請求項1〜6のいずれか一項に記載のカメラ撮影制御方法のステップを実現することを特徴とするインテリジェント装置。
  14. コンピュータプログラムが記憶されるコンピュータ読み取り可能な記憶媒体であって、 前記コンピュータプログラムがプロセッサによって実行される時、請求項1〜6のいずれか一項に記載のカメラ撮影制御方法のステップを実現することを特徴とするコンピュータ読み取り可能な記憶媒体。
JP2019067340A 2018-04-04 2019-03-29 カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体 Active JP6785908B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810299510.1 2018-04-04
CN201810299510.1A CN108737719A (zh) 2018-04-04 2018-04-04 摄像头拍摄控制方法、装置、智能设备及存储介质

Publications (2)

Publication Number Publication Date
JP2019186929A true JP2019186929A (ja) 2019-10-24
JP6785908B2 JP6785908B2 (ja) 2020-11-18

Family

ID=63940700

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019067340A Active JP6785908B2 (ja) 2018-04-04 2019-03-29 カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体

Country Status (4)

Country Link
US (1) US10917577B2 (ja)
EP (1) EP3550827A1 (ja)
JP (1) JP6785908B2 (ja)
CN (1) CN108737719A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113284490A (zh) * 2021-04-23 2021-08-20 歌尔股份有限公司 电子设备的控制方法、装置、设备及可读存储介质

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108391057B (zh) * 2018-04-04 2020-10-16 深圳市冠旭电子股份有限公司 摄像头拍摄控制方法、装置、智能设备及计算机存储介质
CN109817240A (zh) * 2019-03-21 2019-05-28 北京儒博科技有限公司 信号分离方法、装置、设备及存储介质
CN111756986A (zh) * 2019-03-27 2020-10-09 上海博泰悦臻电子设备制造有限公司 一种摄像头控制方法、存储介质、装置及具有其的电子设备
CN113747069A (zh) 2019-05-15 2021-12-03 深圳市大疆创新科技有限公司 一种拍摄控制方法、装置及控制设备、拍摄设备
CN110232925A (zh) * 2019-06-28 2019-09-13 百度在线网络技术(北京)有限公司 生成会议记录的方法、装置和会议终端
CN110213492B (zh) * 2019-06-28 2021-03-02 Oppo广东移动通信有限公司 设备成像方法、装置、存储介质及电子设备
CN112311999A (zh) * 2019-07-26 2021-02-02 上海龙旗科技股份有限公司 智能视频音箱设备及其摄像头视角调整方法
CN111768785B (zh) * 2019-10-22 2022-12-27 广东小天才科技有限公司 一种智能手表的控制方法及智能手表
CN111047758A (zh) * 2019-11-29 2020-04-21 深圳市云天智能终端有限公司 一种智能电子设备的唤醒方法及系统
CN111251307B (zh) * 2020-03-24 2021-11-02 北京海益同展信息科技有限公司 应用于机器人的语音采集方法和装置、一种机器人
CN112866772B (zh) * 2020-08-21 2022-08-12 海信视像科技股份有限公司 一种显示设备及声像人物定位追踪方法
CN114098387B (zh) * 2020-08-27 2024-02-27 阿里巴巴集团控股有限公司 镜子调节方法、装置、镜子、电子设备及计算机可读介质
CN111988671B (zh) * 2020-09-07 2022-06-03 北京达佳互联信息技术有限公司 图像处理方法及图像处理装置
JP2022071984A (ja) * 2020-10-29 2022-05-17 キヤノン株式会社 撮像装置、制御方法、およびプログラム
CN112333391A (zh) * 2020-11-03 2021-02-05 深圳创维-Rgb电子有限公司 基于声音的人像自动追踪方法、装置、智能终端及介质
CN112492207B (zh) * 2020-11-30 2023-04-18 深圳卡多希科技有限公司 一种基于声源定位控制摄像头转动的方法和装置
CN112487246A (zh) * 2020-11-30 2021-03-12 深圳卡多希科技有限公司 一种多人视频中发言人的识别方法和装置
TWI826768B (zh) * 2021-01-22 2023-12-21 圓展科技股份有限公司 視訊會議系統與方法
US11310465B1 (en) * 2021-03-17 2022-04-19 Ampula Inc. Video conference teminal and system there of
CN113395373A (zh) * 2021-04-06 2021-09-14 上海福赛梦扬科技有限公司 一种摄像头控制方法及装置
CN114449252B (zh) * 2022-02-12 2023-08-01 北京蜂巢世纪科技有限公司 基于解说音频的现场视频动态调整方法、装置、设备、系统和介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7336169B2 (en) 2005-03-23 2008-02-26 Lake Star Consulting Llc Method and real time emergency response surveillance system
CN101534413B (zh) 2009-04-14 2012-07-04 华为终端有限公司 一种远程呈现的系统、装置和方法
US20110175999A1 (en) * 2010-01-15 2011-07-21 Mccormack Kenneth Video system and method for operating same
US8395653B2 (en) * 2010-05-18 2013-03-12 Polycom, Inc. Videoconferencing endpoint having multiple voice-tracking cameras
EP2882180A4 (en) 2013-09-29 2015-10-14 Zte Corp CONTROL METHOD, CONTROL APPARATUS AND CONTROL DEVICE
CN106888361A (zh) * 2015-12-11 2017-06-23 深圳市轻生活科技有限公司 视频交互控制方法和装置
CN105611167B (zh) * 2015-12-30 2020-01-31 联想(北京)有限公司 一种对焦平面调整方法及电子设备
CN107800967A (zh) * 2017-10-30 2018-03-13 维沃移动通信有限公司 一种拍摄方法及移动终端
CN107809596A (zh) * 2017-11-15 2018-03-16 重庆科技学院 基于麦克风阵列的视频会议跟踪系统及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113284490A (zh) * 2021-04-23 2021-08-20 歌尔股份有限公司 电子设备的控制方法、装置、设备及可读存储介质
CN113284490B (zh) * 2021-04-23 2022-09-09 歌尔股份有限公司 电子设备的控制方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
US10917577B2 (en) 2021-02-09
JP6785908B2 (ja) 2020-11-18
US20190313031A1 (en) 2019-10-10
CN108737719A (zh) 2018-11-02
EP3550827A1 (en) 2019-10-09

Similar Documents

Publication Publication Date Title
JP2019186929A (ja) カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体
CN103327170B (zh) 用于蜂窝电话机的对接台
JP6759406B2 (ja) カメラ撮影制御方法、装置、インテリジェント装置およびコンピュータ記憶媒体
CN107950018B (zh) 图像生成方法和系统、以及计算机可读介质
CN108900787B (zh) 图像显示方法、装置、系统及设备、可读存储介质
CN104580992A (zh) 一种控制方法及移动终端
CN111901524B (zh) 对焦方法、装置和电子设备
KR101508092B1 (ko) 화상 회의를 지원하는 방법 및 시스템
CN108632536B (zh) 一种相机控制方法及装置、终端、存储介质
US9565356B2 (en) Optimizing capture of focus stacks
WO2020035080A1 (zh) 一种追踪摄像方法、装置及终端设备
CN112689221B (zh) 录音方法、录音装置、电子设备及计算机可读存储介质
WO2017128750A1 (zh) 一种图像采集方法和图像采集装置
WO2018121385A1 (zh) 一种信息处理方法、装置和计算机存储介质
US11308732B2 (en) Face recognition method and apparatus
US10250803B2 (en) Video generating system and method thereof
CN109495689A (zh) 一种拍摄方法、装置、电子设备及存储介质
CN108063909A (zh) 视频会议系统、图像跟踪采集方法及装置
CN104967777A (zh) 一种控制摄像头拍摄方法及终端
US10097747B2 (en) Multiple camera autofocus synchronization
WO2021130548A1 (en) Gesture recognition method and apparatus, electronic device, and storage medium
US11902754B2 (en) Audio processing method, apparatus, electronic device and storage medium
CN104780341A (zh) 一种信息处理方法以及信息处理装置
CN112073639A (zh) 拍摄控制方法及装置、计算机可读介质和电子设备
CN108924405B (zh) 基于距离的拍照聚焦修正和图像处理方法、设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200811

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201012

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201027

R150 Certificate of patent or registration of utility model

Ref document number: 6785908

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250