CN103957359B - 摄像装置及其对焦方法 - Google Patents

摄像装置及其对焦方法 Download PDF

Info

Publication number
CN103957359B
CN103957359B CN201410205508.5A CN201410205508A CN103957359B CN 103957359 B CN103957359 B CN 103957359B CN 201410205508 A CN201410205508 A CN 201410205508A CN 103957359 B CN103957359 B CN 103957359B
Authority
CN
China
Prior art keywords
sound
target
sound source
focusing
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410205508.5A
Other languages
English (en)
Other versions
CN103957359A (zh
Inventor
孙丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nubia Technology Co Ltd
Original Assignee
Nubia Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nubia Technology Co Ltd filed Critical Nubia Technology Co Ltd
Priority to CN201410205508.5A priority Critical patent/CN103957359B/zh
Publication of CN103957359A publication Critical patent/CN103957359A/zh
Priority to PCT/CN2015/077480 priority patent/WO2015172630A1/zh
Application granted granted Critical
Publication of CN103957359B publication Critical patent/CN103957359B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B13/00Viewfinders; Focusing aids for cameras; Means for focusing for cameras; Autofocus systems for cameras
    • G03B13/32Means for focusing
    • G03B13/34Power focusing
    • G03B13/36Autofocus systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/67Focus control based on electronic image sensor signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Studio Devices (AREA)

Abstract

本发明公开了一种摄像装置及其对焦方法,所述对焦方法包括步骤:在拍摄过程中,采集声音;判断采集到的声音中是否有与预存的声音相匹配的目标声音,若是,则对发出所述目标声音的目标声源进行对焦。从而,通过采集声音、分离声音、匹配声音,从而识别出目标声音及对应的目标声源,并自动对该目标声源进行对焦,最终实现了通过声音对跟踪目标进行跟踪拍摄,即使跟踪目标不断转换或不断移动,也能实现实时跟踪拍摄。

Description

摄像装置及其对焦方法
技术领域
本发明涉及摄像技术领域,尤其是涉及一种摄像装置及其对焦方法。
背景技术
摄像装置传统的对焦方法通常是手动对焦,由用户选择焦点,然后对焦点进行对焦。手动对焦比较繁琐,而且效率较低,特别是当目标不断转换或目标不断移动时,手动对焦更是无法实现实时跟踪拍摄。现有技术中虽然也有自动对焦的方法,但现有的自动对焦还无法实现对特定目标的跟踪拍摄。
发明内容
本发明的主要目的在于提供一种摄像装置及其对焦方法,旨在通过声音进行自动对焦,以实现对跟踪目标进行跟踪拍摄。
为达以上目的,本发明提出一种摄像装置的对焦方法,包括步骤:
在拍摄过程中,采集声音;
判断采集到的声音中是否有与预存的声音相匹配的目标声音,若是,则对发出所述目标声音的目标声源进行对焦。
优选地,所述判断采集到的声音中是否有与预存的声音相匹配的目标声音包括:
若采集到的声音为至少两声源发出的声音,则分离出各声源的声音;
提取出各声源的声音的声学特征,并分别与预存的声音的声学特征进行比较;
若其中一声源的声音的声学特征与预存的声音的声学特征相匹配,则判定该声源的声音为目标声音,该声源为目标声源。
优选地,所述对发出所述目标声音的目标声源进行对焦包括:
对发出所述目标声音的目标声源进行定位;
对准所述目标声源的定位方向进行对焦。
优选地,所述方法还包括:若预存的声音至少有两个,且匹配出的目标声音也至少有两个,则根据预设的优先级顺序对优先级较高的目标声音所对应的目标声源进行对焦。
优选地,判断采集到的声音中是否有与预存的声音相匹配的目标声音的步骤之后还包括:若采集到的声音中没有与预存的声音相匹配的目标声音,则对任一发声声源进行对焦。
本发明同时提出一种摄像装置,声音采集模块、处理模块和对焦模块,其中:
声音采集模块,用于采集声音;
处理模块,用于判断采集到的声音中是否有与预存的声音相匹配的目标声音,若是,则向对焦模块发送第一对焦信号;
对焦模块,用于根据所述第一对焦信号对发出所述目标声音的目标声源进行对焦。
优选地,所述处理模块用于:
若检测到采集到的声音为至少两声源发出的声音,则分离出各声源的声音;提取出各声源的声音的声学特征,并分别与预存的声音的声学特征进行比较;若其中一声源的声音的声学特征与预存的声音的声学特征相匹配,则判定该声源的声音为目标声音,该声源为目标声源。
优选地,所述对焦模块用于:对发出所述目标声音的目标声源进行定位,控制摄像头对准所述目标声源的定位方向进行对焦。
优选地,所述对焦模块用于:若预存的声音至少有两个,且匹配出的目标声音也至少有两个,则根据预设的优先级顺序对优先级较高的目标声音所对应的目标声源进行对焦。
优选地,所述处理模块用于:若判定采集到的声音中没有与预存的声音相匹配的目标声音,则向所述对焦模块发送第二对焦信号;
所述对焦模块用于:根据所述第二对焦信号对任一发声声源进行对焦。
本发明所提供的一种摄像装置的对焦方法,通过采集声音、分离声音、匹配声音,从而识别出目标声音及对应的目标声源,并自动对该目标声源进行对焦,最终实现了通过声音对跟踪目标进行跟踪拍摄,即使跟踪目标不断转换或不断移动,也能实现实时跟踪拍摄。
附图说明
图1是本发明的摄像装置的对焦方法第一实施例的流程图;
图2是本发明中声音匹配的具体流程图;
图3是本发明的摄像装置的对焦方法第二实施例的流程图;
图4是本发明的摄像装置一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明所述的摄像装置,包括一切具有摄像功能的设备,如手机、平板电脑、摄像机、监控摄像头等等。
参见图1,提出本发明的摄像装置的对焦方法第一实施例,所述对焦方法包括以下步骤:
步骤S101:开始摄像
步骤S102:在拍摄过程中采集声音
摄像装置利用至少两麦克风,优选利用由多个麦克风组成的麦克风阵列来采集声音。
步骤S103:判断采集到的声音中是否有与预存的声音相匹配的目标声音
摄像装置中预先录制或获取了某人的声音片段,并对该声音片段进行分析,提取出该声音片段的声学特征并予以存储。摄像装置实时或定时的对采集到的声音进行采样,分析采集到的声音中是否有与预存的声音相匹配的目标声音,若其中有目标声音,则进入步骤S104;若没有目标声音,则保持当前的对焦状态。
声音的匹配流程具体如图2所示,包括以下步骤:
步骤S110:判断采集到的声音是否为单一声源发出的声音
若为至少两声源发出的声音,则进入步骤S120;若为单一声源发出的声音,则进入步骤S160。
步骤S120:分离出各声源的声音
可以利用传统的声源分离方法,如基于独立分量分析的声源分析方法分离出多个声源中每一个声源的声音,其充分利用在声源之间声源的源信号是独立的这一事实。在独立分量分析中,根据声源数量使用维数等于麦克风数量的线性滤波器,当声源的数量小于麦克风的数量时,能够完全恢复源信号。当声源数量超过麦克风数量时,可以使用L1范最小化方法,该方法利用了语音功率谱的概率分布接近拉普拉斯分布而不是高斯分布这一事实。
优选利用以下方法进行声源分离:将来自至少两个声源的模拟声音输入转换为数字声音输入;将数字声音输入从时域转换到频域;产生第一解集,且该解集使得来自声源1到N中活动的那些声音的估计的误差最小;根据第一解集估计活动声源的数量,以生产最优分离解集,该最优分离解集最接近收到的模拟声音输入的每个声源;将最优分离解集转换到时域。从而,即使在声源数量超过麦克风数量,并且出现一些具有高S/N的背景噪声、回声和混响的环境里,也能够分离出每个声源的声音。
步骤S130:提取出各声源的声音的声学特征,并分别与预存的声音的声学特征进行比较
目前声音匹配方法中常用的提取声学特征的方法包括线性预测倒谱(LPCC)参数、美化倒谱参数(MFCC)等等。
具体的,摄像装置从各声源的声音中提取声学特征形成待识别的特征矢量序列,如将每个待识别的特征矢量序列与预存的声音的声学特征形成的特征矢量序列进行匹配得分(也称为对数似然的分,或似然的分,或得分),进行判决;根据声纹的识别方法的类型(闭集声纹鉴别、开集声纹鉴别和声纹确认),在需要的时候进行拒识判决,从而得出结果。
步骤S140:若其中一声源的声音的声学特征与预存的声音的声学特征相匹配,则判定该声源的声音为目标声音,该声源为目标声源
若其中一声源的声音的匹配得分最高,且超过预设阈值,则判定该声音为目标声音,该声源为目标声源。
步骤S150:提取出采集到的声音的声学特征
若采集到的声音由单一声源发出,则直接提取出该声音的声学特征形成的待识别的特征矢量序列。
步骤S160:判断采集到的声音的声学特征与预存的声音的声学特征是否匹配
将待识别的特征矢量序列与预存的声音的声学特征形成的特征矢量序列进行匹配得分,进行判决;根据声纹的识别方法的类型(闭集声纹鉴别、开集声纹鉴别和声纹确认),在需要的时候进行拒识判决,从而得出结果。若相匹配,则进入步骤S170;否则,则判定采集到的声音中没有目标声音。
步骤S170:判定采集到的声音为目标声音,发声声源为目标声源
若匹配得分超过预设阈值,则判定采集到的该声音为目标声音,发声声源为目标声源。
当匹配出目标声音后,则进入步骤S104。
步骤S104:对发出目标声音的目标声源进行对焦
摄像装置检测到目标声音后,则利用传统的定位方法对发出目标声音的目标声源进行定位,然后控制摄像头对准目标声源的定位方向,对该目标声源进行对焦。从而,利用该对焦方法,可以利用摄像头对跟踪目标进行实时跟踪拍摄。
在某些实施例中,摄像装置中预存了至少两个人的声音,并对预存的多个声音进行优先级排序,当据此匹配出的目标声音至少有两个时,摄像装置则根据预设的优先级顺序对优先级较高的目标声音所对应的目标声源进行对焦。即,摄像装置中存储了多个跟踪目标的声音特征,当多个跟踪目标同时发声时,则对准优先级较高的跟踪目标进行对焦。或者,也可以由用户从预存的跟踪目标中指定一跟踪目标进行跟踪拍摄。
参见图3,提出本发明的摄像装置的对焦方法第二实施例,所述对焦方法包括以下步骤:
步骤S201:开始摄像
步骤S202:在拍摄过程中采集声音
步骤S203:判断采集到的声音中是否有与预存的声音相匹配的目标声音
若有目标声音,则进入步骤S204;若没有目标声音,则进入步骤S205。
步骤S204:对发出目标声音的目标声源进行对焦
步骤S205:对任一发声声源进行对焦
当发声声源为唯一声源时,则对该唯一声源进行定位,控制摄像头对准该声源的定位方向进行对焦;当发声声源有多个时,则对多个声源进行分离,并选择任一声源进行定位,控制摄像头对准该声源的定位方向进行对焦。本实施例尤其适用于会议场景,当会议中重要人物讲话时,则聚焦于该重要人物;当重要人物没有讲话,而有其他人发言时,则聚焦于其它人。
此外,摄像装置此时也可以根据预设规则选择对焦目标,如就近原则、音量最大原则等。
摄像装置可以在开始拍摄之前预先存储跟踪目标的声音,然后在拍摄过程中对跟踪目标进行跟踪拍摄。摄像装置也可以在拍摄过程中选定跟踪目标,然后对该跟踪目标进行跟踪拍摄。例如,拍摄过程中,用户在拍摄画面上选定一跟踪目标,摄像装置根据现有的转换方法将跟踪目标在拍摄画面上的平面位置转换为空间位置,并获取该跟踪目标的声音,通过分析提取出该声音的声学特征并予以存储,随后无论该跟踪目标在摄像范围内如何移动,摄像装置都能对其跟踪拍摄。
从而,本发明的摄像装置的对焦方法,通过采集声音、分离声音、匹配声音,从而识别出目标声音及对应的目标声源,并自动对该目标声源进行对焦,最终实现了通过声音对跟踪目标的跟踪拍摄,即使跟踪目标不断转换或不断移动,也能实现实时跟踪拍摄。
参见图4,提出本发明的摄像装置一实施例,所述摄像装置包括声音采集模块、处理模块和对焦模块。
声音采集模块:用于采集声音。
声音采集模块通过至少两麦克风,优选通过由多个麦克风组成的麦克风阵列来采集声音。
处理模块:用于判断采集到的声音中是否有与预存的声音相匹配的目标声音,若是,则向对焦模块发送第一对焦信号。
摄像装置中预先录制或获取了某人的声音片段,并对该声音片段进行分析,提取出该声音片段的声学特征并予以存储。
处理模块实时或定时的对采集到的声音进行采样,分析采集到的声音中是否有与预存的声音相匹配的目标声音,若其中有目标声音,则向对焦模块发送第一对焦信号。
具体的,处理模块首先判断采集到的声音是否为单一声源发出的声音。
如果是至少两声源发出的声音,则分离出各声源的声音。可以利用传统的声源分离方法,如基于独立分量分析的声源分析方法分离出多个声源中每一个声源的声音,其充分利用在声源之间声源的源信号是独立的这一事实。在独立分量分析中,根据声源数量使用维数等于麦克风数量的线性滤波器,当声源的数量小于麦克风的数量时,能够完全恢复源信号。当声源数量超过麦克风数量时,可以使用L1范最小化方法,该方法利用了语音功率谱的概率分布接近拉普拉斯分布而不是高斯分布这一事实。优选利用一下方法进行声源分离:将来自至少两个声源的模拟声音输入转换为数字声音输入;将数字声音输入从时域转换到频域;产生第一解集,且该解集使得来自声源1到N中活动的那些声音的估计的误差最小;根据第一解集估计活动声源的数量,以生产最优分离解集,该最优分离解集最接近收到的模拟声音输入的每个声源;将最优分离解集转换到时域。从而,即使在声源数量超过麦克风数量,并且出现一些具有高S/N的背景噪声、回声和混响的环境里,也能够分离出每个声源的声音。
声源分离后,提取出各声源的声音的声学特征,并分别与预存的声音的声学特征进行比较。目前声音匹配方法中常用的提取声学特征的方法包括线性预测倒谱(LPCC)参数、美化倒谱参数(MFCC)等等。具体的处理模块从各声源的声音中提取声学特征形成待识别的特征矢量序列,如将每个待识别的特征矢量序列与预存的声音的声学特征形成的特征矢量序列进行匹配得分(也称为对数似然的分,或似然的分,或得分),进行判决;根据声纹的识别方法的类型(闭集声纹鉴别、开集声纹鉴别和声纹确认),在需要的时候进行拒识判决,从而得出结果。若其中一声源的声音的声学特征与预存的声音的声学特征相匹配(如,其中一声源的声音的匹配得分最高,且超过预设阈值),则判定该声源的声音为目标声音,该声源为目标声源;否则,则,则判定采集到的声音中没有目标声音。
如果是单一声源发出的声音,则直接提取出采集到的声音的声学特征,判断采集到的声音的声学特征与预存的声音的声学特征是否匹配,若相匹配,则判定采集到的声音为目标声音,发声声源为目标声源,否则,则判定采集到的声音中没有目标声音。
在某些实施例中,当处理模块判定采集到的声音中没有目标声音时,则向对焦模块发送第二对焦信号。
对焦模块:用于根据第一对焦信号对发出目标声音的目标声源进行对焦。
具体的,对焦模块接收到第一对焦信号后,则利用传统的定位方法对发出目标声音的目标声源进行定位,然后控制摄像头对准目标声源的定位方向,对该目标声源进行对焦。从而,利用该对焦方法,可以利用摄像头对跟踪目标进行实时跟踪拍摄。
当摄像装置中预存了至少两个人的声音,并对预存的多个声音进行了优先级排序,而处理模块据此匹配出的目标声音至少有两个时,对焦模块则根据预设的优先级顺序对优先级较高的目标声音所对应的目标声源进行对焦。即,摄像装置中存储了多个跟踪目标的声音特征,当多个跟踪目标同时发声时,则对准优先级较高的跟踪目标进行对焦。或者,也可以由用户从预存的跟踪目标中指定一跟踪目标进行跟踪拍摄。
在某些实施例中,当处理模块向对焦模块发送第二对焦信号时,对焦模块根据第二对焦信号对任一发声声源对焦。当发声声源为唯一声源时,则对该唯一声源进行定位,控制摄像头对准该声源的定位方向进行对焦;当发声声源有多个时,处理模块则对多个声源进行分离,对焦模块选择任一声源进行定位,控制摄像头对准该声源的定位方向进行对焦。本实施例尤其适用于会议场景,当会议中重要人物讲话时,则聚焦于该重要任务;当重要人物没有讲话,而有其他人发言时,则聚焦于其它人。此外,对焦模块此时也可以根据预设规则选择对焦目标,如就近原则、音量最大原则等。
摄像装置可以在开始拍摄之前预先存储跟踪目标的声音,然后在拍摄过程中对跟踪目标进行跟踪拍摄。摄像装置也可以在拍摄过程中选定跟踪目标,然后对该跟踪目标进行跟踪拍摄。例如,拍摄过程中,用户在拍摄画面上选定一跟踪目标,摄像装置根据现有的转换方法将跟踪目标在拍摄画面上的平面位置转换为空间位置,并获取该跟踪目标的声音,通过分析提取出该声音的声学特征并予以存储,随后无论该跟踪目标在摄像范围内如何移动,都可通过声音的特征匹配,来确定目标声源的方位,进而摄像装置都能对其对焦跟踪拍摄。
据此,本发明的摄像装置,通过采集声音、分离声音、匹配声音,从而识别出目标声音及对应的目标声源,并自动对该目标声源进行对焦,最终实现了通过声音对跟踪目标的跟踪拍摄,即使跟踪目标不断转换或不断移动,也能实现实时跟踪拍摄。
需要说明的是,上述方法实施例中的技术特征在本装置均对应适用。
本领域普通技术人员可以理解,实现上述实施例方法中的全部或部分步骤可以通过程序来控制相关的硬件完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质可以是ROM/RAM、磁盘、光盘等。
以上参照附图说明了本发明的优选实施例,并非因此局限本发明的权利范围。本领域技术人员不脱离本发明的范围和实质,可以有多种变型方案实现本发明,比如作为一个实施例的特征可用于另一实施例而得到又一实施例。凡在运用本发明的技术构思之内所作的任何修改、等同替换和改进,均应在本发明的权利范围之内。

Claims (10)

1.一种摄像装置的对焦方法,应用于移动终端,其特征在于,包括步骤:
在拍摄过程中,确定用户在拍摄画面上选定的跟踪目标,获取所述跟踪目标的声音,通过分析提取出该声音的声学特征并予以存储;
采集声音,判断采集到的声音中是否有与预存的声音的声学特征相匹配的目标声音,若是,则对发出所述目标声音的目标声源进行对焦。
2.根据权利要求1所述的摄像装置的对焦方法,其特征在于,所述判断采集到的声音中是否有与预存的声音相匹配的目标声音包括:
若采集到的声音为至少两声源发出的声音,则分离出各声源的声音;
提取出各声源的声音的声学特征,并分别与预存的声音的声学特征进行比较;
若其中一声源的声音的声学特征与预存的声音的声学特征相匹配,则判定该声源的声音为目标声音,该声源为目标声源。
3.根据权利要求1所述的摄像装置的对焦方法,其特征在于,所述对发出所述目标声音的目标声源进行对焦包括:
对发出所述目标声音的目标声源进行定位;
对准所述目标声源的定位方向进行对焦。
4.根据权利要求1-3任一项所述的摄像装置的对焦方法,其特征在于,所述方法还包括:若预存的声音至少有两个,且匹配出的目标声音也至少有两个,则根据预设的优先级顺序对优先级较高的目标声音所对应的目标声源进行对焦。
5.根据权利要求1-3任一项所述的摄像装置的对焦方法,其特征在于,判断采集到的声音中是否有与预存的声音相匹配的目标声音的步骤之后还包括:若采集到的声音中没有与预存的声音相匹配的目标声音,则对任一发声声源进行对焦。
6.一种摄像装置,应用于移动终端,其特征在于,声音采集模块、处理模块和对焦模块,其中:
声音采集模块,用于采集声音;
处理模块,用于在拍摄过程中,确定用户在拍摄画面上选定的跟踪目标,获取所述跟踪目标的声音,通过分析提取出该声音的声学特征并予以存储;判断采集到的声音中是否有与预存的声音的声学特征相匹配的目标声音,若是,则向对焦模块发送第一对焦信号;
对焦模块,用于根据所述第一对焦信号对发出所述目标声音的目标声源进行对焦。
7.根据权利要求6所述的摄像装置,其特征在于,所述处理模块用于:
若检测到采集到的声音为至少两声源发出的声音,则分离出各声源的声音;提取出各声源的声音的声学特征,并分别与预存的声音的声学特征进行比较;若其中一声源的声音的声学特征与预存的声音的声学特征相匹配,则判定该声源的声音为目标声音,该声源为目标声源。
8.根据权利要求6所述的摄像装置,其特征在于,所述对焦模块用于:对发出所述目标声音的目标声源进行定位,控制摄像头对准所述目标声源的定位方向进行对焦。
9.根据权利要求6-8任一项所述的摄像装置,其特征在于,所述对焦模块用于:若预存的声音至少有两个,且匹配出的目标声音也至少有两个,则根据预设的优先级顺序对优先级较高的目标声音所对应的目标声源进行对焦。
10.根据权利要求6-8任一项所述的摄像装置,其特征在于,所述处理模块用于:若判定采集到的声音中没有与预存的声音相匹配的目标声音,则向所述对焦模块发送第二对焦信号;
所述对焦模块用于:根据所述第二对焦信号对任一发声声源进行对焦。
CN201410205508.5A 2014-05-15 2014-05-15 摄像装置及其对焦方法 Active CN103957359B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410205508.5A CN103957359B (zh) 2014-05-15 2014-05-15 摄像装置及其对焦方法
PCT/CN2015/077480 WO2015172630A1 (zh) 2014-05-15 2015-04-27 摄像装置及其对焦方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410205508.5A CN103957359B (zh) 2014-05-15 2014-05-15 摄像装置及其对焦方法

Publications (2)

Publication Number Publication Date
CN103957359A CN103957359A (zh) 2014-07-30
CN103957359B true CN103957359B (zh) 2016-08-24

Family

ID=51334574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410205508.5A Active CN103957359B (zh) 2014-05-15 2014-05-15 摄像装置及其对焦方法

Country Status (2)

Country Link
CN (1) CN103957359B (zh)
WO (1) WO2015172630A1 (zh)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103957359B (zh) * 2014-05-15 2016-08-24 努比亚技术有限公司 摄像装置及其对焦方法
CN104092936B (zh) * 2014-06-12 2017-01-04 小米科技有限责任公司 自动对焦方法及装置
CN106303195A (zh) * 2015-05-28 2017-01-04 中兴通讯股份有限公司 拍摄设备及跟踪拍摄方法和系统
CN105208283A (zh) * 2015-10-13 2015-12-30 广东欧珀移动通信有限公司 一种声控拍照的方法及装置
CN105554443B (zh) * 2015-12-04 2018-11-13 浙江宇视科技有限公司 视频图像中异响来源的定位方法及装置
CN105657253B (zh) * 2015-12-28 2019-03-29 联想(北京)有限公司 一种对焦方法及电子设备
CN105872366B (zh) * 2016-03-30 2018-08-24 南昌大学 一种基于fastica算法的盲源分离技术控制聚焦系统
CN107347145A (zh) * 2016-05-06 2017-11-14 杭州萤石网络有限公司 一种视频监控方法及云台网络摄像机
CN105979442B (zh) * 2016-07-22 2019-12-03 北京地平线机器人技术研发有限公司 噪声抑制方法、装置和可移动设备
CN106341601A (zh) * 2016-09-23 2017-01-18 努比亚技术有限公司 移动终端及拍照方法
CN106341665A (zh) * 2016-09-30 2017-01-18 浙江宇视科技有限公司 一种跟踪监控方法及装置
US10212338B2 (en) * 2016-11-22 2019-02-19 Google Llc Camera operable using natural language commands
CN106603919A (zh) * 2016-12-21 2017-04-26 捷开通讯(深圳)有限公司 调整拍摄对焦的方法及终端
CN106803886A (zh) * 2017-02-28 2017-06-06 深圳天珑无线科技有限公司 一种拍照的方法及装置
JP6766086B2 (ja) 2017-09-28 2020-10-07 キヤノン株式会社 撮像装置およびその制御方法
WO2019104681A1 (zh) 2017-11-30 2019-06-06 深圳市大疆创新科技有限公司 拍摄方法和装置
WO2019130909A1 (ja) * 2017-12-26 2019-07-04 キヤノン株式会社 撮像装置及びその制御方法及び記録媒体
JP7292853B2 (ja) 2017-12-26 2023-06-19 キヤノン株式会社 撮像装置及びその制御方法及びプログラム
CN108091091A (zh) * 2017-12-28 2018-05-29 中国电子科技集团公司第五十四研究所 一种低功耗震声图像复合探测系统
CN110875053A (zh) * 2018-08-29 2020-03-10 阿里巴巴集团控股有限公司 语音处理的方法、装置、系统、设备和介质
CN110876036B (zh) * 2018-08-31 2022-08-02 腾讯数码(天津)有限公司 一种视频生成的方法以及相关装置
CN109194918B (zh) * 2018-09-17 2022-04-19 东莞市丰展电子科技有限公司 一种基于移动载体的拍摄系统
CN109639961B (zh) * 2018-11-08 2021-05-18 联想(北京)有限公司 采集方法和电子设备
WO2020118503A1 (zh) * 2018-12-11 2020-06-18 华为技术有限公司 一种确定图像对焦区域的方法及装置
CN111050063A (zh) * 2019-03-29 2020-04-21 苏州浩哥文化传播有限公司 一种基于声源识别的自动化摄像方法及其系统
CN113411487B (zh) * 2020-03-17 2023-08-01 中国电信股份有限公司 设备的控制方法、装置、系统和计算机可读存储介质
CN113284490B (zh) * 2021-04-23 2022-09-09 歌尔股份有限公司 电子设备的控制方法、装置、设备及可读存储介质
CN113573096A (zh) * 2021-07-05 2021-10-29 维沃移动通信(杭州)有限公司 视频处理方法、装置、电子设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068308A (zh) * 2007-05-10 2007-11-07 华为技术有限公司 一种控制图像采集装置进行目标定位的系统及方法
CN101770139A (zh) * 2008-12-29 2010-07-07 鸿富锦精密工业(深圳)有限公司 对焦控制系统及方法
CN103516894A (zh) * 2012-06-25 2014-01-15 Lg电子株式会社 移动终端及其音频缩放方法
CN103685905A (zh) * 2012-09-17 2014-03-26 联想(北京)有限公司 一种拍照方法及电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100690708B1 (ko) * 2002-06-28 2007-03-09 엘지전자 주식회사 화상 통신 기능을 구비한 휴대용 단말기의 촬영 방향 조정방법 및 장치
CN100420298C (zh) * 2004-06-25 2008-09-17 北京中星微电子有限公司 摄像机拍摄方位数字声控定向方法
CN102413276A (zh) * 2010-09-21 2012-04-11 天津三星光电子有限公司 具有声控聚焦功能的数码摄像机
CN103957359B (zh) * 2014-05-15 2016-08-24 努比亚技术有限公司 摄像装置及其对焦方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101068308A (zh) * 2007-05-10 2007-11-07 华为技术有限公司 一种控制图像采集装置进行目标定位的系统及方法
CN101770139A (zh) * 2008-12-29 2010-07-07 鸿富锦精密工业(深圳)有限公司 对焦控制系统及方法
CN103516894A (zh) * 2012-06-25 2014-01-15 Lg电子株式会社 移动终端及其音频缩放方法
CN103685905A (zh) * 2012-09-17 2014-03-26 联想(北京)有限公司 一种拍照方法及电子设备

Also Published As

Publication number Publication date
CN103957359A (zh) 2014-07-30
WO2015172630A1 (zh) 2015-11-19

Similar Documents

Publication Publication Date Title
CN103957359B (zh) 摄像装置及其对焦方法
US9595259B2 (en) Sound source-separating device and sound source-separating method
CN107316651B (zh) 基于麦克风的音频处理方法和装置
EP3791390B1 (en) Voice identification enrollment
KR101610151B1 (ko) 개인음향모델을 이용한 음성 인식장치 및 방법
JP2022532313A (ja) 分散システムにおいてユーザの好みに最適化するためのカスタマイズされた出力
EP3707716A1 (en) Multi-channel speech separation
CN108630202A (zh) 语音识别装置、语音识别方法以及语音识别程序
CN114097027A (zh) 讲话者归属的记录稿生成
CN104036786A (zh) 一种语音降噪的方法及装置
US11790900B2 (en) System and method for audio-visual multi-speaker speech separation with location-based selection
KR101616112B1 (ko) 음성 특징 벡터를 이용한 화자 분리 시스템 및 방법
JP2010054728A (ja) 音源抽出装置
JP2010112995A (ja) 通話音声処理装置、通話音声処理方法およびプログラム
CN109997186B (zh) 一种用于分类声环境的设备和方法
Nandwana et al. Analysis of Critical Metadata Factors for the Calibration of Speaker Recognition Systems.
CN111199751B (zh) 一种麦克风的屏蔽方法、装置和电子设备
US11443760B2 (en) Active sound control
Borsos et al. Micaugment: One-shot microphone style transfer
JP2002034092A (ja) 収音装置
CN114762039A (zh) 一种会议数据处理方法及相关设备
US11875800B2 (en) Talker prediction method, talker prediction device, and communication system
Xiao et al. Overlapped speech detection using long-term spectro-temporal similarity in stereo recording
Fabien et al. Open-Set Speaker Identification pipeline in live criminal investigations
Schmalenstroeer et al. Online speaker change detection by combining BIC with microphone array beamforming.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: A District No. 9018 Han innovation building in Nanshan District high tech Zone in Shenzhen city of Guangdong Province, North Central Avenue, 518000 floor 10

Applicant after: Nubian Technologies Ltd.

Address before: A District No. 9018 Han innovation building in Nanshan District high tech Zone in Shenzhen city of Guangdong Province, North Central Avenue, 518000 floor 10

Applicant before: Shenzhen ZTE Mobile Tech Co., Ltd.

COR Change of bibliographic data
C14 Grant of patent or utility model
GR01 Patent grant