CN105872366B - 一种基于fastica算法的盲源分离技术控制聚焦系统 - Google Patents
一种基于fastica算法的盲源分离技术控制聚焦系统 Download PDFInfo
- Publication number
- CN105872366B CN105872366B CN201610190411.0A CN201610190411A CN105872366B CN 105872366 B CN105872366 B CN 105872366B CN 201610190411 A CN201610190411 A CN 201610190411A CN 105872366 B CN105872366 B CN 105872366B
- Authority
- CN
- China
- Prior art keywords
- module
- signal
- blind source
- gcc
- phat
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000005516 engineering process Methods 0.000 title claims abstract description 18
- 238000004458 analytical method Methods 0.000 claims abstract description 12
- 238000005070 sampling Methods 0.000 claims abstract description 10
- 230000001360 synchronised effect Effects 0.000 claims abstract description 9
- 230000001934 delay Effects 0.000 claims abstract description 6
- 238000000034 method Methods 0.000 claims description 9
- 238000005457 optimization Methods 0.000 claims description 6
- 230000005236 sound signal Effects 0.000 claims description 4
- 238000001228 spectrum Methods 0.000 claims description 4
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 238000003384 imaging method Methods 0.000 abstract 1
- 230000003321 amplification Effects 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 3
- 230000010354 integration Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/60—Control of cameras or camera modules
- H04N23/67—Focus control based on electronic image sensor signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Circuit For Audible Band Transducer (AREA)
- Studio Devices (AREA)
Abstract
一种基于FASTICA算法的盲源分离技术控制聚焦系统,包括盲源分离模块、GCC‑PHAT时延估计模块、几何定位模块和相机模块,各模块依次相连;盲源分离模块包括放大电路、数据同步采集电路、信号处理模块;GCC‑PHAT时延估计模块包括多通道音频输入电路和数字信号处理器;几何定位模块包括多语音通道、数字信号处理器、控制逻辑CPLD;相机模块包括图像信息分析与聚焦权重调整模块、数码相机模块。本发明根据在拍摄时测量出的拍摄距离,调整镜头内部部件和感光组件的距离使拍摄物能在感光组件上清晰成像,即使在弱光、低反差条件下都能调整出最佳聚焦点实现聚焦。本发明将盲源分离技术与相机结合,使相机操作简单、定位精准、智能、聚焦时间短。
Description
技术领域
本发明涉及信号处理领域和光机一体化领域,具体涉及盲源分离技术和自动对焦技术。
背景技术
自动对焦技术是从1963年Canon公司在科隆博览会展出的一架自动聚焦照相机的样机开始逐步发展的。它是利用基础的物体光反射原理,将反射的光传播到传感器CCD,通过智能芯片处理器,带动电动对焦装置进行对焦。它可分为主动式和被动式。目前大多数数码相机采用被动式的自动对焦方式,即直接接收分析拍摄物的反射光,利用相位差原理进行对焦。其不需要发射装置,减少耗能,节约空间利于小型化。但是在弱光条件、低反差等条件下,聚焦能力差。
发明内容
为了提供更佳的拍照聚焦,给群体自拍提供方便,同时避免光多次折射等造成的无法正常聚焦而导致的拍照不清晰等问题,本发明提供了一种基于FASTICA(快速独立成分分析)算法的盲源分离技术控制聚焦系统。
本发明的技术解决方案如下:
一种基于FASTICA算法的盲源分离技术控制聚焦系统,包括盲源分离模块、相位变换加权广义互相关(GCC-PHAT)时延估计模块、几何定位模块和相机模块,各模块依次相连。其中盲源分离模块包括声音信号的获取、数据采集、信号处理三部分;GCC-PHAT时延估计模块包括多通道音频输入和数字信号处理器两部分;几何定位模块定位出各源信号位置也是在数字信号处理器上实现的;相机模块包括图像信息分析与聚焦权重调整模块、数码相机模块。
所述的盲源分离模块包括放大电路、数据同步采集电路、信号处理模块,各模块依次相连。首先放大电路将麦克风获取的混合声音信号进行两级放大,然后数据同步采集电路中的数据采集芯片AD73360进行64KHz同步采样,最后信号处理模块将采集的信号进行前端修正、相关性分析、声源分离处理得到各分离声源。
盲源分离模块中的信号处理模块的算法是基于最大熵原理,在FASTICA模型中,经过预处理,最大化负熵的优化过程转化成EG(wTx)|的优化问题。并通过阻尼牛顿法迭代法将其转化成无约束极值问题,保证了优化算法收敛到极值点,最终经过变化和归一化处理,得到迭代学习算法。
所述的GCC-PHAT时延估计模块包括多通道音频输入电路和数字信号处理器。多通道音频输入电路是实现多路立体声音频的输入,可进行编程增益调节,同时将盲源分离模块分离出的各个声源信号输入到数字信号处理器进行GCC-PHAT算法操作得到时延值。数字信号处理器在控制核心的调度下适时启动GCC-PHAT算法运算,并向控制核心返回时延值。
GCC-PHAT算法进行时延估计。不同麦克风接收信号,经过盲源分离后的源信号,可以由下列GCC函数的峰值决定:
Wmn表示权重函数,对于不同的噪声和混响情况,表示不同的权重函数。Sm(w)和Sn(w)表示不同麦克风信号接收的信号进行盲源分离后的同一声源的频谱,假设信号与噪声是独立的,则关于信号xm(t)和xn(t)互功率谱函数由下式确定:
利用PHAT加权函数Wmn(w)=1/|Gmn(w)|来改进原算法。并提出一个由真实环境信噪比决定的新参数ρ提高小信噪比和大混响情况下的时延精度。此时权重函数被替代为Wmn(w)=1/(Gmn(w)ρ+|γm 2 n(w)|,0≤ρ≤1。
所述的几何定位模块包括多语音通道、数字信号处理器、控制逻辑CPLD。多语音通道分别连接数字信号处理器、控制逻辑CPLD。数字信号处理器根据各声源的具体位置计算出初步聚焦点。控制逻辑CPLD根据相关指示信号通过控制总线协调控制多语音通道和数字处理器完成几何定位。在GCC-PHAT时延的基础上根据麦克风几何位置确定各声源的具体位置。
所述的相机模块包括图像信息分析与聚焦权重调整模块、数码相机模块。图像信息分析与聚焦权重调整模块根据各声源的定位点计算出聚焦点,聚焦得到CCD输出图片信息并进行分析,根据图像信息分析处理结果进行合理的聚焦权重调整。数码相机模块是智能芯片处理器根据图像信息分析处理结果控制聚焦电机和变焦电机移动镜头内部部件进行合理聚焦权重调整,直到聚焦最精准,CCD输出图片信息最佳。
本发明是利用盲源分离技术分离出各源信号,再利用GCC-PHAT进行时延估计,定位出各源信号位置,经过内部智能芯片处理得到最佳聚焦点,带动电动对焦装置进行聚焦。即使在弱光、低反差条件下都能调整出最佳聚焦点。其中盲源分离技术是一种在不知源信号和传输信道参数的情况下,根据输入源信号的统计特性,仅由观测信号恢复出各个源信号的方法。
本发明具有的优点:(1)本发明可以实现多声源语音定位,不需要人操作。(2)本发明基于已有的成熟语音定位技术,不需要安装发射装置,减少耗能。(3)本发明解决了弱光条件、低反差等条件下聚焦困难等问题。(4)本发明避免光多次折射等造成的无法正常聚焦而导致的拍照不清晰等问题。(5)本发明中GCC-PHAT算法考虑了不同的噪声和混响情况,提高定位的精确度。(6)本发明提出一个由真实环境信噪比决定的新参数ρ,提高小信噪比和大混响情况下的时延精度。(7)本发明结合信号处理领域和光机一体化领域,将盲源分离技术融合到相机拍照过程,使拍摄更加简便。
附图说明
图1为本发明所设计的基于FASTICA算法的盲源分离技术控制聚焦系统的总体框图。
图2为本发明盲源分离模块原理示意图。
图3为本发明盲源分离模块中的放大电路原理示意图。
图4为本发明盲源分离的设计图。
图5为本发明定位模块框图。
图6所示为本发明最基础的聚焦原理图。
具体实施方式
下面结合附图和具体功能对本发明作进一步阐述。
如图1所示为本发明中基于FASTICA算法的盲源分离技术控制聚焦系统的总体框图。包括盲源分离模块、GCC-PHAT时延估计模块、几何定位模块和相机模块,各模块依次相连。其中盲源分离模块包括放大电路、数据同步采集电路、信号处理模块三部分;GCC-PHAT时延估计模块包括多通道音频输入和数字信号处理器两部分;几何定位模块包括多语音通道、数字信号处理器、控制逻辑CPLD三部分。;相机模块的主要部分是目前常用数码相机结构与功能模块,主要添加功能是图像信息分析与聚焦权重调整部分。
如图2所示为本发明中盲源分离的设计图。该设计图包括放大电路、数据同步采集电路、信号处理模块部分。麦克风阵列获取环境声音变成电信号,放大电路对该信号进行放大处理,便于数据处理,其中放大电路采用两级放大,第一级放大产生固定增益,第二级放大电路产生可调增益,数据采集是用数据采集芯片AD73360对放大的音频信号进行64KHz同步采样,将模拟音频信号转化为数字音频信号,最后将采集的信号连接到信号处理模块进行处理;信号处理模块的功能主要是功能前端修正、相关性分析、声源分离,它将采集得到的数字音频信号在数字信号处理器上进行基于FASTICA算法的盲源分离运算,得到各个声源分离信号。
如图3所示为本发明中放大电路设计原理图。由于麦克风的输出电压在零到几十毫伏之间,信号非常微弱,无法满足后期的工作要求,因此有必要对麦克风阵列采集到的信号进行放大,在满足放大的基础上,还需要保证放大电路能在麦克风的频率范围内正常工作(麦克风的频率范围是50Hz~20kHz)。另外,所选择的运算放大器要具有比较高的性噪比,满足系统对精度的要求。该放大电路可以正常工作,且能够满足本系统的需求。
放大电路采用两级放大,由U1A、U2A两个放大器构成。U1A为第一级放大,产生固定增益;U2A为第二级放大电路,产生可调增益,将第一级放大电路的输出电压调节到适合的范围。R7用来调整放大倍数,R8用来调整输出信号的偏置电压。
如图4所示为本发明中盲源分离原理示意图。其中M维观测信号矢量表示为x(t)=[x1(t),x2(t),…xM(t)]T,N维信源矢量表示为s(t)=[s1(t),s2(t),…sN(t)]T,M维噪声矢量表示为n(t)=[n1(t),n2(t),…nM(t)]T。
盲信号分离的目标就是找到合适的分离系统W,使得输出所得分离信号y(t)=[y1(t),y2(t),…yN(t)]T尽可能的逼近源信号s(t)=[s1(t),s2(t),…sN(t)]T。
如图5所示为本发明定位模块框图,GCC-PHAT模块包括多语音通道、数字信号处理器、控制逻辑CPLD三部分。多通道音频输入具有输出放大、输入两种工作模式、低功耗和ADC、DAC高信噪比等特点。数字信号处理器具有多个可软件编程器件,支持多通道音频处理的McBSP接口连接。多通道音频输入是实现多路立体声音频的输入,它通过McBSP接口将信号输入到数字信号处理器,CPLD辅助数字信号处理器各模块进行逻辑控制,完成GCC-PHAT算法操作得到时延值。几何定位模块根据GCC-PHAT时延估计模块算出的时延值在数字信号处理器上运算出各声源的定位点。
如图6所示为本发明中最基础的聚焦原理图。无论相机内部结构多么复杂,调焦过程的实现都可以看成是凸透镜聚焦的简单光学原理。一幅清晰的图片的组成都可以看成是不同的点经过光学聚焦后组成的焦平面。
Claims (3)
1.一种基于FASTICA算法的盲源分离技术控制聚焦系统,其特征是包括盲源分离模块、GCC-PHAT时延估计模块、几何定位模块和相机模块,各模块依次相连;
所述的盲源分离模块包括放大电路、数据同步采集电路、信号处理模块,各模块依次相连;放大电路将从麦克风获取的混合声音信号进行放大,然后数据同步采集电路中的数据采集芯片进行数据同步采集,信号处理模块将采集的信号进行前端修正、相关性分析、声源分离处理得到各分离声源信号;
所述的GCC-PHAT时延估计模块包括多通道音频输入电路和数字信号处理器;多通道音频输入电路实现多路立体声音频的输入,进行编程增益调节,同时将盲源分离模块分离出的各个声源信号输入到数字信号处理器进行GCC-PHAT算法操作得到时延值;数字信号处理器在控制核心的调度下适时启动GCC-PHAT算法运算,并向控制核心返回时延值;
所述的几何定位模块包括多语音通道、数字信号处理器、控制逻辑CPLD;多语音通道分别连接数字信号处理器、控制逻辑CPLD;数字信号处理器根据各声源的具体位置计算出初步聚焦点,控制逻辑CPLD根据相关指示信号通过控制总线协调控制多语音通道和数字处理器完成几何定位,在GCC-PHAT时延的基础上根据麦克风几何位置确定各声源的具体位置;
所述的相机模块包括图像信息分析与聚焦权重调整模块、数码相机模块;图像信息分析与聚焦权重调整模块根据各声源的定位点计算出聚焦点,聚焦得到CCD输出图片信息并进行分析,根据图像信息分析处理结果进行合理的聚焦权重调整;数码相机模块是智能芯片处理器根据图像信息分析处理结果控制聚焦电机和变焦电机移动镜头内部部件进行合理聚焦权重调整,直到聚焦最精准,CCD输出图片信息最佳。
2.根据权利要求1所述的盲源分离技术控制聚焦系统,其特征是所述的盲源分离模块中的信号处理模块的算法是基于最大熵原理,在FASTICA模型中,经过预处理,最大化负熵的优化过程转化成E|G(wTx)|的优化问题,并通过阻尼牛顿法迭代法将其转化成无约束极值问题,最终经过变化和归一化处理,得到迭代学习算法。
3.根据权利要求1所述的盲源分离技术控制聚焦系统,其特征是所述的GCC-PHAT算法时延估计,即:不同麦克风接收信号,经过盲源分离后的源信号,由下列GCC函数的峰值决定:
Wmn表示权重函数,对于不同的噪声和混响情况,表示不同的权重函数;Sm(w)和Sn(w)表示不同麦克风信号接收的信号进行盲源分离后的同一声源的频谱,假设信号与噪声是独立的,则关于信号xm(t)和xn(t)互功率谱函数由下式确定:
利用PHAT加权函数Wmn(w)=1/|Gmn(w)|来改进原算法;并提出一个由真实环境信噪比决定的新参数ρ提高小信噪比和大混响情况下的时延精度;此时权重函数被替代为
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610190411.0A CN105872366B (zh) | 2016-03-30 | 2016-03-30 | 一种基于fastica算法的盲源分离技术控制聚焦系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610190411.0A CN105872366B (zh) | 2016-03-30 | 2016-03-30 | 一种基于fastica算法的盲源分离技术控制聚焦系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105872366A CN105872366A (zh) | 2016-08-17 |
CN105872366B true CN105872366B (zh) | 2018-08-24 |
Family
ID=56627423
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610190411.0A Active CN105872366B (zh) | 2016-03-30 | 2016-03-30 | 一种基于fastica算法的盲源分离技术控制聚焦系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105872366B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107644650B (zh) * | 2017-09-29 | 2020-06-05 | 山东大学 | 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统 |
CN107885818A (zh) * | 2017-11-06 | 2018-04-06 | 深圳市沃特沃德股份有限公司 | 机器人及其服务方法和装置 |
CN111597051A (zh) * | 2020-05-21 | 2020-08-28 | 天水师范学院 | 一种多通道数字信号处理的方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007214753A (ja) * | 2006-02-08 | 2007-08-23 | Matsushita Electric Ind Co Ltd | 制御方法及び制御装置 |
CN101068308A (zh) * | 2007-05-10 | 2007-11-07 | 华为技术有限公司 | 一种控制图像采集装置进行目标定位的系统及方法 |
CN102413276A (zh) * | 2010-09-21 | 2012-04-11 | 天津三星光电子有限公司 | 具有声控聚焦功能的数码摄像机 |
CN103051838A (zh) * | 2012-12-25 | 2013-04-17 | 广东欧珀移动通信有限公司 | 一种摄像控制方法及装置 |
CN103957359A (zh) * | 2014-05-15 | 2014-07-30 | 深圳市中兴移动通信有限公司 | 摄像装置及其对焦方法 |
-
2016
- 2016-03-30 CN CN201610190411.0A patent/CN105872366B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007214753A (ja) * | 2006-02-08 | 2007-08-23 | Matsushita Electric Ind Co Ltd | 制御方法及び制御装置 |
CN101068308A (zh) * | 2007-05-10 | 2007-11-07 | 华为技术有限公司 | 一种控制图像采集装置进行目标定位的系统及方法 |
CN102413276A (zh) * | 2010-09-21 | 2012-04-11 | 天津三星光电子有限公司 | 具有声控聚焦功能的数码摄像机 |
CN103051838A (zh) * | 2012-12-25 | 2013-04-17 | 广东欧珀移动通信有限公司 | 一种摄像控制方法及装置 |
CN103957359A (zh) * | 2014-05-15 | 2014-07-30 | 深圳市中兴移动通信有限公司 | 摄像装置及其对焦方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105872366A (zh) | 2016-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105872366B (zh) | 一种基于fastica算法的盲源分离技术控制聚焦系统 | |
CN103973957B (zh) | 双目3d相机自动调焦系统及方法 | |
CN102378097B (zh) | 麦克风控制系统及方法 | |
EP3852106A1 (en) | Sound processing method, apparatus and device | |
TWI295027B (en) | Method for adjusting operating frequency of an optical input device according to reference frame changes | |
US20110085061A1 (en) | Image photographing apparatus and method of controlling the same | |
CN105554370B (zh) | 图像处理设备和图像处理方法 | |
US10534164B2 (en) | Digital microscope and focusing method thereof | |
CN106896622A (zh) | 基于多距离自动对焦的校正方法 | |
WO2007086378A1 (ja) | 合焦検出装置 | |
JP2008109344A (ja) | 特定被写体像の検出方法およびデジタルカメラ | |
CN108200362A (zh) | 基于空间对比度的仿生视网膜摄像电路及子电路 | |
US20130022261A1 (en) | Systems and methods for evaluating images | |
CN114697812A (zh) | 声音采集方法、电子设备及系统 | |
JP2011041096A (ja) | 携帯端末、並びにこれに用いる集音制御方法及びプログラム | |
CN102547131A (zh) | 成像设备及其控制方法 | |
JP2012217004A (ja) | 表示装置および表示プログラム | |
US8208042B2 (en) | Method of controlling digital photographing apparatus, digital photographing apparatus, and medium having recorded thereon a program for executing the method | |
KR101797040B1 (ko) | 디지털 촬영 장치 및 이의 제어 방법 | |
CN104284080A (zh) | 影像撷取装置以及景深信息的获取方法 | |
JP2019161553A (ja) | 撮像システム、撮像装置、及びそれらの制御方法、プログラム、記憶媒体 | |
JP5428821B2 (ja) | 解析装置、撮像装置、サーバ装置、解析方法、プログラム及び解析システム | |
US11665391B2 (en) | Signal processing device and signal processing system | |
CN116405774A (zh) | 视频处理方法与电子设备 | |
JP2014122978A (ja) | 撮像装置、音声認識方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20200915 Address after: 515636 No. 1, Lane 2, Dongtougongqian District, Stork Chao Sancun, Longhu Town, Chaoan District, Chaozhou City, Guangdong Province Patentee after: Li Yanling Address before: 999 No. 330031 Jiangxi province Nanchang Honggutan University Avenue Patentee before: Nanchang University |