CN106231047A - 一种基于智能终端的音频采集方法、系统及智能终端 - Google Patents
一种基于智能终端的音频采集方法、系统及智能终端 Download PDFInfo
- Publication number
- CN106231047A CN106231047A CN201610636259.4A CN201610636259A CN106231047A CN 106231047 A CN106231047 A CN 106231047A CN 201610636259 A CN201610636259 A CN 201610636259A CN 106231047 A CN106231047 A CN 106231047A
- Authority
- CN
- China
- Prior art keywords
- user
- intelligent terminal
- contrast
- audio
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000004807 localization Effects 0.000 claims abstract description 28
- 230000006870 function Effects 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 11
- 230000008901 benefit Effects 0.000 abstract description 6
- 230000005540 biological transmission Effects 0.000 abstract description 6
- 230000008569 process Effects 0.000 description 7
- 230000008878 coupling Effects 0.000 description 5
- 238000010168 coupling process Methods 0.000 description 5
- 238000005859 coupling reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/02—Constructional features of telephone sets
- H04M1/19—Arrangements of transmitters, receivers, or complete sets to prevent eavesdropping, to attenuate local noise or to prevent undesired transmission; Mouthpieces or receivers specially adapted therefor
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Theoretical Computer Science (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
Abstract
本发明所提供的一种基于智能终端的音频采集方法、系统及智能终端,所述方法具体包括:若检测到智能终端开启用户音频采集功能,则获取用户设置的对比输入条件;根据获取的所述对比输入条件采集相应的用户信息,并将采集的所述用户信息与预存储的用户信息进行匹配;若匹配成功,则根据预设的传感器阵列声源定位算法定位当前声源用户,并采集相应声源用户的音频信息进行存储。本发明通过将人脸识别、声纹识别以及传声器阵列声源定位技术相结合进行用户的通话语音采集,使得采集语音信息的过程中的不希望听到的声源忽略掉,只传递和采集用户需要的声源,从而提高了用户语音采集效率和采集数据的准确性,给用户带来了极大的便利。
Description
技术领域
本发明涉及智能终端技术领域,尤其涉及一种基于智能终端的音频采集方法、系统及智能终端。
背景技术
现有技术中当用户在户外嘈杂或者其他环境下通话,传递声音等内容时,不免会夹杂一些不必要的外界杂音信息;且根据电子设备声源位置,可能也会产生嘈杂不清的杂音,容易导致语音采集效率低、采集数据准确性也大大降低,给用户的通话造成很大的不便。
由此可知,现有技术还有待于改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于智能终端的音频采集方法、系统及智能终端,旨在通过将人脸识别、声纹识别以及传声器阵列声源定位技术相结合进行用户的通话语音采集,使得采集语音信息的过程中的不希望听到的声源忽略掉,只传递和采集用户需要的声源,从而提高用户语音采集效率和采集数据的准确性,给用户带来便利。
本发明解决技术问题所采用的技术方案如下:
一种基于智能终端的音频采集方法,其中,包括步骤:
S1、若检测到智能终端开启用户音频采集功能,则获取用户设置的对比输入条件;
S2、根据获取的所述对比输入条件采集相应的用户信息,并将采集的所述用户信息与预存储的用户信息进行匹配;
S3、若匹配成功,则根据预设的传感器阵列声源定位算法定位当前声源用户,并采集相应声源用户的音频信息进行存储。
所述的基于智能终端的音频采集方法,其中,所述对比输入条件包括:进行人脸信息对比和/或进行声纹信息对比。
所述的基于智能终端的音频采集方法,其中,所述步骤S1之前还包括步骤:
S0、预先在所述智能终端中设置并存储用户的人脸信息和/或与所述人脸信息相对应的声纹信息。
所述的基于智能终端的音频采集方法,其中,所述步骤S2具体包括步骤:
S21、若检测到获取的所述对比输入条件为进行人脸信息对比,则采集当前用户的人脸信息,并与所述智能终端中预存储的人脸信息进行匹配;
S22、若检测到获取的所述对比输入条件为进行声纹信息对比,则采集当前用户的语音信息,并与所述智能终端中预存储的声纹信息进行匹配;
S23、若检测到获取的所述对比输入条件为进行人脸信息对比和/或声纹信息对比,则采集当前用户的人脸信息和语音信息,并与所述智能终端中预存储的人脸信息和相对应的声纹信息进行一一匹配。
所述的基于智能终端的音频采集方法,其中,所述步骤S3具体包括步骤:
S31、若匹配成功,则启动所述智能终端预设的传感器阵列声源定位算法;
S32、根据所述传感器阵列声源定位算法确定当前声源用户;
S33、采集当前声源用户的音频信息,并进行存储。
一种基于智能终端的音频采集系统,其中,包括:
预设值存储模块,用于预先在所述智能终端中设置并存储用户的人脸信息和/或与所述人脸信息相对应的声纹信息;
检测启动模块,用于若检测到智能终端开启用户音频采集功能,则获取用户设置的对比输入条件;
用户信息匹配模块,用于根据获取的所述对比输入条件采集相应的用户信息,并将采集的所述用户信息与预存储的用户信息进行匹配;
用户音频信息采集模块,用于若匹配成功,则根据预设的传感器阵列声源定位算法定位当前声源用户,并采集相应声源用户的音频信息进行存储。
所述的基于智能终端的音频采集系统,其中,所述对比输入条件包括:进行人脸信息对比和/或进行声纹信息对比。
所述的基于智能终端的音频采集系统,其中,所述用户信息匹配模块具体包括:
第一信息匹配单元,用于若检测到获取的所述对比输入条件为进行人脸信息对比,则采集当前用户的人脸信息,并与所述智能终端中预存储的人脸信息进行匹配;
第二信息匹配单元,用于若检测到获取的所述对比输入条件为进行声纹信息对比,则采集当前用户的语音信息,并与所述智能终端中预存储的声纹信息进行匹配;
第三信息匹配单元,用于若检测到获取的所述对比输入条件为进行人脸信息对比和/或声纹信息对比,则采集当前用户的人脸信息和语音信息,并与所述智能终端中预存储的人脸信息和相对应的声纹信息进行一一匹配。
所述的基于智能终端的音频采集系统,其中,所述用户音频信息采集模块具体包括:
声源定位算法启动单元,用于若匹配成功,则启动所述智能终端预设的传感器阵列声源定位算法;
声源用户确定单元,用于根据所述传感器阵列声源定位算法确定当前声源用户;
音频信息采集存储单元,用于采集当前声源用户的音频信息,并进行存储。
一种智能终端,其中,包括以上任一项所述的基于智能终端的音频采集系统。
本发明所提供的一种基于智能终端的音频采集方法、系统及智能终端,所述方法具体包括:若检测到智能终端开启用户音频采集功能,则获取用户设置的对比输入条件;根据获取的所述对比输入条件采集相应的用户信息,并将采集的所述用户信息与预存储的用户信息进行匹配;若匹配成功,则根据预设的传感器阵列声源定位算法定位当前声源用户,并采集相应声源用户的音频信息进行存储。本发明通过将人脸识别、声纹识别以及传声器阵列声源定位技术相结合进行用户的通话语音采集,使得采集语音信息的过程中的不希望听到的声源忽略掉,只传递和采集用户需要的声源,从而提高了用户语音采集效率和采集数据的准确性,给用户带来了极大的便利。
附图说明
图1是本发明基于智能终端的音频采集方法的较佳实施例的流程图。
图2是本发明基于智能终端的音频采集方法用户信息存储示意图。
图3是本发明基于智能终端的音频采集方法的应用实施例流程图。
图4是本发明基于智能终端的音频采集系统的较佳实施例的功能模块图。
具体实施方式
本发明公开了一种基于智能终端的音频采集方法、系统及智能终端,为使本发明的目的、技术方案及优点更加清楚、明确,以下参照附图并举实施例对本发明进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参见图1,图1是本发明基于智能终端的音频采集方法的较佳实施例的流程图。图1所示的基于智能终端的音频采集方法,包括:
步骤S101、若检测到智能终端开启用户音频采集功能,则获取用户设置的对比输入条件。
人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别。声纹识别也是一种生物识别方式,通过采集人的语音信息进行身份识别。为了提高用户语音采集效率和采集数据的准确性,本发明实施例结合人脸识别技术以及声纹识别技术,因此,在实施之前需要预先在所述智能终端中设置并存储用户的人脸信息和/或与所述人脸信息相对应的声纹信息。
本发明实施例中的智能终端在第一次开启或者使用该音频采集功能时,会提示用户输入人脸信息和声纹信息。如图2所示的用户信息存储示意图。图2中所示的各用户的用户名和相应的人脸信息和声纹信息都可以增加、编辑、和修改。但是在进行编辑、修改、增加之前,设备需要提供生物的和非生物(如密码)的验证方式以验证当前设备持有者是否为设备的合法拥有者。
步骤S102、根据获取的所述对比输入条件采集相应的用户信息,并将采集的所述用户信息与预存储的用户信息进行匹配。
本发明实施例中,所述步骤S102具体包括:
S21、若检测到获取的所述对比输入条件为进行人脸信息对比,则采集当前用户的人脸信息,并与所述智能终端中预存储的人脸信息进行匹配;
S22、若检测到获取的所述对比输入条件为进行声纹信息对比,则采集当前用户的语音信息,并与所述智能终端中预存储的声纹信息进行匹配;
S23、若检测到获取的所述对比输入条件为进行人脸信息对比和/或声纹信息对比,则采集当前用户的人脸信息和语音信息,并与所述智能终端中预存储的人脸信息和相对应的声纹信息进行一一匹配。
本发明实施例中,所述对比输入条件包括:进行人脸信息对比、以及进行声纹信息对比。即,该智能终端将收集到的人脸信息和声纹信息作为对比的输入条件。其中,所述人脸信息和声音信息可以是与、或关系。本发明实施例提供以下几种方式供选择,
(1)仅声纹识别:当选择声纹识别时,设备只收集当前设备所处环境中的语音信息与预设的信息数据库中的声纹进行一一对比,然后收集通过声纹对比匹配到的用户即进行收集,其余用户不进行收集,且不再需要对比人脸信息。
(2)仅人脸信息识别:当选择人脸信息识别时,设备只收集当前的设备周围的人脸信息与信息数据库中的人脸信息进行一一对比,然后收集人脸信息识别到的用户即进行收集,其余用户不进行收集,且不再需要对比声纹信息。
(3)声纹识别+人脸信息识别:选择两者都对比时,则需要采集声纹信息和人脸信息都与信息数据库中的信息对比,当两者都匹配到时候,才收集语音信息。
(4)声纹识别或人脸信息识别:选择这种的情况下,需要采集声纹信息和人脸信息都与信息数据库中的信息对比,但只要其中之一匹配到后,即进行语音信息收集。
步骤S103、若匹配成功,则根据预设的传感器阵列声源定位算法定位当前声源用户,并采集相应声源用户的音频信息进行存储。
进一步地,所述步骤S103具体包括步骤:
S31、若匹配成功,则启动所述智能终端预设的传感器阵列声源定位算法;
S32、根据所述传感器阵列声源定位算法确定当前声源用户;
S33、采集当前声源用户的音频信息,并进行存储。
即,本发明实施例将实时采集到的人脸信息、声纹信息进行匹配处理。如果对比到与标准库匹配的对象,则调用内置的传声器阵列声源定位算法进行方向调整,收集相应方向的用户声音信息。
传声器阵列声源定位技术是指若干个传声器按照一定的几何结构排列组成传声器阵列,通过阵列信号处理的方法对该阵列接收到的声源信号进行处理,根据所得数据确定出声源的几何位置。该传声器阵列是指按一定距离排列放置的一组麦克风,通过声波抵达阵列中每个麦克风之间的微小时差的相互作用,麦克风阵列可以得到比单个的麦克风更好地指向性。通过对所有麦克风信号的综合处理,麦克风阵列可以组合成为所要求的强指向性麦克风,形成被称为“波束”的指向特性。麦克风阵列的波束可以经由特殊电路或程序算法软件控制,使其指向声源方向而加强音频采集效果。传声器阵列声源定位算法处理后的指向性波束形成技术能精确的形成一个锥状窄波束,只接受说话人的声音同时抑制环境中的噪音与干扰。
具体地,可以通过以下两种方法获得麦克风阵列单元之间相对位置的信息:
(1)把一对麦克风同步采集到的信号进行互相关,寻找互相关信号的最大值,得到两信号之间的延时τ,再乘以声波传播速度C0 得到相对位置间距d = C0τ;
(2)测量一对麦克风同步采集信号相位差Δφ,根据频率f 和声传播速度C0 得到这一对麦克风的位置间隔 d = C0Δφ/ (2πf ) 。
本发明实施例通过以上方式精确地采集相应对象的声音,并将采集的对象声音进行存储、输出。
以下将通过具体的应用实施例对本发明做进一步说明。图3是本发明基于智能终端的音频采集方法的应用实施例流程图。如图3所示,包括:
S201、开始流程;
S202、查询是否开启只采集需要对象的音源功能,如果开启进入步骤S203,如果未开启结束流程则进入步骤S212;
S203、获取用户设置的对比输入条件;
S204、根据对比条件获取相应的信息进行对比;所述对比输入条件包括:进行人脸信息对比、以及进行声纹信息对比。具体地,包括:
(1)若检测到获取的所述对比输入条件为进行人脸信息对比,则采集当前用户的人脸信息,并与所述智能终端中预存储的人脸信息进行匹配;
(2)若检测到获取的所述对比输入条件为进行声纹信息对比,则采集当前用户的语音信息,并与所述智能终端中预存储的声纹信息进行匹配;
(3)若检测到获取的所述对比输入条件为同时进行人脸信息对比和声纹信息对比,则采集当前用户的人脸信息和语音信息,并与所述智能终端中预存储的人脸信息和相对应的声纹信息进行一一匹配;
(4)若检测到获取的所述对比输入条件为进行人脸信息对比或者声纹信息对比,则采集当前用户的人脸信息和语音信息,并与所述智能终端中预存储的人脸信息和声纹信息进行一一匹配。
S205、判断是否匹配到相应的对象,如果匹配到相应对象,进入步骤S206,如果未匹配到相应的对象进入步骤S208;
S206、调用传声器阵列声源定位算法获取匹配对象的声源信息;
S207、采集此声源用户的语音信息,并进行如储存,发送等;
S208、提示用户未匹配到相应的声源对象;
S209、提供给用户是否需要关闭只采集对象音源的功能,如果用户选择关闭,则进入步骤S212结束流程;如果用户不选择关闭,选择继续收集,则进入步骤S210;
S210、提示用户是否新增匹配对象,如果用户不新增匹配对象,则进入步骤S212结束流程;如果用户新增匹配对象,则进入步骤S206;
S211、采集、存储用户新增匹配对象的相应信息并更新用户信息库,返回步骤S206;
S212、结束流程。
由上可见,本发明通过将人脸识别、声纹识别以及传声器阵列声源定位技术相结合进行用户的通话语音采集,实现了用户在录制视频的时候,只会捕捉到想要录入对象的声源信息,或者需要发送语音信息时,也只会发送需要发送对象的声源信息,从而摒弃掉了一些非需要采集对象的杂音,提高了音源的准确率,也提高了用户语音采集效率和采集数据的准确性,给用户带来了极大的便利。
基于上述实施例,本发明还提供一种基于智能终端的音频采集系统,如图4所示,包括:
预设值存储模块100,用于预先在所述智能终端中设置并存储用户的人脸信息和/或与所述人脸信息相对应的声纹信息;具体如上所述。
检测启动模块200,用于若检测到智能终端开启用户音频采集功能,则获取用户设置的对比输入条件;具体如上所述。
用户信息匹配模块300,用于根据获取的所述对比输入条件采集相应的用户信息,并将采集的所述用户信息与预存储的用户信息进行匹配;具体如上所述。
用户音频信息采集模块400,用于若匹配成功,则根据预设的传感器阵列声源定位算法定位当前声源用户,并采集相应声源用户的音频信息进行存储;具体如上所述。
进一步地,所述对比输入条件包括:进行人脸信息对比和/或进行声纹信息对比。
进一步地,所述用户信息匹配模块300具体包括:
第一信息匹配单元,用于若检测到获取的所述对比输入条件为进行人脸信息对比,则采集当前用户的人脸信息,并与所述智能终端中预存储的人脸信息进行匹配;具体如上所述。
第二信息匹配单元,用于若检测到获取的所述对比输入条件为进行声纹信息对比,则采集当前用户的语音信息,并与所述智能终端中预存储的声纹信息进行匹配;具体如上所述。
第三信息匹配单元,用于若检测到获取的所述对比输入条件为进行人脸信息对比和/或声纹信息对比,则采集当前用户的人脸信息和语音信息,并与所述智能终端中预存储的人脸信息和相对应的声纹信息进行一一匹配;具体如上所述。
进一步地,所述用户音频信息采集模块400具体包括:
声源定位算法启动单元,用于若匹配成功,则启动所述智能终端预设的传感器阵列声源定位算法;具体如上所述。
声源用户确定单元,用于根据所述传感器阵列声源定位算法确定当前声源用户;具体如上所述。
音频信息采集存储单元,用于采集当前声源用户的音频信息,并进行存储;具体如上所述。
进一步地,本发明还提供一种智能终端的实施例,本实施例所述的智能终端包括上述所述的基于智能终端的音频采集系统。
综上所述,本发明所提供的一种基于智能终端的音频采集方法、系统及智能终端,所述方法具体包括:若检测到智能终端开启用户音频采集功能,则获取用户设置的对比输入条件;根据获取的所述对比输入条件采集相应的用户信息,并将采集的所述用户信息与预存储的用户信息进行匹配;若匹配成功,则根据预设的传感器阵列声源定位算法定位当前声源用户,并采集相应声源用户的音频信息进行存储。本发明通过将人脸识别、声纹识别以及传声器阵列声源定位技术相结合进行用户的通话语音采集,使得采集语音信息的过程中的不希望听到的声源忽略掉,只传递和采集用户需要的声源,从而提高了用户语音采集效率和采集数据的准确性,给用户带来了极大的便利。
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应属于本发明所附权利要求的保护范围。
Claims (10)
1.一种基于智能终端的音频采集方法,其特征在于,包括步骤:
S1、若检测到智能终端开启用户音频采集功能,则获取用户设置的对比输入条件;
S2、根据获取的所述对比输入条件采集相应的用户信息,并将采集的所述用户信息与预存储的用户信息进行匹配;
S3、若匹配成功,则根据预设的传感器阵列声源定位算法定位当前声源用户,并采集相应声源用户的音频信息进行存储。
2.根据权利要求1所述的基于智能终端的音频采集方法,其特征在于,所述对比输入条件包括:进行人脸信息对比和/或进行声纹信息对比。
3.根据权利要求2所述的基于智能终端的音频采集方法,其特征在于,所述步骤S1之前还包括步骤:
S0、预先在所述智能终端中设置并存储用户的人脸信息和/或与所述人脸信息相对应的声纹信息。
4.根据权利要求3所述的基于智能终端的音频采集方法,其特征在于,所述步骤S2具体包括步骤:
S21、若检测到获取的所述对比输入条件为进行人脸信息对比,则采集当前用户的人脸信息,并与所述智能终端中预存储的人脸信息进行匹配;
S22、若检测到获取的所述对比输入条件为进行声纹信息对比,则采集当前用户的语音信息,并与所述智能终端中预存储的声纹信息进行匹配;
S23、若检测到获取的所述对比输入条件为进行人脸信息对比和/或声纹信息对比,则采集当前用户的人脸信息和语音信息,并与所述智能终端中预存储的人脸信息和相对应的声纹信息进行一一匹配。
5.根据权利要求4所述的基于智能终端的音频采集方法,其特征在于,所述步骤S3具体包括步骤:
S31、若匹配成功,则启动所述智能终端预设的传感器阵列声源定位算法;
S32、根据所述传感器阵列声源定位算法确定当前声源用户;
S33、采集当前声源用户的音频信息,并进行存储。
6.一种基于智能终端的音频采集系统,其特征在于,包括:
预设值存储模块,用于预先在所述智能终端中设置并存储用户的人脸信息和/或与所述人脸信息相对应的声纹信息;
检测启动模块,用于若检测到智能终端开启用户音频采集功能,则获取用户设置的对比输入条件;
用户信息匹配模块,用于根据获取的所述对比输入条件采集相应的用户信息,并将采集的所述用户信息与预存储的用户信息进行匹配;
用户音频信息采集模块,用于若匹配成功,则根据预设的传感器阵列声源定位算法定位当前声源用户,并采集相应声源用户的音频信息进行存储。
7.根据权利要求6所述基于智能终端的音频采集系统,其特征在于,所述对比输入条件包括:进行人脸信息对比和/或进行声纹信息对比。
8.根据权利要求7所述基于智能终端的音频采集系统,其特征在于,所述用户信息匹配模块具体包括:
第一信息匹配单元,用于若检测到获取的所述对比输入条件为进行人脸信息对比,则采集当前用户的人脸信息,并与所述智能终端中预存储的人脸信息进行匹配;
第二信息匹配单元,用于若检测到获取的所述对比输入条件为进行声纹信息对比,则采集当前用户的语音信息,并与所述智能终端中预存储的声纹信息进行匹配;
第三信息匹配单元,用于若检测到获取的所述对比输入条件为进行人脸信息对比和/或声纹信息对比,则采集当前用户的人脸信息和语音信息,并与所述智能终端中预存储的人脸信息和相对应的声纹信息进行一一匹配。
9.根据权利要求8所述基于智能终端的音频采集系统,其特征在于,所述用户音频信息采集模块具体包括:
声源定位算法启动单元,用于若匹配成功,则启动所述智能终端预设的传感器阵列声源定位算法;
声源用户确定单元,用于根据所述传感器阵列声源定位算法确定当前声源用户;
音频信息采集存储单元,用于采集当前声源用户的音频信息,并进行存储。
10.一种智能终端,其特征在于,包括权利要求6至9中任一项所述的基于智能终端的音频采集系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610636259.4A CN106231047A (zh) | 2016-08-05 | 2016-08-05 | 一种基于智能终端的音频采集方法、系统及智能终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610636259.4A CN106231047A (zh) | 2016-08-05 | 2016-08-05 | 一种基于智能终端的音频采集方法、系统及智能终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106231047A true CN106231047A (zh) | 2016-12-14 |
Family
ID=57547664
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610636259.4A Pending CN106231047A (zh) | 2016-08-05 | 2016-08-05 | 一种基于智能终端的音频采集方法、系统及智能终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106231047A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107682786A (zh) * | 2017-10-31 | 2018-02-09 | 广东小天才科技有限公司 | 一种麦克风设备抗干扰方法及麦克风设备 |
CN108682424A (zh) * | 2018-07-13 | 2018-10-19 | 广州势必可赢网络科技有限公司 | 一种音频采集设备及方法 |
CN109754811A (zh) * | 2018-12-10 | 2019-05-14 | 平安科技(深圳)有限公司 | 基于生物特征的声源追踪方法、装置、设备及存储介质 |
CN109785835A (zh) * | 2019-01-25 | 2019-05-21 | 广州富港万嘉智能科技有限公司 | 一种通过移动终端实现声音录制的方法及装置 |
CN110290468A (zh) * | 2019-07-04 | 2019-09-27 | 英华达(上海)科技有限公司 | 虚拟隔音通信方法、装置、系统、电子设备、存储介质 |
CN110611861A (zh) * | 2019-09-06 | 2019-12-24 | Oppo广东移动通信有限公司 | 定向发声控制方法及装置、发声设备、介质和电子设备 |
WO2020042992A1 (zh) * | 2018-08-29 | 2020-03-05 | 阿里巴巴集团控股有限公司 | 语音处理的方法、装置、系统、设备和介质 |
CN111988426A (zh) * | 2020-08-31 | 2020-11-24 | 深圳康佳电子科技有限公司 | 基于声纹识别的通信方法、装置、智能终端及存储介质 |
CN112017658A (zh) * | 2020-08-28 | 2020-12-01 | 北京计算机技术及应用研究所 | 一种基于智能人机交互的操作控制系统 |
CN113406567A (zh) * | 2021-06-25 | 2021-09-17 | 安徽淘云科技股份有限公司 | 一种声源定位方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102045618A (zh) * | 2009-10-19 | 2011-05-04 | 联想(北京)有限公司 | 自动调整的麦克风阵列、方法和携带麦克风阵列的装置 |
CN103391347A (zh) * | 2012-05-10 | 2013-11-13 | 中兴通讯股份有限公司 | 一种自动录音的方法及装置 |
CN104422922A (zh) * | 2013-08-19 | 2015-03-18 | 中兴通讯股份有限公司 | 一种移动终端实现声源定位的方法及装置 |
US20160064002A1 (en) * | 2014-08-29 | 2016-03-03 | Samsung Electronics Co., Ltd. | Method and apparatus for voice recording and playback |
-
2016
- 2016-08-05 CN CN201610636259.4A patent/CN106231047A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102045618A (zh) * | 2009-10-19 | 2011-05-04 | 联想(北京)有限公司 | 自动调整的麦克风阵列、方法和携带麦克风阵列的装置 |
CN103391347A (zh) * | 2012-05-10 | 2013-11-13 | 中兴通讯股份有限公司 | 一种自动录音的方法及装置 |
CN104422922A (zh) * | 2013-08-19 | 2015-03-18 | 中兴通讯股份有限公司 | 一种移动终端实现声源定位的方法及装置 |
US20160064002A1 (en) * | 2014-08-29 | 2016-03-03 | Samsung Electronics Co., Ltd. | Method and apparatus for voice recording and playback |
Non-Patent Citations (1)
Title |
---|
姜世芬: "《传声器电路原理与实践》", 30 April 2012, 华南理工大学出版社 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107682786A (zh) * | 2017-10-31 | 2018-02-09 | 广东小天才科技有限公司 | 一种麦克风设备抗干扰方法及麦克风设备 |
CN108682424A (zh) * | 2018-07-13 | 2018-10-19 | 广州势必可赢网络科技有限公司 | 一种音频采集设备及方法 |
WO2020042992A1 (zh) * | 2018-08-29 | 2020-03-05 | 阿里巴巴集团控股有限公司 | 语音处理的方法、装置、系统、设备和介质 |
US11887605B2 (en) | 2018-08-29 | 2024-01-30 | Alibaba Group Holding Limited | Voice processing |
CN109754811A (zh) * | 2018-12-10 | 2019-05-14 | 平安科技(深圳)有限公司 | 基于生物特征的声源追踪方法、装置、设备及存储介质 |
CN109754811B (zh) * | 2018-12-10 | 2023-06-02 | 平安科技(深圳)有限公司 | 基于生物特征的声源追踪方法、装置、设备及存储介质 |
CN109785835A (zh) * | 2019-01-25 | 2019-05-21 | 广州富港万嘉智能科技有限公司 | 一种通过移动终端实现声音录制的方法及装置 |
CN110290468A (zh) * | 2019-07-04 | 2019-09-27 | 英华达(上海)科技有限公司 | 虚拟隔音通信方法、装置、系统、电子设备、存储介质 |
CN110611861B (zh) * | 2019-09-06 | 2021-05-11 | Oppo广东移动通信有限公司 | 定向发声控制方法及装置、发声设备、介质和电子设备 |
CN110611861A (zh) * | 2019-09-06 | 2019-12-24 | Oppo广东移动通信有限公司 | 定向发声控制方法及装置、发声设备、介质和电子设备 |
CN112017658A (zh) * | 2020-08-28 | 2020-12-01 | 北京计算机技术及应用研究所 | 一种基于智能人机交互的操作控制系统 |
CN111988426A (zh) * | 2020-08-31 | 2020-11-24 | 深圳康佳电子科技有限公司 | 基于声纹识别的通信方法、装置、智能终端及存储介质 |
CN111988426B (zh) * | 2020-08-31 | 2023-07-18 | 深圳康佳电子科技有限公司 | 基于声纹识别的通信方法、装置、智能终端及存储介质 |
CN113406567A (zh) * | 2021-06-25 | 2021-09-17 | 安徽淘云科技股份有限公司 | 一种声源定位方法、装置、设备及存储介质 |
CN113406567B (zh) * | 2021-06-25 | 2024-05-14 | 安徽淘云科技股份有限公司 | 一种声源定位方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106231047A (zh) | 一种基于智能终端的音频采集方法、系统及智能终端 | |
US11302341B2 (en) | Microphone array based pickup method and system | |
WO2016169095A1 (zh) | 终端的报警方法及装置 | |
CN103152546B (zh) | 基于模式识别和延迟前馈控制的视频会议回声抑制方法 | |
CN104168353A (zh) | 蓝牙耳机及其语音交互控制方法 | |
CN107978316A (zh) | 控制终端的方法及装置 | |
CN103456305A (zh) | 终端和基于多个声音采集单元的语音处理方法 | |
CN106356067A (zh) | 录音方法、装置及终端 | |
CN111491249B (zh) | 一种耳机入耳状态的检测方法、装置、耳机及存储介质 | |
CN107360157A (zh) | 一种用户注册方法、装置及智能空调器 | |
US10089980B2 (en) | Sound reproduction method, speech dialogue device, and recording medium | |
US20190164567A1 (en) | Speech signal recognition method and device | |
KR20180128838A (ko) | 다수의 음성 인식 장치 간 조정 | |
CN104078045A (zh) | 一种识别的方法及电子设备 | |
CN103886861A (zh) | 一种控制电子设备的方法及电子设备 | |
CN104658536A (zh) | 录音方式切换方法、录音方式切换系统和终端 | |
EP1429314A1 (en) | Correction of energy as input feature for speech processing | |
US20240096343A1 (en) | Voice quality enhancement method and related device | |
CN107105517A (zh) | 网络连接方法及装置 | |
CN105355195A (zh) | 音频识别方法及装置 | |
WO2018100391A1 (en) | Speaker identification | |
WO2016198132A1 (en) | Communication system, audio server, and method for operating a communication system | |
CN110910876A (zh) | 物品声寻装置及控制方法、语音控制设置方法和系统 | |
KR20210148057A (ko) | 음성 인식 방법 및 이에 사용되는 장치 | |
US20030031327A1 (en) | Method and apparatus for providing multiple output channels in a microphone |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20161214 |
|
RJ01 | Rejection of invention patent application after publication |