CN105704298A - 声音唤醒侦测装置与方法 - Google Patents

声音唤醒侦测装置与方法 Download PDF

Info

Publication number
CN105704298A
CN105704298A CN201510814699.XA CN201510814699A CN105704298A CN 105704298 A CN105704298 A CN 105704298A CN 201510814699 A CN201510814699 A CN 201510814699A CN 105704298 A CN105704298 A CN 105704298A
Authority
CN
China
Prior art keywords
signal
sub
key word
sound
acoustical signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201510814699.XA
Other languages
English (en)
Inventor
孙良哲
吕家贤
郑尧文
郑新平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of CN105704298A publication Critical patent/CN105704298A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/72418User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting emergency services
    • H04M1/72421User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality for supporting emergency services with automatic activation of emergency service functions, e.g. upon sensing an alarm
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3287Power saving characterised by the action undertaken by switching off individual functional units in the computer system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4418Suspend and resume; Hibernate and awake
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/32Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Signal Processing (AREA)
  • Business, Economics & Management (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Emergency Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computer Security & Cryptography (AREA)
  • Telephone Function (AREA)
  • Electric Clocks (AREA)
  • Electrophonic Musical Instruments (AREA)

Abstract

本发明揭示一种声音唤醒侦测装置,运用于电子产品,该装置包括:前端侦测电路,声音辨识处理器以及主处理器。前端侦测电路根据子关键词模型参数来辨识声音信号中是否出现子关键词,并且于确认出现该子关键词时,产生第一中断信号。声音辨识处理器,于接收到该第一中断信号后开始运作,该声音辨识处理器根据关键词模型参数来辨识该声音信号中是否出现关键词,并且于确认出现该关键词时,产生第二中断信号。主处理器,于接收到该第二中断信号后开始运作,并使得该电子产品由睡眠状态进入正常运作模式。

Description

声音唤醒侦测装置与方法
技术领域
本发明是有关于一种侦测装置及方法,且特别是有关于一种声音唤醒侦测装置与方法。
背景技术
现今智能型手机的功能越来越多样化,具声音唤醒功能的智能型手机越来越受到消费者的重视。一般来说,当智能型手机等电子产品进入睡眠状态时,只要用户发出关键词(keyword)的声音,智能型手机即可进行关键词的辨识,并且由睡眠状态进入正常运作状态。换言之,使用者无需利用智能型手机其他的功能按键,即可让智能型手机进入正常运作状态。
请参照图1,其所绘示为现有电子产品中的声音唤醒侦测装置示意图。电子产品中的声音唤醒侦测装置100包括:前端侦测电路(frontenddetectingcircuit)110、声音辨识处理器(speechrecognitionprocessor)120、以及主处理器(mainprocessor)130。其中,前端侦测电路110包括麦克风102与事件侦测器(eventdetector)104。于睡眠状态时,前端侦测电路110会被供电,使得麦克风102与事件侦测器104持续运作。另外,电子产品由睡眠状态被唤醒的过程需要经过三个侦测程序(detectionphase)。说明如下:
基本上,事件侦测器104主要的功能在于进行听觉事件侦测(acousticeventdetection)。麦克风102产生声音信号Sa至事件侦测器104,而事件侦测器104侦测声音信号Sa的振幅、信噪比(SNR)或者子频段信噪比(sub-bandSNR)。
当电子产品处于睡眠状态且声音唤醒侦测装置100处于第一侦测程序(firstphasedetection)时,麦克风102持续地接收外部的声音,并转换为声音信号Sa输入事件侦测器104。当声音信号Sa的振幅大于临限值(threshold)时,事件侦测器104即产生第一中断信号(interrupt)INT1至声音辨识处理器120。
除了侦测声音信号Sa的振幅之外,事件侦测器104也可以侦测声音信号的信噪比(SNR)或者子频段信噪比(sub-bandSNR)。亦即,当声音信号Sa的信噪比(SNR)或者子频段信噪比(sub-bandSNR)大于临限值时,事件侦测器104产生第一中断信号INT1至声音辨识处理器120。
再者,声音辨识处理器120为一种数字信号处理器(DSP),又称为微小处理器(tinyprocessor),其作用在于对声音信号Sa进行语音识别。当第一中断信号INT1尚未动作之前,声音辨识处理器120未被供电,所以无法运作,此时尚处于声音唤醒侦测装置100的第一侦测程序。反之,当第一中断信号INT1动作时,声音辨识处理器120被供电,声音唤醒侦测装置100即由第一侦测程序进入第二侦测程序(secondphasedetection)并且开始执行声音信号Sa的关键词辨识动作。
于第二侦测程序,声音辨识处理器120辨识声音信号Sa是否为关键词的声音。当声音辨识处理器120确认声音信号Sa是关键词的声音,声音辨识处理器120即产生第二中断信号INT2至主处理器130。当主处理器130接收到第二中断信号INT2时,声音唤醒侦测装置100即由第二侦测程序进入第三侦测程序(thirdphasedetection)。
反之,当声音辨识处理器120确认声音信号Sa不是关键词的声音,并不会动作第二中断信号INT2至主处理器130,并且声音辨识处理器120会再次被停止供电。此时,声音唤醒侦测装置100即由第二侦测程序进入第一侦测程序,并且等待前端侦测电路110再次产生第一中断信号INT1。
再者,于第三侦测程序时,主处理器130被供电,并进一步使得智能型手机进入正常运作状态。
由以上的说明可知,现有智能型手机中,于第一侦测程序时,前端侦测器110仅对声音信号Sa进行声音事件的判断,并不会对声音信号Sa进行关键词的辨识。而于第二侦测程序时,声音辨识处理器120才会开始对声音信号Sa进行关键词的辨识。
一般来说,现有声音唤醒侦测装置100中,仅前端侦测电路110运作于第一侦测程序时,消耗的电能最小,大约需要1mA的电流。于前端侦测电路110与声音辨识处理器120同时在运作的第二侦测程序时,电能次之,大约需要6mA的电流。
现有的声音唤醒侦测装置100还是有缺点。举例来说,假设智能型手机于睡眠状态时处于吵杂的环境下,则麦克风102将持续收到不是关键词的声音。此时,前端侦测电路110有可能被激发(trigger)而常常产生第一中断信号INT1。因此,声音唤醒侦测装置100会常常在第一侦测程序与第二侦测程序之间运作。所以,一整天下来其电能损耗(dayofusepowerconsumption)也是非常可观。
发明内容
本发明之主要目的在于提出一种声音唤醒侦测装置与方法。当电子装置处于睡眠状态时,声音唤醒侦测装置能更准确地(accurately)于第一侦测程序侦测声音信号。如此,可以有效地降低声音唤醒侦测装置执行第二侦测程序的次数,并降低电子装置的日电能损耗(dayofusepowerconsumption)。
本发明有关于一种声音唤醒侦测装置,运用于电子产品,该装置包括:前端侦测电路,辨识声音信号中是否出现子关键词,并且于确认出现该子关键词时,产生第一中断信号;声音辨识处理器,于接收到该第一中断信号后开始运作,并辨识该声音信号中是否出现关键词,并且于确认出现该关键词时,产生第二中断信号;以及主处理器,于接收到该第二中断信号后开始运作,并使得该电子产品由睡眠状态进入正常运作模式。
本发明有关于一种声音唤醒侦测方法,包括下列步骤:提供前端侦测电路接收声音信号,并辨识该声音信号;当该声音信号中出现子关键词的声音时,启动声音辨识处理器来辨识该声音信号;当该声音信号中出现关键词的声音时,启动主处理器,并唤醒该电子产品应以进入正常运作状态。
为了对本发明之上述及其他方面有更佳的了解,下文特举较佳实施例,并配合所附图式,作详细说明如下:
附图说明
图1所绘示为现有电子产品中的声音唤醒侦测装置示意图。
图2A与图2B所绘示为本发明声音唤醒侦测装置的功能方块示意图
图3所绘示为本发明电子产品中的声音唤醒侦测装置的第一实施例。
图4所绘示为本发明电子产品中的声音唤醒侦测装置的第二实施例。
图5A与图5B所绘示为本发明子关键词判断电路示意图。
图6所绘示为本发明电子产品中的声音唤醒侦测方法流程图。
具体实施方式
本发明是一种语者相关(speakerdependent)的声音唤醒侦测装置与相关方法。利用训练动作(trainingaction)来建立子关键词的模型参数(sub-keywordmodelparameters)以及关键词的模型参数(keywordmodelparameters),分别运用于第一侦测程序以及第二侦测程序。
图2A与图2B,其所绘示为本发明声音唤醒侦测装置的功能方块示意图。首先,当电子产品于正常运作状态时,利用主处理器来产生关键词模型参数232及子关键词模型参数234。于睡眠状态时,子关键词模型参数即可用于第一侦测程序,而关键词模型参数即可运用于第二侦测程序。
如图2A所示,于正常运作状态时,主处理器可以执行训练动作(trainingaction),用以接收关键词的声音信号Sa。以下系假设关键词为“Hi-Patent”,且“Hi”为子关键词来进行说明。
于训练动作时,主处理器中的模型参数估算单元(modelparameterestimationunit)230即接收用户所发出关键词“Hi-Patent”的声音信号Sa后,会利用先进行特征撷取动作(featureextracting)以撷取声音信号Sa中的各种声音特征(voicefeature),例如频率、音量、噪音等等特征。接着利用特定的语音识别模型来对声音信号Sa建立关键词模型参数232。基本上,特定的语音识别模型可为隐藏式马可夫模型(HiddenMarkovModel,简称HMM)。当然,本发明并不限定于上述的HMM,也可以是高斯混合模型(GaussianMixtureModel,简称GMM)、支持向量机制(SupportVectorMachine,SVM)模型或者神经网络(NeuralNet)模型等等的其他语音识别模型。
再者,为了要建立子关键词模型参数234,模型参数估算单元230更需要进行分段动作(segmentation)。分段动作系基于关键词“Hi-Patent”的HMM运用维特比译码算法来分离关键词中的“Hi”与“Patent”。
于分段完成之后,模型参数估算单元230利用获得的“Hi”子关键词,以HMM来建立子关键词模型参数。当然,上述分段动并不限定于将关键词分段为“Hi”以及“Patent”,也可以分段为“Hi-Pa”以及“tent”。
如图2B所示,于睡眠状态时,前端侦测电路210于第一侦测程序时,利用子关键词模型参数先行辨识声音信号Sa中是否有子关键词“Hi”的声音。当前端侦测电路210确认声音信号Sa中有出现子关键词“Hi”的声音后,即产生第一中断信号INT1至声音辨识处理器220。
再者,声音辨识处理器220为一种数字信号处理器(DSP),又称为微小处理器(tinyprocessor),其作用在于对声音信号Sa进行语音识别。同理,当第一中断信号INT1未动作之前,声音辨识处理器220未被供电,所以无法运作,此时尚处于第一侦测程序。反之,当第一中断信号INT1动作时,声音辨识处理器220被供电后即由第一侦测程序进入第二侦测程序。
于第二侦测程序时,声音辨识处理器220即根据关键词模型参数来辨识声音信号Sa是否为关键词“Hi-Patent”的声音。当声音辨识处理器220确认声音信号Sa是关键词“Hi-Patent”的声音,声音辨识处理器220即产生第二中断信号INT2至主处理器,并第二侦测程序由进入第三侦测程序。
反之,当声音辨识处理器220辨识声音信号Sa不是关键词“Hi-Patent”的声音,并不会动作第二中断信号INT2至主处理器,并且声音辨识处理器220会再次被停止供电。此时,由第二侦测程序进入第一侦测程序,并且等待前端侦测电路210再次产生第一中断信号INT1。
明显地,本发明系于第一侦测程序时,先行进行声音信号Sa中的子关键词辨识。因此,可以有效地降低声音唤醒侦测装置执行第二侦测程序的次数,并降低电子装置的日电能损耗(dayofusepowerconsumption)。
参照图3,其所绘示为本发明电子产品中的声音唤醒侦测装置的第一实施例。电子产品中的声音唤醒侦测装置300包括:前端侦测电路310、声音辨识处理器320、以及主处理器330。其中,前端侦测电路310包括麦克风312、声音解编器(audiocodec)314与子关键词判断电路316。麦克风312产生的模拟的声音信号,经由声音解编器314转换为数字的声音信号Sa。
再者,主处理器330连接至主存储器334,声音辨识处理器320连接至子内存322,子关键词判断电路316中有一内嵌内存(embeddedmemory)。当然,本发明并不限定于上述内存的连接方式,主存储器334与子内存322也可以分别为主处理器330与声音辨识处理器320中的内嵌内存,而子关键词判断电路316也可以连接外部内存。
于正常运作状态时,使用者可控制主处理器330执行训练动作。于训练动作时,主处理器330中的模型参数估算单元332即接收用户所发出关键词“Hi-Patent”的声音信号Sa后,利用HMM模型来对声音信号Sa建立关键词模型参数以及子关键词模型参数。训练动作完成后,关键词模型参数以及子关键词模型参数储存于主存储器334。其中,主存储器334可为非挥发式内存(non-volatilememory)。
当电子产品即将进入睡眠状态之前,主存储器334中的关键词模型参数以及子关键词模型参数会被读取并储存于子内存322。再者,声音辨识处理器320可基于环境因素来修改子关键词模型参数。举例来说,声音辨识处理器320由声音信号Sa中获得周围环境的信噪比(SNR)、噪音的形态(noisetype)等等,并使得声音辨识处理器320据以将子关键词模型参数变更为修正的子关键词模型参数(modifiedsub-keywordmodelparameter)。之后,将修正的子关键词模型参数传递至子关键词判断电路316的内嵌内存。
于电子产品进入睡眠状态时,前端侦测电路310会被供电,使得麦克风312、声音解编器314与子关键词判断电路316持续运作。根据本发明实施例,电子产品由睡眠状态被唤醒的过程需要经过三个侦测程序(detectionphase)。说明如下:
于睡眠状态时,前端侦测电路310于第一侦测程序时,利用修正的子关键词模型参数先行辨识声音信号Sa中是否有子关键词“Hi”的声音。当前端侦测电路310确认声音信号Sa中有出现子关键词“Hi”的声音后,即产生第一中断信号INT1至声音辨识处理器320。
换句话说,于第一侦测程序,子关键词判断电路316会根据修正的子关键词模型参数来辨识声音信号Sa中是否出现子关键词“Hi”的声音。当子关键词判断电路316确认声音信号Sa中出现子关键词“Hi”的声音时,即产生一第一中断信号INT1至声音辨识处理器320,并进入第二侦测程序;反之,当声音信号Sa中未出现子关键词“Hi”的声音时,即维持在第一侦测程序。
再者,声音辨识处理器320为一种数字信号处理器(DSP),又称为微小处理器,其作用在于对声音信号Sa进行语音识别。当第一中断信号INT1未动作之前,声音辨识处理器320未被供电,所以无法运作,此时尚处于第一侦测程序。反之,当第一中断信号INT1动作时,声音辨识处理器320被供电后即进入第二侦测程序。
于第二侦测程序时,声音辨识处理器320即根据关键词模型参数来辨识声音信号Sa是否为关键词“Hi-Patent”的声音。当声音辨识处理器320确认声音信号Sa是关键词“Hi-Patent”的声音,声音辨识处理器320即产生第二中断信号INT2至主处理器330,并第二侦测程序由进入第三侦测程序。
反之,当声音辨识处理器320辨识出声音信号Sa不是关键词“Hi-Patent”的声音,并不会动作第二中断信号INT2至主处理器330,并且声音辨识处理器320会再次被停止供电。此时,由第二侦测程序进入第一侦测程序,并且等待前端侦测电路310再次产生第一中断信号INT1。
再者,于第三侦测程序时,主处理器330被供电,并进一步使得电子产品进入正常运作状态。
请参照图4,其所绘示为本发明电子产品中的声音唤醒侦测装置的第二实施例。电子产品中的声音唤醒侦测装置400包括:前端侦测电路410、声音辨识处理器420、以及主处理器430。其中,前端侦测电路410包括麦克风412、声音解编器414与子关键词判断电路416。
主处理器430连接至主存储器434,声音辨识处理器420连接至子内存422,子关键词判断电路416中有一内嵌内存(embeddedmemory)。
相较于第一实施例,其差异在于关键词模型参数以及子关键词模型参数的储存路径。亦即,当电子产品即将进入睡眠状态之前,主存储器434中的关键词模型参数以及子关键词模型参数会被读取并分别储存于子内存422以及子关键词判断电路416的内嵌内存。
换言之,第二实施例中的子关键词模型参数并未经过任何修改,即直接由主存储器434储存至子关键词判断电路416的内嵌内存。
同理,电子产品由睡眠状态被唤醒的过程需要经过三个侦测程序(detectionphase)。并且,前端侦测电路410于第一侦测程序时,利用子关键词模型参数先行辨识声音信号Sa中是否有子关键词“Hi”的声音。当前端侦测电路410确认声音信号Sa中有出现子关键词“Hi”的声音后,即产生第一中断信号INT1至声音辨识处理器420。反之,则不产生第一中断信号INT1至声音辨识处理器420。
再者,第二实施例中的第二侦测程序与第三侦测程序与第一实施例相同,不再赘述。
请参照图5A与图5B,其所绘示为本发明子关键词判断电路示意图。如图5A所示,子关键词判断电路500包括:信号侦测器510、特征撷取电路(featureextractor)520、匹配电路(matchingcircuit)530。其中,特征撷取电路520包括:频谱分析器(spectralanalyzer)522与特征正规器(featurenormalizer)524。
信号侦测器510接收声音信号Sa,并且侦测声音信号Sa的振幅、信噪比(SNR)或者子频段信噪比(sub-bandSNR)。举例来说,当声音信号Sa的振幅大于一临限值(threshold)时,信号侦测器510即发出使能信号EN用以致能(enable)特征撷取电路520。
当特征撷取电路520被致能时,频谱分析器522撷取声音信号Sa中的信息,并转换为声音特征信号(voicefeaturesignal)Ve,代表声音信号声音Sa的声音特性。接着,特征正规器524将声音特征信号Ve进行正规化(normalize)后,产生正规化声音特征信号(normalizedvoicefeaturesignal)Vn。
再者,匹配电路530根据内存中预先储存的子关键词模型参数来判断所接收的正规化声音特征信号Vn是否为子关键词“Hi”的声音。当匹配电路530确认声音信号Sa中有出现子关键词“Hi”的声音后,即产生第一中断信号INT1。反之,当匹配电路530确认声音信号Sa中有未出现子关键词“Hi”的声音后,即不会产生第一中断信号INT1。
基本上,上述匹配电路530系运用匹配算法(matchingalgorithm)来进行判断,匹配算法可为动态程序(dynamicprogramming)算法或者维特比译码(viterbidecoding)算法。
如图5B所示,频谱分析器522利用子频带分析技术(sub-bandanalysis)来撷取声音信号Sa中的信息,并形成多个向量v1、v2、v3,该些向量即组成声音特征信号Ve。
再者,特征正规器524将向量v1、v2、v3中的音量(volume)、信道系效应(channeleffect)、噪音环境(noiseenvironment)进行正规化后成为向量vn1、vn2、vn3,该些向量即组成正规化声音特征信号Vn。
基本上,匹配电路530会判断正规化声音特征信号Vn中是否包含子关键词“Hi”的声音。匹配电路530利用一匹配算法(matchingalgorithm)并使用正规化声音特征信号Vn以及子关键词模型参数来判断声音信号中是否出现子关键词“Hi”的声音。
参照图6,其所绘示为本发明电子产品中的声音唤醒侦测方法流程图。当电子装置进入睡眠状态(步骤S610)后,即进入第一侦测程序。此时,前端侦测电路会接收声音信号,并根据子关键词模型参数来辨识声音信号(步骤S612)。当声音信号中尚未出现子关键词的声音时(步骤S614),回到步骤S612。
再者,当声音信号中出现子关键词的声音时(步骤S614),即进入第二侦测程序。此时,启动声音辨识处理器,并根据关键词模型参数来辨识声音信号(步骤S616)。当声音信号中尚未出现关键词的声音时(步骤S618),回到步骤S612。
再者,当声音信号中出现关键词的声音时(步骤S618),即进入第三侦测程序。此时,启动主处理器,并唤醒电子产品(步骤S620)。而电子产品被唤醒之后,即可进入正常运作状态。
根据以上的说明可知,于电子产品的正常运作状态时,使用者可执行一训练动作,并产生关键词的声音至电子产品。而主处理器即可接收用户所发出关键词的声音信号后,进一步建立关键词模型参数以及子关键词模型参数。
而于电子产品进入睡眠状态之前,关键词模型参数被储存于子内存中,供语音识别处理器来进行辨识;并且,子关键词模型参数(或者修正的子关键词模型参数)被储存于前端侦测电路中,供子关键词判断电路来进行辨识。如此,电子产品于睡眠状态时,即可执行图6之声音唤醒侦测方法流程。
由以上之说明可知,本发明提出一种声音唤醒侦测装置与相关方法。于第一侦测程序时,先行进行声音信号Sa中的子关键词辨识,于确认出声音信号Sa中有子关键词的声音之后,才进入第二侦测模式。换句话说,本发明可以有效地降低声音唤醒侦测装置执行第二侦测程序的次数,并降低电子装置的日电能损耗(dayofusepowerconsumption)。
综上所述,虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明之精神和范围内,当可作各种之更动与润饰。因此,本发明之保护范围当视后附之申请专利范围所界定者为准。

Claims (20)

1.一种声音唤醒侦测装置,运用于电子产品,该装置包括:
前端侦测电路,辨识声音信号中是否出现子关键词,并且于确认出现该子关键词时,产生第一中断信号;
声音辨识处理器,于接收到该第一中断信号后开始运作,并辨识该声音信号中是否出现关键词,并且于确认出现该关键词时,产生第二中断信号;以及
主处理器,于接收到该第二中断信号后开始运作,并使得该电子产品由睡眠状态进入正常运作模式。
2.根据权利要求1所述的装置,其特征在于,当该前端侦测电路根据子关键词模型参数来确认该声音信号中出现该子关键词时,产生该第一中断信号。
3.根据权利要求2所述的装置,其特征在于,当该声音辨识处理器根据关键词模型参数来确认该声音信号中出现该关键词时,产生第二中断信号。
4.根据权利要求3所述的装置,其特征在于,该前端侦测电路包括:
麦克风,将接收的声音转换为一模拟声音信号;
声音解编器,将该模拟声音信号转换为一数字声音信号;以及
子关键词判断电路,根据该子关键词模型参数来辨识该数字声音信号中是否出现该子关键词,并且于确认出现该子关键词时,产生该第一中断信号。
5.根据权利要求4所述的装置,其特征在于,该子关键词判断电路包括:
信号侦测器,侦测该数字声音信号的振幅、信噪比或者子频段信噪比,并据以产生使能信号;
特征撷取电路,于接收到该使能信号后开始运作,并撷取该数字声音信号中的信息,并产生正规化声音特征信号;以及
匹配电路,根据该子关键词模型参数来判断该正规化声音特征信号中是否出现该子关键词,并且于确认出现该子关键词时,产生该第一中断信号。
6.根据权利要求5所述的装置,其特征在于,该信号侦测器判断该数字声音信号的该振幅大于第一临限值时、该数字声音信号的该信噪比大于第二临限值时,或者该数字声音信号的该子频段信噪比大于第三临限值时,产生该使能信号。
7.根据权利要求5所述的装置,其特征在于,该特征撷取电路包括:
频谱分析器,撷取该数字声音信号中的信息,并形成多个向量,且该些向量组成声音特征信号;以及
特征正规器将该些向量进行正规化后,产生该正规化声音特征信号。
8.根据权利要求3所述的装置,其特征在于,更包括主存储器连接至该主处理器,其中于该正常运作状态下执行训练动作时,该主处理器中的模型参数估算单元接收用户所发出该关键词的该声音信号后,建立该关键词模型参数以及该子关键词模型参数,并储存于该主存储器中。
9.根据权利要求8所述的装置,其特征在于,更包括子内存连接至该声音辨识处理器,用以储存该关键词模型参数以及该子关键词模型参数,其中该声音辨识处理器更处理该子关键词模型参数成为修正的子关键词模型参数后,传递至该前端侦测电路。
10.根据权利要求8所述的装置,其特征在于,更包括子内存连接至该声音辨识处理器,且该前端侦测电路中有内嵌内存,其中该子内存储存该关键词模型参数,该内嵌内存储存该子关键词模型参数。
11.一种声音唤醒侦测方法,包括下列步骤:
提供前端侦测电路接收声音信号,并辨识该声音信号;
当该声音信号中出现子关键词的声音时,启动声音辨识处理器来辨识该声音信号;
当该声音信号中出现关键词的声音时,启动主处理器,并唤醒该电子产品应以进入正常运作状态。
12.根据权利要求11所述的方法,其特征在于,当该前端侦测电路根据子关键词模型参数来确认该声音信号中出现该子关键词时,产生该第一中断信号。
13.根据权利要求12所述的方法,其特征在于,当该声音辨识处理器根据关键词模型参数来确认该声音信号中出现该关键词时,产生第二中断信号。
14.根据权利要求13所述的方法,其特征在于,当该声音信号中出现该子关键词的声音时,该前端侦测电路产生第一中断信号至该声音辨识处理器,用以启动该声音辨识处理器。
15.根据权利要求14所述的方法,其特征在于,当该声音信号中出现该关键词的声音时,该声音辨识处理器产生第二中断信号至该主处理器,用以启动该主处理器。
16.根据权利要求13所述的方法,其特征在于,该前端侦测电路接收该声音信号时,更包括下列步骤:
侦测该声音信号的振幅、信噪比或者子频段信噪比,并据以产生使能信号;
于该使能信号产生时,撷取该声音信号中的信息,并产生正规化声音特征信号;以及
根据该子关键词模型参数来判断该正规化声音特征信号中是否出现该子关键词。
17.根据权利要求16所述的方法,其特征在于,于该声音信号的该振幅大于第一临限值时、该声音信号的该信噪比大于第二临限值时,或者该声音信号的该子频段信噪比大于第三临限值时,产生该使能信号。
18.根据权利要求16所述的方法,其特征在于,更包括下列步骤:
撷取该声音信号中的信息,并形成多个向量,且该些向量组成声音特征信号;以及
将该些向量进行正规化后,产生该正规化声音特征信号。
19.根据权利要求13所述的方法,其特征在于,于该正常运作状态下,该主处理器中的模型参数估算单元接收用户所发出该关键词的该声音信号后,建立该关键词模型参数以及该子关键词模型参数。
20.根据权利要求13所述的方法,其特征在于,该子关键词模型参数为修正的子关键词模型参数。
CN201510814699.XA 2014-12-11 2015-11-23 声音唤醒侦测装置与方法 Withdrawn CN105704298A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US201462090614P 2014-12-11 2014-12-11
US62/090,614 2014-12-11
US201562117109P 2015-02-17 2015-02-17
US62/117,109 2015-02-17
US14/872,207 2015-10-01
US14/872,207 US9779725B2 (en) 2014-12-11 2015-10-01 Voice wakeup detecting device and method

Publications (1)

Publication Number Publication Date
CN105704298A true CN105704298A (zh) 2016-06-22

Family

ID=54705098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510814699.XA Withdrawn CN105704298A (zh) 2014-12-11 2015-11-23 声音唤醒侦测装置与方法

Country Status (4)

Country Link
US (1) US9779725B2 (zh)
EP (1) EP3032535A1 (zh)
CN (1) CN105704298A (zh)
BR (1) BR102015031137B1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107613111A (zh) * 2017-09-01 2018-01-19 江西冠中图像科技有限责任公司 具有声控唤醒的智能手机

Families Citing this family (78)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105376389B (zh) * 2014-08-19 2020-02-14 中兴通讯股份有限公司 一种语音唤醒方法及设备
US9652017B2 (en) * 2014-12-17 2017-05-16 Qualcomm Incorporated System and method of analyzing audio data samples associated with speech recognition
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9811314B2 (en) 2016-02-22 2017-11-07 Sonos, Inc. Metadata exchange involving a networked playback system and a networked microphone system
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US10097919B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Music service selection
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
CN106228979B (zh) * 2016-08-16 2020-01-10 重庆大学 一种公共场所异常声音特征提取及识别方法
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
US10079015B1 (en) * 2016-12-06 2018-09-18 Amazon Technologies, Inc. Multi-layer keyword detection
US10593328B1 (en) * 2016-12-27 2020-03-17 Amazon Technologies, Inc. Voice control of remote device
US10672387B2 (en) * 2017-01-11 2020-06-02 Google Llc Systems and methods for recognizing user speech
US10311876B2 (en) 2017-02-14 2019-06-04 Google Llc Server side hotwording
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
TWI655624B (zh) * 2017-08-03 2019-04-01 晨星半導體股份有限公司 聲控裝置及相關的聲音訊號處理方法
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
KR102417899B1 (ko) * 2017-11-16 2022-07-07 현대자동차주식회사 차량의 음성인식 시스템 및 방법
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
US10672380B2 (en) * 2017-12-27 2020-06-02 Intel IP Corporation Dynamic enrollment of user-defined wake-up key-phrase for speech enabled computer system
US11343614B2 (en) 2018-01-31 2022-05-24 Sonos, Inc. Device designation of playback and network microphone device arrangements
CN110277094A (zh) * 2018-03-14 2019-09-24 阿里巴巴集团控股有限公司 设备的唤醒方法、装置及电子设备
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11726324B2 (en) * 2018-08-31 2023-08-15 Apple Inc. Display system
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
US10878811B2 (en) * 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
CN111176618B (zh) * 2019-12-10 2023-09-01 武汉学子明灯科技有限责任公司 一种语音唤醒开发程序的方法及系统
US11341954B2 (en) * 2019-12-17 2022-05-24 Google Llc Training keyword spotters
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
CN112002320A (zh) * 2020-08-10 2020-11-27 北京小米移动软件有限公司 语音唤醒方法、装置、电子设备和存储介质
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
US11984123B2 (en) 2020-11-12 2024-05-14 Sonos, Inc. Network device interaction by range
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
CN112948006A (zh) * 2021-02-02 2021-06-11 深圳市江元科技(集团)有限公司 终端设备唤醒方法、装置、终端设备和存储介质
CN118197323A (zh) * 2022-11-04 2024-06-14 荣耀终端有限公司 一种语音交互方法及相关电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003026158A1 (en) * 2001-09-14 2003-03-27 Roke Manor Research Limited Single frequency duplex fm transceiver with digital ssb demulator
CN103543814A (zh) * 2012-07-16 2014-01-29 瑞昱半导体股份有限公司 信号处理装置以及信号处理方法
US8768712B1 (en) * 2013-12-04 2014-07-01 Google Inc. Initiating actions based on partial hotwords

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100744301B1 (ko) * 2006-06-01 2007-07-30 삼성전자주식회사 음성 인식을 이용하여 동작 모드를 전환하는 휴대 단말기및 그 방법
US20110288860A1 (en) 2010-05-20 2011-11-24 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for processing of speech signals using head-mounted microphone pair
US9921803B2 (en) 2010-08-23 2018-03-20 Nokia Technologies Oy Audio user interface apparatus and method
US9959865B2 (en) * 2012-11-13 2018-05-01 Beijing Lenovo Software Ltd. Information processing method with voice recognition
US10395651B2 (en) 2013-02-28 2019-08-27 Sony Corporation Device and method for activating with voice input
CN105379308B (zh) * 2013-05-23 2019-06-25 美商楼氏电子有限公司 麦克风、麦克风系统及操作麦克风的方法
KR102060661B1 (ko) * 2013-07-19 2020-02-11 삼성전자주식회사 통신 방법 및 이를 위한 디바이스
US20150112690A1 (en) 2013-10-22 2015-04-23 Nvidia Corporation Low power always-on voice trigger architecture

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003026158A1 (en) * 2001-09-14 2003-03-27 Roke Manor Research Limited Single frequency duplex fm transceiver with digital ssb demulator
CN103543814A (zh) * 2012-07-16 2014-01-29 瑞昱半导体股份有限公司 信号处理装置以及信号处理方法
US8768712B1 (en) * 2013-12-04 2014-07-01 Google Inc. Initiating actions based on partial hotwords

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107613111A (zh) * 2017-09-01 2018-01-19 江西冠中图像科技有限责任公司 具有声控唤醒的智能手机

Also Published As

Publication number Publication date
BR102015031137A2 (pt) 2016-11-08
US20160171975A1 (en) 2016-06-16
US9779725B2 (en) 2017-10-03
EP3032535A1 (en) 2016-06-15
BR102015031137B1 (pt) 2022-05-17

Similar Documents

Publication Publication Date Title
CN105704298A (zh) 声音唤醒侦测装置与方法
CN105704300A (zh) 具数字麦克风的声音唤醒侦测装置及相关方法
KR102335717B1 (ko) 음성 제어 시스템 및 그 웨이크업 방법, 웨이크업 장치 및 가전제품, 코프로세서
CN110503969B (zh) 一种音频数据处理方法、装置及存储介质
CN107481718B (zh) 语音识别方法、装置、存储介质及电子设备
CN104867495B (zh) 声音辨识设备及其操作方法
CN105009204B (zh) 语音识别功率管理
JP5644013B2 (ja) 発話音声処理
CN110444210B (zh) 一种语音识别的方法、唤醒词检测的方法及装置
CN110890093A (zh) 一种基于人工智能的智能设备唤醒方法和装置
CN105700660B (zh) 具有与核域不同的唤醒模块的电子设备
CN113160815B (zh) 语音唤醒的智能控制方法、装置、设备及存储介质
CN109272991A (zh) 语音交互的方法、装置、设备和计算机可读存储介质
CN110268471B (zh) 具有嵌入式降噪的asr的方法和设备
CN108447483A (zh) 语音识别系统
CN108600559B (zh) 静音模式的控制方法、装置、存储介质及电子设备
CN112951243A (zh) 语音唤醒方法、装置、芯片、电子设备及存储介质
CN110517702A (zh) 信号生成的方法、基于人工智能的语音识别方法及装置
CN208538474U (zh) 语音识别系统
CN101350196A (zh) 任务相关的说话人身份确认片上系统及其确认方法
CN112420063A (zh) 一种语音增强方法和装置
US20210350798A1 (en) Two stage user customizable wake word detection
CN113628613A (zh) 两阶段的用户可定制唤醒词检测
CN117496987A (zh) 歌曲生成模型的训练方法、装置、设备及存储介质
CN115691473A (zh) 一种语音端点检测方法、装置和存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20160622