CN113411723A - 语音助理系统 - Google Patents
语音助理系统 Download PDFInfo
- Publication number
- CN113411723A CN113411723A CN202110666598.8A CN202110666598A CN113411723A CN 113411723 A CN113411723 A CN 113411723A CN 202110666598 A CN202110666598 A CN 202110666598A CN 113411723 A CN113411723 A CN 113411723A
- Authority
- CN
- China
- Prior art keywords
- analog
- signal processor
- keyword
- voice assistant
- assistant system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005070 sampling Methods 0.000 claims abstract description 98
- 238000001514 detection method Methods 0.000 claims abstract description 66
- 230000005236 sound signal Effects 0.000 claims abstract description 35
- 230000004044 response Effects 0.000 claims abstract description 22
- 238000013528 artificial neural network Methods 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 4
- 230000003213 activating effect Effects 0.000 claims 2
- 210000000867 larynx Anatomy 0.000 claims 2
- 238000004519 manufacturing process Methods 0.000 abstract description 5
- 238000010586 diagram Methods 0.000 description 12
- 238000013473 artificial intelligence Methods 0.000 description 6
- 210000000988 bone and bone Anatomy 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000003205 muscle Anatomy 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000000034 method Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000001595 mastoid Anatomy 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000012782 phase change material Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Abstract
本发明提供一种语音助理系统。此语音助理系统包括麦克风模块以及信号处理器。麦克风模块适于配戴于用户上,并反应于用户的喉内发声而产生模拟声音信号。信号处理器操作于话语收音模式或关键词检测模式。信号处理器操作于话语收音模式的功耗高于信号处理器操作于关键词检测模式的功耗。当信号处理器操作于关键词检测模式,信号处理器根据模拟声音信号的多笔模拟取样电压进行关键词检测。反应于在关键词检测模式中检测到关键词,信号处理器自关键词检测模式切换为话语收音模式。
Description
技术领域
本发明涉及一种语音助理系统,且特别是有关于一种具有无线麦克风装置的语音助理系统。
背景技术
随着语音识别技术的进步,语音助理已经被广泛应用于现代人的生活之中。语音助理是运行在终端装置上的一种软件程序,其能够和用户进行语音交流而完成用户所指派的任务,例如信息搜索、电器控制或操控终端装置的其他应用程序等等。可想而知,若用户可以随心所欲地使用语音助理,可对生活或工作带来极大的帮助。举例而言,用户可通过语音助理随时进行信息搜索而实时获取需要的信息。目前,用户皆需要对收音装置清楚地且大声地说出语音指令,以顺利与语音助理进行语音交流。然而,于一些需要保持安静的情境中,例如会议情境或公众环境,用户并不适合大声地说出语音指令来操控语音助理,以避免打扰他人。此外,若要让用户可随时随地与语音助理进行沟通,用户需要随时随身配戴收音装置来撷取用户下达的语音指令。因此,如何有效延长配戴于用户身上的收音装置的续航力也是一大考验。
发明内容
有鉴于此,本发明提供一种语音助理系统,其可大幅节省无线麦克风装置的功耗而增加无线麦克风装置的续航力,以使得通过此无线麦克风装置接收语音消息的语音助理的应用范围可更广泛且不受到限制。
本发明实施例提出一种语音助理系统,其包括麦克风模块以及信号处理器。麦克风模块适于配戴于用户上,并反应于用户的喉内发声而产生模拟声音信号。信号处理器操作于话语收音模式或关键词检测模式。信号处理器操作于话语收音模式的功耗高于信号处理器操作于关键词检测模式的功耗。当信号处理器操作于关键词检测模式,信号处理器根据模拟声音信号的多笔模拟取样电压进行关键词检测。反应于在关键词检测模式中检测到关键词,信号处理器自关键词检测模式切换为话语收音模。
本发明实施例提出一种语音助理系统,其包括终端装置、麦克风模块以及信号处理器。麦克风模块适于配戴于用户上,并反应于用户的喉内发声而产生模拟声音信号。信号处理器操作于话语收音模式或关键词检测模式。信号处理器操作于话语收音模式的功耗高于信号处理器操作于关键词检测模式的功耗。
当信号处理器操作于关键词检测模式,信号处理器根据模拟声音信号的多笔模拟取样电压进行关键词检测。反应于在关键词检测模式中检测到关键词,信号处理器自关键词检测模式切换为话语收音模式。在切换至话语收音模式之后,信号处理器对模拟声音信号进行音频处理而产生经处理数字音频数据。信号处理器将经处理数字音频数据提供给终端装置所运行的语音助理程序。
基于上述,于本发明的实施例中,语音助理系统的信号处理器可切换操作于关键词检测模式与话语收音模式。当无线麦克风装置的信号处理器操作于关键词检测模式时,信号处理器在禁能高功耗元件的情况下根据麦克风模块提供的模拟声音信号判断是否检测到关键词。反应于在关键词检测模式中检测到关键词,信号处理器可自关键词检测模式切换为话语收音模式而启动高功耗元件。基此,当用户意图使用语音助理而说出关键词时,无线麦克风装置才从关键词检测模式切换为话语收音模式,以利用高功耗元件对麦克风模块提供的模拟声音信号进行数字音频处理,以避免高功耗元件于非必要时持续运作而浪费无线麦克风装置的电力,从而延长无线麦克风装置的续航力。
附图说明
图1是依照本发明一实施例的语音助理系统的示意图。
图2是依照本发明一实施例的语音助理系统的使用情境示意图。
图3是依照本发明一实施例的无线麦克风装置的示意图。
图4是依照本发明一实施例的语音助理系统的示意图。
图5是依照本发明一实施例的语音助理系统的使用情境示意图。
图6是依照本发明一实施例的无线麦克风装置的示意图。
具体实施方式
现将详细地参考本发明的示范性实施例,示范性实施例的实例说明于附图中。只要有可能,相同元件符号在图式和描述中用来表示相同或相似部分。
为了使本发明的内容可以被更容易明了,以下特举实施例做为本发明确实能够据以实施的范例。另外,凡可能之处,在图式及实施方式中使用相同标号的元件/构件/步骤,是代表相同或类似部件。
应当理解,当元件被称为“直接在另一元件上”或“直接连接到”另一元件时,不存在中间元件。如本文所使用的,“连接”可以指物理及/或电性连接。再者,“电性连接”或“耦合”可以是二元件间存在其它元件。
图1是依照本发明一实施例的语音助理系统的示意图。请参照图1,语音助理系统10可包括无线麦克风装置100与终端装置200。终端装置200用以运行一语音助理程序,其例如是桌面计算机、笔记本式计算机、智能型手机、平板计算机、智能音箱等等,本发明对此并不限制。无线麦克风装置100可经由无线通讯技术连接终端装置200。
举例而言,无线麦克风装置100可经由蓝芽、Wi-Fi或ZigBee等无线通讯技术与终端装置200连接,本发明对此无线通讯技术的种类并不限制。无线麦克风装置100用以感测用户的喉内发声,以让用户可利用无线麦克风装置100与终端装置200所运行的语音助理程序进行语音互动。
于本实施例中,无线麦克风装置100可包括麦克风模块110、信号处理器120,以及电池130。
麦克风模块110适于配戴于用户上,并反应于用户的喉内发声而产生模拟声音信号。喉内发声为旁人听不到的声波振福。麦克风模块110可包括用以感测用户的发声的膜片,其例如是微机电系统(MEMS)麦克风。于一实施例中,无线麦克风装置100可以是可感测到头颈部骨骼或肌肉振动的骨感式麦克风。麦克风模块110接触用户的肌肤并适于配戴于用户的喉咙上或耳后。麦克风模块110可感测到用户以极低音量所发出的声音。更详细而言,图2是依照本发明一实施例的语音助理系统的使用情境示意图。请参照图2,无线麦克风装置100可配戴于用户耳后乳突骨的附近。当用户发出声音时,麦克风模块110可通过膜片感应到的用户的骨骼或肌肉振动而据以产生模拟声音信号。因此,通过与用户肌肤接触的麦克风模块110感测用户的发声,用户可以旁人无法清楚听到的音量下达语音消息给终端装置200所运行的语音助理程序。
电池130耦接麦克风模块110与信号处理器120,并用以作为无线麦克风装置100的电力来源。换言之,电池130可提供电力给麦克风模块110与信号处理器120。
信号处理器120可切换操作于话语收音模式或关键词检测模式。信号处理器120操作于话语收音模式的功耗高于信号处理器操作于关键词检测模式的功耗。也就是说,信号处理器120可操作于功耗较高的话语收音模式或操作于功耗较低的关键词检测模式。于一实施例中,信号处理器120包括高功耗元件121,并接收麦克风模块110所产生的模拟声音信号。当信号处理器120操作于关键词检测模式时,高功耗元件121被禁能而停止运作。当信号处理器120操作于话语收音模式时,高功耗元件121被致能来对麦克风模块110提供的模拟声音信号进行音频处理。于一实施例中,高功耗元件121可包括模拟数字转换器、数字信号处理器、功率放大器或其组合。
因此,当信号处理器120操作于关键词检测模式时,用以对克风模块110提供的模拟声音信号进行音频处理的高功耗元件121不会消耗电池130的电量。需说明的是,信号处理器120是根据用户是否说出关键词而决定是否从关键词检测模式切换为话语收音模式。因此,当用户没有说出关键词时,信号处理器120会维持操作于功耗较低的关键词检测模式中。当用户说出关键词时,信号处理器120会切换为操作于功耗较高的话语收音模式中。对应于不同语音助理程序,上述关键词例如是Alexa、Cortana、Hey Siri、OK Google或其他自定义关键词等等,本发明对此不限制。
于一实施例中,当信号处理器120操作于关键词检测模式,信号处理器120可基于人工神经网络(artificial neural network,ANN)而根据模拟声音信号的多笔模拟取样电压进行关键词检测。详细而言,信号处理器120可对模拟声音信号进行模拟信号取样而获取多笔模拟取样电压。于一实施例中,信号处理器120可包括实现人工神经网络的模拟人工智能(AI)电路,而此人工神经网络经配置接收多笔模拟取样电压来进行关键词检测。相较于数字AI电路,可实现模拟乘加器的模拟AI电路的功耗更低。也就是说,信号处理器120可于关键词检测模式中通过将多笔模拟取样电压提供给模拟AI电路来持续侦测用户是否说出关键词。
于是,反应于在关键词检测模式中检测到关键词,信号处理器120可自关键词检测模式切换为话语收音模式而启动高功耗元件121。在切换至话语收音模式之后,信号处理器120可利用高功耗元件121对模拟声音信号进行音频处理而产生经处理数字音频数据。无线麦克风装置100将经处理数字音频数据提供给终端装置200所运行的语音助理程序,使得语音助理程序可依据经处理数字音频数据执行相关功能,例如信息搜索、电器控制或控制终端装置200的其他应用程序等等。
另一方面,反应于在关键词检测模式中未检测到关键词,信号处理器120维持操作于关键词检测模式而禁能高功耗元件121。也就是说,若用户没有说出关键词,信号处理器120可长时间维持操作于关键词检测模式中来节省电力消耗。也就是说,当配戴无线麦克风装置100的用户没有想要使用语音助理时,用户并不会说出关键词而控制无线麦克风装置100的信号处理器120一直维持操作于关键词检测模式中。当用户想要使用语音助理时,用户可以极低音量说出关键词而控制无线麦克风装置100的信号处理器120切换为操作于话语收音模式,使得操作于话语收音模式的信号处理器120可对麦克风模块110提供的模拟声音信号进行模拟数字转换与数字音频处理。换言之,高功耗元件121只有在用户对语音助理下达语音消息时才会被致能来运作,其余时段是被禁能的。因此,可大幅节省语音助理系统10中的无线麦克风装置110的电力消耗,好让用户可以长时间配戴无线麦克风装置110且不需要频繁对无线麦克风装置110进行充电。
图3是依照本发明一实施例的无线麦克风装置的示意图。请参照图3,无线麦克风装置100可包括麦克风模块110、信号处理器120、电池130,以及无线收发器140。
相较于图1的实施例,于本实施例中,无线麦克风装置100可更包括无线收发器140。无线收发器140耦接信号处理器120并与终端装置200建立无线通讯连结。具体而言,无线收发器140可用以传输数据至终端装置200或从终端装置200接收数据。无线收发器140可包括天线或其他通讯相关电路,其例如是蓝牙收发器,但本发明并不限制于此。于此,无线收发器140可将操作于话语收音模式中的信号处理器120产生的经处理数字音频数据传输至终端装置200,使得终端装置200所运行的语音助理程序可依据经处理数字音频数据进行语音识别而获取用户下达的语音消息。
此外,于本实施例中,信号处理器120可包括模拟取样电路122、模拟式存储器123,以及语音识别电路124。
于一实施例中,模拟取样电路122可包括一或多个模拟取样维持电路(analogsampling-and-hold circuit)。模拟取样电路122可依据取样频率而对模拟声音信号进行取样与保持,藉以输出已取样及保持过后的多笔模拟取样电压。于一实施例中,麦克风模块110的振膜可感测到用户的骨骼或肌肉振动,使麦克风模块110据以输出模拟声音信号至信号处理器120。模拟取样电路122耦接麦克风模块110。模拟取样电路122接收麦克风模块110产生的模拟声音信号,并取样模拟声音信号而产生多笔模拟取样电压。于一实施例中,模拟取样电路122例如可以16k Hz的取样频率来取样模拟声音信号。
模拟式存储器123耦接模拟取样电路122,并记录来自模拟取样电路122的多笔模拟取样电压。于一实施例中,模拟式存储器123可以是电荷耦合装置(charge coupleddevice,CCD)存储器。模拟式存储器123可以是三相CCD存储器或四相CCD存储器,本发明对此不限制。详细而言,模拟式存储器123可分别将多笔模拟取样电压转换为对应的电荷,以将多笔模拟取样电压各自对应的电荷量记录下来。基于将多个频率信号施加于CCD存储器上的多个闸级电极而产生的电荷转移效应,模拟式存储器123可将多笔模拟取样电压依照取样顺序暂存下来。
或者,于一实施例中,模拟式存储器123可以是相变存储器(Phase-changememory,PCM)。详细而言,多笔模拟取样电压可分别转换为具有对应脉冲宽度的电流脉冲,而这些电流脉冲可被施加于模拟式存储器123中的多个记忆单元的电极上,使各记忆单元中的相变材料发生物理相态的变化而具有对应的电阻状态。通过将多笔模拟取样电压转换为相变存储器中多个记忆单元所对应电阻状态,模拟式存储器123中可将多笔模拟取样电压记录下来。
于一实施例中,模拟式存储器123可记录于一个预设取样时段内取样获取的多笔模拟取样电压。上述预设取样时段例如是250ms,但本发明对此不限制。
语音识别电路124耦接模拟式存储器123。语音识别电路124可自模拟式存储器123获取对应至一预设取样时段的多笔模拟取样电压。语音识别电路124可基于人工神经网络而对这些模拟取样电压进行特征撷取,以判断是否检测到关键词。可知的,人工神经网络包括排列于多个层的多个神经元,这些神经元分别会依据权重信息进行乘法运算与加法运算,而这些层的输出可视为撷取到特征向量。于一实施例中,语音识别电路124可包括实现模拟乘加器的模拟AI电路,其可根据人工神经网络对多笔模拟取样电压进行模拟AI运算,以对这些模拟取样电压进行特征撷取。最终,语音识别电路124可依据这些模拟取样电压的特征向量进行分类操作而判断是否检测到关键词。
于一实施例中,关键词可由多个音节组成,这些音节至少包括第一音节与第二音节。语音识别电路124可基于人工神经网络判断多笔模拟取样电压中的多笔第一取样电压是否符合关键词的第一音节。第一取样电压是于一预设取样时段内进行模拟取样而产生,且模拟式存储器123可同时地暂存于一预设取样时段内进行模拟取样而产生的多笔取样电压。举例而言,基于人说出一个音节大概需要花费1/4秒,因而可假设预设取样时段为250ms。假设取样频率为16kHZ(亦即一秒取样16k笔模拟取样电压),则模拟式存储器123所暂存之对应至预设取样时段的第一取样电压共有4k笔。首先,第一取样电压输入至语音识别电路124,语音识别电路124可判断多笔第一取样电压是否符合关键词的第一音节。
接着,反应于基于人工神经网络判定多笔模拟取样电压中的第一取样电压符合关键词的第一音节,语音识别电路124才可基于人工神经网络判断模拟取样电压中的多笔第二取样电压是否符合关键词的第二音节。反之,反应于基于人工神经网络判定多笔模拟取样电压中的第一取样电压并未符合关键词的第一音节,语音识别电路124会再次基于人工神经网络判断模拟取样电压中的多笔第二取样电压是否符合关键词的第一音节。
于一实施例中,语音识别电路124使用第一神经网络权重数据判断多笔模拟取样电压中的第一取样电压是否符合关键词的第一音节。并且,语音识别电路124使用第二神经网络权重数据判断多笔模拟取样电压中的第二取样电压是否符合关键词的第二音节。亦即,对应于不同发音的第一音节与第二音节,语音识别电路124可使用不同的经训练的神经网络权重数据来进行判断。
也就是说,当语音识别电路124判定多笔第一取样电压符合关键词的第一音节时,语音识别电路124才会接续判断后续的其他取样电压是否符合关键词的第二音节。否则,语音识别电路124会继续判断模拟式存储器123所暂存的模拟取样电压是否符合关键词的第一音节。换言之,于一实施例中,当语音识别电路124基于人工神经网络判定模拟取样电压依照特定顺序符合关键词的多个音节,语音识别电路124判定检测到关键词。
举例而言,以关键词为「ok!google」为例,此关键词会包括4个音节「o」、「k」、「goo」、「gle」。语音识别电路124可先依据对应至「o」的第一神经网络权重数据来判定第1笔至第i笔模拟取样电压是否符合关键词的第一音节「o」。若是,语音识别电路124可依据对应至「k」的第二神经网络权重数据来判定第(i+1)笔至第2i笔模拟取样电压是否符合关键词的第二音节「k」。若否,语音识别电路124可再次依据对应至「o」的第一神经网络权重数据来判定第(i+1)笔至第2i笔模拟取样电压是否符合关键词的第一音节「o」。
若语音识别电路124判定第(i+1)笔至第2i笔模拟取样电压未符合关键词的第二音节「k」,语音识别电路124可再次依据对应至「o」的第一神经网络权重数据来判定第(2i+1)笔至第3i笔模拟取样电压是否符合关键词的第一音节「o」。若语音识别电路124判定第(i+1)笔至第2i笔模拟取样电压符合关键词的第二音节「k」,语音识别电路124接着可依据对应至「goo」的第三神经网络权重数据来判定第(2i+1)笔至第3i笔模拟取样电压是否符合关键词的第三音节「goo」。
若语音识别电路124判定第(2i+1)笔至第3i笔模拟取样电压未符合关键词的第三音节「goo」,语音识别电路124可再次依据对应至「o」的第一神经网络权重数据来判定第(3i+1)笔至第4i笔模拟取样电压是否符合关键词的第一音节「o」。若语音识别电路124判定第(2i+1)笔至第3i笔模拟取样电压符合关键词的第三音节「goo」,语音识别电路124接着可依据对应至「gle」的第四神经网络权重数据来判定第(3i+1)笔至第4i笔模拟取样电压是否符合关键词的第四音节「gle」。
若语音识别电路124判定第(3i+1)笔至第4i笔模拟取样电压未符合关键词的第四音节「gle」,语音识别电路124可再次依据对应至「o」的第一神经网络权重数据来判定第(4i+1)笔至第5i笔模拟取样电压是否符合关键词的第一音节「o」。若语音识别电路124判定第(3i+1)笔至第4i笔模拟取样电压符合关键词的第四音节「gle」,语音识别电路124可判定检测到关键词「ok!google」。
于一实施例中,若语音识别电路124判定并未检测到关键词,信号处理器120可维持操作于关键词检测模式中。相对的,若语音识别电路124判定检测到关键词,信号处理器120可从关键词检测模式切换为话语收音模式而致能高功耗元件121。
举例而言,于一实施例中,语音识别电路124可提供通知信号给信号处理器120中的电源控制电路,好让电源控制电路决定是否将电池130的电力供应至高功耗元件121。由此可知,模拟取样电路122、模拟式存储器123,以及语音识别电路124可于关键词检测模式中持续侦测用户是否说出关键词。当语音识别电路124判定检测到关键词时,无线麦克风装置100才会使用高功耗元件121来处理模拟声音信号以及将经处理数字音频数据传输至终端装置200。
图4是依照本发明一实施例的语音助理系统的示意图。图5是依照本发明一实施例的语音助理系统的使用情境示意图。请参照图4与图5,除了相似于图1实施例的无线麦克风装置100与终端装置200之外,语音助理系统10可更包括耳机300。耳机300适于配戴于用户的耳部,并可播放来自终端装置200的音频数据。
于一实施例中,当用户没有意图要使用语音助理程序时,即便用户一直说话,但无线麦克风装置100的信号处理器120还是维持操作于关键词检测模式中,而不会浪费电力来进行数字音频处理以及传输数据至终端装置200。当用户想要使用语音助理程序进行数据搜寻时,用户可以极低音量先说出关键词。反应于侦测到关键词,无线麦克风装置100中操作于关键词检测模式的信号处理器120可切换为操作于话语收音模式而启动高功耗元件121。
接着,用户可以极低音量说出询问问题,此时,高功耗元件121已经被启用来对模拟声音信号进行音频处理而产生经处理数字音频数据。经处理数字音频数据可发送至终端装置200,致使终端装置200的语音助理可依据经处理数字音频数据进行语音识别并执行信息搜索。最后,终端装置200可将用户询问问题的回答回传至耳机300,并由耳机300播放回答给用户。在此情况下,用户可在不打扰他人或甚至是他人没有察觉的情况下使用语音助理来查询数据。
图6是依照本发明一实施例的无线麦克风装置的示意图。请参照图6,相较于图3实施例,于本实施例中,高功耗元件121可包括功率放大器121a、模拟数字转换器121b,以及数字信号处理器121c。功率放大器121a、模拟数字转换器121b,以及数字信号处理器121c用以根据麦克风模块110提供的模拟声音频来产生经处理数字音频数据。
相对于模拟取样电路122、模拟式存储器123,以及语音识别电路124,功率放大器121a、模拟数字转换器121b,以及数字信号处理器121c的操作需要消耗相对高的电力。然而,由于本发明实施例的功率放大器121a、模拟数字转换器121b,以及数字信号处理器121c可仅于话语收音模式中被启动,因而使得无线麦克风装置100的续航力可大幅提升。
综上所述,于本发明实施例中,在用户没有说出关键词的情况下,无线麦克风装置可维持操作于关键词检测模式,并利用功耗较低的模拟电路来侦测用户是否说出关键词。反应于用户说出关键词,无线麦克风装置才切换为操作于话语收音模式而启用高功耗元件。接着,无线麦克风装置可利用高功耗元件进行进行数字音频处理而产生经处理音频数据,接着将经处理音频数据发送给终端装置。基此,高功耗元件只会在需要时刻被启动而消耗电力,因而使得无线麦克风装置不会很快地将电池的电量使用完毕,从而大幅延长无线麦克风装置的续航力。藉此,与此无线麦克风装置搭配使用的语音助理程序的应用范围可更加不受到限制,用户可更随心所欲地使用语音助理。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (30)
1.一种语音助理系统,其特征在于,包括:
麦克风模块,适于配戴于用户上,并反应于所述用户的喉内发声而产生模拟声音信号;以及
信号处理器,操作于话语收音模式或关键词检测模式,其中所述信号处理器操作于所述话语收音模式的功耗高于所述信号处理器操作于所述关键词检测模式的功耗,
其中,当所述信号处理器操作于所述关键词检测模式,所述信号处理器根据所述模拟声音信号的多笔模拟取样电压进行关键词检测,
反应于在所述关键词检测模式中检测到关键词,所述信号处理器自所述关键词检测模式切换为所述话语收音模式。
2.根据权利要求1所述的语音助理系统,其特征在于,其中所述麦克风模块接触所述用户的肌肤并适于配戴于所述用户的喉咙上或耳后。
3.根据权利要求1所述的语音助理系统,其特征在于,其中所述喉内发声为旁人听不到的声波振福。
4.根据权利要求1所述的语音助理系统,其特征在于,其中所述信号处理器基于人工神经网络而根据所述模拟声音信号的多笔模拟取样电压进行所述关键词检测。
5.根据权利要求1所述的语音助理系统,其特征在于,其中所述信号处理器包括高功耗元件,所述信号处理器自所述关键词检测模式切换为所述话语收音模式而启动所述高功耗元件。
6.根据权利要求5所述的语音助理系统,其特征在于,其中反应于在所述关键词检测模式中未检测到所述关键词,所述信号处理器维持操作于所述关键词检测模式而禁能所述高功耗元件。
7.根据权利要求5所述的语音助理系统,其特征在于,其中在切换至所述话语收音模式之后,所述信号处理器利用所述高功耗元件对所述模拟声音信号进行音频处理而产生经处理数字音频数据。
8.根据权利要求5所述的语音助理系统,其特征在于,其中所述高功耗元件包括模拟数字转换器、数字信号处理器、功率放大器或其组合。
9.根据权利要求1所述的语音助理系统,其特征在于,还包括:
无线收发器,耦接所述信号处理器,与终端装置建立无线通讯连结,以将操作于所述话语收音模式中的所述信号处理器产生的经处理数字音频数据传输至所述终端装置。
10.根据权利要求1所述的语音助理系统,其特征在于,其中所述信号处理器包括:
语音识别电路,基于人工神经网络而对所述模拟取样电压进行特征撷取,以判断是否检测到所述关键词。
11.根据权利要求10所述的语音助理系统,其特征在于,其中所述信号处理器还包括:
模拟取样电路,耦接所述麦克风模块,取样所述模拟声音信号而产生多笔模拟取样电压;以及
模拟式存储器,耦接所述模拟取样电路,记录所述模拟取样电压。
12.根据权利要求11所述的语音助理系统,其特征在于,其中所述模拟式存储器包括电荷耦合装置存储器或相变存储器。
13.根据权利要求10所述的语音助理系统,其特征在于,其中所述语音识别电路基于所述人工神经网络判断所述模拟取样电压中的多笔第一取样电压是否符合所述关键词的第一音节,
其中,反应于基于所述人工神经网络判定所述模拟取样电压中的所述第一取样电压符合所述关键词的所述第一音节,所述语音识别电路基于所述人工神经网络判断所述模拟取样电压中的多笔第二取样电压是否符合所述关键词的第二音节。
14.根据权利要求13所述的语音助理系统,其特征在于,其中所述语音识别电路使用第一神经网络权重数据判断所述模拟取样电压中的所述第一取样电压是否符合所述关键词的所述第一音节,并使用第二神经网络权重数据判断所述模拟取样电压中的所述第二取样电压是否符合所述关键词的所述第二音节。
15.根据权利要求10所述的语音助理系统,其特征在于,其中当所述语音识别电路基于所述人工神经网络判定所述模拟取样电压依照特定顺序符合所述关键词的多个音节,所述语音识别电路判定检测到所述关键词。
16.一种语音助理系统,其特征在于,包括:
终端装置;
麦克风模块,适于配戴于用户上,并反应于所述用户的喉内发声而产生模拟声音信号;以及
信号处理器,操作于话语收音模式或关键词检测模式,其中所述信号处理器操作于所述话语收音模式的功耗高于所述信号处理器操作于所述关键词检测模式的功耗,
其中,当所述信号处理器操作于所述关键词检测模式,所述信号处理器根据所述模拟声音信号的多笔模拟取样电压进行关键词检测,
反应于在所述关键词检测模式中检测到关键词,所述信号处理器自所述关键词检测模式切换为所述话语收音模式,
在切换至所述话语收音模式之后,所述信号处理器对所述模拟声音信号进行音频处理而产生经处理数字音频数据,
其中,所述信号处理器将所述经处理数字音频数据提供给所述终端装置所运行的语音助理程序。
17.根据权利要求16所述的语音助理系统,其特征在于,其中所述麦克风模块接触所述用户的肌肤并适于配戴于所述用户的喉咙上或耳后。
18.根据权利要求16所述的语音助理系统,其特征在于,其中所述喉内发声为旁人听不到的声波振福。
19.根据权利要求16所述的语音助理系统,其特征在于,其中所述信号处理器基于人工神经网络而根据所述模拟声音信号的多笔模拟取样电压进行所述关键词检测。
20.根据权利要求16所述的语音助理系统,其特征在于,其中所述信号处理器包括高功耗元件,所述信号处理器自所述关键词检测模式切换为所述话语收音模式而启动所述高功耗元件。
21.根据权利要求20所述的语音助理系统,其特征在于,其中反应于在所述关键词检测模式中未检测到所述关键词,所述信号处理器维持操作于所述关键词检测模式而禁能所述高功耗元件。
22.根据权利要求20所述的语音助理系统,其特征在于,其中在切换至所述话语收音模式之后,所述信号处理器利用所述高功耗元件对所述模拟声音信号进行所述音频处理。
23.根据权利要求20所述的语音助理系统,其特征在于,其中所述高功耗元件包括模拟数字转换器、数字信号处理器、功率放大器或其组合。
24.根据权利要求16所述的语音助理系统,其特征在于,其中还包括无线收发器,所述无线收发器耦接所述信号处理器并与所述终端装置建立无线通讯连结,以将操作于所述话语收音模式中的所述信号处理器产生的经处理数字音频数据传输至所述终端装置。
25.根据权利要求16所述的语音助理系统,其特征在于,其中所述信号处理器包括:
语音识别电路,基于所述人工神经网络而对所述模拟取样电压进行特征撷取,以判断是否检测到所述关键词。
26.根据权利要求25所述的语音助理系统,其特征在于,其中所述信号处理器还包括:
模拟取样电路,耦接所述麦克风模块,取样所述模拟声音信号而产生多笔模拟取样电压;以及
模拟式存储器,耦接所述模拟取样电路,记录所述模拟取样电压。
27.根据权利要求26所述的语音助理系统,其特征在于,其中所述模拟式存储器包括电荷耦合装置存储器或相变存储器。
28.根据权利要求25所述的语音助理系统,其特征在于,其中所述语音识别电路基于所述人工神经网络判断所述模拟取样电压中的多笔第一取样电压是否符合所述关键词的第一音节,
其中,反应于基于所述人工神经网络判定所述模拟取样电压中的所述第一取样电压符合所述关键词的所述第一音节,所述语音识别电路基于所述人工神经网络判断所述模拟取样电压中的多笔第二取样电压是否符合所述关键词的第二音节。
29.根据权利要求28所述的语音助理系统,其特征在于,其中所述语音识别电路使用第一神经网络权重数据判断所述模拟取样电压中的所述第一取样电压是否符合所述关键词的所述第一音节,并使用第二神经网络权重数据判断所述模拟取样电压中的所述第二取样电压是否符合所述关键词的所述第二音节。
30.根据权利要求25所述的语音助理系统,其特征在于,其中当所述语音识别电路基于所述人工神经网络判定所述模拟取样电压依照特定顺序符合所述关键词的多个音节,所述语音识别电路判定检测到所述关键词。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163136653P | 2021-01-13 | 2021-01-13 | |
US63/136,653 | 2021-01-13 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113411723A true CN113411723A (zh) | 2021-09-17 |
Family
ID=77684315
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202121338219.4U Active CN216145422U (zh) | 2021-01-13 | 2021-06-16 | 语音助理系统 |
CN202110666598.8A Pending CN113411723A (zh) | 2021-01-13 | 2021-06-16 | 语音助理系统 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202121338219.4U Active CN216145422U (zh) | 2021-01-13 | 2021-06-16 | 语音助理系统 |
Country Status (3)
Country | Link |
---|---|
CN (2) | CN216145422U (zh) |
TW (2) | TWI790647B (zh) |
WO (1) | WO2022151651A1 (zh) |
Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201439896A (zh) * | 2013-04-10 | 2014-10-16 | Via Tech Inc | 語音操控方法與行動終端裝置 |
TWI464734B (zh) * | 2009-06-04 | 2014-12-11 | Qualcomm Inc | 用於在一語音訊框內避免資訊流失的系統與方法 |
US20140379347A1 (en) * | 2013-06-25 | 2014-12-25 | Keith Kintzley | System and method for efficient signal processing to identify and understand speech |
CN105430543A (zh) * | 2016-01-07 | 2016-03-23 | 歌尔声学股份有限公司 | 数字麦克风和电子设备 |
CN105723451A (zh) * | 2013-12-20 | 2016-06-29 | 英特尔公司 | 从低功率始终侦听模式到高功率语音识别模式的转换 |
CN105869655A (zh) * | 2015-02-06 | 2016-08-17 | 美商富迪科技股份有限公司 | 音频装置以及语音检测方法 |
US20170154620A1 (en) * | 2015-12-01 | 2017-06-01 | Knowles Electronics, Llc | Microphone assembly comprising a phoneme recognizer |
CN107231584A (zh) * | 2016-03-25 | 2017-10-03 | 美特科技(苏州)有限公司 | 一种麦克风装置 |
CN107360327A (zh) * | 2017-07-19 | 2017-11-17 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置和存储介质 |
TW201810253A (zh) * | 2016-06-20 | 2018-03-16 | 羅伯特博斯奇股份有限公司 | 用於致動感測器設備的裝置和方法 |
TW201928949A (zh) * | 2017-12-27 | 2019-07-16 | 美商英特爾智財公司 | 用於語音致能的電腦系統之動態註冊使用者定義的喚醒關鍵詞 |
CN110166879A (zh) * | 2019-06-28 | 2019-08-23 | 歌尔科技有限公司 | 语音采集控制方法、装置及tws耳机 |
TW201935464A (zh) * | 2018-02-12 | 2019-09-01 | 香港商阿里巴巴集團服務有限公司 | 基於記憶性瓶頸特徵的聲紋識別的方法及裝置 |
US20200090647A1 (en) * | 2018-09-14 | 2020-03-19 | Comcast Cable Communications, Llc | Keyword Detection In The Presence Of Media Output |
CN111105796A (zh) * | 2019-12-18 | 2020-05-05 | 杭州智芯科微电子科技有限公司 | 无线耳机控制装置及控制方法、语音控制设置方法和系统 |
CN111833888A (zh) * | 2020-07-24 | 2020-10-27 | 清华大学 | 一种语音关键词识别的近传感器处理系统、电路及方法 |
CN212113216U (zh) * | 2020-04-14 | 2020-12-08 | 邢台职业技术学院 | 一种可语音唤醒工作的计算机 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9838810B2 (en) * | 2012-02-27 | 2017-12-05 | Qualcomm Technologies International, Ltd. | Low power audio detection |
CN106611599A (zh) * | 2015-10-21 | 2017-05-03 | 展讯通信(上海)有限公司 | 基于人工神经网络的语音识别方法、装置及电子设备 |
TWI655624B (zh) * | 2017-08-03 | 2019-04-01 | 晨星半導體股份有限公司 | 聲控裝置及相關的聲音訊號處理方法 |
CN110070863A (zh) * | 2019-03-11 | 2019-07-30 | 华为技术有限公司 | 一种语音控制方法及装置 |
CN110049395B (zh) * | 2019-04-25 | 2020-06-05 | 维沃移动通信有限公司 | 耳机控制方法及耳机设备 |
CN110265036A (zh) * | 2019-06-06 | 2019-09-20 | 湖南国声声学科技股份有限公司 | 语音唤醒方法、系统、电子设备及计算机可读存储介质 |
-
2021
- 2021-06-16 TW TW110121835A patent/TWI790647B/zh active
- 2021-06-16 CN CN202121338219.4U patent/CN216145422U/zh active Active
- 2021-06-16 TW TW110206916U patent/TWM619473U/zh unknown
- 2021-06-16 WO PCT/CN2021/100355 patent/WO2022151651A1/zh active Application Filing
- 2021-06-16 CN CN202110666598.8A patent/CN113411723A/zh active Pending
Patent Citations (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI464734B (zh) * | 2009-06-04 | 2014-12-11 | Qualcomm Inc | 用於在一語音訊框內避免資訊流失的系統與方法 |
TW201439896A (zh) * | 2013-04-10 | 2014-10-16 | Via Tech Inc | 語音操控方法與行動終端裝置 |
US20140379347A1 (en) * | 2013-06-25 | 2014-12-25 | Keith Kintzley | System and method for efficient signal processing to identify and understand speech |
CN105723451A (zh) * | 2013-12-20 | 2016-06-29 | 英特尔公司 | 从低功率始终侦听模式到高功率语音识别模式的转换 |
CN105869655A (zh) * | 2015-02-06 | 2016-08-17 | 美商富迪科技股份有限公司 | 音频装置以及语音检测方法 |
US20170154620A1 (en) * | 2015-12-01 | 2017-06-01 | Knowles Electronics, Llc | Microphone assembly comprising a phoneme recognizer |
CN105430543A (zh) * | 2016-01-07 | 2016-03-23 | 歌尔声学股份有限公司 | 数字麦克风和电子设备 |
CN107231584A (zh) * | 2016-03-25 | 2017-10-03 | 美特科技(苏州)有限公司 | 一种麦克风装置 |
TW201810253A (zh) * | 2016-06-20 | 2018-03-16 | 羅伯特博斯奇股份有限公司 | 用於致動感測器設備的裝置和方法 |
CN107360327A (zh) * | 2017-07-19 | 2017-11-17 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置和存储介质 |
TW201928949A (zh) * | 2017-12-27 | 2019-07-16 | 美商英特爾智財公司 | 用於語音致能的電腦系統之動態註冊使用者定義的喚醒關鍵詞 |
TW201935464A (zh) * | 2018-02-12 | 2019-09-01 | 香港商阿里巴巴集團服務有限公司 | 基於記憶性瓶頸特徵的聲紋識別的方法及裝置 |
US20200090647A1 (en) * | 2018-09-14 | 2020-03-19 | Comcast Cable Communications, Llc | Keyword Detection In The Presence Of Media Output |
CN110166879A (zh) * | 2019-06-28 | 2019-08-23 | 歌尔科技有限公司 | 语音采集控制方法、装置及tws耳机 |
CN111105796A (zh) * | 2019-12-18 | 2020-05-05 | 杭州智芯科微电子科技有限公司 | 无线耳机控制装置及控制方法、语音控制设置方法和系统 |
CN212113216U (zh) * | 2020-04-14 | 2020-12-08 | 邢台职业技术学院 | 一种可语音唤醒工作的计算机 |
CN111833888A (zh) * | 2020-07-24 | 2020-10-27 | 清华大学 | 一种语音关键词识别的近传感器处理系统、电路及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN216145422U (zh) | 2022-03-29 |
WO2022151651A1 (zh) | 2022-07-21 |
TWM619473U (zh) | 2021-11-11 |
TWI790647B (zh) | 2023-01-21 |
TW202228007A (zh) | 2022-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11412333B2 (en) | Interactive system for hearing devices | |
CN104252860B (zh) | 语音识别 | |
US20200344555A1 (en) | A piezoelectric mems device for producing a signal indicative of detection of an acoustic stimulus | |
US10721661B2 (en) | Wireless device connection handover | |
EP2788978B1 (en) | Low power integrated circuit to analyze a digitized audio stream | |
TWI489372B (zh) | 語音操控方法與行動終端裝置 | |
CN107506353B (zh) | 翻译盒子和翻译系统 | |
KR20200027554A (ko) | 음성 인식 방법 및 장치, 그리고 저장 매체 | |
US10694437B2 (en) | Wireless device connection handover | |
US10104213B2 (en) | Information processing device | |
KR20160010606A (ko) | Vad 탐지 마이크로폰 및 그 마이크로폰을 동작시키는 방법 | |
JP2004511823A (ja) | 動的再構成可能音声認識システムとその方法 | |
US20130238340A1 (en) | Wearing State Based Device Operation | |
CN216145422U (zh) | 语音助理系统 | |
KR20200045851A (ko) | 음성 인식 서비스를 제공하는 전자 장치 및 시스템 | |
CN112256135A (zh) | 一种设备控制方法及装置、设备、存储介质 | |
CN114097212A (zh) | 支持语音的外部智能电池处理系统 | |
GB2600562A (en) | Hardware architecture for modularized eyewear systems apparatuses, and methods | |
CN111383632B (zh) | 电子设备 | |
WO2020117404A1 (en) | Wireless device connection handover | |
JP2004348382A (ja) | 携帯型電子装置およびその制御方法 | |
US11776538B1 (en) | Signal processing | |
CN117354623A (zh) | 拍照的控制方法、装置、电子设备及存储介质 | |
WO2020117403A1 (en) | Wireless device connection handover | |
JP2021093760A (ja) | 情報処理装置、携帯電話及びシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210917 |