CN101141508B - 通信系统以及语音识别方法 - Google Patents
通信系统以及语音识别方法 Download PDFInfo
- Publication number
- CN101141508B CN101141508B CN200710149769XA CN200710149769A CN101141508B CN 101141508 B CN101141508 B CN 101141508B CN 200710149769X A CN200710149769X A CN 200710149769XA CN 200710149769 A CN200710149769 A CN 200710149769A CN 101141508 B CN101141508 B CN 101141508B
- Authority
- CN
- China
- Prior art keywords
- mentioned
- controller
- voice
- keyword
- phonetic entry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
Abstract
一种通信系统和其方法。该通信系统包括设定控制器、语音识别控制器、以及应用控制器。该设定控制器,接收一语音关键词查询表,该语音关键词查询表包括语音识别关键词以及相对应的应用指令。该语音识别控制器,耦接上述设定控制器,接收上述设定控制器而来的上述语音关键词查询表,接收第一语音输入,以及比较上述第一语音输入和上述语音关键词查询表用以判定上述相对应的应用指令。该应用控制器,耦接上述语音识别控制器,接收以及执行上述相对应的应用指令。
Description
技术领域
本发明涉及语音识别,特别是涉及一种提供语音识别的通信系统和其方法。
背景技术
语音识别控制器是一种具有使用者提供的识别关键词能力并且产生相对应输出的装置,例如,指令或文字符串,用于一应用装置,例如,DVD或MP3播放器,移动电话、汽车收音机、以及汽车控制器。
语音识别控制器可以是用于移动电话的蓝牙喇叭扩音器,其在一通信系统内具有蓝牙功能,在该通信系统中语音控制器喇叭扩音器和移动电话是成对的。语音控制器上的语音识别引擎用来识别使用者定义的名单中的名字,并且输出相对应的电话号码。移动电话中的拨打功能将会拨打该号码,并且使用者可以经由移动电话的喇叭扩音器进行通话。
有鉴于此,需要一种使用语音识别控制器的通信系统,该语音识别控制器具有较佳的语音识别率。
发明内容
本发明提出一种通信系统,包括一设定控制器、一语音识别控制器、以及一应用控制器。该设定控制器,接收一语音关键词查询表(Voice KeywordTable,VKT),该语音关键词查询表包括一语音识别关键词以及一相对应的应用指令。该语音识别控制器,耦接上述设定控制器,接收上述设定控制器而来的上述语音关键词查询表,接收第一语音输入,以及比较上述第一语音输入和上述语音关键词查询表用以判定上述相对应的应用指令。该应用控制器,耦接上述语音识别控制器,接收以及执行上述相对应的应用指令。
本发明另提出一种语音识别方法,用于一通信系统,包括一设定控制器接收一语音关键词查询表,该语音关键词查询表包括一语音识别关键词以及一相对应的应用指令,一语音识别控制器接收上述语音关键词查询表,以及比较一第一语音输入和上述语音关键词查询表用以判定上述相对应的应用指令,以及一应用控制器接收以及执行上述相对应的应用指令。
附图说明
图1是显示根据本发明实施例所述的通信系统的方块图。
图2a、2b和2c是显示根据本发明实施例所述的语音关键词查询表。
第3图是显示根据本发明实施例所述的语音合成以及语音识别方法。
第4图是显示根据本发明实施例所述的语音识别装置的方块图。
第5图是显示根据本发明实施例所述的语音识别方法的流程图。
附图符号说明
10-设定控制器;
12-语音识别控制器;
14-应用控制器;
120-第一收发器;
121-第二收发器;
122-声音输入装置;
123-声音输出装置;
124-模拟/数字转换器;
125-内存;
126-系统控制器;
127-语音识别控制器。
具体实施方式
为让本发明的上述和其它目的、特征、和优点能更明显易懂,下文特举出较佳实施例,并配合附图,作详细说明如下:
图1是显示根据本发明实施例所述的通信系统的方块图,包括设定控制器10、语音识别控制器12、和应用控制器14。设定控制器10耦接语音识别控制器12、然后耦接应用控制器14。
设定控制器10可以为个人计算机或个人数字助理(Personal DigitalAssistant,PDA)。设定控制器10包括语音识别关键词VKT 100,其包括语音识别关键词以及相对应的应用指令。语音识别关键词VKT 100可以包括至少一组语音关键词Vi和应用指令Ai对。语音识别方法利用从所有的语音关键词Vi中搜寻输入语音数据而执行。语音识别方法通常由3种种类分类,分为不特定语者模型(Speaker Independent,SI)、特定语者模型(SpeakerDependent,SD)、和语者调适模型(Speaker Adapted,SA)。在不特定语者模型系统中,语音识别引擎藉由普遍的语音模型来识别特征,该普遍的语音模型由大量的训练取样产生。其中一种使用不特定语者模型的商用软件为微软语音识别软件(Microsoft Speech Recognizer)。因为不需训练过的使用者就可使用,所以这种系统非常方便。然而,这种系统的识别率通常较差,特别是当说话者的口音严重或说话者的说话模式和训练取样差异过大时。另一方面,特定语者模型系统需要使用者对每个关键词提供取样,因此对于产生大量关键词不但麻烦且非常需要内存。语音识别关键词VKT 100可以由像是键盘或按键的输入来编辑,或由经建立的数据库,例如Outlook、Skype、MSN、或Yahoo Messager的电话簿输入。
图2a是显示根据本发明实施例所述的语音关键词查询表,使用于图1的通信系统,包括20a、22a、24a、和26a。20a包含使用者输入的名字标签L1、L2、...、Li、...、和Ln。每个LI都可以藉由设定控制器10内的不特定语者模型的文字到声音(Text-to-Speech)语音合成算法转换到标准语音关键词VDI。标准语音关键词是和输入语音数据流一起比较的语音识别关键词。24的实现不需是看的见的。设定控制器10包括用于语音输入的麦克风。使用者可以另外在改变语音栏22内输入相对应的改变语音关键词VA1到VAn。改变语音关键词Kai可以针对每个发音参数调整。当识别到设定控制器10内的标准语音关键词VDI或改变语音关键词VA1时26即提供应用指令API用以执行。
参考图1,语音识别控制器12从10接收语音识别关键词VKT 100,并且接收V用以执行第一层语音识别,即,从第一收发器120内的语音识别关键词中搜寻第一语音输入V1,藉此判定相对应的应用指令。在第一收发器120内找到语音关键词Vi之后,语音识别控制器12传送应用指令到应用控制器14以便执行。语音识别控制器12可以是一轻便可携的装置,例如耳机、喇叭、或具有语音识别功能的耳机。应用控制器14可以是移动电话、DVD播放器、MP 3播放器、汽车音响、汽车控制器、或任意消费电子产品。
如果没有在语音识别查询表内找到第一语音输入,语音识别控制器12就会传送第一语音输入V1到应用控制器14。应用控制器14另外执行第二层语音识别,即,根据第一语音输入V1判定应用指令,以及传送第一语音输入V1和其相对应的应用指令给语音识别控制器12。第二层语音识别可以由应用控制器14的本地的语音关键词查询表实现,该本地的语音关键词查询表包括其它的语音关键词和相对应的应用指令,使得第一语音输入V1可以符合其中一个语音关键词,藉此找到和执行A1。应用控制器14接着执行A1。第二层语音识别可以识别比语音识别控制器12的第一层语音识别更多的语音关键词。应用控制器14可以更将第一语音输入V1和相对应的应用指令Ai传送给语音识别控制器12,使得语音识别控制器12也可以识别第一语音输入V1,藉此改进语音识别率。
设定控制器10、语音识别控制器12、和应用控制器14经由有线或无线的通信方式沟通。无线的通信方式可以是蓝牙(Bluetooth)、无线局域网络(Wireless LAN)、WiFi、或其它通信方式。
设定控制器10包括自我诊断功能,接收V2用以和第一收发器120内的语音识别关键词做比较,以及若V2符合语音识别关键词则确认该语音识别关键词,允许使用者改变设定控制器10内的该语音识别关键词。
语音关键词查询表VKT可以是电话簿,语音识别关键词是名字输入的发音,而相对应的应用指令是拨打一预定号码。图2b显示图1中的语音关键词查询表VKT。20b包括使用者定义的名字输入,例如,“Brian Smith”或“家”。24b包括机器产生的音素数据,包括从名字输入经由文字到音素算法而产生的音素串,以及相对应的产生语音的不特定语者模型,该不特定语者模型用于语音识别和语音合成。22b包括使用者定义的音素数据,可能和24b的音素数据不同,他提供使用者另外在24b定义个人化数据的选择,用以加强语音识别效能和系统的实时语音品质。相对应的应用指令是文字符串,例如拨打26b内的电话号码。
语音关键词查询表VKT可以是语音指令查询表,语音识别关键词是语音指令的发音,而相对应的应用指令是内建指令或使用者定义的指令。图2c显示图1中的语音关键词查询表VKT。20c存储指令卷标,例如,“家”、“语音留言”、“快速键[1-9]”、“内存[1-9]”、或“设定选单”。24c包括标准的音素数据,22c包括使用者定义、可以改变的音素资料。对应到“家”的标准的音素数据和可以改变的音素资料对到拨打家中电话的应用指令,“语音留言”对应到拨打语音留言的号码,“快速键[1-9]”对应到拨打对应快速键[1-9]的号码、“内存[1-9]”对应到拨打内存[1-9]之内的号码、或“设定选单”对应到进入设定选单。
图3是显示根据本发明实施例所述的语音合成以及语音识别方法,使用第2图的语音关键词查询表VKT和图1的设定控制器。方法利用语音合成实时输出和语音识别模型共享相同的音素来改善语音识别率。设定控制器10会产生合适的发音音素,使用者能够在语音合成实时输出的引导下根据他的习惯发音而编辑发音音素。一旦确定了发音音素,系统会更产生用于识别的语音识别模型。因此可以藉由使用者的习惯而提高语音识别率。第3图的方法在语音合成和语音识别方法中使用共同的音素串,使得设定控制器可以产生语音关键词查询表VKT,该语音关键词查询表VKT可以藉由使用者的发音喜好改变因此加强识别率。虚线以上的步骤提供语音合成的方法,以下的步骤提供语音识别模型产生的方法。
在步骤S310中,设定控制器10从S300接收图2a20a的文字符串,例如,“Home”,并且从所有的语言的音素中(S302)产生发音音素给“Home”(S312)。文字到音素算法S310可以利用搜寻发音字典或应用发音产生规则来产生字典外的文字符串。
在步骤S320中,语音合成模块根据音素串(S322)产生语音波形(S322)。
在步骤S330中,设定控制器10接收音素(S312)用以根据完整的内建不特定语者模型(S332)产生语音数据。例如,系统控制器126(见第4图)根据S312得到S322的“h”“o”“m”“e”模型用以产生相对应的语音识别模型。
图4是显示根据本发明实施例所述的语音识别装置的方块图,包括第一收发器120、第二收发器121、声音输入装置122、声音输出装置123、模拟/数字转换器124、内存125、系统控制器126、和语音识别控制器127。
第一收发器120从设定控制器10下载语音识别关键词VKT 100用以存储在内存125。第二收发器121传送相对应的应用指令Ai,以及从应用控制器14接收请求的语音识别关键词Vi和相对应的应用指令Ai,并且接着将请求的语音识别关键词Vi和相对应的应用指令Ai加入第一收发器120。声音输入装置122可以是接收第一语音输入V1的麦克风。声音输出装置123可以是播放声音数据的扩音器。模拟/数字转换器124将语音关键词Vi从模拟转换到数字。内存125存储第一收发器120、内建的语音模型和参数以及第一语音输入V1。系统控制器126(语音识别模块)将第一语音输入V1和语音关键词查询表VKT内的语音关键词Vi比较用以判定相对应的应用指令Ai。
图5是显示根据本发明实施例所述的语音识别方法的流程图,使用图4的语音识别控制器。
在步骤S500中,第一语音输入V1的信号在时域中被抑制用来提供好的信号品质。
在步骤S502中,第一语音输入V1转换到频域来进一步减低噪声以及抽取其中的特定模型。
在步骤S504中,系统控制器126使用第一语音输入V1、不特定语者模型、和特定语者模型来搜寻语音关键词查询表VKT内的语音识别关键词。
在步骤S506中,系统控制器126对1执行后处理,例如,执行相对应的应用指令、第一层的退回、或语音识别织成功率的产生。如果系统控制器126判定第一语音输入V1符合语音关键词查询表VKT内的语音识别关键词,就传送相对应的应用指令到应用控制器14执移动作。如果没有,系统控制器126传送第一语音输入V1到应用控制器14来执行第二层语音识别。系统控制器126可以建立一种根据第一层语音识别的成功率的给分系统。
本发明虽以较佳实施例揭露如上,然其并非用以限定本发明的范围,任何熟习此项技艺者,在不脱离本发明的精神和范围内,当可做些许的更动与润饰,因此本发明的保护范围当视本发明的申请专利范围所界定者为准。
Claims (19)
1.一种通信系统,包括:
设定控制器,接收一语音关键词查询表,该语音关键词查询表包括一语音识别关键词以及一相对应的应用指令;该语音识别关键词包括标签、标准语音关键词、以及改变语音关键词;该标准语音关键词包括音素串、以及不特定语者模型;该改变语音关键词包括使用者定义的音素数据,用以对发音参数进行调整;该设定控制器通过该不特定语者模型进行语音合成,将该标签转换而产生该音素串;
语音识别控制器,耦接上述设定控制器,接收上述设定控制器而来的上述语音关键词查询表,接收第一语音输入,以及比较上述第一语音输入和上述语音关键词查询表用以判定上述相对应的应用指令;以及
应用控制器,耦接上述语音识别控制器,接收以及执行上述相对应的应用指令。
2.如权利要求1所述的通信系统,其中,上述设定控制器、上述语音识别控制器、以及上述应用控制器经由有线或无线通信沟通。
3.如权利要求1所述的通信系统,其中,上述设定控制器更在语音合成和语音识别模型间共享音素,以及根据上述音素产生发音。
4.如权利要求1所述的通信系统,其中,上述语音识别控制器更传送上述第一语音输入到上述应用控制器,如果上述第一语音输入和上述语音关键词查询表内所有的语音关键词都不符。
5.如权利要求4所述的通信系统,其中,上述应用控制器更根据上述第一语音输入判定相对应的应用指令,以及传送上述第一语音输入和上述应用控制器根据上述第一语音输入判定所得的相对应的应用指令到上述语音识别控制器。
6.如权利要求1所述的通信系统,其中,上述语音关键词查询表是电话簿,上述语音识别关键词是名字输入的发音,上述相对应的应用指令是拨打一预定号码。
7.如权利要求1所述的通信系统,其中,上述语音识别关键词是指令输入的发音,上述相对应的应用指令是控制或接收信息。
8.如权利要求1所述的通信系统,其中,上述语音识别关键词是数字输入的发音,上述相对应的应用指令是拨打上述数字输入。
9.如权利要求1所述的通信系统,其中,上述设定控制器更接收第二语音输入,如果上述第二语音输入和上述语音关键词符合,则上述设定控制器更让使用者改变上述语音识别关键词。
10.如权利要求1所述的通信系统,其中,上述语音识别控制器包括:
第一收发器,从上述设定控制器下载上述语音关键词查询表;
第二收发器,传送上述相对应应用指令到上述应用控制器;
声音输入装置,接收上述语音输入;
模拟/数字转换器,耦接上述声音输入装置,转换上述语音输入到数字;
内存,耦接上述第一和第二收发器,存储上述语音关键词查询表;以及
语音识别模块,耦接上述模拟/数字转换器和上述内存,比较上述第一语音输入和上述语音识别关键词用以判定上述相对应的应用指令。
11.一种语音识别方法,用于一通信系统,包括:
设定控制器接收一语音关键词查询表,该语音关键词查询表包括一语音识别关键词以及一相对应的应用指令;
语音识别控制器从上述设定控制器接收上述语音关键词查询表,以及比较一第一语音输入和上述语音关键词查询表用以判定上述相对应的应用指令;以及
应用控制器从上述语音识别控制器接收以及执行上述相对应的应用指令,
其中,该语音识别关键词包括标签、标准语音关键词、以及改变语音关键词;该标准语音关键词包括音素串、以及不特定语者模型;该改变语音关键词包括使用者定义的音素数据,用以对发音参数进行调整;该设定控制器通过该不特定语者模型进行语音合成,将该标签转换而产生该音素串。
12.如权利要求11所述的语音识别方法,其中,上述设定控制器、上述语音识别控制器、以及上述应用控制器经由有线或无线通信沟通。
13.如权利要求11所述的语音识别方法,更包括:上述设定控制器在语音合成和语音识别模型间共享音素,以及根据上述音素产生发音。
14.如权利要求11所述的语音识别方法,更包括:上述语音识别控制器传送上述第一语音输入到上述应用控制器,如果上述第一语音输入和上述语音关键词查询表内所有的语音关键词都不符。
15.如权利要求14所述的语音识别方法,更包括:上述应用控制器根据上述第一语音输入判定相对应的应用指令,以及传送上述第一语音输入和上述应用控制器根据上述第一语音输入判定所得的相对应的应用指令到上述语音识别控制器。
16.如权利要求11所述的语音识别方法,其中,上述语音关键词查询表是电话簿,上述语音识别关键词是名字输入的发音,上述相对应的应用指令是拨打一预定号码。
17.如权利要求11所述的语音识别方法,其中,上述语音识别关键词是指令输入的发音,上述相对应的应用指令是控制或接收信息。
18.如权利要求11所述的语音识别方法,其中,上述语音识别关键词是数字输入的发音,上述相对应的应用指令是拨打上述数字输入。
19.如权利要求11所述的语音识别方法,更包括:上述设定控制器接收第二语音输入,如果上述第二语音输入和上述语音关键词符合,则上述设定控制器更让使用者改变上述语音识别关键词。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US84269306P | 2006-09-05 | 2006-09-05 | |
US60/842,693 | 2006-09-05 | ||
US11/672,472 US7957972B2 (en) | 2006-09-05 | 2007-02-07 | Voice recognition system and method thereof |
US11/672,472 | 2007-02-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101141508A CN101141508A (zh) | 2008-03-12 |
CN101141508B true CN101141508B (zh) | 2012-02-22 |
Family
ID=39153041
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200710149769XA Expired - Fee Related CN101141508B (zh) | 2006-09-05 | 2007-09-05 | 通信系统以及语音识别方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7957972B2 (zh) |
CN (1) | CN101141508B (zh) |
TW (1) | TWI349267B (zh) |
Families Citing this family (51)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8260618B2 (en) * | 2006-12-21 | 2012-09-04 | Nuance Communications, Inc. | Method and apparatus for remote control of devices through a wireless headset using voice activation |
JP2009244639A (ja) * | 2008-03-31 | 2009-10-22 | Sanyo Electric Co Ltd | 発話装置、発話制御プログラムおよび発話制御方法 |
KR20090107365A (ko) * | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
CH702399B1 (fr) * | 2009-12-02 | 2018-05-15 | Veovox Sa | Appareil et procédé pour la saisie et le traitement de la voix. |
JP5533042B2 (ja) * | 2010-03-04 | 2014-06-25 | 富士通株式会社 | 音声検索装置、音声検索方法、プログラム及び記録媒体 |
US9847083B2 (en) * | 2011-11-17 | 2017-12-19 | Universal Electronics Inc. | System and method for voice actuated configuration of a controlling device |
US8756060B2 (en) | 2011-12-22 | 2014-06-17 | Ncr Corporation | Methods and apparatus for audio input for customization of digital displays |
TWI574254B (zh) * | 2012-01-20 | 2017-03-11 | 華碩電腦股份有限公司 | 用於電子系統的語音合成方法及裝置 |
US8468023B1 (en) * | 2012-10-01 | 2013-06-18 | Google Inc. | Handsfree device with countinuous keyword recognition |
KR102091003B1 (ko) * | 2012-12-10 | 2020-03-19 | 삼성전자 주식회사 | 음성인식 기술을 이용한 상황 인식 서비스 제공 방법 및 장치 |
US9467785B2 (en) | 2013-03-28 | 2016-10-11 | Knowles Electronics, Llc | MEMS apparatus with increased back volume |
US9503814B2 (en) | 2013-04-10 | 2016-11-22 | Knowles Electronics, Llc | Differential outputs in multiple motor MEMS devices |
US9633655B1 (en) | 2013-05-23 | 2017-04-25 | Knowles Electronics, Llc | Voice sensing and keyword analysis |
US10020008B2 (en) | 2013-05-23 | 2018-07-10 | Knowles Electronics, Llc | Microphone and corresponding digital interface |
US20180317019A1 (en) | 2013-05-23 | 2018-11-01 | Knowles Electronics, Llc | Acoustic activity detecting microphone |
US10028054B2 (en) | 2013-10-21 | 2018-07-17 | Knowles Electronics, Llc | Apparatus and method for frequency detection |
EP3575924B1 (en) | 2013-05-23 | 2022-10-19 | Knowles Electronics, LLC | Vad detection microphone |
US9711166B2 (en) | 2013-05-23 | 2017-07-18 | Knowles Electronics, Llc | Decimation synchronization in a microphone |
US9386370B2 (en) | 2013-09-04 | 2016-07-05 | Knowles Electronics, Llc | Slew rate control apparatus for digital microphones |
US10885918B2 (en) * | 2013-09-19 | 2021-01-05 | Microsoft Technology Licensing, Llc | Speech recognition using phoneme matching |
US9502028B2 (en) | 2013-10-18 | 2016-11-22 | Knowles Electronics, Llc | Acoustic activity detection apparatus and method |
US9147397B2 (en) | 2013-10-29 | 2015-09-29 | Knowles Electronics, Llc | VAD detection apparatus and method of operating the same |
CN104660792A (zh) * | 2013-11-21 | 2015-05-27 | 腾讯科技(深圳)有限公司 | 唤醒应用的方法及装置 |
US9601108B2 (en) | 2014-01-17 | 2017-03-21 | Microsoft Technology Licensing, Llc | Incorporating an exogenous large-vocabulary model into rule-based speech recognition |
US10749989B2 (en) | 2014-04-01 | 2020-08-18 | Microsoft Technology Licensing Llc | Hybrid client/server architecture for parallel processing |
US9831844B2 (en) | 2014-09-19 | 2017-11-28 | Knowles Electronics, Llc | Digital microphone with adjustable gain control |
US10002543B2 (en) * | 2014-11-04 | 2018-06-19 | Knotbird LLC | System and methods for transforming language into interactive elements |
US9712915B2 (en) | 2014-11-25 | 2017-07-18 | Knowles Electronics, Llc | Reference microphone for non-linear and time variant echo cancellation |
CN107112012B (zh) | 2015-01-07 | 2020-11-20 | 美商楼氏电子有限公司 | 用于音频处理的方法和系统及计算机可读存储介质 |
US9830080B2 (en) | 2015-01-21 | 2017-11-28 | Knowles Electronics, Llc | Low power voice trigger for acoustic apparatus and method |
US10121472B2 (en) | 2015-02-13 | 2018-11-06 | Knowles Electronics, Llc | Audio buffer catch-up apparatus and method with two microphones |
US9866938B2 (en) | 2015-02-19 | 2018-01-09 | Knowles Electronics, Llc | Interface for microphone-to-microphone communications |
CN107534818B (zh) | 2015-05-14 | 2020-06-23 | 美商楼氏电子有限公司 | 麦克风 |
US10291973B2 (en) | 2015-05-14 | 2019-05-14 | Knowles Electronics, Llc | Sensor device with ingress protection |
US9478234B1 (en) | 2015-07-13 | 2016-10-25 | Knowles Electronics, Llc | Microphone apparatus and method with catch-up buffer |
US10045104B2 (en) | 2015-08-24 | 2018-08-07 | Knowles Electronics, Llc | Audio calibration using a microphone |
FR3045909B1 (fr) * | 2015-12-17 | 2017-12-29 | Delta Dore | Procede et dispositif d'analyse et de repartition de commandes vocales |
US9894437B2 (en) | 2016-02-09 | 2018-02-13 | Knowles Electronics, Llc | Microphone assembly with pulse density modulated signal |
CN105913841B (zh) * | 2016-06-30 | 2020-04-03 | 北京小米移动软件有限公司 | 语音识别方法、装置及终端 |
US10499150B2 (en) | 2016-07-05 | 2019-12-03 | Knowles Electronics, Llc | Microphone assembly with digital feedback loop |
US10257616B2 (en) | 2016-07-22 | 2019-04-09 | Knowles Electronics, Llc | Digital microphone assembly with improved frequency response and noise characteristics |
CN106250474B (zh) * | 2016-07-29 | 2020-06-23 | Tcl科技集团股份有限公司 | 一种语音控制的处理方法及系统 |
WO2018081278A1 (en) | 2016-10-28 | 2018-05-03 | Knowles Electronics, Llc | Transducer assemblies and methods |
WO2018126151A1 (en) | 2016-12-30 | 2018-07-05 | Knowles Electronics, Llc | Microphone assembly with authentication |
JP6875905B2 (ja) * | 2017-03-29 | 2021-05-26 | 株式会社日立情報通信エンジニアリング | 通話制御システム及び通話制御方法 |
US11025356B2 (en) | 2017-09-08 | 2021-06-01 | Knowles Electronics, Llc | Clock synchronization in a master-slave communication system |
US11061642B2 (en) | 2017-09-29 | 2021-07-13 | Knowles Electronics, Llc | Multi-core audio processor with flexible memory allocation |
US11438682B2 (en) | 2018-09-11 | 2022-09-06 | Knowles Electronics, Llc | Digital microphone with reduced processing noise |
US11094327B2 (en) * | 2018-09-28 | 2021-08-17 | Lenovo (Singapore) Pte. Ltd. | Audible input transcription |
US10908880B2 (en) | 2018-10-19 | 2021-02-02 | Knowles Electronics, Llc | Audio signal circuit with in-place bit-reversal |
US11282500B2 (en) * | 2019-07-19 | 2022-03-22 | Cisco Technology, Inc. | Generating and training new wake words |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1391210A (zh) * | 2001-05-11 | 2003-01-15 | 皇家菲利浦电子有限公司 | 用于一种语言识别设备的训练或适配方法 |
CN1746970A (zh) * | 2004-09-10 | 2006-03-15 | 乐金电子(惠州)有限公司 | 移动通讯终端机的语音识别方法 |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4870686A (en) * | 1987-10-19 | 1989-09-26 | Motorola, Inc. | Method for entering digit sequences by voice command |
JP2989211B2 (ja) * | 1990-03-26 | 1999-12-13 | 株式会社リコー | 音声認識装置における辞書制御方式 |
JPH0535293A (ja) * | 1991-08-01 | 1993-02-12 | Fujitsu Ltd | 音声認識装置における認識候補数設定方式 |
CA2209948C (en) * | 1995-11-17 | 2000-12-26 | At&T Corp. | Automatic vocabulary generation for telecommunications network-based voice-dialing |
US5715369A (en) * | 1995-11-27 | 1998-02-03 | Microsoft Corporation | Single processor programmable speech recognition test system |
US5835570A (en) * | 1996-06-26 | 1998-11-10 | At&T Corp | Voice-directed telephone directory with voice access to directory assistance |
US5933775A (en) * | 1996-12-16 | 1999-08-03 | Ncr Corporation | Mechanism for providing wireless audio and control channels for personal computer interactive phone (PCIP) system |
US6078568A (en) * | 1997-02-25 | 2000-06-20 | Telefonaktiebolaget Lm Ericsson | Multiple access communication network with dynamic access control |
GB2323693B (en) * | 1997-03-27 | 2001-09-26 | Forum Technology Ltd | Speech to text conversion |
US5974382A (en) * | 1997-10-29 | 1999-10-26 | International Business Machines Corporation | Configuring an audio interface with background noise and speech |
JP3507686B2 (ja) * | 1998-01-16 | 2004-03-15 | 日本電気株式会社 | 音声認識機能を有する通信装置及び通信方法 |
FI981127A (fi) * | 1998-05-20 | 1999-11-21 | Nokia Mobile Phones Ltd | Ääniohjausmenetelmä ja äänellä ohjattava laite |
JP2001051694A (ja) | 1999-08-10 | 2001-02-23 | Fujitsu Ten Ltd | 音声認識装置 |
US7590538B2 (en) * | 1999-08-31 | 2009-09-15 | Accenture Llp | Voice recognition system for navigating on the internet |
JP2002283259A (ja) * | 2001-03-27 | 2002-10-03 | Sony Corp | ロボット装置のための動作教示装置及び動作教示方法、並びに記憶媒体 |
JP2003319070A (ja) | 2002-04-24 | 2003-11-07 | Nippon Telegr & Teleph Corp <Ntt> | 音声応答方法及び装置 |
US7328157B1 (en) * | 2003-01-24 | 2008-02-05 | Microsoft Corporation | Domain adaptation for TTS systems |
US8880047B2 (en) * | 2005-08-03 | 2014-11-04 | Jeffrey C. Konicek | Realtime, location-based cell phone enhancements, uses, and applications |
US7594082B1 (en) * | 2006-03-07 | 2009-09-22 | Emc Corporation | Resolving retention policy conflicts |
US7676363B2 (en) * | 2006-06-29 | 2010-03-09 | General Motors Llc | Automated speech recognition using normalized in-vehicle speech |
US7689417B2 (en) * | 2006-09-04 | 2010-03-30 | Fortemedia, Inc. | Method, system and apparatus for improved voice recognition |
US8880402B2 (en) * | 2006-10-28 | 2014-11-04 | General Motors Llc | Automatically adapting user guidance in automated speech recognition |
-
2007
- 2007-02-07 US US11/672,472 patent/US7957972B2/en active Active
- 2007-09-04 TW TW096132860A patent/TWI349267B/zh not_active IP Right Cessation
- 2007-09-05 CN CN200710149769XA patent/CN101141508B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1391210A (zh) * | 2001-05-11 | 2003-01-15 | 皇家菲利浦电子有限公司 | 用于一种语言识别设备的训练或适配方法 |
CN1746970A (zh) * | 2004-09-10 | 2006-03-15 | 乐金电子(惠州)有限公司 | 移动通讯终端机的语音识别方法 |
Also Published As
Publication number | Publication date |
---|---|
US20080059193A1 (en) | 2008-03-06 |
CN101141508A (zh) | 2008-03-12 |
TWI349267B (en) | 2011-09-21 |
TW200813980A (en) | 2008-03-16 |
US7957972B2 (en) | 2011-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101141508B (zh) | 通信系统以及语音识别方法 | |
CN104168353B (zh) | 蓝牙耳机及其语音交互控制方法 | |
TWI281146B (en) | Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition | |
US9202465B2 (en) | Speech recognition dependent on text message content | |
US9570066B2 (en) | Sender-responsive text-to-speech processing | |
CN111261144B (zh) | 一种语音识别的方法、装置、终端以及存储介质 | |
CN107895578A (zh) | 语音交互方法和装置 | |
CN106816149A (zh) | 车辆自动语音识别系统的优先化内容加载 | |
CN107819929A (zh) | 优选表情符号的识别和生成 | |
CN108242236A (zh) | 对话处理装置及其车辆和对话处理方法 | |
CN103095911A (zh) | 一种通过语音唤醒寻找手机的方法及系统 | |
JP2007525897A (ja) | マルチモーダル埋め込み型インタフェースの交換可能なカスタマイズ用の方法及び装置 | |
US9997155B2 (en) | Adapting a speech system to user pronunciation | |
CN110827826B (zh) | 语音转换文字方法、电子设备 | |
CN1381831A (zh) | 与扬声器无关的语音识别装置 | |
US10008205B2 (en) | In-vehicle nametag choice using speech recognition | |
US11676571B2 (en) | Synthesized speech generation | |
US10866948B2 (en) | Address book management apparatus using speech recognition, vehicle, system and method thereof | |
KR20230118089A (ko) | 사용자 스피치 프로파일 관리 | |
US20120197643A1 (en) | Mapping obstruent speech energy to lower frequencies | |
CN101320561A (zh) | 提升个人语音识别率的方法及模块 | |
CN102542705A (zh) | 语音提醒的方法和系统 | |
KR100380829B1 (ko) | 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체 | |
JP2000338991A (ja) | 認識率信頼性表示機能付き音声操作電話装置及びその音声認識方法 | |
JP2003177788A (ja) | 音声対話システムおよびその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120222 Termination date: 20210905 |