CN101141508B - 通信系统以及语音识别方法 - Google Patents

通信系统以及语音识别方法 Download PDF

Info

Publication number
CN101141508B
CN101141508B CN200710149769XA CN200710149769A CN101141508B CN 101141508 B CN101141508 B CN 101141508B CN 200710149769X A CN200710149769X A CN 200710149769XA CN 200710149769 A CN200710149769 A CN 200710149769A CN 101141508 B CN101141508 B CN 101141508B
Authority
CN
China
Prior art keywords
mentioned
controller
voice
keyword
phonetic entry
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200710149769XA
Other languages
English (en)
Other versions
CN101141508A (zh
Inventor
黄炎松
白博仁
鲁又南
侯震
张铭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fortemedia Inc
Original Assignee
Fortemedia Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fortemedia Inc filed Critical Fortemedia Inc
Publication of CN101141508A publication Critical patent/CN101141508A/zh
Application granted granted Critical
Publication of CN101141508B publication Critical patent/CN101141508B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Abstract

一种通信系统和其方法。该通信系统包括设定控制器、语音识别控制器、以及应用控制器。该设定控制器,接收一语音关键词查询表,该语音关键词查询表包括语音识别关键词以及相对应的应用指令。该语音识别控制器,耦接上述设定控制器,接收上述设定控制器而来的上述语音关键词查询表,接收第一语音输入,以及比较上述第一语音输入和上述语音关键词查询表用以判定上述相对应的应用指令。该应用控制器,耦接上述语音识别控制器,接收以及执行上述相对应的应用指令。

Description

通信系统以及语音识别方法
技术领域
本发明涉及语音识别,特别是涉及一种提供语音识别的通信系统和其方法。
背景技术
语音识别控制器是一种具有使用者提供的识别关键词能力并且产生相对应输出的装置,例如,指令或文字符串,用于一应用装置,例如,DVD或MP3播放器,移动电话、汽车收音机、以及汽车控制器。
语音识别控制器可以是用于移动电话的蓝牙喇叭扩音器,其在一通信系统内具有蓝牙功能,在该通信系统中语音控制器喇叭扩音器和移动电话是成对的。语音控制器上的语音识别引擎用来识别使用者定义的名单中的名字,并且输出相对应的电话号码。移动电话中的拨打功能将会拨打该号码,并且使用者可以经由移动电话的喇叭扩音器进行通话。
有鉴于此,需要一种使用语音识别控制器的通信系统,该语音识别控制器具有较佳的语音识别率。
发明内容
本发明提出一种通信系统,包括一设定控制器、一语音识别控制器、以及一应用控制器。该设定控制器,接收一语音关键词查询表(Voice KeywordTable,VKT),该语音关键词查询表包括一语音识别关键词以及一相对应的应用指令。该语音识别控制器,耦接上述设定控制器,接收上述设定控制器而来的上述语音关键词查询表,接收第一语音输入,以及比较上述第一语音输入和上述语音关键词查询表用以判定上述相对应的应用指令。该应用控制器,耦接上述语音识别控制器,接收以及执行上述相对应的应用指令。
本发明另提出一种语音识别方法,用于一通信系统,包括一设定控制器接收一语音关键词查询表,该语音关键词查询表包括一语音识别关键词以及一相对应的应用指令,一语音识别控制器接收上述语音关键词查询表,以及比较一第一语音输入和上述语音关键词查询表用以判定上述相对应的应用指令,以及一应用控制器接收以及执行上述相对应的应用指令。
附图说明
图1是显示根据本发明实施例所述的通信系统的方块图。
图2a、2b和2c是显示根据本发明实施例所述的语音关键词查询表。
第3图是显示根据本发明实施例所述的语音合成以及语音识别方法。
第4图是显示根据本发明实施例所述的语音识别装置的方块图。
第5图是显示根据本发明实施例所述的语音识别方法的流程图。
附图符号说明
10-设定控制器;
12-语音识别控制器;
14-应用控制器;
120-第一收发器;
121-第二收发器;
122-声音输入装置;
123-声音输出装置;
124-模拟/数字转换器;
125-内存;
126-系统控制器;
127-语音识别控制器。
具体实施方式
为让本发明的上述和其它目的、特征、和优点能更明显易懂,下文特举出较佳实施例,并配合附图,作详细说明如下:
图1是显示根据本发明实施例所述的通信系统的方块图,包括设定控制器10、语音识别控制器12、和应用控制器14。设定控制器10耦接语音识别控制器12、然后耦接应用控制器14。
设定控制器10可以为个人计算机或个人数字助理(Personal DigitalAssistant,PDA)。设定控制器10包括语音识别关键词VKT 100,其包括语音识别关键词以及相对应的应用指令。语音识别关键词VKT 100可以包括至少一组语音关键词Vi和应用指令Ai对。语音识别方法利用从所有的语音关键词Vi中搜寻输入语音数据而执行。语音识别方法通常由3种种类分类,分为不特定语者模型(Speaker Independent,SI)、特定语者模型(SpeakerDependent,SD)、和语者调适模型(Speaker Adapted,SA)。在不特定语者模型系统中,语音识别引擎藉由普遍的语音模型来识别特征,该普遍的语音模型由大量的训练取样产生。其中一种使用不特定语者模型的商用软件为微软语音识别软件(Microsoft Speech Recognizer)。因为不需训练过的使用者就可使用,所以这种系统非常方便。然而,这种系统的识别率通常较差,特别是当说话者的口音严重或说话者的说话模式和训练取样差异过大时。另一方面,特定语者模型系统需要使用者对每个关键词提供取样,因此对于产生大量关键词不但麻烦且非常需要内存。语音识别关键词VKT 100可以由像是键盘或按键的输入来编辑,或由经建立的数据库,例如Outlook、Skype、MSN、或Yahoo Messager的电话簿输入。
图2a是显示根据本发明实施例所述的语音关键词查询表,使用于图1的通信系统,包括20a、22a、24a、和26a。20a包含使用者输入的名字标签L1、L2、...、Li、...、和Ln。每个LI都可以藉由设定控制器10内的不特定语者模型的文字到声音(Text-to-Speech)语音合成算法转换到标准语音关键词VDI。标准语音关键词是和输入语音数据流一起比较的语音识别关键词。24的实现不需是看的见的。设定控制器10包括用于语音输入的麦克风。使用者可以另外在改变语音栏22内输入相对应的改变语音关键词VA1到VAn。改变语音关键词Kai可以针对每个发音参数调整。当识别到设定控制器10内的标准语音关键词VDI或改变语音关键词VA1时26即提供应用指令API用以执行。
参考图1,语音识别控制器12从10接收语音识别关键词VKT 100,并且接收V用以执行第一层语音识别,即,从第一收发器120内的语音识别关键词中搜寻第一语音输入V1,藉此判定相对应的应用指令。在第一收发器120内找到语音关键词Vi之后,语音识别控制器12传送应用指令到应用控制器14以便执行。语音识别控制器12可以是一轻便可携的装置,例如耳机、喇叭、或具有语音识别功能的耳机。应用控制器14可以是移动电话、DVD播放器、MP 3播放器、汽车音响、汽车控制器、或任意消费电子产品。
如果没有在语音识别查询表内找到第一语音输入,语音识别控制器12就会传送第一语音输入V1到应用控制器14。应用控制器14另外执行第二层语音识别,即,根据第一语音输入V1判定应用指令,以及传送第一语音输入V1和其相对应的应用指令给语音识别控制器12。第二层语音识别可以由应用控制器14的本地的语音关键词查询表实现,该本地的语音关键词查询表包括其它的语音关键词和相对应的应用指令,使得第一语音输入V1可以符合其中一个语音关键词,藉此找到和执行A1。应用控制器14接着执行A1。第二层语音识别可以识别比语音识别控制器12的第一层语音识别更多的语音关键词。应用控制器14可以更将第一语音输入V1和相对应的应用指令Ai传送给语音识别控制器12,使得语音识别控制器12也可以识别第一语音输入V1,藉此改进语音识别率。
设定控制器10、语音识别控制器12、和应用控制器14经由有线或无线的通信方式沟通。无线的通信方式可以是蓝牙(Bluetooth)、无线局域网络(Wireless LAN)、WiFi、或其它通信方式。
设定控制器10包括自我诊断功能,接收V2用以和第一收发器120内的语音识别关键词做比较,以及若V2符合语音识别关键词则确认该语音识别关键词,允许使用者改变设定控制器10内的该语音识别关键词。
语音关键词查询表VKT可以是电话簿,语音识别关键词是名字输入的发音,而相对应的应用指令是拨打一预定号码。图2b显示图1中的语音关键词查询表VKT。20b包括使用者定义的名字输入,例如,“Brian Smith”或“家”。24b包括机器产生的音素数据,包括从名字输入经由文字到音素算法而产生的音素串,以及相对应的产生语音的不特定语者模型,该不特定语者模型用于语音识别和语音合成。22b包括使用者定义的音素数据,可能和24b的音素数据不同,他提供使用者另外在24b定义个人化数据的选择,用以加强语音识别效能和系统的实时语音品质。相对应的应用指令是文字符串,例如拨打26b内的电话号码。
语音关键词查询表VKT可以是语音指令查询表,语音识别关键词是语音指令的发音,而相对应的应用指令是内建指令或使用者定义的指令。图2c显示图1中的语音关键词查询表VKT。20c存储指令卷标,例如,“家”、“语音留言”、“快速键[1-9]”、“内存[1-9]”、或“设定选单”。24c包括标准的音素数据,22c包括使用者定义、可以改变的音素资料。对应到“家”的标准的音素数据和可以改变的音素资料对到拨打家中电话的应用指令,“语音留言”对应到拨打语音留言的号码,“快速键[1-9]”对应到拨打对应快速键[1-9]的号码、“内存[1-9]”对应到拨打内存[1-9]之内的号码、或“设定选单”对应到进入设定选单。
图3是显示根据本发明实施例所述的语音合成以及语音识别方法,使用第2图的语音关键词查询表VKT和图1的设定控制器。方法利用语音合成实时输出和语音识别模型共享相同的音素来改善语音识别率。设定控制器10会产生合适的发音音素,使用者能够在语音合成实时输出的引导下根据他的习惯发音而编辑发音音素。一旦确定了发音音素,系统会更产生用于识别的语音识别模型。因此可以藉由使用者的习惯而提高语音识别率。第3图的方法在语音合成和语音识别方法中使用共同的音素串,使得设定控制器可以产生语音关键词查询表VKT,该语音关键词查询表VKT可以藉由使用者的发音喜好改变因此加强识别率。虚线以上的步骤提供语音合成的方法,以下的步骤提供语音识别模型产生的方法。
在步骤S310中,设定控制器10从S300接收图2a20a的文字符串,例如,“Home”,并且从所有的语言的音素中(S302)产生发音音素给“Home”(S312)。文字到音素算法S310可以利用搜寻发音字典或应用发音产生规则来产生字典外的文字符串。
在步骤S320中,语音合成模块根据音素串(S322)产生语音波形(S322)。
在步骤S330中,设定控制器10接收音素(S312)用以根据完整的内建不特定语者模型(S332)产生语音数据。例如,系统控制器126(见第4图)根据S312得到S322的“h”“o”“m”“e”模型用以产生相对应的语音识别模型。
图4是显示根据本发明实施例所述的语音识别装置的方块图,包括第一收发器120、第二收发器121、声音输入装置122、声音输出装置123、模拟/数字转换器124、内存125、系统控制器126、和语音识别控制器127。
第一收发器120从设定控制器10下载语音识别关键词VKT 100用以存储在内存125。第二收发器121传送相对应的应用指令Ai,以及从应用控制器14接收请求的语音识别关键词Vi和相对应的应用指令Ai,并且接着将请求的语音识别关键词Vi和相对应的应用指令Ai加入第一收发器120。声音输入装置122可以是接收第一语音输入V1的麦克风。声音输出装置123可以是播放声音数据的扩音器。模拟/数字转换器124将语音关键词Vi从模拟转换到数字。内存125存储第一收发器120、内建的语音模型和参数以及第一语音输入V1。系统控制器126(语音识别模块)将第一语音输入V1和语音关键词查询表VKT内的语音关键词Vi比较用以判定相对应的应用指令Ai
图5是显示根据本发明实施例所述的语音识别方法的流程图,使用图4的语音识别控制器。
在步骤S500中,第一语音输入V1的信号在时域中被抑制用来提供好的信号品质。
在步骤S502中,第一语音输入V1转换到频域来进一步减低噪声以及抽取其中的特定模型。
在步骤S504中,系统控制器126使用第一语音输入V1、不特定语者模型、和特定语者模型来搜寻语音关键词查询表VKT内的语音识别关键词。
在步骤S506中,系统控制器126对1执行后处理,例如,执行相对应的应用指令、第一层的退回、或语音识别织成功率的产生。如果系统控制器126判定第一语音输入V1符合语音关键词查询表VKT内的语音识别关键词,就传送相对应的应用指令到应用控制器14执移动作。如果没有,系统控制器126传送第一语音输入V1到应用控制器14来执行第二层语音识别。系统控制器126可以建立一种根据第一层语音识别的成功率的给分系统。
本发明虽以较佳实施例揭露如上,然其并非用以限定本发明的范围,任何熟习此项技艺者,在不脱离本发明的精神和范围内,当可做些许的更动与润饰,因此本发明的保护范围当视本发明的申请专利范围所界定者为准。

Claims (19)

1.一种通信系统,包括:
设定控制器,接收一语音关键词查询表,该语音关键词查询表包括一语音识别关键词以及一相对应的应用指令;该语音识别关键词包括标签、标准语音关键词、以及改变语音关键词;该标准语音关键词包括音素串、以及不特定语者模型;该改变语音关键词包括使用者定义的音素数据,用以对发音参数进行调整;该设定控制器通过该不特定语者模型进行语音合成,将该标签转换而产生该音素串;
语音识别控制器,耦接上述设定控制器,接收上述设定控制器而来的上述语音关键词查询表,接收第一语音输入,以及比较上述第一语音输入和上述语音关键词查询表用以判定上述相对应的应用指令;以及
应用控制器,耦接上述语音识别控制器,接收以及执行上述相对应的应用指令。
2.如权利要求1所述的通信系统,其中,上述设定控制器、上述语音识别控制器、以及上述应用控制器经由有线或无线通信沟通。
3.如权利要求1所述的通信系统,其中,上述设定控制器更在语音合成和语音识别模型间共享音素,以及根据上述音素产生发音。
4.如权利要求1所述的通信系统,其中,上述语音识别控制器更传送上述第一语音输入到上述应用控制器,如果上述第一语音输入和上述语音关键词查询表内所有的语音关键词都不符。
5.如权利要求4所述的通信系统,其中,上述应用控制器更根据上述第一语音输入判定相对应的应用指令,以及传送上述第一语音输入和上述应用控制器根据上述第一语音输入判定所得的相对应的应用指令到上述语音识别控制器。
6.如权利要求1所述的通信系统,其中,上述语音关键词查询表是电话簿,上述语音识别关键词是名字输入的发音,上述相对应的应用指令是拨打一预定号码。
7.如权利要求1所述的通信系统,其中,上述语音识别关键词是指令输入的发音,上述相对应的应用指令是控制或接收信息。
8.如权利要求1所述的通信系统,其中,上述语音识别关键词是数字输入的发音,上述相对应的应用指令是拨打上述数字输入。
9.如权利要求1所述的通信系统,其中,上述设定控制器更接收第二语音输入,如果上述第二语音输入和上述语音关键词符合,则上述设定控制器更让使用者改变上述语音识别关键词。
10.如权利要求1所述的通信系统,其中,上述语音识别控制器包括:
第一收发器,从上述设定控制器下载上述语音关键词查询表;
第二收发器,传送上述相对应应用指令到上述应用控制器;
声音输入装置,接收上述语音输入;
模拟/数字转换器,耦接上述声音输入装置,转换上述语音输入到数字;
内存,耦接上述第一和第二收发器,存储上述语音关键词查询表;以及
语音识别模块,耦接上述模拟/数字转换器和上述内存,比较上述第一语音输入和上述语音识别关键词用以判定上述相对应的应用指令。
11.一种语音识别方法,用于一通信系统,包括:
设定控制器接收一语音关键词查询表,该语音关键词查询表包括一语音识别关键词以及一相对应的应用指令;
语音识别控制器从上述设定控制器接收上述语音关键词查询表,以及比较一第一语音输入和上述语音关键词查询表用以判定上述相对应的应用指令;以及
应用控制器从上述语音识别控制器接收以及执行上述相对应的应用指令,
其中,该语音识别关键词包括标签、标准语音关键词、以及改变语音关键词;该标准语音关键词包括音素串、以及不特定语者模型;该改变语音关键词包括使用者定义的音素数据,用以对发音参数进行调整;该设定控制器通过该不特定语者模型进行语音合成,将该标签转换而产生该音素串。
12.如权利要求11所述的语音识别方法,其中,上述设定控制器、上述语音识别控制器、以及上述应用控制器经由有线或无线通信沟通。
13.如权利要求11所述的语音识别方法,更包括:上述设定控制器在语音合成和语音识别模型间共享音素,以及根据上述音素产生发音。
14.如权利要求11所述的语音识别方法,更包括:上述语音识别控制器传送上述第一语音输入到上述应用控制器,如果上述第一语音输入和上述语音关键词查询表内所有的语音关键词都不符。
15.如权利要求14所述的语音识别方法,更包括:上述应用控制器根据上述第一语音输入判定相对应的应用指令,以及传送上述第一语音输入和上述应用控制器根据上述第一语音输入判定所得的相对应的应用指令到上述语音识别控制器。
16.如权利要求11所述的语音识别方法,其中,上述语音关键词查询表是电话簿,上述语音识别关键词是名字输入的发音,上述相对应的应用指令是拨打一预定号码。
17.如权利要求11所述的语音识别方法,其中,上述语音识别关键词是指令输入的发音,上述相对应的应用指令是控制或接收信息。
18.如权利要求11所述的语音识别方法,其中,上述语音识别关键词是数字输入的发音,上述相对应的应用指令是拨打上述数字输入。
19.如权利要求11所述的语音识别方法,更包括:上述设定控制器接收第二语音输入,如果上述第二语音输入和上述语音关键词符合,则上述设定控制器更让使用者改变上述语音识别关键词。
CN200710149769XA 2006-09-05 2007-09-05 通信系统以及语音识别方法 Expired - Fee Related CN101141508B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US84269306P 2006-09-05 2006-09-05
US60/842,693 2006-09-05
US11/672,472 US7957972B2 (en) 2006-09-05 2007-02-07 Voice recognition system and method thereof
US11/672,472 2007-02-07

Publications (2)

Publication Number Publication Date
CN101141508A CN101141508A (zh) 2008-03-12
CN101141508B true CN101141508B (zh) 2012-02-22

Family

ID=39153041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710149769XA Expired - Fee Related CN101141508B (zh) 2006-09-05 2007-09-05 通信系统以及语音识别方法

Country Status (3)

Country Link
US (1) US7957972B2 (zh)
CN (1) CN101141508B (zh)
TW (1) TWI349267B (zh)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8260618B2 (en) * 2006-12-21 2012-09-04 Nuance Communications, Inc. Method and apparatus for remote control of devices through a wireless headset using voice activation
JP2009244639A (ja) * 2008-03-31 2009-10-22 Sanyo Electric Co Ltd 発話装置、発話制御プログラムおよび発話制御方法
KR20090107365A (ko) * 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
CH702399B1 (fr) * 2009-12-02 2018-05-15 Veovox Sa Appareil et procédé pour la saisie et le traitement de la voix.
JP5533042B2 (ja) * 2010-03-04 2014-06-25 富士通株式会社 音声検索装置、音声検索方法、プログラム及び記録媒体
US9847083B2 (en) * 2011-11-17 2017-12-19 Universal Electronics Inc. System and method for voice actuated configuration of a controlling device
US8756060B2 (en) 2011-12-22 2014-06-17 Ncr Corporation Methods and apparatus for audio input for customization of digital displays
TWI574254B (zh) * 2012-01-20 2017-03-11 華碩電腦股份有限公司 用於電子系統的語音合成方法及裝置
US8468023B1 (en) * 2012-10-01 2013-06-18 Google Inc. Handsfree device with countinuous keyword recognition
KR102091003B1 (ko) * 2012-12-10 2020-03-19 삼성전자 주식회사 음성인식 기술을 이용한 상황 인식 서비스 제공 방법 및 장치
US9467785B2 (en) 2013-03-28 2016-10-11 Knowles Electronics, Llc MEMS apparatus with increased back volume
US9503814B2 (en) 2013-04-10 2016-11-22 Knowles Electronics, Llc Differential outputs in multiple motor MEMS devices
US9633655B1 (en) 2013-05-23 2017-04-25 Knowles Electronics, Llc Voice sensing and keyword analysis
US10020008B2 (en) 2013-05-23 2018-07-10 Knowles Electronics, Llc Microphone and corresponding digital interface
US20180317019A1 (en) 2013-05-23 2018-11-01 Knowles Electronics, Llc Acoustic activity detecting microphone
US10028054B2 (en) 2013-10-21 2018-07-17 Knowles Electronics, Llc Apparatus and method for frequency detection
EP3575924B1 (en) 2013-05-23 2022-10-19 Knowles Electronics, LLC Vad detection microphone
US9711166B2 (en) 2013-05-23 2017-07-18 Knowles Electronics, Llc Decimation synchronization in a microphone
US9386370B2 (en) 2013-09-04 2016-07-05 Knowles Electronics, Llc Slew rate control apparatus for digital microphones
US10885918B2 (en) * 2013-09-19 2021-01-05 Microsoft Technology Licensing, Llc Speech recognition using phoneme matching
US9502028B2 (en) 2013-10-18 2016-11-22 Knowles Electronics, Llc Acoustic activity detection apparatus and method
US9147397B2 (en) 2013-10-29 2015-09-29 Knowles Electronics, Llc VAD detection apparatus and method of operating the same
CN104660792A (zh) * 2013-11-21 2015-05-27 腾讯科技(深圳)有限公司 唤醒应用的方法及装置
US9601108B2 (en) 2014-01-17 2017-03-21 Microsoft Technology Licensing, Llc Incorporating an exogenous large-vocabulary model into rule-based speech recognition
US10749989B2 (en) 2014-04-01 2020-08-18 Microsoft Technology Licensing Llc Hybrid client/server architecture for parallel processing
US9831844B2 (en) 2014-09-19 2017-11-28 Knowles Electronics, Llc Digital microphone with adjustable gain control
US10002543B2 (en) * 2014-11-04 2018-06-19 Knotbird LLC System and methods for transforming language into interactive elements
US9712915B2 (en) 2014-11-25 2017-07-18 Knowles Electronics, Llc Reference microphone for non-linear and time variant echo cancellation
CN107112012B (zh) 2015-01-07 2020-11-20 美商楼氏电子有限公司 用于音频处理的方法和系统及计算机可读存储介质
US9830080B2 (en) 2015-01-21 2017-11-28 Knowles Electronics, Llc Low power voice trigger for acoustic apparatus and method
US10121472B2 (en) 2015-02-13 2018-11-06 Knowles Electronics, Llc Audio buffer catch-up apparatus and method with two microphones
US9866938B2 (en) 2015-02-19 2018-01-09 Knowles Electronics, Llc Interface for microphone-to-microphone communications
CN107534818B (zh) 2015-05-14 2020-06-23 美商楼氏电子有限公司 麦克风
US10291973B2 (en) 2015-05-14 2019-05-14 Knowles Electronics, Llc Sensor device with ingress protection
US9478234B1 (en) 2015-07-13 2016-10-25 Knowles Electronics, Llc Microphone apparatus and method with catch-up buffer
US10045104B2 (en) 2015-08-24 2018-08-07 Knowles Electronics, Llc Audio calibration using a microphone
FR3045909B1 (fr) * 2015-12-17 2017-12-29 Delta Dore Procede et dispositif d'analyse et de repartition de commandes vocales
US9894437B2 (en) 2016-02-09 2018-02-13 Knowles Electronics, Llc Microphone assembly with pulse density modulated signal
CN105913841B (zh) * 2016-06-30 2020-04-03 北京小米移动软件有限公司 语音识别方法、装置及终端
US10499150B2 (en) 2016-07-05 2019-12-03 Knowles Electronics, Llc Microphone assembly with digital feedback loop
US10257616B2 (en) 2016-07-22 2019-04-09 Knowles Electronics, Llc Digital microphone assembly with improved frequency response and noise characteristics
CN106250474B (zh) * 2016-07-29 2020-06-23 Tcl科技集团股份有限公司 一种语音控制的处理方法及系统
WO2018081278A1 (en) 2016-10-28 2018-05-03 Knowles Electronics, Llc Transducer assemblies and methods
WO2018126151A1 (en) 2016-12-30 2018-07-05 Knowles Electronics, Llc Microphone assembly with authentication
JP6875905B2 (ja) * 2017-03-29 2021-05-26 株式会社日立情報通信エンジニアリング 通話制御システム及び通話制御方法
US11025356B2 (en) 2017-09-08 2021-06-01 Knowles Electronics, Llc Clock synchronization in a master-slave communication system
US11061642B2 (en) 2017-09-29 2021-07-13 Knowles Electronics, Llc Multi-core audio processor with flexible memory allocation
US11438682B2 (en) 2018-09-11 2022-09-06 Knowles Electronics, Llc Digital microphone with reduced processing noise
US11094327B2 (en) * 2018-09-28 2021-08-17 Lenovo (Singapore) Pte. Ltd. Audible input transcription
US10908880B2 (en) 2018-10-19 2021-02-02 Knowles Electronics, Llc Audio signal circuit with in-place bit-reversal
US11282500B2 (en) * 2019-07-19 2022-03-22 Cisco Technology, Inc. Generating and training new wake words

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1391210A (zh) * 2001-05-11 2003-01-15 皇家菲利浦电子有限公司 用于一种语言识别设备的训练或适配方法
CN1746970A (zh) * 2004-09-10 2006-03-15 乐金电子(惠州)有限公司 移动通讯终端机的语音识别方法

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4870686A (en) * 1987-10-19 1989-09-26 Motorola, Inc. Method for entering digit sequences by voice command
JP2989211B2 (ja) * 1990-03-26 1999-12-13 株式会社リコー 音声認識装置における辞書制御方式
JPH0535293A (ja) * 1991-08-01 1993-02-12 Fujitsu Ltd 音声認識装置における認識候補数設定方式
CA2209948C (en) * 1995-11-17 2000-12-26 At&T Corp. Automatic vocabulary generation for telecommunications network-based voice-dialing
US5715369A (en) * 1995-11-27 1998-02-03 Microsoft Corporation Single processor programmable speech recognition test system
US5835570A (en) * 1996-06-26 1998-11-10 At&T Corp Voice-directed telephone directory with voice access to directory assistance
US5933775A (en) * 1996-12-16 1999-08-03 Ncr Corporation Mechanism for providing wireless audio and control channels for personal computer interactive phone (PCIP) system
US6078568A (en) * 1997-02-25 2000-06-20 Telefonaktiebolaget Lm Ericsson Multiple access communication network with dynamic access control
GB2323693B (en) * 1997-03-27 2001-09-26 Forum Technology Ltd Speech to text conversion
US5974382A (en) * 1997-10-29 1999-10-26 International Business Machines Corporation Configuring an audio interface with background noise and speech
JP3507686B2 (ja) * 1998-01-16 2004-03-15 日本電気株式会社 音声認識機能を有する通信装置及び通信方法
FI981127A (fi) * 1998-05-20 1999-11-21 Nokia Mobile Phones Ltd Ääniohjausmenetelmä ja äänellä ohjattava laite
JP2001051694A (ja) 1999-08-10 2001-02-23 Fujitsu Ten Ltd 音声認識装置
US7590538B2 (en) * 1999-08-31 2009-09-15 Accenture Llp Voice recognition system for navigating on the internet
JP2002283259A (ja) * 2001-03-27 2002-10-03 Sony Corp ロボット装置のための動作教示装置及び動作教示方法、並びに記憶媒体
JP2003319070A (ja) 2002-04-24 2003-11-07 Nippon Telegr & Teleph Corp <Ntt> 音声応答方法及び装置
US7328157B1 (en) * 2003-01-24 2008-02-05 Microsoft Corporation Domain adaptation for TTS systems
US8880047B2 (en) * 2005-08-03 2014-11-04 Jeffrey C. Konicek Realtime, location-based cell phone enhancements, uses, and applications
US7594082B1 (en) * 2006-03-07 2009-09-22 Emc Corporation Resolving retention policy conflicts
US7676363B2 (en) * 2006-06-29 2010-03-09 General Motors Llc Automated speech recognition using normalized in-vehicle speech
US7689417B2 (en) * 2006-09-04 2010-03-30 Fortemedia, Inc. Method, system and apparatus for improved voice recognition
US8880402B2 (en) * 2006-10-28 2014-11-04 General Motors Llc Automatically adapting user guidance in automated speech recognition

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1391210A (zh) * 2001-05-11 2003-01-15 皇家菲利浦电子有限公司 用于一种语言识别设备的训练或适配方法
CN1746970A (zh) * 2004-09-10 2006-03-15 乐金电子(惠州)有限公司 移动通讯终端机的语音识别方法

Also Published As

Publication number Publication date
US20080059193A1 (en) 2008-03-06
CN101141508A (zh) 2008-03-12
TWI349267B (en) 2011-09-21
TW200813980A (en) 2008-03-16
US7957972B2 (en) 2011-06-07

Similar Documents

Publication Publication Date Title
CN101141508B (zh) 通信系统以及语音识别方法
CN104168353B (zh) 蓝牙耳机及其语音交互控制方法
TWI281146B (en) Apparatus and method for synthesized audible response to an utterance in speaker-independent voice recognition
US9202465B2 (en) Speech recognition dependent on text message content
US9570066B2 (en) Sender-responsive text-to-speech processing
CN111261144B (zh) 一种语音识别的方法、装置、终端以及存储介质
CN107895578A (zh) 语音交互方法和装置
CN106816149A (zh) 车辆自动语音识别系统的优先化内容加载
CN107819929A (zh) 优选表情符号的识别和生成
CN108242236A (zh) 对话处理装置及其车辆和对话处理方法
CN103095911A (zh) 一种通过语音唤醒寻找手机的方法及系统
JP2007525897A (ja) マルチモーダル埋め込み型インタフェースの交換可能なカスタマイズ用の方法及び装置
US9997155B2 (en) Adapting a speech system to user pronunciation
CN110827826B (zh) 语音转换文字方法、电子设备
CN1381831A (zh) 与扬声器无关的语音识别装置
US10008205B2 (en) In-vehicle nametag choice using speech recognition
US11676571B2 (en) Synthesized speech generation
US10866948B2 (en) Address book management apparatus using speech recognition, vehicle, system and method thereof
KR20230118089A (ko) 사용자 스피치 프로파일 관리
US20120197643A1 (en) Mapping obstruent speech energy to lower frequencies
CN101320561A (zh) 提升个人语音识别率的方法及模块
CN102542705A (zh) 语音提醒的方法和系统
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
JP2000338991A (ja) 認識率信頼性表示機能付き音声操作電話装置及びその音声認識方法
JP2003177788A (ja) 音声対話システムおよびその方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120222

Termination date: 20210905