CN1761996A - 采用合并词典的语音识别系统及方法 - Google Patents
采用合并词典的语音识别系统及方法 Download PDFInfo
- Publication number
- CN1761996A CN1761996A CN200480007702.7A CN200480007702A CN1761996A CN 1761996 A CN1761996 A CN 1761996A CN 200480007702 A CN200480007702 A CN 200480007702A CN 1761996 A CN1761996 A CN 1761996A
- Authority
- CN
- China
- Prior art keywords
- sil
- function word
- dictionary
- relevant phrases
- order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 230000006870 function Effects 0.000 claims description 82
- 241001122315 Polites Species 0.000 claims description 15
- 230000007935 neutral effect Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 13
- 230000008859 change Effects 0.000 claims description 8
- 230000008676 import Effects 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 26
- 238000005516 engineering process Methods 0.000 description 11
- 101100288386 Xenopus laevis ssb-a gene Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 230000003466 anti-cipated effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Character Discrimination (AREA)
Abstract
本发明包括利用合并词典的语音识别系统及方法,以及可包括识别器,它配置成比较输入语音数据与来自合并词典的一系列词典条目,从而检测所识别的短语或命令。合并词典可通过采用将具有相似含义的两个或两个以上相关短语或命令映射到词典条目中的单个条目的合并技术来实现。因此,通过合并否则可能会错误地相互混淆的短语或命令,识别器可实现更精确的语音识别准确度。
Description
背景部分
1.发明领域
一般来说,本发明涉及电子语音识别系统,更具体来说,涉及利用合并词典的语音识别系统及方法。
2.背景技术说明
实现让系统用户与电子设备接口的健壮且有效的方法是系统设计人员及制造商的一个重要考虑事项。电子设备的语音控制操作是许多系统用户希望的接口。例如,语音控制操作允许用户同时执行其它任务。例如,某个人可能在开车的同时通过语音控制来操作电子管理器。对于具有身体局限性或其它特殊要求的用户,电子系统的免提操作可能也是符合要求的。
电子设备的免提操作可通过各种语音激活电子系统来实现。在使用传统输入装置不方便或者可能有危险的情况下,语音激活电子系统以这种方式有利地让用户与电子设备接口。电子娱乐系统也可利用语音识别技术,让用户可以通过对系统口述来与其交互。
但是,有效地实现这类系统可能对系统设计人员带来大量难题。例如,对于增加的系统功能性和性能的增强的需求可能要求更大的系统处理能力以及要求附加的硬件资源。处理要求或硬件要求的提高还可能因增加的生产成本和操作低效而导致相应有害的经济影响。
此外,执行各种高级操作的增强的系统能力可能为系统用户提供附加利益,但也可能对各种系统组件的控制和管理提出增加的需求。例如,由于所涉及数字数据的大数量及复杂度,有效地识别粤语中的单词和短语的增强电子系统可能受益于有效的实现。因此,由于上述所有原因,实现让系统用户与电子设备接口的健壮且有效的方法仍然是系统设计人员及制造商的一个重要考虑事项。
发明概述
根据本发明,公开一种利用合并词典的语音识别系统及方法。在包括中国南部的粤语在内的某些语言中,短语结尾虚词(particle)可描绘说话者的语气,同时不改变短语或命令的核心含义。根据本发明,可定义若干不同的虚词上下文,用于执行将具有相似含义的各种相关短语组合的合并技术。
例如,可能存在断言性上下文,其中,特定命令之后没有跟随任何类型的关联虚词。上述断言性上下文可能表示说话者的粗鲁或武断的语气。另外,可能存在中性虚词上下文,其中,特定命令之后跟随关联的中性虚词(例如“aa3”)。上述中性虚词上下文可能表示说话者的中性语气。
此外,可能存在礼貌虚词上下文,其中,特定命令之后跟随关联的礼貌虚词(例如“laa1”)。上述礼貌虚词上下文可能表示作为说话者的语气的礼貌命令或请求。在某些实施例中,与无虚词上下文、中性虚词上下文以及礼貌虚词上下文的任一个关联的命令可有利地映射到语音识别过程中所使用的词汇词典中的单个礼貌上下文词典条目。
语音识别过程中的识别差错可能从相互混淆的两个或两个以上这类发音相似命令的不正确分析中产生。本发明的合并词典通过将具有相同基本含义的相似短语映射到语音识别过程中所使用的词汇词典中的同一个命令,有利地防止将一个相似短语不正确地识别为另一个相似短语。
另外,在某些实施例中,合并词典还可将具有相同基本含义的两个发音不同的短语合并到同一个命令中。在各种实施例中,合并词典还可对实质上改变根短语的含义的虚词提供某些合并例外情况。因此,利用上述技术的合并词典可被创建,从而提供对单个根短语或命令的若干变体的更精确识别。因此,本发明提供一种利用合并词典的语音识别的有效系统及方法。
附图简介
图1是根据本发明的计算机系统的一个实施例的框图;
图2是根据本发明的图1的存储器的一个实施例的框图;
图3是根据本发明的图2的语音检测器的一个实施例的框图;
图4是根据本发明的图2的隐马尔可夫模型的一个实施例的示意图;
图5是根据本发明的图2的词典的一个实施例的示意图;
图6是根据本发明的一个实施例的图5的词典条目的示意图;
图7是示意图,说明根据本发明的一个实施例、具有语音虚词的命令;以及
图8是示意图,说明一种根据本发明的一个实施例、实现合并词典的技术。
详细说明
本发明涉及语音识别系统的改进。提供以下描述以便使本领域的技术人员能够实施和利用本发明,这些描述在专利申请及其要求的上下文中提供。本领域的技术人员将会非常清楚对这些优选实施例的各种修改,以及本文的一般原理可应用于其它实施例。因此,本发明不是意在局限于所述实施例,而是符合与本文所述的原理和特征一致的最广义的范围。
本发明包括利用合并词典的语音识别系统及方法,以及可包括识别器,它配置成比较输入语音数据与来自合并词典的一系列词典条目,从而检测所识别短语或命令。合并词典可通过采用将具有相似含义的两个或两个以上相关短语或命令映射到词典条目中的单个条目的合并技术来有利地实现。因此,通过合并否则可能会错误地相互混淆的短语或命令,识别器可实现更精确的语音识别准确度。
现在参照图1,根据本发明,说明计算机系统110的一个实施例的框图。图1的实施例包括声音传感器112、放大器116、模数转换器120、中央处理器(CPU)128、存储器130以及输入/输出接口132。在备选实施例中,计算机系统110可便利地包括其它各种元件或功能性,作为结合图1的实施例所述的那些元件或功能性的补充或替代。
声音传感器112检测声能,并将所检测的声能转换成模拟语音信号,它经由线路114提供给放大器116。放大器116放大所接收的模拟语音信号,并将放大的模拟语音信号经由线路118提供给模数转换器120。模数转换器120则把放大的模拟语音信号转换成相应的数字语音数据。然后,模数转换器120把数字语音数据经由线路122提供给系统总线124。
CPU 128则可访问系统总线124上的数字语音数据,以及作为响应而分析和处理数字语音数据,以便根据存储器130中所包含的软件指令执行语音检测。下面结合图2-3进一步论述CPU 128的操作以及存储器130中的软件指令。在语音数据被处理之后,CPU 128则可将语音检测分析的结果经由输入/输出接口132提供给其它装置(未示出)。在备选实施例中,本发明可便利地通过不同于图1所示的计算机系统110的各种装置来实施。
现在参照图2,根据本发明,说明图1的存储器130的一个实施例的框图。存储器130还可包括各种存储装置配置,其中包括随机存取存储器(RAM)和诸如软盘或硬盘驱动器之类的存储装置。在图2的实施例中,存储器130包括但不限于语音检测器210、隐马尔可夫模型(HMM)212以及词汇词典214。在备选实施例中,存储器130可便利地包括其它各种元件或功能性,作为结合图2的实施例所述的那些元件或功能性的补充或替代。
在图2的实施例中,语音检测器210包括一系列软件模块,它们由CPU 128执行以便分析和识别语音数据,下面结合图3进一步描述。在备选实施例中,语音检测器210可便利地采用其它各种软件和/或硬件配置来实现。HMM 212和词典214可由语音检测器210用来实现本发明的语音识别功能。下面结合图4进一步论述HMM 212的一个实施例,以及结合图5进一步论述词典214的一个实施例。
现在参照图3,根据本发明,说明图2的语音检测器210的一个实施例的框图。语音检测器210包括但不限于特征提取器310、端点检测器312以及识别器314。在备选实施例中,语音检测器210可便利地包括其它各种元件或功能性,作为结合图3的实施例所述的那些元件或功能性的补充或替代。
在图3的实施例中,模数转换器120(图1)把数字语音数据经由系统总线124提供给特征提取器310。特征提取器310作为响应而产生特征向量,它们经由通路320提供给识别器314。特征提取器310还作为响应而经由通路322对端点检测器312产生语音能量。端点检测器312分析语音能量,并作出响应而确定语音能量所表示的发音的端点。端点表示发音在时间上的起始和结束。端点检测器312则经由通路324向识别器314提供端点。
识别器314最好是配置成识别词典214(图2)中所表示的预定词汇中的命令。词典214中的上述词汇命令可对应于任何预期命令、指令或计算机系统110的其它通信。所识别的词汇命令则可经由通路332输出到系统110。
实际上,来自词典214的每个命令可与表示那个单词的相应音素串(一系列独立音素)关联。隐马尔可夫模型(HMM)212(图2)可包括来自可有效地用于表示词典214中的命令的预定音素集的每个音素的已训练随机表示。识别器314则可将来自线路320的输入特征向量与来自词典214的每个音素串的适当HMM 212进行比较,从而确定哪个命令产生最高识别评分。因此,与最高识别评分对应的命令可被标识为所识别命令。
现在参照图4,根据本发明,说明图2的HMM 212的一个实施例的框图。在图4的实施例中,HMM 212最好是可包括模型1(412(a))至模型N(412(c))。在备选实施例中,HMM 212可便利地包括其它各种元件或功能性,作为结合图4的实施例所述的那些元件或功能性的补充或替代。
在图4的实施例中,HMM 212可便利地实现为包括可包含任何所需类型的信息的任何预期数量的模型412。在图5的实施例中,来自HMM 212的每个模型412可对应于来自与识别器314(图3)配合使用的预定音素集的不同的特定音素。
现在参照图5,根据本发明的一个实施例,说明图2的词典214的框图。在图5的实施例中,词典214最好是可包括条目1(512(a))至条目N(512(c))。在备选实施例中,词典214可便利地包括其它各种元件或功能性,作为结合图5的实施例所述的那些元件或功能性的补充或替代。
在图5的实施例中,词典214可便利地实现为包括可包含任何所需类型的信息的任何预期数量的条目512。在图5的实施例中,如以上结合图3所述,来自词典214的各条目512还可包括来自预定音素集的独立音素的相应音素串。上述音素串的独立音素最好是形成来自词典214的相应单词的发音的顺序表示。下面结合图6进一步论述词典条目512的一个实施例。
现在参照图6,根据本发明的一个实施例,说明图5的示范词典条目512的示意图。在备选实施例中,本发明可便利地利用词典条目来执行语音识别,其中具有其它各种元件或功能性作为结合图6的实施例所述的那些元件或功能性的补充或替代。
在图6的实施例中,词典条目512可包括来自词汇表、识别器314(图3)设计成对其进行识别的特定命令610。在各种实施例中,命令610可以是任何类型的发音或语音,其中包括可按照适当的表示方案来表示的句子、短语、命令、疑问或单词。另外,词典条目512可包括表示命令610的顺序听觉特性的音素串。与命令610关联的音素串可由来自与识别器314配合使用的预定音素集的一系列音素组成。在图6的实施例中,上述音素串可包括音素1(612(a))至音素N(612(b))。下面结合图8进一步论述词典条目512的应用。
现在参照图7,根据本发明的一个实施例,表示出示意图710,说明与语音虚词关联的若干命令610(图6)。在备选实施例中,本发明可便利地利用其它各种语音虚词技术或功能性,作为结合图7的实施例所述的那些技术或功能性的补充或替代。
在包括中国南部的粤语在内的某些语言中,短语结尾虚词可描绘说话者的语气,同时不改变短语或命令的核心含义。在图7的实施例中,框714说明断言性虚词上下文,其中,特定命令之后没有跟随任何类型的关联虚词。如图7的示意图710所示,上述断言性虚词上下文表示说话者的粗鲁或武断的语气。
另外,框916说明中性虚词上下文,其中,特定命令之后跟随关联虚词“aa3”。如图7的示意图710所示,上述中性虚词上下文表明说话者的中性语气。此外,框918说明礼貌虚词上下文,其中,特定命令之后跟随关联虚词“laa1”。如图7的示意图710所示,上述礼貌虚词上下文表明作为说话者的语气的礼貌命令或请求。下面结合图8进一步说明上述虚词的应用。
现在参照图8,根据本发明的一个实施例,示出示范示意图810,说明一种实现合并词典的技术。在备选实施例中,本发明可便利地通过采用其它各种技术或功能性作为结合图8的实施例所述的那些技术或功能性的补充或替代,来实现合并词典。
在图8的实例中,为了便于说明,提供示意图810及下表I,以便表示来自中国南部的粤语的声音。由于粤语通常采用汉字而不是罗马字母书写,因此,通过采用由香港语言学学会(LSHK)制订的、称作“jyutping”的粤语用罗马字体书写方案来提供图7的示意图810和下表I。有关“jyutping”和香港语言学学会的更多信息可见于万维网的cpct91.cityu.edu.hk/lshk。在备选实施例中,本发明可利用以其它各种类型的用罗马字体书写方案来表示的合并词典,其中包括其它任何适当类型的语言的合并词典。
识别器314(图3)的识别差错可能从相互混淆的两个或两个以上发音相似命令的不正确分析中产生。本发明的合并词典通过将具有相同基本含义的相似短语映射到相同的词典条目512中,有利地防止将一个相似短语不正确地识别为另一个相似短语。
为了说明本发明的各种合并原则,在图8的实例中,框814在上述图7的断言性虚词上下文中包含示范粤语命令“hei2_san1”(起立),其中没有任何类型的附加虚词。在框816中,在图7的中性虚词上下文中,相同的命令“hei2_san1”之后跟随虚词“aa3”。类似地,在框818中,在图7的礼貌虚词上下文中,相同的命令“hei2_san1”之后跟随虚词“laa1”。根据本发明,相同根命令(hei2_san1)的三个不同的虚词上下文(框814、816和818)可有利地合并到词汇词典214中的同一个命令512中。在某些实施例中,所有虚词上下文可合并到具有礼貌虚词上下文的词典条目中。本发明可与任何虚词结合使用。例如,在某些实施例中,虚词可包括但不限于“a1”、“aa3”“laa3”、“lo3”、“o3”、“ga3”和“ge3”。
另外,在某些实施例中,合并词典还可将具有相同基本含义的两个不同的短语合并到同一个词典条目512中。在图8的实施例中,合并词典还可对实质上改变根短语的含义的改变虚词(例如,粤语虚词“maa3”和“nel”)提供某些例外情况。例如,在粤语中,将虚词“maa3”添加到句子的结尾会把那个句子变换成疑问句,因此,为了精确的语音识别,进行合并不是适当的。合并词典可表示粤语的各种声音,而不利用相应的音调信息作为不同音素串的一部分。
因此,利用上述技术的合并词典可被创建,从而提供对单个根短语或命令的若干变体的更精确识别。为了便于说明,下面以表I的形式提供合并词典的这样一个实施例,它包括左侧的命令610以及右侧的表示相应命令610的发音的音素612的相应音素串。在备选实施例中,合并词典可按照与下表I所示的方式不同的各种其它方式来组织。
表I:
aai1_bou4: sil aa b ou sil
aai1_bou4: sil aai b ou sil
aai1_bou4: sil ng aai b ou sil
baai1_baai3: sil b aai b aai sil
baai2_go3_pou1_si2: sil b aai g o p ou s i sil
bei2_jat1_go3_zi6_ngo5: sil b eij a t g o z i ng o sil
bei2_jat1_go3_zi6_ngo5: sil b ei j a t g o z i o sil
caa4_ngo5_ge3_seon3: sil c aa ng o g e i m eu sil
caa4_ngo5_ge3_seon3: sil c aa ng o g e s eo n sil
caa4_ngo5_ge3_seon3: sil c aa o g e i m eu sil
caa4_ngo5_ge3_seon3: sil c aa o g e s eo n sil
caa4_seon3: sil c aa i m eu sil
caa4_seon3: sil c aa s eo n sil
caa4_seon3: sil c e k i m eu sil
co5_dai1: sil c o d ai sil
co5_dai1: sil c o d ai l aa sil
co5_dai1: sil s i cl sil
daa2_kyun4: sil d aa k yu n sil
daa2_kyun4: sil h eoi d aa g aau sil
daa2_kyun4: sil k yu n g i cl sil
dai6_jat1_jip6: sil d ai j a t j i cl sil
dai6_ji6_jip6: sil d ai j i j i cl sil
dai6_ji6_zek3_sau2: sil d ai j i z e k s au sil
dai6_ng5_jip6: sil d ai m j i cl sil
dai6_ng5_jip6: sil d ai ng j icl sil
dai6_saam1_jip6: sil d ai s aa m j i cl sil
dai6_sei3_jip6: sil d ai s ei j i cl sil
dai6_seng1_di1_laa1: sil d ai s e ng d i sil
dai6_seng1_di1_laa1: sil d ai s e ng d i l aa sil
dong2_dak1_hou2: sil d o ng d a k h ou sil
dong2_dak1_hou2: sil z i p d a k h ou sil
duk6_dai6_jat1_jip6: sil d u k d ai j a t j i cl sil
duk6_dai6_ji6_jip6: sil d u k d ai j i j i cl sil
duk6_dai6_ng5_jip6: sil d u k d ai m j i cl sil
duk6_dai6_ng5_jip6: sil d u k d ai ng j i cl sil
duk6_dai6_saam1_jip6: sil d u k d ai s aa m j i cl sil
duk6_dai6_sei3_jip6: sil d u k d ai s ei j i cl sil
duk6_haa6_jat1_fung1_seon3: sil d u k h aa j a t f u ng s eon sil
duk6_haa6_jat1_fung1_seon3: sil d u k h aa j a t g o i m eu sil
duk6_jyun4_seon3_gin2: sil d u k j yu n s eo n g i n sil
duk6_jyun4_seon3_gin2: sil t ai j yu n s eo n g i n sil
duk6_ngo5_ge3_seon3: sil d u k ng o g e s eo n sil
duk6_ngo5_ge3_seon3: sil d u k o g e s eo n sil
duk6_seon3: sil d u k s e on sil
duk6_seon3_jig4_sik1: sil d u k s e on j i ng s i cl sil
duk6_soeng6_jat1_fung1_seon3:
sil d u k s oe ng j a t f u ng sil
duk6_soeng6_jat1_fung1_seon3:
sil d u k s oe ng j a t f u ng i m eu sil
duk6_soeng6_jat1_fung1_seon3:
sil d u k s oe ng j a t f u ng s eo n sil
duk6_soeng6_jat1_fung1_seon3:
sil d u k s oe ng j a t g o i m eu sil
faai3_di1_laa1: sil f aai d i sil
faai3_di1_laa1: sil f aai d i l aa sil
faai3_di1_laa1: sil g aa c u cl sil
faan1_heoi3_fan3_laa1: sil f aa n h eoi f a n l aa sil
faan1_heoi3_soeng5_jat1_fung1_seon3:
sil faa n h eoi s oe ng j a t f u ng sil
faan1_heoi3_soeng5_jat1_fung1_seon3:
sil f aa n h eoi s oe ng j a t f u ng i m eu sil
faan1_heoi3_soeng5_jat1_fung1_seon3:
sil f aa n h eoi s oe ng j a t f u ng s eo n sil
faan1_heoi3_soeng5_jat1_fung1_seon3:
sil f aa n h eoi s oe ng j a t g o i m eu sil
fai6_laa1: sil f ai l aa sil
fan3_jat1_zan6: sil f a n j a t z a n sil
gam3_dak1_ji3_ge3: sil g a m d a k j i g e sil
gam3_dak1_ji3_ge3: sil h ou d a k j i sil
gam3_ho2_ngoi3_ge3: sil g a m h o ng oi g e sil
gam3_ho2_ngoi3_ge3: sil h ou h o ng oi sil
git3_cuk1_duk6_seon3_jing4_sik1:
sil g i t c u k d u k s eo n j i ng s i cl sil
git3_cuk1_duk6_seon3_jing4_sik1:
sil j yu n s i ng d u k s eo n j i ng s i cl sil
giu3_jan4_laa1: sil g iu j a n l aa sil
giu3_jan4_laa1: sil s ei h aa l ou sil
giu3_jan4_laa1: sil t u ng h eoi s ei h aa l ou sil
giu3_jan4_laa1: sil t u ng k eoi s ei h aa l ou sil
go3_bo1_hai2_bin1_aa3: sil g o b o h ai b i n aa sil
go3_bo1_hai2_bin1_aa3: sil g o b o h ai b i n d ou aa sil
go3_bo1_hai2_bin1_aa3: sil g o b o h ai b i n d ou o sil
go3_bo1_hai2_bin1_aa3: sil g o b o h ai b i n o sil
go3_bo1_hai2_bin1_aa3: sil g o b o h eoi z o b i n aa sil
go3_bo1_hai2_bin1_aa3: sil g o b o h eoi z o b i n d ou aa sil
go3_bo1_hai2_bin1_aa3: sil g o b o h eoi z o b i n d ou o sil
go3_bo1_hai2_bin1_aa3: sil g o b o h eoi z o b i n o sil
goi2_meng2: sil g oi m e ng sil
gui6_m4_gui6_aa3: sil g ui m g ui aa sil
gui6_m4_gui6_aa3: sil g ui m g ui o sil
gui6_m4_gui6_aa3: sil l ei g ui m aa sil
gui6_m4_gui6_aa3: sil l ei g ui m g ui aa sil
gui6_m4_gui6_aa3: sil l ei g ui m g ui o sil
gui6_m4_gui6_aa3: sil n ei g ui m aa sil
gui6_m4_gui6_aa3: sil n ei g ui m g ui aa sil
gui6_m4_gui6_aa3: sil n ei g ui m g ui o sil
gwaan1_gin6_ci4: sil g w aa n g i n c i sil
haa6_jat1_fung1_seon3: sil h aa j a t f u ng i m eu sil
haa6_jat1_fung1_seon3: sil h aa j a t f u ng s eo n sil
haa6_jat1_fung1_seon3: sil h aa j a t g o i m eu sil
haa6_jat1_fung1_seon3: sil h eoi h aa j a t f u ng i m eu sil
haa6_jat1_fung1_seon3: sil h eoi h aa j a t f u ng s eo n sil
haa6_jat1_fung1_seon3: sil h eoi h aa j a t g o i m eu sil
haai1: sil h aai sil
haai1: sil l ei h ou sil
haai1: sil n ei h ou sil
hap6_maai4_zeoi2: sil h a p m aai g o z eoi sil
hap6_maai4_zeoi2: sil h a p m aai z eoi sil
hei2_san1: sil h ei s a n sil
hei2_san1: sil h ei s a n aa sil
hei2_san1: sil h ei s a n l aa sil
hei2_san1: sil h ei s a n o sil
hei2_san1: sil k ei h ei s a n sil
hei2_san1: sil k ei h ei s a n aa sil
hei2_san1: sil k ei h ei s a n l aa sil
hei2_san1: sil k ei h ei s a n o sil
heoi3_haang4_haa5_laa1: sil h aa ng h aa sil
heoi3_haang4_haa5_laa1: sil h aa n h aa sil
heoi3_haang4_haa5_laa1: sil h eoi h aa ng h aa l aa sil
heoi3_haang4_haa5_laa1: sil h eoi h aa n h aa l aa sil
heoi3_waan2_laa1: sil h eoi w aa n aa sil
heoi3_waan2_laa1: sil h eoi w aa n l aa sil
heoi3_waan2_laa1: sil h eoi w aa n o sil
heoi3_waan2_laa1: sil w aa n aa sil
heoi3_waan2_laa1: sil w aa n l aa sil
heoi3_waan2_laa1: sil w aa n o sil
heoi3_zap1_bo1_laa1: sil f aai d i h eoi w a n g o b o l aa sil
heoi3_zap1_bo1_laa1: sil h eoi d aa m b o l aa sil
heoi3_zap1_bo1_laa1: sil h eoi w a n g o b o l aa sil
heoi3_zap1_bo1_laa1: sil h eoi z a p b o l aa sil
hoeng3_cin4: sil h aa ng h eoi c i n b i n sil
hoeng3_cin4: sil h aa ng h eoi c i n m i n sil
hoeng3_cin4: sil h aa n h eoi c i n b i n sil
hoeng3_cin4: sil h aa n h eoi c i n m i n sil
hoeng3_cin4: sil h eoi c i n b i n sil
hoeng3_cin4: sil h eoi c i n m i n sil
hoeng3_cin4: sil h oe ng c i n sil
hoeng3_hau6: sil f aa n h eoi l aa sil
hoeng3_hau6: sil h eoi h au b i n sil
hoeng3_hau6: sil h eoi h au m i n sil
hoeng3_hau6: sil h oe ng h au sil
hoi1_ci2_bei2_coi3: sil b ei c oi h oi c i sil
hoi1_ci2_bei2_coi3: sil h oi c i b ei c oi sil
hoi1_ci2: sil h oi c i sil
hou2_jai5_aa3: sil g a m j ai g aa sil
hou2_jai5_aa3: sil h ou j ai aa sil
hou2_jai5_aa3: sil h ou j ai o sil
hung1_sau2_dou6: sil h u ng s au d ou sil
jap6_kau4: sil j a p k au sil
jat1_ji6_saam1_siu3: sil j a t j i s aa m s iu sil
jau5_mou5_seon3_aa3: sil j au m ou s eo n aa sil
jau5_mou5_seon3_aa3: sil j au m ou s eo n o sil
jau5_mou5_seon3_aa3: sil ng o j au m ou s eo n aa sil
jau5_mou5_seon3_aa3: sil ng o j au m ou s eo n o sil
jau5_mou5_seon3_aa3: sil o j au m ou s eo n aa sil
jau5_mou5_seon3_aa3: sil o j au m ou s eo n o sil
jau5_mou5_si6_aa3: sil d i m aa sil
jau5_mou5_si6_aa3: sil d i m o sil
jau5_mou5_si6_aa3: sil j au m ou s i aa sil
jau5_mou5_si6_aa3: sil j au m ou s i o sil
jau5_mou5_si6_aa3: sil l ei d i m aa sil
jau5_mou5_si6_aa3: sil l ei d i m o sil
jau5_mou5_si6_aa3: sil l ei j au m ou s i aa sil
jau5_mou5_si6_aa3: sil l ei j au m ou s i o sil
jau5_mou5_si6_aa3: sil l ei m ou s i a m aa sil
jau5_mou5_si6_aa3: sil n ei d i m aa sil
jau5_mou5_si6_aa3: sil n ei d i m o sil
jau5_mou5_si6_aa3: sil n ei j au m ou s i aa sil
jau5_mou5_si6_aa3: sil n ei j au m ou s i o sil
jau5_mou5_si6_aa3: sil n ei m ou s i a m aa sil
jau6_min6: sil h eoi j au b i n sil
jau6_min6: sil h eoi j au m i n sil
jau6_min6: sil j au b i n sil
jau6_min6: sil j au m i n sil
ji4_gaa1_gei2_dim2_aa3: sil j i g aa g ei d i m sil
ji4_gaa1_gei2_dim2_aa3: sil j i g aa g ei d i m aa sil
ji4_gaa1_gei2_dim2_aa3: sil j i g aa g ei d i m o sil
ji4_gaa1_gei2_dim2_aa3: sil j i g aa g ei d i m z u ng sil
ji4_gaa1_gei2_dim2_aa3: sil j i g aa g ei d i m z u ng aa sil
ji4_gaa1_gei2_dim2_aa3: sil j i g aa g ei d i m z u ng o sil
jing2_soeng2_laa1: sil j i ng s oe ng sil
jing2_soeng2_laa1: sil j i ng s oe ng aa sil
jing2_soeng2_laa1: sil j i ng s oe ng l aa sil
jing2_soeng2_laa1: sil j i ng s oe ng o sil
jing2_soeng2_laa1: sil j i ng z oe ng s oe ng sil
jiu3_heoi3_fan3_laa3: sil j iu f a n g aau l aa sil
jiu3_heoi3_fan3_laa3: sil j iu h eoi f a n l aa sil
jiu3_m4_jiu3_caa1_din6_aa3: sil j iu c aa d i n m aa sil
jiu3_m4_jiu3_caa1_din6_aa3: sil j iu m j iu c aa d i n aa sil
jiu3_m4_jiu3_caa1_din6_aa3: sil j iu m j iu c aa d i n o sil
laa6_tei1: sil l aa t ei sil
laang5_zing6_di1_laa1: sil l aa ng z i ng d i l aa sil
laang5_zing6_di1_laa1: sil l aa n z i ng d i l aa sil
ling6_zyun3_min6: sil l i ng z yu n m i n sil
ling6_zyun3_min6: sil l i ng z yu n s a n sil
ling6_zyun3_min6: sil z yu n w aa n sil
m4_goi1: sil d o z e sil
m4_goi1: sil m g oi sil
m4_goi1: sil m g oi s aai sil
m4_hou2_cou4_laa1: sil m h ou c ou l aa sil
m4_hou2_cou4_laa1: sil s au s e ng l aa sil
m4_hou2_cou4_laa1: sil z i ng d i l aa sil
m4_hou2_fai6_laa1: sil m h ou f ai l aa sil
m4_zeon2_aa3: sil m d a cl sil
m4_zeon2_aa3: sil m h o j i sil
m4_zeon2_aa3: sil m h ou g a m j ai l aa sil
m4_zeon2_aa3: sil m z eo n aa sil
m4_zeon2_aa3: sil m z eo n g a m j oe ng sil
m4_zeon2_aa3: sil m z eo n o sil
maa1_kaa6_won4: sil m aa k aa w o n sil
maak3_daai6_hau2: sil d aa h oi sil
maak3_daai6_hau2: sil m aa k d aai h au sil
maak3_daai6_hau2: sil m aa k d aai h au aa sil
maak3_daai6_hau2: sil m aa k d aai h au o sil
maan5_ngon1: sil m aa n ng o n sil
maan5_ngon1: sil m aa n o n sil
nei5_gei2_seoi3_aa3: sil l ei g ei d o s eoi aa sil
nei5_gei2_seoi3_aa3: sil l ei g ei d o s eoi o sil
nei5_gei2_seoi3_aa3: sil l ei g ei s eoi aa sil
nei5_gei2_seoi3_aa3: sil l ei g ei s eoi o sil
nei5_gei2_seoi3_aa3: sil n ei g ei d o s eoi aa sil
nei5_gei2_seoi3_aa3: sil n ei g ei d o s eoi o sil
nei5_gei2_seoi3_aa3: sil n ei g ei s eoi aa sil
nei5_gei2_seoi3_aa3: sil n ei g ei s eoi o sil
nei5_giu3_mat1_je5_meng2_aa3:
sil l ei g iu m a t j e m e ng aa sil
nei5_giu3_mat1_je5_meng2_aa3:
sil l ei g iu m a t j e m e ng o sil
nei5_giu3_mat1_je5_meng2_aa3:
sil n ei g iu m a t j e m e ng aa sil
nei5_giu3_mat1_je5_meng2_aa3:
sil n ei g iu m a t j e m e ng o sil
ngaak1_sau2: sil aa k aa k s au sil
ngaak1_sau2: sil aa k ng aa k s au sil
ngaak1_sau2: sil aa k s au sil
ngaak1_sau2: sil aa k s au l aa sil
ngaak1_sau2: sil ng aa k aa k s au sil
ngaak1_sau2: sil ng aa k ng aa k s au sil
ngaak1_sau2: sil ng aa k s au sil
ngaak1_sau2: sil ng aa k s au l aa sil
ngaap3: sil aa cl sil
ngaap3: sil ng aa cl sil
ngo5_dei6_waan3_lo4: sil ng o d ei w aa n l aa sil
ngo5_dei6_waan3_lo4: sil ng o d ei w aa n l o sil
ngo5_dei6_waan3_lo4: sil o d ei w aa n l aa sil
ngo5_dei6_waan3_lo4: sil o d ei w aa n l o sil
ngo5_hai2_dou6_aa3: sil l i d ou aa sil
ngo5_hai2_dou6_aa3: sil l i d ou o sil
ngo5_hai2_dou6_aa3: sil ng o h ai d ou aa sil
ngo5_hai2_dou6_aa3: sil ng o h ai d ou o sil
ngo5_hai2_dou6_aa3: sil ng o h ai l i d ou aa sil
ngo5_hai2_dou6_aa3: sil ng o h ai l i d ou o sil
ngo5_hai2_dou6_aa3: sil ng o h ai n i d ou aa sil
ngo5_hai2_dou6_aa3: sil ng o h ai n i d ou o sil
ngo5_hai2_dou6_aa3: sil n i d ou aa sil
ngo5_hai2_dou6_aa3: sil n i d ou o sil
ngo5_hai2_dou6_aa3: sil o h ai d ou aa sil
ngo5_hai2_dou6_aa3: sil o h ai d ou o sil
ngo5_hai2_dou6_aa3: sil o h ai l i d ou aa sil
ngo5_hai2_dou6_aa3: sil o h ai l i d ou o sil
ngo5_hai2_dou6_aa3: sil o h ai n i d ou aa sil
ngo5_hai2_dou6_aa3: sil o h ai n i d ou o sil
ngo5_hou2_zung1_ji3_nei5: sil ng o h ou z u ng j i l ei sil
ngo5_hou2_zung1_ji3_nei5: sil ng o h ou z u ng j i n ei sil
ngo5_hou2_zung1_ji3_nei5: sil ng o z a n h ai z u ng j i l ei sil
ngo5_hou2_zung1_ji3_nei5: sil ng o z a n h ai z u ng j i n ei sil
ngo5_hou2_zung1_ji3_nei5: sil ng o z u ng j i l ei sil
ngo5_hou2_zung1_ji3_nei5: sil ng o z u ng j i n ei sil
ngo5_hou2_zung1_ji3_nei5: sil o h ou z u ng j i l ei sil
ngo5_hou2_zung1_ji3_nei5: sil o h ou z u ng j i n ei sil
ngo5_hou2_zung1_ji3_nei5: sil o z a n h ai z u ng j i l ei sil
ngo5_hou2_zung1_ji3_nei5: sil o z a n h ai z u ng j i n ei sil
ngo5_hou2_zung1_ji3_nei5: sil o z u ng j i l ei sil
ngo5_hou2_zung1_ji3_nei5: sil o z u ng j i n ei sil
paa1_hai2_dou6: sil f a n d ai sil
paa1_hai2_dou6: sil f a n d ai l aa sil
paa1_hai2_dou6: sil p aa h ai d ou sil
paa1_hai2_dou6: sil t aa n h ai d ou sil
pui4_ngo5_king1_haa5_gaai2_a2:
sil k i ng h aa g aai l o sil
pui4_ngo5_king1_haa5_gaai2_a2:
sil ng o d ei k i ng h aa g aai l o sil
pui4_ngo5_king1_haa5_gaai2_a2:
sil o d ei k i ng h aa g aai l o sil
pui4_ngo5_king1_haa5_gaai2_a2:
sil p ui ng o k i ng h aa g aai a sil
pui4_ngo5_king1_haa5_gaai2_a2:
sil p ui o k i ng h aa g aai a sil
saan3_maai4: sil s aa n m aai sil
sai2_m4_sai2_hap1_haa5_aa3:
sil f a n m f a n h aa aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil f a n m f a n h aa o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil j iu f a n g aau m aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil j iu f a n h aa m aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil j iu h a p h aa m aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil j iu m j iu f a n g aau aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil j iu m j iu f a n g aau o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil j iu m j iu h a p h aa aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil j iu m j iu h a p h aa o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil l ei j iu f a n g aau m aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil l ei j iu h a p h aa m aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil l ei j iu m j iu f a n g aau aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil l ei j iu m j iu f a n g aau o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil l ei j iu m j iu h a p h aa aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil l ei j iu m j iu h a p h aa o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil n ei j iu f a n g aau m aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil n ei j iu h a p h aa m aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil n ei j iu m j iu f a n g aau aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil n ei j iu m j iu f a n g aau o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil n ei j iu m j iu h a p h aa aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil n ei j iu m j iu h a p h aa o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil s ai m s ai f a n g aau aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil s ai m s ai f a n g aau o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil s ai m s ai f a n h aa aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil s ai m s ai f a n h aa o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil s ai m s ai h a p h aa aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil s ai m s ai h a p h aa o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil s ai m s ai t au h aa aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil s ai m s ai t au h aa o sil
sai2_m4_sai2_hap1_haa5_aa3:
sil t au m t au h aa aa sil
sai2_m4_sai2_hap1_haa5_aa3:
sil t au m t au h aa o sil
sai2_m4_sai2_jau1_sik1_aa3:
sil j iu j au s i k m aa sil
sai2_m4_sai2_jau1_sik1_aa3:
sil j iu m j iu j au s i k aa sil
sai2_m4_sai2_jau1_sik1_aa3:
sil j iu m j iu j au s i k o sil
sai2_m4_sai2_jau1_sik1_aa3:
sil s ai m s ai j au s i k aa sil
sai2_m4_sai2_jau1_sik1_aa3:
sil s ai m s ai j au s i k o sil
sai2_m4_sai2_sik6_faan6_aa3:
sil j iu m j iu s i k f aa n aa sil
sai2_m4_sai2_sik6_faan6_aa3:
sil j iu m j iu s i k f aa n o sil
sai2_m4_sai2_sik6_faan6_aa3:
sil j iu m j iu s i k j e aa sil
sai2_m4_sai2_sik6_faan6_aa3:
sil j iu m j iu s i k j e o sil
sai2_m4_sai2_sik6_faan6_aa3:
sil j iu s i k f aa n m aa sil
sai2_m4_sai2_sik6_faan6_aa3:
sil j iu s i k j e m aa sil
sai2_m4_sai2_sik6_faan6_aa3:
sil s ai m s ai s i k d i j e aa sil
sai2_m4_sai2_sik6_faan6_aa3:
sil s ai m s ai s i k d i j e o sil
sai2_m4_sai2_sik6_faan6_aa3:
sil s ai m s ai s i k f aa n aa sil
sai2_m4_sai2_sik6_faan6_aa3:
sil s ai m s ai s i k f aa n o sil
sai2_m4_sai2_sik6_faan6_aa3:
sil s ai m s ai s i k j e aa sil
sai2_m4_sai2_sik6_faan6_aa3:
sil s ai m s ai s i k j e o sil
sai2_m4_sai2_sik6_faan6_aa3:
sil s i k m s i k d i j e aa sil
sai2_m4_sai2_sik6_faan6_aa3:
sil s i k m s i k d i j e o sil
se6_kau4: sil s e k au sil
soeng6_jat1_fung1_seon3: sil s oe ng j a t f u ng s eo n sil
soeng6_jat1_fung1_seon3: sil s oe ng j a t g o i m eu sil
tek3_bo1_laa1: sil t e cl sil
tek3_bo1_laa1: sil t e k b o sil
tek3_bo1_laa1: sil t e k b o l aa sil
tek3_bo1_laa1: sil t e k g o b o sil
tek3_bo1_laa1: sil t e k l aa sil
teng1_ngo5_gong2_laa1: sil t e ng ng o g o ng sil
teng1_ngo5_gong2_laa1: sil t e ng ng o g o ng l aa sil
teng1_ngo5_gong2_laa1: sil t e ng o g o ng sil
teng1_ngo5_gong2_laa1: sil t e ng o g o ng l aa sil
teng1_ngo5_gong2_laa1: sil t e ng z yu sil
ting4_dai1: sil t i ng d ai sil
ting4_dai1: sil t i ng d ai l aa sil
ting4_dai1: sil t i ng h ai d ou sil
ting4_dai1: sil t i ng h ai d ou l aa sil
tiu3_mou5_laa1: sil t iu m ou sil
tiu3_mou5_laa1: sil t iu m ou l aa sil
tou5_m4_tou5_ngo6_aa3: sil l ei t ou m t ou ng o aa sil
tou5_m4_tou5_ngo6_aa3: sil l ei t ou m t ou ng o o sil
tou5_m4_tou5_ngo6_aa3: sil l ei t ou m t ou o aa sil
tou5_m4_tou5_ngo6_aa3: sil l ei t ou m t ou o o sil
tou5_m4_tou5_ngo6_aa3: sil l ei t ou ng o m aa sil
tou5_m4_tou5_ngo6_aa3: sil l ei t ou o m aa sil
tou5_m4_tou5_ngo6_aa3: sil n ei t ou m t ou ng o aa sil
tou5_m4_tou5_ngo6_aa3: sil n ei t ou m t ou ng o o sil
tou5_m4_tou5_ngo6_aa3: sil n ei t ou m t ou o aa sil
tou5_m4_tou5_ngo6_aa3: sil n ei t ou m t ou o o sil
tou5_m4_tou5_ngo6_aa3: sil n ei t ou ng o m aa sil
tou5_m4_tou5_ngo6_aa3: sil n ei t ou o m aa sil
tou5_m4_tou5_ngo6_aa3: sil t ou m t ou ng o aa sil
tou5_m4_tou5_ngo6_aa3: sil t ou m t ou ng o o sil
tou5_m4_tou5_ngo6_aa3: sil t ou m t ou o aa sil
tou5_m4_tou5_ngo6_aa3: sil t ou m t ou o o sil
waa6_bei2_ngo5_zi1_ji4_gaa1_gei2_dim2:
sil w aa b ei ng o z i j i g aa g ei d i m sil
waa6_bei2_ngo5_zi1_ji4_gaa1_gei2_dim2:
sil w aa b ei o z i j i g aa g ei d i m sil
zan1_hai6_dak1_ji3_laa3: sil l ei g a m d a k j i g e sil
zan1_hai6_dak1_ji3_laa3: sil n ei g a m d a k j i g e sil
zan1_hai6_dak1_ji3_laa3: sil z a n h ai d a k j i l aa sil
zan1_hai6_gwaai1_laa3: sil l ei h ou g w aai aa sil
zan1_hai6_gwaai1_laa3: sil l ei h ou g w aai o sil
zan1_hai6_gwaai1_laa3: sil n ei h ou g w aai aa sil
zan1_hai6_gwai1_laa3: sil n ei h ou g w aai o sil
zan1_hai6_gwaai1_laa3: sil z a n h ai g w aai l aa sil
zan1_hai6_zeng3: sil h ou z e ng sil
zan1_hai6_zeng3: sil z a n h ai z e ng sil
zau2_laa3: sil g o l ei l aa sil
zau2_laa3: sil g w o l ei l aa sil
zau2_laa3: sil l ei l aa sil
zau2_laa3: sil ng o d ei z au l aa sil
zau2_laa3: sil o d ei z au l aa sil
zau2_laa3: sil z au l aa sil
zau6_faai3_mou5_din6_laa3: sil z au f aai m ou d i n l aa sil
zek3_maau1_lei4_laa3: sil z e k m aau l ei g a n aa sil
zek3_maau1_lei4_laa3: sil z e k m aau l ei g a n o sil
zek3_maau1_lei4_laa3: sil z e k m aau l ei l aa sil
zo2_min6: sil h eoi z o b i n sil
zo2_min6: sil h eoi z o m i n sil
zo2_min6: sil z o b i n sil
zo2_mim6: sil z o m i n sil
zoi3_gong2_do1_ci3: sil z oi g o ng d o c i sil
zoi3_gong2_do1_ci3: sil z oi g o ng j a t c i sil
zou2_san4: sil z ou s a n sil
zyun3_jau6: sil z yu n j au sil
zyun3_zo2: sil z yu n z o sil
以上参照优选实施例说明了本发明。根据本公开,本领域的技术人员将会非常清楚其它实施例。例如,本发明可便利地采用与以上优选实施例中所述不同的配置和技术来实现。另外,本发明可有效地与不同于优选实施例以上所述的系统结合使用。因此,对优选实施例的这些及其它变更意在由本发明涵盖,它仅受所附权利要求的限制。
Claims (42)
1.一种用于执行语音识别过程的系统,包括:
识别器,配置成比较输入语音数据与来自合并词典的词典条目,所述合并词典是通过利用将具有相似含义的两个或两个以上相关短语映射到所述词典条目中的单个条目的合并技术来实现的;以及
处理器,配置成控制所述识别器,从而执行所述语音识别过程。
2.如权利要求1所述的系统,其特征在于,所述输入语音数据包括粤语语言数据,所述合并词典配置成精确地表示用于分析所述粤语语言数据的预定识别词汇。
3.如权利要求1所述的系统,其特征在于,所述识别器和所述处理器被实现为消费电子设备的一部分。
4.如权利要求1所述的系统,其特征在于,所述合并词典的所述合并技术通过防止所述识别器在所述语音识别过程中把所述相关短语其中之一误认为是所述相关短语中的另一个,来改进所述识别器的识别准确度特性。
5.如权利要求1所述的系统,其特征在于,所述词典条目中的每一个包括命令以及表示所述命令的发音特性的关联音素串。
6.如权利要求5所述的系统,其特征在于,所述识别器比较所述输入语音数据与来自所述词汇词典中的所述命令中每一个的所述音素串的隐马尔可夫模型,从而选择所识别单词。
7.如权利要求1所述的系统,其特征在于,所述合并技术基于来自所述两个或两个以上相关短语中每一个的虚词上下文,所述虚词上下文表明所述输入语音数据的初始说话者的预期语气。
8.如权利要求7所述的系统,其特征在于,所述两个或两个以上相关短语中每一个包括后面跟随所述虚词上下文的命令。
9.如权利要求8所述的系统,其特征在于,所述两个或两个以上相关短语其中之一具有断言性虚词上下文,用以表明所述输入语音数据的所述初始说话者的所述预期语气。
10.如权利要求9所述的系统,其特征在于,所述断言性虚词上下文在所述两个或两个以上相关短语中的所述一个之后没有包括结尾虚词。
11.如权利要求8所述的系统,其特征在于,所述两个或两个以上相关短语其中之一具有中性虚词上下文,用以表明所述输入语音数据的所述初始说话者的所述预期语气。
12.如权利要求11所述的系统,其特征在于,所述中性虚词上下文在所述两个或两个以上相关短语中的所述一个之后包括结尾虚词“aa3”。
13.如权利要求8所述的系统,其特征在于,所述两个或两个以上相关短语其中之一具有礼貌虚词上下文,用以表明所述输入语音数据的所述初始说话者的所述预期语气。
14.如权利要求13所述的系统,其特征在于,所述礼貌虚词上下文在所述两个或两个以上相关短语中的所述一个之后包括结尾虚词“1aa1”。
15.如权利要求8所述的系统,其特征在于,所述合并词典将所述两个或两个以上相关短语中的每个映射到对应于礼貌虚词上下文的合并词典条目中。
16.如权利要求1所述的系统,其特征在于,对于后面跟随改变虚词的命令,没有使用所述合并技术,因为所述改变虚词实质上改变了所述命令的含义。
17.如权利要求16所述的系统,其特征在于,所述改变虚词包括跟随所述命令的“maa”虚词和“ne”虚词其中至少一个。
18.如权利要求8所述的系统,其特征在于,所述虚词上下文可包括独立虚词“a”、“aa”、“laa”、“lo”、“o”、“ga”和“ge”。
19.如权利要求1所述的系统,其特征在于,所述合并技术用于将具有不相似发音、但具有相似含义的两个或两个以上相关短语映射到所述词典条目中的单个条目。
20.如权利要求1所述的系统,其特征在于,所述合并词典被实现为包括表示粤语语言的音素串而未采用相应音调信息作为所述音素串的一部分的词典条目。
21.一种用于执行语音识别过程的方法,包括以下步骤:
采用识别器来比较输入语音数据与来自合并词典的词典条目,所述合并词典采用将具有相似含义的两个或两个以上相关短语映射到所述词典条目中的单个条目的合并技术来实现;以及
采用处理器来控制所述识别器,从而执行所述语音识别过程。
22.如权利要求21所述的方法,其特征在于,所述输入语音数据包括粤语语言数据,所述合并词典配置成精确地表示用于分析所述粤语语言数据的预定识别词汇。
23.如权利要求21所述的方法,其特征在于,所述识别器和所述处理器被实现为消费电子设备的一部分。
24.如权利要求21所述的方法,其特征在于,所述合并词典的所述合并技术通过防止所述识别器在所述语音识别过程中把所述相关短语其中之一误认为是所述相关短语中的另一个,来改进所述识别器的识别准确度特性。
25.如权利要求21所述的方法,其特征在于,所述词典条目中的每一个包括命令以及表示所述命令的发音特性的关联音素串。
26.如权利要求25所述的方法,其特征在于,所述识别器比较所述输入语音数据与来自所述词汇词典中的所述命令中每一个的所述音素串的隐马尔可夫模型,从而选择所识别单词。
27.如权利要求21所述的方法,其特征在于,所述合并技术基于来自所述两个或两个以上相关短语中每一个的虚词上下文,所述虚词上下文表明所述输入语音数据的初始说话者的预期语气。
28.如权利要求27所述的方法,其特征在于,所述两个或两个以上相关短语中的每一个包括后面跟随所述虚词上下文的命令。
29.如权利要求28所述的方法,其特征在于,所述两个或两个以上相关短语其中之一具有断言性虚词上下文,用以表明所述输入语音数据的所述初始说话者的所述预期语气。
30.如权利要求29所述的方法,其特征在于,所述断言性虚词上下文在所述两个或两个以上相关短语中的所述一个之后没有包括结尾虚词。
31.如权利要求28所述的方法,其特征在于,所述两个或两个以上相关短语其中之一具有中性虚词上下文,用以表明所述输入语音数据的所述初始说话者的所述预期语气。
32.如权利要求31所述的方法,其特征在于,所述中性虚词上下文在所述两个或两个以上相关短语中的所述一个之后包括结尾虚词“aa3”。
33.如权利要求28所述的方法,其特征在于,所述两个或两个以上相关短语其中之一具有礼貌虚词上下文,用以表明所述输入语音数据的所述初始说话者的所述预期语气。
34.如权利要求33所述的方法,其特征在于,所述礼貌虚词上下文在所述两个或两个以上相关短语中的所述一个之后包括结尾虚词“laal”。
35.如权利要求28所述的方法,其特征在于,所述合并词典将所述两个或两个以上相关短语中的每个映射到对应于礼貌虚词上下文的合并词典条目。
36.如权利要求21所述的方法,其特征在于,对于后面跟随改变虚词的命令,没有使用所述合并技术,因为所述改变虚词实质上改变了所述命令的含义。
37.如权利要求36所述的方法,其特征在于,所述改变虚词包括跟随所述命令的“maa”虚词和“ne”虚词其中至少一个。
38.如权利要求28所述的方法,其特征在于,所述虚词上下文可包括独立虚词“a”、“aa”、“laa”、“lo”、“o”、“ga”和“ge”。
39.如权利要求21所述的方法,其特征在于,所述合并技术用于将具有不相似发音、但具有相似含义的两个或两个以上相关短语映射到所述词典条目中的单个条目。
40.如权利要求21所述的方法,其特征在于,所述合并词典被实现为包括表示粤语语言的音素串而不采用相应音调信息作为所述音素串的一部分的词典条目。
41.一种计算机可读介质,包括程序指令,用于通过执行以下步骤来执行语音识别过程:
采用识别器来比较输入语音数据与来自合并词典的词典条目,所述合并词典是采用将具有相似含义的两个或两个以上相关短语映射到所述词典条目中的单个条目的合并技术来实现的;以及
采用处理器来控制所述识别器,从而执行所述语音识别过程。
42.一种用于执行语音识别过程的系统,包括:
用于比较输入语音数据与来自合并词典的词典条目的装置,所述合并词典是采用将具有相似含义的两个或两个以上相关短语映射到所述词典条目中的单个条目的合并技术来实现的;以及
用于控制所述识别器、从而执行所述语音识别过程的装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/395,492 | 2003-03-24 | ||
US10/395,492 US7181396B2 (en) | 2003-03-24 | 2003-03-24 | System and method for speech recognition utilizing a merged dictionary |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1761996A true CN1761996A (zh) | 2006-04-19 |
CN100578613C CN100578613C (zh) | 2010-01-06 |
Family
ID=32988590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200480007702A Expired - Fee Related CN100578613C (zh) | 2003-03-24 | 2004-03-22 | 采用合并词典的语音识别系统及方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US7181396B2 (zh) |
CN (1) | CN100578613C (zh) |
HK (1) | HK1090735A1 (zh) |
WO (1) | WO2004086357A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105706163A (zh) * | 2013-11-06 | 2016-06-22 | 微软技术许可有限责任公司 | 检测语音输入短语混淆风险 |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7502731B2 (en) * | 2003-08-11 | 2009-03-10 | Sony Corporation | System and method for performing speech recognition by utilizing a multi-language dictionary |
WO2005103951A1 (en) | 2004-04-23 | 2005-11-03 | Novauris Technologies Limited | Tree index based method for accessing automatic directory |
GB2428853A (en) * | 2005-07-22 | 2007-02-07 | Novauris Technologies Ltd | Speech recognition application specific dictionary |
US8249873B2 (en) * | 2005-08-12 | 2012-08-21 | Avaya Inc. | Tonal correction of speech |
US20070050188A1 (en) * | 2005-08-26 | 2007-03-01 | Avaya Technology Corp. | Tone contour transformation of speech |
US7831431B2 (en) | 2006-10-31 | 2010-11-09 | Honda Motor Co., Ltd. | Voice recognition updates via remote broadcast signal |
US8099287B2 (en) | 2006-12-05 | 2012-01-17 | Nuance Communications, Inc. | Automatically providing a user with substitutes for potentially ambiguous user-defined speech commands |
US9045098B2 (en) * | 2009-12-01 | 2015-06-02 | Honda Motor Co., Ltd. | Vocabulary dictionary recompile for in-vehicle audio system |
US20110131040A1 (en) * | 2009-12-01 | 2011-06-02 | Honda Motor Co., Ltd | Multi-mode speech recognition |
WO2014000276A1 (en) * | 2012-06-29 | 2014-01-03 | Harman International (Shanghai) Management Co., Ltd. | Control logic analyzer and method thereof |
CN103680498A (zh) * | 2012-09-26 | 2014-03-26 | 华为技术有限公司 | 一种语音识别方法和设备 |
KR102298457B1 (ko) * | 2014-11-12 | 2021-09-07 | 삼성전자주식회사 | 영상표시장치, 영상표시장치의 구동방법 및 컴퓨터 판독가능 기록매체 |
US11176939B1 (en) | 2019-07-30 | 2021-11-16 | Suki AI, Inc. | Systems, methods, and storage media for performing actions based on utterance of a command |
CN114708860B (zh) * | 2022-05-10 | 2024-10-11 | 平安科技(深圳)有限公司 | 语音命令识别方法、装置、计算机设备及计算机可读介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5751905A (en) * | 1995-03-15 | 1998-05-12 | International Business Machines Corporation | Statistical acoustic processing method and apparatus for speech recognition using a toned phoneme system |
US5835888A (en) * | 1996-06-10 | 1998-11-10 | International Business Machines Corporation | Statistical language model for inflected languages |
US6233546B1 (en) * | 1998-11-19 | 2001-05-15 | William E. Datig | Method and system for machine translation using epistemic moments and stored dictionary entries |
US6192333B1 (en) * | 1998-05-12 | 2001-02-20 | Microsoft Corporation | System for creating a dictionary |
ATE374421T1 (de) * | 1998-08-28 | 2007-10-15 | Ibm | Segmentierungsverfahren zur erweiterung des aktiven vokabulars von spracherkennern |
US6308149B1 (en) * | 1998-12-16 | 2001-10-23 | Xerox Corporation | Grouping words with equivalent substrings by automatic clustering based on suffix relationships |
US6510410B1 (en) * | 2000-07-28 | 2003-01-21 | International Business Machines Corporation | Method and apparatus for recognizing tone languages using pitch information |
-
2003
- 2003-03-24 US US10/395,492 patent/US7181396B2/en not_active Expired - Lifetime
-
2004
- 2004-03-22 CN CN200480007702A patent/CN100578613C/zh not_active Expired - Fee Related
- 2004-03-22 WO PCT/US2004/008612 patent/WO2004086357A2/en active Application Filing
-
2006
- 2006-10-12 HK HK06111224.9A patent/HK1090735A1/xx not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105706163A (zh) * | 2013-11-06 | 2016-06-22 | 微软技术许可有限责任公司 | 检测语音输入短语混淆风险 |
CN105706163B (zh) * | 2013-11-06 | 2019-11-05 | 微软技术许可有限责任公司 | 用于检测语音输入短语混淆风险的方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
WO2004086357A3 (en) | 2005-03-24 |
CN100578613C (zh) | 2010-01-06 |
HK1090735A1 (en) | 2006-12-29 |
US7181396B2 (en) | 2007-02-20 |
US20040193416A1 (en) | 2004-09-30 |
WO2004086357A2 (en) | 2004-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1311423C (zh) | 利用多语言字典执行语音识别的系统和方法 | |
CN1237502C (zh) | 生成声音模型的方法、装置和生成声音模型的计算机程序 | |
CN1159704C (zh) | 信号分析装置 | |
CN1110757C (zh) | 处理两种文字对照的数据库的方法与装置 | |
CN1761996A (zh) | 采用合并词典的语音识别系统及方法 | |
CN1875345A (zh) | 在编译过程中表示和检查程序组件的一致性的可扩展类型系统 | |
CN1813252A (zh) | 信息处理方法、信息处理程序、信息处理装置及摇控器 | |
CN1842702A (zh) | 声音合成装置和声音合成方法 | |
CN1225484A (zh) | 地址识别设备和方法 | |
CN1856036A (zh) | 字幕产生设备和方法 | |
CN1126053C (zh) | 文件检索方法、文件检索发送方法及装置 | |
CN1296825C (zh) | 模拟器及模拟方法 | |
CN1066517A (zh) | 说明用户接口的方法及运行多用户接口型计算机的编程系统 | |
CN1315030C (zh) | 十笔结构数码输入法 | |
CN1632794A (zh) | 可扩展标记语言类型至关系数据库表的映射方法 | |
CN101059729A (zh) | 十笔首部尾部笔画数码输入法 | |
CN1889174A (zh) | 一种语音编码有声读物及其拾音器 | |
CN1655634A (zh) | 移动装置的显示信息的话音装置及其实现方法 | |
CN101036138A (zh) | 从第一语言到第二语言的自动翻译和/或处理集成电路处理单元中功能的方法以及用于执行该方法的装置 | |
CN1529846A (zh) | 在以过程语言开发的计算机软件应用程序中的导航 | |
CN1089919C (zh) | 一种叠加式按形归类的文字拆分编码输入方法及键盘 | |
CN1068127C (zh) | 文字信息处理方法和装置 | |
CN85107539A (zh) | 电脑通讯系统 | |
CN1503127A (zh) | 一种扩展程序存储空间和动态升级程序的程序编码方法 | |
CN87106390A (zh) | 阿、波、维、哈、柯文智能化语词处理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1090735 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: GR Ref document number: 1090735 Country of ref document: HK |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20100106 |