CN103871400A - 用于语音系统的方法和系统 - Google Patents

用于语音系统的方法和系统 Download PDF

Info

Publication number
CN103871400A
CN103871400A CN201310757199.8A CN201310757199A CN103871400A CN 103871400 A CN103871400 A CN 103871400A CN 201310757199 A CN201310757199 A CN 201310757199A CN 103871400 A CN103871400 A CN 103871400A
Authority
CN
China
Prior art keywords
user
mark
sounding
module
designate similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310757199.8A
Other languages
English (en)
Inventor
R·M·赫奇特
O·尖霍尼
U·温特
R·D·辛斯三世
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GM Global Technology Operations LLC
Original Assignee
GM Global Technology Operations LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GM Global Technology Operations LLC filed Critical GM Global Technology Operations LLC
Publication of CN103871400A publication Critical patent/CN103871400A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60RVEHICLES, VEHICLE FITTINGS, OR VEHICLE PARTS, NOT OTHERWISE PROVIDED FOR
    • B60R16/00Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for
    • B60R16/02Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements
    • B60R16/037Electric or fluid circuits specially adapted for vehicles and not otherwise provided for; Arrangement of elements of electric or fluid circuits specially adapted for vehicles and not otherwise provided for electric constitutive elements for occupant comfort, e.g. for automatic adjustment of appliances according to personal settings, e.g. seats, mirrors, steering wheel
    • B60R16/0373Voice control
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3605Destination input or retrieval
    • G01C21/3608Destination input or retrieval using speech input, e.g. using speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/227Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology

Abstract

提供了一种用于语音系统的方法和系统,具体地,提供了用于车辆的语音系统的方法和系统。在一个实施例中,该方法包括:从自语音系统的用户处接收的语音发声中产生发声标记,而不没有对用户识别交互作用的特定需求;基于所述发声标记为用户生成用户标记;以及,基于所述用户标记来管理与用户有关的对话。

Description

用于语音系统的方法和系统
相关申请的交叉引用
本申请要求2012年11月13日提交的美国临时申请No.61/725,804的权益,其全部内容在此通过引用被并入。
技术领域
技术领域一般涉及语音系统,并且更具体地,涉及为车辆的语音系统产生用户标记的方法和系统。
背景技术
车辆语音识别系统对车辆乘客发出的语音进行语音识别。语音发声典型地包括控制车辆的一个或多个特征或者可由车辆访问的其他系统(例如但不限于,银行业务和购物)的命令。语音对话系统利用了一般的对话技术,使得来自车辆中任何乘客的语音发声都能被处理。每个用户在使用语音对话系统时可能具有不同的熟练程度和偏好。因此,一般的对话系统对所有用户而言可能并不理想。
因此,期望提供用于识别和追踪用户的方法和系统。因此,还期望提供一种方法和系统,其基于对用户的识别和追踪来对语音对话系统进行管理和调整。此外,从接下来的详细描述和所附权利要求,并且结合附图和前述的技术领域以及背景技术,本发明的其他期望特征和特性将显而易见。
发明内容
提供了用于车辆语音系统的方法和系统。在一个实施例中,所述方法包括:从自语音系统的用户处接收的语音发声来产生发声标记,而不存在对用户识别交互作用的特定需求;基于发声标记来为用户产生用户标记;以及,基于用户标记管理与用户有关的对话。
在另一个实施例中,一种系统包括第一模块,所述第一模块用于从自语音系统的用户处接收的语音发声来产生发声标记,而不存在对用户识别交互作用的特定需求。第二模块基于发声标记为用户产生用户标记。第三模块基于用户标记来管理与用户有关的对话。
本发明还包括下列方案:
1.一种用于车辆的语音系统的方法,包括:
从自所述语音系统的用户处接收的语音发声来产生发声标记,而没有对用户识别交互作用的特定需求;
基于所述发声标记来为用户生成用户标记;和
基于所述用户标记来管理与所述用户有关的对话。
2.如方案1所述的方法,其中,所述生成包括:基于所述发声标记和存储的用户标记来生成所述用户标记。
3.如方案2所述的方法,其中,所述存储的用户标记是基于至少两个在先的发声标记。
4.如方案3所述的方法,其中,所述存储的用户标记还基于交互作用中的全部或一些在先发声。
5.如方案1所述的方法,其中,所述生成用户标记包括:确定不存在与所述发声标记类似的用户标记,以及将所述发声标记作为所述用户标记存储在数据库中。
6.如方案1所述的方法,其中,所述产生用户标记包括:确定存在与所述发声标记类似的用户标记,利用所述发声标记来对与所述发声标记类似的所述用户标记进行更新,以及将更新后的用户标记存储在数据库中。
7.如方案6所述的方法,其中,所述确定存在与所述发声标记类似的用户标记包括:确定来自相同事务处理的用户标记不存在。
8.如方案6所述的方法,其中,所述确定存在与所述发声标记类似的用户标记包括:确定来自不同事务处理的用户标记不存在。
9.如方案1所述的方法,进一步包括:基于第二用户标记,基本上同时管理与第二用户有关的对话。
10.如方案9所述的方法,其中,所述管理与第二用户有关的对话还基于波束形成。
11.如方案1所述的方法,其中,管理对话包括:基于所述用户标记来调整与所述用户有关的提示和交互作用序列中的至少一个。
12.一种车辆语音系统,包括:
第一模块,所述第一模块从自所述语音系统的用户处接收的语音发声来产生发声标记,而没有对用户识别交互作用的特定需求;
第二模块,所述第二模块基于所述发声标记为所述用户生成用户标记;和
第三模块,所述第三模块基于所述用户标记来管理与所述用户有关的对话。
13.如方案12所述的语音系统,其中,所述第二模块基于所述发声标记和存储的用户标记来生成所述用户标记。
14.如方案13所述的语音系统,其中,所述存储的用户标记是基于至少两个在先的发声标记,或者基于交互作用中的全部或一些在先发声的集合。
15.如方案12所述的语音系统,其中,所述第二模块通过下述来生成所述用户标记:确定不存在与所述发声标记类似的用户标记,以及将所述发声标记作为所述用户标记存储在数据库中。
16.如方案12所述的语音系统,其中,所述第二模块通过下述来生成所述用户标记:确定存在与所述发声标记类似的用户标记,利用所述发声标记来对与所述发声标记类似的所述用户标记进行更新,以及将更新后的用户标记存储在数据库中。
17.如方案16所述的语音系统,其中,所述第二模块通过确定来自相同事务处理的用户标记不存在来确定与所述发声标记类似的用户标记存在。
18.如方案16所述的语音系统,其中,所述第二模块通过确定来自不同事务处理的用户标记不存在来确定与所述发声标记类似的用户标记存在。
19.如方案12所述的语音系统,其中,所述第三模块基于第二用户标记基本上同时管理与第二用户有关的对话。
20.如方案19所述的语音系统,其中,所述第三模块基于波束形成来管理与所述第二用户有关的对话。
21.如方案12所述的语音系统,其中,所述第三模块通过下述来管理所述对话:基于所述用户标记,调整与所述用户有关的提示和交互作用序列中的至少一个。
附图说明
下面将结合下列附图对示例性实施例进行描述,附图中相同的附图标记指示了相同的元件,并且附图中:
图1为车辆的功能框图,其包括根据各种示例性实施例的语音系统;
图2为数据流图,其示出了根据各种示例性实施例的语音系统的标记引擎;和
图3是序列图,其示出了标记产生方法,所述标记产生方法可以由根据各种示例性实施例的语音系统执行。
具体实施方式
下面的详细描述本质上仅是示例性的,且并不旨在限制本发明以及其应用。此外,也不旨在受到前述技术领域、背景技术、发明内容或者下面的详细描述中所出现的任何明确或暗示的理论的约束。如在此所用地,术语“模块”指的是专用集成电路(ASIC)、电子电路、执行一种或多种软件或固件程序的处理器(共享的、专用的或成组的)和存储器、组合逻辑电路和/或提供了所述功能的其它合适部件。
根据本发明的示例性实施例,示出了语音系统10被包含在车辆12内。在各种示例性实施例中,语音系统10通过人机接口模块(HMI模块)14为一个或多个车辆系统提供了语音识别和/或对话。这样的车辆系统可以包括但不限于,例如电话系统16、导航系统18、媒体系统20、远程信息处理系统22、网络系统24,或者可以包括依赖语音的应用的任何其它车辆系统。应当认识到,语音系统10的一个或多个实施例可以应用于具有依赖语音的应用的其它非车辆系统,因此,并不局限于当前的车辆示例。
语音系统10通过HMI模块14和通信总线和/或其他通信装置26(例如,有线的、短程无线的或远程无线的)与多种车辆系统16-24进行通信。所述通信总线可以是,例如但不限于,CAN总线。
语音系统10包括语音识别引擎(ASR)模块32和对话管理器模块34。应当理解的是,如所示的那样,ASR模块32和对话管理器模块34可以被实施成分立的系统和/或组合的系统。ASR模块32接收和处理来自HMI模块14的语音发声。一些从语音发声中识别出的命令(例如,基于置信度阈值)被发送给对话管理器模块34。对话管理器模块34基于所述命令来管理交互作用序列和提示。在各种实施例中,语音系统10还包括文本到语音引擎(未示出),其接收和处理从HMI模块14接收到的文本。文本到语音引擎产生由对话管理器模块34类似地使用的命令。
在各种示例性实施例中,语音系统10还包括标记引擎模块30。标记引擎模块30接收和处理来自HMI模块14的语音发声。附加地或替代地,标记引擎模块30接收和处理由ASR模块32所执行的处理产生的信息(例如,通过语音识别处理所提取的特征、通过语音识别处理所确定的字边界,等等)。标记引擎模块30识别语音系统10的用户,并且基于语音发声(以及,在一些情况下,基于来自ASR模块32的信息)为语音系统的每个用户建立用户标记。
在各种示例性实施例中,标记引擎模块30基于语音发声且随着时间的过去来逐渐建立用户标记,而不需要用户主动识别其自身。然后,对话管理器模块34利用用户标记进行追踪,并且为每个特定用户调整提示和交互作用序列。通过利用用户标记,对话管理器模块34以及因此语音系统10可以同时管理与两个或更多个用户有关的两个或更多个对话。
现参照图2,所图示的数据流图示出了根据各种示例性实施例的标记引擎模块30。应当理解的是,根据现有的公开内容,标记引擎模块30的各种示例性实施例可以包括任意数量的子模块。在各种实施例中,图2中所示的子模块可以组合和/或进一步分割,以类似地产生用户标记。在各种示例性实施例中,标记引擎模块30包括标记产生器模块40、标记建立器模块42和标记数据库44。
标记产生器模块40接收由用户通过HMI模块14(图1)提供的语音发声46作为输入。标记产生器模块40处理语音发声46,并且基于语音发声46的特征来产生发声标记48。例如,标记引擎模块40可以执行超向量方法以进行说话人识别并产生发声标记48。该方法将音频流转换成高维空间中的单个点。从原始表示的变换(即,音频至目标表示)可以通过多个阶段来进行。例如,首先可以将信号切分成多个窗口,并进行梅尔倒谱(Mel-Cepstrum)变换。该表示将每个窗口映射为空间中的一个点,所述空间中距离与音素差别相关。两个点相距越远,则它们来自同一音素的可能性越小。如果忽略时间,则该点的集合(每个点针对一个窗口)可以被概括为梅尔倒谱空间中的概率分布。该分布对于每个说话人来说都是几乎唯一的。对该分布进行建模的一种通常方法是通过高斯混合模型(GMM)来进行。因此,所述标记可以表示为由全部的GMM高斯函数的均值(means)产生的GMM或超向量。
应当理解的是,所述方法仅仅是示例性的。用于产生用户标记的其它方法被认为落入本发明的范围内。因此,本发明并不局限于现有的例子。
标记建立器模块42接收发声标记48作为输入。基于发声标记48,标记建立器模块42使用用户标记50来更新标记数据库44。例如,如果标记数据库44中不存在用户标记50,则标记建立器模块42将发声标记48作为用户标记50存储到标记数据库44中。然而,如果标记数据库44中存在一个或多个在先存储的用户标记50,则标记建立器模块42将该发声标记48与在先存储的用户发声标记48进行比较。如果发声标记48与用户标记50不相似,则发声标记48被当作新的用户标记50存储到标记数据库44中。然而,如果发声标记48与所存储的用户标记50类似,则类似的用户标记50通过发声标记48被更新并且被存储在标记数据库44中。应当理解的是,术语“存在”和“不存在”指的是硬判决和软判决两者,其中似然值被分配给“存在”和“不存在”。
例如,如上述的例子,在说话人的GMM是从多个说话人的全局GMM调整而来的映射的情况下,可以在发声标记48和存储的用户标记50两者的GMM分布参数中执行校正。校正后的均值(means)的集合可以被结合成单个高维向量。该空间中的距离与说话人之间的差别相关。因此,可以评估向量间的距离以确定相似的标记。一旦找到了相似的标记,则每个标记48、50的GMM可以被合并,并且作为更新后的用户标记50进行存储。
应当理解的是,所述方法仅仅是示例性的。用于产生用户标记的其它方法也被认为落入本发明的范围内。因此,本发明并不局限于现有的例子。
现参照图3,所示的序列图示出了一种标记产生方法,其可以由根据各种示例性实施例的语音系统10执行。应当理解的是,在本发明的启示下,该方法中的操作顺序并不局限于图3中所示的执行顺序,而是可以根据应用和现有的公开按照一种或多种不同的顺序来执行。应当进一步理解的是,可以添加或去除方法中的一个或多个步骤,而不改变本方法的精神。
如所示,在100处,用户通过HMI模块14将语音发声提供至ASR模块32。在110处,由ASR模块32对语音发声进行评估以确定口头表达的命令。在120处,在给出判据(例如,置信度分数)的情况下,口头表达的命令被提供给对话管理器模块34。基本上同时或稍微随后地,在130处,由HMI模块14将语音发声提供给标记引擎30。然后,标记引擎30对语音发声进行评估。例如,在140处,标记产生器模块40使用超向量方法或一些其它方法对语音发声进行处理以确定标记。标记建立器模块42在150处使用该标记来建立,并且在160处存储用户标记。用户标记或该标记的多个隐式表示,例如分数(scores),在170处被发送至对话管理器。在180,对话管理器模块40使用用户标记和命令来确定对话的提示和/或交互作用序列。在190,所述对话管理器模块将所述提示或命令提供给HMI模块。
应当理解的是,对于用户提供的任意数量的语音发声而言,所述序列是可以重复的。还应当理解的是,可以同时为多个用户提供的多个语音发声执行相同或类似的序列。在这种情况下,为每个用户产生单独的用户标记,并且基于单独的用户标记来为每个用户管理对话。在各种实施例中,为了提高精确度,在管理对话中除了用户标记之外还可以使用波束形成技术。
尽管在前述的详细描述中已经公开了至少一个示例性实施例,但应当理解的是,存在大量的变形。还应当理解的是,一个或多个示例性实施例只是例子,且不旨在以任何方式限制本发明的范围、应用或配置。相反,前述的详细描述将为本领域技术人员提供实现所述一个或多个示例性实施例的便捷路线图。应当理解的是,可以在不脱离由所附权利要求书及其法律等同物阐明的本发明范围的情况下,对功能和元件的设置进行各种变化。

Claims (10)

1.一种用于车辆的语音系统的方法,包括:
从自所述语音系统的用户处接收的语音发声来产生发声标记,而没有对用户识别交互作用的特定需求;
基于所述发声标记来为用户生成用户标记;和
基于所述用户标记来管理与所述用户有关的对话。
2.如权利要求1所述的方法,其中,所述生成包括:基于所述发声标记和存储的用户标记来生成所述用户标记。
3.如权利要求2所述的方法,其中,所述存储的用户标记是基于至少两个在先的发声标记。
4.如权利要求3所述的方法,其中,所述存储的用户标记还基于交互作用中的全部或一些在先发声。
5.如权利要求1所述的方法,其中,所述生成用户标记包括:确定不存在与所述发声标记类似的用户标记,以及将所述发声标记作为所述用户标记存储在数据库中。
6.如权利要求1所述的方法,其中,所述产生用户标记包括:确定存在与所述发声标记类似的用户标记,利用所述发声标记来对与所述发声标记类似的所述用户标记进行更新,以及将更新后的用户标记存储在数据库中。
7.如权利要求6所述的方法,其中,所述确定存在与所述发声标记类似的用户标记包括:确定来自相同事务处理的用户标记不存在。
8.如权利要求6所述的方法,其中,所述确定存在与所述发声标记类似的用户标记包括:确定来自不同事务处理的用户标记不存在。
9.如权利要求1所述的方法,进一步包括:基于第二用户标记,基本上同时管理与第二用户有关的对话。
10.一种车辆语音系统,包括:
第一模块,所述第一模块从自所述语音系统的用户处接收的语音发声来产生发声标记,而没有对用户识别交互作用的特定需求;
第二模块,所述第二模块基于所述发声标记为所述用户生成用户标记;和
第三模块,所述第三模块基于所述用户标记来管理与所述用户有关的对话。
CN201310757199.8A 2012-11-13 2013-11-13 用于语音系统的方法和系统 Pending CN103871400A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201261725804P 2012-11-13 2012-11-13
US61/725804 2012-11-13
US14/059955 2013-10-22
US14/059,955 US20140136204A1 (en) 2012-11-13 2013-10-22 Methods and systems for speech systems

Publications (1)

Publication Number Publication Date
CN103871400A true CN103871400A (zh) 2014-06-18

Family

ID=50556054

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310757199.8A Pending CN103871400A (zh) 2012-11-13 2013-11-13 用于语音系统的方法和系统

Country Status (3)

Country Link
US (1) US20140136204A1 (zh)
CN (1) CN103871400A (zh)
DE (1) DE102013222520B4 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105225660A (zh) * 2014-06-30 2016-01-06 通用汽车环球科技运作有限责任公司 语音系统的适应方法和系统
CN110297702A (zh) * 2019-05-27 2019-10-01 北京蓦然认知科技有限公司 一种多任务并行处理方法和装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140358538A1 (en) * 2013-05-28 2014-12-04 GM Global Technology Operations LLC Methods and systems for shaping dialog of speech systems

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1462366A (zh) * 2001-05-10 2003-12-17 皇家菲利浦电子有限公司 说话人声音的后台学习
US6973426B1 (en) * 2000-12-29 2005-12-06 Cisco Technology, Inc. Method and apparatus for performing speaker verification based on speaker independent recognition of commands
US20080065380A1 (en) * 2006-09-08 2008-03-13 Kwak Keun Chang On-line speaker recognition method and apparatus thereof
US20090119103A1 (en) * 2007-10-10 2009-05-07 Franz Gerl Speaker recognition system
US20120284026A1 (en) * 2011-05-06 2012-11-08 Nexidia Inc. Speaker verification system

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6073101A (en) * 1996-02-02 2000-06-06 International Business Machines Corporation Text independent speaker recognition for transparent command ambiguity resolution and continuous access control
SE9602622L (sv) * 1996-07-01 1997-09-08 Telia Ab Förfarande och arrangemang för adaptering av modeller vid exempelvis talarverifieringssystem
US6141644A (en) * 1998-09-04 2000-10-31 Matsushita Electric Industrial Co., Ltd. Speaker verification and speaker identification based on eigenvoices
US7263489B2 (en) * 1998-12-01 2007-08-28 Nuance Communications, Inc. Detection of characteristics of human-machine interactions for dialog customization and analysis
US6253179B1 (en) * 1999-01-29 2001-06-26 International Business Machines Corporation Method and apparatus for multi-environment speaker verification
US6691089B1 (en) * 1999-09-30 2004-02-10 Mindspeed Technologies Inc. User configurable levels of security for a speaker verification system
US6526335B1 (en) * 2000-01-24 2003-02-25 G. Victor Treyz Automobile personal computer systems
DE10110316B4 (de) * 2000-03-15 2004-09-23 International Business Machines Corp. Sichere Passworteingabe
US6587824B1 (en) * 2000-05-04 2003-07-01 Visteon Global Technologies, Inc. Selective speaker adaptation for an in-vehicle speech recognition system
US7054811B2 (en) * 2002-11-06 2006-05-30 Cellmax Systems Ltd. Method and system for verifying and enabling user access based on voice parameters
US7240007B2 (en) * 2001-12-13 2007-07-03 Matsushita Electric Industrial Co., Ltd. Speaker authentication by fusion of voiceprint match attempt results with additional information
US7379868B2 (en) * 2002-07-18 2008-05-27 Massachusetts Institute Of Technology Method and apparatus for differential compression of speaker models
US20040176946A1 (en) * 2002-10-17 2004-09-09 Jayadev Billa Pronunciation symbols based on the orthographic lexicon of a language
JP2004348658A (ja) * 2003-05-26 2004-12-09 Nissan Motor Co Ltd 車両用情報提供方法および車両用情報提供装置
US7454349B2 (en) * 2003-12-15 2008-11-18 Rsa Security Inc. Virtual voiceprint system and method for generating voiceprints
US20050273333A1 (en) * 2004-06-02 2005-12-08 Philippe Morin Speaker verification for security systems with mixed mode machine-human authentication
ATE400474T1 (de) * 2005-02-23 2008-07-15 Harman Becker Automotive Sys Spracherkennungssytem in einem kraftfahrzeug
US7519531B2 (en) * 2005-03-30 2009-04-14 Microsoft Corporation Speaker adaptive learning of resonance targets in a hidden trajectory model of speech coarticulation
US20060293892A1 (en) * 2005-06-22 2006-12-28 Jan Pathuel Biometric control systems and associated methods of use
US20080080678A1 (en) * 2006-09-29 2008-04-03 Motorola, Inc. Method and system for personalized voice dialogue
WO2008086216A2 (en) * 2007-01-05 2008-07-17 Johnson Controls Technology Company System and method for customized audio prompting
US8099288B2 (en) * 2007-02-12 2012-01-17 Microsoft Corp. Text-dependent speaker verification
KR20080090034A (ko) * 2007-04-03 2008-10-08 삼성전자주식회사 음성 화자 인식 방법 및 시스템
US20090055178A1 (en) * 2007-08-23 2009-02-26 Coon Bradley S System and method of controlling personalized settings in a vehicle
US8332223B2 (en) * 2008-10-24 2012-12-11 Nuance Communications, Inc. Speaker verification methods and apparatus
US9218807B2 (en) * 2010-01-08 2015-12-22 Nuance Communications, Inc. Calibration of a speech recognition engine using validated text
US9318114B2 (en) * 2010-11-24 2016-04-19 At&T Intellectual Property I, L.P. System and method for generating challenge utterances for speaker verification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6973426B1 (en) * 2000-12-29 2005-12-06 Cisco Technology, Inc. Method and apparatus for performing speaker verification based on speaker independent recognition of commands
CN1462366A (zh) * 2001-05-10 2003-12-17 皇家菲利浦电子有限公司 说话人声音的后台学习
US20080065380A1 (en) * 2006-09-08 2008-03-13 Kwak Keun Chang On-line speaker recognition method and apparatus thereof
US20090119103A1 (en) * 2007-10-10 2009-05-07 Franz Gerl Speaker recognition system
US20120284026A1 (en) * 2011-05-06 2012-11-08 Nexidia Inc. Speaker verification system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105225660A (zh) * 2014-06-30 2016-01-06 通用汽车环球科技运作有限责任公司 语音系统的适应方法和系统
CN105225660B (zh) * 2014-06-30 2019-07-05 通用汽车环球科技运作有限责任公司 语音系统的适应方法和系统
CN110297702A (zh) * 2019-05-27 2019-10-01 北京蓦然认知科技有限公司 一种多任务并行处理方法和装置
CN110297702B (zh) * 2019-05-27 2021-06-18 北京蓦然认知科技有限公司 一种多任务并行处理方法和装置

Also Published As

Publication number Publication date
DE102013222520A1 (de) 2014-05-15
US20140136204A1 (en) 2014-05-15
DE102013222520B4 (de) 2016-09-22

Similar Documents

Publication Publication Date Title
EP3750110B1 (en) Methods and systems for intent detection and slot filling in spoken dialogue systems
CN109791767B (zh) 用于语音识别的系统和方法
KR102201937B1 (ko) 후속 음성 쿼리 예측
US8527271B2 (en) Method for speech recognition
US8666743B2 (en) Speech recognition method for selecting a combination of list elements via a speech input
US9299347B1 (en) Speech recognition using associative mapping
CN105096940A (zh) 用于进行语音识别的方法和装置
US9715877B2 (en) Systems and methods for a navigation system utilizing dictation and partial match search
CN103337241B (zh) 一种语音识别方法和装置
CN103810995A (zh) 用于语音系统的调节方法和系统
CN104112448B (zh) 用于管理语音系统的对话的方法和系统
JP2010191400A (ja) 音声認識装置およびデータ更新方法
CN107045871A (zh) 利用外部数据源重新识别语音
US20160061619A1 (en) Navigation system with touchless command mechanism and method of operation thereof
CN105047196A (zh) 语音识别系统中的语音假象补偿系统和方法
CN103871400A (zh) 用于语音系统的方法和系统
US20140067400A1 (en) Phonetic information generating device, vehicle-mounted information device, and database generation method
US10468017B2 (en) System and method for understanding standard language and dialects
CN112863496B (zh) 一种语音端点检测方法以及装置
WO2020238341A1 (zh) 语音识别的方法、装置、设备及计算机可读存储介质
CN114242047A (zh) 一种语音处理方法、装置、电子设备及存储介质
CN111798839A (zh) 语音识别方法、装置、移动终端及计算机可读存储介质
CN114283780A (zh) 语音合成方法、装置、电子设备和存储介质
CN117456999B (zh) 音频识别方法、音频识别装置、车辆、计算机设备和介质
CN113553827B (zh) 一种信息处理方法、装置、设备和计算机存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140618