CN101206857A - 用于修改语音处理设置的方法和系统 - Google Patents

用于修改语音处理设置的方法和系统 Download PDF

Info

Publication number
CN101206857A
CN101206857A CNA2007101927429A CN200710192742A CN101206857A CN 101206857 A CN101206857 A CN 101206857A CN A2007101927429 A CNA2007101927429 A CN A2007101927429A CN 200710192742 A CN200710192742 A CN 200710192742A CN 101206857 A CN101206857 A CN 101206857A
Authority
CN
China
Prior art keywords
input
processing system
speech processing
acoustic enviroment
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101927429A
Other languages
English (en)
Other versions
CN101206857B (zh
Inventor
D·戴姆斯
F·戈梅斯
B·D·梅茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101206857A publication Critical patent/CN101206857A/zh
Application granted granted Critical
Publication of CN101206857B publication Critical patent/CN101206857B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种基于诸如天气输入的非声音外部输入执行修改的语音处理系统和方法。在该系统中,声学环境可以包括麦克风和扬声器。麦克风可以接收语音输入至语音处理系统/扬声器可以从语音处理系统产生语音输出。外部输入处理器可以接收与声学环境相关的非声音输入,并将接收的输入与相关的配置文件匹配。设置调节器可以根据基于由所述外部输入处理器处理的输入的配置文件来动态调节所述语音处理系统的设置。例如,所述设置可以包括定制的噪声过滤算法、识别置信度阈值、输出能量等级和/或变换器增益设置。

Description

用于修改语音处理设置的方法和系统
技术领域
本发明涉及语音处理的领域,更具体地涉及根据不直接涉及工作声学环境中的声音的外部输入对语音处理系统的修改。
背景技术
语音处理系统利用各种基于声音的输入来调节语音处理环境的语音应用设置和音频特性。例如,可以对语音输入进行分析以确定讲话者的语言方言和/或性别,同时可以基于分析的结果对语音识别设置(例如,语言)进行调节。在另一实例中,可以对声学环境的周围噪声进行采样,并使用所述周围噪声来调节附加的设置,诸如麦克风灵敏度和扬声器音量。另外,可以利用来自多个方向的麦克风的输入来捕获声音,并且还可以在执行语音识别动作之前利用诸如滤波和减噪的数字信号处理技术来预处理所捕获的输入。
不管可以基于出现在语音识别系统的声学环境内的声音进行调节的宽度,传统上忽略了声学环境的非声音输入。与基于声音的因素相比,这些非声音输入通常可以对于语音处理系统或者利用这种系统的用户体验具有更大的影响。例如天气因素和/或用户特定因素可以对利用语音处理系统的用户体验具有重大影响。
例如,如果用户正站在雨中使用语音使能的自动柜员机(ATM),则包括加强的但很少使用的选项的冗长提示可能会使得试图执行快速交易的淋雨用户非常恼火。另外,与清晰的环境相比,对于下雨环境可能非常难以得到最佳声学设置;变换器的性能尤其受到天气条件的影响。天气还可能影响语音处理环境的周围噪声特性。例如,较高的风力可能干扰用户语音命令的捕获并产生过强的背景噪声量。
需要的是一种用来捕获各种形式的外部输入并使用该输入调节语音应用设置和/或与语音处理系统相关联的声学模型的手段。理想的情况是,这种解决方案将会从特定声学环境的各种源收集不同类型的有关数据。即,为了调节系统以提供最佳服务,将对容纳有语音处理系统的工作声学环境内的条件进行检测。
发明内容
本发明提供了一种解决方案,该解决方案基于诸如天气的外部输入自动修改语音处理系统的特性。所述外部输入可以包括直接声音输入之外的输入,诸如周围噪声,一些传统语音处理系统为了声级调节的目的而利用所述直接声音输入之外的输入。如此处所使用的,外部输入可以包括影响用户与语音处理系统的交互体验的任何条件,诸如用户位置、用户心率、等候使用系统的队列的长度、影响该系统的天气条件等。例如,本发明可以允许语音处理系统加入来自当前环境的天气信息以及动态利用特定的声学模型和特别为检测的天气条件(例如,晴朗、刮风、下雨、暴风雨等)而定制的系统识别阈值,从而根据所述当前的天气条件来优化系统性能。
本发明可以根据与此处提供的材料一致的若干方面来实现。例如,本发明的一个方面可以包括基于诸如天气输入的非声音外部输入来执行修改的语音处理系统。在所述系统中,声学环境可以包括麦克风和扬声器。所述麦克风可以将语音输入接收至语音处理系统/所述扬声器可以从语音处理系统产生语音输出。外部输入处理器可以接收与所述声学环境相关的非声音输入,并将所接收的输入与相关的配置文件相匹配。设置调节器可以基于配置文件来动态调节所述语音处理系统的设置,所述配置文件基于由所述外部输入处理器处理的输入。例如,所述设置可以包括定制的噪声过滤算法、识别置信度阈值、输出能量等级和/或变换器增益设置。
本发明的另一方面可以包括一种用于修改语音处理设置的方法。所述方法可以包括接收与语音处理系统的用户和声学环境中的至少一个相关联的实时输入的步骤。所述实时输入可以是非语音输入。前面建立的配置文件可以根据与所接收的输入匹配的配置文件集来确定。所述配置文件可以与所述语音处理系统的至少一个设置相关联。可以根据所确定的配置文件的设置来动态地和自动地调节语音处理系统。
本发明的另一方面可以包括一种用于自动调节语音处理系统的设置的方法。在所述方法中,可以确定影响声学环境的至少一个天气条件,语音处理系统的语音输入从所述声学环境接收。可以根据所确定的天气条件来自动调节所述语音处理系统的至少一个设置以优化所述系统。
应当注意,本发明的各个方面可以作为用于控制计算设备实现此处描述功能的程序而实现,或者作为用于使计算设备能够执行与此处公开的步骤对应的处理的程序而实现。该程序可以通过在磁盘、光盘、半导体存储器或者任何其他记录介质中存储程序来提供。所述程序还可以作为经由载波传递的数字编码的信号来提供。所描述的程序可以是单个程序,或者可以作为多个子程序来实现,所述多个子程序中的每个都在单个计算设备内进行交互或者以分布的形式跨过网络空间进行交互。
还应当注意,此处描述的方法还可以是响应于服务请求至少部分由服务代理和/或由服务代理操纵的机器来执行的方法。
附图说明
在附图中示出了目前优选的实施例,然而应当理解,本发明并不限于示出的确切布置和手段。
图1是示出了根据此处公开的本发明布置的实施例的语音处理系统的示意图,所述语音处理系统可以基于与环境声音不直接相关的外部输入来修改操作。
图2是示出了根据此处公开的本发明布置的实施例的方法的流程图,其中语音处理系统可以基于外部输入来修改操作。
图3是示出了根据此处公开的本发明布置的实施例语音处理系统可以如何使用外部输入来调节操作的图示。
图4是示出了根据此处公开的本发明布置的实施例的方法的流程图,其中服务代理可以配置语音处理系统以基于与环境声音不直接相关的外部输入来修改其操作。
具体实施方式
图1是示出了根据此处公开的本发明布置的实施例的语音处理系统125的示意图,所述语音处理系统可以基于与环境声音不直接相关的外部输入来修改操作。在图1中,用户110可以与语音处理系统125进行交互。用户110可以位于声学环境105中,所述声学环境可以包括传感器112和113、麦克风115和扬声器117。在一个预期的配置中,麦克风115和扬声器117可以集成到容纳语音处理系统125的外壳中。
由用户110持有或位于用户110身上的传感器112可以收集用户110相关的数据,并将该数据作为输入143传送到语音处理系统125。例如,语音使能的手持装置(即,系统125)可以检测到蓝牙耳机正用于提供输出。指示该系统条件的输入142可以传送至系统125,该系统125能够相应地自动修改输出特性。在另一实例中,传感器112可以确定用户的脉搏率或者向系统125提供其他语言学输入143,该系统将基于输入143来进行调节。
定位在声学环境105中的另一传感器113可以收集环境数据,诸如风速或者大气压,并将该数据作为输入142传送到语音处理系统125。语音处理系统125还可以从一个或多个服务器120接收输入141。这些服务器120可以为系统125提供各种数据,诸如本地报告的天气条件、卫星雷达图、与用户110相关的配置文件特定信息等。
输入141、142和143可以通过语音处理系统125的外部输入处理器126进行处理。外部输入处理器126可以执行软件代码以识别与声学环境105中存在的当前条件相关的有关数据。一旦已经对输入141、142和143进行了处理,外部输入处理器126就可以调用输入至配置文件转换器127。
输入至配置文件转换器127可以访问包括在数据存储器135中的配置文件137,并基于处理的输入141-143来确定应当启动哪个配置文件。例如,与本地天气条件有关的输入的接收可以使得输入至配置文件转换器127访问天气配置文件138。如该实例所示,天气配置文件138可以包括诸如刮风和下雨的有关天气条件的值以及相关联的设置配置文件以基于处理的外部输入使用。应当注意的是,天气配置文件138中示出的内容仅仅是为了示例性目的,并非是对本发明进行限制。
确定哪些配置文件137可应用于声学环境105的条件之后,输入至配置文件转换器127可以将与确定的配置文件137相关联的设置130传送到语音处理引擎128。如该实例中所示,设置130可以包括诸如扬声器调节、麦克风调节、识别阈值、噪声消除设置、语音应用设置等的项目。可以通过语音处理引擎128对语音处理系统125的相关联部件来制定这些设置130。
在一种布置中,对于系统125而言,配置文件137可以在任一时刻都是激活的或者有效的,这将使得可以进行多种调节。例如,在雨天脉搏率高(输入143)的用户正在使用系统125的场景中,可以使“下雨”配置文件137和“匆忙用户”配置文件137都有效。另外,基于声音的条件可以与其他输入141-143结合,以生成更加准确的配置文件137和/或进一步优化系统125。例如,用户110的讲话速率可以是确定用户110处于激动状态还是放松状态的因素。在另一实例中,来自环境105的周围声音采样可以与天气输入141-142结合,以优化环境105条件的其他变换器115-117设置和增益。
通过语音处理系统125进行的调节可以影响系统接收和处理发声147的方式和/或可以影响提供语音输出156的方式。例如,刮风条件可以使得系统125增加麦克风115捕获发声147的灵敏度。此外,还可以对提供语音输出156至用户110的扬声器117的音量进行调节以对刮风条件进行补偿。
图2是示出了根据此处公开的本发明布置的实施例的方法200的流程图,其中语音处理系统可以基于外部输入对操作进行调节。方法200可以在系统100的场合下执行。
方法200以步骤205开始,在该步骤,可以在声学环境中检测与环境声音不直接相关的至少一个外部条件。在步骤210,检测的外部条件信息可以发送至语音处理系统。在步骤215,语音处理系统可以基于接收到的信息来确定环境配置文件。
在步骤220中,可以确定与配置文相关联的设置集和/或声学模型。在步骤225,语音处理系统可以基于步骤220中确定的声学模型/设置来调节需要的设置。为了基于声学环境中的改变来动态调节操作设置,则可以返回到步骤205以反复执行该方法。
图3是示出了根据此处公开的本发明布置的实施例语音处理系统可以如何使用外部输入来调节操作的图示300。图示300中示出的实例可以利用系统100和/或方法200。
在该图示300中,用户305可以试图与话音使能的ATM310执行交易。ATM310可以配备有用于收集语音输入的麦克风311、语音处理系统312、用于生成语音输出的扬声器313、摄像机314以及一个或多个传感器315。语音处理系统312可以代表系统100的语音处理系统125。ATM310可以使用这些部件来收集和处理数据,以根据用户和环境条件来调节操作。
传感器315可以代表用以检测各种环境条件的仪器。例如,传感器315可以包括湿度计,用以测量ATM310周围的湿度水平,从而确定当前的天气条件316是否是下雨。传感器315还可以包括用以测量ATM310正在经受的风速的风速计。传感器315收集的数据可以传送至语音处理系统312,以用于进一步处理。
许多ATM310已经配备有用于安全目的的摄像机314。摄像机314还可以用于收集可以由语音处理系统312利用的一般用户数据。如该实例中所示,摄像机314可以用于确定用户305的高度,由虚线指示。该信息可以指示用户305是个年轻人。可以通过对麦克风311捕获的话音输入进行采样来执行一般年龄分组的确定。诸如音调和音色的特征可以由语音处理系统312用来确定用户305诸如年龄和性别的特征。
在一个实施例中,摄像机314或者其他传感器315可以用于确定等待使用ATM310的人员的排队长度。当排队较长时,系统312可以从正常提示状态调节到简洁提示状态,该简洁提示状态可以与“匆忙用户”配置文件或者“加急服务”配置文件相关联。加急服务配置文件可以致使提供的ATM310选项最少、提示的冗长度降低、语音输出的讲话速率增加等。
由ATM310的部件收集的数据可以致使语音处理系统312确定年轻配置文件320和下雨配置文件325可应用于该用户305和天气条件316。如该实例所示,年轻配置文件320和下雨配置文件325可以具有诸如扬声器音量和提示冗长度的重叠的设置以及诸如麦克风位置和噪声消除的独特设置。
语音处理系统312可以将相关联的规则应用到这些配置文件,以确定结果设置330的集。正如该实例所示,结果设置330包括来自每个配置文件的所有项目以及在配置文件320和325都包含该项目时的最高设置。然后结果设置330可以用来调节ATM310的操作及其部件。
图4是示出了根据此处公开的本发明布置的实施例的方法400的流程图,其中服务代理可以配置语音处理系统以基于与环境声音不直接相关的外部输入来修改其操作。可以在系统100和/或方法200的场合下执行方法400。
当客户启动服务请求时,方法400可以在步骤405开始。服务请求可以是要求服务代理向客户提供新的语音处理系统的请求,所述新的语音处理系统可以基于与环境声音不直接相关的外部输入来修改其操作。服务请求还可以要求代理利用基于外部输入修改操作的能力来增强现有语音处理系统。服务请求还可以要求技术人员查找现有系统的问题的故障。
在步骤410,可以选择人工代理来响应服务请求。在步骤415,人工代理可以分析客户的当前系统和/或问题,并且可以响应性地得到解决方案。在步骤420,人工代理可以使用一个或多个计算设备来配置语音处理系统,以基于与环境声音不直接相关的外部输入来修改操作。该步骤可以包括输入至配置文件转换器和外部输入处理器的安装和配置以及操作配置文件的创建。
在步骤425,人工代理可以可选地维护使用外部输入来调节操作的语音处理系统或者查找该系统的故障。在步骤430,人工代理可以完成服务活动。
本发明可以以硬件、软件或者硬件和软件的结合来实现。本发明可以在一个计算机系统中以集中的方式来实现,也可以以其中不同元件跨过若干互连的计算机系统而分布的分布方式来实现。任何种类的计算机系统或者适用于实现在此描述的方法的其他装置都是适合的。软件和硬件的典型结合可以是具有计算机程序的通用计算机系统,当所述计算机程序被加载并执行时,控制所述计算机系统使其执行此处描述的方法。
本发明还可以嵌入在计算机程序产品中,所述计算机程序产品包括能够执行此处描述方法的所有特征,并且在加载入计算机系统时能够执行这些方法。在本发明的上下文中,计算机程序意味着任何语言、代码或符号的指令集表示,所述指令集旨在使得系统具有信息处理能力,以能够直接或者在下列处理任一个或者二者之后执行特定功能:a)至任何语言、代码或者符号的转换;b)以不同的材料形式再生。
在并未脱离本发明的精神或者基本属性的情况下,还可以以其他形式来体现本发明。因此,当表明本发明的范围时,应当参考下列权利要求书而不是前述说明。

Claims (20)

1.一种语音处理系统,包括:
声学环境,所述声学环境包括用于接收语音输入的至少一个麦克风;
语音处理系统,所述语音处理系统配置用于接收语音输入、基于所述语音输入自动执行计划性动作集以及提供因所述计划性的动作而产生的输出;
外部输入处理器,所述外部输入处理器配置用于接收与所述声学环境相关的非声音输入以及将所接收的输入与相关的配置文件匹配;以及
设置调节器,所述设置调节器配置用于根据基于由所述外部输入处理器处理的输入而确定的配置文件来动态调节所述语音处理系统的设置。
2.根据权利要求1所述的系统,其中所述声学环境进一步包括用于以可听的方式提供语音输出的至少一个扬声器,并且其中所述语音处理系统的输出包括经由所述至少一个扬声器提供的语音输出。
3.根据权利要求1所述的系统,其中所述自动调节的设置包括建立定制的噪声过滤算法和建立定制的识别置信度阈值集中的至少一个。
4.根据权利要求1所述的系统,进一步包括:
供所述系统用户佩戴的传感器,所述传感器向所述语音处理系统提供用户特定的非声音输入,所述用户特定的非声音输入由所述外部输入处理器处理。
5.根据权利要求1所述的系统,进一步包括:
定位于所述声学环境中用于测量天气条件的传感器,其中所述传感器生成所述非声音输入,所述传感器包括湿度计、风速计、气压计和温度计中的至少一个。
6.根据权利要求1所述的系统,进一步包括:
离所述语音处理系统和所述声学环境远程定位的服务器,该服务器通信链接至所述语音处理系统,其中来自所述服务器的所述非语音输入包括专用于所述声学环境的临近位置的动态数据。
7.根据权利要求6所述的系统,其中所述动态数据与天气相关。
8.根据权利要求1所述的系统,其中所述非声音输入包括关于所述语音处理系统的用户的实时生理输入,其中所述用户位于所述声学环境中。
9.根据权利要求1所述的系统,其中所述非声音输入包括基于天气的输入。
10.根据权利要求9所述的系统,其中所述声学环境是室外环境,其中由所述设置调节器进行的调节包括优化与所述室外环境的天气条件对应的声学模型。
11.一种用于修改语音处理设置的方法,包括:
接收与语音处理系统的声学环境和用户中的至少一个相关联的实时输入,其中所述实时输入是非语音输入;
从配置文件集中确定与所接收的输入匹配的先前建立的配置文件,其中所述配置文件与所述语音处理系统的至少一个设置相关联;以及
动态地且自动地调节至少一个设置。
12.根据权利要求11所述的方法,进一步包括:
重复执行所述接收、确定和调节步骤。
13.根据权利要求11所述的方法,其中所述实时输入包括与所述用户相关联的生理输入和与所述声学环境相关联的天气输入中的至少一个。
14.根据权利要求11所述的方法,其中所述实时输入是从临近所述声学环境定位的传感器得到的与天气相关的输入,所述传感器包括湿度计、风速计、气压计和温度计中的至少一个。
15.根据权利要求11所述的方法,其中所述实时输入从离所述语音处理环境和所述语音处理服务器远程定位的服务器传送,所述实时输入专用于临近所述声学环境的位置。
16.根据权利要求11所述的方法,其中所述调节步骤进一步包括下列至少之一:
调节定制的噪声过滤算法;
调节所述语音处理系统的至少一个识别置信度阈值;以及
调节与所述声学环境相关的声学模型,所述语音处理系统的声学设置基于所述声学模型。
17.根据权利要求11所述的方法,其中权利要求11所述的步骤通过服务代理和所述服务代理操纵的计算设备中至少一个来执行,所述步骤响应于服务请求而执行。
18.根据权利要求11所述的方法,其中权利要求11的所述步骤由至少一个机器根据至少一个计算机程序来执行,所述计算机程序具有可由所述至少一个机器执行的多个代码部分。
19.一种自动调节语音处理系统的设置的方法,包括:
确定影响声学环境的至少一个天气条件,语音处理系统的语音输入从所述声学环境接收;以及
根据所确定的天气条件自动调节所述语音处理系统的至少一个设置以优化所述系统。
20.根据权利要求19所述的方法,进一步包括:
针对不同的天气条件建立多个配置文件,每个配置文件与语音处理设置集相关;以及
基于所确定的至少一个天气条件选择所述多个配置文件之一,其中所述调节步骤的所述至少一个设置是与所选择的配置文件相关联的语音处理设置集。
CN2007101927429A 2006-12-19 2007-11-16 用于修改语音处理设置的方法和系统 Expired - Fee Related CN101206857B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/612,722 2006-12-19
US11/612,722 US20080147411A1 (en) 2006-12-19 2006-12-19 Adaptation of a speech processing system from external input that is not directly related to sounds in an operational acoustic environment

Publications (2)

Publication Number Publication Date
CN101206857A true CN101206857A (zh) 2008-06-25
CN101206857B CN101206857B (zh) 2012-05-30

Family

ID=39528617

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101927429A Expired - Fee Related CN101206857B (zh) 2006-12-19 2007-11-16 用于修改语音处理设置的方法和系统

Country Status (2)

Country Link
US (1) US20080147411A1 (zh)
CN (1) CN101206857B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102903360A (zh) * 2011-07-26 2013-01-30 财团法人工业技术研究院 以麦克风阵列为基础的语音辨识系统与方法
CN103179251A (zh) * 2011-12-22 2013-06-26 三星电子株式会社 便携式终端中调节音量的装置和方法
CN103329576A (zh) * 2011-01-05 2013-09-25 皇家飞利浦电子股份有限公司 音频系统及其操作方法
CN103578468A (zh) * 2012-08-01 2014-02-12 联想(北京)有限公司 一种语音识别中置信度阈值的调整方法及电子设备
CN104345649A (zh) * 2013-08-09 2015-02-11 晨星半导体股份有限公司 应用于声控装置的控制器与相关方法
CN104867495A (zh) * 2013-08-28 2015-08-26 德州仪器公司 上下文感知的声音标志检测
CN105355201A (zh) * 2015-11-27 2016-02-24 百度在线网络技术(北京)有限公司 基于场景的语音服务处理方法、装置和终端设备
CN105556595A (zh) * 2013-09-17 2016-05-04 高通股份有限公司 用于调整用于激活话音辅助功能的检测阈值的方法及设备
CN106653010A (zh) * 2015-11-03 2017-05-10 络达科技股份有限公司 电子装置及其透过语音辨识唤醒的方法
CN106796790A (zh) * 2016-11-16 2017-05-31 深圳达闼科技控股有限公司 机器人语音指令识别的方法及相关机器人装置
CN103810005B (zh) * 2012-11-13 2018-04-10 通用汽车环球科技运作有限责任公司 用于语音系统的调节方法和系统
CN108564948A (zh) * 2018-03-30 2018-09-21 联想(北京)有限公司 一种语音识别方法及电子设备

Families Citing this family (161)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US7904311B2 (en) * 2007-02-16 2011-03-08 Aetna Inc. Medical management modeler and associated methods
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
US10255566B2 (en) 2011-06-03 2019-04-09 Apple Inc. Generating and processing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
CN102667926A (zh) * 2009-12-21 2012-09-12 富士通株式会社 声音控制装置以及声音控制方法
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
CA3023918C (en) * 2011-09-30 2022-11-29 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
JP5904021B2 (ja) * 2012-06-07 2016-04-13 ソニー株式会社 情報処理装置、電子機器、情報処理方法、及びプログラム
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9767828B1 (en) * 2012-06-27 2017-09-19 Amazon Technologies, Inc. Acoustic echo cancellation using visual cues
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9159315B1 (en) * 2013-01-07 2015-10-13 Google Inc. Environmentally aware speech recognition
KR20150104615A (ko) 2013-02-07 2015-09-15 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US20140278395A1 (en) * 2013-03-12 2014-09-18 Motorola Mobility Llc Method and Apparatus for Determining a Motion Environment Profile to Adapt Voice Recognition Processing
US20140278392A1 (en) * 2013-03-12 2014-09-18 Motorola Mobility Llc Method and Apparatus for Pre-Processing Audio Signals
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
KR101759009B1 (ko) 2013-03-15 2017-07-17 애플 인크. 적어도 부분적인 보이스 커맨드 시스템을 트레이닝시키는 것
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105264524B (zh) 2013-06-09 2019-08-02 苹果公司 用于实现跨数字助理的两个或更多个实例的会话持续性的设备、方法、和图形用户界面
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
CN105453026A (zh) 2013-08-06 2016-03-30 苹果公司 基于来自远程设备的活动自动激活智能响应
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
CN103617797A (zh) 2013-12-09 2014-03-05 腾讯科技(深圳)有限公司 一种语音处理方法,及装置
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
EP3149728B1 (en) 2014-05-30 2019-01-16 Apple Inc. Multi-command single utterance input method
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9530408B2 (en) 2014-10-31 2016-12-27 At&T Intellectual Property I, L.P. Acoustic environment recognizer for optimal speech processing
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
CN107168677A (zh) * 2017-03-30 2017-09-15 联想(北京)有限公司 音频处理方法及装置、电子设备、存储介质
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US11438452B1 (en) 2019-08-09 2022-09-06 Apple Inc. Propagating context information in a privacy preserving manner

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5146539A (en) * 1984-11-30 1992-09-08 Texas Instruments Incorporated Method for utilizing formant frequencies in speech recognition
US6205425B1 (en) * 1989-09-22 2001-03-20 Kit-Fun Ho System and method for speech recognition by aerodynamics and acoustics
DE4330143A1 (de) * 1993-09-07 1995-03-16 Philips Patentverwaltung Anordnung zur Siganlverarbeitung akustischer Eingangssignale
US5568559A (en) * 1993-12-17 1996-10-22 Canon Kabushiki Kaisha Sound processing apparatus
JP3254994B2 (ja) * 1995-03-01 2002-02-12 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
US5960397A (en) * 1997-05-27 1999-09-28 At&T Corp System and method of recognizing an acoustic environment to adapt a set of based recognition models to the current acoustic environment for subsequent speech recognition
US6420975B1 (en) * 1999-08-25 2002-07-16 Donnelly Corporation Interior rearview mirror sound processing system
US6842877B2 (en) * 1998-12-18 2005-01-11 Tangis Corporation Contextual responses based on automated learning techniques
US6463415B2 (en) * 1999-08-31 2002-10-08 Accenture Llp 69voice authentication system and method for regulating border crossing
JP3969908B2 (ja) * 1999-09-14 2007-09-05 キヤノン株式会社 音声入力端末器、音声認識装置、音声通信システム及び音声通信方法
US7110951B1 (en) * 2000-03-03 2006-09-19 Dorothy Lemelson, legal representative System and method for enhancing speech intelligibility for the hearing impaired
US6587824B1 (en) * 2000-05-04 2003-07-01 Visteon Global Technologies, Inc. Selective speaker adaptation for an in-vehicle speech recognition system
US6674865B1 (en) * 2000-10-19 2004-01-06 Lear Corporation Automatic volume control for communication system
US7117145B1 (en) * 2000-10-19 2006-10-03 Lear Corporation Adaptive filter for speech enhancement in a noisy environment
US20020087306A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented noise normalization method and system
US7617099B2 (en) * 2001-02-12 2009-11-10 FortMedia Inc. Noise suppression by two-channel tandem spectrum modification for speech signal in an automobile
EP1256875A1 (en) * 2001-05-10 2002-11-13 Nokia Corporation Method and device for context dependent user input prediction
EP1293964A3 (en) * 2001-09-13 2004-05-12 Matsushita Electric Industrial Co., Ltd. Adaptation of a speech recognition method to individual users and environments with transfer of data between a terminal and a server
US6937980B2 (en) * 2001-10-02 2005-08-30 Telefonaktiebolaget Lm Ericsson (Publ) Speech recognition using microphone antenna array
EP1486300B1 (en) * 2002-03-15 2011-08-17 Sony Corporation Robot behavior control system, behavior control method, and robot device
US7072834B2 (en) * 2002-04-05 2006-07-04 Intel Corporation Adapting to adverse acoustic environment in speech processing using playback training data
US7224981B2 (en) * 2002-06-20 2007-05-29 Intel Corporation Speech recognition of mobile devices
JP4352790B2 (ja) * 2002-10-31 2009-10-28 セイコーエプソン株式会社 音響モデル作成方法および音声認識装置ならびに音声認識装置を有する乗り物
US7457745B2 (en) * 2002-12-03 2008-11-25 Hrl Laboratories, Llc Method and apparatus for fast on-line automatic speaker/environment adaptation for speech/speaker recognition in the presence of changing environments
US7885420B2 (en) * 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US7613532B2 (en) * 2003-11-10 2009-11-03 Microsoft Corporation Systems and methods for improving the signal to noise ratio for audio input in a computing system
US7626110B2 (en) * 2004-06-02 2009-12-01 Stmicroelectronics Asia Pacific Pte. Ltd. Energy-based audio pattern recognition
US20060074660A1 (en) * 2004-09-29 2006-04-06 France Telecom Method and apparatus for enhancing speech recognition accuracy by using geographic data to filter a set of words
FR2883656B1 (fr) * 2005-03-25 2008-09-19 Imra Europ Sas Soc Par Actions Traitement continu de la parole utilisant une fonction de transfert heterogene et adaptee

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103329576A (zh) * 2011-01-05 2013-09-25 皇家飞利浦电子股份有限公司 音频系统及其操作方法
CN102903360B (zh) * 2011-07-26 2014-08-27 财团法人工业技术研究院 以麦克风阵列为基础的语音辨识系统与方法
CN102903360A (zh) * 2011-07-26 2013-01-30 财团法人工业技术研究院 以麦克风阵列为基础的语音辨识系统与方法
US8744849B2 (en) 2011-07-26 2014-06-03 Industrial Technology Research Institute Microphone-array-based speech recognition system and method
CN103179251A (zh) * 2011-12-22 2013-06-26 三星电子株式会社 便携式终端中调节音量的装置和方法
CN103578468B (zh) * 2012-08-01 2017-06-27 联想(北京)有限公司 一种语音识别中置信度阈值的调整方法及电子设备
CN103578468A (zh) * 2012-08-01 2014-02-12 联想(北京)有限公司 一种语音识别中置信度阈值的调整方法及电子设备
CN103810005B (zh) * 2012-11-13 2018-04-10 通用汽车环球科技运作有限责任公司 用于语音系统的调节方法和系统
CN104345649A (zh) * 2013-08-09 2015-02-11 晨星半导体股份有限公司 应用于声控装置的控制器与相关方法
CN104867495A (zh) * 2013-08-28 2015-08-26 德州仪器公司 上下文感知的声音标志检测
CN105556595A (zh) * 2013-09-17 2016-05-04 高通股份有限公司 用于调整用于激活话音辅助功能的检测阈值的方法及设备
CN105556595B (zh) * 2013-09-17 2019-11-01 高通股份有限公司 用于调整用于激活话音辅助功能的检测阈值的方法及设备
CN106653010A (zh) * 2015-11-03 2017-05-10 络达科技股份有限公司 电子装置及其透过语音辨识唤醒的方法
CN106653010B (zh) * 2015-11-03 2020-07-24 络达科技股份有限公司 电子装置及其透过语音辨识唤醒的方法
CN105355201A (zh) * 2015-11-27 2016-02-24 百度在线网络技术(北京)有限公司 基于场景的语音服务处理方法、装置和终端设备
CN106796790A (zh) * 2016-11-16 2017-05-31 深圳达闼科技控股有限公司 机器人语音指令识别的方法及相关机器人装置
CN106796790B (zh) * 2016-11-16 2020-11-10 深圳达闼科技控股有限公司 机器人语音指令识别的方法及相关机器人装置
CN108564948A (zh) * 2018-03-30 2018-09-21 联想(北京)有限公司 一种语音识别方法及电子设备

Also Published As

Publication number Publication date
US20080147411A1 (en) 2008-06-19
CN101206857B (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
CN101206857B (zh) 用于修改语音处理设置的方法和系统
EP3525204B1 (en) Method and apparatus to provide comprehensive smart assistant services
JP4166153B2 (ja) 鳴声の音声的特徴分析に基づく犬の感情判別装置及びその方法
CN110310623B (zh) 样本生成方法、模型训练方法、装置、介质及电子设备
CN105741836B (zh) 声音识别装置以及声音识别方法
EP3057093B1 (en) Operating method for voice function and electronic device supporting the same
US20190088251A1 (en) Speech signal recognition system and method
US8831939B2 (en) Voice data transferring device, terminal device, voice data transferring method, and voice recognition system
CN109637520B (zh) 基于语音分析的敏感内容识别方法、装置、终端及介质
JP7171532B2 (ja) 音声を認識する装置及び方法、音声認識モデルをトレーニングする装置及び方法
CN110444202B (zh) 复合语音识别方法、装置、设备及计算机可读存储介质
JP2019035941A (ja) 個人化された音声認識方法及びこれを行うユーザ端末及びサーバ
CN110459222A (zh) 语音控制方法、语音控制装置及终端设备
CN112820291A (zh) 智能家居控制方法、系统和存储介质
US20200219487A1 (en) Information processing apparatus and information processing method
KR20210153165A (ko) 음성 인식 기능을 제공하는 인공 지능 기기, 인공 지능 기기의 동작 방법
WO2014173325A1 (zh) 喉音识别方法及装置
EP1063635A2 (en) Method and apparatus for improving speech command recognition accuracy using event-based constraints
US20240013784A1 (en) Speaker recognition adaptation
CN110308886A (zh) 提供与个性化任务相关联的声音命令服务的系统和方法
CN110933225A (zh) 通话信息获取方法、装置、存储介质及电子设备
CN109841221A (zh) 基于语音识别的参数调节方法、装置及健身设备
CN110728993A (zh) 一种变声识别方法及电子设备
KR20200082137A (ko) 전자 장치 및 그의 제어 방법
KR20190021088A (ko) 음성 명령을 이용한 동작을 수행하는 전자 장치 및 전자 장치의 동작 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: NIUAOSI COMMUNICATIONS LIMITED

Free format text: FORMER OWNER: INTERNATIONAL BUSINESS MACHINE CORP.

Effective date: 20090925

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20090925

Address after: Massachusetts, USA

Applicant after: Nuance Communications, Inc.

Address before: New York grams of Armand

Applicant before: International Business Machines Corp.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120530

Termination date: 20211116

CF01 Termination of patent right due to non-payment of annual fee