CN101164102A - 自动扩展移动通信设备的话音词汇的方法和装置 - Google Patents

自动扩展移动通信设备的话音词汇的方法和装置 Download PDF

Info

Publication number
CN101164102A
CN101164102A CNA2006800080989A CN200680008098A CN101164102A CN 101164102 A CN101164102 A CN 101164102A CN A2006800080989 A CNA2006800080989 A CN A2006800080989A CN 200680008098 A CN200680008098 A CN 200680008098A CN 101164102 A CN101164102 A CN 101164102A
Authority
CN
China
Prior art keywords
word
speech recognition
recognition device
words
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800080989A
Other languages
English (en)
Other versions
CN101164102B (zh
Inventor
丹尼尔·L·罗森
乔丹·科恩
艾里亚斯·P.·贝拉基斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nuance Communications Inc
Original Assignee
Voice Signal Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Voice Signal Technologies Inc filed Critical Voice Signal Technologies Inc
Publication of CN101164102A publication Critical patent/CN101164102A/zh
Application granted granted Critical
Publication of CN101164102B publication Critical patent/CN101164102B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Abstract

一种用于提高语音识别器性能的方法,所述方法包括:为语音识别器提供词典;监测用户与网络的交互作用;访问多个与所监测的交互作用关联的词语;以及将所述多个词语包括在词典中。

Description

自动扩展移动通信设备的话音词汇的方法和装置
技术领域
本发明涉及具有语音识别能力的移动通信设备。
背景技术
现代移动通信设备(MCD)比传统单用途的移动语音电话提供更多的功能。这些设备可以包括地址簿、日历、Web浏览器、数字音乐播放器、电子邮件器、文本消息器、词语处理器、照相机,以及其它应用。用户特定的对文本数据的选择通常是和这些应用的每一个相关联的。例如,地址簿通常包含所述用户的联系方式的合适的人名,而数字音乐播放器包括用户音乐采集(collection)的音乐描述符,例如艺术家和歌名。随着驻留在移动通信设备上的应用的数量增长,这些文本数据的采集可能呈现为用户个人信息的日益增长的巨大主体。
语音识别能力通常包含在这些设备中,用于命令和控制所述设备,并作为用于一种或多种应用的输入形式。近来,一些移动设备已经包括了大词汇量(大约30,000词语)的独立于说话者的语音识别器,以使得用户能够执行语音到文本的消息传递。然而,这些语音识别器的词汇是预定的,而且没有利用可驻留在移动设备上的用户的个人信息的采集。
发明内容
通常,在一个方面中,本发明表征了一种提高语音识别器性能的方法。该方法包括:为语音识别器提供词典;监测用户与网络的交互作用;访问多个与监测的交互作用关联的词语;以及基于多个词语中的一个修改所述词典以提高所述语音识别器的性能。
其它实施例包括一个或多个下述特征。所述语音识别器在移动设备上运行,而且对词语的访问包括从服务器将所述词语下载到移动设备。所述语音识别器位于与网络连接的设备上。所述网络是数据网络,例如互联网或电话网络。当所述网络是互联网时,监测用户与网络的交互作用的步骤包括:监测用户与web浏览器的交互作用,以及访问与用户与Web浏览器的交互作用相关联的词语。从查询、搜索结果和作为所述用户与Web浏览器交互作用的结果所访问的Web页面其中的至少一个中获得所访问的词语。当用户与电话网络交互作用时,所述设备监测所述用户经由电话网络与一个或多个其他方的话音通信,访问与所述用户经由电话网络与一个或多个其他方的话音通信相关联的词语。当从用户收到的输入时,以周期性间隔,或者当发生事件时,动态地访问所述词语。所述设备以基于所访问词语在所监测的交互作用中的出现频率的方式来偏置(bias)语音识别器。所述监测的步骤还包括:记录每个词语的分类,以及以基于所述多个词语中的每一个的分类的方式来偏置语音识别器。所述监测的步骤进一步包括:记录所述多个词语中的每一个的使用上下文,以及以基于与所述多个词语中的每一个相关联的使用上下文的方式来偏置语音识别器。
一般地,在另一方面,本发明表征了一种实现在移动设备上的方法。所述方法包括:为语音识别器提供词典;监测用户与网络的交互作用;捕获多个与监测的交互作用相关联的词语;以及将捕获的多个词语添加到词典中。
其它实施例包括一个或多个下述特征。监测用户与网络的交互作用的步骤包括:监测用户与Web浏览器的交互作用,以及捕获与用户与Web浏览器的交互作用相关联的词语。
通常,在另一方面中,本发明表征了一种在具有语音识别器的移动设备上扩展语音词汇的方法。该方法包括:在移动设备上为语音识别器储存词典;在移动设备上储存多个词语,所述多个词语和移动用户与驻留在移动设备上的Web浏览器的交互作用相关联;以及将多个词语导入到词典中。在另一实施例,所述词语包括由移动用户输入到浏览器的搜索项和由使用搜索项进行的搜索所返回的结果中包含的词语。
通常,在另一方面中,本发明表征了一种在具有语音识别器的移动设备上扩展语音词汇的方法,该方法包括:在移动设备上为语音识别器储存词典;所述词典包括第一多个词语;在移动设备上储存第二多个词语,以及为所述第二多个词语中的每一个储存与所述词语关联的使用上下文,所述第二多个词语与除了语音识别器之外的应用相关联;以及将所述第二多个词语及其相关使用上下文导入到词典中。
其它实施例包括一个或多个下述特征。所述第二多个词语中的至少一个与适当名称的使用上下文关联。所述语音识别器被偏置为从所述词典中选择如下候选词语,所述候选词语具有如下使用上下文,所述使用上下文对应于将由所述语音识别器所识别的词语的使用上下文。
通常,在另一方面中,本发明表征了一种在具有语音识别器的移动设备上扩展语音词汇的方法,该方法包括:在移动设备上为语音识别器储存词典,所述词典包括多个词语;在移动设备上储存第二多个词语,所述文本词语的第二集合与除了语音识别器之外的应用相关联;为所述第二多个词语中的每一个记录所述词语的使用频率;以及将所述第二多个词语及其相关使用频率从储存的文本词语集合导入到词典中。在另一实施例中,所述语音识别器至少部分基于候选词语的使用频率从词典中选择候选词语。
附图说明
图1是具有语音识别能力的移动通信设备的框图。
图2是示出当扩展语音词汇时的信息流程的移动通信设备的框图。
图3是示出语音识别词汇扩展过程的步骤的流程图。
图4是示出当扩展语音词汇时的信息流的多用户移动通信设备的框图。
图5是连接到网络的通信设备的框图。
图6是示出用于具有语音识别能力的移动通信设备的硬件平台的高层的框图。
具体实施方式
具有语音识别能力的多功能MCD110的所选择的组件如图1所示。所述设备包括应用102和104,每个应用使所述设备能够执行具体的功能,例如,文本消息传送,在电话簿中查找联系方式。文本103和105的采集和每一个应用关联。以适合于与文本采集相关的应用进行访问的形式(例如在文本文件中,或在数据库中)存储所述文本采集。当特定应用正在运行时,它将利用关联的文本采集中的词语或短语。典型地,所述文本采集包括属于所述MCD拥有者个人的文本。例如,与地址簿关联的文本采集包括用户的联系名称和其他联系信息。以下给出其它示例。
MCD100还包括语音识别器106。语音识别器106接收语音输入,并且通过将它们和存储在语音到文本的词典108中的条目进行匹配来尝试识别所说的词语。所述词典包括词语集合,每一个词语具有文本表示和对应的发音。当识别出所说的词语时,所述语音识别器将所说的词语传递到请求该输入的应用。所述词语可以表示对于所述应用的命令或所述应用中的信息输入。
MCD100包括用于扩大语音到文本的词典108的内容的机制,通过分别从与应用102和104关联的文本采集103和105中导入词语来运行所述机制。一旦被合并到词典中,这些词语就扩展了语音识别器106的词汇。所述添加的词汇可能是对用户的具体值,因为它包括用户为与其它应用结合使用而选择的词语,并且因此它形成用户的个人语言空间的一部分。受益于词汇的扩展,当用户使用与所述词语关联的原始应用或MCD中的任意其它应用时,所述语音识别器可以识别初始与所述应用中的任意一个关联的词语。此外,用户获得词汇的扩展,而不需要手动将词语输入或下载词语到词典。
图2示出在词汇扩展期间在MCD110中的信息流程。所述MCD将文本采集103、105导入到语音到文本的词典108,如箭头203、205所示。在图3中进一步示出该过程。MCD100标识其驻留的文本采集(步骤302)。MCD100已经获知制造商提供的应用,并使用由定位文本采集的每一个应用所提供的指针。此外,MCD100获知所述设备装配后所下载的应用。如制造商所提供的应用,下载的每一个应用具有指向关联文本采集的指针。在步骤304,MCD100确定哪个文本采集将用于将文本导入到语音到文本的词典。所述单元具有两种模式:自动和手动。在自动模式中,用户将设备设置为仅参照指定的文本采集。用户还指定所述单元执行扩展操作的频率。例如,用户将所述设备设定为只参照采集103,以及仅当用户将一个或多个词语添加到采集中时才进行参照。可选地,用户可以设定具体的时间间隔(例如每天或每周)以执行扩展。在手动模式中,用户请求每个词汇扩展操作,并选择使用哪些文本采集。在步骤306,所述系统从在步骤304中选择的文本采集中的每一个中选择导入哪些文本。对于步骤304,所述设备具有自动和手动模式。在自动模式中,用户指定用于选择导入词语的规则。例如,用户指定系统只导入合适的名称。在手动模式中,所述设备提示用户选择或拒绝作为添加到词典的候选的每个词语。在自动模式和手动两种模式中,所述单元使用嵌入式查找功能检查每一个选择的词语,以确定它是否已经出现在词典中。如果所述单元找到所述词语,则它将忽略所述词语。如果所述单元找不到所述词语,则它将所述词语添加到正导入的词语的列表中。所述系统保持本地数据结构,以跟踪已经在词典中的词语,或者那些由于某些原因已经对于扩展过程所拒绝的词语。这使得所述系统在后续词汇扩展操作期间跳过不需要的词语,因此使文本选择更高效。
当已经选择用于导入到词典的一个或多个词语时,所述设备为每个词语生成发音,并且将它们储存为语音表示(步骤308)。从文本词语生成发音为本领域公知。所述设备将选择的文本词语连同其发音添加到词典(步骤310)。在某些语言中,在直接的规则管理发音的情况下,所述语音识别器包含用于从文本生成发音的算法,所述词典不储存发音的完整列表;此外,所述系统根据需要随时生成发音。
所述识别器通过将输入的语言和在词典中词语声学表示进行匹配来尝试识别语音。因此,在所述单元可以识别语音之前,所述语音识别器需要词典中词语的声学表示。通过将发音转换为声学表示的声学模型,所述识别器获取所需的声学表示。
除了将文本和发音添加到词典,所述系统可以执行其它行为以提高语音识别器的速度和/或精确性(步骤312)。例如,如果语音树用于剪除语音识别器的搜索,则所述系统将新导入的发音添加到树中。如果语义信息对词语可用,并且所述语音识别器能够使用语义信息,则所述系统将所述信息添加到识别器中以提高语音识别器的速度和精确性。
例如,在类语言模型中,所述识别器使用上下文来预测语言输入的词语属于什么类,并且以有利于所述类的成员的方式来偏置词典搜索。例如,当输入电子邮件应用的地址字段时,电子邮件地址比名称更有可能,然而,在文档中的昵称会期望跟在词语“亲爱的”后面。在概率模型中,识别器基于在短语或句子中直接在一个词语前面的一个或多个词语的类来储存所述短语和句子中的所述词语属于特定类的概率。其后,所述识别器基于之前词语的类将优先级给予其对属于的所期望类的词语的搜索。因此,如果类语言模型用于语音识别器,则将所导入的词语的类被导入到识别器中。类的示例为合适的名称、昵称和电子邮件地址。导入的文本词语的来源可以指示它的类。例如,从所述设备的地址簿的“姓”字段导入的词语很可能属于合适的名称的类,而在电子邮件器中来自“电子邮件地址”的词语很可能属于电子邮件地址类。
此外,所述算法可以扩展词典词汇,以包括由MCD上的一个或多个应用所识别的命令。如同文本采集,所述算法通过每个应用中的指针来定位这些命令。这些命令典型地储存在数据结构中,例如文本文件。在一些示例中,所述系统通过在应用代码中搜索未加密的文本字符串标识命令。所述命令有时候包括表示由移动网络提供商提供的特定功能的对运营商特定的附加物。所述系统以与其定位标准命令同样的方式来定位这些命令。
在一些设备中,语言到文本词典支持大词汇量识别器,所述词典具有30,000的词量。所述词典的初始词汇由设备制造商选择,且通常不包括对于特定用户特定的词汇。即使这样的系统有很好的机会来识别标准说话词汇,所述词典也不会包括所述用户的文本采集103、105的部分或全部。因此,甚至在配备大词汇量的语音识别器中,上面描述的词汇扩展也用于定制和增强语音识别能力。
虽然图1示出两种应用,但在假设提供足够的存储器和计算能力的情况下,MCD中可以存在任意数量的应用,每一个都有自己的文本采集。典型地,这些文本采集包括当使用MCD应用时用户输入的个人信息。此外,它们包括与应用结合的由用户下载的词语列表。用户通过使用标准的蜂窝电话接口的空中方式、通过web、通过短距离无线系统(例如蓝牙或Wi-Fi)或以对外部计算设备的电缆连接来将它们导入设备中。这些数据可以是在文本输入期间可以用于拼写检查、词语的自动完成以及其它目的的特定主题词语的采集。所述主题可以涉及专业或个人的兴趣。例如,医生可以下载医学短语集合。运动爱好者可以具有关于喜欢的球队的词语集合。
MCD可以具有多于一个的用户,每个用户具有他们自己的文本采集。每个用户独立地执行词汇扩展过程。图4示出适合于两个用户A和B的系统400。词典402细分为普通组件404,以及对用户特定的扩展406和408。用户A具有分别和应用102和104关联的文本采集410和412。用户A通过将词语从用户A的文本采集导入到与用户A关联的对用户特定的词典扩展406来扩展词汇,如箭头414和416所示。类似地,用户B通过从用户B的文本采集418和420向用户B词典扩展408进行导入来扩展词典,如箭头422和424所示。在后续语音识别期间,当用户A使用所述设备时,语音识别器106以扩展406来扩展普通词典404,以及当用户B为所述用户时,以扩展408来扩展普通词典404。这样的布置使用户A和用户B都得益于各自的词汇扩展。虽然上面描述了两个用户的系统,但在设备的处理和储存能力限制内,设备也可以支持具有各自文本采集及其相关词汇扩展的任意数量的用户。
具有相关文本采集的应用的示例包括以下项:地址簿,具有其关联的合适名称、昵称、工作区、地址、电子邮件地址以及其它联系信息;日历,具有其关联的人名、地方和其它日历项信息;Web浏览器,具有其喜欢的web地址的关联列表、标准web站点、用户访问的站点、用户已输入的搜索项以及web搜索结果;数字音乐播放器,具有其关联的音乐流派、歌曲标题、艺术家姓名、专辑名称以及其它与音乐相关的信息;电子邮件器,具有其关联的电子邮件地址、接收、发送及撰写的电子邮件文档以及电子邮件附件;文本传讯器,具有其关联的发送和接收的文本消息文档;即时传讯器,具有关联的发送和接收的文本以及屏幕名称;词语处理器,具有由词语处理器创建或编辑的其关联的文档;相机,具有图像捕获;视频片段播放器,具有关联标题和内容;以及地理定位应用,具有包含地理名称的其关联的地图(例如镇、街道、山川、河流和湖泊的名称)。此外,文本采集包括根据对从移动设备发送或由移动设备接收的语音通信的监测而获得的信息和词语。如果MCD具有与话音拨号盘关联的另一较简单的语音识别器或另一特定应用,则可以将较简单的识别器的词典中的词语导入到大词汇量的词典中。
上述技术应用于通过无线或有线连接而连接到网络的移动设备和非移动设备,如图5所示。该图示出通信设备500经由有线或无线网络连接504连接到网络502。网络502可以是电话网络,或者是数据网络,例如互联网。通信设备500包括软件模块506,软件模块506包含与移动通信设备100关联的上述词典108和语音识别器106。
当尚未在移动设备中储存将要添加到到词典的词语,但是从用户与网络的交互作用中已捕获所述词语时,也可以使用上述技术。在此情况下,软件模块506包括用于监测用户与网络交互作用的指令。当网络502是互联网时,模块506监测用户发送或接收的文本。在通常情况下,用户使用Web浏览器与互联网交互作用,模块506监测用户的搜索项、搜索结果以及作为搜索结果所访问的Web页面。
网络502可以是承载话音的网络(例如传统电话网络)、数字语音网络或者2G/3G无线接入网络。在这种情况下,将要添加到词典中的词语被包含在通过电话网络承载到所述设备和来自所述设备的语音话语中。典型地,所述语音话语在位于移动设备或连接到网络的另一设备中的存储器上被缓冲。在设备上本地执行的或在连接到网络的另一设备上执行的语音识别器监测储存的语音并识别特定词语。模块506自动地或在用户对无法识别的词语进行屏幕筛选后将识别的词语添加到词典。
软件模块506从所监测的网络交互作用访问和捕获词语,并将全部或部分词语添加到词典108。该过程动态发生,从而软件模块506在用户与网络交互作用期间连续更新。在其它应用中,软件模块506以周期间隔、或当从用户收到指令时访问所述词语。在其它应用中,当发生事件(例如用户网络交互作用的中止或通信设备断电)时访问词语。
上述词汇扩展过程可以以多种方式改变。例如,所述设备可以省略图3中所示的一个或多个步骤,或以不同的顺序执行步骤。在一种改变中,参照上文,对于使用规则从文本容易地得到发音的语言,所述系统省略步骤308,并且不生成发音。
在图6中作为高层框图600示出可以实现移动通信设备的典型平台。所述设备在其核心处包括:基带数字信号处理器(DSP)602,用于处理蜂窝通信功能,例如包括语音频带和信道编码功能:以及应用处理器604,例如Intel StrongArm SA-1110,在其上运行操作系统,例如Microsoft PocketPC。所述电话支持:GSM语音呼叫,SMS(短消息服务)文本消息传送,即时消息传送,无线电子邮件,桌面型Web浏览,以及传统PDA特征(例如地址簿、日历以及闹钟)。所述处理器还可以运行附加的应用,例如数字音乐播放器、词语处理器、数字相机以及地理定位应用,例如GPS。
通过RF合成器606和RF无线收发器608完成发送和接收功能,RF无线收发器608后面有功率放大模块610,功率放大模块610通过天线612处理最后级的RF发送任务。接口ASIC614和音频编码译码器616为扬声器、麦克风以及在电话中提供的其它输入/输出设备(例如用于输入命令和信息的数字或字母数字键盘(未示出))提供接口。DSP602使用闪速储存器618以存储代码。锂离子电池620给电话供电,耦合到DSP602的电源管理模块622在所述设备内管理电源的消耗。所述设备具有附加的硬件组件(未示出),以支持特定功能。例如,图像处理器和CCD传感器支持数字相机,而GPS接收器支持地理定位应用。
分别以SDRAM624和闪速储存器626的形式提供用于应用处理器614的易失性存储器和非易失性存储器。存储器的这种布置可以用于保持用于操作系统的代码,即,所有用于操作所述设备和支持它的各种功能的相关代码,包括用于上述语音识别系统的代码和用于被包括在所述设备中任何的应用软件的代码。它也存储词典,以及与应用关联的文本采集。
用于所述设备的可视化显示设备包括LCD驱动芯片628,其驱动LCD显示器630。还存在时钟模块632,为电话中的其它设备提供时钟信号和提供实时指示符。上述所有组件被封装在合适设计的壳体634中。
由于上述设备是表示许多不同商业可用设备的一般内部结构的,并且由于这些设备的内部电路设计通常对本领域普通技术人员是公知的,因此未提供关于图6中示出的组件的进一步细节及其操作,并且其对于理解本发明并非是必需的。
考虑到可以应用本发明的原理的实施例的广泛种类,应理解,示出的实施例仅仅是示例性的,而不应认为是限定本发明的范围的。例如,可以与所描述的流程图的顺序不同的顺序来执行流程图的步骤,可以在示图中使用更多或更少的元件。虽然已经将这些实施例的各种元件描述为以软件来实现,但可以替换地使用硬件或固件实现中的其它实施例,反之亦然。
其它的实施例在所附权利要求的范围之内。

Claims (25)

1.一种用于提高语音识别器性能的方法,所述方法包括:
为语音识别器提供词典;
监测用户与网络的交互作用;
访问多个与所监测的交互作用相关联的词语;以及
基于所述多个词语中的至少一个来修改词典,以提高语音识别器的性能。
2.如权利要求1所述的方法,其中,所述语音识别器位于移动设备上。
3.如权利要求2所述的方法,其中,访问的步骤包括:将所述多个词语从服务器下载到移动设备。
4.如权利要求1所述的方法,其中,所述语音识别器位于连接到网络的设备上。
5.如权利要求4所述的方法,其中,所述网络为互联网。
6.如权利要求4所述的方法,其中,所述网络为电话网络。
7.如权利要求1所述的方法,其中,监测用户与网络的交互作用的步骤包括:监测用户与Web浏览器的交互作用,并且其中,所访问的多个词语和用户与Web浏览器的交互作用相关联。
8.如权利要求7所述的方法,其中,从查询、搜索结果以及作为用户与Web浏览器交互作用的结果所访问的Web页面里的至少一个中获得所述多个词语。
9.如权利要求1所述的方法,其中,监测用户与网络的交互作用的步骤包括:监测所述用户经由电话网络与一个或多个其它方的话音通信,并且其中,所访问的多个词语与所述用户经由电话网络与一个或多个其它方的话音通信相关联。
10.如权利要求1所述的方法,其中,访问的步骤包括:动态访问所述多个词语。
11.如权利要求1所述的方法,其中,访问的步骤包括:以周期性间隔访问所述多个词语。
12.如权利要求1所述的方法,其中,访问的步骤包括:当从用户接收到输入时访问所述多个词语。
13.如权利要求1所述的方法,其中,访问的步骤包括:当发生事件时访问所述多个词语。
14.如权利要求1所述的方法,其中,以基于所述多个词语中的词语在所监测的交互作用中的出现频率的方式来偏置所述语音识别器。
15.如权利要求1所述的方法,其中,监测的步骤进一步包括:记录所述多个词语中的每一个的分类,并且其中,以基于所述多个词语中的每一个的分类的方式来偏置所述语音识别器。
16.如权利要求1所述的方法,其中,监测的步骤进一步包括:记录所述多个词语中的每一个的使用上下文,并且其中,以基于与所述多个词语中的每一个相关联的使用上下文的方式来偏置所述语音识别器。
17.一种在移动设备上实现的方法,所述方法包括:
为语音识别器提供词典;
监测用户与网络的交互作用;
捕获与所监测的交互作用相关联的多个词语;以及
将捕获的多个词语添加到词典中。
18.如权利要求17所述的方法,其中,监测用户与网络的交互作用的步骤包括:监测用户与Web浏览器的交互作用,并且其中,所捕获的多个词语和用户与Web浏览器交互作用相关联。
19.一种用于在具有语音识别器的移动设备上扩展语音词汇的方法,该方法包括:
在移动设备上为语音识别器储存词典;
在移动设备上储存多个词语,所述多个词语和移动用户与驻留在移动设备上的Web浏览器的交互作用相关联;以及
将所述多个词语导入到词典。
20.如权利要求19所述的方法,其中,所述多个词语包括由移动用户输入到浏览器的搜索项和通过使用搜索项进行的搜索所返回的结果中包含的词语。
21.一种用于在具有语音识别器的移动设备上扩展语音词汇的方法,该方法包括:
在移动设备上为语音识别器储存词典,所述词典包括第一多个词语;
在移动设备上储存第二多个词语,以及为所述第二多个词语中的每一个词语储存与所述词语关联的使用上下文,所述第二多个词语与除了语音识别器之外的应用相关联;以及
将所述第二多个词语及其相关使用上下文导入到词典中。
22.如权利要求21所述的方法,其中,所述第二多个词语中的至少一个与适当名称的使用上下文相关联。
23.如权利要求21所述的方法,其中,所述语音识别器被偏置为从所述词典中选择如下候选词语,所述候选词语具有如下使用上下文,所述使用上下文对应于将由所述语音识别器所识别的词语的使用上下文。
24.一种用于在具有语音识别器的移动设备上扩展语音词汇的方法,该方法包括:
在移动设备上为语音识别器储存词典,所述词典包括多个词语;
在移动设备上储存第二多个词语,该文本词语的第二集合与除了语音识别器的应用相关联;
为所述第二多个词语中的每一个词语记录所述词语的使用频率;以及
将所述第二多个词语及其相关使用频率从所储存的文本词语集合导入到所述词典中。
25.如权利要求24所述的方法,其中,所述语音识别器至少部分基于候选词语的使用频率从词典中选择候选词语。
CN2006800080989A 2005-02-03 2006-02-03 自动扩展移动通信设备的话音词汇的方法和装置 Expired - Fee Related CN101164102B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US64980605P 2005-02-03 2005-02-03
US60/649,806 2005-02-03
PCT/US2006/003864 WO2006084144A2 (en) 2005-02-03 2006-02-03 Methods and apparatus for automatically extending the voice-recognizer vocabulary of mobile communications devices

Publications (2)

Publication Number Publication Date
CN101164102A true CN101164102A (zh) 2008-04-16
CN101164102B CN101164102B (zh) 2012-06-20

Family

ID=36581544

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800080989A Expired - Fee Related CN101164102B (zh) 2005-02-03 2006-02-03 自动扩展移动通信设备的话音词汇的方法和装置

Country Status (6)

Country Link
US (1) US8160884B2 (zh)
EP (1) EP1844464B1 (zh)
JP (2) JP2008529101A (zh)
KR (1) KR101221172B1 (zh)
CN (1) CN101164102B (zh)
WO (1) WO2006084144A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915730A (zh) * 2012-10-19 2013-02-06 东莞宇龙通信科技有限公司 语音处理方法及系统
CN104538031A (zh) * 2014-12-15 2015-04-22 北京云知声信息技术有限公司 智能语音服务开发云平台及方法
US10381007B2 (en) 2011-12-07 2019-08-13 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
CN110797027A (zh) * 2013-05-13 2020-02-14 谷歌有限责任公司 多识别器语音识别

Families Citing this family (138)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
EP2044804A4 (en) * 2006-07-08 2013-12-18 Personics Holdings Inc PERSONAL HEARING AID AND METHOD
US7689417B2 (en) * 2006-09-04 2010-03-30 Fortemedia, Inc. Method, system and apparatus for improved voice recognition
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US20080154608A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. On a mobile device tracking use of search results delivered to the mobile device
US20080154870A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Collection and use of side information in voice-mediated mobile search
US20080154612A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Local storage and use of search results for voice-enabled mobile communications devices
US20080153465A1 (en) * 2006-12-26 2008-06-26 Voice Signal Technologies, Inc. Voice search-enabled mobile device
US8886540B2 (en) * 2007-03-07 2014-11-11 Vlingo Corporation Using speech recognition results based on an unstructured language model in a mobile communication facility application
US20080221884A1 (en) 2007-03-07 2008-09-11 Cerra Joseph P Mobile environment speech processing facility
US8838457B2 (en) 2007-03-07 2014-09-16 Vlingo Corporation Using results of unstructured language model based speech recognition to control a system-level function of a mobile communications facility
US8949266B2 (en) 2007-03-07 2015-02-03 Vlingo Corporation Multiple web-based content category searching in mobile search application
US10056077B2 (en) 2007-03-07 2018-08-21 Nuance Communications, Inc. Using speech recognition results based on an unstructured language model with a music system
US8949130B2 (en) 2007-03-07 2015-02-03 Vlingo Corporation Internal and external speech recognition use with a mobile communication facility
US8886545B2 (en) 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US20080275701A1 (en) * 2007-04-25 2008-11-06 Xiaotao Wu System and method for retrieving data based on topics of conversation
CN101803353B (zh) 2007-09-20 2013-12-25 西门子企业通讯有限责任两合公司 用于运行通信连接的方法和通信装置
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US9202460B2 (en) * 2008-05-14 2015-12-01 At&T Intellectual Property I, Lp Methods and apparatus to generate a speech recognition library
WO2009150591A1 (en) * 2008-06-11 2009-12-17 Koninklijke Philips Electronics N.V. Method and device for the generation of a topic-specific vocabulary and computer program product
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
KR100998566B1 (ko) * 2008-08-11 2010-12-07 엘지전자 주식회사 음성인식을 이용한 언어 번역 방법 및 장치
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
KR20110006004A (ko) * 2009-07-13 2011-01-20 삼성전자주식회사 결합인식단위 최적화 장치 및 그 방법
US20110035210A1 (en) * 2009-08-10 2011-02-10 Benjamin Rosenfeld Conditional random fields (crf)-based relation extraction system
US20130191857A1 (en) * 2009-10-02 2013-07-25 R. Edward Guinn Method and System for a Vote Based Media System
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US20110231189A1 (en) * 2010-03-19 2011-09-22 Nuance Communications, Inc. Methods and apparatus for extracting alternate media titles to facilitate speech recognition
WO2012090196A1 (en) * 2010-12-30 2012-07-05 Melamed Gal Method and system for processing content
US8688453B1 (en) * 2011-02-28 2014-04-01 Nuance Communications, Inc. Intent mining via analysis of utterances
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US9785628B2 (en) * 2011-09-29 2017-10-10 Microsoft Technology Licensing, Llc System, method and computer-readable storage device for providing cloud-based shared vocabulary/typing history for efficient social communication
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US9721563B2 (en) * 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9715879B2 (en) * 2012-07-02 2017-07-25 Salesforce.Com, Inc. Computer implemented methods and apparatus for selectively interacting with a server to build a local database for speech recognition at a device
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US9997160B2 (en) * 2013-07-01 2018-06-12 Toyota Motor Engineering & Manufacturing North America, Inc. Systems and methods for dynamic download of embedded voice components
US9786296B2 (en) * 2013-07-08 2017-10-10 Qualcomm Incorporated Method and apparatus for assigning keyword model to voice operated function
CN103825952B (zh) * 2014-03-04 2017-07-04 百度在线网络技术(北京)有限公司 细胞词库推送方法和服务器
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
EP3480811A1 (en) 2014-05-30 2019-05-08 Apple Inc. Multi-command single utterance input method
US9773499B2 (en) * 2014-06-18 2017-09-26 Google Inc. Entity name recognition based on entity type
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
JP5692734B1 (ja) * 2014-09-08 2015-04-01 株式会社ゆうインタークロス 検索支援装置、検索支援システム、検索支援方法及びプログラム
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9696904B1 (en) * 2014-10-30 2017-07-04 Allscripts Software, Llc Facilitating text entry for mobile healthcare application
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9922643B2 (en) * 2014-12-23 2018-03-20 Nice Ltd. User-aided adaptation of a phonetic dictionary
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10565981B2 (en) * 2017-09-26 2020-02-18 Microsoft Technology Licensing, Llc Computer-assisted conversation using addressible conversation segments
KR20190113693A (ko) * 2019-09-18 2019-10-08 엘지전자 주식회사 단어 사용 빈도를 고려하여 사용자의 음성을 인식하는 인공 지능 장치 및 그 방법
KR20210052958A (ko) * 2019-11-01 2021-05-11 엘지전자 주식회사 인공 지능 서버
US20210312901A1 (en) * 2020-04-02 2021-10-07 Soundhound, Inc. Automatic learning of entities, words, pronunciations, and parts of speech

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5613036A (en) * 1992-12-31 1997-03-18 Apple Computer, Inc. Dynamic categories for a speech recognition system
US5819220A (en) * 1996-09-30 1998-10-06 Hewlett-Packard Company Web triggered word set boosting for speech interfaces to the world wide web
US6167117A (en) 1996-10-07 2000-12-26 Nortel Networks Limited Voice-dialing system using model of calling behavior
US6154526A (en) 1996-12-04 2000-11-28 Intellivoice Communications, Inc. Data acquisition and error correcting speech recognition system
US6188985B1 (en) 1997-01-06 2001-02-13 Texas Instruments Incorporated Wireless voice-activated device for control of a processor-based host system
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
US6490557B1 (en) * 1998-03-05 2002-12-03 John C. Jeppesen Method and apparatus for training an ultra-large vocabulary, continuous speech, speaker independent, automatic speech recognition system and consequential database
US6195641B1 (en) * 1998-03-27 2001-02-27 International Business Machines Corp. Network universal spoken language vocabulary
DE69937176T2 (de) * 1998-08-28 2008-07-10 International Business Machines Corp. Segmentierungsverfahren zur Erweiterung des aktiven Vokabulars von Spracherkennern
US6684185B1 (en) * 1998-09-04 2004-01-27 Matsushita Electric Industrial Co., Ltd. Small footprint language and vocabulary independent word recognizer using registration by word spelling
CN1126052C (zh) * 1998-09-29 2003-10-29 松下电器产业株式会社 采用多个文法网络的语音识别的方法
EP1055227B1 (en) * 1998-12-21 2004-09-01 Koninklijke Philips Electronics N.V. Language model based on the speech recognition history
US6463413B1 (en) * 1999-04-20 2002-10-08 Matsushita Electrical Industrial Co., Ltd. Speech recognition training for small hardware devices
US6640249B1 (en) * 1999-08-31 2003-10-28 Accenture Llp Presentation services patterns in a netcentric environment
JP4200607B2 (ja) * 1999-09-03 2008-12-24 ソニー株式会社 情報処理装置および方法、並びにプログラム格納媒体
JP2002014693A (ja) * 2000-06-30 2002-01-18 Mitsubishi Electric Corp 音声認識システム用辞書提供方法、および音声認識インタフェース
JP2002091477A (ja) * 2000-09-14 2002-03-27 Mitsubishi Electric Corp 音声認識システム、音声認識装置、音響モデル管理サーバ、言語モデル管理サーバ、音声認識方法及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2002175175A (ja) * 2000-12-07 2002-06-21 Sumitomo Electric Ind Ltd 音声駆動可能なユーザインターフェイス
JP2002183127A (ja) * 2000-12-18 2002-06-28 Sentan Kagaku Gijutsu Incubation Center:Kk ユーザ辞書生成登録システム、辞書サーバ、端末、ユーザ辞書生成方法、ユーザ辞書登録方法、ならびに、情報記録媒体
US6973427B2 (en) * 2000-12-26 2005-12-06 Microsoft Corporation Method for adding phonetic descriptions to a speech recognition lexicon
US6937986B2 (en) 2000-12-28 2005-08-30 Comverse, Inc. Automatic dynamic speech recognition vocabulary based on external sources of information
US20020087315A1 (en) * 2000-12-29 2002-07-04 Lee Victor Wai Leung Computer-implemented multi-scanning language method and system
US7027987B1 (en) * 2001-02-07 2006-04-11 Google Inc. Voice interface for a search engine
EP1490790A2 (en) * 2001-03-13 2004-12-29 Intelligate Ltd. Dynamic natural language understanding
JP4581290B2 (ja) * 2001-05-16 2010-11-17 パナソニック株式会社 音声認識装置および音声認識方法
US20030078777A1 (en) * 2001-08-22 2003-04-24 Shyue-Chin Shiau Speech recognition system for mobile Internet/Intranet communication
JP2003219038A (ja) * 2001-10-22 2003-07-31 Ntt Comware Corp 顧客情報と連携させたコールセンタシステム装置及び顧客情報と連携させたコール方法
US20030191639A1 (en) 2002-04-05 2003-10-09 Sam Mazza Dynamic and adaptive selection of vocabulary and acoustic models based on a call context for speech recognition
US7668885B2 (en) * 2002-09-25 2010-02-23 MindAgent, LLC System for timely delivery of personalized aggregations of, including currently-generated, knowledge
US7584102B2 (en) * 2002-11-15 2009-09-01 Scansoft, Inc. Language model for use in speech recognition
JP2004219714A (ja) * 2003-01-15 2004-08-05 Will Being:Kk 人間からの指示に基づいてそれぞれ予め定めた特定のシーンに属する対話のシーンを識別し、シーンに即した自然対話を構成する応答文を作成して、それを音声合成することにより、音声対話を行うコンピュータによる音声対話方法及び音声対話システム
US7603267B2 (en) * 2003-05-01 2009-10-13 Microsoft Corporation Rules-based grammar for slots and statistical model for preterminals in natural language understanding system
JP2005055606A (ja) * 2003-08-01 2005-03-03 Toyota Motor Corp サーバ、情報処理端末、音声認識システム
US7292978B2 (en) * 2003-12-04 2007-11-06 Toyota Infotechnology Center Co., Ltd. Shortcut names for use in a speech recognition system

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10381007B2 (en) 2011-12-07 2019-08-13 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
US11069360B2 (en) 2011-12-07 2021-07-20 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
US11810569B2 (en) 2011-12-07 2023-11-07 Qualcomm Incorporated Low power integrated circuit to analyze a digitized audio stream
CN102915730A (zh) * 2012-10-19 2013-02-06 东莞宇龙通信科技有限公司 语音处理方法及系统
CN102915730B (zh) * 2012-10-19 2015-04-08 东莞宇龙通信科技有限公司 语音处理方法及系统
CN110797027A (zh) * 2013-05-13 2020-02-14 谷歌有限责任公司 多识别器语音识别
CN110797027B (zh) * 2013-05-13 2023-11-21 谷歌有限责任公司 多识别器语音识别
CN104538031A (zh) * 2014-12-15 2015-04-22 北京云知声信息技术有限公司 智能语音服务开发云平台及方法

Also Published As

Publication number Publication date
US8160884B2 (en) 2012-04-17
EP1844464B1 (en) 2013-06-26
WO2006084144A2 (en) 2006-08-10
KR101221172B1 (ko) 2013-01-11
JP2013047809A (ja) 2013-03-07
KR20070100837A (ko) 2007-10-11
JP2008529101A (ja) 2008-07-31
CN101164102B (zh) 2012-06-20
WO2006084144A3 (en) 2006-11-30
US20060173683A1 (en) 2006-08-03
EP1844464A2 (en) 2007-10-17

Similar Documents

Publication Publication Date Title
CN101164102B (zh) 自动扩展移动通信设备的话音词汇的方法和装置
CN101971250B (zh) 具有活动语音识别的移动电子设备
CN101366075B (zh) 话音控制式无线通信装置系统的控制中心
KR100891695B1 (ko) 확장가능한 음성 명령
US20080153465A1 (en) Voice search-enabled mobile device
US20080154612A1 (en) Local storage and use of search results for voice-enabled mobile communications devices
US20080154870A1 (en) Collection and use of side information in voice-mediated mobile search
US20040083109A1 (en) Method and system for text editing in hand-held electronic device
US20060235684A1 (en) Wireless device to access network-based voice-activated services using distributed speech recognition
KR101624137B1 (ko) 표시 화면 업데이트 방법 및 이를 이용한 휴대 단말기
CN100576171C (zh) 步进式标记语言与面向对象开发工具组合使用的系统和方法
CN103442130A (zh) 语音操控方法、移动终端装置及语音操控系统
US20080154608A1 (en) On a mobile device tracking use of search results delivered to the mobile device
CN102184254A (zh) 移动联系人备注
CN101682667A (zh) 用于搜索不同类型项目的方法和便携式设备
JP2014513828A (ja) 自動会話支援
KR100920442B1 (ko) 휴대 단말기에서 정보 검색 방법
KR20070034313A (ko) 모바일 검색 서버 및 상기 검색 서버의 동작 방법
KR101523954B1 (ko) 휴대 단말기의 음악 파일 검색 방법 및 장치
KR100843329B1 (ko) 모바일 지식 검색 서비스 시스템
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
CN101164359A (zh) 作为用户接口要素的背景音的系统和方法
US8447276B2 (en) Mobile terminal and method of controlling operation of the same
WO2008083172A2 (en) Integrated voice search commands for mobile communications devices
KR20080068793A (ko) 모바일 지식 검색 서비스 제공방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: NUANCE COMMUNICATIONS, INC.

Free format text: FORMER OWNER: VOICE SIGNAL TECHNOLOGIES

Effective date: 20130220

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130220

Address after: Massachusetts, USA

Patentee after: Nuance Communications Inc

Address before: Massachusetts, USA

Patentee before: Voice Signal Technologies Inc.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120620

Termination date: 20170203