CN104885071B - 多设备智能语言模型同步 - Google Patents

多设备智能语言模型同步 Download PDF

Info

Publication number
CN104885071B
CN104885071B CN201380066013.2A CN201380066013A CN104885071B CN 104885071 B CN104885071 B CN 104885071B CN 201380066013 A CN201380066013 A CN 201380066013A CN 104885071 B CN104885071 B CN 104885071B
Authority
CN
China
Prior art keywords
language
processing system
host
user
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201380066013.2A
Other languages
English (en)
Other versions
CN104885071A (zh
Inventor
安德鲁·菲利普斯
大卫·J·凯儿
厄兰·昂鲁
艾瑞克·J·傅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CN104885071A publication Critical patent/CN104885071A/zh
Application granted granted Critical
Publication of CN104885071B publication Critical patent/CN104885071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • G06F16/273Asynchronous replication or reconciliation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0233Character input methods
    • G06F3/0237Character input methods using prediction or retrieval techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

提供了用于跨多个设备的智能语言模型的系统和方法。一些实施例提供了将来自运行本地语言处理系统的每一个设备的改变事件整合到主语言模型的客户‑服务器系统。该改变事件不仅能够整合到主模型中,也可以整合到其他本地语言模型的每一个中。其结果是,一些实施例使得能够恢复到新设备以及在多个设备上对使用同步。此外,实时消息可以使用在被选消息上使得高优先级改变事件在所有的活跃设备上快速地更新。使用由服务器基础架构驱动的订阅模式,客户端上的使用逻辑也可以驱动选择性的语言模型的更新。

Description

多设备智能语言模型同步
背景技术
各种的语言识别系统被设计来使用一个或多个输入模式。通常,这些输入模式包括文本输入模式、语音输入模式和/或手写输入模式。这些语言识别系统根本的基本目标是使用户使用一个或多个输入模式以增加的可靠性和提高的速率来创建文本。例如,文本输入模式,通过能够让用户执行比可比较系统所要求更低的精确度的操作,通常允许增加的输入速率。此外,这种模式往往提供了提示完成单词的判断完成功能。语音和手写输入模式利用了不同组的输入操作,有些用户可能发现其比打字更容易和更快。这些输入然后被转换为文本。
一般情况下,语言识别系统依靠本地语言模型,具有文本对象的词库,其可以根据由用户执行的输入操作由系统产生。然而,因为每个用户是不同的,这些语言模型基于每个用户的交互方式以不同的方式动态地演变。此外,语言识别系统的用户通常有多个设备在其上使用语言识别系统。这导致用户需要为每个设备独立地训练语言模型。因此,需要能够在跨多个设备上提供语言模型的技术。
附图说明
本发明的实施例将通过附图的使用来描述和解释,其中:
图1示出了在其中本发明的一些实施例可被运用的计算环境的例子;
图2示出了根据本发明的一个或多个实施例的用于本地语言处理系统的一组组件;
图3展示了根据本发明的各种实施例的用于主语言处理系统的一组组件;
图4示出根据本发明的一个或多个实施例的基于主语言模型的用于同步本地语言模型的一组操作的流程图;
图5示出根据本发明的各种实施例的用于利用高优先级消息发送系统的一组操作的流程图;
图6示出根据本发明的一个或多个实施例的用于整合基于服务器的订阅模式的一组操作的流程图;
图7是允许用户管理用户移动设备订阅的代表性图形用户界面的屏幕截图;
图8示出了根据本发明的各种实施例的可与每个用户关联的一组信息;以及
图9是本发明的实施例可以通过其运用的计算机系统的例子。
附图不一定是按比例绘制。例如,图中信令时期的相对大小没有按照比例,并且特定信令或消息周期的大小可以不同。类似的,为了讨论本发明的一些实施例,一些部件和/或操作可以被分成不同的块或组合成单个块。此外,虽然本发明可修改为各种修改和替代形式,但是具体实施例已通过示例方式在附图中示出,并在下面被详细描述。然而,该意图不是将本发明限制于所描述的特定实施例。相反,本发明意在覆盖落入由所附权利要求所限定的本发明的范围之内的所有修改、等价物和替代。
具体实施方式
所公开的语言处理系统和方法的各个实施例一般涉及用户使用输入设备将信息输入系统。特别地,一些实施例提供了用于跨多个设备的智能语言模型。传统的语言识别系统依靠具有可由系统产生的文本对象的词库的本地语言模型。在某些情况下,运行语言识别系统的设备使用语言模型来将由使用者执行的输入操作映射到词库中的这些文本对象的一个或多个。这些模型通常是动态的,并随着它们被使用而成长和学习,允许用户通过使用和教学改善基线预测。
随着计算设备的激增,用户具有多个设备并不罕见,其结果是,具有多个本地语言模型。在传统语言识别系统下,每个设备需要基于每个设备的用户输入独自地学习或发展定制的本地语言模型。此外,许多变量影响这些语言识别系统将输入识别和映射至文本对象的准确度。这些因素之间突出的是,文本对象是否驻留在词库和文本对象使用的频率。例如,如果一个单词不经常使用,文本输入系统可能误认该单词,而偏爱统计上更可能被使用的单词。常常被误认的词可能是正确的名字,如人、街道、餐馆和其他的与个人消息特殊相关的单词,如语音邮箱。结果是,因为该语言模型没有被所有的用户输入所训练,任何一个设备中的语言模型的响应可能不是令人满意的响应。
对比而言,本发明公开的语言处理系统和方法创建了主语言模型,将来自单个设备模型的变化与主语言模型同步,并将来自主语言模型的变化同步至与用户关联的其他设备。该主语言模型可存储在“云中”,如在一个远程服务器或其他设备里。保持主语言模型允许用户创建定制的语言模型,该模型在设备之间随用户移动,以及保持多个设备同步。此外,主语言模型的使用使得新设备采用最当前的语言模型。在一些实施例中,用于语言更新的基于服务器的订阅模型可以被在用户设备上运行的客户利用,它决定了用于在每个本地设备中的语言模型的最优化更新安排。
在有些情况下(例如,由于连接类型或大量使用),一直使本地设备上的事件与主语言模型同步是不切实际的。各种实施例提供选择性地实时(或近实时)传送某些事件至主语言模型的能力,以提高在其他的辅助设备的立即预测。在至少一个实施例中,可以使用消息传送系统来对何时将事件分布到本地设备进行优先化。例如,消息传递系统可确定哪些事件非常重要并立即将此事件输入语言模型。该消息传递系统可以利用在多个客户与一个服务器之间或与一组服务器之间的实时(或近实时)的消息总线,提供同步语言模型改变事件的能力,来提高用户跨多个设备的输入体验。
为了解释,下面的描述提供了很多具体的细节来提供对本发明实施例的详尽理解。然而,对本领域技术人员明显的是,在没有这些具体细节时,也可以实施本发明的实施例。尽管为了方便本发明的实施例参考基于云的主语言模型描述,本发明的实施例也同样能够运用至的主语言模型可存在其中的各种其他网络范例。
这里介绍的技术可以被实施为专用硬件(例如,电路)、用软件和/或固件适当编程的可编程电路或专用和可编程电路的组合。因此,实施例可包括在其上存储有指令可被用来编程计算机(或其他电子设备)来执行过程的机器可读介质。该机器可读介质可以包括但不限于软盘、光盘、光盘只读存储器(CD-ROM)、磁光盘、ROM、随机存取存储器(RAM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、磁卡或光卡、闪存或其他类型的适于存储电子指令的媒体/机器可读介质。
短语“在一些实施方案中”、“根据一些实施方案”、“在所示实施例中”、“在其他实施例中”等类似的一般指短语后的特定的特点、结构或特征被被包括在本发明的至少一个实施例中,并且可被包括在一个以上的实施例中。此外,该短语并非一定指相同或者不同的实施例。
图1展示了在其中本发明的一些实施例可被运用的计算环境100的例子。如图1所示,语言识别系统可以在一个或多个移动设备110a-n(如移动电话、平板电脑、移动媒体设备、移动游戏设备、基于车辆的计算机等等)、一个或多个计算设备(如计算机120)以及能够接收用户输入的其他设备(例如,如导航系统130)上操作。这些设备的每个可包括各种输入机制(例如,麦克风、键盘和/或触摸屏)来接收用户互动(例如,语音、文本和/或手写输入)。在这些设备上的每个语言识别系统可能正在运行本地语言模型。
如图1所示,这些设备可以通过一个或多个有线或无线、公共或私人网络150与主语言处理系统140进行通信。根据本发明的各种实施例,主语言处理系统140通过应用从在移动设备上正在本地运行的多个语言模型接收的改变建立主语言模型。结果是,该主语言模型是从终端用户和与终端用户关联的设备的互动专为该终端用户产生的模型(也就是说,单个模式或多个模式的组合)。
根据各种实施方案,主语言模型可包括多个模型,例如静态语言模型160和动态语言模型170。静态语言模型160是基于通用语言使用为语言生成的单词列表。在一些实施方案中,不经常使用的单词(例如,恐龙的名字或街道名)可基于位置或其他触发事件临时或永久地被添加为新分区或语言模型。相比之下,动态语言模型170从与终端用户关联的每个设备接收改变事件(例如,添加一个单词、删除一个单词、单词的修正、n元语法和单词计数)。改变事件一般以它们出现的顺序被处理从而来更新动态语言模型(如,在实时或近实时下)。然而,在一些实施例中,改变事件可能不按顺序被处理来更新动态语言模型。例如,更重要的改变事件可以在相对不重要的改变事件处理前优先处理。
图2展示了用于本地语言处理系统200的一组元件。根据图2所示的实施例,本地语言处理系统200可包括存储器205、一个或多个处理器210、电源215、输入设备220、事件检测模块225、事件汇总模块230、本地语言模型235、优先级模块240、同步模块245、通信模块250、排队模块255和图形用户界面(GUI)生成模块260。该系统的其它实施例可连同其它模块、应用和/或组件包括这些模块和组件的一些、全部或没有。此外,一些实施例可将两个或两个以上这样的模块和组件结合到单一模块和/或将这些模块的一个或多个的功能性的一部分与不同的模块关联。例如,在一个实施例中,优先级模块240和排队模块255可以被组合成用于优先传输事件数据的单个模块。
存储器205可以是用于存储信息的任何装置、机构或填充(populated)数据结构。根据本系统的一些实施例,存储器205可包括任何类型的,但不限于易失性存储器、非易失性存储器和动态存储器。例如,存储器205可以是随机存取存储器、存储器存储设备、光存储设备、媒体磁介质、软盘、磁带、硬盘驱动器、SDRAM、RDRAM、DDRRAM、可擦除可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)、CD、DVD和/或等等。根据一些实施方案中,存储器205可以包括一个或多个盘驱动器、闪存驱动器、一个或多个数据库、一个或多个表、一个或多个文件、本地高速缓冲存储器、处理器高速缓冲存储器、关系数据库、平面数据库和/或等等。此外,本领域普通技术人员将了解用于存储信息的许多额外的设备和技术可被用作存储器205。
存储器205可以用来存储运行在处理器210上的一个或多个应用或模块的指令。例如,存储器205可用于在一个或多个实施方案中,以容纳需要用来执行事件检测模块225、事件汇总模块230、本地语言模型235、优先级模块240、同步模块245、通信模块250、排队模块255和/或GUI生成模块260的功能的全部或部分指令。存储器205、处理器210和其他组件(例如,输入设备220)可以通过电源215(例如,电池或其它电源)供电。
事件检测模块225可以使用一个或多个输入设备220(例如,键盘、触摸屏或麦克风),以检测与在每个计算设备110-130上运行的本地语言模型关联的一个或多个变化事件。改变事件作为用户与本地设备上的语言处理系统互动的结果出现。改变事件可以被用于修改本地语言模型。一些改变事件可能对本地语言模型有很大的影响(例如,增加一个单词时),而其他改变事件可能具有很少或几乎没有影响(例如,使用已经具有高频率计数的单词)。改变事件可以包括数据点,其可以被系统使用来处理修改语言模型的变化。可被检测到的事件的例子包括新单词事件、删除单词事件、标志使用事件、标志不使用事件、调整质量事件、删除语言事件、新单词对事件、新n元语法事件、位置事件等可用于开发动态语言模型的很多其他事件。在一些实施例中,改变事件还可以包括额外的数据,如权重因子、分类指标、位置信息、场所信息(例如,确定语言使用的方言)和单词用法的信息。附加数据可以来自用户与本地设备的互动,或者可以由系统自动产生。
在某些情况下,事件汇总模块230可以将事件聚合或分类成单一的分组,以允许通信模块250将事件推送到主语言处理系统140。此外,任何分类,其被定义为单词或n元语法的分组,使得能够定制语言和复杂模型管理。在至少一个实施例中,语言变化可以下推作为一个类别,允许不同的权重给每个作为整体的类别。将不同的权重分配给每个类别的能力允许,如,调整对该语言模型的影响。在其他实施例中,类别可以被删除,从而在不影响其余模型的情况下,可以很容易地从用户的模型去除单词和n元语法设定。
本地语言模型235可以与每个设备关联,以本地处理用户输入。这些本地语言模型仅包括由关联设备检测到的事件。在某些情况下,该模型还可以访问任何本地联系人列表、本地电子邮件、本地SMS/MMS信息和其他以文本为基础的本地通讯,用来发展本地语言模型。
优先级模块240使通过事件检测模块225检测到的改变事件优先。在一些实施例中,优先级可以基于本地上下文信息,如网络连接、当前使用率、功率电平或用户偏好。使用检测事件的信息,以及这些检测事件的优先级,同步模块245可以单独地或集合地发送该事件到主语言处理系统140。在一些实施例中,同步模块245从主语言处理系统140接收更新指令。
通信模块250向主语言处理系统140发送任何更新,并从主语言处理系统140接收任何更新。在一些实施例中,通信模块250监视当前连接类型(例如,蜂窝或Wi-Fi),并做出是否应该推动或拉动更新和事件的判定。例如,如果通信模块250确定当前正在使用蜂窝连接,那么任何传出消息可以用排队模块255进行排队。除了当前连接类型,通信模块在判定是否推动或拉动数据时,可使用其他信息,例如事件优先级和/或用户偏好。
GUI生成模块260生成一个或多个GUI屏幕,其允许与语言处理系统的用户的互动。在至少一个实施例中,GUI生成模块260生成图形用户界面,允许计算设备用户来设置偏好、运行用于训练语言处理系统的训练应用、设置设备限制、选择临时静态语言模型添加和/或以其他方式在用户和设备之间接收或传送信息。
图3展示了一组用于主语言处理系统140的部件。根据图3所示的实施例,主语言处理系统140可包括存储器305、一个或多个处理器310、电源315、用户识别模块320、本地模型识别模块325、事件分析模块330、主语言模型335、比较模块340、同步模块345和通信模块350。本发明的其它实施例可连同其它模块、应用和/或组件包括这些模块和组件的一些、全部或没有。此外,一些实施例可将两个或两个以上这样的模块和组件结合到单一模块和/或将这些模块的一个或多个的功能性的一部分与不同的模块关联。例如,在一个实施例中,用户识别模块320和本地模型识别模块325的功能性可被结合进单个模块。
如参照以上描述的存储器205,存储器305可以是用于存储信息的任何装置、机构或填充数据结构。存储器305可以用来存储用于在处理器310上运行一个或多个应用或模块的指令。例如,存储器205可用于在一个或多个实施方案中,以容纳需要用来执行用户识别模块320、本地模型识别模块325、事件分析模块330、主语言模型335、比较模块340、同步模块345和/或通信模块350的功能的全部或部分指令。
用户识别模块320可被配置来识别用户。根据各种实施例,可以使用各种方法,其如但不限于登录凭证、电信设备标识、语音识别、视觉识别和/或其它用于识别用户的技术。当用户访问语言处理系统时,可以在每个设备使用相同或不同的识别方法来识别用户。每个用户和具有本地语言模型的多个设备关联。本地模型识别模块325可用于跟踪每个模型的当前状态。
随着事件从与个体相关联的各种本地语言模型被接收,事件分析模块330确定事件应当如何被处理和运用(例如,根据时间标记按顺序进行或根据分配的事件优先级)到主语言模型335上。虽然一些实施例可以通知用户不一致,其它实施方案则自动地处理变化和管理语言模型。在一些情况下,系统资源,如磁盘空间可以用在做出如何处理和应用事件和/或是否保留单词的列表的决定中。在一些实施例中,主语言模型335的改变可以使用SQL数据库中的更改日志进行跟踪。在其他实施例中,该改变存储在磁盘上的更改日志中。除了从本地设备接收的事件,其他板外个人数据可被用于建立主语言模型,如网站数据、社交网络数据、社交网络朋友的数据(例如与朋友的通信)、个人计算设备的信息、因特网可访问文档数据(例如,谷歌文档)以及其他数据。
比较模块340确定用户的任何本地语言模型与当前主语言模型状态相比的当前状态。使用由比较模块340中确定的状态信息,信息同步模块345能够确定是否使用通信模块350发送更新(例如,以批量)或请求整个本地语言模型被替换。
图4是展示基于主语言模型的用于同步本地语言模型的一组操作400的流程图。根据各种实施例,图4所示的操作可以由一个或多个部件(例如,处理器310)和/或模块(例如,用户识别模块320或同步模块345)来执行。识别操作410识别具有本地语言模型的用户和任何关联设备。保持操作420基于从识别操作410中识别的本地语言模型记录的事件,建立和保持主语言模型。主语言模型通常被保持在基于云的环境里或其他分布式服务器-客户系统。
记录操作430基于从关联用户设备接收的改变,如新单词、移除单词、n元语法和单词/n元语法权重,记录主语言模型的任何改变。使用同步操作440,在用户设备上的各种本地模型可被同步。语言模型的同步允许终端用户使用多种设备和使得这些设备的每个同时影响主模型和其他设备上的模型。平板电脑、手机、电视和汽车都包括可以利用语言模型同步的文本输入。最终的结果是更好的体验,因为用户对一台设备的使用影响了用户将在另一设备上接收的预测。
判定操作450判定是否已检测到新的或复位设备。如果是这样,判定操作450分支到恢复操作460,那里整个主语言模型被提供给新的或复位设备作为本地语言模型。由此检测到的任何变化或事件,或任何其他本地语言模型,被用来更新主语言模型。如果判定操作450判定没有新的或复位设备已被检测到,则该判定操作分支到记录操作430,那里任何对于主语言模型变化被记录。
考虑下面的将主语言模型应用至新设备的例子。假设用户已经使用了语言处理系统,该系统允许用户在多个设备中备份和同步语言模型。该用户在旧手机上使用语言处理系统,但购买了一款新手机。当用户在新的设备上启动语言处理系统,它要求一组登录凭证。一旦用户登录到现有的语言处理系统帐户(或其他识别帐户,如FacebookTM),本地语言处理系统连接到主语言处理系统,并加载主动态语言模型,其包括来自旧手机所有使用。其结果是,本地语言处理系统检索所有的变化,并将其结合到新设备中。其结果是,当用户开始键入,新手机上的语言模型基于先前使用的情况做出预测,并为用户提供更好的体验。
考虑下面的根据本发明的各种实施例用于同步多个设备的例子:假设用户购买新的平板电脑以匹配用户的手机。该用户的帐户被访问并且本地语言模型与在云中的主语言模型同步。在一些实施例中,云或云基础设施仅仅是一个基于服务器的可以分布的系统。当用户开始使用平板电脑写电子邮件,在当前区域的常用新单词以及一些新的短语被加载。然后,当用户拿起手机和键入最近加载的新单词的几个字符,单词便显示在她的单词选择列表中。如果用户选择该单词,新的短语的下一个单词在用户的单词选择列表中被给予作为预测选择。
本发明的各种实施例的一个优点是允许用户跨多个设备保持语言模型的能力,并保持其随时间处于最新状态。这使用户能够购买新的设备,并从他们上次离开的地方拿起,以及将词语在跨多个设备上保持一致。本发明的各种实施例还通过允许跨多个设备实际用户语言模型的分析方法,使得该该信息被用来改善默认的或共享的语言模型。
本发明的各种实施例可提供消息发送系统来同步改变事件,其被确定为在多个设备之间具有重要性。图5是展示了根据本发明的各种实施例的用于利用高优先级消息发送系统的一组操作500。优先级确定操作510在本地语言模型确定改变事件的优先级。高优先级改变事件(例如,添加到语言模型的新单词和n元语法)在高优先级发送操作520中经由实时连接(例如,TCP连接)被立即发送到主处理系统。在一些实施例中,显著影响预测引擎中的单词的权重的事件可被确定为高优先级。
主处理系统用这些改变事件更新主语言模型,并在同步操作530期间将改变推送至本地语言模型。低优先级的改变事件在之后的时间使用低优先级发送操作540被发送到主处理系统(例如,通过批处理消息)。主处理系统用这些改变事件更新主语言模型,并在同步操作550期间将改变推送至本地语言模型。
在一些实施例中,主处理系统可以整合语来自从单个设备和多个设备的语言模型变化。例如,如果有三个设备同步,主模型可以为第三个设备整合来自第一和第二设备的一组变化。在一些情况下,该系统可以基于使用和/或时间结合和/或聚集常见事件以及丢弃不再可应用的事件。在一些实施例中,相同的优先级可被应用到所有的改变事件。而在其它的实施例中,每个事件或事件组,可以有不同的优先级。本地设备可以基于多重考虑(例如网络可用性)使用事件优先级来创建更新和基于优先级或在较大块中发送事件。然后,主处理系统可以处理该事件,并将它们发送至其他设备。
考虑下面的实时同步例子:假设用户有带有语言处理系统最新版本的手机和平板,其能够实时同步单词。用户在平板电脑上给他的一些朋友写关于他最喜欢的节目太空堡垒卡拉狄加的电子邮件。太空堡垒不是用户的语言模型的一部分,因此,用户需要将其完全地键入,连同不能被识别的卡拉狄加。系统检测到添加单词事件,并产生一个消息在整个消息系统上发送到服务器。服务器检测到手机也是活跃的,并将事件发送到用户手机。当用户完成电子邮件,他立刻在他的电话上接收到他的朋友信息,想聊太空堡垒卡拉狄加。用户拿起他的手机,开始写回复,当他开始键入太空堡垒时,他注意到该系统立即预测了它,不需要他输进去。
本发明的一些实施例还提供了语言处理系统,用于语言更新的基于服务器的订阅模型被客户使用。在至少一个实施例中,客户可以使用如连接状态(例如,蜂窝或Wi-Fi)和/或用户偏好的设备级别因素,确定最优化更新安排。例如,如果判定存在高品质的和免费的数据管道,则更频繁的更新可被应用。类似地,如果只有低质量(例如,不断地掉线或EDGE),系统可能延迟大数据集的同步。另外,对于在其中良好连接的变化可以被实时发送的高优先级事件,可能会发生更频繁的更新,而一个差的连接可能导致系统要么分批处理,要么丢弃事件。根据一些实施例,设备可能被告知可能的语言模型增强列表(例如,恐龙或街道名称),其被手动或自动订阅,然后被整合到本地语言模型。
图6是根据本发明的一个或多个实施例示出的用于整合基于服务器的订阅模式的一组操作600的流程图。规定何时自动更新本地语言模型的规则在本发明中被称为“订阅”,被发送到客户且用于更新订阅下的本地语言模型的周期性变化被称为“订阅包”。订阅可以是基于类别(例如,在进入国家时下载相关国家的语言)或为特定主题(例如,接收与丹佛艺术博物馆相关的所有更新)。根据各种实施例,订阅包(即,实际的更新)可以是批量的二进制事件,批量的基于文本的事件或一组上述两者中任一的事件。系统接收触发事件后,如下所述可以是基于位置、基于事件、基于社区等等,订阅包被自动发送给用户。根据各种实施例,订阅更新通常包括在用户接受订阅时的第一下载,随后通过定期或不定期的更新来改变。
例如,在一些实施例中,用户可以通过呈现一个或多个类别、设置、选项或可用订阅包的GUI导航。该GUI可包括设置来驱动基于位置的订阅、根据用户的位置和/或可用的订阅的总列表两者的可用选项的手动列表。该GUI可以给用户呈现通知来基于位置订阅。例如,当用户移动到博物馆或其它位置,系统检测到专用于此位置的列表并提示用户选择。
如图6中所示,接收操作610接收通过添加(可能是暂时的)附加单词用于更新语言模型的触发事件。在一些实施例中,触发事件可以是指示与一组附加的单词相关的标识的广播信号。例如,博物馆中的展出可以广播识别订阅包的信号,该订阅包与用户刚进去的展览具有共同的一组单词。该广播可以是被用来从远程服务器下载订阅包的标识。在其他情况下,该广播可以包括共同的单词集本身。触发事件的其它例子可以包括用户扫描1-D或2-D条码(例如,在标志、广告或杂志上)或GPS位置。该订阅包可以被自动或手动接受。然后,发送操作620将接受发送到主语言处理系统,那里订阅包在更新操作630中被添加至主语言模型。然后,位于用户设备上的本地模型使用同步操作640被更新。
在一些实施例中,本地语言处理系统(即,在终端用户设备上运行的客户端)可以使用当前语言作为触发事件,以确定更新哪些模型。在这种情况下,基于语言的更新可以从基于服务器的系统(即,主语言处理系统)提供给客户端,且该客户端将使用活跃语言来确定是否应取出更新。一个好处是,增强只下载给用户正在活跃使用的语言,即使该用户可能已经使用具有更新的其他语言。当用户切换语言,该系统将确定服务器是否通知了该设备用于语言的更新以及处理任何更新。
考虑下面的例子,其中用户的手机检索了来自服务器的可用订阅列表。本地语言处理系统检测到用户当前正在使用英语,并在美国的区域设置。客户端确定了所有可用的适当英语订阅并订阅他们。客户端为用户的设备下载了当前更新。其结果是,用户发现设备现在预测了它之前没有预测的他最喜爱的音乐家的名字。当用户切换到他的母语法语,客户端确定了所有可用的适当法语订阅并订阅他们。第二天,该服务器通知该客户端它已经订阅的英语和法语模型的更新。由于设备仍然在法语状态,该设备更新了法语订阅,并在用户切换回英语时,将英语订阅标记为可用。
在一些实施例中,位置和/或众包可以被用作触发事件,来确定用于下载的单词或订阅包。例如,当用户到了巴黎,法语订阅包可被下载/和或激活。作为众包的一个例子,可以由在你的地理位置的那些人做出哪些订阅被下载和/或激活的决定。也就是说,如果在一定地理区域内的大多数人已经主动用特定订阅配置了他们的移动设备,则系统可将该订阅建议给用户,或自动将该订阅添加到用户的设备。在这样的情况下,用于下载的触发事件是,在某一特定地理区域内具有同一个订阅的人口的一定比例。根据特定限制,如距离和/或时间也可以被应用来指定该触发条件。
各种实施例允许管理订阅的不同机制。例如,在一些情况下,终端用户可以在应用中或通过基于网络的系统管理订阅。各种图形用户界面可被创建,其允许用户选择手动或自动更新和切换。图7是代表性图形用户界面700的截图,其用过GUI生成模块260产生,允许用户为用户的移动设备管理订阅。用户界面700包括各种单选按钮和域,允许用户修改与订阅关联的设置以自动更新本地语言模型。例如,在区域710,用户可以定义与外国语言订阅关联的各种设置。根据各种实施例,用户可以选择基于语言的使用自动订阅,并使该设备根据位置保持更新。用户还可以选择基于语言和/或位置手动订阅,或者让他们进入设置来更改选项,或当有新的订阅来提示用户。
在区域720中,用户可以定义与基于位置的订阅关联的各种设置。单选按钮722允许用户选择自动的基于位置的更新,其由移动设备到达新的城市被触发,单选按钮724允许用户选择自动的基于位置的更新,其由移动设备到达新的国家被触发。单选按钮726允许用户指定他们是否有兴趣接收基于位置的更新,其与地标或兴趣点(例如,博物馆、图书馆、公民馆)关联。关联的下拉菜单728允许用户指定由地标或者兴趣点触发的基于位置的更新的范围。例如,该用户可以指定,当用户进入离地标或者兴趣点1公里内时,自动地出现更新。
在区域730中,用户可以定义与社交订阅关联的各种设置。例如,下拉菜单732允许用户从一个社交网络服务,如的识别出该用户想保持公共语言模型的朋友群。在这种方式下,由在一组朋友中的用户创建的并添加到本地语言模型的如昵称的术语被自动传播到该组朋友的其他人。其他社交网络如Twitter、Google Plus、Path、博客、Orkut、新浪微博和其他的也可以在一些实施例中被使用。
在区域740中,用户可以定义应用于该订阅包的各种网络或设备设置。例如,单选按钮742允许用户指定只有当用户的移动设备连接到Wi-Fi或其他低成本的网络连接时,才下载所有包。单选按钮744允许用户指定当用户不太可能使用他们的移动设备的特定的小时中时,所有的包应出现。下拉菜单746允许用户指定定义订阅是否仅适用于本设备,还是适用于用户所拥有的所有设备。例如,用户可能希望只使用Wi-Fi下载订阅,而不使用完他们的数据计划。由于免费的Wi-Fi技术的扩散,用户可以跳转到公共Wi-Fi和为终端用户下载已标记在本地设备上的可用更新。用户也可以利用基于其他网络的系统,如本地蓝牙网络,来将数据传输到其它装置或从中央服务器传输数据。
在一些实施例中,该系统可以利用网络条件。例如,如果系统检测到用户目前处于它确定为一个差的或计量的连接时,更新将不会被处理。当系统确定用户处于一个更高质量的和/或非计量的连接时,系统将会更新相应的改进。
在区域750中,系统给用户呈现由用户选择的订阅选项的额外成本。当用户定义与订阅更新关联的各种设置时,成本由系统动态地更新。如果用户同意接受显示的价格,系统可以生成一个或多个图形用户界面屏幕(未示出),为那些需要支付的订阅接受支付信息。各种费用表、费率和/或计划可使用在各种实施例中。例如,订阅费可以基于时间(例如,对每月或每年的使用收费)、整个系统使用的一次性费用、对每个服务的一次性费用、或者对每个地标的单独使用费。
图8展示了根据本发明的各种实施例的可与每个用户关联的一组信息800。如图8所示,一个用户记录可包括用户ID、本地ID、本地设备版本、当前位置、当前的语言ID以及任何由本地语言处理系统利用的临时语言模型。
示例性计算机系统概述
本发明的实施例包括以上已描述的各种步骤和操作。各种这些步骤和操作可以被硬件部件执行,或者应用于机器可执行指令中,其可以被用来使被指令编程的通用或专用处理器来执行步骤。相应地,这些步骤可以通过硬件、软件和/或固件的组合来执行。同样的,图9是计算机系统900的例子,本发明的实施例可通过其被利用。根据本例子,该计算机系统包括总线905、至少一个处理器910、至少一个通信端口915、主存储器920、可移除存储介质925、只读存储器930和大容量存储器935。
处理器910可以是任何已知的处理器,如但不限于, 或者Itanium处理器;或速龙处理器;或lines处理器。通信端口915可以是任何一个RS-232端口,用于与基于调制解调器的拨号连接,10/100以太网端口,或者使用铜缆或光纤的千兆端口。通信端口915可以根据网络选择,如局域网(LAN)、广域网(WAN)或者任何计算机系统900与之连接的网络。
主存储器920可以是随机存取存储器(RAM)或任何其它在本领域中公知的动态存储设备。只读存储器930可以是任何静态存储设备,例如用于存储如用于处理器910的指令的静态信息的可编程只读存储器(PROM)芯片。
大容量存储器935可以被用于存储信息和指令。例如,如SCSI驱动器系列的硬盘、光盘、磁盘阵列,如RAID,如RAID驱动器Adaptec系列,或者任何其他大容量存储设备可被使用。
总线905通信地将处理器910与其他存储器、存储和通信块耦合。总线905可以是取决于所使用的存储设备的基于PCI/PCI-X或SCSI的系统总线。
可移除存储介质925可以是任何类型的外部硬盘驱动器、软盘驱动器、Zip驱动器、光盘-只读存储器(CD-ROM)、光盘-可重写(CD-RW)、数字视频光盘-只读存储器(DVD-ROM)。
以上所述意在列举一些可能的类型。上述实施例绝不是限制本发明的范围,因为它们仅是示例性实施例。
除非上下文清楚地要求,否则本说明书和权利要求中的单词“包括”等被解释为包含的意义,而不是排他或穷举的含义;也就是说,“包括但不限于”的含义。如本文所用,术语“连接”、“耦接”或其任何变体是指任何两个或两个以上元件之间直接或间接的连接或耦接;元件之间的耦接或连接可以是物理的、逻辑的或其组合。另外,单词“其中”、“以上”、“以下”以及类似含义的单词,当在本申请中被使用时,是指本申请的整体而不是本申请的任何特定部分。如果上下文允许,在上述具体实施方式中使用单数或复数的单词还可以分别包括复数或单数。涉及两个或两个以上项目的列表,单词“或”包括了单词的所有以下解释:该列表中的任何项目、列表中的所有项目、以及列表中项目的任何组合。
以上对本发明的具体实施例不旨在穷举或将本发明限制在以上所公开的精确形式。尽管本发明的具体实施例在以上以说明的目的被描述,如相关领域技术人员所认识到的,各种等同修改在本发明的范围之内是可能的。例如,尽管处理或模块以给定的顺序呈现,替换实现可以不同的顺序执行具有不同顺序的步骤的例程,或采用具有不同顺序的块的系统,并且某些过程或块可以被删除、移动、增加、细分、组合和/或修改以提供替代性或子组合。这些处理或模块每个可以以各种不同的方式来实现。此外,尽管过程或块有时显示出串联执行,这些处理或块可以替代地被并行执行或实施,或者可以在不同的时间被执行。此外,本文提到的任何特定数字仅仅是示例:替代性的实施可以采用不同的值或范围。
本文提供的本发明的教导可以应用于其它系统,而不一定是上述系统。上述各种实施例的元素和动作可以被组合以提供本发明的进一步实施方式。本发明的一些替代实施方式可不仅包括除以上所述的那些实施方式的额外元件,也可以包括更少的元件。
这些和其他的变化可以根据上述具体实施方式对本发明作出。虽然上述说明描述了本发明的某些特定实施例,并描述了可预期的最佳模式,无论上述描述在文字中多么详细,本发明可以以很多方式实现。该系统的细节可以在具体的实施例中有着显著的变化,但仍然被包括在本文所公开的发明中。如上所述,描述本发明的特定的特征或方面时所使用的术语不应被认为暗示该术语在此被重新定义,以被限制为与该术语关联的任何本发明的特定特性、特征或方面。一般地,下面的权利要求中使用的术语不应当被解释为将本发明为限制在说明书中公开的具体实施例中,除非上述具体实施方式部分明确定义了此种术语。因此,本发明的实际范围不仅包括所公开的例子,也包括在权利要求下实践或实施本发明的所有等同的方式。
为降低权利要求的数量,本发明的某些方面以特定的权利要求的形式在下面给出,但申请人设想了在任何数量的权利要求形式下的本发明的各个方面。例如,尽管只有本发明的一个方面被叙述为计算机可读介质权利要求,其它方面同样可被实施为计算机可读介质权利权利要求,或以其他形式,例如被体现为装置加功能的权利要求。(任何拟根据35美国联邦法典§112,下的权利要求以“用于..装置”开始,但是在其他环境中对“用于”的使用不会引起35美国联邦法典§112,的处理)。相应地,申请人保留在提交本申请后寻求额外权利要求的权利,以在本申请或在后续申请中追求这样的额外权利要求。

Claims (14)

1.一种用于操作主语言处理系统的方法,应用于服务器,所述方法包括:
在所述主语言处理系统处从多个本地语言处理系统接收更新消息,其中所述更新消息包括由所述多个本地语言处理系统检测的对本地语言模型的一个或多个改变事件,其中每个更新消息还包括反映在所述更新消息中的一个或多个改变事件的优先级的优先等级;
根据所述一个或多个改变事件,在所述主语言处理系统中实时或近实时更新主语言模型,所述一个或多个改变事件被包括在从所述多个本地语言处理系统接收的所述更新消息中,其中,在所述主语言模型被用具有低优先等级的更新消息更新之前,所述主语言模型先用具有高优先等级的更新消息更新;
为所述多个本地语言处理系统的每个本地语言处理系统产生同步消息,以使各个本地语言处理系统整合来自其他本地语言处理系统的改变事件;以及
向所述多个本地语言处理系统的每个发送所述同步消息,使得对所述主语言模型的更新被传播到所述本地语言模型。
2.如权利要求1所述的方法,其中在所述主语言处理系统接收的所述更新消息包括来自所述多个本地语言处理系统并具有低优先等级的多组批量的更新消息。
3.如权利要求1所述的方法,其中每一个同步消息还包括反映在所述同步消息中的改变事件的优先级的优先等级。
4.如权利要求3所述的方法,其中在所述主语言模型用具有所述高优先等级的每一个更新消息更新后,立即产生具有高优先等级的同步消息。
5.如权利要求1所述的方法,其中所述更新消息根据优先等级通过不同的网络连接被发送。
6.如权利要求1所述的方法,其中所述主语言模型系统是基于服务器的系统,且更新消息通过网络连接被接收。
7.如权利要求1所述的方法,其中所述一个或多个改变事件包括新单词、移除单词、n元语法或单词权重。
8.如权利要求1的所述的方法,其中所述接收的一个或多个改变事件被分类成多组改变事件来使得所述主语言处理器处理类似的事件。
9.如权利要求1所述的方法,其中所述主语言模型包括静态的语言模型和动态的语言模型。
10.一种用于操作本地语言处理系统的计算机可实施方法,包括:
在运行所述本地语言处理系统的计算设备处检测对本地语言模型的一个或多个改变事件并确定与所述一个或多个改变事件的每一个关联的优先等级,所述一个或多个改变事件反映所述本地语言模型的更新使得所述本地语言模型和主语言模型不同;
根据已经检测到的一个或多个改变事件,修改所述本地语言模型;
先发送带有高优先等级的任意所述一个多个改变事件到所述主语言处理系统,所述主语言处理系统使用带有高优先等级的任意所述一个多个改变事件来更新主语言模型;以及
将任意带有低优先等级的所述一个或多个改变事件分组到批处理,以在之后的某个时间发送到所述主语言处理系统,所述主语言处理系统使用带有低优先等级的所述一个或多个改变事件来更新主语言模型,
其中,所述主语言处理系统在与所述计算设备远程的基于服务器的计算系统上操作。
11.如权利要求10所述的计算机可实施方法,还包括从所述主语言处理系统接收同步消息,其中所述同步消息包括根据事件改变在所述计算设备上将被结合进所述本地语言模型的变化,所述事件改变通过在其他计算设备上的其他语言处理系统被报告到所述主语言处理系统。
12.如权利要求10所述的计算机可实施方法,其中在所述计算设备上的所述本地语言处理系统和在其他计算设备上的所述其他本地语言处理系统与共同的用户关联。
13.如权利要求10所述的计算机可实施方法,其中所述一个或多个改变事件包括新单词、移除单词、n元语法或单词权重。
14.如权利要求10所述的计算机可实施方法,还包括:
确定所述计算设备是否是与用户关联的新设备;以及
如果所述计算设备是新设备,接收对所述本地语言模型的改变事件,使得所述本地语言模型与所述主语言模型同步。
CN201380066013.2A 2012-10-17 2013-10-16 多设备智能语言模型同步 Active CN104885071B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201261715186P 2012-10-17 2012-10-17
US61/715,186 2012-10-17
US13/834,887 US9035884B2 (en) 2012-10-17 2013-03-15 Subscription updates in multiple device language models
US13/834,887 2013-03-15
US13/834,575 US8983849B2 (en) 2012-10-17 2013-03-15 Multiple device intelligent language model synchronization
US13/834,575 2013-03-15
PCT/US2013/065318 WO2014062851A1 (en) 2012-10-17 2013-10-16 Multiple device intelligent language model synchronization

Publications (2)

Publication Number Publication Date
CN104885071A CN104885071A (zh) 2015-09-02
CN104885071B true CN104885071B (zh) 2019-05-28

Family

ID=50476174

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380066013.2A Active CN104885071B (zh) 2012-10-17 2013-10-16 多设备智能语言模型同步

Country Status (5)

Country Link
US (3) US9035884B2 (zh)
EP (1) EP2909736A4 (zh)
KR (1) KR101693653B1 (zh)
CN (1) CN104885071B (zh)
WO (1) WO2014062851A1 (zh)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201208373D0 (en) * 2012-05-14 2012-06-27 Touchtype Ltd Mechanism for synchronising devices,system and method
US9747895B1 (en) * 2012-07-10 2017-08-29 Google Inc. Building language models for a user in a social network from linguistic information
US9035884B2 (en) 2012-10-17 2015-05-19 Nuance Communications, Inc. Subscription updates in multiple device language models
US9253160B2 (en) * 2012-12-31 2016-02-02 Kent Lawson Methods, systems, and media for secure connection management and automatic compression over metered data connections
US10102845B1 (en) * 2013-02-25 2018-10-16 Amazon Technologies, Inc. Interpreting nonstandard terms in language processing using text-based communications
US9323780B2 (en) * 2013-03-13 2016-04-26 Microsoft Technology Licensing, Llc Locale-based sorting on mobile devices
US9672818B2 (en) * 2013-04-18 2017-06-06 Nuance Communications, Inc. Updating population language models based on changes made by user clusters
KR101456974B1 (ko) 2013-05-21 2014-10-31 삼성전자 주식회사 사용자 단말기, 음성인식 서버 및 음성인식 가이드 방법
US10049656B1 (en) * 2013-09-20 2018-08-14 Amazon Technologies, Inc. Generation of predictive natural language processing models
US9812130B1 (en) * 2014-03-11 2017-11-07 Nvoq Incorporated Apparatus and methods for dynamically changing a language model based on recognized text
US10643616B1 (en) * 2014-03-11 2020-05-05 Nvoq Incorporated Apparatus and methods for dynamically changing a speech resource based on recognized text
US10978052B2 (en) 2014-04-16 2021-04-13 Facebook, Inc. Email-like user interface for training natural language systems
US20150309984A1 (en) * 2014-04-25 2015-10-29 Nuance Communications, Inc. Learning language models from scratch based on crowd-sourced user text input
US20150370674A1 (en) * 2014-06-19 2015-12-24 Microsoft Corporation Tenant provisioning for testing a production multi-tenant service
US9311811B1 (en) 2014-10-08 2016-04-12 Google Inc. Alarm profile for a fabric network
WO2016058138A1 (en) * 2014-10-15 2016-04-21 Microsoft Technology Licensing, Llc Construction of lexicon for selected context
US10248640B2 (en) * 2015-02-05 2019-04-02 Microsoft Technology Licensing, Llc Input-mode-based text deletion
US10073828B2 (en) * 2015-02-27 2018-09-11 Nuance Communications, Inc. Updating language databases using crowd-sourced input
KR102325724B1 (ko) * 2015-02-28 2021-11-15 삼성전자주식회사 다수의 기기에서 텍스트 데이터 동기화
US20160307562A1 (en) * 2015-04-14 2016-10-20 GM Global Technology Operations LLC Controlling speech recognition systems based on radio station availability
US20160379630A1 (en) * 2015-06-25 2016-12-29 Intel Corporation Speech recognition services
CN105654945B (zh) * 2015-10-29 2020-03-06 乐融致新电子科技(天津)有限公司 一种语言模型的训练方法及装置、设备
US10354200B2 (en) 2015-12-14 2019-07-16 Here Global B.V. Method, apparatus and computer program product for collaborative mobility mapping
US10248406B2 (en) * 2016-11-17 2019-04-02 International Business Machines Corporation Locale object management
KR102691541B1 (ko) * 2016-12-19 2024-08-02 삼성전자주식회사 음성 인식 방법 및 장치
KR102068182B1 (ko) * 2017-04-21 2020-01-20 엘지전자 주식회사 음성 인식 장치, 및 음성 인식 시스템
CN107481722A (zh) * 2017-08-21 2017-12-15 无锡小天鹅股份有限公司 语音控制方法、衣物处理装置及服务器
CN107918497A (zh) * 2017-11-14 2018-04-17 厦门攸信信息技术有限公司 一种控制器的预测方法及系统
CN108597533B (zh) * 2018-04-10 2021-11-23 北京三听科技有限公司 一种增强智能终端的语音输入信号的方法和系统
US10896672B2 (en) * 2018-04-16 2021-01-19 Google Llc Automatically determining language for speech recognition of spoken utterance received via an automated assistant interface
US11494200B2 (en) * 2018-05-02 2022-11-08 Microsoft Technology Licensing, Llc. Configuring an electronic device using artificial intelligence
US11205045B2 (en) * 2018-07-06 2021-12-21 International Business Machines Corporation Context-based autocompletion suggestion
KR102225984B1 (ko) * 2018-09-03 2021-03-10 엘지전자 주식회사 음성 인식 서비스를 제공하는 서버
CN109617950B (zh) * 2018-11-26 2021-09-03 杭州涂鸦信息技术有限公司 一种数据更新方法、装置、设备及可读存储介质
CN110609654B (zh) * 2019-08-14 2021-03-12 广州视源电子科技股份有限公司 数据同步显示方法、装置、设备以及远程会议系统
CN111209075B (zh) * 2020-01-21 2024-02-09 深圳市优必选科技股份有限公司 多语言界面维护方法、系统、存储介质和智能设备
KR20220055789A (ko) * 2020-10-27 2022-05-04 삼성전자주식회사 사용자 모델을 관리하는 전자 장치 및 이의 동작 방법
US11929079B2 (en) 2020-10-27 2024-03-12 Samsung Electronics Co., Ltd Electronic device for managing user model and operating method thereof
US12039265B2 (en) * 2020-12-01 2024-07-16 Rovi Guides, Inc. Systems and methods to support a new locale in a language model
US11115353B1 (en) * 2021-03-09 2021-09-07 Drift.com, Inc. Conversational bot interaction with utterance ranking
CN112926042B (zh) * 2021-04-13 2024-01-16 效生软件科技(上海)有限公司 一种跨通道生物语音识别验证系统及验证方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1968281A (zh) * 2006-11-21 2007-05-23 华为技术有限公司 实现终端间单词库数据同步的方法及终端
EP1791114A1 (en) * 2005-11-25 2007-05-30 Swisscom Mobile Ag A method for personalization of a service
CN101030157A (zh) * 2007-04-20 2007-09-05 北京搜狗科技发展有限公司 一种用户词库同步更新的方法和系统
CN101079037A (zh) * 2006-06-26 2007-11-28 腾讯科技(深圳)有限公司 一种中文词库更新系统及方法
CN101627382A (zh) * 2007-01-07 2010-01-13 苹果公司 根据同步偏好与主机设备的数据同步

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5566229A (en) * 1992-08-24 1996-10-15 At&T Voice directed communications system employing shared subscriber identifiers
US5677989A (en) * 1993-04-30 1997-10-14 Lucent Technologies Inc. Speaker verification system and process
US5896544A (en) * 1996-12-26 1999-04-20 Intel Corporation Software device for supporting a new class of PC peripherals
US6205418B1 (en) * 1997-06-25 2001-03-20 Lucent Technologies Inc. System and method for providing multiple language capability in computer-based applications
US6623529B1 (en) 1998-02-23 2003-09-23 David Lakritz Multilingual electronic document translation, management, and delivery system
US6226618B1 (en) 1998-08-13 2001-05-01 International Business Machines Corporation Electronic content delivery system
WO2000021232A2 (en) * 1998-10-02 2000-04-13 International Business Machines Corporation Conversational browser and conversational systems
US6785869B1 (en) * 1999-06-17 2004-08-31 International Business Machines Corporation Method and apparatus for providing a central dictionary and glossary server
US6788768B1 (en) 1999-09-13 2004-09-07 Microstrategy, Incorporated System and method for real-time, personalized, dynamic, interactive voice services for book-related information
US9076448B2 (en) 1999-11-12 2015-07-07 Nuance Communications, Inc. Distributed real time speech recognition system
JP2002073072A (ja) * 2000-08-31 2002-03-12 Sony Corp モデル適応装置およびモデル適応方法、記録媒体、並びにパターン認識装置
US6823306B2 (en) * 2000-11-30 2004-11-23 Telesector Resources Group, Inc. Methods and apparatus for generating, updating and distributing speech recognition models
US20020169777A1 (en) * 2001-03-15 2002-11-14 Liviu Balajel Database architecture and method
US7103534B2 (en) * 2001-03-31 2006-09-05 Microsoft Corporation Machine learning contextual approach to word determination for text input via reduced keypad keys
US7058890B2 (en) 2002-02-13 2006-06-06 Siebel Systems, Inc. Method and system for enabling connectivity to a data system
US6763019B2 (en) * 2002-03-05 2004-07-13 Nokia Corporation Method and system for authenticated fast channel change of media provided over a DSL connection
US7016849B2 (en) 2002-03-25 2006-03-21 Sri International Method and apparatus for providing speech-driven routing between spoken language applications
JP3863118B2 (ja) 2002-04-01 2006-12-27 松下電器産業株式会社 受信装置、印刷装置およびファームウェア更新システム
CN1453767A (zh) 2002-04-26 2003-11-05 日本先锋公司 语音识别装置以及语音识别方法
US7398209B2 (en) 2002-06-03 2008-07-08 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7228275B1 (en) * 2002-10-21 2007-06-05 Toyota Infotechnology Center Co., Ltd. Speech recognition system having multiple speech recognizers
US7313528B1 (en) * 2003-07-31 2007-12-25 Sprint Communications Company L.P. Distributed network based message processing system for text-to-speech streaming data
US20050193370A1 (en) * 2004-02-27 2005-09-01 Goring Brian R. System and method for interactive wireless applications with conditional UI controls and screen navigation
US7324083B2 (en) 2004-06-02 2008-01-29 Research In Motion Limited Handheld electronic device with text disambiguation
US9178948B2 (en) * 2004-07-30 2015-11-03 Qualcomm Incorporated Methods and apparatus for subscribing to multimedia delivery services in a data network
US20060122840A1 (en) 2004-12-07 2006-06-08 David Anderson Tailoring communication from interactive speech enabled and multimodal services
US7640160B2 (en) 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
US7590536B2 (en) * 2005-10-07 2009-09-15 Nuance Communications, Inc. Voice language model adjustment based on user affinity
US8140336B2 (en) 2005-12-08 2012-03-20 Nuance Communications Austria Gmbh Speech recognition system with huge vocabulary
US7587378B2 (en) * 2005-12-09 2009-09-08 Tegic Communications, Inc. Embedded rule engine for rendering text and other applications
US20070136068A1 (en) * 2005-12-09 2007-06-14 Microsoft Corporation Multimodal multilingual devices and applications for enhanced goal-interpretation and translation for service providers
DE102006006551B4 (de) 2006-02-13 2008-09-11 Siemens Ag Verfahren und System zum Bereitstellen von Sprachdialoganwendungen sowie mobiles Endgerät
JP5040909B2 (ja) * 2006-02-23 2012-10-03 日本電気株式会社 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム
US7756708B2 (en) 2006-04-03 2010-07-13 Google Inc. Automatic language model update
US8073681B2 (en) 2006-10-16 2011-12-06 Voicebox Technologies, Inc. System and method for a cooperative conversational voice user interface
US8355915B2 (en) * 2006-11-30 2013-01-15 Rao Ashwin P Multimodal speech recognition system
US8886540B2 (en) * 2007-03-07 2014-11-11 Vlingo Corporation Using speech recognition results based on an unstructured language model in a mobile communication facility application
US20110060587A1 (en) * 2007-03-07 2011-03-10 Phillips Michael S Command and control utilizing ancillary information in a mobile voice-to-speech application
US20080288252A1 (en) * 2007-03-07 2008-11-20 Cerra Joseph P Speech recognition of speech recorded by a mobile communication facility
US20080221884A1 (en) * 2007-03-07 2008-09-11 Cerra Joseph P Mobile environment speech processing facility
US8065624B2 (en) 2007-06-28 2011-11-22 Panasonic Corporation Virtual keypad systems and methods
CN101169789A (zh) * 2007-11-30 2008-04-30 腾讯科技(深圳)有限公司 基于输入法的词库更新装置及方法
CN101551801B (zh) * 2008-03-31 2013-05-22 国际商业机器公司 数据同步的方法和系统
JP5475795B2 (ja) 2008-11-05 2014-04-16 グーグル・インコーポレーテッド カスタム言語モデル
US8229937B2 (en) * 2008-12-16 2012-07-24 Sap Ag Automatic creation and transmission of data originating from enterprise information systems as audio podcasts
GB201108200D0 (en) * 2011-05-16 2011-06-29 Touchtype Ltd User input prediction
US9111540B2 (en) * 2009-06-09 2015-08-18 Microsoft Technology Licensing, Llc Local and remote aggregation of feedback data for speech recognition
US8682640B2 (en) * 2009-11-25 2014-03-25 International Business Machines Corporation Self-configuring language translation device
US8595380B2 (en) 2009-12-15 2013-11-26 Red Hat, Inc. Message bus based replication
US20110197227A1 (en) 2010-02-11 2011-08-11 Alan Rouse Systems and methods for providing roaming video wanted list and roaming video preferences
CN102063450A (zh) * 2010-04-16 2011-05-18 百度在线网络技术(北京)有限公司 一种基于网络的供用户进行文字输入的方法与设备
CN101847159A (zh) * 2010-05-11 2010-09-29 中兴通讯股份有限公司 终端设备及其词库更新的方法
US8595234B2 (en) * 2010-05-17 2013-11-26 Wal-Mart Stores, Inc. Processing data feeds
US20120010886A1 (en) * 2010-07-06 2012-01-12 Javad Razavilar Language Identification
US20120324391A1 (en) 2011-06-16 2012-12-20 Microsoft Corporation Predictive word completion
US8903707B2 (en) * 2012-01-12 2014-12-02 International Business Machines Corporation Predicting pronouns of dropped pronoun style languages for natural language translation
US8909565B2 (en) 2012-01-30 2014-12-09 Microsoft Corporation Clustering crowdsourced data to create and apply data input models
US9020824B1 (en) * 2012-03-09 2015-04-28 Google Inc. Using natural language processing to generate dynamic content
US20140365221A1 (en) * 2012-07-31 2014-12-11 Novospeech Ltd. Method and apparatus for speech recognition
US9035884B2 (en) 2012-10-17 2015-05-19 Nuance Communications, Inc. Subscription updates in multiple device language models

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1791114A1 (en) * 2005-11-25 2007-05-30 Swisscom Mobile Ag A method for personalization of a service
CN101079037A (zh) * 2006-06-26 2007-11-28 腾讯科技(深圳)有限公司 一种中文词库更新系统及方法
CN1968281A (zh) * 2006-11-21 2007-05-23 华为技术有限公司 实现终端间单词库数据同步的方法及终端
CN101627382A (zh) * 2007-01-07 2010-01-13 苹果公司 根据同步偏好与主机设备的数据同步
CN101030157A (zh) * 2007-04-20 2007-09-05 北京搜狗科技发展有限公司 一种用户词库同步更新的方法和系统

Also Published As

Publication number Publication date
EP2909736A4 (en) 2016-05-11
US9361292B2 (en) 2016-06-07
US9035884B2 (en) 2015-05-19
WO2014062851A1 (en) 2014-04-24
US8983849B2 (en) 2015-03-17
US20150234807A1 (en) 2015-08-20
EP2909736A1 (en) 2015-08-26
US20140108003A1 (en) 2014-04-17
CN104885071A (zh) 2015-09-02
KR20150074075A (ko) 2015-07-01
US20140108018A1 (en) 2014-04-17
KR101693653B1 (ko) 2017-01-06

Similar Documents

Publication Publication Date Title
CN104885071B (zh) 多设备智能语言模型同步
US10567568B2 (en) User event pattern prediction and presentation
AU2017202007B2 (en) Notification feed across multiple client devices
US8626141B2 (en) Method and apparatus for customizing a user interface menu
US20170140048A1 (en) Information processing method, apparatus, terminal and server
US20160321551A1 (en) Semantic Locations Prediction
US11194717B2 (en) Facts control and evaluating card definitions using cached facts
US11281992B2 (en) Predicting geofence performance for optimized location based services
US20230068252A1 (en) Smart advanced content retrieval
US9736636B1 (en) Geofence prioritization
EP2779057A1 (en) Computing system with relationship model mechanism and method of operation thereof
US20210144111A1 (en) Automatic electronic message filtering method and apparatus
WO2014049378A1 (en) Method of processing data in a data processing engine
US20200334217A1 (en) Content grouping and surfacing
KR102039995B1 (ko) 메신저 서비스에서의 사용자 상황에 따른 효율적인 멀티미디어 메시지 제공 방법 및 시스템
US9514443B2 (en) Locating previously communicated electronic messages
CN106651272B (zh) 一种配送信息管理的方法和设备以及移动终端
KR20210009301A (ko) 사용 정도에 기초하여 대화방을 처리하는 방법과 시스템 및 비-일시적인 컴퓨터 판독가능한 기록 매체
KR20240108713A (ko) 일정 정보에 기반하여 메시지 검색 결과를 추천하는 방법, 컴퓨터 장치, 및 컴퓨터 프로그램
Caixeiro Integration of an App iOS APP with Social Networks and Cloud Storages
Caixeiro Integration of an iOS App with Social Networks and Cloud Storages

Legal Events

Date Code Title Description
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20231025

Address after: Washington State

Patentee after: MICROSOFT TECHNOLOGY LICENSING, LLC

Address before: Massachusetts

Patentee before: NUANCE COMMUNICATIONS, Inc.