CN101563683A - 提供基于灵活文本的语言识别的方法、设备和计算机程序产品 - Google Patents

提供基于灵活文本的语言识别的方法、设备和计算机程序产品 Download PDF

Info

Publication number
CN101563683A
CN101563683A CNA2007800468255A CN200780046825A CN101563683A CN 101563683 A CN101563683 A CN 101563683A CN A2007800468255 A CNA2007800468255 A CN A2007800468255A CN 200780046825 A CN200780046825 A CN 200780046825A CN 101563683 A CN101563683 A CN 101563683A
Authority
CN
China
Prior art keywords
score
language
entry
alphabet
multilingual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800468255A
Other languages
English (en)
Inventor
B·巴利加
M·A·哈如
J·埃索-斯皮拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Oyj
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN101563683A publication Critical patent/CN101563683A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/263Language identification

Abstract

一种用于提供基于灵活文本的语言识别的设备,包括:字母表计分部件、n元语法频率部件和处理部件。字母表计分部件可被配置为接收计算机可读文本格式的词条,并针对多种语言中的每个计算所述词条的字母表分数。n元语法频率部件可被配置为针对多种语言中的每个计算所述词条的n元语法频率分数。处理部件可与所述n元语法频率部件和所述字母表计分部件通信。所述处理部件还可被配置为基于所述字母表分数和所述n元语法频率分数的组合确定与所述词条关联的语言。

Description

提供基于灵活文本的语言识别的方法、设备和计算机程序产品
技术领域
本发明实施例总的涉及语音处理技术,更具体地,涉及用于提供基于灵活文本的语言识别的方法、设备和计算机程序产品。
背景技术
现代通信时代带来了有线和无线网络的巨大发展。计算机网络、电视网络、和电话网络正在经历由消费者需求引起的前所未有的技术发展。无线和移动网络技术已经解决了相关消费者需求,同时提供更加灵活和直接的信息传递。
目前和未来的网络技术不断使得信息传递变得容易并方便用户使用。需要使信息传递变得容易的一个领域涉及向移动终端的用户提供服务。所述服务可以是用户所期望的特定介质或通信应用的形式,例如音乐播放器、游戏机、电子书、短消息、电子邮件等。所述服务也可以是交互应用的形式,在这种形式中用户可响应于网络设备以执行任务、玩游戏或实现目标。可以从网络服务器或其他网络设备,或甚至从移动终端(例如移动电话、移动电视、移动计算机、移动游戏系统等)提供所述服务。
在许多应用中,用户必须从网络或移动终端接收音频信息(例如口头反馈或指令),或用户必须向网络或移动终端给出口头指令或反馈。这种应用可提供不取决于实际手动用户行为的用户界面。换句话说,用户可以在免提(hand free)或半免提环境下与应用交互。这种应用的实例可以是支付帐单、点播节目、请求和接收驱动指令等。其他应用可将口头语音转变成文本,或基于识别的语音执行一些其他功能,例如口述SMS或电子邮件等。为了支持这些和其他应用,语音识别应用、从文本生成语音的应用、和其他语音处理设备将变得更加普遍。
从计算机可读文本生成语音的设备(例如文语转换(TTS)设备)典型地分析文本,并执行语音和韵律分析以生成音素,作为与原始文本的内容相关的合成语音来输出。然而,由于这种设备在全世界使用,并且还由于许多地理位置在当地居民所说的语言方面不断增加的多样性,所以可遇到涉及各种语言的文本。例如,文本的直接音素到合成语音的转换可造成不精确或听起来不自然。目前用于消除上述缺陷的机制可能需要大量的文本来顺利工作,因此并不灵活。
所以,期望提供对输入数据的灵活语言识别,以保证在执行文语转换时使用适当的语言模型。
发明内容
因此,提供一种方法、设备和计算机程序产品,用于提供基于灵活文本的语言识别。根据本发明示例性实施例,可为了语言识别而精确分析甚至如一个词那样短的文本。因此,为了支持高度可配置的多语言系统,可提供灵活语言识别。
在一个示例性实施例中,提供一种用于提供基于灵活文本的语言识别的方法。该方法包括:接收计算机可读文本格式的词条;对多种语言中的每个确定所述词条的字母表分数;对多种语言中的每个确定所述词条的n元语法频率分数;以及基于所述字母表分数和所述n元语法频率分数的组合确定与所述词条关联的语言。
在另一示例性实施例中,提供一种用于提供基于灵活文本的语言识别的计算机程序产品。该计算机程序产品包括至少一个计算机可读存储介质,在该介质中存储有计算机可读程序代码部分。所述计算机可读程序代码部分包括第一、第二、第三和第四可执行部分。第一可执行部分用于接收计算机可读文本格式的词条。第二可执行部分用于对多种语言中的每个确定所述词条的字母表分数。第三可执行部分用于对多种语言中的每个确定所述词条的n元语法频率分数。第四可执行部分用于基于所述字母表分数和所述n元语法频率分数的组合确定与所述词条关联的语言。
在另一示例性实施例中,提供一种用于提供基于灵活文本的语言识别的设备。该设备可包括:字母表计分部件、n元语法频率部件和处理部件。字母表计分部件可被配置为接收计算机可读文本格式的词条,并针对多种语言中的每个计算所述词条的字母表分数。n元语法频率部件可被配置为针对多种语言中的每个计算所述词条的n元语法频率分数。处理部件可与所述n元语法频率部件和所述字母表计分部件通信。所述处理部件可被配置为基于所述字母表分数和所述n元语法频率分数的组合确定与所述词条关联的语言。
在另一示例性实施例中,提供一种用于提供基于灵活文本的语言识别的设备。该设备包括:用于接收计算机可读文本格式的词条的装置;用于对多种语言中的每个确定所述词条的字母表分数的装置;用于对所述多种语言中的每个确定所述词条的n元语法频率分数的装置;以及用于基于所述字母表分数和所述n元语法频率分数的组合确定与所述词条关联的语言的装置。
本发明实施例可提供一种在系统中采用的方法、设备和计算机程序产品,以改善语音处理。结果,例如移动终端和其他电子设备可获益于对各种语言精确执行语音处理的能力,而不需要大量基于文本的数据用于分析。因此,可使用相对少量的资源执行精确的词识别和再现。
附图说明
现在将参照附图概括描述本发明实施例,所述附图不必按规定比例,其中:
图1是根据本发明示例性实施例的移动终端的示意性框图;
图2是根据本发明示例性实施例的无线通信系统的示意性框图;
图3是根据本发明示例性实施例的用于提供基于灵活文本的语言识别的系统的框图;以及
图4是根据本发明示例性实施例的用于提供基于灵活文本的语言识别的示例性方法的流程图。
具体实施方式
现在将参照附图在下文中更详细描述本发明实施例,其中示出一些但并非本发明所有的实施例。当然,本发明可通过许多不同形式来实现,并且不应该理解为限制为这里所描述的实施例;此外,提供这些实施例使得本发明满足适当的法律需求。在附图中,类似的标号表示类似的元素。
图1示出从本发明实施例得到的移动终端10的框图。然而,应理解,这里所示和下文中所述的移动电话仅是从本发明实施例得到的一种移动终端的示例,因此不应用来限制本发明实施例的范围。尽管为了示例的目的在下文中示出和描述移动终端10的一个实施例,但是其他类型的移动终端(例如便携式数字助理(PDA)、寻呼机、移动计算机、移动电视、游戏机、膝上型计算机、照相机、录像机、GPS设备和其他类型语音和文本通信设备)可容易地采用本发明实施例。此外,并非移动的设备也可以容易地采用本发明实施例。
以下将结合移动通信应用主要描述本发明实施例的系统和方法。然而,应理解,可在移动通信业界中以及移动通信业界以外结合各种其他应用使用本发明实施例的系统和方法。
移动终端10包括天线12(或多个天线),其可操作地与发射机14和接收机16通信。移动终端10还包括控制器20或分别向发射机14和接收机16提供信号以及从中接收信号的其他处理部件。信号包括根据适当蜂窝系统的空中接口标准的信令信息、以及用户语音、所接收的数据和/或用户生成的数据。在此,移动终端10能够通过一个或多个空中接口标准、通信协议、调制类型、和接入类型来运行。通过图示,移动终端10能够根据多个第一、第二、第三和/或第四代通信协议等中的任一个来运行。例如,移动终端10能够根据第二代(2G)无线通信协议IS-136(TDMA)、GSM、和IS-95(CDMA)、或根据第三代(3G)无线通信协议(例如UMTS、CDMA2000、WCDMA和TD-SCDMA)、根据第四代(4G)无线通信协议等来运行。
可以理解,控制器20包括期望实现移动终端10的音频和逻辑功能的电路。例如,控制器20可包括数字信号处理器设备、微处理器设备、以及各种模数转换器、数模转换器、和其他支持电路。移动终端10的控制和信号处理功能根据他们各自的性能位于在这些设备之间。因此,控制器20还可包括在调制和传输之前对消息和数据进行卷积编码和交织的功能。控制器20还可包括内部语音编码器,并且可包括内部数据调制解调器。此外,控制器20可包括运行可存储在存储器中的一个或多个软件程序的功能。例如,控制器20能够运行连接程序,例如传统Web浏览器。于是,连接程序可允许移动终端10例如根据无线应用协议(WAP)和/或超文本传输协议(HTTP)等发送和接收Web内容,例如基于位置的内容和/或其他Web页面内容。
移动终端10还可包括用户接口,其包括输出设备(例如传统耳机或扬声器24、振铃器22、麦克风26、显示器28)和用户输入接口,所述全部设备耦合至控制器20。允许移动终端10接收数据的用户输入接口可包括允许移动终端10接收数据的多种设备中的任一个,例如键板30、触摸屏(未示出)或其他输入设备。在包括键板30的实施例中,键板30可包括传统数字(0-9)和相关键(#,*),以及用于操作移动终端10的其他键。可选地,键板30可包括传统的标准键盘(QWERTY)的键板配置。键板30还可包括具有相关功能的各种软键。附加地或可选地,移动终端10可包括例如操纵杆或其他用户输入接口的接口设备。移动终端10还包括电池34,例如振动电池组,用于对操作移动终端10所需的各种电路提供电力以及可选地用于提供机械振动作为可检测输出。
移动终端10还可包括用户身份模块(UIM)38。UIM 38典型地是具有嵌入处理器的存储器设备。例如,UIM 38可包括订户身份模块(SIM)、通用集成电路卡(UICC)、通用订户身份模块(USIM)、可移动用户身份模块(R-UIM)等。UIM 38典型地存储与移动订户相关的信息元素。除了UIM 38之外,移动终端10还可配备有存储器。例如,移动终端10可包括易失性存储器40,例如易失性随机存取存储器(RAM),其包括用于临时存储数据的缓存区。移动终端10还可包括其他非易失性存储器42,其可以被嵌入和/或可以是可插拔的。非易失性存储器42可附加地或可选地包括EEPROM、闪存等,例如他们可由加利福尼亚州(California)Sunnyvale的SanDisk公司提供或可由加利福尼亚州(California)Frenmont的Lexar Media公司提供。存储器可存储由移动终端10使用的多条信息和数据中的任一条,以实现移动终端10的功能。例如,存储器可包括能够唯一识别移动终端10的标识符,例如国际移动设备识别(IMEI)码。
图2是根据本发明示例性实施例的无线通信系统的示意性框图。现在参照图2,提供从本发明实施例得到的一种系统的示例。该系统包括多个网络设备。如图所示,一个或多个移动终端10均可包括天线12,用于向基站点或基站(BS)44发送信号以及从其接收信号。基站44可以是一个或多个蜂窝网络或移动网络的一部分,所述每个网络包括运行网络所需的单元,例如移动交换中心(MSC)46。正如本领域普通技术人员已知地,移动网络还可称为基站/MSC/互通功能(BMI)。在运行中,当移动终端10发出和接收呼叫时,MSC 46能够向移动终端10和从移动终端10路由呼叫。当在呼叫中涉及移动终端10时,MSC 46还可提供到陆线中继(landline trunk)的连接。此外,MSC 46能够控制向移动终端10和从移动终端10转发消息,并且还可控制向消息中心和从消息中心转发移动终端的消息。应注意,尽管在图2的系统中示出MSC 46,但是MSC 46仅是示例性网络设备,并且本发明实施例不限于在采用MSC的网络中使用。
MSC 46可耦合至数据网络(例如局域网(LAN)、城域网(MAN)和/或广域网(WAN))。MSC 46可直接耦合至数据网络。然而,在一个典型实施例中,MSC 46耦合至网关设备(GTW)48,GTW 48耦合至WAN,例如因特网50。而诸如处理部件的设备(如个人计算机、服务器计算机等)可经由因特网50耦合至移动终端10。例如,如下所述,处理部件可包括一个或多个与如下所述的计算系统52(图2中示出2个)、源服务器54(图2中示出1个)等关联的处理部件。
BS 44还可耦合至信令GPRS(通用分组无线业务)支持节点(SGSN)56。正如本领域普通技术人员已知地,SGSN 56典型地能够执行与用于分组交换服务的MSC 46类似的功能。与MSC 46类似,SGSN 56可耦合至数据网络(例如因特网50)。SGSN 56可直接耦合至数据网络。然而,在一个更典型实施例中,SGSN 56耦合至分组交换核心网络,例如GPRS核心网络58。该分组交换核心网络耦合至另一GTW 48,例如GTW GPRS支持节点(GGSN)60,而GGSN 60耦合至因特网50。除了GGSN 60之外,该分组交换核心网络还可耦合至GTW 48。GGSN 60还可耦合至消息中心。在此,与MSC 46类似,GGSN 60和SGSN 56能够控制消息(例如MMS消息)的转发。GGSN 60和SGSN 56还能够控制向消息中心和从消息中心转发移动终端10的消息。
此外,通过将SGSN 56耦合至GPRS核心网络58和GGSN 60,诸如计算系统52和/或源服务器54的设备可经由因特网50、SGSN 56和GGSN 60耦合至移动终端10。在此,诸如计算系统52和/或源服务器54的设备可通过SGSN 56、GPRS核心网络58和GGSN 60与移动终端10通信。通过将移动终端10和其他设备(例如计算系统52、源服务器54等)直接或间接连接至因特网50,移动终端10可例如根据超文本传输协议(HTTP)和/或类似协议与其他设备和彼此通信,由此执行移动终端10的各种功能。
尽管这里没有示出和描述各种可能移动网络的每个单元,但是应理解,移动终端10可通过BS 44耦合至多种不同网络中任一种网络中的一个或多个。在此,网络能够根据多个第一代(1G)、第二代(2G)、2.5G、第三代(3G)、3.9G、第四代(4G)移动通信协议等的任一个或多个支持通信。例如,一个或多个网络能够根据2G无线通信协议IS-136(TDMA)、GSM、和IS-95(CDMA)支持通信。例如,一个或多个网络还能够根据2.5G无线通信协议GPRS、增强数据GSM环境(EDGE)等支持通信。此外,例如,一个或多个网络能够根据3G无线通信协议(例如采用宽带码分多址(WCDMA)无线电接入技术的通用移动电话系统(UMTS)网络)支持通信。一些窄带AMPS(NAMPS)以及TACS网络也可以从本发明实施例得到,其应该是双模或更多模式移动站(例如数/模或TDMA/CDMA/模拟电话)。
移动终端10还可耦合至一个或多个无线接入点(AP)62。AP 62可包括被配置为根据多种技术(例如射频(RF)、蓝牙(BT)、红外(IrDA)或任意多种不同无线组网技术,其包括如IEEE 802.11(例如802.11a、802.11b、802.11g、802.11n等)的无线LAN(WLAN)技术、如IEEE 802.16的WiMAX技术和/或如IEEE 802.15等的超宽带(UWB)技术)与移动终端10通信的接入点。AP 62可耦合至因特网50。与MSC 46类似,AP 62可直接耦合至因特网50。然而,在一个实施例中,AP 62可经由GTW 48间接耦合至因特网50。此外,在一个实施例中,BS 44可认为是另一个AP62。可以理解,通过直接或间接地将移动终端10和计算系统52、源服务器54、和/或任意其他设备连接至因特网50,移动终端10可彼此、与计算系统等通信,从而执行移动终端10的各种功能,例如向计算系统52发送数据、内容等和/或从计算系统52接收内容、数据等。其中,术语“数据”、“内容”、“信息”和类似术语可交替使用,以表示能够根据本发明实施例发送、接收和/或存储的数据。因此,任意这种术语的使用不应该限制本发明实施例的精神和范围。
尽管图2中没有示出,附加地或代替地,除了通过因特网50将移动终端10连接至计算系统52之外,移动终端10和计算系统52可根据例如RF、BT、IrDA或任意多种不同有线或无线通信技术(包括LAN、WLAN、WiMAX、UWB技术等)彼此耦合和通信。一个或多个计算系统52可附加地或可选地包括能够存储内容的可移动存储器,该内容之后可传输至移动终端10。此外,移动终端10可耦合至一个或多个电子设备,例如打印机、数字投影仪和/或其他多媒体捕获、生成和/或存储设备(例如其他终端)。与计算系统52类似,移动终端10可被配置为根据多种技术(例如RF、BT、IrDA或任意多种不同有线或无线通信技术(包括USB、LAN、WLAN、WiMAX、UWB技术等))与便携式电子设备通信。
在示例性实施例中,与口语接口相关的数据可在图2的系统上在移动终端(可类似于图1的移动终端10)与图2的系统的网络设备之间或移动终端之间通信。例如,应该理解,不需要采用图2的系统在服务器和移动终端之间通信,但是仅提供图2用作示例的目的。此外,应该理解,本发明实施例可驻留在例如移动终端10的通信设备上,或者可驻留在可访问通信设备的网络设备或其他设备上。
图3示出根据本发明示例性实施例的用于提供灵活语言识别的系统的框图。现在将参照图3描述本发明示例性实施例,其中示出用于提供灵活语言识别的系统的某些部件。为了示例的目的,将结合图1的移动终端10来描述图3的系统。然而,应注意,图3的系统还可以结合各种其他设备(移动的和固定的)来使用,因此本发明实施例不应限制为应用于如图1的移动终端10的设备。还应注意,尽管图3示出提供灵活语言识别的系统配置的一个实例,但是还可以采用各种其他配置来实现本发明实施例。
现在参照图3,提供一种用于提供灵活语言识别的系统68。系统68包括与语言识别(LID)部件72通信的第一种语音处理部件,例如文语转换(TTS)部件70。应注意,尽管在包括TTS部件72的语音处理部件的环境中描述图3,但是可选地或附加地可采用其他语音处理部件。例如,自动语音识别(ASR)部件可使用LID部件72,以选择与正确语言对应的适当规则,用于将文本数据转换成在识别中要使用的音素序列。通常,文本语素转换的规则集合在语言之间有所不同。此外,尽管在TTS部件70之前示出LID部件72,但是这种配置不是必须的。此外,根据本发明实施例的LID部件72可配置在可分析文本的系统68的任意部分。换句话说,可结合语音处理部件或结合语音处理部件的组合来使用LID部件72,以处理文本形式的输入数据、输出数据、或中间数据。此外,尽管图3示出使用LID部件72向TTS部件70提供输入文本,但是TTS部件70可选地可从任意其他源接收输入文本。
如图3所示,在一个实施例中,TTS部件70可以是在能够根据计算机可读文本生成合成语音的硬件、软件、或其组合中实现的任意设备或装置。例如,图3的TTS部件70的部件仅是示例性的,并且为了清楚起见,仅以示例性地给出以下所提供的描述,以概括地说明TTS部件70的操作。TTS部件70可包括例如文本处理器76、韵律处理器78、和声音合成器80。
文本处理器76可接收介质输入,例如输入文本82,并开始处理输入文本82,之后将所处理的文本传送至韵律处理器78。文本处理器76可被配置为执行本领域已知的各种处理操作中的任一个。文本处理器76可包括将特定文本词或字母序列与用于发音的特定规范或规则关联的表或其他机制。在示例性实施例中,文本处理器76可被配置为将非书面语表示(例如数字和缩写)转换成对应的书面词等同物。
韵律处理器78可分析所处理的文本,以确定文本应该如何发音、重读什么音节、使用什么音调、多快发出声音等的规范。在示例性实施例中,韵律处理器78可被配置为将文本和文本的标记段分成各种韵律单元,例如短语、从句和句子。韵律处理器78还可采用文本音素(TTP)转换模块或映射,用于执行输入文本82的标音。标音和韵律信息的组合构成可向声音合成器80中输入的音素的符号语言表示。
声音合成器80可被配置为响应于音素的输入序列以计算机生成语音的形式生成合成产生的音频输出。声音合成器80可将所存储的规则或模型应用于来自韵律处理器78的输入,以便以符合韵律处理器78确定的规范的方式生成可听地再现计算机文本的合成语音84。然后,可将合成语音84发送至输出设备,例如音频混合器或另一输出设备,如扬声器22。
在期望将TTS部件70用在多语言系统中的示例性实施例中,可与声音合成器80关联地存储分别对应于不同语言的各种模型。因此,可训练每个特定语言模型以响应于与特定语言对应的音素序列生成自然发声和精确合成语音。因此,如果向TTS部件70通知输入文本82的正确语言(或基于理性分析最可能是正确的语言),则TTS部件70能够选择对应的语言模型并以合成语音84的形式生成输入文本82的自然和精确的发声表示。
在此,LID部件72可被配置为分析输入文本8(其可以甚至如一个词大小),并生成与输入文本82关联的最可能语言(例如最佳语言)的精确估计。LID部件712可以是在能够接收输入文本82和确定与输入文本82最可能关联的语言的硬件、软件或其组合中实现的任意设备或装置。在示例性实施例中,LID部件72可包括处理部件90,其可控制LID部件72的其他部件的操作或与其通信。可通过许多方式实现处理部件90。例如,处理部件90可实现为处理器、协处理器、控制器或包括诸如例如ASIC(专用集成电路)的集成电路的各种其他处理装置或设备。在根据以下所述的处理确定最可能语言列表之后,LID部件70可向TTS部件70传送语言识别信息91。语言识别信息91可包括与输入文本82关联的最佳语言或n元最佳语言的列表的识别。
在示例性实施例中,LID部件72的其他部件可包括:字母表计分部件92,其被配置为对输入文本82中的每个词(或词条)分配字母表分数;和n元语法频率分析部件94,其被配置为对输入文本82中的每个词提供n元语法频率分数。可选地,处理部件90或甚至多个处理部件可执行与字母表计分部件92和/或n元语法频率分析部件94相关的所有功能。在示例性实施例中,处理部件90还可被配置为对每个词确定组合分数,其中该组合分数包括每个词的字母表分数和n元语法频率分数。在示例性实施例中,处理部件90还可被配置为基于输入文本82中的每个词的组合分数确定输入文本82的累积组合分数。基于累积组合分数,处理部件90可被配置为确定与输入文本82关联的最佳语言(例如最希望或可能的语言)。在一个实施例中,具有最低分数的特定语言可代表最佳语言。然而,可选实施例可根据用于分数计算的算法和采用的计分模式选择具有最高分数的语言。
在一个实施例中,LID部件72可包括分组排序部件96,其具有用于最佳语言确定的预定的语言偏好信息,以用在组合分数和/或累积组合分数没有提供与确定最佳语言相关的明显结果的情况。应注意,可通过组合每个组合分数,或首先组合输入文本82中每个词的所有字母表分数,并将所得到的组合字母表分数与组合了输入文本82中每个词的所有n元语法频率分数的结果相组合来确定累积组合分数。
字母表计分部件92可被配置为针对多种语言中的每个语言为输入文本82的每个词提供字母表分数。字母表计分部件92可以是在能够检查要解码的词的每个字符(或字母)以及将词的每个字符与多种语言的每个字母表相比较的硬件、软件、或其组合中实现的任意设备或装置。基于所述比较,字母表计分部件92可被配置为在多种语言中的每个语言中生成该词的字母表分数。多种语言中的每个语言的字母表分数可至少部分地取决于在要计分的多种语言的各个语言的对应字母表中无法表示词的一个或多个字符的情况。换句话说,如果词的每个字符能够在特定语言中表示,则在特定语言中的该词的字母表分数可能是最可能分数(根据所选计分模式其可以是更大或更小的数值),同时在其中不能表示某些字符的另一语言的字母表分数将差于该最可能分数一个量,这个量由不能够在该另外语言中表示的字符数目来确定。
在示例性实施例中,字母表计分部件92可被配置为基于每个词的“字母表外”字符的数目对该词分配字母表分数。在计算或确定每个词的字母表分数之后,字母表计分部件92可将字母表分数与阈值相比较,以确定该词是否具有及格或不及格的字母表分数。在示例性实施例中,该阈值可以是这样的预定值,即如果没有满足这个预定值,则其表示该词与计算该字母表分数的语言不相关的高可能性。换句话说,不及格的字母表分数表示在计算出不及格字母表分数的语言中该词不能够被表示。可选地,可简单地对计算出字母表分数的语言中不能够表示其字符的词分配不及格字母表分数。
在对多种语言中的每个语言中的词计算字母表分数之后,本发明示例性实施例的字母表计分部件92排除具有不及格字母表分数的每个语言作为由n元语法频率分析元件94进一步处理的候选语言。换句话说,如果该词接收到对特定语言的不及格字母表分数,则该词可不接收该特定语言的n元语法频率分数。在可选示例性实施例中,并非简单地计算在收到不及格字母表分数的语言中该词的n元语法频率分数,字母表计分部件92可被配置为对该词分配较差(例如比最小的非不及格字母表分数更小的)或甚至最差的可能分数。然后,n元语法频率分析部件94可在该词接收到不及格字母表分数的语言中处理该词。
在示例性实施例中,字母表计分部件92还可被配置为对多种语言中的每个语言计算或确定累积字母表分数。累积字母表分数可表示在多种语言中的对应的一个语言中输入文本82的每个词的字母表分数的组合。累积字母表分数可与阈值相比较,并可对一个词通过以上所述进行处理。
n元语法频率分析部件94可被配置为针对多种语言中的每个语言对输入文本82的每个词提供n元语法频率分数。n元语法频率分析部件94可以是在能够基于与多种语言中的每个语言相关的已知信息检查词的每个字符(或字母)以及与多种语言中的每个语言对应的词的可能性相关的概率的硬件、软件、或其组合中实现的任意设备或装置。在此,可对多种语言中的每个语言使用模型。每个模型可包括累积的n元语法统计,其可表示假定先前有n-1个字符时每个词(或词条)的第n个字符的条件概率。例如,对3字母“abc”来说,n元语法概率可表示假定先前2个字母是“ab”时字母“c”的条件概率。在示例性实施例中,n元语法频率分数可表示与该词相关的n元语法的n元语法概率的对数的累积。还应注意,尽管基于词级分析提供了这里的描述,可选地可基于音节、短语、句子等级别对任意文本执行分析。可选地,n元语法频率分析部件94可被配置为,通过组合输入文本82的每个词(或音节、短语、句子等)的n元语法频率分数来确定累积n元语法频率分数。
在示例性实施例中,可通过收集对多种语言中的每个语言的统计来创建每个模型。对多种语言的数目不存在限制。例如,可基于任意期望的因素来选择构成该多种语言的语言。每个模型对应于多种语言中的一个,并且可基于与每个模型相关的语言而收集的训练数据来生成。每个模型可实现为包括与对应模型相关的语言的n元语法频率和/或对应的n元语法概率的文件。在示例性实施例中,可对训练数据的每个词分配开始和停止字符。在此,开始字符(例如[)可在每个词之前,停止字符(例如])可在每个词之后,从而可区分开始n元语法(例如在紧邻开始字符之后的n元语法)、停止n元语法(例如在紧邻停止字符之前的n元语法)和内部n元语法(例如并非紧邻于开始或停止字符的语法)。
在示例性实施例中,可将语言的字母表描述为字符或字母的列表、字母表占用的Unicode范围、或两者。因此,可通过紧凑的机器可读格式与其他字母表一起描述大型字母表(例如普通话)。根据一个实施例,每个模型可包括对字母表的每个字母分配唯一索引的字母表描述信息。可根据索引表示n元语法频率数据。因此,可以简要方式表示n元语法频率数据,以减小模型的文件大小。
通过使用与多种语言对应的每个模型文件,可通过将模型文件组合到单一二进制文件中来创建与LID部件72关联的分组。因此,分组可基于在单一二进制文件中包括哪些模型来限定所支持的语言(即二进制文件的模型对应于要支持的特定语言)。在一个示例性实施例中,为了减小二进制文件的大小,可将n元语法频率数据存储在树型结构中。由于按广度优先遍历顺序依次存储节点,所以树型结构可支持快速树分析。
分组排序部件96可被配置为,在组合分数和/或累积组合分数没有提供与确定最佳语言相关的明显结果的情况下执行最佳语言确定。分组排序部件96可以是在最佳语言确定时能够具有解决语言之间联系的预定的语言偏好信息的硬件、软件、或其组合中实现的任意设备或装置。在此,如上所述,分组可限定所支持的语言。因此,分组排序部件96可存储分组和/或存储与分组所支持的语言的偏好或排序相关的信息。在此,可基于地理信息(例如在特定地理位置通常遇到的语言)或任何其他适当信息确定偏好信息。由于在一些情况下仅在词或输入文本82具有不及格的字母表分数并且不能够生成n元语法频率分数时使用分组排序部件96,所以在确定偏好信息时可使用可能生成这种结果的相关语言的信息以及遇到这种语言的频率。
在操作期间,当分析词条(例如音节、词、短语、句子等)时,可在字母表计分部件92中对词条进行字母表计数。在此,在一个实施例中,可将词条转换成当前语言的字母表的索引队列。如果在该语言中不支持该词条,则该语言对该词条得到不及格的字母表分数。同时,对于具有与该语言的字符相关的至少一些字符的词条,对该语言分配字母表分数。对于每个语言完成该处理,并为每个语言分配字母表分数。可对不适合语言给出小于最低及格分数的分数,或如上所述可排除其作为候选项。然后,n元语法频率部件94可计算词条的n元语法频率分数。词条可具有分别对前面和后面增加的开始和停止字符。
可通过各种方式实现本发明实施例。例如,可利用实施例对给定词、名称或词条生成几个候选语言的排序列表。因此,本发明的实施例有助于在没有与正确语言相关的精确信息可用时(例如扬声器独立的姓名拨号)用于语音识别。实施例还可在目标TTS语言和给定词的语言之间观察到脚本不匹配的情形下用于TTS合成(例如将汉语词合成到英语中)。例如,可对于大范围的语言组合或转换提供语言支持。
图4是根据本发明示例性实施例的系统、方法和程序产品的流程图。可以理解,可通过各种装置(例如硬件、固件、和/或包括一个或多个计算机程序指令的软件)来实现流程图的每个方框或步骤以及流程图中的方框的组合。例如,可通过计算机程序指令来实现上述一个或多个过程。在此,实现上述过程的计算机程序指令可通过移动终端的存储器设备来存储,并通过移动终端中嵌入的处理器来执行。可以理解,可将任意这种计算机程序指令载入到计算机或其他可编程设备(即硬件)上,以生成机器,从而在计算机或其他可编程设备上执行的指令创建用于实现在流程图的方框或步骤中指定的功能的装置。这些计算机程序指令还可以存储在指示计算机或其他可编程设备按特定方式运行的计算机可读存储器中,从而在计算机可读存储器中存储的指令生成这样的产品,其包括实现在流程图的方框或步骤中指定的功能的指令装置。计算机程序指令还可载入到计算机或其他可编程设备中,以使得一系列可操作步骤可以在计算机或其他可编程设备上执行,以生成计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图的方框或步骤中指定的功能的步骤。
因此,流程图的方框或步骤支持用于执行特定功能的装置的组合、用于执行特定功能的步骤的组合和用于执行特定功能的程序指令装置。还可以理解,可通过执行特定功能或步骤的基于专用硬件的计算机系统、或该专用硬件和计算机指令的组合来实现流程图中的一个或多个方框或步骤,以及流程图中的方框或步骤的组合。
在此,用于提供基于灵活文本的语言识别的方法的一个实施例可包括:在操作200,接收计算机可读文本格式的词条。在操作210,对多种语言中的每个语言可计算或确定该词条的字母表分数。在操作220,对多种语言中的每个语言可计算或确定该词条的n元语法频率分数。该方法还可包括:在操作230,基于字母表分数和n元语法频率分数的组合确定与该词条关联的语言。
可通过许多方式执行上述功能。例如,可采用实现以上每个功能的任意适当装置来实现本发明实施例。在一个实施例中,本发明的所有或一部分部件通常在计算机程序产品的控制下运行。执行本发明实施例的方法的计算机程序产品包括在计算机可读存储介质中实现的计算机可读存储介质(例如非易失性存储介质)和计算机可读程序代码部分(例如一系列计算机指令)。
这里阐述的本发明的许多修改和其他实施例使得本领域普通技术人员明了涉及的这些发明具有前述说明和相关附图中呈现的教导和优点。因此,可以理解,本发明实施例不限于这里公开的特定实施例,并且旨在将其修改和其他实施例包括在所附权利要求的范围内。尽管这里采用的特定术语,但是他们的使用仅在于一般性和说明性的意义,而并非限制。

Claims (33)

1.一种方法,包括:
接收计算机可读文本格式的词条;
对多种语言中的每种语言确定所述词条的字母表分数;
对多种语言中的每种语言确定所述词条的n元语法频率分数;以及
基于所述字母表分数和所述n元语法频率分数的组合确定与所述词条关联的语言。
2.如权利要求1所述的方法,其中确定字母表分数的步骤包括:
将与所述词条关联的字符与多种语言中的每种语言的字母表相比较;以及
对多种语言中的每种语言生成分数,对多个语言中的每个语言的分数至少部分地取决于在要计分的多种语言的各个语言的对应字母表中无法表示一个或多个字符的情况。
3.如权利要求1所述的方法,其中确定n元语法频率分数的步骤包括:对于多种语言中的每种语言,将所述词条与所述多种语言中的一个的n元语法统计相比较。
4.如权利要求3所述的方法,其中所述词条包括n个字符,以及将所述词条与n元语法统计相比较的步骤包括:确定假定所述词条先前有n-1个字符时所述词条的第n个字符的条件概率。
5.如权利要求3所述的方法,还包括:分别对词条的第一字符和最后字符分配开始字符和停止字符,以结合与所述n元语法统计的每个n元语法概率相关的对应开始字符和停止字符使用。
6.如权利要求1所述的方法,还包括:将多种语言中的每种语言的字母表分数与阈值相比较。
7.如权利要求6所述的方法,其中仅对所述字母表分数满足所述阈值的多种语言中的那些执行确定n元语法频率分数的步骤。
8.如权利要求6所述的方法,还包括:响应于所述字母表分数没有满足所述阈值,对所述词条分配预定的字母表分数。
9.如权利要求1所述的方法,其中确定与词条关联的语言的步骤包括:响应于所述字母表分数和所述n元语法频率分数的组合提供对于与所述词条关联的语言的不确定结果,基于语言的预定顺序选择与所述词条关联的语言。
10.如权利要求1所述的方法,其中所述词条是包括输入文本的多个段中的一个;以及
确定语言的步骤还包括:基于多个段中的每个的字母表分数和n元语法频率分数的累积组合确定与所述输入文本关联的语言。
11.一种计算机程序产品,包括至少一个计算机可读存储介质,在该介质中存储有计算机可读程序代码部分,所述计算机可读程序代码部分包括:
第一可执行部分,用于接收计算机可读文本格式的词条;
第二可执行部分,用于对多种语言中的每种语言确定所述词条的字母表分数;
第三可执行部分,用于对多种语言中的每种语言确定所述词条的n元语法频率分数;以及
第四可执行部分,用于基于所述字母表分数和所述n元语法频率分数的组合确定与所述词条关联的语言。
12.如权利要求11所述的计算机程序产品,其中所述第二可执行部分包括这样的指令:用于将与所述词条关联的字符与多种语言中的每个的字母表相比较;以及对多种语言中的每个生成分数,所述多种语言中的每个的分数至少部分地取决于在要计分的多种语言的各个语言的对应字母表中无法表示一个或多个字符的情况。
13.如权利要求11所述的计算机程序产品,其中所述第三可执行部分包括用于对多种语言中的每个,将所述词条与多个语言中的一个的n元语法统计相比较的指令。
14.如权利要求13所述的计算机程序产品,其中所述词条包括n个字符,以及所述第三可执行部分还包括用于确定假定所述词条先前有n-1个字符时所述词条的第n个字符的条件概率的指令。
15.如权利要求13所述的计算机程序产品,还包括第五可执行部分,用于分别对所述词条的第一字符和最后字符分配开始字符和停止字符,以结合与n元语法统计的每个n元语法概率关联的对应开始字符和停止字符使用。
16.如权利要求11所述的计算机程序产品,还包括第五可执行部分,用于将所述多种语言中的每个的字母表分数与阈值相比较。
17.如权利要求16所述的计算机程序产品,其中仅对字母表分数满足所述阈值的所述多种语言中的那些语言执行所述第三可执行部分。
18.如权利要求16所述的计算机程序产品,还包括:第六可执行部分,用于响应于所述字母表分数没有满足所述阈值,对所述词条分配预定的字母表分数。
19.如权利要求11所述的计算机程序产品,其中所述第四可执行部分包括这样的指令,用于响应于所述字母表分数和所述n元语法频率分数的组合提供对于与所述词条关联的语言的不确定结果,基于语言的预定顺序选择与所述词条关联的语言。
20.如权利要求11所述的计算机程序产品,其中所述词条是包括输入文本的多个段中的一个;以及
其中所述第四可执行部分包括用于基于所述多个段中的每个的字母表分数和n元语法频率分数的累积组合确定与所述输入文本关联的语言的指令。
21.一种设备,包括:
字母表计分部件,被配置为接收计算机可读文本格式的词条,并对多种语言中的每个计算所述词条的字母表分数;
n元语法频率部件,被配置为对所述多种语言中的每个计算所述词条的n元语法频率分数;以及
与所述n元语法频率部件和所述字母表计分部件通信的处理部件,所述处理部件被配置为基于所述字母表分数和所述n元语法频率分数的组合确定与所述词条关联的语言。
22.如权利要求21所述的设备,其中所述字母表计分部件还被配置为将与所述词条关联的字符与所述多种语言中的每个的字母表相比较;以及对所述多种语言中的每个生成分数,对所述多种语言中的每个的分数至少部分地取决于在要计分的多种语言的各个语言的对应字母表中无法表示一个或多个字符的情况。
23.如权利要求21所述的设备,其中所述n元语法频率部件还被配置为对所述多种语言中的每个,将所述词条与所述多种语言中的一个的n元语法统计相比较。
24.如权利要求23所述的设备,其中所述词条包括n个字符,以及其中所述n元语法频率部件还被配置为确定假定所述词条先前有n-1个字符时该词条的第n个字符的条件概率。
25.如权利要求23所述的设备,其中所述n元语法频率部件还被配置为分别对所述词条的第一字符和最后字符分配开始字符和停止字符,以结合与所述n元语法统计的每个n元语法概率关联的对应开始字符和停止字符使用。
26.如权利要求21所述的设备,所述字母表计分部件还被配置为将所述多种语言中的每个的字母表分数与阈值相比较。
27.如权利要求26所述的设备,其中所述n元语法频率部件还被配置为仅对所述字母表分数满足所述阈值的多个语言中的那些语言计算所述n元语法频率分数。
28.如权利要求26所述的设备,其中所述n元语法频率部件还被配置为响应于所述字母表分数没有满足所述阈值,对所述词条分配预定的字母表分数。
29.如权利要求21所述的设备,还包括:分组排序部件,被配置为响应于所述字母表分数和所述n元语法频率分数的组合提供对于与所述词条关联的语言的不确定结果,基于语言的预定义顺序选择与所述词条关联的语言。
30.如权利要求21所述的设备,其中所述词条是包括输入文本的多个段中的一个;以及其中所述处理部件还被配置为基于所述多个段中的每个段的字母表分数和n元语法频率分数的累积组合确定与所述输入文本关联的语言。
31.如权利要求21所述的设备,其中所述设备实现为移动终端。
32.一种设备,包括:
用于接收计算机可读文本格式的词条的装置;
用于对多种语言中的每个确定所述词条的字母表分数的装置;
用于对所述多种语言中的每个确定所述词条的n元语法频率分数的装置;以及
用于基于所述字母表分数和所述n元语法频率分数的组合确定与所述词条关联的语言的装置。
33.如权利要求32所述的设备,还包括:用于响应于所述字母表分数和所述n元语法频率分数的组合提供对于与所述词条关联的语言的不确定结果,基于语言的预定义顺序选择与所述词条关联的语言的装置。
CNA2007800468255A 2006-12-18 2007-12-12 提供基于灵活文本的语言识别的方法、设备和计算机程序产品 Pending CN101563683A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/611,964 US7552045B2 (en) 2006-12-18 2006-12-18 Method, apparatus and computer program product for providing flexible text based language identification
US11/611,964 2006-12-18

Publications (1)

Publication Number Publication Date
CN101563683A true CN101563683A (zh) 2009-10-21

Family

ID=39528593

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800468255A Pending CN101563683A (zh) 2006-12-18 2007-12-12 提供基于灵活文本的语言识别的方法、设备和计算机程序产品

Country Status (6)

Country Link
US (1) US7552045B2 (zh)
EP (1) EP2095266A2 (zh)
KR (1) KR20090099069A (zh)
CN (1) CN101563683A (zh)
RU (1) RU2009127102A (zh)
WO (1) WO2008075161A2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186522A (zh) * 2011-12-29 2013-07-03 富泰华工业(深圳)有限公司 电子设备及其自然语言分析方法
CN105765564A (zh) * 2013-12-20 2016-07-13 谷歌公司 标识语义上有意义的文本选择
CN107111607A (zh) * 2014-10-17 2017-08-29 机械地带有限公司 用于语言检测的系统和方法
CN109376355A (zh) * 2018-10-08 2019-02-22 上海起作业信息科技有限公司 英文单词和语句筛选方法、装置、存储介质及电子设备
US10699073B2 (en) 2014-10-17 2020-06-30 Mz Ip Holdings, Llc Systems and methods for language detection
US10769387B2 (en) 2017-09-21 2020-09-08 Mz Ip Holdings, Llc System and method for translating chat messages

Families Citing this family (203)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8185376B2 (en) * 2006-03-20 2012-05-22 Microsoft Corporation Identifying language origin of words
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
ITFI20070177A1 (it) * 2007-07-26 2009-01-27 Riccardo Vieri Sistema per la creazione e impostazione di una campagna pubblicitaria derivante dall'inserimento di messaggi pubblicitari all'interno di uno scambio di messaggi e metodo per il suo funzionamento.
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US8019596B2 (en) * 2008-06-26 2011-09-13 Microsoft Corporation Linguistic service platform
US8266514B2 (en) * 2008-06-26 2012-09-11 Microsoft Corporation Map service
US8073680B2 (en) 2008-06-26 2011-12-06 Microsoft Corporation Language detection service
US8107671B2 (en) * 2008-06-26 2012-01-31 Microsoft Corporation Script detection service
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US8583418B2 (en) * 2008-09-29 2013-11-12 Apple Inc. Systems and methods of detecting language and natural language strings for text to speech synthesis
US8712776B2 (en) 2008-09-29 2014-04-29 Apple Inc. Systems and methods for selective text to speech synthesis
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US8224641B2 (en) * 2008-11-19 2012-07-17 Stratify, Inc. Language identification for documents containing multiple languages
US8224642B2 (en) * 2008-11-20 2012-07-17 Stratify, Inc. Automated identification of documents as not belonging to any language
US9959870B2 (en) 2008-12-11 2018-05-01 Apple Inc. Speech recognition involving a mobile device
US8380507B2 (en) 2009-03-09 2013-02-19 Apple Inc. Systems and methods for determining the language to use for speech generated by a text to speech engine
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US8326602B2 (en) * 2009-06-05 2012-12-04 Google Inc. Detecting writing systems and languages
US8468011B1 (en) * 2009-06-05 2013-06-18 Google Inc. Detecting writing systems and languages
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8190420B2 (en) * 2009-08-04 2012-05-29 Autonomy Corporation Ltd. Automatic spoken language identification based on phoneme sequence patterns
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
DE202011111062U1 (de) 2010-01-25 2019-02-19 Newvaluexchange Ltd. Vorrichtung und System für eine Digitalkonversationsmanagementplattform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US9177333B2 (en) 2010-06-17 2015-11-03 Microsoft Technology Licensing, Llc Ad copy quality detection and scoring
US8442827B2 (en) * 2010-06-18 2013-05-14 At&T Intellectual Property I, L.P. System and method for customized voice response
CN101894548B (zh) * 2010-06-23 2012-07-04 清华大学 一种用于语种识别的建模方法及装置
US20120035905A1 (en) * 2010-08-09 2012-02-09 Xerox Corporation System and method for handling multiple languages in text
US8375035B2 (en) * 2010-08-17 2013-02-12 Oracle International Corporation Visual aid to assist making purchase by tracking key product characteristics
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9535895B2 (en) * 2011-03-17 2017-01-03 Amazon Technologies, Inc. n-Gram-based language prediction
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9164983B2 (en) 2011-05-27 2015-10-20 Robert Bosch Gmbh Broad-coverage normalization system for social media language
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
RU2500024C2 (ru) * 2011-12-27 2013-11-27 Общество С Ограниченной Ответственностью "Центр Инноваций Натальи Касперской" Способ автоматизированного определения языка и (или) кодировки текстового документа
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US10199051B2 (en) 2013-02-07 2019-02-05 Apple Inc. Voice trigger for a digital assistant
US9298703B2 (en) 2013-02-08 2016-03-29 Machine Zone, Inc. Systems and methods for incentivizing user feedback for translation processing
US10650103B2 (en) 2013-02-08 2020-05-12 Mz Ip Holdings, Llc Systems and methods for incentivizing user feedback for translation processing
US9600473B2 (en) 2013-02-08 2017-03-21 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US8996352B2 (en) 2013-02-08 2015-03-31 Machine Zone, Inc. Systems and methods for correcting translations in multi-user multi-lingual communications
US9031829B2 (en) 2013-02-08 2015-05-12 Machine Zone, Inc. Systems and methods for multi-user multi-lingual communications
US9977766B2 (en) * 2013-02-21 2018-05-22 Red Hat, Inc. Keyboard input corresponding to multiple languages
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
CN105027197B (zh) 2013-03-15 2018-12-14 苹果公司 训练至少部分语音命令系统
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
KR101809808B1 (ko) 2013-06-13 2017-12-15 애플 인크. 음성 명령에 의해 개시되는 긴급 전화를 걸기 위한 시스템 및 방법
DE112014003653B4 (de) 2013-08-06 2024-04-18 Apple Inc. Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
EP3480811A1 (en) 2014-05-30 2019-05-08 Apple Inc. Multi-command single utterance input method
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US9606986B2 (en) 2014-09-29 2017-03-28 Apple Inc. Integrated word N-gram and class M-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10765956B2 (en) 2016-01-07 2020-09-08 Machine Zone Inc. Named entity recognition on chat data
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
WO2018067440A1 (en) * 2016-10-03 2018-04-12 Machine Zone, Inc. Systems and methods for language detection
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11204787B2 (en) 2017-01-09 2021-12-21 Apple Inc. Application integration with a digital assistant
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
DK201770383A1 (en) 2017-05-09 2018-12-14 Apple Inc. USER INTERFACE FOR CORRECTING RECOGNITION ERRORS
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
CN109145145A (zh) 2017-06-16 2019-01-04 阿里巴巴集团控股有限公司 一种数据更新方法、客户端及电子设备
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
CN110491375B (zh) * 2019-08-22 2022-02-01 新疆科大讯飞信息科技有限责任公司 一种目标语种检测的方法和装置
WO2021056255A1 (en) 2019-09-25 2021-04-01 Apple Inc. Text detection using global geometry estimators

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5062143A (en) 1990-02-23 1991-10-29 Harris Corporation Trigram-based method of language identification
US6415250B1 (en) 1997-06-18 2002-07-02 Novell, Inc. System and method for identifying language using morphologically-based techniques
US6272456B1 (en) * 1998-03-19 2001-08-07 Microsoft Corporation System and method for identifying the language of written text having a plurality of different length n-gram profiles
US6292772B1 (en) 1998-12-01 2001-09-18 Justsystem Corporation Method for identifying the language of individual words
US6167369A (en) * 1998-12-23 2000-12-26 Xerox Company Automatic language identification using both N-gram and word information
FI20010644A (fi) 2001-03-28 2002-09-29 Nokia Corp Merkkisekvenssin kielen määrittäminen
US20040205675A1 (en) * 2002-01-11 2004-10-14 Thangaraj Veerappan System and method for determining a document language and refining the character set encoding based on the document language
US20040078191A1 (en) 2002-10-22 2004-04-22 Nokia Corporation Scalable neural network-based language identification from written text
FR2848688A1 (fr) 2002-12-17 2004-06-18 France Telecom Identification de langue d'un texte
EP1612695A1 (en) 2004-07-01 2006-01-04 Alcatel Method of language identification and language identifying module using short word lists and n-grams
US7865355B2 (en) * 2004-07-30 2011-01-04 Sap Aktiengesellschaft Fast text character set recognition
US8027832B2 (en) * 2005-02-11 2011-09-27 Microsoft Corporation Efficient language identification
GB0507036D0 (en) * 2005-04-07 2005-05-11 Ibm Method and system for language identification
US8185376B2 (en) * 2006-03-20 2012-05-22 Microsoft Corporation Identifying language origin of words

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186522A (zh) * 2011-12-29 2013-07-03 富泰华工业(深圳)有限公司 电子设备及其自然语言分析方法
CN103186522B (zh) * 2011-12-29 2018-01-26 富泰华工业(深圳)有限公司 电子设备及其自然语言分析方法
CN105765564A (zh) * 2013-12-20 2016-07-13 谷歌公司 标识语义上有意义的文本选择
CN107111607A (zh) * 2014-10-17 2017-08-29 机械地带有限公司 用于语言检测的系统和方法
US10699073B2 (en) 2014-10-17 2020-06-30 Mz Ip Holdings, Llc Systems and methods for language detection
US10769387B2 (en) 2017-09-21 2020-09-08 Mz Ip Holdings, Llc System and method for translating chat messages
CN109376355A (zh) * 2018-10-08 2019-02-22 上海起作业信息科技有限公司 英文单词和语句筛选方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
KR20090099069A (ko) 2009-09-21
RU2009127102A (ru) 2011-01-27
WO2008075161A2 (en) 2008-06-26
WO2008075161A3 (en) 2008-11-13
US20080147380A1 (en) 2008-06-19
US7552045B2 (en) 2009-06-23
EP2095266A2 (en) 2009-09-02

Similar Documents

Publication Publication Date Title
CN101563683A (zh) 提供基于灵活文本的语言识别的方法、设备和计算机程序产品
CN101542590A (zh) 提供基于语言的交互式多媒体系统的方法、装置和计算机程序产品
CN111667814B (zh) 一种多语种的语音合成方法及装置
CN103430232B (zh) 利用设备停靠情境的语音识别
WO2018157703A1 (zh) 自然语言的语义提取方法及装置和计算机存储介质
US20090326945A1 (en) Methods, apparatuses, and computer program products for providing a mixed language entry speech dictation system
CN101816039A (zh) 用于提供改进的话音转换的方法、装置和计算机程序产品
CN104813275A (zh) 用于预测文本的方法和系统
CN104462058B (zh) 字符串识别方法及装置
CN105657129A (zh) 通话信息获取方法和装置
CN108682421B (zh) 一种语音识别方法、终端设备及计算机可读存储介质
CN1495641B (zh) 将语音字符转换成书面字符的方法和设备
CN101595449A (zh) 用于在电子设备中输入中文字符的交叉媒体输入系统和方法
CN110069624B (zh) 文本处理方法及装置
CN110211562A (zh) 一种语音合成的方法、电子设备及可读存储介质
CN110827803A (zh) 方言发音词典的构建方法、装置、设备及可读存储介质
US20100268525A1 (en) Real time translation system and method for mobile phone contents
CN1855223B (zh) 音频字体输出设备、字体数据库和语言输入前端处理器
CN112580335B (zh) 多音字消歧方法及装置
JP2006235856A (ja) 端末機器、入力候補辞書選択方法
CN112527967A (zh) 文本匹配方法、装置、终端和存储介质
CN111460156A (zh) 样本扩充方法、装置、设备及计算机可读存储介质
CN115879440A (zh) 自然语言处理、模型训练方法、装置、设备及存储介质
JP2005128711A (ja) 感性情報推定方法および文字アニメーション作成方法、これらの方法を用いたプログラム、記憶媒体、感性情報推定装置、文字アニメーション作成装置
US20040049386A1 (en) Speech recognition method and system for a small device

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20091021