CN101263491A - 数至文本和语音的转换 - Google Patents
数至文本和语音的转换 Download PDFInfo
- Publication number
- CN101263491A CN101263491A CNA2006800331436A CN200680033143A CN101263491A CN 101263491 A CN101263491 A CN 101263491A CN A2006800331436 A CNA2006800331436 A CN A2006800331436A CN 200680033143 A CN200680033143 A CN 200680033143A CN 101263491 A CN101263491 A CN 101263491A
- Authority
- CN
- China
- Prior art keywords
- textization
- numeral
- represent
- numerical digit
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 title claims description 64
- 238000012937 correction Methods 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 44
- 238000004590 computer program Methods 0.000 claims description 41
- 230000015572 biosynthetic process Effects 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 37
- 238000003860 storage Methods 0.000 claims description 5
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 2
- 230000014509 gene expression Effects 0.000 abstract description 7
- 230000001419 dependent effect Effects 0.000 abstract 1
- 238000004458 analytical method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 4
- 230000001915 proofreading effect Effects 0.000 description 3
- 244000207178 Acinos arvensis Species 0.000 description 2
- 241000751119 Mila <angiosperm> Species 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005670 electromagnetic radiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 102220013477 rs117560775 Human genes 0.000 description 1
- 102220062245 rs1800369 Human genes 0.000 description 1
- 102220008982 rs187686559 Human genes 0.000 description 1
- 102220118806 rs4876870 Human genes 0.000 description 1
- 102220202372 rs557800691 Human genes 0.000 description 1
- 102220199366 rs762720562 Human genes 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
公开了一种将基数转换成为期望文本化表示、或者转换成为语音的解决方案。转换器(302)将基数的每个数字逐个转换成为文本化表示。组合器(304)根据数字的数位,来向数字的文本化表示添加数位值的文本化表示。校正器(306)基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字具有不同于正确表述的文本化表示,以及组合文本化表示用于形成数的完整文本化表示。合成器将数的完整文本化表示转换成为语音。
Description
技术领域
本发明涉及将数(number)转换成为文本形式、并且进一步转换至语音形式。
背景技术
可以通过文本至语音系统将书面文本转换成为语音,所述文本至语音系统可应用于多媒体、讲话网站、消息阅读(电子邮件、SMS)、用于免提/免看(eyesfree)设备(导航、移动电话)的用户界面、自动上下文感知的告知系统(包括变换数据、电话服务的任何事物)、以及视觉受损者辅助。
TTS系统的文本标准化器或者文本预处理器控制输入TTS系统的所有信息可通过常规字符来适当地呈现。进一步处理字符以创建相应的发音。然而,信息的数字式(numerical)部分(诸如,“1”、“45”、“363”)并不包含任何关于发音的线索,并且由此必须单独生成该发音。对此的一种方式是,将数转换成文本化表示。然后,如同在任何其他非数字式信息的情况下那样,使用文本串:“1”→“一”、“45”→“四十五”等,可以使用规则或者查找表来发音作为文本的数。
当然,在每种语言中数具有不同的文本表示。此外,文本串的构建根据不同语言而彼此不同。例如,在英语中,“四十三”包括针对数“40”和“3”的词语,在芬兰语包含针对“4”的词语,指示十和“3”。在法语中,数“74”是“soixamte-dix-quatre”,该数等于“60”、“10”和“4”。
基数(cardinal number)表示输入至TTS系统的一种特殊情况。如果所需数的范围较大,则不能将每个数的发音分别出处在查找表中。例如,支持从1至99999数的表的大小是非常巨大的。
对于将数转换至文本,已经提出了某些基于规则的方法。然而,所提出的方案具有许多问题。通常,这些方法是语言特定的,并且由此只能将数转换成为一种语言。通常,这些方法是基于复杂的数学需求(例如,取模计算)。总之,已知的基于规则的方法在方法以及结构两方面都是复杂的。
由此,需要一种用于构造基数的文本化表示的简单方案。该方案还应该适用于多种语言。
发明内容
本发明的一个方面提供了一种用于将数转换成为文本的改进的方案。根据本发明的一个方面,提供了一种将十进制数系统的基数转换成为期望语言的文本化表示的方法,所述基数包括由十的幂排序的数位序列中的至少一个数字(digit),所述方法包括:将所述基数的每个数字逐个转换成为期望语言的文本化表示;根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:向数字的文本化表示添加数位值的文本化表示;以及基于定义正确表述的语言依赖的规则,来附加地执行以下操作:校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
根据本发明的另一方面,提供了一种将十进制数系统的基数转换成为期望语言的语音的方法,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述方法包括:将所述基数的每个数字逐个转换成为期望语言的文本化表示;根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:向数字的文本化表示添加数位值的文本化表示;以及基于定义正确表述的语言依赖的规则,来附加地执行以下操作:校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及将所述数的所述完整文本化表示转换成为语音。
根据本发明的另一方面,提供了一种将十进制数系统的基数转换成为期望语言的文本化表示的设备,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:转换器,配置以将所述基数的每个数字逐个转换成为期望语言的文本化表示;组合器,配置以根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及校正器,配置以基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
根据本发明的另一方面,提供了一种将十进制数系统的基数转换成为期望语言的文本化表示的设备,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:转换装置,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;添加装置,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及校正装置,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
根据本发明的另一方面,提供了一种将十进制数系统的基数转换成为期望语言的语音的设备,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:转换器,配置以将所述基数的每个数字逐个转换成为期望语言的文本化表示;组合器,配置以根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;校正器,配置以基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;以及如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及合成器,配置以将所述数的所述完整文本化表示转换成为语音。
根据本发明的另一方面,提供了一种将十进制数系统的基数转换成为期望语言的语音的设备,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:转换装置,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;添加装置,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;装置,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;以及如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及转换装置,用于将所述数的所述完整文本化表示转换成为语音。
根据本发明的另一方面,提供了一种包括将十进制数系统的基数转换成为期望语言的文本化表示的设备的用户终端,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:转换器,配置以将所述基数的每个数字逐个转换成为期望语言的文本化表示;组合器,配置以根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及校正器,配置以基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
根据本发明的另一方面,提供了一种包括将十进制数系统的基数转换成为期望语言的文本化表示的设备的用户终端,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:转换装置,用于所述基数的每个数字逐个转换成为期望语言的文本化表示;组合装置,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及校正装置,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
根据本发明的另一方面,提供了一种包括将十进制数系统的基数转换成为期望语言的语音的设备的用户终端,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:转换器,配置以将所述基数的每个数字逐个转换成为期望语言的文本化表示;组合器,配置以根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;校正器,配置以基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;以及如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及合成器,配置以将所述数的所述完整文本化表示转换成为语音。
根据本发明的另一方面,提供了一种包括将十进制数系统的基数转换成为期望语言的语音的设备的用户终端,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:转换装置,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;添加装置,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;装置,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;以及如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及转换装置,用于将所述数的所述完整文本化表示转换成为语音。
根据本发明的另一方面,提供了一种计算机程序产品编码用于执行计算机处理的指令的计算机程序,所述计算机处理用于将十进制数系统的基数转换成为期望语言的文本化表示,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述处理包括:将所述基数的每个数字逐个转换成为期望语言的文本化表示;根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:向数字的文本化表示添加数位值的文本化表示;以及基于定义正确表述的语言依赖的规则,来附加地执行以下操作:校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
根据本发明的另一方面,提供了一种计算机程序产品编码用于执行计算机处理的指令的计算机程序,所述计算机处理用于将十进制数系统的基数转换成为期望语言的语音,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述处理包括:将所述基数的每个数字逐个转换成为期望语言的文本化表示;根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:向数字的文本化表示添加数位值的文本化表示;基于定义正确表述的语言依赖的规则,来附加地执行以下操作:校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及将所述数的所述完整文本化表示转换成为语音。
根据本发明的另一方面,提供了一种计算机可读的计算机程序分布介质,并且编码用于执行计算机处理的指令的计算机程序,所述计算机处理用于将十进制数系统的基数转换成为期望语言的文本化表示,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述处理包括:将所述基数的每个数字逐个转换成为期望语言的文本化表示;根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:向数字的文本化表示添加数位值的文本化表示;以及基于定义正确表述的语言依赖的规则,来附加地执行以下操作:校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
根据本发明的另一方面,提供了一种计算机可读的计算机程序分布介质,并且编码用于执行计算机处理的指令的计算机程序的,所述计算机处理用于将十进制数系统的基数转换成为期望语言的语音,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述处理包括:将所述基数的每个数字逐个转换成为期望语言的文本化表示;根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:向数字的文本化表示添加数位值的文本化表示;基于定义正确表述的语言依赖的规则,来附加地执行以下操作:校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及将所述数的所述完整文本化表示转换成为语音。
根据本发明的另一方面,提供了一种数据结构,用于将十进制数系统的基数转换成为期望语言的文本化表示,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述数据结构包括:第一数据域,包括用于以下操作的信息,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;第二数据域,包括用于以下操作的信息,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及第三数据域,包括用于以下操作的信息,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
根据本发明的另一方面,提供了一种由计算机可读的计算机程序分布介质,所述计算机程序分布介质具有这样的数据结构,所述数据结构用于将十进制数系统的基数转换成为期望语言的文本化表示,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述数据结构包括:第一数据域,包括用于以下操作的信息,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;第二数据域,包括用于以下操作的信息,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及第三数据域,包括用于以下操作的信息,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
根据本发明的另一方面,提供了一种数据结构,用于将十进制数系统的基数转换成为期望语言的文本化表示的语音,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述数据结构包括:第一数据域,包括用于以下操作的信息,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;第二数据域,包括用于以下操作的信息,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;第三数据域,包括用于以下操作的信息,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;用于如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示,以及用于将所述数的所述完整文本化表示转换成为语音。
根据本发明的另一方面,提供了一种由计算机可读的计算机程序分布介质,所述计算机程序分布介质具有这样的数据结构,用于将十进制数系统的基数转换成为期望语言的文本化表示的语音,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述数据结构包括:第一数据域,包括用于以下操作的信息,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;第二数据域,包括用于以下操作的信息,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;第三数据域,包括用于以下操作的信息,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;用于如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示,以及用于将所述数的所述完整文本化表示转换成为语音。
本发明提供了多个优点。本方案提供了一种简单并且有效的方式,以便将数转换成为文本和语音。本方案是非常存储器有效的,并且允许具有较低内存占用(memory footprint)的数值的良好覆盖。规则集可呈现为可在语言特定包中包括的数据。这以及并不复杂的语法简化了随各种语言变化的制造产品中的逻辑。
附图说明
在下文中,将参考实施方式以及附图来更详细地描述本发明,其中:
图1示出了文本至语音系统的框图;
图2示出了无线系统的终端设备;
图3示出了标准化操作块;
图4示出了数到书面英语的转换;
图5示出了用于将小于十的数转换成为书面英语的表;
图6示出了书面英语中数位值的表;
图7A示出了英语的文本化表示的校正表的第一部分;
图7B示出了英语的文本化表示的校正表的第二部分;
图8A示出了数字至书面芬兰语的转换;
图8B示出了书面芬兰语中的数位值的表;
图8C示出了芬兰语的文本化表示的校正表;
图9A示出了数字至书面瑞典语的转换;
图9B示出了书面瑞典语中的数位值表;
图9C示出了瑞典语中的文本化表示的校正表的第一部分;
图9D示出了瑞典语中的文本化表示的校正表的第二部分;
图10A示出了数字至书面法语的转换;
图10B示出了书面法语中的数位值表;
图10C示出了法语中的文本化表示的校正表的第一部分;
图10D示出了法语中的文本化表示的校正表的第二部分;
图10E示出了法语中的文本化表示的校正表的第三部分;
图11A示出了数字至书面德语的转换;
图11B示出了书面德语中的数位值表;
图11C示出了德语中的文本化表示的校正表的第一部分;
图11D示出了德语中的文本化表示的校正表的第二部分;
图12A示出了数字至书面丹麦语的转换;
图12B示出了书面丹麦语中的数位值表;
图12C示出了丹麦语中的文本化表示的校正表的第一部分;
图12D示出了丹麦语中的文本化表示的校正表的第二部分;
图13A示出了数字至书面匈牙利语的转换;
图13B示出了书面匈牙利语中的数位值表;
图13C示出了匈牙利语中的文本化表示的校正表的第一部分;
图13D示出了匈牙利语中的文本化表示的校正表的第二部分;
图14A示出了数字至书面意大利语的转换;
图14B示出了书面意大利语中的数位值表;
图14C示出了意大利语中的文本化表示的校正表的第一部分;
图14D示出了意大利语中的文本化表示的校正表的第二部分;
图15A示出了数字至书面国语中文的转换;
图15B示出了书面国语中文的数位值的表;
图15C示出了国语中文的文本化表示的校正表;
图16A示出了数字至书面乌克兰语的转换;
图16B示出了书面乌克兰语中的数位值表;
图16C示出了乌克兰语中的文本化表示的校正表的第一部分;
图16D示出了乌克兰语中的文本化表示的校正表的第二部分;
图16E示出了乌克兰语中的文本化表示的校正表的第三部分;
图17示出了转换至文本的流程图;
图18示出了转换至语音的流程图;
图19示出了用于转换时间的寄存器设置;
图20A示出了在转换的第一步骤之后的寄存器元;
图20B示出了在转换的第二步骤之后的寄存器元;
图21示出了针对转换缩写的寄存器设置;以及
图22示出了转换之后的寄存器元。
具体实施方式
本方案适用于电子设备,所述电子设备可以是用户设备、计算机等。应用领域可以包括消息阅读、用于免提或者免看设备的用户界面、自动上下文感知的告知系统、以及视觉受损者辅助。
参考图1,检查文本至语音(TTS)系统的框图。文本包括书面符号、数、特殊标记和/或注释,可将该文本馈送进入预处理操作块100。预处理可包括解析,解析可依次包括解译文本中的特殊标记和注释以便控制合成处理,例如定义段落、特别强调特定词语等。预处理还可以包括某些应用特定的处理,诸如从文本中去除不必要的信息。不必要的信息可以是例如(电子邮件的)标题或者不发音的字符(诸如,“*******”)。
在预处理之后,可在标准化操作块102中将文本标准化。此块102可以包括例如将数转换成为文本化表示、扩展缩写等。可使用基于规则的方法,用于创建用于发音的数的文本串。在现有技术中,通常将用于创建数的文本串的规则在语言特定的程序代码中编码,例如在DLL(动态装载库)中。在某些系统中,提供了还用于处理其他语言特定处理的复杂脚本语言。
语言学处理块104还包括语言学和句法分析以及韵律分析。语言学和句法分析可以包括形态分析、上下文分析,以及基于某些标准来将词语分类成为分句。韵律分析可以利用语言学和句法分析来指定例如语调升降曲线、停顿、重音以及语音片断长度。
合成块106可以基于从语言学处理块104接收的数据,来执行字母至声音或者文本至音素的转换,以便生成实际语音波形。
现在,使用图2来研究无线系统的终端设备,其中所述终端设备是作为可以利用本发明的电子设备的示例。终端设备可以包括作为操作单元的移动设备(块200、202、206至216)、以及作为用户特定模块204的USIM(全球移动电话系统用户标识模块)模块或者如SIM。用户特定模块是包括微处理器和存储器的智能卡。用户的个人数据、可操作单元数据、以及用户界面的标识数据可在USIM模块的存储器中存储。
终端设备包括其中可以执行终端设备的计算机程序操作的处理器200。例如,处理器200可以进行数字信号处理以及控制其他块的操作。用户控制电子设备并且以终端设备的用户界面202(显示器和小键盘)来输入数据,并以用户界面来向用户显示由处理器200处理的可视信息(诸如,文本、数和图像)。可在存储器206中存储由处理器200所需的数据。声音处理单元208对来自处理器200的信号进行转换以适应扬声器210。声音处理单元208可以是合成器,用于合成语音形式的文本。另外,语音处理单元208可以包括编解码块。声音处理单元208还可以对来自麦克风212的信号进行转换以适应处理器200。接着,RF块214依次将待传送的并来自处理器200的数字信号转换成为模拟射频信号,以便将信号作为电磁辐射来经由天线216传送。相应地,将由天线216接收的射频信号转换至较低频率,并且在去往处理器200的应用之前,将其在RF块214中数字化。
本方案聚焦于标准化操作块102,在所述标准化操作块102中可执行将数转换成为文本化表示。基数0、1、2、3...可以表示有限基数,还可以称作计数数、自然数、非负整数或者全部数。基数不包括小数部分或者分数部分。十进制数系统的基数包括以十的幂排序的数位序列中的至少一个数字。例如,数15243是1、5、2、4和3的序列,并且其可解译为,诸如数“1”表示在所述数中包括10000=104的多少倍。数“5”表示在所述数中包括1000=103的多少倍。数“2”表示在所述数中包括100=102的多少倍。数“4”表示在所述数中包括10=101的多少倍。最后,数“3”表示在所述数中包括1=100的多少倍。10000=104、1000=103、100=102、10=101以及1=100,这些数都是十的幂,并且这些十的幂在序列中定义了这些数字的数位(在此示例中,是1、2、3、4和5的数位)。
图3示出了标准化操作块102,其中可以执行将数字式数据形式的数转换成为文本化表示,还可以是以下方式的数字式数据的形式。如果可用多种语言,则首先通过选择器300来选择期望的语言。先前的处理100可以通过从输入词语的信号识别语言来自动选择语言,或者用户可以定义语言。标准化操作块102还包括转换器302、组合器304以及校正器306。转换器302将基数的每个数字的数据逐个地转换成为期望语言的文本化表示的数据。
组合器304可以向数字的文本化表示添加数位值的文本化表示的数据。组合器是否添加数位值的文本化表示可以依赖于由十的幂排序的数位序列中的数字数位。在十进制数系统中,数字的值依赖于其在数中(即,在数字序列中)的数位或者位置。每个数位具有的值十倍于其右边前面的数位。该数位的值是十的幂的值,并且可以写作个位(1=100)、十位(10=101)、百位(100=102)、千位(1000=103)、万位(10000=104)、十万位(100000=105)、百万位(1000000=106)等。当数位具有零时,意味着该数位没有值。例如,在1000000的情况下,第六数位意味着零乘以十万。但是第七数位意味着一乘以百万。由此,结果是“一百万”。例如,如果数是2,则当将该数转换成为英语时,组合器304不需要添加任何事物,这是因为转换器302提供了正确的结果“二”。
校正器306可以校正由转换器302和组合器304形成的文本化表示的任何数据。在许多情况下,校正器306不需要校正任何事物,这是由于由转换器302和/或组合器304形成的文本化表示已经是正确的。但是,由于在自然语言中通常存在意外和不规则情况,则校正器306是重要的。自然语言是当人们在一起彼此讨论或者书面交流时使用的人类语言。自然语言在人类社会中自然地进化。例如,芬兰语、英语、法语和日语都是自然语言。已经由人类人工构建了诸如世界语的语言,这也是可接受的。事先可以已知由转换器302和组合器304形成的所有文本化表示,其中所述文本化表示不同于自然语言的文本化表示。因为它们的数有限,因而可以容易地将关于这样的数位中的数字或者数字组合的差异进行列表,其中已知所述数位导致不同于正确表述的文本化表示。校正可以基于定义正确表述的语言依赖的规则。可通过期望语言的语法规则来支持语言依赖的规则。
图4示出了使用寄存器将数转换成为书面英语的示例。由十的幂所排序的数位序列在寄存器中可实现为寄存器元的序列。以类似方式,可通过具有寄存器元的行的寄存器来处理数位值。第一寄存器400包括将要转换成为文本化表示的数。第二寄存器402包括以期望语言的数的数字的文本化表示。第三寄存器404包括以期望语言的数位值的文本化表示。在此示例中,数是12368。数字“1”是最高有效数字,数字“1”位于寄存器元4000(用于ten thousands(万位))中,数字“2”位于寄存器元4002(用于thousands(千位))中,数字“3”位于寄存器元4004(用于hundreds(百位))中,数字“6”位于寄存器元4006(用于tens(十位))中,而作为最低有效数字,数字“8”位于寄存器元4008(用于ones(个位))中。
根据将基数的每个位逐个转换成为期望语言的文本化表示,来应用第一规则,寄存器402的寄存器元R5包括文本化表示“one(1)”。以类似方式,寄存器元R4包括文本化表示“two(2)”,寄存器元R3包括文本化表示“three(3)”,寄存器元R2包括文本化表示“six(6)”,以及寄存器元R1包括文本化表示“eight(8)”。例如,如果最低有效数字是“0”,则在寄存器元R1中的文本化表示可以是“”,但是其还可以是“zero(0)”。
当应用第二规则时,向数字的文本化表示添加数位值的文本化表示。根据由十的幂排序的数位序列中的数字的数位,来添加文本化表示。根据此示例,在寄存器元T65中的数位值的文本化表示不是必要的,这是因为其表示十万。可以搜索最高有效数字(在此情况中是“1”),以确定针对可能数位值的需要。在英语中,实际上“ten thousand(万)”的数位值不是必要的。由此,寄存器元T54的内容为空,即寄存器元T54=“”。接着,对寄存器元T43中的“thousand(千)”的数位值添加“2”。对寄存器元T32中的“hundred(百)”的数位值添加“3”。在英语中,寄存器元T21和T10的数位值“ten(十)”和“one(一)”不是必要的。由此,寄存器元T21和T10的内容是空,即寄存器元T21=“”,并且寄存器元T10=“”。R5、T54、R4、T43、R3、T32、R2、T21、R1、T10中的文本化表示结果是“one two thousand three hundred six eight”的文本化形式,将所述文本化表示结果进行组合。通过第三规则,数的文本化表示得以校正,根据所述第三规则,校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。在此示例中,与正确表述存在两个差异:“onetwo”以及“six”。然而,在检查第三规则来校正差异之前,首先研究用于将数字转换成为文本化表示以及将数位值与数字相组合的列表规则。
接着,使用图5至图16E来示出用于转换基数的数据结构。该数据结构可包括在由计算机可读的计算机程序分布介质中。可以与执行转换的实际计算机程序分开地存储语言特定的数据域即,规则。这支持针对多种语言来使用相同的计算机程序,在转换期间,每种语言使用其自身的数据域。
图5示出了用于将小于十的数转换至英语文本化表示的第一数据域。可以通过列表形式表示该第一数据域。该表是直接的,并且将数“1”转换至文本化表示“one”,将数“2”转换至“two”,等等。作为一种特殊情况,数“0”可转换至“”,这意味着,零具有空的文本化表示。
图6示出了针对英语数位值的文本化表示的第二数据域。该第二数据域也以列表形式表示。在图6中的表代表小于一百万的数。针对寄存器元T32的必要数位值=“hundred”,针对寄存器元T43的必要数位值=“thousand”,并且针对寄存器元T65的必要数位值=“hundred”。其他所有寄存器可以是空。根据定义正确表述的语言依赖的规则,可将数位值的文本化表示添加至数字的文本化表示。可将数位值的文本化表示添加到数字的文本化表示之后。
现在,研究用于校正文本化表示的第三数据域。也可以以列表形式表示第三数据域。在图7A中示出了该表的第一部分,并且在图7B中示出了第二部分。还可认为这三个数据域是规则。第三规则超越先前的规则,并且在两个规则没有得出期望语言的正确表述的情况下是预先已知的。非正确表述的原因例如可以是词尾变化、数的次序、正负性等。然而,无论原因如何,都可以校正文本化表示。
问号的数目表示在数中数字的数目,而星号表示通配符字符。根据在数中数字的数目,将数位值的寄存器被清空。如果在数中数字的最大数目是五(即,该数小于100000),则将具有索引XX大于54的寄存器元TXX清空。如果在数中数字的最大数目是四(即,该数小于10000),则将具有索引XX大于43的寄存器元TXX(诸如,T65和T54)清空。如果在数中数字的最大数目是三(即,该数小于1000),则将具有索引XX大于32的寄存器元TXX清空。如果在数中数字的最大数目是二(即,该数小于100),则将具有索引XX大于21的寄存器元TXX清空。如果在数中数字的最大数目是一(即,该数小于10),则以类似方式将寄存器元T21清空。
英语中的校正可以涉及“ten thousands(万位)”。如果第五数字是“2”,则将寄存器元R5的内容设置为“twenty”。如果第五数字是“3”,则将寄存器元R5的内容设置为“thirty”。如果第五数字是“4”,则将寄存器元R5的内容设置为“forty”。如果第五数字是“5”,则将寄存器元R5的内容设置为“fifty”。如果第五数字是“6”,则将寄存器元R5的内容设置为“sixty”。如果第五数字是“7”,则将寄存器元R5的内容设置为“seventy”。如果第五数字是“8”,则将寄存器元R5的内容设置为“eighty”。如果第五数字是“9”,则将寄存器元R5的内容设置为“ninety”。
英语中的校正还可以涉及从一万至十万九千的数。在所有这些情况下,第五数字是“1”并且将寄存器元R4的内容设置为空。如果第四数字是“0”,则寄存器元R5的内容是“ten”。如果第四数字是“1”,则将寄存器元R5的内容设置为“eleven”。如果第四数字是“2”,则将寄存器元R5的内容设置为“twelve”。如果第四数字是“3”,则将寄存器元R5的内容设置为“thirteen”。如果第四数字是“4”,则将寄存器元R5的内容设置为“fourteen”。如果第四数字是“5”,则将寄存器元R5的内容设置为“fifteen”。如果第四数字是“6”,则将寄存器元R5的内容设置为“sixteen”。如果第四数字是“7”,则将寄存器元R5的内容设置为“seventeen”。如果第四数字是“8”,则将寄存器元R5的内容设置为“eighteen”。如果第四数字是“9”,则将寄存器元R5的内容设置为“nineteen”。
在涉及万位以及涉及从一万至一万九千的数的情况下,对在已知导致非正确表述的数位中具有多于一个数字的数的连续数字的组合的文本化表示进行校正。可通过由正确文本化表示来替换已知非正确的文本化表示来执行校正。
英语中的校正可以涉及十位。如果第二数字是“2”,则将寄存器元R2设置为“twenty”。如果第二数字是“3”,则将寄存器元R2设置为“thirty”。如果第二数字是“4”,则将寄存器元R2设置为“forty”。如果第二数字是“5”,则将寄存器元R2设置为“fifty”。如果第二数字是“6”,则将寄存器元R2设置为“sixty”。如果第二数字是“7”,则将寄存器元R2设置为“seventy”。如果第二数字是“8”,则将寄存器元R2设置为“eighty”。如果第二数字是“9”,则将寄存器元R2设置为“ninety”。
英语中的校正可以涉及在十和二十之间的数。在所有这些情况中,第二数字都是“1”。如果第一数字是“1”,则将寄存器元R2的内容设置为“eleven”。如果第一数字是“2”,则将寄存器元R2的内容设置为“twelve”。如果第一数字是“3”,则将寄存器元R2的内容设置为“thirteen”。如果第一数字是“4”,则将寄存器元R2的内容设置为“fourteen”。如果第一数字是“5”,则将寄存器元R2的内容设置为“fifteen”。如果第一数字是“6”,则将寄存器元R2的内容设置为“sixteen”。如果第一数字是“7”,则将寄存器元R2的内容设置为“seventeen”。如果第一数字是“8”,则将寄存器元R2的内容设置为“eighteen”。如果第一数字是“9”,则将寄存器元R2的内容设置为“nineteen”。
在涉及十位以及涉及在十和二十之间的数的情况下,对在已知导致非正确表述的数位中包括多于一个数字的数的连续数字的组合的文本化表示进行校正。可通过由正确文本化表示来替换已知非正确的文本化表示来执行校正。
如果第三数字是“0”,则将寄存器元T32的内容设置为空。最后,如果数是“0”,则将寄存器元R1的内容设置为“zero”,而将其他寄存器清空。在必要的校正之后,其中在此情况下意味着针对在一万和一万九千(*12???→R5=“twelve”)以及在二十和九十之间的值(*6?→R2=“sixty”)来应用校正,12368的示例变为“twelve thousand three hundred sixty eight”。在校正之前,“*6?”的文本化表示可以是“six ten”或者只是“six”。两种形式都可以校正为文本化表示“sixty”。
此类型的方法可应用至多种语言,同时数位值和校正的应用规则根据语言不同而有所不同。根据定义正确表述的语言依赖的规则,通过改变寄存器元的内容,可以容易地实现数位值和校正的不同应用。语法非常简单,并且仅包括条件和指定。再一次简言之,每个数字可指定为<数寄存器元>=“<字符串>”。数位值可以构成为<数位值寄存器元>=“<字符串>”。校正可以构成为<匹配标准>;<寄存器元>=“<字符串>”|<寄存器元>;<寄存器元>=“<字符串>”|<寄存器元>;...匹配标准可以在标准的开始处或者结尾处使用通配符符号,以及可以在标准的任何位置使用“任意字符”标记“?”。另外,<>表示所需字符串,[]表示可选字符串,|是在可选方式、多个相互排斥的参数之间的分隔符,?是指示任何单个数字的符号,以及*是指示任意数目的数字的符号。
参见英语、芬兰语、瑞典语、法语、德语、丹麦语、匈牙利语、意大利语、国语中文(日语)以及乌克兰语的数“534676”的示例。在应用第一规则之后,在英语中数变为“five three four six seven six”。在应用第二规则之后,数变为“five hundred three”“four thousand sixhundred seven”“six”。在第三规则之后,通过将“five hundred three”“four thousand six hundred seven”“six”的文本化表示进行组合来正确地书写。
图8B示出了芬兰语中数位值的添加。在添加之后,数变为“viisisataa kolmetuhatta kuusi sataakuusi”。应该注意到在芬兰语中,实际上在第一和第二规则之后对数的文本化表示进行校正。
图8C示出了在芬兰语中文本化表示的校正。数的校正形式是文本化表示“viisi sataatuhatta kuusi sataakuusi”的组合。在芬兰语中,通过使用第二规则来添加针对十位的数位值。在英语中,必须使用第三规则来校正十位。
图9A示出了数字至瑞典语的文本化表示的转换。在此转换之后,数变成“fem tre fyra sex sju sex”。
图9B示出了瑞典语中数位值的添加。在添加之后,数变为“femhundra tre”、“fyra tusen sex hundra sju”、“sex”。
图9C至图9D示出了瑞典语的文本化表示的校正。数的校正形式是“fem hundra trettio”、“fyra tusen sex hundra sjuttio”、“sex”。
图10A示出了数字至法语文本化表示的转换。在此转换之后,数变为“cinq trios quatre six sept six”。
图10B示出了法语中数位值的添加。在添加之后,数变为“cinqcents trios”、“quatre mille six cents sept”、“six”。
在图10C、图10D和图10E中示出了法语文本化表示的校正。数的校正形式是“cinq cents trente”、“quatre mille six cents soixanteseize”。
图11A示出了数字至德语文本化表示的转换。在此转换之后,数变为“fünf drei vier sechs sieben sechs”。
图11B示出了德语数位值的添加。在添加之后,数变为“fünfhundert drei”、“vier tausend sechs hundert sieben”、“sechs”。
图11C和图11D示出了德语文本化表示的校正。数的校正形式是“fünf hundert vierunddreizig tausend sechs hundertsechsundsiebzig”。在德语中,特殊性在于十位的结构与个位组合。
图12A示出了数字至丹麦语文本化表示的转换。在此转换之后,数变为“fem tre fire seks syv seks”
图12B示出了丹麦语数位值的添加。在添加之后,数变为“femhundrede og tre”、“fire tusind seks hundrede og syv”、“seks”。
图12C和图12D示出了丹麦语文本化表示的校正。数的校正形式是“fem hundrede og fieogtredive tusind seks hundrede ogseksoghalvfjers”。
图14A示出了数字至意大利语文本化表示的转换。在此转换之后,数变为“cinque tre quattro sei sette sei”。
图14B示出了意大利语数位值的添加。在添加之后,数变为“cinque cento tre”、“quattro mila sei cento sette”、“sei”。
图14C和图14D示出了意大利语文本化表示的校正。数的校正形式是“cinque cento trenta”、“quattro mila sei cento settanta”、“sei”。
图15A示出了数字至国语中文文本化表示的转换。在此转换之后,数变为“五三四六七六”。
图15B示出了国语中文数位值的添加。在添加之后,数变为“五十三万四千六百七十六”。
图15C示出了国语中文文本化表示的校正。数的校正形式是“五十三万四千六百七十六”。数至日本汉字字符的转换也与日文中相同。在此转换中的特殊性在于数位值“万”,“万”表示10000。下一特殊数位值位于100000处,等等。数“五十三万四千六百七十六”的日语发音可通过字母表来书写为“go juu san man yon senroppyaku nana juu roku”。
图16A示出了数字至乌克兰语文本化表示的转换。在此转换之后,数变为“п′ятъ три чотири шiсть сiм шiсть”。
图16B示出了乌克兰语数位值的添加。在添加之后,数变为“’чотири тисяч шiсть сот сiм”、“шiсть”。
图16C、图16D和图16E示出了乌克兰语文本化表示的校正。数的校正形式是“п′ятьсот триДчять”、“чотири тисячi шiстьсот сiмДесят”、“шiсть”。
在所有这些语言中,可以类似于英语的方式应用列表的规则。显然,相同的方法可应用至在此应用中没有提及的许多其他语言。
图17示出了将数转换成为文本化表示的方法的流程图。在步骤1700中,基数的每个数字被逐个转换成为期望语言的文本化表示。在步骤1702中,根据十的幂排序的数位序列中数字的数位,来执行将数位值的文本化表示添加至数字的文本化表示。在步骤1704中,根据定义正确表述的语言依赖的规则,来校正所形成的文本化表示,并且其中所述文本化表示涉及在已知导致不同于正确表述的文本化表示的数位中的至少一个数字。
图18示出了将数转换成为语音的方法的流程图。在步骤1800中,将基数的每个数字逐个转换成为期望语言的文本化表示。在步骤1802中,根据十的幂排序的数位序列中数字的数位,来执行将数位值的文本化表示添加至数字的文本化表示。在步骤1804中,根据定义正确表述的语言依赖的规则,来校正所形成的文本化表示,并且其中所述文本化表示涉及在已知导致不同于正确表述的文本化表示的数位中的至少一个数字。在步骤1806中,如果数具有多于一个数字,则组合文本化表示以形成数的完整文本化表示;否则使用单一数字的文本化表示,来形成数的完整文本化表示。在步骤1808中,将数的完整文本化表示转换成为语音。
本发明的实施方式可以在电子设备中实现,包括例如显示器、键盘以及可操作地连接至键盘和显示器的控制器。控制器可以配置以执行结合在图17和图18中所示方法的任一项所描述的步骤中的至少某些。实施方式可以实现为包括用于执行计算机处理的指令的计算机程序,用于将基数的每个数字逐个转换成为期望语言的文本化表示;根据由十的幂排序的数位序列中的数字的数位来执行以下操作:将数位值的文本化表示添加至数字的文本化表示;以及根据定义正确表述的语言依赖的规则来附加地执行以下操作:校正任何形成的文本化表示,并且其中所述文本化表示涉及在已知导致不同于正确表述的文本化表示的数位中的至少一个数字。
实施方式还可以实现为包括用于执行计算机处理的指令的计算机程序,用于将基数的每个数字逐个转换成为期望语言的文本化表示;根据由十的幂排序的数位序列中的数字的数位来执行以下操作:将数位值的文本化表示添加至数字的文本化表示;根据定义正确表述的语言依赖的规则来附加地执行以下操作:校正任何形成的文本化表示,并且其中所述文本化表示涉及在已知导致不同于正确表述的文本化表示的数位中的至少一个数字;如果数具有多于一个数字,则组合文本化表示以形成数的完整文本化表示,否则使用单一数字的文本化表示,来形成数的完整文本化表示;以及将数的完整文本化表示转换成为语音。
计算机程序的任一项可在由计算机或者处理器可读的计算机程序分布介质上存储。计算机程序介质例如但不局限于电、磁、光、红外或者半导体系统、设备或者传输介质。所述介质可以是计算机可读介质、程序存储介质、记录介质、计算机可读存储器、随机访问存储器、可擦除可编程只读存储器、计算机可读软件分布包、计算机可读信号、计算机可读电信信号以及计算机可读压缩的软件包。
寄存器的应用可用于将以小时和分钟表示的时间转换成为文本化表示。实现使用包括多个数字的寄存器。在每个数字之间设置转化寄存器(类似于数位值寄存器)。
在图19中示出了寄存器设置。数寄存器1900包括诸如12:35的时间。然后,寄存器元R4包括数“1”,寄存器元R3包括数“2”,寄存器元R2包括数“3”,以及寄存器元R1包括数“5”。转化寄存器1902包括寄存器元D54至D10。寄存器1900和1902的内容可进行组合,以便其形成D54R4D43R3D32R2D21R1D10。转化寄存器元1902可用作存储器,用于存储在特定语言中每个数字之间可能需要的词语。
在英语中,例如可以根据以下规则来处理时间:
??:0? RT2=“o”;
其中?是指示任意单一数字的符号。
在芬兰语中,例如可以根据以下规则来处理时间:
??:0? RT2=“nolla”;
在德语中,例如可以根据以下规则来处理时间:
??:?? D32=“Uhr”;
语法考虑如下:
<匹配标准>;<寄存器>=
“<字符串>”|<寄存器>;[<寄存器>=“<字符串>”|<寄存器>;...],
<匹配标准>=[*]<数>[<数>]...[<数>],
<数>=?|0|1|2|3|4|5|6|7|8|9,以及
<寄存器>=R1|R2|R3|R4|T54|T43|T32|T21|T10
图20A和图20B示出了应用规则的示例。寄存器1900包括时间12:01。在图20A中,在应用规则影响寄存器元D32之后,寄存器1902在寄存器元D32中包括词语“Uhr”。将其他寄存器元设置为空。接着,应用关于“??:01”的规则,并且由此在图20B中寄存器元RT1包括“eins”。将寄存器元RT2设置为空。在使用在应用中先前呈现的数规则之后,时间变为“Uhr eins”。以类似方式来处理秒。
另外,可以类似地处理关于数的缩写,诸如,km、km/h、m、kg等。实现使用两个主寄存器:一个用于单位,而另一个用于与该单元相关联的数。在数和单位之间以及在单位之后,在数之前还可以存在附加的转化寄存器元。在图21中呈现了寄存器设置。在寄存器2100中的寄存器元RR2包括数,而寄存器元RR1包括缩写。在寄存器2102中的寄存器元DD10至DD32包括对于适当表述所必须的词语。可以组合寄存器的内容,以便其形成序列DD32RR2DD21RR1DD10。可以将寄存器元DD21设置为“\m”、“\n”或者“\f”,其中可以使用标记来表示阳性(“\m”)、中性(“\n”)或者阴性(“\f”)。需要定义规则集合,以便获得针对缩写单位的适当格式。规则可实现为具有某些附加模式匹配能力的查找表。
语法可以考虑如下:
<匹配标准>;<寄存器>=
“<字符串>”|<寄存器>;[<寄存器>=“<字符串>”|<寄存器>;...],
<匹配标准>=
[*]<数>[<数>]...[<数>]-<单位>
<数>=?|0|1|2|3|4|5|6|7|8|9,
<单位>=m|km|yd|mi|kCal|kJ|km/h|min/h|mph|min/mi...,以及
<寄存器>=RR1|RR2|DD32|DD21|DD10。
标记-表示空白处。
例如,可使用以下规则将表达式453km/h可转换至英语文本化表示:
*km/h RR1=“kilometers per hour”;
1km/h RR1=“kilometer per hour”;
图22示出了匹配规则[*km/h RR1=“kilometers per hour”;]的检测之后的寄存器内容。然后,输出串是“453 kilometers per hour”。如果单位“km/h”的正负对于数453的口语/书面形式具有影响,则针对数处理块,在寄存器2102的寄存器元DD21之中设置正负标记,例如,“453”“\f”“kilometers per hour”。
另外,应该注意,如果在“kilometers per hour”的开始中不存在空白处,则输出序列将是“453kilometers per hour”。如上所述,可在字符串之中包括空白处,或者可将空白处放入转化寄存器元DD21。
尽管已经根据附图参考示例来描述了本发明,显然,本发明并不局限于其中,而是可以在所附权利要求书的范围以内以各种方式进行修改。
Claims (42)
1.一种将十进制数系统的基数转换成为期望语言的文本化表示的方法,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述方法包括:
将所述基数的每个数字逐个转换成为期望语言的文本化表示;
根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:
向数字的文本化表示添加数位值的文本化表示;以及
基于定义正确表述的语言依赖的规则,来附加地执行以下操作:
校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
2.根据权利要求1所述的方法,所述方法进一步包括,如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则
使用单一数字的所述文本化表示,来形成所述数的完整文本化表示。
3.根据权利要求1所述的方法,所述方法进一步包括,根据定义正确表述的所述语言依赖的规则,来向数字的文本化表示添加数位值的文本化表示。
4.根据权利要求1所述的方法,所述方法进一步包括,校正数的连续数字的组合的文本化表示,所述数在已知导致非正确表述的数位中包括多于一个的数字。
5.根据权利要求1所述的方法,所述方法进一步包括,通过由正确文本化表示替换已知非正确的文本化表示,来校正文本化表示。
6.根据权利要求1所述的方法,所述方法进一步包括,在数字的文本化表示之后添加数位值的文本化表示。
7.根据权利要求1所述的方法,所述方法进一步包括,为了将所述基数转换成为文本化表示而从多种语言中选择期望的语言。
8.根据权利要求1所述的方法,所述方法进一步包括,如果数是0,则将所述数的所述文本化表示校正成与所述期望语言的零相对应的文本化表示。
9.根据权利要求1所述的方法,所述方法进一步包括,搜索所述最高有效数字,以确定针对数位值的需要。
10.根据权利要求1所述的方法,所述方法进一步包括,将以小时和分钟表述的时间转换成为文本化表示。
11.根据权利要求1所述的方法,所述方法进一步包括,将缩写转换成为文本化表示。
12.一种将十进制数系统的基数转换成为期望语言的语音的方法,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述方法包括:
将所述基数的每个数字逐个转换成为期望语言的文本化表示;
根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:
向数字的文本化表示添加数位值的文本化表示;以及
基于定义正确表述的语言依赖的规则,来附加地执行以下操作:
校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;
如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及
将所述数的所述完整文本化表示转换成为语音。
13.一种将十进制数系统的基数转换成为期望语言的文本化表示的设备,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:
转换器,配置以将所述基数的每个数字逐个转换成为期望语言的文本化表示;
组合器,配置以根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及
校正器,配置以基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
14.根据权利要求13所述的设备,其中所述校正器进一步配置以便
如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则
使用所述单一数字的所述文本化表示,来形成所述数的完整文本化表示。
15.根据权利要求13所述的设备,其中所述组合器配置以根据定义正确表述的所述语言依赖的规则,来向数字的所述文本化表示添加所述数位值的文本化表示。
16.根据权利要求13所述的设备,其中所述校正器配置以校正数的连续数字的组合的文本化表示,所述数在已知导致非正确表述的数位中包括多于一个的数字。
17.根据权利要求13所述的设备,其中所述校正器配置以通过由正确文本化表示替换已知非正确的文本化表示,来校正文本化表示。
18.根据权利要求13所述的设备,其中所述组合器配置以在数字的文本化表示之后添加数位值的文本化表示。
19.根据权利要求13所述的设备,其中所述设备包括选择器,配置以针对将所述基数转换成为文本化表示来从多种语言中选择期望的语言。
20.根据权利要求13所述的设备,其中所述校正器配置成如果所述数是0,则将所述数的所述文本化表示校正成与所述期望语言的零相对应的文本化表示。
21.根据权利要求13所述的设备,其中所述设备配置以搜索所述最高有效数字,以确定针对数位值的需要。
22.根据权利要求13所述的设备,其中所述设备配置以将以小时和分钟表述的时间转换成为文本化表示。
23.根据权利要求13所述的设备,其中所述设备配置以将缩写转换成为文本化表示。
24.一种将十进制数系统的基数转换成为期望语言的文本化表示的设备,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:
转换装置,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;
添加装置,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及
校正装置,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
25.一种将十进制数系统的基数转换成为期望语言的语音的设备,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:
转换器,配置以将所述基数的每个数字逐个转换成为期望语言的文本化表示;
组合器,配置以根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;
校正器,配置以
基于定义正确表述的语言依赖的规则,来校正关于至少一个
数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;
如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及
合成器,配置以将所述数的所述完整文本化表示转换成为语音。
26.一种将十进制数系统的基数转换成为期望语言的语音的设备,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:
转换装置,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;
添加装置,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;
装置,用于
基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;
如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及
装置,用于将所述数的所述完整文本化表示转换成为语音。
27.一种包括将十进制数系统的基数转换成为期望语言的文本化表示的设备的用户终端,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:
转换器,配置以将所述基数的每个数字逐个转换成为期望语言的文本化表示;
组合器,配置以根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及
校正器,配置以基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
28.一种包括将十进制数系统的基数转换成为期望语言的文本化表示的设备的用户终端,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:
转换装置,用于所述基数的每个数字逐个转换成为期望语言的文本化表示;
组合装置,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及
校正装置,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
29.一种包括将十进制数系统的基数转换成为期望语言的语音的设备的用户终端,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:
转换器,配置以将所述基数的每个数字逐个转换成为期望语言的文本化表示;
组合器,配置以根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;
校正器,配置以
基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;
如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及
合成器,配置以将所述数的所述完整文本化表示转换成为语音。
30.一种包括将十进制数系统的基数转换成为期望语言的语音的设备的用户终端,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述设备包括:
转换装置,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;
添加装置,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;
装置,用于
基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;
如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及
装置,用于将所述数的所述完整文本化表示转换成为语音。
31.一种计算机程序产品,编码用于执行计算机处理的指令的计算机程序,所述计算机处理用于将十进制数系统的基数转换成为期望语言的文本化表示,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述处理包括:
将所述基数的每个数字逐个转换成为期望语言的文本化表示;
根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:
向数字的文本化表示添加数位值的文本化表示;以及
基于定义正确表述的语言依赖的规则,来附加地执行以下操作:
校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
32.根据权利要求31所述的计算机程序产品,所述计算机程序产品包括以下的至少一个:计算机可读介质、计算机存储介质、记录介质、计算机可读存储器、计算机可读软件分布包、计算机可读信号、计算机可读电信信号、以及计算机可读压缩的软件包。
33.一种计算机程序产品,编码用于执行计算机处理的指令的计算机程序,所述计算机处理用于将十进制数系统的基数转换成为期望语言的语音,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述处理包括:
将所述基数的每个数字逐个转换成为期望语言的文本化表示;
根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:
向数字的文本化表示添加数位值的文本化表示;以及
基于定义正确表述的语言依赖的规则,来附加地执行以下操作:
校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;
如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及
将所述数的所述完整文本化表示转换成为语音。
34.根据权利要求33所述的计算机程序产品,所述计算机程序产品包括以下的至少一个:计算机可读介质、计算机存储介质、记录介质、计算机可读存储器、计算机可读软件分布包、计算机可读信号、计算机可读电信信号、以及计算机可读压缩的软件包。
35.一种计算机可读的计算机程序分布介质,并且所述计算机程序分布介质编码用于执行计算机处理的指令的计算机程序,所述计算机处理用于将十进制数系统的基数转换成为期望语言的文本化表示,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述处理包括:
将所述基数的每个数字逐个转换成为期望语言的文本化表示;
根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:
向数字的文本化表示添加数位值的文本化表示;以及
基于定义正确表述的语言依赖的规则,来附加地执行以下操作:
校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
36.根据权利要求35所述的计算机程序分布介质,所述分布介质包括以下介质的至少一个:计算机可读介质、计算机存储介质、记录介质、计算机可读存储器、计算机可读软件分布包、计算机可读信号、计算机可读电信信号、以及计算机可读压缩的软件包。
37.一种计算机可读的计算机程序分布介质,并且所述计算机程序分布介质编码用于执行计算机处理的指令的计算机程序,所述计算机处理用于将十进制数系统的基数转换成为期望语言的语音,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述处理包括:
将所述基数的每个数字逐个转换成为期望语言的文本化表示;
根据由十的幂排序的所述数位序列中数字的数位来执行以下操作:
向数字的文本化表示添加数位值的文本化表示;以及
基于定义正确表述的语言依赖的规则,来附加地执行以下操作:
校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;
如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示;以及
将所述数的所述完整文本化表示转换成为语音。
38.根据权利要求37所述的计算机程序分布介质,所述分布介质包括以下介质的至少一个:计算机可读介质、计算机存储介质、记录介质、计算机可读存储器、计算机可读软件分布包、计算机可读信号、计算机可读电信信号、以及计算机可读压缩的软件包。
39.一种数据结构,用于将十进制数系统的基数转换成为期望语言的文本化表示,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述数据结构包括:
第一数据域,包括用于以下操作的信息,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;
第二数据域,包括用于以下操作的信息,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及
第三数据域,包括用于以下操作的信息,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
40.一种由计算机可读的计算机程序分布介质,所述计算机程序分布介质具有这样的数据结构,所述数据结构用于将十进制数系统的基数转换成为期望语言的文本化表示,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述数据结构包括:
第一数据域,包括用于以下操作的信息,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;
第二数据域,包括用于以下操作的信息,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;以及
第三数据域,包括用于以下操作的信息,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中。
41.一种数据结构,用于将十进制数系统的基数转换成为期望语言的文本化表示的语音,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述数据结构包括:
第一数据域,包括用于以下操作的信息,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;
第二数据域,包括用于以下操作的信息,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;
第三数据域,包括用于以下操作的信息,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;
用于如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示,以及用于将所述数的所述完整文本化表示转换成为语音。
42.一种计算机可读的计算机程序分布介质,所述计算机程序分布介质具有这样的数据结构,用于将十进制数系统的基数转换成为期望语言的文本化表示的语音,所述基数包括由十的幂排序的数位序列中的至少一个数字,所述数据结构包括:
第一数据域,包括用于以下操作的信息,用于将所述基数的每个数字逐个转换成为期望语言的文本化表示;
第二数据域,包括用于以下操作的信息,用于根据由十的幂排序的所述数位序列中数字的数位,来向数字的文本化表示添加数位值的文本化表示;
第三数据域,包括用于以下操作的信息,用于基于定义正确表述的语言依赖的规则,来校正关于至少一个数字的任何形成的文本化表示,所述数字处于已知导致不同于正确表述的文本化表示的数位中;
用于如果所述数具有多于一个数字,则组合所述文本化表示以形成所述数的完整文本化表示,以及否则使用所述单一数字的所述文本化表示,来形成所述数的所述完整文本化表示,以及用于将所述数的所述完整文本化表示转换成为语音。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/193,028 US20070027673A1 (en) | 2005-07-29 | 2005-07-29 | Conversion of number into text and speech |
US11/193,028 | 2005-07-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101263491A true CN101263491A (zh) | 2008-09-10 |
Family
ID=37683007
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800331436A Pending CN101263491A (zh) | 2005-07-29 | 2006-07-18 | 数至文本和语音的转换 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20070027673A1 (zh) |
EP (1) | EP1910940A1 (zh) |
KR (1) | KR100959552B1 (zh) |
CN (1) | CN101263491A (zh) |
WO (1) | WO2007012699A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111199724A (zh) * | 2019-12-31 | 2020-05-26 | 出门问问信息科技有限公司 | 一种信息处理方法、设备及计算机可读存储介质 |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7551935B2 (en) | 2005-09-21 | 2009-06-23 | U Owe Me, Inc. | SMS+4D: short message service plus 4-dimensional context |
US8489132B2 (en) * | 2005-09-21 | 2013-07-16 | Buckyball Mobile Inc. | Context-enriched microblog posting |
US7580719B2 (en) * | 2005-09-21 | 2009-08-25 | U Owe Me, Inc | SMS+: short message service plus context support for social obligations |
US8515468B2 (en) | 2005-09-21 | 2013-08-20 | Buckyball Mobile Inc | Calculation of higher-order data from context data |
US8275399B2 (en) * | 2005-09-21 | 2012-09-25 | Buckyball Mobile Inc. | Dynamic context-data tag cloud |
US9042921B2 (en) * | 2005-09-21 | 2015-05-26 | Buckyball Mobile Inc. | Association of context data with a voice-message component |
US8509827B2 (en) * | 2005-09-21 | 2013-08-13 | Buckyball Mobile Inc. | Methods and apparatus of context-data acquisition and ranking |
US9166823B2 (en) * | 2005-09-21 | 2015-10-20 | U Owe Me, Inc. | Generation of a context-enriched message including a message component and a contextual attribute |
US8509826B2 (en) * | 2005-09-21 | 2013-08-13 | Buckyball Mobile Inc | Biosensor measurements included in the association of context data with a text message |
US7769412B1 (en) * | 2006-04-19 | 2010-08-03 | Sprint Communications Company L.P. | Wearable wireless telecommunications systems |
US8626586B1 (en) | 2006-06-23 | 2014-01-07 | Sprint Communications Company L.P. | Coordinated advertising for multiple wearable advertising display systems |
US7715873B1 (en) | 2006-06-23 | 2010-05-11 | Sprint Communications Company L.P. | Wearable accessories providing visual indicia of incoming events for wireless telecommunications device |
JP2009244639A (ja) * | 2008-03-31 | 2009-10-22 | Sanyo Electric Co Ltd | 発話装置、発話制御プログラムおよび発話制御方法 |
US8489131B2 (en) * | 2009-12-21 | 2013-07-16 | Buckyball Mobile Inc. | Smart device configured to determine higher-order context data |
US9129605B2 (en) * | 2012-03-30 | 2015-09-08 | Src, Inc. | Automated voice and speech labeling |
WO2014076525A1 (en) * | 2012-11-16 | 2014-05-22 | Data2Text Limited | Method and apparatus for expressing time in an output text |
GB201320334D0 (en) * | 2013-11-18 | 2014-01-01 | Microsoft Corp | Identifying a contact |
JP6289950B2 (ja) * | 2014-03-19 | 2018-03-07 | 株式会社東芝 | 読み上げ装置、読み上げ方法及びプログラム |
US10467347B1 (en) | 2016-10-31 | 2019-11-05 | Arria Data2Text Limited | Method and apparatus for natural language document orchestrator |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3513002A (en) * | 1966-04-29 | 1970-05-19 | Johns Manville | Chemical resistant glass composition for fiberization |
CA2170669A1 (en) * | 1995-03-24 | 1996-09-25 | Fernando Carlos Neves Pereira | Grapheme-to phoneme conversion with weighted finite-state transducers |
US6513002B1 (en) * | 1998-02-11 | 2003-01-28 | International Business Machines Corporation | Rule-based number formatter |
US20040030554A1 (en) * | 2002-01-09 | 2004-02-12 | Samya Boxberger-Oberoi | System and method for providing locale-specific interpretation of text data |
US20030216920A1 (en) * | 2002-05-16 | 2003-11-20 | Jianghua Bao | Method and apparatus for processing number in a text to speech (TTS) application |
US7558732B2 (en) * | 2002-09-23 | 2009-07-07 | Infineon Technologies Ag | Method and system for computer-aided speech synthesis |
-
2005
- 2005-07-29 US US11/193,028 patent/US20070027673A1/en not_active Abandoned
-
2006
- 2006-07-18 WO PCT/FI2006/050345 patent/WO2007012699A1/en active Application Filing
- 2006-07-18 EP EP06778528A patent/EP1910940A1/en not_active Withdrawn
- 2006-07-18 CN CNA2006800331436A patent/CN101263491A/zh active Pending
- 2006-07-18 KR KR1020087004959A patent/KR100959552B1/ko not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111199724A (zh) * | 2019-12-31 | 2020-05-26 | 出门问问信息科技有限公司 | 一种信息处理方法、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20070027673A1 (en) | 2007-02-01 |
EP1910940A1 (en) | 2008-04-16 |
KR20080032640A (ko) | 2008-04-15 |
WO2007012699A1 (en) | 2007-02-01 |
KR100959552B1 (ko) | 2010-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101263491A (zh) | 数至文本和语音的转换 | |
CN101923858B (zh) | 一种实时同步互译语音终端 | |
US7797629B2 (en) | Handheld electronic device and method for performing optimized spell checking during text entry by providing a sequentially ordered series of spell-check algorithms | |
CN100592385C (zh) | 用于对多语言的姓名进行语音识别的方法和系统 | |
CN1901041B (zh) | 语音字典形成方法、语音识别系统及其方法 | |
US20060033644A1 (en) | System and method for filtering far east languages | |
RU2419142C2 (ru) | Способ организации синхронного перевода устной речи с одного языка на другой посредством электронной приемопередающей системы | |
CN110516125B (zh) | 识别异常字符串的方法、装置、设备及可读存储介质 | |
CN109754780B (zh) | 基本语音编码图形和音频交换方法 | |
CN101661335A (zh) | 一种为嵌入式系统设计的中文输入方法及系统 | |
US8482529B2 (en) | Computer input system and input method thereof | |
CN100561469C (zh) | 创建和使用中文语言数据和用户自纠正数据的方法和系统 | |
CN113160793A (zh) | 基于低资源语言的语音合成方法、装置、设备及存储介质 | |
KR20100096335A (ko) | 한국어 단문 메시지 스팸 필터링 시스템 및 방법 | |
RU80603U1 (ru) | Электронная приемопередающая система с функцией синхронного перевода устной речи с одного языка на другой | |
KR100342785B1 (ko) | 한국어 문자열간의 전역 유사도 측정 방법 | |
KR101324765B1 (ko) | 모바일 기기의 중간 내부 치환을 이용한 문자 입출력 방법. | |
CN113345408B (zh) | 中英文语音混合合成方法、装置、电子设备和存储介质 | |
JP2006092223A (ja) | 携帯通信端末及び多言語表示制御方法 | |
CN107145478B (zh) | 一种将汉字语句转换为盲文的方法 | |
KR20100076337A (ko) | 발음 기반의 번역 방법 및 그 장치 | |
KR20030008254A (ko) | 키패드에서의 알파벳 입력장치 및 그 방법 | |
JPS6371767A (ja) | 文書作成装置 | |
KR101365855B1 (ko) | 문자를 예측하여 표시하기 위한 동적으로 생성된 키패드 | |
CN101187847A (zh) | 将字符输入电子装置中的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20080910 |