本申请要求以下美国临时申请的优先权,Nos.60/463,844,申请日是2003年4月18日;60/466,594,申请日是2003年4月30日;60/468,028,申请日是2003年5月5日;60/474,447,申请日是2003年5月30日;60/475,533,申请日是2003年6月3日;60/482,706,申请日是2003年6月26日;60/482,998,申请日是2003年6月27日;60/496,702,申请日是2003年8月20日;60/500,602,申请日是2003年9月5日;60/504,331,申请日是2003年9月19日;60/510,885,申请日是2003年10月14日;60/536,564,申请日是2004年1月14日;60/552,968,申请日是2004年3月11日;60/557,140,申请日是2004年3月26日,以上申请全部并入在这里引作参考。
具体实施方式
优选实施例的详细描述:
以下所描述的本发明涉及一种在具有有限数量的按键的小键盘上例如字符、标点、功能等符号(例如计算机键盘的符号)的配置方法,所述有限数量的按键用于通常的数据输入、以及用于尤其是组合了用户的声音/语音与小键盘上的按键交互(例如按下)的数据和/或文本输入方法。该方法使这种小键盘的使用更容易。
图1示出了使用按下和声音/语音识别系统的用于数据输入法的集成小键盘100的例子。在该例中,小键盘的按键可以对一种或多种类型与其的交互进行响应。所述交互可以是例如:
-使用特定的手指或手指的一部分(使用手指识别系统)来按下按键;
-单击(例如单次按下)按键或者双击(例如在较短时间间隔内连续两次按下)按键;
-轻轻地按下(或者触摸)按键,或者较重地按下按键。
-与按键短时间地交互(例如短时间地按下按键)或者长时间地按下按键等...
可以把所述小键盘上的一组符号分配给与所述小键盘的按键的每一种所述交互或者这些交互的组合。例如,可以把小键盘100的按键的上部所示的符号分配给单击小键盘的按键。例如,如果用户按下按键101,可以选择符号“DEF3.”。在相同的例子中,可以把小键盘100的按键的下部所配置的符号分配给例如双击所述按键。例如,如果用户双击按键101,则选择了符号“{}‘”。
根据使用小键盘的按键所实现的系统,使用如前所述的其他交互来进行相同的选择也是可能的。例如,轻轻地按下(或者触摸)按键101可以选择所述按键的上部所配置的符号,而较重地按下相同的按键可以选择所述按键的下部所配置的符号。
如所描述的,当用户和按键进行接触时,识别系统使分配给所述类型的交互的所述按键上的符号成为候选符号。例如,如果用户触摸或者轻轻地按下按键102,则系统使符号“A”、“B”、“C”、“2”和“,”成为候选符号。为了对所述候选符号之一进行选择,所述用户可以说出例如所述符号或者在所述小键盘上的所述符号的位置名称。出于这个目的,声音/语音识别系统被使用。
如果用户不说话,可以选择这些候选符号中的预定符号作为默认值。在本例中,在方框103中所示的标点“,”被选择。为了选择一个其他的候选符号,例如字母“B”,用户可以说出所述字母。
在相同的例子中,如果用户较重地按下按键102,则可以使符号“[”、“]”和““”作为候选符号。如前所述,如果用户不说话,则通过所述的按键动作进行选择的那些符号中的预定符号可以被选择作为默认值。在本例中,标点““”被选择。仍然在本例中,为了在其他两个候选符号“[”或“]”中选择所需符号,用户可以使用不同的方法,例如说出所述所需符号,和/或说出与其他符号有关的位置,和/或说出其颜色(如果每个符号具有不同的颜色),和/或分配给所述符号的任何预定名称(例如由用户发出的预定的声音或语音)。例如,如果用户说“左”,则选择符号“[”。如果用户说“右”,则选择符号“]”。
当然,与按键交互相结合的用户行为而不是使用语音,也可以对符号进行选择。例如,用户可以较重地按下按键102,并用手指向所需符号重击。
上述的数据输入方法还可以应用于具有对与按键进行单一类型的交互进行响应的所述按键的小键盘(例如,具有按钮的标准电话小键盘)。如图2所示,小键盘200具有对与按键进行单一交互进行响应的按键。当用户按下按键时,系统使在所述按键上的所有符号成为候选符号。例如,如果用户按下按键202,则符号“A”、“B”、“C”、“2”、“,”、“[”和“]”成为候选符号。
在本例中,如果用户不说话,则系统可以选择预定的默认符号。在本例中,标点“,”203被选择。
仍然在相同的例子中,为了在所述候选符号中对所需符号进行选择,用户可以说出所需符号,或者例如说出所述符号在所述按键上的位置名称,或者说出在所述小键盘上与其他符号有关的位置名称,或者说出如前所述的任何其他名称。例如,可以通过说出该符号而对按键上部所配置的那些符号中的符号进行选择(例如“A”、“B”、“C”或“2”)。另一方面,例如,可以通过说出其相对于例如在所述按键下部的两个其他符号的位置,例如通过说出“左”、“中”或“右”,而可以对按键的下部所配置的符号之一进行选择。例如,为了选择“[”204,用户可以按下按键202,并说出“左”。
如所述的,图1的小键盘上的按键可以对至少两种与其进行的预定类型的交互进行响应。与所述小键盘上的按键进行的各类型的交互可以使在所述按键上的一组所述字符成为候选字符。
如前所述,在例如写入文本的数据输入期间,可能需要与按键的不同的交互(例如单击,双击),以及与所述按键交互相结合的不同的用户行为(例如说,不说)。虽然本发明的数据输入方法是快速和容易的数据输入,但是,本发明的小键盘的按键上符号的更好配置可能会产生更容易和更快速的数据输入系统。该方法将在下面进行描述。
根据一个实施例,如图3所示,多个符号(例如计算机小键盘上的符号)被实际划分为至少两个组,并由它们的优先级(例如使用频率,用户对于例如标准电话小键盘等上的字母和数字的一些符号的现有布置的熟悉程度等)被布置在电话小键盘的按键上,如下所述:
被分配给与按键进行第一类型的交互的第一组
a)使用声音/语音的第一小组
可以根据标准配置把数字0-9和字母A-Z设置在小键盘的按键上,并把其分配给与所述按键的第一类型的交互(例如第一水平的按压)。通过与相应按键进行交互(例如第一类型的交互)并自然地说出所述符号,可以对这些符号中的所需符号进行选择。在图3中,所述符号(例如301)被配置在按键的上部。
在例如文本输入期间,字母和数字可能经常被使用。在例如敲击相应按键的同时,可以自然地说出这些字母和数字。由此,为了更快速和容易的数据输入,优选地,把这些字母和数字分配给与小键盘的按键的相同类型的交互。
b)不使用声音/语音的第二小组
可以把在数据(例如文本)输入期间经常使用的其他符号(例如,标点、功能等)的至少一部分设置在小键盘的按键上(每一个按键一个符号),并且把其分配给与所述按键的所述第一类型的交互(例如单击)。作为默认,可以仅通过与相应按键的交互,而不使用语音/声音对所需符号进行选择。在图3中,在所述按键的上部上的方框内设置所述符号(例如302)。
当然,还可以通过在与相应按键进行交互的同时说出所述符号对其进行选择,但是由于说出这种符号(例如标点、功能)总归不是自然的行为,由此,优选地,不说出这些符号。
分配给与至少一个按键进行交互的至少第二类型的至少第二组
可以把剩余符号的至少一部分分配给与所述小键盘的所述按键的至少第二类型的交互。它们可以划分为以下两组:
c)不使用声音/语音的第三小组
可以把包括剩余的经常使用的符号和难以和/或无法自然发音的符号的第三小组设置在所述小键盘的所述按键上(每一个按键一个符号),并且把其分配给与所述按键的第二类型交互(例如双击、较重的按压水平、同时按下两个按键、通过其触摸按键的手指的一部分,等)。
作为默认,可以仅通过与相应按键的所述交互,而不使用语音/声音来选择所需符号。在图3中,在按键下部上的方框中配置所述符号(例如303)。
当然,还可以通过在与相应按键进行交互的同时说出这些符号来选择它们,但是由于说出这种符号(例如标点、功能)总归不是自然行为,由此,优选地,不说出这些符号。
d)使用声音/语音的至少第四小组
可以把包括剩余符号的至少一部分的第四小组分配给与所述小键盘的按键的所述第二类型的交互,并且与例如声音的用户行为相结合。在图3中,在按键下部上配置所述符号(例如304)。可以通过与相应按键的所述第二类型交互并且使用不同方式下的声音/语音来选择所述符号,所述不同方式包括:
-通过自然地说出它们的名称来选择符号
-通过自然地说出它们在按键上彼此相对的位置,或者在文本中使用它们的时候的它们的位置(例如在本例中的“<”、“>”,所述符号不属于所述第二类型交互,这仅仅是例子),例如通过说出“左、右、开、关等”,来选择所述符号。
-非常少使用的(几乎不会使用)和/或难以发音(例如304)的符号。对于快速和容易的数据输入方法,还可以通过说出它们在按键上的位置或它们在所述小键盘上彼此相对的位置来选择所述符号。当然,可以通过使用例如对其进行发音的其他语音来选择这些符号。
e)其他
如果需要,可以把例如“F1-F12”等其他符号设置在小键盘的按键上,并且向其分配交互的类型。例如,可以把它们分配给所述第二类型交互(使用或不用语音),或者把其分配给另一种交互,例如同时地按下两个按键、三次敲击相应按键、使用开关进入另一模式等。
增强小键盘以及小键盘使用的更多考虑
由于根据标准配置可以把数字0-9和字母A-Z设置在小键盘的按键上,并且把它们分配给与和语音相结合的所述按键的第一类型的交互(例如第一水平的按压、单击等),例如311、312、313和314的一些按键可以包括在所述配置中使用的最多一个符号(例如在按键311上的数字1、或者在按键313上的数字0)。由此,为了更好地使用所述按键,可以把一些容易和自然发音的符号321-324添加在所述按键上,并且把其分配给所述第一类型的交互。例如,用户可以通过使用与按键311的第一类型的交互并说出例如“左”或“开”,来选择符号“(”。为了选择符号“)”,用户可以使用与所述按键311的相同的第一类型的交互并说出例如“右”或“关”。对于所述符号,这是快速和更为重要的自然语音。由于在所述按键311-314上分配给所述第一类型的交互的候选符号的数量不超过在其他按键上的候选符号的数量,语音识别系统仍然可以具有与其他按键类似的精确度。
一些符号还可以使用在两种模式中(与按键的交互)。所述符号可以多于一次地配置在小键盘上(例如在单一按键上或在不同的按键上),并且把其分配给与相应按键的第一类型交互和/或第二类型交互。
图3示出了用于计算机数据输入系统的本发明的优选实施例。小键盘300的按键对其上的两种或多种不同交互(例如不同水平的按压、单击或双击等)进行响应。如所示出的,例如字母数字符号、标点、功能和PC命令的多个符号按照如下模式分布在所述按键中。
模式1
第一组-字母A-Z和数字0-9在例如写入文本的数据输入期间是非常频繁使用的符号。在按下相应按键同时,可以容易地、更为重要的是自然地对这些符号进行发音。由此,可以在属于例如单击(例如单次按压)按键的相同类型交互(例如第一模式)的按键上的相同侧上,把这些符号布置在一起,并且通过说出这些符号对其进行选择。
第二组-例如标点和例如写入文本的数据输入期间非常频繁使用的功能的符号可以属于相同类型的交互,其用于选择所述字母和数字(例如所述第一模式)。即,在输入数据时,与按键的相同类型的交互越多越好。每一个按键可以仅具有所述第二组的一个所述符号。可以仅通过按下相应按键、不使用声音而对这组符号进行选择。为了更好地区分,这些符号被显示在按键上部上的方框中(例如与用于字母和数字相同的一侧)。
模式2
符号的所述数量的其他符号显示在小键盘的按键的下部上。把这些符号分配给与所述按键的第二类型交互(例如双击)。
第三组-在方框中示出默认符号(例如需要与按键的交互和不需要使用声音的那些符号)。所述符号包括用户目前较少使用的字符、标点、功能等。
第四组-最后,在数据输入中较少使用并且无法自然拼出的符号在本例中位于按键下部上的左侧。通过与相应按键的相应交互(例如双击)并且还(例如几乎同时)对这些符号进行发音,或者通过说出分配给所述符号的预定语音或声音(例如“左,右”或者“蓝色,红色”等)叫出它们,可以对这些符号进行选择。
通过使用小键盘,其具有与不同类型的交互(优选地,两种类型,从而不使按键的使用复杂)相应的按键,以及具有不需要语音(例如默认符号)的一些符号,当与所述小键盘的按键进行交互时,或者所需的按键(例如默认的)被直接交互,或者通过例如声音/语音的用户行为使被选择的候选符号是最少的。这增加了语音识别系统的准确度。
例如,当用户轻轻地按下按键时,系统在位于所述按键上的这些符号中对所述按键上部上的符号进行选择。如果用户同时使用语音,则系统在所述所选择的符号中对需要语音的那些符号进行选择。减少候选字符的数量并需要语音识别技术来选择符号之一的这个过程通过具有有限数量的按键的小键盘被用于具有高准确度的数据输入。通过例如按下按键和/或说话的用户自然行为产生减少的过程。
如图4所示,按键411、412、413和414具有需要语音交互和分配给与所述按键进行第一类型交互的一个符号。另一方面,在下部的同一按键包括需要与所述按键进行第二类型交互并且还需要语音交互的两个符号。所述两个符号可以比属于相同种类的其他符号更频繁地被使用(例如在算术数据输入中或当写软件等时,等)。在这种情况下,以及为了在与按键进行交互(例如按下)的同时还使用户差错最小化,还可以把所述符号分配给与所述按键进行的所述第一类型交互。候选符号的总数保持较低。用户可以按照其需要按下所述按键并说话。
附加的布置可以设置在上述的小键盘上,以便用户使用。例如,可以把“-”和“_”、“””和“’”、或者“;”和“:”配置为相同按键411上的默认符号,或者配置在两个相邻按键415、416上。还可以把“Sp”和““(例如Tab)看作默认符号并配置在相同按键412上,每一个对应于与所述按键的不同类型交互(例如按压水平)。例如,通过一次按下按键412,选择字符“Sp”。通过双击相同按键,选择“tab”功能。
当与按键进行交互时(例如一次按下按键或者双击按键),通过不释放所述按键,与所述交互相应的符号(如果需要,包括语音)可以被选择并被重复,直到释放该按键为止。例如,通过双击按键415并在第二次敲击之后保持按键按下而且不说话,分配给所述交互的默认符号(例如“&”)被选择并被重复,直到用户释放所述按键为止。为了输入字母“X”并且重复该字母,用户可以例如按下相应按键415(不释放该按键)并且说出“X”。字母“X”将被重复,直到用户释放所述按键为止。
并且,为了小键盘的更加熟悉的外观,可以根据标准电话小键盘配置,把字母、数字以及例如“#”和“*”的字符设置在所述按键上。
与所述小键盘的按键分开设置的其他按键可以用于包括一些所述符号和其他符号。在图6的例子中,通过至少一个与小键盘600的按键分开设置的按键,在不同的方向上对光标进行导航。单一的按键601可以被分配给所有方向602。例如,用户可以按下所述按键,并且说“上、下、左或右”,以便在相应方向上对光标进行导航。按键601还可以是多方向的按键(例如与在视频游戏中或在一些蜂窝电话中所使用的那些按键类似,以便在菜单中进行导航)。用户可以按下按键601的上、右、下或左侧,以便因此对光标进行导航。还可以对多个其他按键进行分配,例如,每一个分配给例如““的至少一个符号。
所述附加的按键可以是在电子设备上的现有按键。例如,在蜂窝电话中,除了标准电话小键盘的十二个按键之外,还设置例如菜单按键或开/关按键等其他功能按键。当系统例如处于文本输入模式时,至少这些按键的一部分可以被用作其他的数据输入按键,其包括多个符号。这释放了标准电话小键盘的按键上的一些空间。所释放的空间可以允许更准确的语音识别系统和/或小键盘的按键上符号的更为用户友好的配置。
上述配置方法和前面所示的例子仅作为例子被示出。当然,符号的多种其他的配置以及对于与按键交互的不同用户的不同任务也可以进行考虑。例如,按键可以不具有默认符号,或在按键上可以没有分配给声音/语音的符号。
并且,并非小键盘的所有按键都可以对相同类型的交互进行响应。例如,小键盘的第一按键可以对两种水平的按压进行响应,而相同小键盘的另一个按键可以对单击或双击按键进行响应。
图1一7示出了小键盘的按键上符号的不同配置。
通过计算机小键盘,上述数据输入系统允许例如全文本数据输入的全数据输入。通过逐一输入例如字母、标点符号、功能等符号,可以输入单词和句子。
这将大大影响允许对已使用的多种应用和方法进行增强的电信市场。它们的一部分在下文中被列出。可以理解,上述交互的任何组合可以被用于输入所需符号。
根据本发明的一个实施例,用户使用声音/语音以输入例如字母的所需符号,而不需要例如按下按键的其他交互。用户可以使用小键盘的按键(例如单次按键、两次按键、三次按键等)以输入例如标点的符号,而无需说出这些符号。
可以理解,在本申请中所描述的数据输入方法可以应用到例如汉语、韩语、日语等所有其他的语言。
符号的校正和重复
不同的方法可以用于校正错误输入的符号。如所提到的,为了输入符号,用户可以例如按下相应按键,并说出在所述按键上配置的所述所需符号。有可能发生下面的情况,即,声音/语音识别系统误解用户的语音,并且系统选择了在所述按键上配置的非所需的符号。
例如,如果用户:
a)在输入下一个所需符号之前,识别出错误输入的符号(例如光标被定位在所述错误的符号之后,紧挨着它),则用户可以进行校正过程,其在后面进行解释;
b)在输入至少下一个符号之后,识别出错误输入的符号,则用户可以首先通过具有导航功能的例如按键101(图1)或202(图2)的相应方式在文本中进行导航,并且把光标定位在所述错误的符号之后,紧挨此符号。然后,用户进行校正过程,其在后面进行解释;
在把光标定位在所述错误符号的后面而紧挨该符号之后,用户可以重说所述所需符号或者其位置名称,而不需要重新按下所述相应按键。如果系统重新选择了相同的所删除的符号,则系统将自动地丢弃所述选择,并且在所述按键上配置的剩余符号中选择符号,其中,该符号的名称或者其位置名称相应于与所述用户的语音相应的下一个最高的可能性。如果通过系统仍然选择了错误的符号,则由用户重说所需符号、并且在所述按键上的剩余符号中选择具有最高可能性的下一个符号的过程可以继续,直到通过系统选择了所需符号为止。
可以理解,在使用具有对例如两种水平的按压进行响应的按键的小键盘的数据输入系统中,当进行校正时,识别系统可以首先在属于相同符号组的那些符号中对符号进行选择,所述相同符号组属于请求选择所述错误的符号的按压水平。如果用户不接受这些符号中的任何一个,则系统可以在所述按键上属于另一个按压水平的符号中对符号进行选择。
图7b示出了相应于校正方法的实施例的流程图。如果为了任何原因,用户想要校正已经输入的符号,则用户可以进入此校正过程。
校正过程开始于步骤701。如果替代的符号不位于与要被替代的符号相同的按键上(702),则用户删除要被替代的符号(704),并且通过按下相应按键,而且如果需要,使用增加的语音对替代的符号进行输入(706),然后退出(724)。
如果替代的符号位于与要被替代的符号相同的按键上(708),并且替代的符号不需要语音(710),则系统进入步骤704和706,并因此起到前述的作用,然后退出(724)。
如果替代的符号位于与要被替代的符号相同的按键上(708),并且替代的符号不需要语音(712),则要对两种可能性进行考虑:
a)光标不位于要被替代的符号之后(714)。在这种情况下,用户把光标定位在要被替代的符号之后并紧挨该符号(716),然后进入下一步骤718;
b)光标位于要被替代的符号之后(714)(例如用户立即识别出错误输入的符号)。在这种情况下,用户进入下一步骤718;
在步骤718,用户说出所需符号而不按下按键。通过不按下按键而只说话,系统理解属于位于光标之前的按键的符号必须由属于相同按键的另一个符号进行代替。然后,系统将在具有与所述语音相应的最高可能性的所述按键上的其余符号(例如包括已被选择的符号)中对符号进行选择(720)。如果新选择的符号还是非所需的符号(722),则系统(和用户)在步骤718处重新输入。如果所选择的符号是所需符号,则系统退出校正过程(724)。
当然,除了上述方法之外,还可以提供传统的校正符号的方法。例如,为了校正已经输入的符号,用户可以容易地首先删除所述符号,并接着通过按下相应按键,并且如果需要,使用增加的语音,重新输入新的符号。
文本输入系统也可以被应用于单词级(例如用户说出单词并通过使用小键盘进行输入)。相同的文本输入过程可以结合单词级输入(例如对于包括在数据库中的单词)和字符级输入。由此,上述校正过程还可以应用于单词级数据输入。
例如,为了输入单词,用户可以说出所述单词并按下相应按键。如果由于例如对具有相近发音和类似按键按下的两个单词之间的含混进行消除等原因,识别系统选择了非所需的单词,则用户可以重说所述所需单词,而不重新按下所述相应按键。然后,系统将在相应于所述按键按下的候选单词的剩余部分中(例如包括已被选择的单词)对相应于所述语音具有最高可能性的单词进行选择。如果新选择的单词还不是所需单词,则用户可以重说所述单词。重复该过程,直到通过系统选择了所述的所需单词或者不存在其他候选单词为止。在这种情况下,用户可以通过例如前所述字符输入系统,输入所述的所需单词。
可以理解,在单词级中,当进行校正时,光标应该位于所述要被替代的单词之后。出于这个目的,并且为了避免字符校正模式的含混,当修改整个单词(单词校正级)时,用户可以把光标定位在所述要被替代的单词之后,其中,至少一个空格字符对所述单词和所述光标进行间隔。这是由于,例如,如果用户想要校正已经输入单词的最后一个字符,用户应该把光标定位在紧挨在所述字符之后。通过把光标定位在单词后面的至少一个空格之后(或者下一行的开始处,如果所述单词是前一行的最后一个单词),并且说话而不按下按键,则系统识别出用户可能希望校正光标前的最后一个单词。为了更好的结果,可以理解,如果要被替代的单词包括标点符号(例如“.”、“?”、“,”等),可以把光标放回到标点符号后面的空格之后。这是由于在某些情况下,用户可能希望对必须位于单词末尾的错误的标点符号进行修改。出于这个目的,用户可以把光标定位在紧挨在所述标点符号之后。
为了避免意外的校正(例如光标位于文本中的某个地方,并且用户说话而不想要进行数据输入),则可以应用不同的方法。例如,当用户希望例如在文本输入期间进行休息,则可以使用暂停或者非文本按键。另一解决方案是:在把光标定位在文本中的某个位置上之后,经过一段时间(例如两秒)之后,系统不接受在光标之前最后的单词或字符的校正。如果用户希望校正所述单词或所述字符,用户可以例如对所述光标进行导航(至少向任意方向移动一次),并且把其放回所述所需位置。在把光标重新定位在所需位置之后,将从开始处对时间进行计数,并且用户应该在所述时间段被截止之前对所述单词或所述字符进行校正。
重复符号
为了重复所需符号,用户首先按下相应按键,并且如果需要,或者说出所述符号,或者用户说出在其相应按键上所述符号的位置名称、或根据所述按键上其他符号说出所述符号的位置名称。然后,该系统选择所需符号。用户继续按下所述按键而不中断。经过预定的时间段之后,系统识别出用户想要重复所述符号。系统对所述符号进行重复,直到用户停止按下所述按键。
应该注意,上述校正和重复按键符号的方法可以与包括但不限于单击/双击、压力敏感按键、同时按下的按键、只有一部分被按下的按键等的任何输入方法结合起来使用。
电话簿
为了进行电话呼叫,用户可以通过例如名字(例如人、公司等)的任何信息输入要被呼叫的目的地,而不是拨号,并且如果需要,输入例如所述要被呼叫方地址等的更多信息。中央电话薄可以把所述呼叫自动定向到所述目的地。如果存在分配给所述目的地(例如对方)的多于一条的电话线路,或者对于由用户输入的所述所需信息存在多于一个选择,可以把相应的选择列表(例如电话号码、或者分配给所述电话线路的任何其他预定的配备)传送到呼叫方的电话,并且例如在其电话的显示单元上进行显示。然后,用户可以选定所需选择,并且进行电话呼叫。
上述的呼叫(例如拨号)方法可以允许消除对通过他/她的电话号码呼叫对方(例如个人)的需要。由此,可以消除对存储电话号码、携带电话本或利用接线员的帮助的需要。
使用声音/语音的交互电话簿
语音电话簿越来越多地被公司、公共机构等使用。这种与另一方进行交互的方法对用户而言是非常耗时和麻烦的过程。许多人通过收听在电话另一侧的语音电话簿而断开通信。甚至当个人设法与所述系统进行交互时,经常发生在花费大量时间之后,呼叫方不能成功地访问所需服务或个人。这种含混的主要原因在于当收听语音电话簿指示时,多数情况下用户必须等待,直到宣布了所有选项。多数情况下,他(用户)没有记住所宣布的所有选择。因此他必须重新收听这些选择。
并且多数情况下,语音电话簿需要由用户输入数据。由于电话小键盘的按键的有限数量,或者由于通过小键盘输入符号的复杂性,数据输入的变化受到限制。
上述数据输入方法允许与电话簿进行快速可视的交互。被呼叫方可以把可视的交互电话簿传送到呼叫方,而呼叫方几乎立即可以看到所有的选择,并且使用他的电话小键盘(包括以上所提到的数据输入系统)容易而快速地对问题进行响应或询问问题。
语音邮件
语音邮件还可以由文本邮件替代。该方法已经被使用。当用户必须给另一方回答消息或者写消息给另一方时,上述数据输入方法的优点是显而易见的。本发明的数据输入方法还显著地增强了通过例如蜂窝电话的移动电子设备的消息系统的使用。一种最熟知的使用是在短消息服务(SMS)中。
使用电话型小键盘的电子设备的数量是巨大的。本发明的数据输入方法通过所述设备的小键盘允许显著增强的数据输入。当然,这种方法不限于电话型小键盘。该方法还可以用于任何小键盘,其中,所述小键盘的至少一个按键包括多于一个符号。
多部分的小键盘
通过使用具有多部分的小键盘,使用上述数据输入方法的小键盘的尺寸还可以被最小化。处于关闭状态时,所述小键盘在尺寸上可以最小化(例如与最大的部分一样大,例如与成人用户指尖的尺寸或者小小键盘的按键一样大),并且当小键盘处于打开状态时,如所需的可以是最大的(根据所使用和/或打开的部分的数量)。
理论上,处于关闭状态时,小键盘甚至可以具有所述小键盘的按键的尺寸。
图8示出了包括至少三个部分801的所述小键盘800的一个实施例,其中,每一个所述部分包括电话小键盘的一列按键。当所述小键盘处于打开状态时,提供电话型小键盘800。处于关闭状态802时,所述小键盘可以具有所述部分之一的宽度。
图9示出了所述小键盘的另一个实施例。所述小键盘900包括至少两个部分901-902,其中,第一部分901包括电话型小键盘的两列按键911-912,而所述小键盘的第二部分902至少包括所述电话型小键盘的第三列913。当所述按键处于打开状态时,提供电话型小键盘。所述小键盘还可以具有布置在所述第二部分上的另外的按键列914。处于关闭状态920时,所述小键盘可以具有一个所述部分的宽度。
如图10所示,所述小键盘1000的另一个实施例包括至少四个部分1001-1004,其中,每个所述部分包括电话小键盘的一行按键。当所述小键盘处于打开状态时,提供电话型小键盘。处于关闭状态1005时,所述小键盘的长度可以是所述小键盘的一行按键的宽度的尺寸。
图11示出了包括至少两个部分1101-1102的所述小键盘1100的另一个实施例,其中,第一部分包括电话型小键盘的两行按键,而所述小键盘的第二部分包括所述电话型小键盘的另外两行按键。当所述小键盘处于打开状态时,提供电话型小键盘。处于关闭状态1103时,小键盘的长度可以与所述小键盘的一行按键的宽度尺寸一致。
在由本发明人已经递交的专利申请中,已经对上述多部分的小键盘进行了描述。
通过使用上述的通过如所述的多部分的小键盘的数据输入方法,可以提供小型化的易使用的全数据输入小键盘。这种小键盘可以用在许多设备中,特别是具有限制的尺寸的那些设备。
当然,可以在所述多部分的小键盘上使用上述的符号配置。
图12示出了多部分的小键盘1200的另一个实施例。具有按键1201的部分之间的距离可以通过任何方法增加。例如,可以把空(例如不包括按键)部分1202设置在包括按键的部分之间。当所述小键盘处于打开状态时,这将允许更加增大各部分之间的距离。另一方面,处于关闭状态1203时,还允许具有更细的小键盘。
具有集成的小键盘和鼠标或指向和点击设备的数据输入设备
为了通过通常的小键盘和特别是通过本发明的小键盘,增强数据输入方法,可以把在下文中是鼠标的指向和点击系统集成在电子设备的背面,该电子设备的前面具有用于数据输入的小键盘。
图13示出了例如蜂窝电话1300的电子设备,其中,用户在其手掌1301中持有该设备。所述用户可以仅使用一只手把所述设备1300持在其手中,并同时操作其位于前面的小键盘1303,以及位于所述设备背面的鼠标或指向和点击设备(未示出)。所述用户的拇指1302可以使用小键盘1303,而其食指1304可以操作所述鼠标(在背面上)。其他三个手指1305可以帮助把设备持在用户的手中。
集成在所述设备背面的鼠标或指向和点击设备可以具有与计算机鼠标类似的功能。还可以把电话型小键盘的多个按键(例如两个按键)或者把所述设备的其他按键中的多个按键分配给鼠标点击功能。例如,按键1308和1318可以与所述设备1300的集成鼠标一起动作,并且具有与计算机鼠标的按键类似的功能。所述按键可以具有与计算机鼠标相同的功能。例如,通过操作鼠标,用户可以对所述设备的屏幕1307上的常规选择(指针)指示符1306进行导航,并且把其定位在所需菜单1311上。如同对计算机鼠标一样,所述用户接着可以例如单击(点击)或双击(两次点击)所述小键盘中的预定按键1308(其被分配给鼠标),从而可以例如选择或打开所述所需菜单1311,其通过所述常规选择(指针)指示符1306被指向。
由于例如蜂窝电话的移动设备的显示器具有较小的尺寸,由此,可以在所述设备中设置转动按钮1310,从而使用户能够例如转动菜单列表。例如,在屏幕1307上出现所需菜单1311之后,用户可以使用鼠标把常规选择(指针)指示符放在所述的所需菜单上,并且通过使用例如电话型小键盘1303的按键1313之一、或者所述设备上的其他按键1308之一等,对其进行选择。
如同对于计算机一样,用户接着可以按下所述按键以打开相关的菜单条1312。为了选择所述菜单条1312的功能1313,用户可以保持按下所述按键,并且在把正常选择(指针)指示符1306放在所述功能上之后,通过释放所述按键,可以选择所述功能。
通过使用所述小键盘和所述鼠标,可以提供与计算机的功能类似的其他功能。
并且,用户可以使用预定声音/语音或其他预定行为来代替所述按键的功能,而不使用分配给鼠标的所述按键。例如,在把正常选择(指针)指示符1306定位在图标上之后,用户可以说出“选择”或者“打开”,而不是按下按键,以选择或打开由所述图标所表示的应用。
图14示出了例如移动电话1400的电子设备。表示不同应用的多个不同的图标1411-1414在所述设备的屏幕1402上被显示。为了选择和/或打开应用之一,如同对于计算机一样,通过使用鼠标,用户可以把常规选择(指针)指示符1403放在所需图标1411上。然后,所述用户可以通过例如一次按下所述小键盘的预定按键1404,选择所述图标。为了打开由所述图标表示的应用,用户可以例如双击所述小键盘的预定按键1404。
在电子设备的背面上集成的鼠标可以是任何类型的。例如,图15示出了例如图13-14所示的电子设备的电子设备1500的背面,鼠标1501与传统的计算机鼠标类似。如所述的,可以利用用户的手指操作鼠标1501。通过把所述设备放置在例如桌面的表面上,并且在所述表面上敲击所述鼠标,可以象传统的计算机鼠标那样操作鼠标。
图16示出了例如图13-14示出的电子设备1600的背面上集成的另一传统类型的鼠标(敏感垫)。鼠标1601与传统的计算机鼠标类似。如所述的,可以利用用户的手指对其进行操作。在本例中,优选地,如前所述,把该设备持在其手掌中时,用户使用其食指1602以使用(例如去操作)所述鼠标。根据该位置,用户使用其拇指(未示出)去操作小键盘(未示出)中的按键,其位于所述设备的前面(例如另一面)。
优选地,移动设备应该只用一只手操作。这是由于当用户在运动时(例如在公共汽车或火车上时),用户站在火车上时可以使用另一只手用于例如握住横杆的其他目的,或者使用一只手握住报纸或公文包)。
通过在例如移动电话的设备的背面使用鼠标,用户可以利用一只手操作所述设备并输入数据。该用户可以同时使用所述设备的小键盘和鼠标两者。
当然,如果用户希望,所述用户可以使用他的两只手来操作所述设备及其鼠标。
使用所述设备的另一种方法是把其放置在例如桌面的表面上,并以与常规的计算机鼠标相同的方式在所述表面上滑动所述设备,并且使用所述小键盘输入数据。
可以理解,可以把包括前述鼠标的任何类型的鼠标集成在移动设备的任何部分中。例如,鼠标可以位于所述设备的前面。所述鼠标还可以位于所述设备的一侧上,并且如前所述,通过手指同时操作鼠标和小键盘。
应该注意,鼠标在这个讨论中从始到终被使用,不过,集成在电子设备中并与电话型小键盘结合的例如笔式计算机(stylus computer)的任何指向和点击数据输入设备都在本发明的构想之内。
外部集成的数据输入单元
在需要例如大键盘(或小键盘)和/或鼠标的数据输入装置的电子设备中还可以设置和使用包括小键盘和鼠标的外部集成的数据输入单元。可以设置集成的数据输入单元,其在所述单元的前面具有小键盘(例如电话型小键盘)的按键,并具有集成在所述单元的背面内的鼠标。可以把所述数据输入单元与例如计算机、个人数字助理(PDA)、照相机、电视机(TV)、传真机等所需设备相连。
图19示出了包括大键盘1901、鼠标1902、监视器1903和其他计算机附件(未示出)的计算机1900。在某些情况下(例如当用户不想坐在监视器前面的椅子上,而宁愿躺在他的床上同时与所述计算机进行交互时),用户可以使用较小的外部集成的数据输入单元,而不是大键盘和/或相应的鼠标。可以设置外部数据输入单元1904,其包括以下特征,即,例如位于所述数据输入单元前面的小键盘按键1911,可以是可延伸的麦克风1906的麦克风,集成在所述数据输入单元的背面内的鼠标(未示出)(如前所述)。所述数据输入单元可以(无线地或通过导线)与所述电子设备(例如所述计算机1900)相连。例如前所述的集成的数据输入系统(例如由用户使用与按键的交互结合的语音识别系统)可以被集成在所述电子设备(例如所述计算机1900)内部,或者集成在所述数据输入单元1904内部。麦克风还可以被集成在所述电子设备(例如计算机)内部。所述集成的数据输入系统可以使用位于所述数据输入单元上或所述电子设备(例如计算机)内的一个或者两个麦克风。
为了在进行交互时更好的观看,特别是当从远处与例如所述计算机1900的电子设备进行交互时,可以把显示单元1905集成在例如本发明的所述集成的数据输入单元1904的所述输入单元内部。当从远处与所述电子设备1900的监控器1903进行交互时,用户可以总体上看到所述监视器1903的显示器1910。通过使用所述监视器1903的显示器1910上的鼠标所选择的箭头1909附近的限定区域1908或其他区域可以同时显示在所述数据输入单元1904的所述显示器1905上。所述区域1908的尺寸可以由制造商和用户定义。优选地,所述区域1908的尺寸可以接近于所述数据输入单元1904的显示器1905的尺寸。这可以允许对于用户而言接近的和/或如果需要的话、交互区域1908的实际尺寸的视图(例如通过在数据输入屏幕1905上观看所述区域)。当具有监视器1903的显示器1910的总体视图时,用户可以具有交互区域1908的特别接近的视图,其同时被显示在所述数据输入单元1904的显示器1905上。例如,用户可以使用小键盘鼠标(未示出,在小键盘的背面上)以在计算机显示器1910上对箭头1909进行导航。同时,在所述计算机显示器1910上的所述箭头1909和所述箭头1909周围的区域1908可以显示在小键盘显示器1905上。
为了例如打开文件的交互,用户可以例如在所述计算机的屏幕1910上对箭头1909进行导航,并把其定位在所需文件1907上。所述导航区域1908和所述文件1907可以在所述数据输入屏幕1905上被看到。通过具有靠近其眼睛的所述数据输入单元1904的显示器1905,用户可以在所述数据输入单元1904的显示器1905上清楚地看到他的交互,同时在所述电子设备1900(例如计算机)的大显示器1910上具有总体的视图。
可以理解,可以根据不同的需要或定义对所述交互区域1908进行定义和改变。例如,所述交互区域可以是箭头1909周围的区域,其中所述箭头位于所述区域的中心,或者,所述区域是所述箭头的右、左、上、下等侧的区域,或是所述监视器的屏幕上的任何区域,而与所述监视器的显示器上的所述箭头位置无关。
图20示出了例如前述的数据输入单元的与计算机2001相连的数据输入单元2000。在例如文本输入的数据输入期间,在小键盘显示器2004上同时显示在交互点2003(例如光标)周围的区域2002上。
图21a-21b示出了不同电子设备的例子,其可以使用上述的数据输入单元。图21a示出了计算机2100,而图21b示出了TV 2101。所述TV 2101的数据输入单元2102还可以用作所述TV 2101的遥控器。例如,通过使用位于所述数据输入单元2102后面的鼠标(未示出),用户可以把选择箭头2103定位在表示电影或频道的图标2104上,并且通过双击(两次点击)所述数据输入单元的按键2105把其打开。当然,所述TV的所述数据输入单元2102还可以用于例如通过TV的因特网的数据输入,或者通过TV、有线TV等发送消息。在这种情况下,本发明的集成的数据输入系统可以集成在例如TV的调制解调器2106内部。
可延伸的麦克风
可以把可延伸的和/或可转动的麦克风集成在例如蜂窝电话的电子设备中。所述麦克风可以是向用户的嘴延伸的刚性麦克风。
随着技术的进步,新的输入系统和设备正在进入市场,从而允许与设备容易地进行交互。许多这样的输入系统使用了声音/语音识别系统,其中,用户说出要输入的数据或命令。由于这是以自然的方式输入数据,因此,语音识别系统正在变得非常普遍。计算机、电话、玩具和许多其他设备配备有使用语音识别系统的不同种类的数据输入系统。
虽然这是较好的输入方法,但是其具有严重的缺陷。该方法不是间断的输入方法。通常,用户不想要其他人听到他所说的话,而另一方面,人们不喜欢其他人的大声说话。
为了显著地克服(或至少减小)该问题,用户必须轻声地说话。为了不使用户的声音/语音被语音识别系统误译,麦克风必须靠近用户的嘴。
本发明的目的是提供带有从所述设备向用户的嘴延伸的麦克风、使用用户的语音作为数据的设备。
使用这种麦克风具有许多优点。这种麦克风的优点之一在于:通过把所述麦克风向所述用户的嘴延伸并且靠近麦克风说话,声音/语音识别系统可以更好地区分和识别所述声音/语音。另一个优点在于:通过把所述麦克风定位成靠近用户的嘴(例如接近嘴),用户可以非常轻声地对其说话(例如耳语)。这允许几乎无声的和间断的数据输入。并且,所述麦克风的另一个优点在于:由于被集成在相应的电子设备中,为了把所述麦克风保持在所需位置上(例如靠近用户的嘴),用户可以不必通过他的手持有所述麦克风。所述用户也不必携带与所述电子设备分开的所述麦克风。
在电子设备中或者作为与电子设备相连的外部单元,通过对以下特征进行组合:例如,本发明的增强的小键盘、鼠标、可延伸的电话和以例如前述的方式的数据输入方法,可以提供完整的增强的数据输入系统。用户可以例如通过只使用一只手,持有例如数据输入设备(例如移动电话、PDA等)的电子设备,使用例如增强的小键盘、集成的鼠标和可延伸的麦克风等所有特征,并同时通过使用其自然的习惯(例如按下小键盘的按键以及在需要时说话),提供快速、容易和特别自然的数据输入。
可延伸的麦克风的最重要的应用之一是当移动通信设备的数据输入系统对小键盘的使用和声音/语音识别系统进行结合时。用户以这种方式与按键进行交互(例如,通过按下按键),并且同时,用户可以说出例如在所述按键上的符号。为了按下包括所需符号的按键,用户可能需要看小键盘。用户还可能需要看设备的显示器上的数据。另一方面,用户可能宁愿轻声说出所述符号。可延伸的麦克风允许使移动电话位于离眼睛较远、足够看到这个小键盘之处,并且同时,使麦克风靠近嘴,允许轻声说话。
如许多人所习惯的,他们可以在一只手中握住他们的移动电话,同时使用同一只手的拇指按下小键盘的按键。第二只手可以用于把所述手握在麦克风的周围,以减少外部噪声,或者使麦克风与嘴保持最佳关系。
如果设备的麦克风是无线的,或者把其与设备相连的部件由非刚性的材料制成,用户可以以把其定位在其手掌一侧的方式,把麦克风保持在两个手指之间。然后,通过把所述手的手掌定位在嘴周围,用户可以在说话时显著地减少外部噪声。
可以理解,使用用户的语音输入数据的电子设备的包括数据输入单元的用户接口以及显示器可以是任何类型的。例如,该电子系统可以包括触摸敏感垫(touch sensitive pad),而不是小键盘,或者,该电子设备可以只配备有语音识别系统,而不需要小键盘。
图18示出了根据本发明的实施例,例如蜂窝电话或PDA的电子设备1800。如图所示,小键盘1801位于所述设备1800的前面。鼠标(未示出)位于所述设备1800的背面。可延伸的麦克风1802也与所述设备成为一体。所述麦克风可以进行延伸,并且由用户在所需位置上进行定位(例如接近于用户的嘴)。所述设备还可以包括如前所述的数据输入方法。通过只使用一只手,用户能够以非常高的准确度进行快速和容易的数据输入。把所述麦克风定位成靠近用户的嘴,使得通过系统对用户的声音/语音更好地识别。所述用户还可以轻声地(例如耳语)对着所述麦克风说话。这允许几乎无声的数据输入。
在本发明的图18B到图18C的可选实施例中,示出了具有小键盘1801和显示单元的移动电话1800。移动电话配备有具有安装在其末端的麦克风1802的绕轴转动部分1803。通过把麦克风向用户的嘴延伸,用户可以轻声地对着电话说话,并同时能够看到其电话的显示器和小键盘1801,以及最终,在对着麦克风1802说话时,同时使用所述的显示器和小键盘。
图18D示出了转动的可延伸的麦克风1810,以便允许用户以对他方便的关系对设备进行定位,并同时,通过相应地转动和延伸麦克风,使麦克风1810靠近他的嘴或达到所需位置。必须注意,使麦克风与所述设备相连的部件可以具有至少两个部分,彼此相互地或对设备进行延伸/缩回。麦克风可以具有折叠、滑动、伸缩和其他运动,用于延伸或缩回。
图18E和18F示出了可伸缩地延伸的集成转动麦克风1820。在该实施例中,包括麦克风1820的可延伸的部分可以位于设备中。当需要时,用户可以拉出该部分,并把其向他的嘴延伸。当其被拉出时,麦克风1820也可以被使用。
根据图18G和图18H示出的本发明的另一个实施例,包括麦克风1831的延伸部件1830可以是多部分的设备的一个部分。该部分可以用作所述设备的盖子。包括麦克风1831的部分自身可以是多个部分的,以便如所需是可延伸的和/或可调整的。
根据图18I示出的实施例,可以把如前所述的可延伸的麦克风1840安装在计算机或类似设备中。
并且,根据本发明的另一个实施例,可以把设备的麦克风系缚到用户的戒指上,或者其本身被做成象环的形状,并由所述用户佩戴。该麦克风可以无线地或通过导线与所述设备相连。当使用时,用户使其手靠近其嘴并说话。
可以理解,图中示出的设备作为例子被示出。可延伸的麦克风可以安装在任何设备中。其还可以安装在延伸部分上的任何位置上。
在通信设备中,包括麦克风的延伸部分可以被用作所述设备的天线。在这种情况下,天线可以作为所述的部分被制造,并且包括集成的麦克风。
必须注意,除了至少可延伸的麦克风之外,设备可以包括至少一个另外的常规麦克风,其中,所述麦克风可以单独使用,也可以与所述可延伸的麦克风同时使用。
必须注意,可以利用刚性材料制造包括麦克风的可延伸的部件,以便允许把麦克风定位在所需位置,而不需要用手对其进行保持。为了更好地操作,还可以通过半刚性或软性材料制造包括麦克风的部分。
必须注意,可以使用例如展开/折叠方法的任何延伸/缩回方法。
如前所述,本发明的集成的小键盘和/或鼠标和/或可延伸的麦克风可以被集成在例如PDA、TV的遥控器和多种其他的电子设备的各种电子设备内部。例如,通过使用TV的遥控器内的所述集成的小键盘和鼠标,用户可以在TV屏幕示出的与电影有关的图标上进行指点,并且通过使用所述遥控器的预定按键选择所述电影。
并且,如所述的,可以把所述集成的小键盘和/或鼠标和/或可延伸的麦克风制造为分开的设备,并与所述电子设备相连。
当然,可以把单独的所述小键盘或者与所述鼠标和/或可延伸的麦克风成为一体的所述小键盘与例如本发明的数据输入方法的数据和文本输入方法相结合。
图17示出了可以使用本发明的增强的小键盘、增强的鼠标、可延伸的麦克风和数据输入方法的一些电子设备。
电子设备可以包括至少一个或多个本发明的特征。电子设备可以例如包括如所述的本发明的所有特征。
通过有线电话的数据输入
前述的数据输入方法还可以用于有线电话和他们相应的网络。如所知道的,电话小键盘的每一个按键产生预定音调,其通过有线网络进行传送。存在分配给电话小键盘的12个按键的十二个预定音调。通过使用例如输入文本的用于数据输入的目的有线电话及其小键盘,可能存在产生另外的音调的需要。可以为每一个符号分配不同的音调,从而网络将根据分配给所述符号的所产生的音调对符号进行识别。
戴在手腕上的多部分的数据输入单元
图22a作为例子示出了如前所述的本发明的数据输入单元2201-2203的不同实施例。为了减小所述数据输入单元的尺寸,可以设置多部分的数据输入单元2202-2203,其可以具有如上所述的多部分的小键盘2212-2222。所述多部分的数据输入单元可以具有本发明的部分和全部特征。该数据输入单元还具有在本申请中所述的集成的数据输入系统。作为例子,数据输入单元2202包括显示器2213、天线2214(可以是可延伸的)、麦克风2215(可以是可延伸的)、集成在所述数据输入单元后面的鼠标(未示出)。
可以把本发明的数据输入单元的一个实施例带在手腕上。可以把该实施例集成在例如手表的戴在手腕上的设备内,或者例如腕表带的腕带上。所述数据输入单元可以具有本发明的集成的数据输入单元的部分或全部特征。这将允许具有系缚在用户的手腕上的小型数据输入单元。所述戴在手腕上的数据输入单元可以用作任何电子设备的数据输入单元。通过把戴在其手腕上的数据输入单元与所需电子设备相连,用户例如可以打开其寓所的房门、与TV进行交互、与计算机进行交互、拨电话号码等。相同的数据输入单元可以用于对不同的电子设备进行操作。出于这个目的,可以把访问密码(access code)分配给每一个电子设备。通过输入(例如通过所述数据输入单元)所需电子设备的访问密码,可以建立所述数据输入单元和所述电子设备之间的连接。
图22b示出了本发明的戴在手腕上的数据输入单元2290(例如具有多部分的小键盘2291的多部分的数据输入单元)的例子(处于打开状态),该单元与例如PDA2293的手持设备相连(无线地或者通过导线2292)。所述多部分的数据输入单元2290还可以包括另外的特征,例如在本申请中所述的部分或全部特征。在本例中,设置显示单元2294、天线2295、麦克风2296和鼠标2297。
可以理解,所述多部分的小键盘可以从戴在手腕上的设备/腕带2298上拆下。出于这个目的,可以提供本领域的技术人员所知的不同的拆卸/系缚方法。例如,如图23a所示,可以把用于包括所述数据输入设备的外壳2301设置在腕带2302内。图23b示出了处于打开状态的所述外壳2303。可拆卸的数据输入设备2304可以设置在所述外壳2301内部。图23c示出了处于打开状态2305和处于关闭状态2306的所述外壳。处于打开状态时(例如当使用所述数据输入单元时),所述数据输入单元的部件2311(例如小键盘的一部分和/或显示器等)的部分可以位于所述外壳的盖子2312内。
根据本发明的一个实施例,例如腕表2307的设备可以设置在相同腕带内与手腕相对的一侧内。例如,可以设置具有外壳的腕表带,以包容数据输入单元。所述腕表带可以被系缚到例如腕表、腕戴照相机等任何腕戴设备上。数据输入设备的外壳可以位于佩带者的手腕一侧2308上,而所述另一腕带设备的外壳可以位于所述佩带者的手腕的对侧2309上。为了把所述腕带系缚到例如腕带的设备上,可以提供传统的腕表带表带的系缚装置2310。
上述的腕带外壳还可以用于包容任何其他的腕戴设备。例如,除了包容数据输入单元之外,所述腕带外壳可以适于包容例如腕戴电话的多种电子设备。
使用本发明的腕戴数据输入单元时具有多种优点。例如,用户可以把电子设备放在其口袋中,并且所述电子设备的显示单元(可以是柔性的)放在其手中。通过所述腕戴数据输入单元,可以提供与所述电子设备的交互。在另一个例子中,本发明的腕戴数据输入单元可以用于操作电子新闻显示(关于电子新闻显示的PCT专利申请No.PCT/US00/29647,申请日是2000年10月27日,并入在此作为参考)。
因此,当对如应用到可选实施例的本发明的基本的新颖特征进行示出、描述、和指出时,将要理解的是,不背离本发明的精神,所公开的发明的形式和细节的多种省略和代替和变化可以通过本领域技术人员进行产生。要理解的是,附图不必按比例画出,而是,他们实际上仅仅是概念上的。例如,可以为所有按键设置单个的压力敏感系统(例如压力敏感垫)(例如在按键上面或下面的单个的较大的垫),而不是为小键盘的每个按键提供单独的压力系统。用户还可以通过不是其手指的其他方法与按键进行交互。例如,所述用户可以使用钢笔去按下按键。
本发明的数据输入方法还可以使用其他的数据输入方法。例如,所述符号还可以分配给例如用户的手指(或手指的部分)的其他对象,而不是把符号分配给小键盘的按键。在本申请中所提到的这些对象和数据输入方法早已在所并入的参考文献PCT专利申请No.PCT/US00/29647之中进行了详细的描述,其申请日是2000年10月27日。
可延伸的显示单元
根据本发明的一个实施例,可以在例如本发明的数据输入单元的电子设备内或者在移动电话内设置可延伸的显示单元。图24a示出了处于关闭状态的可延伸的显示单元2400。该显示单元可以由刚性和/或半刚性材料制成,并且可以例如通过相应的铰链2401折叠或展开、或者伸缩地延伸或缩回、或者具有允许其通过任何方法进行延伸和缩回的装置。
图24b示出了例如处于打开状态的具有本发明的所述可延伸的显示器2400的移动电话的移动计算设备2402。当打开时,所述可延伸的显示单元可以具有A4标准纸的宽度,从而在例如用户利用字处理程序写信或浏览网页时,允许所述用户看见文件的实际宽度尺寸,并工作在其上。
本发明的显示单元还可以由柔性材料制成。图25a示出了处于关闭状态的柔性显示单元2500。
可以理解,本发明的显示单元还可以在其另一侧(例如外侧)2505的至少一部分上显示信息。这是重要的,因为某些情况下,用户可能希望使用显示单元而不展开它。
图25b示出了具有本发明的柔性显示单元2500的电子设备2501,柔性显示单元2500处于打开状态。
通过使例如本发明的数据输入单元、移动电话、PDA等电子设备具有本发明的至少一个增强的特征,例如包括如前所述的电信装置的可延伸/不可延伸的显示单元、本发明的鼠标、可延伸的麦克风、可延伸的照相机、本发明的数据输入系统、语音识别系统、或在本申请中所描述的其他任何特征,可以对可由一个用户的手持有和操作的完整的数据输入/计算设备进行设置。这是非常重要的,因为象众所周知的那样,在移动环境计算/数据输入中,用户的至少一只手必须是自由的。
可延伸的照相机
如对于可延伸的麦克风所述的,电子设备还可以配备有可延伸的照相机。例如,对于组合了按键按下和唇读(不是用户的声音/语音,或除了用户的声音/语音之外)的本发明的数据输入系统,可以在相应的电子设备或数据输入单元中设置可延伸的照相机。
图26示出了配备有绕轴转动部分2601的移动计算设备2600。所述绕轴转动部分可以具有安装在例如其末端的照相机2602和/或麦克风2603。通过把照相机伸向用户的嘴,用户可以向照相机说话,并且在使用按键按下和口型相结合的本发明的数据输入期间,照相机可以传输例如用户的口型的图像。同时,用户能够看到其电话的显示器和小键盘,并且最终在对着照相机说话的同时,使用所述显示器和小键盘。当然,安装在可延伸的部分上的麦克风可以向数据输入系统的语音识别系统传送用户的语音。
可延伸的部分2601可以包括天线,或其自身就是电子设备的天线。
本发明的可延伸的麦克风和/或照相机可以可拆卸地系缚到例如移动电话或PDA的电子设备上。这是因为在很多情况下,电子设备(例如移动电话)的制造商不希望为了新的应用修改其硬件。
根据本发明的一个实施例,包括麦克风和/或照相机的外部绕轴转动的部分可以是可拆卸地系缚到相应的电子设备上的分开的单元。图27示出了处于拆开状态的可拆卸的单元2701和例如移动电话的电子设备2700。可拆卸的单元2701可以包括多个组件之一,包括但不限于麦克风2702、照相机2703、扬声器2704、光学读出器(reader)(未示出)或有必要靠近用户以便更好地与电子设备进行交互的其他组件。该单元还可以包括至少一个天线,或其本身是天线。该单元还可以包括系缚和/或连接装置2705,以便把单元2701系缚到电子设备2700上,并把单元2701上可用的组件与电子设备2700相连。为了系缚和连接的目的,系缚和连接装置2705可以适于使用在例如移动电话2700或计算机的电子设备中可用的端口2706,设置端口,用于例如麦克风、扬声器、照相机、天线等的外围组件的连接。可以理解,端口2706可以是例如麦克风插孔或USB端口、或在电子设备中可用的任何其他类似的连接装置的标准端口。在这种情况下,系缚/连接装置可以是例如标准连接装置,其插入电子设备中可用的相应端口。
可以理解,可以提供外部单元的系缚和/或连接装置,以便具有机械系缚功能或电/电子连接功能,或两者都具有。如图27a所示,例如,外部单元2701可以包括固定地位于外部单元上的插针2705,用于机械地将外部单元系缚到电子设备上。插针也可以用电/电子的方式把在单元2701内可用的麦克风组件2702与前面示出的电子设备相连。除了插针,外部单元可以包括例如USB连接器的另一个连接器2707,其通过导线2708连接到例如安装在外部单元2701内的照相机2703。在这种情况下,连接器2707可以仅仅以电的/电子的方式把单元2701连接到电子设备。
为了更好的机械系缚,通过外部单元的系缚和连接装置可以使用多于一个的端口。例如,系缚和连接装置可以包括两个系缚装置,例如固定的位于外部单元上的两个插针,其中第一个插针插入相应于例如外部麦克风的电子设备的第一端口,而第二个插针插入相应于例如外部扬声器的端口。
图27b示出了在系缚位置处的本发明的可拆卸的外部单元2701和电子设备2700。
在把外部单元2701系缚到电子设备2700之后(例如通过把插针2705插入相应的端口2706),用户可以通过在本申请中对可延伸的麦克风和照相机的如前所述的延伸和转动动作,在所需方向调整外部单元2701。再次必须注意,本发明的可拆卸的单元可以具有类似于如前所述的在本申请中对用于外部麦克风和照相机的本发明的可延伸部分的特性。例如,本发明的可拆卸的单元2701可以是具有至少两个部件2710-2711的多部分的,其中每个部分具有彼此相互和对于外部单元的例如绕轴转动、转动和延伸(伸缩、折叠/展开)的动作。可以使用系缚部分2712-2714用于这些目的。
如所述的可拆卸的单元允许把外部/外围组件添加给电子设备并使用它们,就象它们是原设备的一部分那样。其首先允许使用单元,而不把组件持在手中或把其系缚到用户的身体上(例如必须系缚到用户的耳朵上的耳机),以及其次,其允许把组件添加给电子设备,而不迫使电子设备(例如手机)的制造商修改他们的硬件。
本发明的数据输入方法也可以使用其他数据输入装置。例如,不是把符号分配到小键盘的按键,而是可以把所述符号分配给例如用户的手指(或手指的部分)的其他对象。同样,系统可以通过读出(识别其动作)用户的口型与按键按下相结合/不结合,而不是(或除了)声音/语音输入,对数据输入进行识别。用户可以按下小键盘的按键并讲出所述按键上的符号中所需的字母。通过识别讲出所述字母的用户的口型动作与所述按键按下相结合,系统可以容易地识别并输入所需的字母。
同样如上所述,在本申请中所描述的配置方法中给出的示例作为实例被示出。根据需要的数据输入单元可以考虑多种不同的配置和符号的分配。在该配置方法中的原理是根据例如使用频率、自然发音、非自然发音等不同因素定义不同的符号组,并对其进行分配,从而分配了其优先权等级。把最高优先权等级的组(发声或不发声)分配给最容易和最自然的按键交互(例如单次按压)。该组还包括最高级别的非口语符号。然后,把第二最高优先权分配给第二较容易的交互(例如两次按压)等。
继续参考前面所述的数据输入系统,把符号分配给小键盘的按键可以用这种形式产生,即,更加增强通过声音/语音或口型读出系统的识别。图28示出了小键盘2800,其中,以这种方式把具有接近发音的字母符号分配给所述小键盘的按键,即,避免它们之间的含混。如示出的,把具有接近发音的字母“c”和“d”、“j”和“k”、“m”和“n”、“v”和“t”分开并放置在不同按键上。这将帮助声音识别系统更容易地识别所述字母。例如,为了选择字母“c”,用户可以按下按键2801并说出“c”。为了选择字母“d”,用户可以按下按键2802并说出“d”。把具有接近发音的例如“b”和“p”、“t”和“d”、“f”和“s”的其他字母也分配给不同的按键。
把用于小型设备的嵌入式语音识别系统分配成使用尽可能少的存储器。分开具有类似发音的符号并把它们分配给不同的按键显著地简化了识别算法,导致更少的存储器的使用。
继续参考图28,如示出的,字母的配置被设置成这种方式,即,保持字母a-z处于连续的顺序(例如a,b,c......z)。以尽可能类似于标准的电话型小键盘的方式进行小键盘2800上符号配置。可以理解,当需要时可以改变这种顺序。
同样,分开类似的口型表达的符号可以帮助口型读出(口型识别)系统更容易地识别它们。例如,把字母“j”和“k”分配给不同的按键将显著地简化它们的识别。
可以理解,为了识别例如字母的口语符号,在说出所述字母的不同时间用户的口型的多于一个图象可以提供给口型识别/读出系统。
本发明的口型读出(识别)系统可以使用用于识别目的的任何图像产生和图像识别处理技术。例如,如上所述,当所述用户正在说出例如字母的符号并且正在小键盘上按下相应于所述符号的按键时,可以使用照相机接收用户的口型图像。也可以使用其他图像产生和/或图像截取技术。例如,当用户正在说出例如字母的符号并在小键盘上按下相应于所述符号的按键时,例如光或波的方式的投影仪和接收器可以被用于把所述方式投影到用户的口型(并最终是脸上)上,并接收回提供了用户的口型的数字图像(并最终是用户的脸)的所述方式,而不使用照相机。
结合按键按下和用户行为(例如,语音)的本发明的数据输入系统可以使用不同的行为(例如,语音)识别技术。例如,除了口型的动作之外,为了更好的识别语音,还可以对用户的舌头在用户的牙齿上的压下动作进行检测。
根据本发明的一个实施例,如图29所示,本发明的口型读出系统可以使用可移动的安装在用户的牙齿和/或嘴唇上的接触/压力敏感组件2900,而不使用(或除了)照相机。所述组件可以具有分布在其表面的传感器2903,用于检测在其任何部分上的压下动作,允许对用户的舌头和所述组件之间碰撞的大小、位置、压力测量等进行测量。所述组件可以具有两个部分。第一部分2901位于所述用户的两片嘴唇(上嘴唇和下嘴唇)之间,而第二部分2902位于用户的牙齿上(优选的,是上齿的前面)。系缚装置2904允许把所述组件系缚/固定在用户的牙齿上。
图29a示出了如前所述的敏感组件2910,以这种方式安装在用户的牙齿2919上,即,组件的一部分2911位于所述用户的上下嘴唇之间(在该图中,组件、用户的牙齿和舌头被示出在用户的身体外)。所述用户可以按下包括字母“abc”的小键盘2918的按键2913,并说出字母“b”。通过说出“b”,用户的嘴唇2914-2915压下嘴唇之间的所述感应部分2911。因为说出两个其他字母(例如字母“ab”)不需要嘴唇互相按压,所以系统识别出所需的字母是字母“b”。如果用户按下按键2913并发出字母“c”的音,则用户的舌头2916将轻微按压位于用户的上齿前面的组件的牙齿部分的内侧部分2912。因为所述按键上的其他字母(例如“bc”)不需要组件的所述部分上的所述按下操作,所以系统将识别出所需的符号是字母“c”。如果用户按下按键2913并说出字母“a”,则没有按下操作施加在所述组件上。则系统识别出所需字母是字母“a”。在另一个例子中,如果用户按下按键2917并说出字母“j”,则用户的舌头按压组件的牙齿部分的上部内侧。如果用户按下按键2917并说出字母“I”,则用户的舌头将几乎按压组件的牙齿部分的整个内侧部分。在这种情况下,分布在组件的牙齿部分的内侧部分的几乎整个传感器将被按压,而系统识别出所需的字母是字母“I”。
上述的口型读出/识别系统允许具有高准确度的间断和有效的数据输入方法。这种数据输入系统特别是被使用在例如军队、公安机关或情报机关的部门中。
下面是根据本发明的一个实施例,通过电话型小键盘的字母输入识别系统的例子:
必须注意,上述表格仅作为例子被示出,以示出通过说出所需的字母(当使用所述的硬件时)并按下相应的按键区别字母的方便性。应该理解,其他根据该系统的例如基于该系统的硬件上的按压时间的其他识别参数(例如当说出“g”或说出“h”时,两者都在同一按键上并可能具有类似的按下程度)可以由识别系统和本领域技术人员进行考虑。同样,由用户说出例如数字(例如0-9)的其他符号并对其进行识别可以由上述系统进行考虑。
此外,本发明的敏感组件可以无线地或借助导线连接到处理设备(例如蜂窝式电话)。如果被无线连接,组件可以包括传送器,用于传送按下信息。组件还可以包括电池电源,用于为其功能提供电源。
如上所述,本发明结合按键按下和语音,用于提高识别准确度。在一个实施例中,语法不进行工作,用于允许对只相应于按键按下的字母进行识别。
通常,在通过声音/语音的数据(例如文本)输入期间,麦克风/传感器(transducer)感知用户的声音/语音,并把其传送到所需的电子设备的处理器,用于通过声音/语音识别系统进行识别处理。对于通过声音/语音识别系统进行有效的语音到数据/文本的转化的巨大障碍(特别是,在移动环境中),是输入的音频质量较差,所述较差的质量由外部噪音引起。必须注意,麦克风不加区别的“听”每件事。
研究人员已经进行许多努力,用于从所需音频区别和消除外部噪音。至今为止,这些努力已能够仅仅部分地减少外部噪音,但仍然要做大量工作,以获得可接受的结果。不幸的是,目前的噪音消除/减少技术同时也降低了所需音频的质量,使所述音频不适合由声音/语音识别系统进行识别。
为了在通过声音/语音输入的数据输入电子设备期间减少(或甚至完全消除)外部噪音,而不降低所述声音/语音输入的质量,可以提供位于用户耳朵内的与耳朵结合的麦克风/传感器单元。即使用户小声说话或耳语,所述麦克风/传感器也可以允许用户的声音/语音更好的接收质量。
众所周知,当人们说话时,由所述语音引起并相应于所述语音的骨骼振动被传导到耳朵,在内耳和耳廓中引起相应于所述语音的空气振动。
根据一种方法,由位于耳朵中的与耳朵结合的麦克风感知所述空气振动,优选的,麦克风在耳廓中。根据另一种方法,所述耳骨振动其自身可以通过位于耳内与耳朵结合的传感器从内耳感知。
图30示出了麦克风/传感器单元3000,其被设计成处于这种方式,即,以麦克风/传感器组件3001位于用户的耳朵内(优选的,是用户的耳廓)的方式与用户的耳朵结合。
优选的,除了麦克风/传感器组件3001之外,所述单元3000还可以具有密封的隔离装置3002,其中,当所述麦克风3001安装在用户的耳中时(优选的,在用户的耳廓中),所述密封隔离装置3002可以把所述麦克风从外部(耳朵)环境噪音隔离开,以允许所述麦克风3001只感知在耳内形成的用户的声音/语音。对于声音/语音识别系统是主要问题的外部噪音将显著地减少或者甚至将完全消除。
用户可以如所需的调整密封隔离的程度。例如,为了消去耳廓内的语音回声,可以通过从所述用户的耳廓轻微的拔出所述麦克风单元,所述麦克风从外耳环境较少隔离。麦克风单元也具有成为一体的隔离/不隔离程度装置。
可以借助导线3003、或借助无线通信系统把所述麦克风/传感器3001连接到相应的电子设备。无线通信系统可以是例如蓝牙、红外、射频(RF)等任何类型。
在声音/语音-到-数据(例如文本)输入系统使用结合了按键按下和相应的语音、现在被命名为按键-和-说话(KIKS)技术的本发明的数据输入系统期间,上述与耳朵结合的麦克风/传感器可以用于感知用户的声音/语音。通过按下按键并说出分配给所述按键的所需符号(例如字母),如上所述,声音/语音识别系统努力把所述语音匹配到分配给所述按键的几个符号的语音模式之一。在这种情况下,即使与耳朵结合的麦克风/传感器具有比标准麦克风更低质量的音频感知,由所述与耳朵结合的麦克风/传感器感知的口语符号的质量将仍然足以使声音/语音识别系统在该按键上所述几个符号中容易地识别口语符号。
根据本发明的一个实施例,如图31所示,可以提供与耳朵结合的麦克风3100,并且其连接到例如移动电话3102的移动电子设备。如图所示,以下面的方式设计麦克风3101,即,其位于用户的耳廓内,并当所述用户说话时,对用户的耳朵中产生的用户的声音/语音振动进行感知。然后,借助导线3103、或无线地把所述语音传送到所述移动电话3102。
通过被安置在用户的耳朵内并具有密封隔离装置3104,所述麦克风3101将只感知用户的声音/语音。对声音/语音识别系统是主要问题的外部噪音将显著地减少或甚至完全消除。如上所述,可以自动的或通过用户调整隔离程度。
例如,当用户按下按键3105并说出位于该按键上的字母“k”时,所述语音在用户耳朵中的振动可以通过所述与耳朵结合的传感器/麦克风进行感知,并被传送到所需电子设备。本发明的声音/语音识别系统必须把所述语音与位于所述按键上几个符号(例如,在该示例中,“J、K、L、5”)的已经存储的语音模式进行匹配。即使所述语音的质量不够好(例如,因为用户低声说话),所述语音能够容易地与所需的字母的存储模式进行匹配。
正如刚刚提到的,本系统的另一个优点是用户可以低声说话或者甚至耳语。因为一方面,麦克风安装在用户的耳朵中,并直接感知用户的声音而不被外部噪音打断,以及另一方面,即使用户低声说话、耳语,识别系统仍努力把口语符号与仅有的几个选择进行匹配,所以,用户的声音质量将仍然足够好,以供声音/语音识别系统使用。因为相同的原因,识别系统可以是独立于用户的。当然,利用用户的声音对系统进行训练(例如扬声器依赖(dependent)方法)将更使识别系统具有更好的识别准确度级别。
除了麦克风/传感器之外,与耳朵结合的单元也包括位于麦克风/传感器外部的扬声器,并且,其同样与用户的耳朵成为一体,用于收听的目的。
根据本发明的一个实施例,如图32所示,以麦克风3201安装在用户的第一个耳朵(如上所述)上、以及扬声器3202安装在用户的第二个耳朵上的方式,能够提供与耳朵结合的麦克风和扬声器3200。
上述说明不应解释成为限制本发明的范围,而仅仅描述了本发明的一些优选实施例。许多变化可以在本发明范围内进行考虑。例如,在图32的与耳朵结合的单元的示例中,可以把麦克风和扬声器组件两者提供给两个耳朵。在另一个实施例中,当所述与耳朵结合的单元无线连接到相应的电子设备时,在所述与耳朵结合的单元内可以提供电池电源。同样,为了获得更好的语音接收质量,本发明的与耳朵结合的麦克风单元也包括至少一个位于耳朵外(例如在传送线上)的其他的标准麦克风。耳朵内的麦克风与耳朵外的麦克风相结合可以为本发明的声音/语音识别系统提供更多的音频信号信息。还必须注意,本发明的数据输入系统可以使用利用任何技术的麦克风或传感器,用于接收耳朵内的语音振动。
如上所述,把按键按下和语音相结合(例如根据用户的语音或口型动作)的一般数据输入方法已在PCT申请PCT/US00/29647中进行描述,申请日是2000年10月27日。
如在所述申请中所描述的,通过按下按键以及说出或不说出所需符号,例如分配给所述按键的符号组中的字符,可以对所述所需的符号进行选择。例如,为了通过标准电话型小键盘3300输入单词“morning”(参见图33),用户可以:
-按下按键3308并说出‘m’;
-按下按键3308并说出‘o’;
-按下按键3306并说出‘r’;
-按下按键3308并说出‘n’;
-按下按键3303并说出‘i’;
-按下按键3308并说出‘n’;
-按下按键3303并说出‘g’。
通过逐字母(或逐符号)地说出单词,并按下相应的按键,可以输入所述单词。
在PCT/US00/29647中描述的数据输入系统可以允许具有减少的按键数量的键盘(例如电话小键盘)起到全尺寸PC键盘的作用(例如,一个符号对应一种按下动作)。
·逐单词数据输入系统
为了增强上述数据输入系统,一种单词级的数据输入系统已经在所述PCT申请中被提出。在所述申请中,对通过说出所述单词并按下相应于构成所述单词的字母的按键使用户能够输入单词进行了描述。
在语言中,每个单词的语音可以由音素集构成,其中,所述音素集包括一个或多个音素。图34示出了单词词典3400的例子,其中,对于每个输入(例如单词)3401,其字符集(例如其相应的字符串)3402、相关的按键按下值3403(例如,使用例如在图33中示出的电话小键盘)、相应于所述单词的音素集3404以及所述音素集的语音模型3405(最终由声音/语音识别系统使用)被示出。
根据一种声音(例如语音)识别的方法,当用户说出单词时,可以把他的语音与存储的语音模型进行比较,并且通过系统将对一个或多个最佳匹配模式进行选择。根据另一种语音识别的方法,例如,当用户说出单词时,基于构成所述语音的音素集的识别,对其语音进行识别。
然后,相应于所述所选择的语音模型或音素集的单词(例如字符集)通过系统被选择。如果选择包括一个单词,则所述单词可成为最终的选择。如果选择包括多于一个单词,则可以把所述单词显示给用户(例如在显示器显示出的列表中),并且用户可以通过例如按下“select”按键对其中之一进行选择。
基于单词语音的单词识别的上述方法只作为例子被描述。可以理解,通过本领域技术人员可以考虑通过语音进行识别的其他方法。
只基于其语音对单词进行识别不是准确的系统。对此存在多个原因。例如,许多单词具有大致类似或含混的发音。同样,例如外部噪音的因素可以在单词级数据输入系统中引起含混。通过声音输入任意的单词需要复杂的软件,需要考虑例如口音、声音变形、用户用意或噪音影响的多种参数。由于这些原因,语音识别系统基于短语的识别,其中,例如,可以根据所述短语的上下文在短语中对具有类似发音的单词的含混进行消除。基于短语的识别的语音识别系统同样需要大量的存储器和CPU使用,至此,这使他们不可能集成在例如移动电话的小设备中。
由本发明人发明的、以及在不同的PCT和美国专利申请中被描述的按键和语音技术可以解决上述问题。除了/结合如在所述申请中描述的字符输入系统的字符,本发明的单词级数据输入技术可以为用户提供带有自然快速(逐单词)的文本/数据输入系统的小型/移动/固定设备。
如所述的,在PCT申请PCT/US00/29647中,以及描述了用户说出单词,同时按下相应于构成所述单词的字母的按键。还提到,为此目的可以使用单词词典数据库。根据这些并参考图33,作为示例,当用户说出单词“card”并按下相应的按键(例如电话型小键盘的按键3302、3302、3306、3309)时,系统可以从词典数据库(例如在图34中示出的数据库)选择相应于所述按键按下的单词。在该例中,按键按下的相同组也对应于例如“care”、“bare”、“base”、“cape”和“case”的其他单词。然后,系统可以对用户的语音(该单词的)与相应于相同按键按下的所述单词的语音(存储模型或音素集)进行比较,并且,如果其中之一与所述用户的语音相匹配,则系统选择所述单词。如果所述单词没有语音与用户的语音相匹配,那么系统可以在所述单词中,选择其语音与所述用户的语音最匹配的单词(或多个单词)。
根据这种方法,识别系统将从仅有的几个候选(例如,在上面的例子中是6个单词)中选择单词。作为结果,识别变得容易,并且语音识别系统的准确性显著提高时,这允许以高准确度进行一般单词级的文本输入。同样必须注意,说出单词同时对其进行输入是人们熟悉的行为。
根据本发明另一个实施例,为了输入单词,用户可以按下相应于所述单词的至少一部分字符的几个(例如一个、两个,并且如果需要,更多个)按键,(优选的,开始)并且(优选的,同时)说出所述单词。根据所述按键按下和所述语音,系统可以识别所需单词。为此目的,根据一种方法,例如,系统可以首先选择词典数据库的单词,其中,所述单词的相应的部分字符对应于所述按键按下,并对所述所选择的单词的语音与用户的语音进行对比。然后,该系统选择一个或多个单词,其中,它们的语音最匹配所述用户的语音。根据相应于所述单词的至少开始字符的至少几个按键按下,对存在于单词数据库的词典中的单词进行选择,显著的减少与用户的语音进行比较的所述选择单词的数量。这使输入所需单词的高准确度成为可能。根据另一种方法,例如,系统可以首先选择其语音最匹配所述用户的语音的词典的单词。然后,系统可以通过所述用户的相应的按键按下对所述单词的至少开始字符(构成所述单词的字符集的)进行确定(确定他们属于哪个按键按下),以便最终选择与所述用户的按键按下相匹配的字符集。
在上述实施例中,如果选择包括一个单词,则所述单词可以成为最终的选择。如果选择包括多于一个的单词,则把所述单词显示给用户(例如在显示器显示的列表中),用户可以通过例如按下“select”按键对它们的其中之一进行选择。可以理解,通过按键按下和语音的结合、以及通过刚刚描述的系统对相应的单词进行选择的输入单词的系统作为例子被示出。很明显,为了相同的目的,通过本领域技术人员可以理解并考虑基于本发明的数据输入系统的原理的其他系统。
说出单词并按下相应于构成所述单词的至少一部分的字符的按键、并把所述按键按下与相应于单词词典中单词的字母的按键按下进行比较的上述方法需要使用大量的存储器。已经存储了语言中可用的所有单词的音素集/语音(例如模式)、相应于一种或多种语言中可用的所述单词的字符串的数据库、并且还具有相应于在所述词典数据库中可用的所述单词的按键按下的数据库,需要大量的存储器。
同样,如在以前申请中所描述的,根据本发明的数据输入系统,例如标点符号的符号可以分配给小键盘的按键,并通过按下所述按键而不说出语音,进行默认的输入。在如前述的本发明的单词级数据输入系统中,用户可以在输入所有的单词相应的按键按下结束前,说完该单词。由于不被用户的语音所覆盖的最后的按键按下可能被认为是所述默认字符,这可能使识别系统迷惑。存在许多解决方案克服该问题。例如,用户可以首先说出单词,并接着按下相应的按键。这将向系统指出,在语音之后会产生相应于所述语音的一系列按键按下。
在另一个例子中,通过例如按下模式按键的预定动作,系统可以退出文本模式并进入例如标点/函数模式的另一种模式(例如特殊字符模式)。根据这个例子,在所述文本模式中,当相应于最后的语音时,系统可以考虑所有按键按下。当系统处于特殊字符模式时,通过按下按键,可以在单词的末尾(或任何其他位置)输入例如标点符号的符号,同样向系统指出所述单词的末尾。
如在所述PCT申请中所解释的那样,可以把例如标点符号、空格字符、或功能的至少一个特殊符号分配给小键盘的按键。通过单次按下所述小键盘的按键而不说话,通过所述按键输入例如标点符号的符号。在相同的按键上双次按下而不说话可以提供分配给所述按键的另一个符号(例如标点符号)。
·基于子语音(sub-speeches)的数据输入系统
必须考虑,当用户说出单词同时按下对其进行输入时,客户很自然地根据例如所述语音的音节把所述单词的所述语音分成一个或多个子语音部分(例如,当客户输入相应于每个子语音的字母)。例如,当使用例如小键盘的键盘输入单词“morning”时,用户可以很自然地首先说出第一个子语音“mor”,并且/同时其按下相应的按键。然后,用户可以发出随后的子语音“ning”的音,并敲击相应的按键。为了方便示出,在本申请中,单词“子语音”被用于表示单词的语音的一部分语音。例如,可以用两个子语音“per”和“haps”说出单词“perhaps”。还例如,以单个的子语音“pet”说出单词“pet”。
还例如,为了输入单词“playing”,用户输入相应于字母“pla”的按键时,可以首先发出相应于第一音节(例如“ple”)的音素的音,并接着,在输入字符集“ying”时,发出相应于第二音节(例如“ying”)的音素的音。
必须注意,一个用户可能把单词分为与另一个用户所不同的部分。因此,子语音和相应的按键按下对于每个部分可能是不同的。在通过所述用户完成所述单词的所有部分的数据(例如按键按下和子语音)输入之后,最终结果将是类似的。
在上述例子中,所述另一个用户可能发出如“pla”的第一部分的音,并按下相应的字符集“play”的按键。接着,他可以说出“ing”,并按下相应于字符串“ing”的按键。还例如,第三个用户可以通过3个子语音序列和按键按下对单词“playing”进行输入。当敲击相应的按键时,所述用户可以说出“ple”、“yin”和“g”(例如,拼写字符“g”或发出相应的声音)。可以理解,以语音和按键按下的不同序列对单词进行划分的最自然方式是每个语音序列对应于所述单词的音节。因此,必须注意,即使在本申请的许多段落中,我们也把音节作为单词的一部分/一节,本发明的数据输入系统可以应用于以一个或多个部分划分单词的任何形式。
根据上述原理,例如,可以通过两个部分(例如音节)“tri”和“ing”发出单词“trying”的音。还例如,可以对单词“playground”进行划分,并以两个部分(例如,根据它的两个音节)“pla”和“ground”进行输入(例如,在本申请的许多段落中,音素(例如语音声音)由根据韦氏(Webster’s)词典的相应的字符被示出)。
如在上面的例子所示出的那样,在一种(或多种)语言中,不同单词的部分语音可以具有类似的发音(例如由相同的音素集组成)。例如,单词“trying”和“playing”在它们的语音中具有共同的子语音部分“ing”(或“ying”)。
根据上述原理,可以产生一种数据输入方法,其中,通过对相应于单词的子语音的预定音素/语音模式集进行考虑/记录、并对相应于分配给相应的音素/语音模式集的字符集(character-set)的按键按下的至少一部分进行考虑,在本发明的按下和说话数据输入系统中整个单词的识别可以成为有效的。图35示出了相应于整个单词词典3502的子语音的音素集(例如音素的集)的示例性词典3501,和相应于所述音素集词典3501的音素集的字符集的词典3503,还包括相应于所述字符集的词典3503的按键按下值的词典(根据电话小键盘)3504,字符集的词典3503相应于所述音素集的词典3501。根据本发明的不同的实施例,由本发明的数据输入系统可以使用一个或多个这些数据库。
因为在许多情况下,相同的音素集(或子语音模式)可以被用于识别不同的单词(在它们的语音中具有相同的子语音发音),更少的存储的音素集/语音模式被需要用于识别在一个或多个单词词典内可用的整个单词,减少了所需的存储器容量。这将导致把减少数量的音素集/字符集分配给例如电话型小键盘的键盘的相应的按键,并将显著地提高语音识别系统(例如任意文本输入)的准确度。
图36示出了具有类似的语音部分3602的英语单词3601的示例性例子。如图所示,四个短音素集3602可以产生至少七个完整单词3601的语音。可以理解,所述音素集3602也可以表示英语或其他语言中许多其他单词的部分语音。
基于上述原理,可以提供自然按下和语音数据输入系统,该系统通过具有有限的存储容量(例如移动电话、PDA)和有限数量的按键(例如电话小键盘)的移动设备,使用减少数量的音素集来输入任何单词(例如普通命令、任意文本输入)。该系统还可以通过例如使用用于例如个人计算机的固定设备的PC键盘,对数据输入进行增强。在这种情况下,(因为PC键盘具有更多的按键),仍旧把减少数量的音素集分配给每个按键,提高语音识别系统的准确度。后面将描述本发明的不同的详细实施例。
所有按键-至少部分音素
根据本发明的一个实施例,用户可以把单词的语音划分为不同的子语音,其中每个子语音可以由相应于字符串(例如字符集)的音素集进行表示,该字符串构成所述单词的相应部分。通过说出每个音素集以及/同时按下相应于字母的按键并对所有的(或至少部分)所述子语音重复(按顺序,从开始到最后)该过程,可以输入所述整个单词(例如以字符串的形式),其中所述字母相应于所述音素集/字符集。
如图33所示,例如,字母“t”位于小键盘3300的按键3301上。对于所述按键,可以分配例如“tē”、“ti”、“ta”、“to”等不同的音素集(在该例中,所述音素集相应于以所述字母“t”开始的字符集),和/或相应的语音模式(参见图37的表格)。发出“tē”的音可以对应于例如“tea”、“tee”或者甚至“the”(例如,如果用户不是美国/英国本地人)的不同的字母集。作为一个例子,为了产生单词“teabag”,用户可以按下“t”按键3301并说出“tē”,并继续按下相应于剩余的字母“ea”的剩余按键。根据一种方法,系统可以对用户的语音与分配给首先按下的按键(在该示例中,“t”按键3301)的语音(例如模式)或音素集进行比较。在把所述用户的语音与分配给所述按键的一个(或多个)所述音素集/语音模式进行匹配之后,系统选择一个或多个分配给所述音素集/语音模式的字符集。如上所述,在该例中,相同的语音可以对应于两个不同的字符集,一个相应于字母“tea”(例如按键按下值832),而另一个相应于字母“tee”(例如按键按下值833)。系统对由用户按下的按键(例如按键值)与相应于所选择的字符集的按键按下(例如按键值)进行比较,并且,如果它们其中之一与用户按键按下相匹配,则系统对其进行选择,以便最终进行输入/输出。在该例中,字母“tea”可以是这个阶段的最终选择。例如空格按键按下的终点(例如单词的末尾)信号可以通知系统:对于当前的完整单词而言,按键按下和语音已经结束。
必须注意,优选的,表示字符串(例如tac)的音素集(例如“tak”)可以分配给另一音素(例如“t”)的相同按键,表示所述字符串的第一个字符(例如“t”)被分配。同样,优选的,由字母串(例如“th”)表示、并表示字符串(例如“th”)的单个音素(例如“th”)可以分配给另一个音素(例如“t”)的相同按键,表示所述字符串的第一个字符(例如“t”)被分配。
在上述的例子中,所述选择不是最终的(例如,所以用户不提供所述终点)。用户可以按下相应于字母“b”(例如,在单词中后面音节的第一个字符)的按键3302并说出“bag”,并继续按下相应于剩余字母“ag”的剩余按键。系统象上面那样处理,并选择相应的字符集“bag”。现在,用户通过例如按下空格键给出单词末尾的信号。
通过说出“tē”并按下按键3301、3309、3302(例如按键值“8,3,1”),以及接着说出“bag”并按下按键3302、3302、3303(例如按键值“1,1,4”),可以产生单词“teabag”。如所注意到的,通过语音和按键按下产生单词“teabag”,而不在存储器中具有完整的语音模式/音素集。事实上,单词“teabag”的语音模式/音素集通过在存储器中可用的两个其他子语音模式/音素集(例如“tē”和“bag”)产生,每个表示完整单词“teabag”的所述音素模式/音素集的一部分,并一起产生所述完整的语音模式/音素集。可以使用“tē”或“bag”的语音模式/音素集,分别作为例如“teaming”或“Baggage”的其他单词的部分语音模式/音素集。
虽然在该实施例中,识别准确度是非常高的,还可能发生有时最终的选择是错误的单词,其在词典数据库中不存在的情况。因为这个原因,根据本发明的一个实施例,在输入/输出所述单词之前,系统可以对最终的选择和所需语言的单词词典的单词进行比较。如果所述选择与所述词典中的单词不匹配,可以拒绝该选择。
同样,根据一种方法,当按下单词的部分相应的按键并说出它时,在所述输入中,用户以他的语音覆盖所述相应的按键按下的方式说出该单词。这将具有以下优点,即,在每个时刻用户的语音对应于同时被按下的按键,从而使所述语音的识别更容易。另一方面,在单词输入的末尾,用户可以按下任何按键而不说话。这可以通知系统,单词被完整地输入了(例如,按下按键而不说话可以被分配给例如标点符号、PC功能等的字符)。这种情况已在PCT申请中解释过,该PCT申请已由本发明人提交。
在上述的识别过程完成之后,根据一个实施例,如果所选择的输出包括多于一个的单词,则可以把所述单词显示给用户(例如在显示器显示的列表中),并且用户可以通过例如按下“select”按键对它们其中之一进行选择。
必须注意,在某些情况下,在本发明的按下和说话数据输入系统中,对单词的一个或多个子语音(优选的,在所述子语音的开始处的那些)的部分音素进行识别可能足以识别相应的单词。
根据本发明的一个实施例,不考虑相应于单词的子语音的所有音素,而可以只考虑几个音素(优选的,所述子语音开始的那些),并且优选的,把其分配给相应于字符集的首字母的按键,该字符集相应于所述音素集。通过本发明的按下和说话数据输入系统,所述音素集可以用作识别目的。根据这种方法,可以显著地减少用于识别许多完整单词所需要的语音模式/音素集的数量。在这种情况下,对例如小键盘的键盘的每个按键而言,通过声音/语音识别系统将分配仅仅几个音素集,从而使所述音素集的识别更容易。
通过使用语音识别系统,为了单词的每个子语音(优选的,第一个子语音)的所有/几个(优选的,开始)字符的确定,连同对相应于所述单词的所有字符的所有按键按下的考虑,通过本发明的数据输入系统可以识别语言中的单词。
如上所述,优选的,根据语言中单词的子语音,可以对不同的音素集(或语音模式)进行考虑和存储。每个所述音素集可以对应于在所述单词内任何位置的单词的一部分。每个所述音素集可以对应于具有类似的/大致类似的发音的一个或多个字符集(例如串)。根据它们相应的字符集的第一个字符,把所述音素集分配给按键。例如,表示字符集“tee”和“tea”的音素集“tē”可以被分配给按键3301,音素集“tē”也表示字母“t”。如果音素集表示每个以不同字母开始的两个字符串,则可以把所述音素集分配给两个不同的按键,每个按键表示所述字符串之一的首字母。例如,为了增强本发明的声音识别系统的准确度,可以把具有大致类似发音的字符集“and”和“hand”分配给音素集“and”。在这种情况下,可以把所述音素集分配给分别表示字母“a”和“h”的两个不同的按键3302和3303。可以理解,当按下按键3302并说出“hand”时,优选的,相应的字符集将是“and”,以及,当按下按键3303并说出“hand”时,优选的,相应的字符集将是“hand”。
图37示出了可能出现在以字母“t”开始的单词的音节的开始(或其他任何位置)处的一些音素集的示例性表格。表格的最后一行还示出了对于字母“i”的音素集和相关字符集的其他例子。
虽然可以考虑、模拟、和存储具有更多音素的音素集(例如,例如taps、tāke、tāst等更长的音素集),以便帮助单词的识别,在本实施例中,其中,用户大致按下相应于单词的字母的所有按键,通过结合声音/语音识别并且还使用如图35所示的单词数据库和相关的数据库(例如按键按下值),确定/识别所述单词一个或多个部分(例如音节)的少数开始字符,可能足以产生所述单词。很明显,当需要时,为了更好地识别和消除含混,也使用更长的音素集。
例如,通过考虑图33并使用图37的表格,为了产生单词“title”,用户可以按下相应于字母“t”的按键3301并说出“ti”,并接着按下相应于剩余字母“itle”的剩余按键。在单词的末尾,用户可以按下例如空格键的单词结束键。如所述表格所示出的,把例如“ti、ty、tie”的字符集分配给音素集“ti”。很明显,第一个字母“t”被选择。因为按下按键3303(例如,“y”在按键3304上),第二个字母将是“i”。接下来按下的按键是与字母“t”相关的按键3301。在这种情况下,字符键“tie”的可能性被排除。所以“ti”将是确定的选择。系统现在考虑“ti”以及剩余的按键按下(值)8(例如“t,u,v”)、5(例如“g,h,i”)和3(例如“d,e,f”)。把这些输入与具有相应的按键按下数据库的单词词典进行比较,可以显示出相应于这些输入的单词是唯一单词是单词“title”。然后,系统选择单词“title”。
为了更好地识别,当按下相应的按键时,用户可以说出多于一个的单词的子语音。在这种情况下,系统可以通过语音考虑所述输入,以便更好地识别相应于所述多于一个的所述字符的子语音的字符。
在几乎每种情况下,通过由键盘/小键盘输入单词(具有一个或多个部分/音节),并部分/整个地说出所述单词,结合相应于所述单词的剩余字符的按键按下,由语音识别系统(通过相应的按键按下的确定进行帮助的)对所述单词的至少一个所述部分/音节(优选的,第一部分/音节)的少数开始字符的识别,将产生所述单词。
在另一个例子中,为了输入包括两个子语音/音节“tā”和“ken”的单词“taken”,当输入第一个字符“t”(按键3301)时,用户说出“tā”并接着按下相应于第一个音节的剩余字符的剩余按键(例如“a”)。然后,用户很自然地进行到下一个音节,并说出“ken”,同时按下相应于字母“k”的按键3305,并继续按下相应于字母“en”的所述下面的音节的剩余按键。然后,他可以按下例如空格键,以便通知系统数据输入结束。
在完成上述的识别过程之后,如果所选择的输出包括多于一个的单词,则可以把所述单词显示给用户(例如在显示器显示的列表中),然后,用户可以通过例如按下“select”按键,对它们其中之一进行选择。
快捷键:与至少部分音素相结合的较少的按键按下
具备带有有限数量的按键的小键盘的小型移动电子设备已经在世界范围内广泛使用。用户通过使用一只手的手指(例如拇指、食指)按下所述小键盘的按键。甚至在上述数据输入系统中,其中,通过在相应的按键上的单次按下动作输入每个符号,数据输入速度慢于使用PC键盘的数据输入速度,在PC键盘中,用户经常使用两只手的手指按下键盘的按键。
为了增强本发明的数据输入系统并允许更快的数据(例如文本)输入,在PCT申请PCT/US00/29647中已经提出宏级别的数据/文本输入系统。在所述PCT申请中提到,能够把宏(例如字母/字符串)分配给小键盘的按键,并由结合/不结合声音/语音的单次按下动作进行输入。通过把单词的字符的至少一部分分配给单次的按键按下,可以通过少数按键按下输入整个单词。通过把本方法应用到本发明的按下和说话数据输入方法中,可以提供用于移动环境/小型设备的快速数据输入。在该方法中,按键按下的次数通常少于单词的字符数(除了单个字符和一些例如词典外的单词,它们可能需要通过字符输入的字符)。
如上所述,可能把相应于一种或多种语言的单词的语音的至少一部分(包括一个或更多个音节)的音素集分配给小键盘上不同的预定按键。同样,如上所述,每个所述音素集可以表示语言中的至少一个字符集。如上所述,优选的,把表示例如字母(例如字符集)的字符串的音素集分配给与表示所述字符串的首字符的另一个音素被分配给的相同的按键。
根据本发明的优选实施例,优选的,用户可以按下相应于单词的首字母部分的按键,并且优选的,同时说出所述相应的部分。为此,用户可以把单词划分为不同部分(例如,根据例如所述单词的语音的音节)。在本申请中,说出单词的每个部分/音节被称为“子语音”。可以理解,相应于所述单词的所述所划分的部分的音素集(和它们相应的字符集)必须在本系统中是可用的。
根据这个实施例,例如,为了输入单词“tiptop”,其可以被划分为两个子语音(例如在本实施例中,根据它的音节)“tip”和“top”,用户可能首先按下按键3301(例如把音素/字母“t”分配给所述按键)并(优选的,同时)说出“tip”(例如单词“tiptop”的第一个子语音),然后,他可以按下按键3301并(优选的,同时)说出“top”(例如单词“tiptop”的第二个子语音)。使用图37中的示例性表格,把字符集“tip”分配给音素集“tip”和按键3301上的字母“t”。当用户按下按键3301并说出“tip”时,系统对用户的语音和分配给按键3301的所有音素集/语音模式进行比较。在选择最匹配所述用户的语音的一个(或多个)所述音素集/模式之后,系统对分配给所述所选择的音素集的字符集进行选择。在当前例子中,把唯一一个字符集(例如tip)分配给音素集“tip”。然后,系统以相同方式进行到单词的下一个部分(例如子语音),诸如此类。在本例中,字符集“top”是分配给音素集“top”的唯一字符集。系统选择所述字符集。根据本发明的一个实施例,在对相应于单词的所有子语音/音素集的所有字符集进行选择之后,系统可以接着对提供不同字符集/串的所述字符集(例如在下一个段落中描述的组合过程的例子)进行结合。然后,系统对每个所述字符集与存储器中可用的单词数据库的词典的单词进行比较。例如,在选择了最匹配所述字符集之一的词典的一个单词之后,系统可以选择所述单词作为最终的选择。在该例中,在输入第二个部分/音节之后,用户按下例如空格键或另一个按键,而不通知系统单词已经被完全输入(例如,按下按键而不发声可以被分配给例如标点符号、PC功能等字符)。这个问题已在由本发明人已提交的PCT申请中解释过。系统对字符集“tip”和“top”进行组合,并产生字符集“tiptop”。如果需要,系统接着对所述字符集和在系统的单词数据库的词典(例如英语词典)中的单词进行比较,并且如果所述单词之一匹配所述字符集,则系统输入/输出所述单词。在该示例中,单词“tiptop”存在于系统的英语词典中。最终,所述单词被输入/输出。
图38示出了本实施例的所选择的字符集组合方法。例如,当用户通过使用本发明的实施例,试图以三个序列输入单词“envelope”时,系统为每个部分选择1到2个字符集3801。如图39所示,然后,系统可以根据它们在所述单词中的各自的位置,对所述字符集进行组合,提供不同的字符集3802。所述字符集3802将与系统的单词词典的单词进行比较,并最终选择和输入匹配一个或多个所述单词的字符集。在本示例中,字符集3803(例如“envelope”)是匹配所述词典中的单词的唯一字符集。所述单词被最终选择。
如上所述,在一些情况下,语音识别系统为单词的所有/部分(例如音节)语音选择多于一个音素集/语音模式。例如,根据本发明的实施例,如果具有“糟糕”口音的用户试图输入单词“teabag”,他首先按下按键3301并同时说出“tē”。系统可能不确定用户说的是“tē”还是“thē”,它们被分配给所述按键。在这种情况下,系统可以选择相应于两个音素集的不同的字符集。然后,用户通过使用相同的过程输入单词的第二部分。在该示例中,通过系统选择唯一一个字符集“bag”。用户最后按下空格键。然后,系统可以对所述字符集进行组合(以不同的排列),以产生不同的字符集,并对每个所述字符集和单词数据库的词典的单词进行比较。在该示例中,可能的字符集可以是:
-“teebag”
-“teabag”
-“thebag”
在例如英语语言中匹配单词词典中的单词的唯一字符集是单词“teabag”。该单词可以被认为是最终的选择。
如刚刚描述的,可能会发生系统为单词的每个/一些音素集选择多于一个字符集的情况。在这种情况下,可以对多于一个字符集进行组合。因此,有可能,词典的多于一个的单词可以匹配所述字符集。在这种情况下,把所述单词显示给用户(例如在显示器显示的列表中)并且用户可以通过例如“select”按键选择它们其中之一。同样,如果系统包括足够的内存并具有足够的处理速度,根据例如上下文中相应的短语,可以使用语音识别系统对所述单词之一进行选择。
如果单词/单词的一部分包括多个音素,而它的语音包括单一音节,根据一种方法,把包括/考虑所述单词/单词的一部分的所有所述音素的音素集/模式分配给所述单词。例如,为了输入单词“thirst”,把由所述单词的所有音素构成的音素集分配给所述单词以及字母“t”(的键)(例如位于/分配给按键3301)。例如,用户按下按键3301并说出“thirst”。正如上面解释的,系统选择单词的子语音(在本示例中,一个子语音)的字符集(在本示例中,只有一个“thirst”),并组合它们(在本示例中,不组合)。然后,系统可以对所述字符集和系统的单词词典的单词进行比较,并且,如果所述字符集匹配词典中所述单词之一,则系统选择所述单词作为最终选择。在这种情况下,单词“thirst”被最终选择。
在许多情况下,特别是当单词只包括一个音节时,为了消除单词的含混,可能需要为音节按键按下超过一次。为此,不同的用户友好方法可以被实施。例如,原本包括一个音节的单词“fire”可以用分别包括音素集“fi”和“re”的两个音节进行发音。在这种情况下,用户可以首先按下相应于字母“f”的按键同时说出“fi”。然后,他可以按下相应于字母“r”的按键,并可以说出“re”。
同样,例如,以两个音节“ti”和“mes”或者“tim”和“es”进行发音的单词“times”。同样,例如“listen”的单词可以用两个音节“lis”和“ten”进行发音,它们可能需要分别相应于字母“l”和“t”的按键按下。同样,根据这个原理,可以把单词“thirst”划分为三个部分“thir”、“s”和“t”。例如,通过对音素集“thir”可能已被分配给包括字母“t”的按键(例如按键3301)进行考虑,用户可以按下按键3301,并说出“thir”,然后他可以按下相应于字母“s”的按键3306,并发出音素“s”的音或说出所述字母。然后,他可以按下相应于字母“t”的按键3301,并发出音素“t”的音或说出所述字母。在单词的末尾,用户可以按下例如空格键3307的单词结束键。
同样,为了更好地消除含混以及减少在其开始处具有例如相同语音(例如“bring”和“brings”)的单词所需的音素集数目,除了按下音节的第一个按键并说出所述音节之外,在许多情况下,可以按下并说出例如单词/音节的最后字符(例如在本示例中的“s”)的一个或更多字符。例如,用户可以按下相应于字符“b”的按键并说出“bring”(例如,把音素集“bring”分配给按键3302)。然后,他可以按下相应于字母“s”的按键,并发出“s”的音或说出音素“s”的声音。在提供例如按下“空格”键的单词结束信号后,系统将考虑两个数据输入序列,并提供相应的单词“brings”(例如,它的音素集没有被分配给按键3302)。可以理解,通过使用这种方法在单词中的任何位置输入一个或更多单字符(例如开始、中间、结尾)都是可能的。为了不使系统迷惑,当用户通过本发明的单词/单词的一部分输入系统输入包括(单词的)字母的部分时,优选的,用户可以说出所述字母的声音。例如,用户可以发出音素“m”的声音,而不说出“em”。同样,在类似情况下,通过系统可以把说出“t”与字符串“tea”相关联,当发出音素“t”的声音时,“tea”和字母“t”可以与唯一字母“t”相关联。
如上所述,为了更好地消除含混,可以把具有大量音素集的单词/单词的一部分/单词的音节/单词的子语音划分为多于一个部分,其中一些所述部分可以只包括一个音素/字符,并根据本发明的数据输入系统进行输入。同样,如上所述,根据这种方法,其中每个包括少量音素的多个音素集可以取代包括大量音素的单个音素集,用于表示单词的一部分(例如音节)。同样,如上所述,把单词长部分(例如包括大量音素的长音节)的语音划分为更短的子语音/音素集部分将减少用于识别词典数据库中可用的所有单词所需的音素集的总数。同样如上所述,这将允许把更少的音素集分配给键盘/小键盘的每个按键。
根据本发明的一个实施例,基于上述原理,把包括少量音素的短音素集分配给键盘/小键盘的每个按键。为此,例如,如果音素集以辅音开始,它可以包括以下结构/音素:
-仅有所述辅音
-以所述辅音开始,以及至少一个元音随后
-以所述辅音开始,至少一个元音在所述辅音之后,以及一个辅音在所述元音之后
如果音素集以元音开始,则它可以具有以下结构:
-以至少一个元音开始
-以所述元音开始,以及一个辅音随后
图40示出了根据本发明的实施例,辅音“t”4002和元音“u”4003的音素集4001的一些示例。列4004、4005、4006示出了根据构成所述音素集的声音集(例如辅音/元音),所述音素集的不同部分。列4007示出了相应的示例性单词,其中,相应的音素集构成所述单词的语音的一部分。例如,音素集“tār”4008构成单词“stair”的一部分4009。列4010示出了用于输入相应的单词的按键按下的数目的示例性估计(根据本发明的这个实施例,一个按键按下相应于单词的每个部分的第一个字符)。例如,为了输入单词“until”4011,用户将首先按下相应于字母“u”的按键3301(参见图33),并且优选的,同时说出“un”。然后,他再次按下相应于字母“t”的按键3301,并且优选的,也同时说出“til”。为了结束该单词,用户接着通过例如按下空格键的单词结束信号通知系统。通过两次按键按下(不包括单词结束信号)以及用户的语音,直到单词被输入。根据基于前述原理的当前实施例,在其前后没有元音的辅音音素可以被认为是单词语音的单独部分。例如,在单词“study”4012开始处的“s”和在单词“understand”4013中间处的“s”遵从该原理。这将显著地减少用于输入词典中可用的大多数单词所需的音素集的数目(例如,当使用电话型小键盘时,单词的每个开始音素/字符部分可能具有大约100个音素集,这可能足以识别例如英语语言中的大多数单词)。图40示出了分配给电话型小键盘的按键3301的例如“v”4014和“th”4015的其他的开始音素/字符。对每个所述开始音素/字符,可以根据上述原理对音素集进行考虑。
可以理解,如果所需要/期望的较长子语音部分的单词具有多个音节,同样可以利用本系统的短音素集进行考虑。同样,例如,也可以对表示多于一个的单词的音节的音素集进行考虑,并把其分配给所述相应按键。同样,为了更容易地识别,如在以前实施例中所描述的,为了允许更好地对在许多情况下是非英语口语地区的本地人的用户发出的语音进行识别,可以把相应于具有含混的类似发音的音素集(例如“tō”和的字符集分配给所有所述音素集。
相同的预定的(优选的,短的)音素集/语音模式可以允许在多种语言中识别和输入单词。例如,音素集“sha”可以被用于识别例如以下的单词:
“shadow”,英语
“Chaleur”,法语
“shalom”,希伯来语
“shabab”,阿拉伯语
“Geisha”,日本语,等
可以把相应的语言中相应的字符集分配给每个所述音素集。如上所述,通过这样做,可以提供基于音素集识别的强大的多语言数据输入系统。为此,不同语言中的一个或多个数据库可以在系统中是可用的。可以考虑在不同语言中用于输入不同文本的不同方法。
根据一种方法,通过具有许多语言中共同的音素集数据库和相应的字符集数据库,为了以所需语言输入文本,用户可以通过由预定方式通知系统选择语言模式。例如,所述用户可以按下模式键以进入到所需的语言模式。在这种情况下,根据本发明的相应实施例,在通过输入所述单词的一部分而输入单词之后,系统将对组合字符集的所选择的相应的集/串和相应于所述所选择的所需语言的单词词典的单词进行比较。在把所述字符集和所述词典的一个或多个单词相匹配之后,系统选择所述单词作为进行输入/输出的最终选择。如果该选择包括一个单词,则所述单词可以成为最终的选择。如果该选择包括多于一个的单词,则把所述单词显示给用户(例如在显示器显示的列表中),并且用户可以通过例如使用“select”按键,对它们其中之一进行选择。
根据另一种方法,系统可用的不同语言中的所有数据库将被同时使用,允许以不同的语言输入任意单词条目(例如在同一文档中)。例如,在根据本发明的一个实施例通过输入所述单词的一部分输入单词之后,系统可以对所选择的相应的字符集和系统可用的所有单词词典的单词进行比较。在把所述字符集和系统可用的不同词典中可用的单词进行比较之后,系统选择所述匹配的单词作为进行输入/输出的最终选择。如果该选择包括一个单词,所述单词可以成为最终选择。如果该选择包括多于一个的单词,则把所述单词显示给用户(例如在显示器显示的列表中),并且用户通过例如使用“select”按键对它们其中之一进行选择。
在例如希伯来语或阿拉伯语的一些语言中,其中大多数元音不通过单个字符表示,该系统甚至可以用更高的精度工作。
不与单词词典比较
本系统也可以在不对组合的所选择的字符集和单词词典进行比较的步骤下进行工作。这对以不同的语言输入文本是有用的,而不用担心它们在系统的单词词典中是否存在。例如,如果系统不包括希伯来语单词词典,用户可以通过使用罗马字母以希伯来语输入文本。为了输入单词“Shalom”,用户将使用存在的音素集“sha”和“lom”以及它们对应的在系统中可用的字符集。使用例如模式键的装置通知系统:不与词典数据库进行所述比较,组合字符集将被输入/输出,或被显示给用户用于确认。如果已产生多于一个的组合字符集,它们将被显示给用户(例如在显示器显示的列表中),并且用户可以通过例如按下“select”按键,对它们其中之一进行选择。
在本发明的单词/单词的一部分输入实施例中,如果输入/输出的单词不是用户需要的那个,则把单词擦除功能分配给按键。类似于字符擦除功能(例如删除、退格)键,按下单词擦除键将擦除例如显示器上光标前面的单词。
根据本发明另一个实施例,优选的,系统的大多数音素集可以只具有一个辅音。图41示出了一些这种音素集作为示例。根据本实施例,例如,为了输入单词“teabag”4101,用户首先按下按键3301同时说出“tē”。然后,他按下按键3302同时说出“ba”。最后,他按下按键3303同时说出“g”(或说发出音素“g”的声音)。如在另一个实施例中那样,在单词末尾,他可以按下例如空格键的按键。
为了更好地响应并增加系统的准确度,可以把自动校正软件与本发明的实施例相结合。自动校正软件已被本领域技术人员所知。例如,(通过考虑图33的小键盘),当用户试图输入单词“network”时,他首先按下字母“n”被分配给的小键盘的按键3308并同时说出“net”。字母“m”也被分配给同一按键3308。在一些情况下,系统可能把用户的语音错误地识别为“met”,并为所述语音选择例如“met”的字符集。通过按下相应于所述音节的首字母“w”的按键3304,用户进行到输入下一个音节,并说出“work”。系统对由用户发出的音素集“work”进行识别,并选择相应的字符集“work”。现在,系统对两个所选择的字符集进行组合,并得到单词“metwork”。通过把该单词与在系统的单词数据库的词典中存在的单词进行比较,系统可能不能把所述合成的单词与所述数据库的任何所述单词相匹配。然后,该系统将试图把所述合成的单词与最相像的单词进行匹配。在这种情况下,根据一个假设,系统可以用字母“n”代替字母“m”,提供在所述词典中可用的单词“network”。根据另一个假设,通过考虑由语音识别系统可能误识别“m”和“n”,而两者都位于相同按键上,系统可以用音素集“net”代替“met”,并选择分配给音素集“net”的字符集“net”。然后,通过用字符集“net”代替字符集“met”,将合成单词“network”。所述单词在系统的单词词典中是可用的。它将最终被选择。
在另一示例中,输入“that”可能被系统识别为“vat”。相同的过程将消除所述单词的含混,并将提供正确的单词“that”。
在另一个示例中,如果系统不能把合成的字符集与词典的单词相匹配,则系统的自动校正软件可以对所述合成字符集的字符(互相相关)在相应的部分中(例如音节)和/或所述合成字符集中的位置进行确定,并试图把所述字符集与词典的单词相匹配。例如,如果字符不在所述字符串/组中,通过与词典的单词的所述比较,系统可以识别出错误,并输出/输入正确的单词。例如,如果(例如以四个部分)输入单词“un-der-s-tand”的用户忘记输入所述单词的“s”部分,则合成字符集之一可以是字符串“undertand”。通过对所述字符串的字符和它们在所述字符串中彼此相关的位置进行考虑,并把所述字符串和词典的单词进行比较,系统可以识别所需单词是单词“understand”,并将最终输入/输出所述单词,或把其显示给用户,供用户决定。另外,系统的自动校正软件可以包括由本领域技术人员已知的其他校正软件的部分或全部功能。
具有相同发音(例如,并分配给同一按键)的例如“to”、“too”或“two”的单词可以遵从特殊的处理。例如,在这些单词中最普遍用到的单词是单词“to”。可以根据本发明的实施例输入该单词。对该操作的输出可以默认是单词“to”。通过按下相应于字母“t”的按键同时说出“tōō”,输入单词“too”(以两个部分“to”和“o”)。在按下单词结束按键之前,用户还可以通过按下相应于字母“o”的按键并说出“o”而输入另一个字符“o”。现在他可以按下结束点按键。单词“too”将被识别并输入。为了输入单词“two”,系统可以逐字符地输入它,或把例如“tro”的特殊语音分配给所述单词,并使用该实施例进行输入。同样,例如,为了输入“two”,用户可以按下按键3301并发出长“tōō”的音。为了输入数字“2”,用户按下相应的按键3302,并发出所述数字的音。可以理解,这里示出例子作为实例被示出。本领域技术人员可以考虑输入具有大致类似发音的单词的其他方法。
刚才已提到一个非常有趣的问题。例如,通过说出“fiv”并按下相应于单词“five”的首字母的按键3309,将输入单词“five”。有趣的是,通过说出“fiv”并按下相应于数字“5”的按键3305,将输入数字“five”。通过说出相应于两个不同符号的单词,并使用按键按下,用户的意图被阐明。这是只通过数据输入的缺点之一,其中,用户的意图可以不通过声音/语音识别系统进行考虑。同样,例如,可以把多于一个的语音分配给相同的数字。例如,可以把两个语音“four”和“forty”分配给数字“4”。用户可以通过说出“four”、“five”同时按下相应的按键,或说出“forty five”同时按下相同按键产生数字“45”。同样,当用户按下按键3306并说出“seven”,将输入数字“7”。这是因为为了输入单词“seven”,用户可以按下按键3306,并说出“se”。然后,他可以按下按键3301并说出“ven”。
在例如法语的其他语言中,其中,数字“7”的语音包括一个音节,为了消除含混的目的,可以把具有两个音节的自定义产生的语音分配给字符集“sept”。例如,单词“septo”可以通过用户产生、并添加到单词词典。该单词可以指向词典中的单词“sept”。当用户输入单词“septo”(根据本发明的当前实施例)时,系统将在系统的单词词典中找出所述单词。系统将输入/输出由单词“septo”指向的单词,而不输入/输出所述单词。所述单词是单词“sept”。可以在单独的数据库中,对指向词典数据库的单词的产生的符号进行安排。
根据另一种方法,把数字分配给与按键交互的第一模式,而表示所述数字的字符集可以被分配给与所述按键交互的另一个模式。例如,可以把数字“7”分配给按键3306上的单次按下动作(例如当说出它时),并且可以把字符串“sept”分配给相同按键3306上的两次按下动作(例如当说出它时)。
必须注意,本发明的子语音级数据输入系统是基于对单词的至少一部分语音(例如单词的子语音)进行识别。考虑到在一种或多种语言中许多单词具有共同的子语音,通过稍微修改/添加音素集,并把相应的字符分配给所述音素集,多语言数据输入系统可能成为可用的。例如,例如英语、德语、阿拉伯语、希伯来语以及甚至汉语的多种语言可以包括具备带有类似发音的部分/音节的单词。
可以理解,用户会添加新标准或自定义产生的单词,并把相应的语音添加到系统的词典数据库。因此,系统可以产生相应的按键按下值和语音模式并添加到相应的数据库。
如上所述,为了输入单词,用户可以按下相应于单词的第一部分的首字符/字母的按键并说出所述部分(的音素)。如果以多于一个部分说出所述单词,则用户可以对所述单词的每个剩余部分重复该过程。
根据本发明的一个实施例,当用户按下相应于单词(例如音节)的首字母部分的按键并说出所述部分时,声音/语音识别系统听到所述用户的语音并试图对至少(优选的,至少开始部分)所述语音的一部分与分配给所述按键的音素集进行匹配。通过系统选择最匹配的音素集以及选择相应的字符集。在通过为所述单词的每个部分(例如音节)重复相同的过程而输入整个单词之后,可以分别对所述单词的每个部分(例如音节)选择一个或多个字符集。现在,系统对单词的每个部分(例如音节)可以具有一个或多个字符集,其中每个字符集可以包括至少部分(优选的,开始部分)所述音节的字符。然后,系统将试图把每个所述字符集与系统的单词数据库的词典的单词的相应音节的(开始)字符相匹配。最匹配的单词将被选择。在许多情况下,只选择词典的一个单词。所述单词将被输入/输出。如果选择了多于一个可用的单词,所述单词将被显示给用户(在显示器显示的列表中),并且用户可以通过例如按下“select”按键选择它们其中之一。
例如,通过使用图37的表格,和图33的小键盘,为了输入单词“trying”(例如音素集用户可以首先按下按键3301并说出系统把用户的语音与分配给按键3301的相应的音素集相匹配,并选择相应的字符集(例如,在本示例中,“try”、“tri”)。然后,用户按下相应于字符“i”的按键3303并说出“ing”。在这种情况下,系统把用户的语音的开始部分与分配给按键3303的音素集“in”(例如,音素集“ing”在示例性数据库中不存在,因此它不被分配给所述按键)相匹配,并选择相应的字符集“in”。现在,用户已经结束输入单词,并且他输入结束点(例如单词结束)符号,例如按下空格键,或按下任何按键而不说话(例如,按下按键而而不说话可以被分配给例如标点符号、PC功能等字符。该问题已在由本发明人提交的PCT申请中解释过)。现在系统可以产生不同的字符集,每个包括所需单词的每个部分/音节的至少部分开始字符的可能字符。在该示例中,可以产生两个字符集。所述字符集是:
“tri-in”
和
“try-in”只有第二个字符集(例如“try in”)对应于英语词典中存在的单词,其中,所述单词包括在其第一音节开始处的字母“try”,并且还包括所述单词的另一个(例如第二个)音节开始处的字母“in”。所述单词是单词“trying”。
在本系统中,用于识别许多完整单词需要的音素集/语音模式的数量将被显著地减少。另一方面,可以增加表示所述音素集的字符集的数量,但是对所需存储器容量将没有显著地影响。
在许多情况下,只有一个所述组合的字符可以与词典中的单词相匹配。所述单词将被输入/输出。如果多于一个字符集的组合对应于词典中可用的单词,则可以把所述单词显示给用户(例如在显示器显示的列表中),并且用户通过例如按下“select”按键对它们其中之一进行选择。
如上所述,系统可以根据相应于所述单词的语音/子语音的一个或多个所述所选择的字符/音素集对单词进行选择。
在许多情况下,系统可能不考虑一个或多个所述所选择的字符/音素集,鉴于它们是通过系统被错误选择的。同样,根据需要,系统可能只考虑通过系统选择的音素集/字符集的部分(优选的,开始)音素/字符。例如,如果用户尝试以四个部分“de-mons-tra-ting”输入单词“demonstrating”,而系统错误地选择了字符集“des-month-tra-ting”,根据一种识别方法(例如,对所述字符集和词典的单词进行比较),系统可能没有发现相应于所述字符集的组合的单词。然后,系统可能注意到,通过考虑第一个选择的字符集的字母“de”和第二个字符集的字母“mon”(少数开始字母),并考虑第三和第四个字符集,所需的单词可能是单词“demonstrating”。同样,如果需要,系统可以把字符添加到组合的字符串(选择字符集)中,或者从所述字符中删除字符,用于把其与词典的最匹配的单词相匹配。例如,如果用户试图以两个部分输入单词“sit-ting”,而系统错误地选择了字符集“si-ting”,根据一种识别方法(例如,对所述字符/音素集和词典的单词进行比较),系统可以决定在所述字符串中必须在字母“i”之后添加字母“t”,用于把其与单词“sitting”相匹配。在另一个示例中,如果用户试图以两个部分输入单词“mee-ting”,而系统错误地选择了字符集“meet-ting”,根据一种识别方法(例如把所述字符/音素集和词典的单词进行比较),系统可以决定必须在所述字符串中字母“e”之后删除字母“t”,用于把其与单词“meeting”相匹配。
在单词的一部分的末尾(例如具有多于一个部分/音节的所述单词)和所述单词接下来的部分的开始具有相同的音素可以使系统具有更好地识别准确度。
根据本发明的一个实施例,例如,对于以例如元音的音素结束的(分配给按键的)音素集,可以对包括所述音素集并且以例如辅音的其他音素结尾的其他音素集进行考虑,并把其分配给所述按键。这可以提高识别的准确度。例如,通过参考图33,当输入包括两个部分“co-ming”的单词“coming”时,用户可以按下按键3302并说出“co”,然后他可以立刻按下按键3308并说出“ming”。因为子语音的第一部分太短,如果音素集“com”没有被分配给与音素集“co”被分配给的相同按键3302,当按下所述按键并说出“co”时,可能发生系统可能错误识别由用户说出的所述部分语音并选择例如
(例如,字符集“call”被分配给的)的错误的音素集的情况。另一方面,如果把音素集“com”也分配给所述按键,则部分“ming”的开始音素“m”将类似于音素集“com”的结束音素“m”。在这种情况下,系统可以选择两个音素集“com-ming”和它们相应的字符集(例如,作为例子,“com/come”和“ming”)。在对组合字符集和词典单词进行比较之后,系统可以决定在所述组合字符集之一中删除一个“m”,并且把所述组合字符集与词典数据库的单词“coming”相匹配。
为了能够更好地识别由用户说出的语音,在许多情况下,所述用户可能是非英语口语地区的当地人,可以把相应地分配给具有含混的大致类似的发音的音素集(例如“vo”和“tho”)的字符集分配给所有所述音素集。例如,可以把相同的(例如,共同的)字符集“tho”、“vo”和“vau”等分配给每个音素集“vo”和“tho”,其中,在通过系统选择所述字符集并产生相应的不同字符集的情况下,对所述集和系统的词典数据库的单词进行比较可以导致选择所需的所述词典的单词。
通过小小键盘输入例如文本的数据严重降低了数据输入速度。基于对单词每个部分/音节按下单个按键,同时说出所述部分/音节的本发明的数据输入系统显著地提高了数据输入速度。该系统还有许多其他优点。该系统的一个优点在于,它可以通过对所述单词的每个部分(例如音节)按下也许单个按键而(高度准确地)识别单词。本发明的另一个显著优势在于,用户不需要担心误拼写/误输入单词,特别是在单词预报的数据输入系统中(例如通过输入每个部分的第一个字母),可能导致误识别/不识别整个单词。同样,本系统的另一显著优势是当用户按下相应于单词的首字母部分的按键时,他在所述按键按下期间说话(所述部分)。在单词的末端,用户可以通过按下所述按键而不说话输入例如(分配给按键的)标点符号的默认符号。如上所述,该按键按下也可以被用作单词结束信号。例如,用户可以通过按下按键3303并同时说出输入单词“hi”。然后,他可以按下按键3306而不发声。这将通知,单词输入已结束,并且必须把符号“,”添加到所述单词的末尾。最终的输入/输出将是字符集“hi,”。
本发明描述的数据输入系统是由本发明人提交的PCT和US专利申请中描述的数据输入系统的派生。通过提供在以前申请中描述的完整PC键盘功能的字符数据输入系统和在所述PCT申请和本申请中描述的的单词/单词的一部分级数据输入系统的字符的组合将在移动(甚至是固定)环境中提供十分快速、方便和自然的数据输入,允许通过小型电子设备的具有减少数量的按键的键盘(例如小键盘)的快速数据输入。
如上所述,本发明的数据输入系统可以使用例如PC键盘的任何键盘。同样如上所述,根据本发明的数据输入系统,可以通过按下所述按键而不说话输入键盘按键上的符号。本发明的数据输入系统可以与例如标准PC键盘的键盘进行最佳操作,其中,把单个符号分配给一个或多个按键上的预定按下操作。如使用例如图42中示出的的计算机键盘的人们所知道的,例如,通过按下PC键盘4200的按键4201,可以输入字母“b”。同样,例如,通过同时按下换档键4202和按键4203,可以输入符号“#”。
通过把本发明的数据输入系统和这种键盘相结合,一方面,用户可以通过按下相应于所需数据的按键而不说出所述数据照常使用所述键盘(这允许不说话而输入单个字母、标点字符、数字、命令等),并且另一方面,所述用户可以通过说出所述数据并(优选的,同时)按下相应的按键输入所需数据(例如单词/单词的一部分)。例如,通过使用例如PC键盘的键盘,为了输入字母“b”,用户可以按下按键4201而不发声。为了输入单词/音节“band”,用户可以按下按键4201并(优选的,同时)说出“band”。不需要用于改变模式的其他操作,一方面,这允许用户照常使用键盘,而另一方面,能让所述用户通过说出所述宏并(优选的,同时)按下相应的一个或多个按键而输入例如单词/单词的一部分的宏。同样,例如,为了输入由两个部分(例如两个音节)“bi”和“ble”构成的单词“bible”,用户(如上所述,根据本发明的数据输入系统的原理)可以按下按键4201并说出
然后,他可以按下按键4201并说出“bel”。
如上所述,通过提供在以前申请中描述的完整PC键盘功能的字符数据输入系统和在所述PCT申请和本申请中描述的单词/单词的一部分级数据输入系统的字符的组合将在移动(甚至固定)环境中提供十分快速、方便和自然的数据输入系统。
单词的语音可能包括也相应于单个字符的一个或多个子语音。例如,通过参考图33,当用户按下小键盘3300的按键3302并说出“b”时,输入的所述数据可以对应于字母“b”、单词“be”和单词“bee”。根据一个实施例,系统可以把最高优先权分配给字符级数据,把其(例如在本实施例中,字母“b”)作为首选用于最终输入/显示给用户。如果这不是用户想输入的,他可以接着逐字符地继续输入剩余的单词,或者他例如可以按下结束按键以完成所述单词的输入,并接着例如操作选择键,以便在其他选择(例如在本示例中,“be”和“bee”)之间进行导航并选择他需要的那个。
根据本方法,还例如,当输入单词/字符串时,所述单词/字符串开始于相应于单个字符并最终相应于分配给所述按键的单词/单词的一部分的语音的子语音,即使在由用户输入单词结束信号之前,所述字符也可以被给予最高优先权并最终显示在相应的设备的显示器上。如果输入的下一个语音的一部分/子语音仍对应于/也对应于单个字母,则重复该过程。如果例如空格键的单词结束信号被产生,所述字符串可以被给予最高优先权并保持在显示器上。进行到例如输入下一个单词的下一个任务将被认为是由用户接受所述字符串的确认。如果输入的相同数据还对应于由系统进行匹配的一个或多个单词,所述单词对用户也是可用的/显示给用户。如果所述打印的单个字符串不是用户希望输入的,用户可以例如使用选择键在所述单词之间进行导航并选择他所需的一个。
继续描述本发明的实施例,如果在输入单词/单词的一部分中输入的数据(语音/部分语音和/或按键按下)之一不对应于单个字符并已输入单词结束信号,则可以删除所述显示的字符,而代替把具有最高优先权的(相应于所述数据)单词显示给用户。如果输入的相同数据还对应于多个单词,如果愿意,也可以把所述单词显示给用户。在这种情况下,用户可以例如使用选择键在所述单词之间进行导航并选择他所需的单词。
通过使用标准电话小键盘和本发明的数据输入系统,可以注意到,在英语中没有这样的单词,即,其具有多于一个的音节,其中所有所述音节的语音都对应于相应的按键上的单个字母。
存在许多单音节单词,其对应于相应的按键上的字符(例如“b、be、bee”或“t、tea、tee”)。如上所述,在这些情况下,所述单个字符可以被给予最高优先权。
根据上述原理,例如:
-为了输入“b”,用户按下相应于所述字母的按键并说出“b”
-为了输入“bmx”,用户按下相应的按键同时发出相应字母的音
-为了输入“bmx95”,用户按下相应的按键并发出相应字符的音
-为了输入单词“before”,用户可以按下相应的按键同时发出相应字母(例如逐字符数据输入)的音,或者例如,他可以首先按下相应于字母“b”的按键并(优选的,同时)说出“bē”,并接着按下相应于字母“f”的按键并说出“for”。在结束时,他输入单词结束信号,例如按下空格键(例如单词/单词的一部分输入系统)。
该方法的优点在于,用户可以结合本发明的逐字符数据输入和本发明的单词/单词的一部分数据输入系统,而不用在不同模式之间进行转换。
本发明的数据输入系统是完整的数据输入系统,能使用户在任意时刻输入包括例如字母、数字、标点符号、(PC)命令的符号的任意字符串,或输入存在于词典数据库中的单词。
根据本发明的一个实施例,在组合和与词典数据库的单词进行比较的过程之前,由系统选择的字符集可以显示给用户。例如,在每次输入单词的一部分之后,可以立即把相应于所述输入数据的字符集显示给用户。该方法的优点在于,在紧随输入单词的一部分之后,用户可以验证通过系统是否错误识别了所述单词的一部分。在这种情况下,用户可以删除所述部分并重复(如果需要,逐字符地输入所述部分)所述输入,直到输入相应于所述部分的正确字符。可以提供允许删除相应于所述部分的整个字符的按键,而不是一个接一个地删除相应于单词的输入部分的字符。根据本发明的一个实施例,可以使用相同按键删除整个单词和/或单词的一部分。例如,单次按下所述按键可以导致删除输入的单词的整个部分(例如,通过系统/用户使其位于所述部分之后的光标向系统指出所述部分将被删除)。很明显,每次其他的相同按下操作可以删除在所述光标之前的单词的其他部分。同样,例如,两次按下所述按键可以导致删除为所述单词输入的所有部分(例如,位于紧随要删除部分之后的光标通知系统必须删除位于所述光标之前的单词的所有部分)。
可能发生用户希望输入包括整个单词和单个字符的例如“systemXB5”的字符串。
根据一个实施例,在每次输入相应于部分所述字符串之后,或在输入所述整个字符串结束时,系统可以识别词典中没有单词对应于所选择的字符集,该字符集相应于单词的每个部分。另一方面,系统可以识别一些连续选择的字符集的组合对应于词典数据库中的单词,而另一些对应于单个字符。在这种情况下,系统将形成输出,该输出包括所述字符和单个字符串的单词。在上面的示例中,以五个部分“sys-tem-x-b-5”输入单词“systemXB5”。
例如,通过使用如图33所示的电话小键盘,相应于按键按下的所选择的字符集和每个部分的语音可以如下:
部分 sys tem x b
5
字符集 sis/sys tem/theme x b/be/bee
5
在组合并对所述字符集和词典的单词进行比较之后,系统可以识别数据库中没有单词与所述所选择的字符集的组合相匹配。然后系统可以识别,在所述数据库中对应于单词,一方面具有相应于单个字符的一些部分,而另一方面,具有单个字符集或连续的其他字符集的组合。然后,系统输入/输出所述组合。在该示例中,系统可以识别第一和第二字符集“sys”和“tem”的组合与单词“system”相匹配。第三和第五字符集分别对应于字母“x”和数字“5”。第四部分可以对应于字母“b”或单词“be”和“bee”。
系统可以根据它们的优先权向用户示出以下选择:
“systemxb5”
“systemxbe5”
“systemxbee5”
可以理解,为了使包括单个字符和整个单词的字符串的识别过程较为容易,用户可以通过例如按下预定按键的预定信号发出在所述串中所述单词/字符开始/结束的信号。
根据本发明的一个实施例,优选的,当有可能时,为了进行输入划分为多于一个部分的单词可以用所述部分的语音以元音开始的方式进行划分。例如,可以把单词“merchandize”划分为部分“merch-and-ize”。同样,例如,可以把单词“manipulate”划分为“man-ip-ul-ate”。
同样,为了更好的结果,当对所述字符集和词典数据库的单词进行比较时,相应于音素集的所选择的字符集可以考虑相应的音素集,所述音素集相应于单词的部分语音。例如,在英语中,对于音素集“ār”的相应字符集可以是例如“air、“ar”和“are”的字符集。对于音素集
的相应字符集可以是“are”和“ar”。在该示例中,两个音素集具有类似的字符集“are”和“ar”。在错误识别输入的情况下,系统可以尝试消除含混或校正过程(例如改变次序)。知道字符集涉及哪个音素集可以帮助系统更好地进行所述过程。例如,如果用户希望输入单词“ār”,而系统错误地识别所述语音为“āb”(例如,在该示例中没有意义)。对于所述错误识别的音素集的相关字符集可以是例如“abe”、“ab”的字符集。通过考虑所述音素集,系统将被指向例如“aim”、“ail”、“air”等单词,而不是例如“an”、“am”的单词(例如涉及音素“a”)。
如上所述,表示多于一个单词的音节的音素集也被考虑并分配给按键,并由本发明的实施例输入(例如,相应于具有两个音节的单词的一部分的音素集可以通过说出它并按下相应于所述部分的首字符的按键进行输入)。同样,如上所述,可以通过说出它并同时按下相应于所述单词的首音素/字符的按键输入整个单词。如上所述,甚至可以把单词串分配给按键并如所述的进行输入。可能会发生系统不识别具有多于一个子语音(例如音节)的单词的音素集(例如子语音)的情况。在这种情况下,可以把所述单词的两个或多个连续的子语音(例如音节)分配给按键。参考图33,例如,可以把单词“da-ta”(例如,其中例如系统错误识别音素集“ta”)分配给按键3309。为了输入所述单词,用户可以按下按键3309并说出“data”。
本发明的按下和说话数据输入系统允许输入单词,因此,可以分别由系统或用户自动或手工地管理单词结束过程。
-如上所述,有多种被输入的单词,例如:
-通过与相应的按键按下结合的单个子语音/语音,以一个部分输入单词(例如具有一个音节的单词)
-把单词划分为多于一个的部分(例如具有多于一个音节的单词,或者具有一个音节但是包括多个连续的辅音或元音的单词),并通过相应于
每个部分的子语音/语音与对每个部分的相应的按键输入相结合进行输入。
根据本发明的一个实施例,当输入相应于语言的单词数据库中现存单词的整个单词,而用户输入例如按下“单词结束”按键的单词结束信号时,则把所述单词考虑为用于进行输入/输出的输入所述数据的结果。根据预定系统设计/模式,系统可以考虑添加或不添加例如在所述结果末尾的空格字符的字符。如果系统或用户不在所述单词之后输入例如空格字符或输入功能的符号,则接下来输入的单词/字符将与所述单词的末尾连接。
示例:
“FOR”后跟着是“单词结束”按键(没有空格),产生“FOR”
根据本发明另一个实施例,当输入相应于语言的单词数据库中现存单词的整个单词,并且用户在所述单词的末尾输入例如至少空格字符、至少标点符号、或至少“输入”功能的其他符号时,则输入所述单词和所述其他符号。
示例:
“FOR”后面是“”,产生“FOR”
“FOR”后面是“,”,产生“FOR,”
“FOR”后面是“.”,产生“FOR.”
根据本发明的一个实施例,当用户输入相应于语言的单词的词典数据库中现存单词的单词,并且所述用户接着输入也相应于词典中现存单词的下一个单词(在所述两个连续的单词之间不输入例如空格字符的单词结束信号)时,但是,所述两个单词的组合不相应于单词数据库的词典中的单词,则系统可以自动在所述两个单词之间添加空格字符。
示例:“FOR”后面是“SOME”,产生“FOR SOME”
根据本发明的一个实施例,当用户输入相应于语言的单词的词典数据库中现存单词的单词,并且所述用户接着输入也相应于词典中现存单词的下一个单词(在所述两个连续的单词之间不输入例如空格字符的单词结束信号)时,并且,所述两个单词的组合也相应于单词数据库的词典中的单词时,则系统可以向用户显示两个选择。第一个选择可以是所述两个单词的组合(在它们之间没有空格字符),而第二个选择可以是它们之间包括一个(或多个)空格字符的所述两个单词。根据例如预定系统设计、所述单词被组合的意义和分开的意义、短语概念等的因素,系统可以对所述选择之一给出较高优先权,并把它显示在相应设备的显示器上,用于用户确认。然后,用户将决定选择哪一个。例如,进行到下一个单词/字符的输入可以通知用户,第一个选择被确认。
示例1:
“FOR”后面是“GIVE”可以产生第一个选择“FORGIVE”
“FOR”后面是“GIVE”可以产生第二个选择“FOR GIVE”
示例2:
“WORK”后面是“MAN”可以产生“WORKMAN”
“WORK”后面是“MAN”也可以产生“WORK MAN”
上述过程可以应用到也相应于相同原理的例如以下单词的单词。
示例:
“WORKMAN”后面是“SHIP”可以产生“WORKMANSHIP”
“WORKMAN”后面是“SHIP”也可以产生“WORKMAN SHIP”
根据本发明的一个实施例,当输入相应于语言的单词数据库中现存单词的第一个单词,并且用户把下一个单词/单词的一部分输入到所述第一个单词的末尾(它们之间没有空格字符),并且所述下一个单词/部分不对应于词典中的现存单词,但是与所述第一个单词组合的所述下一个单词/部分对应于词典中的单词时,则系统将自动把所述第一个单词和所述第二个单词/部分连接起来,用于提供单个单词。
示例:
“FOR”后面是“CING”产生“FORCING”
“FORGIVE”后面是“NESS”产生“FORGIVENESS”
根据本发明的一个实施例,当第一个输入的单词/单词的一部分不存在于语言的单词数据库中,并且用户输入下一个单词/单词的一部分时,系统将对所述第一和下一个部分进行组合,并把所述组合与词典中的单词进行比较。如果所述组合对应于所述词典中的单词,则系统选择所述单词并最终把其显示给用户,用于确认。
示例:
“SYS”后面是“TEM”,产生“SYSTEM”
可以理解,为了更好的结果,也为了减少含混,把自动的单词结束过程与用户干预进行结合。例如,在结束部分按下预定按键,可以通知系统必须把所述部分与它之前的至少一个部分进行组合。如果如此定义,系统也可以在所述组合单词的末尾放置空格字符。
示例1:没有用户干预,可能发生以下情况:
“FOR”后面是“GIVE”可以产生第一个选择“FORGIVE”
“FOR”后面是“GIVE”也可以产生第二个选择“FOR GIVE”
示例2:采用用户干预,可能发生以下情况:
“FOR”后面是“GIVE”,再后面是“”可以产生一个选择“FORGIVE”
使系统进入手工/半自动/自动单词结束模式/过程可以是可选的。用户可以通过例如模式按钮的装置通知系统,用于进入所述过程或从所述过程退出。这是因为在许多情况下,用户可能宁愿手工处理单词结束问题。
如在上面的实施例中提到的,用户可能希望在字符串中任意输入一个或多个单词。该问题已在本发明前面的实施例之一中描述过。
示例:“91SYSTEMep7”
根据本发明的一个实施例,系统可以向用户显示,在其输入(例如语音和相应按键)之后并在“单词结束”信号之前的当前输入的单词/单词的一部分已经被输入。系统可以把所述部分与词典的单词进行匹配,把所述部分与以前的单词/单词的一部分、当前的短语上下文等进行关联,以决定把哪个输出显示给用户。系统也可以简单地把所述部分本身显示给用户。该过程也可以使用户能够在单词之间不间隔地输入单词。例如,在用户已经选择了向其显示的所选择的结果之后,用户可以进行到输入下面的单词/单词的一部分,而不在所述第一个单词和所述下面的单词/单词的一部分之间添加空格字符。系统将连接所述两个单词。
示例:
“PRESS”后是“SPEAK”产生“PRESSSPEAK”
除了词典中的标准单词之外,系统的单词数据库也包括缩写词、包括特殊字符的单词(例如“it’s”)、用户产生的单词等。
参考图33,例如,当用户按下按键3303并说出“its”,系统可以选择单词“its”和“it’s”,这两个单词被分配给利用所述按键的所述按下动作和所述(部分)语音。系统可以自己选择所述单词之一(例如,根据短语概念、前面的单词等)作为最终的选择,或者把所述所选择的单词显示给用户,用于通过他最终选择。在这种情况下,例如,系统可以在相应设备的显示器上显示具有最高优先权(例如“its”)的单词。如果这是用户希望输入的,则用户可以使用例如按下预定按键的预定确认装置,或者进行到输入下面的数据(例如文本)。通过系统可以把进行到输入下面的数据(例如文本)认作接受当前提出的单词的确认。如果所述显示/提出的数据不是用户希望输入的,则用户可以通过系统内设置的选择装置对其他所选择的单词(例如“it’s”)进行选择。根据另一个实施例,当两个单词具有类似发音时,可以把表示所述单词之一(例如,在上述示例中的单词“its”)的音素集分配给与按键的第一交互(例如单次按下),可以把表示另一单词(例如单词“it’s”)的类似音素集分配给与所述按键的第二种交互(例如两次按下)。
如上所述,可以把符号(例如语音/音素集/字符集等)分配给与说话结合/不结合在例如按键上的例如两次按下的模式/动作。根据本发明的一个实施例,把含混的单词/单词的一部分分配给所述模式/操作。例如,当用户发出单词“tom”和“tone”(例如分配给相同按键)的音时,它们可能引起含混。消除它们的含混的一个解决办法是把它们中的每个分配给所述按键的不同模式/动作。例如,用户可以单次按下(例如按下一次)按键3301并说出“tom”(例如,把音素集“tom”分配给与所述按键交互的所述模式),用于输入示例的字符集“tom”。同样,所述用户可以两次按下按键3301并说出“ton”(例如把音素集“ton”分配给与所述按键交互的所述模式),用于输入示例的字符集“tone”。
同样,例如,以元音结束的第一音素集(例如,相应于单词的至少部分语音)可能引起与第二音素集的含混,所述第二音素集在其开始处包括所述第一音素集,还包括其他音素。把所述第一音素集和所述第二音素集分配给与按键交互的两种不同的模式。这可以在噪音环境中显著地提高声音/语音识别的准确度。例如,当由用户说出时,相应于字符集“mo”的音素集可能引起与相应于字符集“mall”的含混。为了更好地确认,把它们的每一个分配给不同模式。例如,字符串“mo”的音素可以被分配给相应按键的单次按下,而字符串“mall”的音素可以被分配给在所述相应按键上的两次按下。
根据本发明另一个实施例,把引起含混的符号(例如音素集)分配给例如按下不同的按键的不同的相应模式/操作。虽然很明显,这是不方便的,在上面的示例中,第一音素集(例如“mo”)可以例如被分配给例如3308的第一个按键,而第二音素集(例如“mall”)可以被分配给另一个按键。
同样,根据本发明的一个实施例,以至少一个字符表示的第一音素集可以被分配给第一动作/模式(例如,利用相应按键),所述字符表示所述第一音素集的开始音素,而以至少一个字符表示的第二音素集可以会被分配给(例如与相应按键的)第二动作/模式,所述字符表示所述第二音素集的开始音素,诸如此类。例如,以表示字符“s”开始的音素可以被分配给按键3301上的单次按下,而以例如“sh”的表示字符开始的音素可以被分配给相同按键3301或其他按键上的两次按下。
根据本发明的一个实施例,可以把单个字母(例如“a”到“z”)分配给第一模式/动作(例如,利用相应的按键),并可以把单词/单词的一部分分配给第二动作/模式。例如,可以把单个字母分配给相应按键上的单次按下(例如,结合用户说出所述字母),并可以把单词/单词的一部分分配给相应按键上的两次按下(例如,结合用户说出所述单词/单词的一部分)。根据该示例,用户可以对逐字母数据输入和单词/单词的一部分数据输入进行组合。为此,一方面,当说出所述字母时,所述用户可以通过单次按下相应于被输入字母的按键,提供逐字母数据输入,而另一方面,当说出所述单词/单词的一部分时,所述用户可以通过两次按下相应于被输入单词/单词的一部分的按键,提供单词/单词的一部分数据输入。
根据本发明的一个实施例,为了上述目的,设置例如按键按下的装置。例如,通过按下模式按钮,系统可以进入逐字符数据输入系统,并且,通过再次按下相同按钮或按下其他按钮,系统可以进入单词/单词的一部分数据输入系统。根据本实施例,在相应模式中,用户可以例如通过在相应按键上的单次按下动作输入字符或单词/单词的一部分,并说出相应的字符(例如字母)或单词/单词的一部分。
同样,例如根据它们的优先权,或通常根据当前的短语上下文,可以把具有类似发音的单词/单词的一部分(以及显然的,它们的相应音素集)分配给不同模式。在这种情况下,例如,可以把第一单词/单词的一部分分配给例如单次按下的模式,并可以把第二单词/单词的一部分分配给例如在相应按键上两次按下的动作,诸如此类。例如,单词“by”和“buy”具有类似发音。用户可以通过单次按下分配给字母“b”的按键并说出“bi”而输入单词“by”。所述用户可以通过在相应于字母“b”的按键上施加两次按下动作并说出“bi”而输入单词“buy”。同样,例如,可以把音节/字符集“bi”(同样,说出“bi”)分配给例如三次敲击按键的第三模式,诸如此类。可以理解,可以把至少一个所述单词/单词的一部分分配给与另一个按键交互的模式(例如以及明显地,结合所述单词/单词的一部分的语音)。
如上所述,与单词的至少一部分的语音相关的所选择的字符集的不同组合可以对应于词典数据库中多于一个的单词。同样,如上所述,可以使用例如“选择键”的选择装置在那些匹配的单词中选择所需单词。可以根据单词所属于的短语上下文,把较高优先权(当有多于一个所选择的单词时)分配给一个单词。同样,根据至少一个前面和/或后面的单词的一部分/单词的上下文,把较高优先权(当有多于一个所选择的单词时)分配给单词。
根据本发明的一个实施例,可以把每个所述单词/单词的一部分分配给本发明的数据输入系统的不同模式(例如交互模式)。例如,当用户按下相应于字母“b”的按键并说出“be”时,通过系统可以选择两个单词“be”和“bee”。根据本实施例,为了避免使用例如“选择按键”,例如,可以把第一个单词“be”分配给例如单次按下模式的模式,并可以把第二个单词“bee”分配给例如两次按下模式的另一个模式。根据该实施例,在上面的示例中,用户可以单次按下相应于“b”的按键并说出“bē”,以提供单词“be”。同样,他可以两次按下相同按键并说出“bē”,以提供“bee”。
根据本发明的一个实施例,也可以把一些间隔的问题分配给例如单次按下模式或两次按下模式的(例如,与按键交互的)模式。例如,在自动间隔过程中,可以把(例如,单词的一部分/单词的)连接/拆开功能分配给单次按下或两次按下模式。根据该实施例,例如,在所述已输入单词/部分之前和/或之后,把分配给两次按下模式的将要输入的单词/单词的一部分与已输入单词/部分相连接。例如,当用户通过单次按下输入例如单词“for”的单词时(例如,同时说出它),在所述单词之前(或之后、或之前和之后两者),可以自动设置空格字符。如果通过两次按下(例如并说出它)输入相同单词,则可以把所述单词与前面的单词/单词的一部分进行连接,或者与在其后被输入的单词/单词的一部分进行连接。
在上面的示例中,同样,例如,在输入单词/单词的一部分之后的两次按下可能引起相同结果。
根据本发明一些实施例,为了自动间隔目的,分配给相应的音素集的一些单词/单词的一部分可以在它们的末尾包括至少一个空格字符。在这种情况下,当不需要所述空格时,它可以由系统自动删除。在单词的末尾输入的例如标点符号的字符可以(例如,通过系统)位于所述空格之前。例如:
“word”后面是“,”产生“word,”
根据本发明另一个实施例,为了自动间隔目的,分配给相应的音素集的一些单词/单词的一部分可以在它们开始处包括至少一个空格键。在这种情况下,当不需要所述空格时(例如,对于一行的第一个单词),可以由系统删除它。因为空格字符位于单词的开始处,所以,象通常那样,可以在单词的末尾照常输入例如单个字母或标点符号的字符(例如连接到它)。
根据本发明的一个实施例,在包括自动间隔过程的数据输入期间,可以提供用于连接当前部分/单词与前面/后面的部分/单词的例如预定按键按下的动作。例如,如果在两个(例如当前的和前面的)单词/部分之间自动提供空格,则例如按键按下的预定动作可以删除所述空格,并连接所述两个单词/部分,示例:
“for”+“give”+预定按键按下,产生“forgive”
根据本发明另一个实施例,较长时间发出单词/音节/单词的部分的元音,以所述元音结束,可能导致通过本发明的语音识别的更好的消除含混的过程。例如,当说“vo”时,更长时间地发出元音“o”的音可以通知系统要输入的单词/单词的一部分是“vo”,并不是例如单词/单词的一部分“vol”。
根据本发明的一个实施例,通过使用例如预定按键按下动作的预定装置,要输入的数据可以被大写。例如,通过按下“Caps Lock”按键,在此之后被输入的字母/单词/单词的一部分可以以大写字母输入/输出。在所述“Caps Lock”按键上的另一个按下动作可以把系统转换回到小写模式。可以理解,可以把所述功能(例如“Caps Lock”)分配给口语模式。例如,为了提供大写过程的开始,用户可以按下相应于“Caps Lock”符号的按键并发出分配给所述符号的相应语音(例如“Caps”或“lock”或“Caps lock”等)。
根据本发明的一个实施例,可以把小写的字母/单词/单词的一部分分配给例如在相应按键上单次按下的第一模式(例如结合/不结合所述字母/单词/单词的一部分的语音),并可以把大写的字母/单词/单词的一部分分配给例如在相应按键上两次按下的第二模式(例如结合/不结合所述字母/单词/单词的一部分的语音)。例如,为了提供单词(例如字符集)“thought”,用户可以单次按下按键3301并说出“thought”。为了产生单词“THOUGHT”,所述用户可以两次按下按键3301并说出“thought”。这允许局部地大写输入。
同样,根据类似原理,可以把具有其第一字母大写和其剩余部分小写的单词/单词的一部分分配给例如单次按下模式、两次按下模式等模式。
根据本发明的一个实施例,如在用于逐字符数据输入的以前申请中所描述的,可以把字母/单词/单词的一部分分配给多于一个的单动作,例如同时按下两个按键。例如,可以把以“th”开始的单词/单词的一部分分配给同时按下分别分配给字母“t”和“h”的两个不同的按键,并(最终)说出所述单词/单词的一部分。可以把相同的原理分配给以“ch”、“sh”或字母表的任何其他字母(例如“a”、“b”等)开始的单词/单词的一部分。
根据本发明的一个实施例,可以把由字符表示的音素开始的单词/单词的一部分分配给例如单次按下相应按键的第一模式,而由多于一个字符表示的音素开始的单词/单词的一部分可以被分配给例如两次按下相应按键(其可以是不同的按键)的第二模式。例如,可以把以“t”开始的单词/单词的一部分分配给单次按下相应按键(例如,与所述单词的语音结合),而以“th”开始的单词/单词的一部分可以被分配给两次按下所述相应按键或两次按下另一个按键(例如,与所述单词的语音结合)。
如上所述,根据本发明的不同实施例,在一种或多种语言中,在例如单词词典的不同词典的不同种类中,可以使用音节/单词的一部分(字符集)的词典、语音模式(例如音节/单词的一部分)的词典等。如果需要,可以对在每种或所有种类中的两个或多个词典进行合并。例如,可以合并单词的词典和单词的一部分的词典。
如上所述,本发明的数据输入系统可以使用任何键盘,并可以用于例如“多按键”系统、单词预报系统、虚拟键盘等许多数据输入系统。例如,一方面,用户可以通过按下相应键盘的按键而不说出输入的内容(例如在所述系统中习惯的那样),使用所述其他系统输入文本(例如字母、单词),并在另一方面,所述用户可以通过按下相应按键并说出所述数据(例如信件、单词/单词的一部分,并且如果如此设计,例如标点符号的其他字符等)输入例如文本(例如字母、单词/单词的一部分)的数据。
如上所述,本发明的数据输入系统可以使用任何声音/语音识别系统和方法,用于识别例如字符、单词-单词的一部分、短语等的口语符号。本系统也可以使用例如唇读、眼读等其他识别系统,与例如按键按下的不同模式、手指识别、指纹识别、手指移动识别(例如通过使用照相机)等的用户动作识别系统相结合。这些识别系统和用户的动作已在由本发明人所提交的以前的专利申请中描述过。在所述以前的申请中的所有特点都可以被应用于本发明的数据输入系统的宏(例如逐单词/单词的一部分)。
根据本发明另一个实施例,(如在关于逐字符输入级的以前的申请中所描述的)系统可以被设计成使得为了输入文本,用户可以说出单词/单词的一部分而不按下相应按键。另一方面,所述用户可以按下按键,用于通知系统语音(例如字符、单词的一部分、单词、短语等)、标点符号、功能等的结束/开始。
本发明的数据输入系统也可以应用于输入例如多于一个单词的序列的宏,或甚至应用于短语输入系统。例如,用户可以(例如同时)说出两个单词,并按下相应于所述两个单词的第一个单词的首字母的按键。
虽然在本申请和以前的申请的许多段落中,为了数据输入目的,结合用户的声音/语音的按键按下已如所示例的所述,本发明的数据输入系统也可以应用到其他数据输入装置(例如,字符、单词/单词的一部分等可以被分配给的例如用户的手指的对象),并可以使用其他的用户行为和相应的识别系统。例如,(如由本发明人提交的以前的专利申请中已经描述过的)系统(通过例如使用照相机)可以识别用户的手指在空间的移动,而不是(或结合)对键盘按键上的按下动作进行分析。例如,用户可以在桌子上敲击(例如把字母“m、n、o”分配给的)他的右拇指并说出“milk”(例如,优选的,把单词“milk”预定分配给右拇指)。在该示例中,结合所述用户的语音的所述用户的手指移动可以用于输入单词“milk”。
在另一个示例中并根据相同原理,所述其他数据输入方法可以是例如字母的用户的手写符号(例如涂鸦),并且所述行为可以是用户的语音。例如,通过使用采用了手写识别系统的基于笔的装置(例如PDA、铁笔等),用户可以书写例如字母的符号,并说出所述字母,以提高本系统的识别系统的准确度。在另一个示例中,所述用户可以书写相应于单词/单词的一部分的语音的至少首音素的至少一个字母,并说出所述单词/单词的一部分。当所述用户书写所述字母时,该装置的手写识别系统识别所述字母,并把所述字母与单词-单词的一部分和/或分配给所述至少一个字母(或符号)的音素集相关联。当系统听见用户的声音,则该系统尝试把它与至少一个所述音素集相匹配。如果在所述音素集中有音素集与所述语音相匹配,则系统选择相应于所述音素集的字符集。剩余的过程(例如,找出最终单词的过程)可以类似于在本申请和由本发明人以前提交的申请的不同实施例中所描述的过程。
根据一个实施例,对由本发明人提交的本申请和以前的申请中所描述的发明的数据输入系统,可以做如下总结:
可以把预定数量的符号分配给预定数量的对象,通常是按键,所述符号表示至少一种语言的文字数字字符和/或单词和/或单词的一部分、标点符号、功能等,所述符号被用在例如文本输入系统的数据中,其中,可以通过提供与所述其他信息中相应对象的预定交互输入符号,当存在相应于所述符号的其他信息时,所述其他信息通常不与所述对象交互而被提供,其中,所述其他信息通常是存在相应于所述符号的语音,或者最终,缺少所述语音。并且其中,所述对象也可以是例如用户的手指、用户的眼睛、键盘的按键等对象,而所述用户行为可以是例如用户的语音、用户的手指移动方向(包括不移动)、用户的指纹、用户的嘴唇或眼睛移动等行为。
不同于其他的数据输入系统,其中,许多按键按下被用于输入少量字符,本发明的数据输入系统可以使用少量按键按下提供许多字符的输入。
在小键盘上配置符号的方法
在由本发明人提交的以前的专利申请中已提出了配置符号的不同方法。图43示出了把符号分配给小键盘4300的按键的方法。
如上所述,字母a-z、和数字0-9位于电话型小键盘上它们的标准位置,并可以通过按下相应按键并说出它们进行输入。
同样如上所述,许多标点符号和功能被分配给所述小键盘的按键,并可以通过按下(或两次按下)相应按键不说出它们而进行输入。
在本配置中,由用户自然说出的例如“+”号4301的一些标点符号被分配给一些按键,并可以通过按下相应按键并说出它们进行输入。
同样根据这种布置,例如“-”号4302的一些符号可以位于一个按键、两个位置,所述符号可以具有不同的含义并根据上下文、根据数据的上下文进行发音或不发音。它们与当输入它们时需要说话的符号进行一次性组合,并且还与当输入它们不需说话的符号进行组合。可以根据数据的上下文,把需要语音的符号分配给多于一个语音。例如,分配给按键4303的符号“-”4302可以用不同方式输入。
-用户可以按下按键4303并说出“minus”
-用户可以按下按键4303并说出“dash”
-用户可以按下按键4303而不说话
在小键盘的按键上交换含混的符号
如上所述,分配给小键盘/键盘的相同按键的例如字母的一些符号可以具有大致类似的发音。这可能使本发明的声音/语音识别系统引起含混。图43示出了标准电话型小键盘4300。当按下所述按键并发出所述字母之一的音时,分配给按键4301的一对字母“d”和“e”可能导致本发明的声音/语音识别系统的含混。当发出它们之一的音时,分配给相邻按键4302的一对字母“m”和“n”也可能引起含混。另一方面,可以容易地对字母“e”或“d”与字母“m”或“n”进行区分。通过把每对字母之一交换分配给另一对的相应按键,将解决所述四个字母的识别问题(例如,通过使用本发明的按下和说话数据输入系统)。这可能稍微改变小键盘的数字顺序配置,但将显著地提高数据输入的准确度。图43b示出了在所述更改之后的小键盘4310。
自动间隔方法
如上所述,用于连接/分离开单词的一部分/单词的自动间隔过程可以被分配给例如单次按下模式或两次按下模式的模式。如已经描述的,用户可以通过说出所述符号同时按下相应于所述符号的开始字符/音素(在本发明的逐字符数据输入系统中,所述开始字符通常是所述符号)的按键(例如,所述符号被分配给的按键),对例如至少单词的一部分的符号(例如,在其末尾不提供空格字符)进行输入。根据所述过程,还例如,用户可以通过说出所述符号同时两次按下相应于所述符号的开始字符/音素的所述按键而输入例如至少单词的一部分的符号(例如,在其末尾包括空格字符)。在需要许多按键按下以输入单词的数据输入系统中,自动间隔可能特别有利。
根据上述原理,例如,在本发明的逐字符数据输入系统中,通过说出/不说出所述字符,同时例如单次按下相应按键,字符可以被输入并与前面的字符相连接。包括两次按下动作的相同动作可以导致输入所述字符并把它与所述前面的字符相连接,但也可以在当前字符之后添加空格字符。要输入的下一个字符将位于所述空格字符之后(例如将与所述空格字符相连接)。例如,为了输入单词“see you”,用户可以首先通过说出字母“s”和“e”并单次按下它们的相应按键而输入字母“s”和“e”。然后,他可以说出“e”同时两次按下它的相应按键。然后,用户可以通过说出字母“y”和“o”同时单次按下相应按键而输入字母“y”和“o”。然后,他可以说出“u”并两次按下相应按键。
根据本发明另一个实施例,系统可以使所述空格字符位于所述当前字符之前,而不是使所述空格字符位于所述当前字符之后。
可以理解,在所述字符之后或之前可以考虑任何其他符号(或符号组),而不是空格字符。当然,如前所述,考虑到字母是单词的一部分,相同过程可以应用于本发明的数据输入系统的单词的一部分/单词级。再例如,用户可以通过下面的步骤输入单词“prepare it”,即,通过说出“pre”同时例如单次按下相应于字母“p”的按键而首先输入部分“pre”。然后,用户可以通过说出“pare”同时两次按下相应于字母“p”的按键而输入“pare”(例如,包括在其末尾的空格)。然后,用户可以通过说出字母“i”同时两次按下相应于字母“i”的按键而输入单词“it”(例如,包括在其末尾的空格)。
在具有减少数目的按键的小键盘上标准的传统键盘(QWERTY)配置
根据本发明的一个实施例,在小键盘上的字母配置和/或分配可以根据在QWERTY键盘上字母的配置。这会吸引许多不使用电话型小键盘用于数据输入的人,很简单,只是因为他们不熟悉标准电话小键盘上字母的字母顺序配置。根据本发明的一个实施例,使用与本发明的数据输入系统相结合的这种小键盘也可以通过本发明的声音/语音识别系统,提供更好的识别准确度。
图44a示出了电话型小键盘4400的示例,其中,字母字符被布置在根据所述字母在QWERTY键盘上的配置的它的按键上/分配给根据所述字母在QWERTY键盘上的配置的它的按键。如图所示,QWERTY键盘字母按键的上部行上的字母以所述字母在所述QWERTY键盘上的相同顺序,被分布在所述小键盘4400的上部行4404的按键4401-4403上。位于QWERTY键盘中间字母行的字母以所述字母布置在QWERTY键盘上的相同顺序(相互关联),被分布在所述小键盘4400的第二行4405的按键上。并且最后,QWERTY键盘的较低字母行上的字母以它们位于QWERTY键盘上的相同顺序,被分布在所述小键盘4400的第三行4406的按键上。
继续参考该实施例,以使含混字母位于不同按键上的形式,把所述字母表字母分布在所述小键盘的按键上。图44b示出了具有微小改变的QWERTY布置的小键盘4407。在所述小键盘中,以消除字母“M”和“Z”之间的含混的方式,对字母“M”4408和“Z”4409的按键分配进行交换。在该示例中,已稍微修改QWERTY配置,但是通过使用具有本发明的数据输入系统的所述小键盘,可以提高识别准确度。可以理解,可以考虑任何其他的字母布置和更改。
如图所示,本发明的QWERTY小键盘可以包括例如标点符号、数字、功能等其他符号。通过使用如在由本发明人提交的本申请和以前的申请中所描述的本发明的数据输入系统,对它们进行输入。
必须注意:具有QWERTY(或任何其他)布置的字母表字母可以被分配给具有减少数目的按键的任何键盘的按键。本发明的数据输入系统可以结合并使用所述键盘。可以理解,为了更好的准确度,可以修改任何标准的布置。
六个按键上的QWERTY布置
根据本发明的一个实施例,本发明的数据输入系统可以使用键盘/小键盘,其中,把具有QWERTY布置的字母表字母分配给所述键盘/小键盘的六个按键。很明显,根据本发明的数据输入系统原理,也可以把单词/单词的一部分分配给所述按键。
如所知的,根据被称为QWERTY的配置顺序,把字母表字母布置在PC键盘的3行按键的按键上。图45示出了QWERTY键盘4500,其中,把字母A到Z布置在所述键盘的三行按键4507、4508、4509上。通常,用户使用其双手的手指用于(触摸)敲击所述键盘。通过使用他左手的手指,用户例如敲击所述键盘4500的左侧4501上所示的字母的按键,并通过使用他右手的手指,用户例如敲击位于所述键盘4500的右侧4502的字母的按键。根据这些原理,可以考虑根据三行4507、4508、4509乘以两列4501-4502表格对QWERTY键盘的字母的按键进行布置。
根据本发明的一个实施例,减小的键盘的六个按键的组(例如3乘2)可以用于在其上复制PC键盘的所述QWERTY布置,并用于本发明的数据输入系统。图45a示出了一个示例,优选的,六个按键被布置成三行4517-4519和两列4511-4512,用于在其上复制所述QWERTY布置。作为示例,上部左侧按键4513包括字母“QWERT”,其相应于位于图45的QWERTY键盘4500的上部行4507的左侧4501的按键上的字母。所述六个按键的组的其他按键遵循相同原理,并包括位于所述PC键盘的相应行和列的按键上的相应字母。
QWERTY键盘的用户通常确切地知道每个字母的位置。运动反射使其能够在QWERTY键盘上快速输入。如上所述,在六个按键上复制QWERTY布置使用户能够在具有减少数目的按键的键盘上进行按指法打(快速输入)。所述用户可以例如使用双手的拇指(左拇指用于左列,右拇指用于右列)用于数据输入。这看起来象在允许快速数据输入的PC键盘上进行按键。
可以理解,在上面示例中描述的键盘的左侧和右侧字符定义仅仅作为示例被示出。可以根据用户的习惯重新考虑所述定义。例如,字母“G”可以被考虑属于右侧而不是左侧。
根据本发明的一个实施例,具有包括使用QWERTY布置对按键进行分配的字母表字母的至少6个按键的小键盘可以用于本发明的逐字符/逐至少单词的一部分的数据输入系统。除了已描述的优点之外,所述布置也包括其他优点,例如:
-通过本发明的声音/语音识别系统通常对位于相同按键上的字母进行区分
-高度准确的数据输入、大大减少的字母按键的数目、和所述字母在所述小键盘上非常熟悉的布置(例如,QWERTY),使用户能够快速数据输入而不需要经常看小键盘或相应设备的显示单元
为了更好地准确度,可以考虑对该布置的更改。例如,图45b示出了如上所示的具有使用QWERTY字母布置的至少六个按键的小键盘4520,其中,为了分开字母“M”4522与字母“N”4523,已交换了字母“Z”4521和“M”4522。可以理解,这仅为示例,也可以考虑其他形式的更改。
必须注意,如上所述,分配给少数按键的QWERTY布置仅作为示例被示出和描述。字母表字母(在任何语言中)的其他配置可以被分配给在任何形状的键盘(例如小键盘)上以任何按键布置形式被安排的任何数目的按键,并用于本发明的按下和说话数据输入系统。同样,可以理解,例如标点符号、数字、功能等的其他符号可以被分配给所述按键、或包括所述字母的按键的小键盘的其他按键、或所述小键盘的其他按键,并根据如在由本发明人提交的本申请和以前提交的申请中所描述的本发明的数据输入系统进行输入。
根据本发明的一个实施例,更少数目的按键可以用于包括字母表字母(和如上所述的其他符号),并用于本发明的按下和说话数据输入系统。图45C示出了四个按键4530-4533的例子,其具有分配给它们的英语字母表的字符。为了保持该布置的熟悉性,图45b的小键盘4520上面两行的字母的QWERTY布置被保持,以及,图45b的所述小键盘4520的最低行的字母以下面方式被分布在所述四个按键4530-4533的相应列(例如左、右)的按键中,即,以保持“近似QWERTY”键盘的熟悉性和本发明的语音识别系统的高准确度的形式。例如,在这里分开字母“n”4537和“m”4538并分别分配给小键盘4530的右键4533和4532,字母“n”和字母“m”位于图45b的小键盘4520的最低的右键。可以理解,例如标点符号、数字、功能等的其他符号可以在所述按键或包括所述字母表按键的小键盘的其他按键上进行分布,并根据在本申请和由本发明人以前提交的申请中描述的本发明的数据输入系统进行输入。
也可以理解,迄今为止,识别准确度没有受到影响,甚至少数的按键可以用于包括所有字母表的字符,并用于本发明的按下和说话数据输入系统。图45d示出了英语字母表的字母被分配给的(例如小键盘的)两个按键4541-4542。所述小键盘可以用于本发明的按下和说话数据输入系统,但是对于具有大致类似发音的相同按键上字母,可能引起含混。
理论上,可以把所有字母表字母分配给单个按键,但是这可能极大地降低识别准确度。
虽然,按下按键并说出分配给所述按键的所需符号足以用于输入所述符号,但是因为例如不希望说出某些符号的某些原因,可以提供例如在本申请和以前的申请中描述的、关于本发明的数据输入系统的一些方法。如所示出的,可以通过按下按键而不说出所述符号对符号进行输入。例如,通过参考图45C,用户可以按下按键4530而不说话,以提供空格字符。根据另一种方法,可以通过按下第一个按键,保持所述按键按下并同时按下第二个按键,对符号进行输入。根据另一种方法,通过在释放相应于所述符号的按键之前按下预定按键(例如,相应于特殊字符),可以在例如字母的符号之后提供例如空格字符的所述特殊字符。
当具有少数按键用于数据输入时,为了更快的数据输入,可以把例如空格字符的频繁使用的非口语符号的输入分配给预定按键的两次按下动作而不说话。这可能是有效,因为如果把空格字符分配给例如单次按下按钮的模式,而例如字母的其他口语字符也以所述模式被分配给所述按钮,在输入口语字符之后,(为了不使声音/语音识别系统迷惑)为了输入所述空格字符,用户在按下按键(而不发声)之前不得不暂停一小段时间。把空格字符分配给按键的两次按下模式,对于所述按键没有口语符号被分配给两次按下模式,解决了该问题。用户简单地两次按下所述按键而没有所述暂停,而不是停止并按下所述按键一次。如上所述,另一解决方案是把口语和非口语符号分配给不同的按键,但这可能需要更多按键。
同样,可以理解,如在这里-上面描述的按键组上字母的QWERTY布置作为示例被提供。可以考虑例如字母表顺序、其他数目的按键、或任何按键布置的其他符号配置。例如,根据本发明的一个实施例,小键盘可以包括用于分配最频繁使用的字母的两个按键,并且所述小键盘可以具有把较不频繁使用的字母分配给的其他两个按键。
现今,允许数据输入的大多数电子设备配备有电话型小键盘。可以把如上所述的字母表字母的配置和分配应用到电话型小键盘的按键上。
图46a示出了电话型小键盘4600的示例,其中,把具有QWERTY配置的字母表字母(例如,如上所述)分配给所述小键盘的两个相邻列4601、4602的六个按键。由于处于相邻列,通过一只手(的拇指)的字母输入变得更加容易。同样如上所述,用户可以使用他的两个拇指(例如左拇指用于左列,右拇指用于右列)用于快速数据输入。可以理解,例如标点符号、数字、功能等的其他符号可以在所述小键盘的按键上分布,并根据如本申请和由本发明人以前提交的申请中描述的数据输入系统进行输入。
图46b示出了另一种电话型小键盘4610,其中,把具有QWERTY配置的字母表字母分配给所述小键盘的两个外面的列4611、4612的六个按键。由于处于两个外面的列,通过两手(的拇指)的字母输入变得更加容易。同样,如上所述,用户可以使用一只手用于数据输入。在该示例中,为了提高本发明的声音/语音识别系统的准确度,微小的修改已被应用。例如,已在相应的按键4613、4614上交换了字母“m”和“k”,用于避免字母“m”和“k”之间的含混。同样,已在相应的按键上交换了字母“f”和“z”,用于避免字母“f”和“z”之间的含混。可以理解,可以考虑配置中的其他变化。为了更快的数据输入,把例如空格字符的一些字符分配给多个按键4615、4616。
图46C示出了另一种电话型小键盘4620,其中,基于上述原理并在图45C中示出的字母表字母布置被分配给所述小键盘的四个按键。
可以理解,在例如小键盘的键盘的少数(例如6、4、2个等)按键上QWERTY布置的字母作为示例被描述。例如字母表顺序的字母布置的其他类型也可以被考虑,并被分配给例如2/3/4/5/6等个按键的少数按键。
很明显,例如本发明的逐字符数据输入和/或逐单词/单词的一部分数据输入系统的本发明所有数据输入系统(和它们相应应用)可以使用上述刚刚描述过的小键盘(例如,具有例如4到6个按键的少数按键)。
个人移动计算机/电信设备
移动设备必须小到足以提供方便的便携性。需要数据(例如文本)输入和/或数据通信的理想的移动设备必须具有小的数据输入单元(例如,至多,仅仅少数按键)和大的(例如宽的)显示器。
在少数按键上字母表字母(和其他符号)的布置和由通过所述少数按键的本发明的数据输入系统提供的快速准确的完整数据输入的能力可以允许重新考虑一些当前产品的设计,用于使它们更加有效。
这些产品之一是移动电话,其目前被用于例如文本通信和因特网的任务,并被预言成为移动计算设备。对实际的移动电话进行设计与上述原理相反。这是因为移动电话的(复杂的)数据输入系统需要使用许多按键,使用电话的大致表面,提供慢的数据输入,并为小型(例如窄的)显示单元留下较小的区域。
计算机最普遍使用的应用之一是单词处理过程。伴随因特网的使用,书写字母也将成为移动计算机/通信设备的最普遍使用的应用。所述应用需要宽的显示器,以允许在其整个宽度内起草、安排格式和浏览文档。例如,当编辑字母时,用户必须在其整个宽度内看见所述文档,而不必须把其滚动到左边或右边。
根据本发明的一个实施例,可以提供包括宽显示器和小的数据输入单元、具有快速数据输入能力的例如移动计算/通信设备的电子设备。图47a示出了具有两行按键4701、4702的移动计算/通信设备4700,其中,把字母表字母(例如,优选的,具有上述的QWERTY布置)分配给它们。如上所述,把例如数字、标点符号、功能等其他符号也分配给所述按键(或其他按键)。所述通信设备的所述按键可以与本发明的按下和说话数据输入系统相结合,以提供完整快速的数据输入。使用少数按键(例如,只有两行)用于数据输入,允许在所述设备内集成宽显示器4703。所述移动设备(很明显,所述显示单元)的宽度可以近似是A4纸的宽度,以提供近似的真实尺寸(例如宽度)的文档,用于浏览。所述移动计算/通信设备也可以具有例如按钮4704、4705的其他按钮,用于例如向上/向下、向左/向右滚动文档、在所述显示器4703中对光标4706进行导航、发送/结束功能等。同样,所述设备在例如其后侧或任何其他侧内可以包括鼠标。在由本发明人提交的多个申请(例如“笔式计算机”和“用于增强数据输入的特征(Features to Enhance Data Entry)”)中,已描述了在显示器和其他数据输入增强装置上的鼠标/浏览问题。所述申请的所有所述问题/特征可以在它们之间进行结合,和/或与本发明的数据输入系统和数据通信设备相结合。
继续描述图47a,在所述通信设备4700的左侧和右侧上两行4701、4702中按键的布置允许用户当持有所述设备4700时使用他的双手进行拇指输入。可以理解,可以考虑字母的其他配置和在所述设备上按键的其他布置上的其他符号。例如,设备可以包括以仅仅一行进行布置的少数按键,其中,把所述符号(例如字母)分配给它们。
同样如上所述以及在相应的专利申请中所描述的,通过在所述设备的后侧设置鼠标(未示出),其中,优选的,所述鼠标的按键在所述电子设备的相反侧(例如前侧)内,用户可以使用例如他的食指,用于操作所述鼠标同时使用其拇指按下相关的按钮。
同样,如上所述,可以使用所述设备作为电话。它可以包括至少一个麦克风4707和至少一个扬声器4708。在所述设备上所述麦克风和所述扬声器的位置之间的距离可以对应于鼠标和用户的耳朵之间的距离。
图47b示出了类似于图47的设备的设备4710的示例,其中,它的输入单元只包括以两行4711、4712进行布置的四个按键,其中,字母表字母和普通的数字根据已经描述的原理分配给所述按键。其他符号和功能(未示出)也可以根据已经描述的原理分配给所述按键和/或其他按键。用户可以使用他的两个拇指4713、4714,用于输入。
图47C示出了类似于图47b的设备的设备4720,其中,它的输入单元只包括以两行4721、4722进行布置的四个按键,这两行位于所述电子设备的一侧,其中,字母表字母和普通的数字可以根据已描述的原理被分配给所述按键。其他符号和功能(未示出)也可以根据已描述的原理分配给所述按键和/或其他按键。用户可以使用一只手(或双手),用于数据输入。在所述四个按键的布置的中心可以设置凸起部4723,用于允许数据输入而不用看小键盘。
图47d示出了类似于图47c的设备的设备4730,其中,它的输入单元包括以两行4731、4732进行布置的四个按键,这两行位于所述电子设备的一侧,其中,字母表字母和普通的数字可以根据已描述的原理分配给所述按键。对所述第一个两行按键之一(在该示例中,4731)进行复制的第三行按键4733位于所述电子设备4730的相反末端。按键的这种布置允许用户使用一只手或两只手作为他的选择,以输入数据。其他符号和功能(未示出)也可以根据已描述的原理分配给所述按键和/或其他按键。
图47e示出了根据本申请中描述的原理进行设计、并类似于前述实施例的电子设备4740的示例,区别在于,当需要时,所述电子设备内可以设置可延伸/可收缩/可折叠的显示器4741,以允许大型显示。例如,通过使用有机发光二极管(OLED)显示器,所述电子装置可以配备有单片(one-piece)可延伸的显示器。可以理解,所述显示器可以随需要进行延伸。例如,所述显示器单元可以展开多次,用于提供大显示器。其也可以是转动/非转动的显示单元,以便随需要进行延伸。可以理解,本发明的所述数据输入系统的按键可以是软按键,其在所述电子设备的所述显示单元的表面被实施。
根据本发明的一个实施例,如图47f所示,例如以上描述的电子设备的电子设备4750可以包括在其内部集成的打印单元(未示出)。虽然所述设备可以具有任何宽度,但优选的,所述电子设备的设计(例如,在该示例中,具有近似A4纸的宽度)可以是使得使用例如A4纸的打印/扫描/拷贝单元可以集成在所述设备内。例如,用户可以装入A4纸张4751,以打印页面。
对移动计算/通信设备提供完整的解决方案在许多情况下可能是非常有用的。例如,用户可以对例如信件的文档进行编辑并立即打印它们。同样例如,商人可以在客户同意下对例如发票的文档进行编辑并打印它,用于立即交付。
为了允许减少所述移动计算/通信设备的尺寸并仍能打印例如A4纸的标准尺寸纸张,可以提供相应于所述标准尺寸纸张的一半尺寸的设备。
图47g示出了例如A4纸的标准空白文档4760。如图47h所示,所述纸可以在其中间被折叠,提供两个半表面4761、4762。如图47i所示,可以把所述折叠文档4771装入例如本发明的移动计算/通信设备的电子设备4770的打印单元,以在其两个半表面4761、4762上打印例如编辑的信件的文档页面,提供标准尺寸打印信件。这将允许制造能打印标准尺寸文档的小尺寸的移动电子设备。
圆形键盘
根据本发明的一个实施例,小键盘的至少部分按键可以用产生圆形式的方式位于所述小键盘上。图48示出了包括位于中心按键4807周围的六个按键4801-4806的小键盘4800。所述中心按键可以比所述其他6个按键形状不同。例如,所述中心按键4807可以大于其他按键,或其上具有凸起部。具有例如QWERTY配置的字母表字母可以在所述按键中进行分布。可以把空格字符分配给位于中心的按键4807。当然,所述按键还可以包括如本申请中前面所描述的和以前的申请所描述的、以及通过本发明的数据输入系统所使用的例如数字、标点符号、功能等的其他符号。在小键盘上这种(例如圆形)按键布置的优点在于,通过触摸所述中心按键对所述中心按键进行识别,用户可以敲打所述按键而不看小键盘。
腕部通信设备
本发明的数据输入系统可以允许产生具有完整、快速的数据输入能力的小型电子设备。一种有前途的未来电信设备是腕部通信设备。已进行了许多努力以产生可工作的腕部通信/组织者(organizer)设备。这种设备的主要问题是可工作的相对快速的数据输入系统。一些制造商已提供了使用声音/语音识别技术的腕部电话的样机,用于数据输入。当然,这种设备的硬件和软件限制提供了糟糕的数据输入结果。如在本申请和由本发明人以前提交的申请中所描述的,本发明的数据输入系统与少数按键的使用相结合可以解决该问题,并允许在非常小型的设备上的快速数据输入。图49示出了包括少数按键(例如,在该示例中,布置于两行4901、4902的四个按键)的腕部电子设备4900的示例,其中,例如字母表字母、数字、标点符号等的符号根据本发明的数据输入系统的原理被分配给所述按键。所述电子设备还包括至少使用所述按键的本发明的数据输入系统。所述按键可以是例如类似于移动电话的常规按键或是触摸敏感型等任何类型。触摸敏感按键可以允许使用一只手的两个手指4903、4904进行触摸输入。也可以提供显示单元4905,用于浏览输入的数据、接收的数据等。也可以把观察单元4906与所述腕部设备进行装配。所述腕部装置也可以包括例如4907、4908的其他按钮,用于例如发送、结束等功能。必须注意,为了更快的数据输入,用户可以从他的腕部取下腕部装置并使用两个拇指,每个拇指用于按下一行按键的按键。可以理解,可以考虑其他数目的按键(例如,如上所述的6个按键)和其他的按键布置(例如,如上所述,例如圆形的按键布置)。
也可以理解,可以考虑用于腕部通信/组织者设备的其他类型的设计。例如,如图49a所示,腕部设备4910可以设置有翻盖部分4911。所述设备4910可以例如包括用于数据输入的大多数按键4913,并且所述翻盖4911可以包括显示单元4912(或者,反之亦然)。如图49b所示,在所述翻盖的另一侧,可以安装观察单元的显示单元4921。在关闭的位置处,所述腕部设备可以类似并用作腕表。
可以理解,以上示出和描述的腕部装置只作为示例被示出。可以对带有需要使用仅仅少数按键的本发明的按下和说话数据输入系统的其他类型的腕部设备进行考虑。例如,如图50a所示,包括使用少数按键5003的本发明的数据输入系统的腕部通信设备5000可以是可拆卸的-可连接到/可集成到观察单元5002的腕带5001。图50b示出了类似于图50a的一个5000的腕部设备5010,区别在于,显示单元5011和数据输入按键5012被分开,并分别位于翻盖5013和设备主体5014上。要注意,所述按键和所述观察单元可以以相对的关系围绕用户的腕部。
如上所述,本发明的数据输入系统可以集成在具有少数按键的设备内。PDA是经常使用手写识别系统或小型虚拟QWERTY键盘的电子组织者,其中,两个方法具有提供缓慢并令人失望的数据输入过程的主要缺点。通常,大多数PDA设备包括至少四个按键。本发明的数据输入系统可以根据以上描述的原理使用所述按键,用于为PDA设备提供快速而准确的数据输入。例如平板(Tablet)计算机的其他设备也可以使用本发明的数据输入系统。同样,例如,根据另一种方法,如所述的,可以在例如PDA、平板计算机等电子设备的显示单元上对例如图49a中所示的少数大虚拟(例如软的)按键(例如4、5、6、8等)进行设计,并把这些按键用于本发明的数据输入系统。作为示例,在例如平板计算机的显示单元的大显示器上按键的布置和配置可以类似于如图47a-47d所示出的那些。
用于数据输入的移动跟踪
把例如字母表字母、数字、标点符号、功能等符号组划分为少数子组、并使用本发明的按下和说话系统使用它们,这允许通过最终使用例如对用户的移动进行识别的其他用户行为识别系统取代按钮按下动作,从而可以消除按钮按下动作的使用。所述移动可以是例如用户的手指、眼睛、脸等的移动。这可能非常有利于具有有限运动能力的用户,或需要更加间断的数据输入系统的环境中。例如,可以考虑例如一个或多个手指或其眼睛的用户身体部位的四个移动方向,而不是使用四个按键。
根据本发明的一个实施例,通过参考图45C并考虑数据输入系统的符号被布置在四个区域作为例子,用户可以把他的眼睛(或在脸部跟踪系统的情况下,他的脸,或在手指跟踪系统的情况下,他的手指)移动到上部右侧并说出“Y”,用于输入所述字母。相同的移动而不说话可以被分配给例如标点符号“.”4535。为了输入字母“s”,用户可以向较低部左侧移动他的眼睛并说出“S”。通过只使用少数清楚/容易识别的用户移动,其被分配给与例如说出所需符号的(本发明的数据输入系统的)特征相结合的少数符号子组,本发明的数据输入系统将提供快速而准确的数据输入而不需要硬件制造(例如按钮)。要注意,在本实施例中,用户身体部位的预定移动可以取代其他实施例中的按键按下。本发明的数据输入系统的其余过程照旧。
可以理解,如在以前的申请中所述的,可以使用例如敏感的小键盘或用户的手指的其他对象,而不使用按键,用于把所述符号子组分配给它们。例如,为了输入所需符号,用户可以在桌上敲击(所述符号被分配的)手指并说出分配给所述手指和所述移动的所述字母。同样,可以使用其他的用户行为和/或例如唇读系统的行为识别系统,而不识别用户的声音(例如语音)。
本发明的至少单词的一部分级别(例如音节级别)数据输入的一个主要问题在于,如果存在外部噪音,并且所述单词的一部分的语音以元音结束,则该系统可能错误识别所述语音,并提供通常相应于所需部分的开始并以辅音结束的输出。例如,如果用户说出“mo”(同时按下相应于字母“m”的按键时),该系统可能提供例如“mall”的输出。为了消除该问题,本发明的数据输入系统可以应用一些方法。
根据本发明的一个实施例,如以前提及的,以元音发音结束的单词/单词的一部分可以与具有类似开始发音但以辅音结束的单词/部分归为一类。在输入所述单词/部分之后,辞典比较和短语结构将决定要被输入的所需部分是什么。例如,分配给相同按键的单词/单词的一部分“mo”和“mall”也被归类在相同种类中,意味着当用户按下所述按键并说出“mo”或“mall”时,在每种所述情况下,系统考虑两个音素集的相应字符集。这是因为,应该考虑到所述两个音素集“mo”和“mall”的发音(特别是在噪音环境中)是大致类似的,并可能被声音识别系统错误识别。
根据本发明的一个实施例,小键盘可以被用于至少本发明的至少单词的一部分级别(例如音节级别)数据输入系统,其中,字母表字母被布置在例如小键盘按键的两列按键上。
图51示出了小键盘5100的示例,其中,字母表字母被布置在两列按键5101和5102上。所述布置使具有近似发音的字母/音素位在不同的按键上。所述布置还对QWERTY布置进行一些修改。在该示例中,中间列不包括字母字符。如上所述,本发明的至少单词的一部分级别(例如音节级别)数据输入系统的不同方法可以使用所述类型的小键盘,或使用如在图45a到45d的前面的图中所示的、具有少数按键的其他小键盘。
如上所述,根据本发明的一个实施例,如果单词/单词的一部分以元音结束,用户可以按下相应于所述单词/单词的一部分的开始音素/字母的所述小键盘的按键,并说出所述单词/单词的一部分,用于输入它。如果必要,为了提供更多关于所述部分的信息,用户可以按下相应于构成字母的至少一部分的所述部分的其他按键。例如,如果所述单词/单词的一部分以辅音音素结束,用户可以按下相应于所述辅音的其他按键。
为了允许系统对相应于单词/单词的一部分的开始字母/音素的按键按下和相应于例如所述单词/单词的一部分的最后字母/音素的按键按下之间进行区分,可以提供例如此后描述的不同方法。
根据本发明的一个实施例,当用户按下相应于单词/单词的一部分的开始音素/字母的第一个按键同时说出它时,他可以保持所述按键被按下,并按下相应于所述单词/单词的一部分的(优选的,是最后的辅音的)另一字母的至少其他的按键。
如果所述另一字母位于相同的开始按键上,用户可以双击所述按键同时说出所述单词/单词的一部分。
图51a示出了小键盘5110,其中,字母表字符(以大写示出)被布置在两列按键5111、5112上。包括所述字母表字符的每个所述按键也包括分配给相同行的相对的按键的字母表字符(以小写示出)。根据本发明的一个实施例,当用户尝试输入单词/单词的一部分时,他按下相应于所述印成大写(例如,在所述按键上以大写印出)的单词/单词的一部分的开始字符/音素的按键,并说出所述单词/单词的一部分。如果所述用户希望提供例如按下相应于所述单词/单词的一部分的其他字母的按键的更多信息,(同时保持所述第一个按键按下,)所述用户可以按下相应于所述单词/单词的一部分的所述(例如,在所述相对列的按键上以大写或小写印出的)其他字母的位于相对列上的按键。例如,如果用户希望输入单词“fund”,他首先按下按键5113并说出所述单词,并且(当保持所述按键5113按下时)所述用户连续按下例如相应于辅音“n”和“d”的两个其他按键5114和5115。
图51b示出了类似图51a的小键盘的小键盘5120,区别在于,这里的两列5121和5122被分配给相应于单词/单词的一部分的开始音素/字母的字母/音素,并通过按下至少相应于除了所述单词/单词的一部分的开始字母之外的至少一个字母的按键,使用其他的列5123提供关于所述单词/单词的一部分的更多信息。这可以允许只使用一只手的数据输入。例如,如果用户希望输入单词“fund”,他首先按下按键5124并说出所述单词,并且(在释放所述按键5124之后)所述用户连续按下例如相应于辅音“n”和“d”的两个其他按键5125和5126。
根据本发明另一个实施例,如上所述,可以把需要语音(用于输入它们)的符号分配给第一预定数目的对象/按键,而不用语音进行输入的符号被分配给另一预定数目的按键,其与所述第一预定数目的按键分开。
根据本发明另一个实施例,如果提供字母的按键只包括口语符号,则用户可以按下相应于所述单词/单词的一部分的首字母/音素的按键,并且优选的,同时说出所述单词/单词的一部分。然后,他可以按下相应于构成所述单词/单词的一部分的其他字母的其他按键而不发音。系统识别出,没有语音的按键按下对应于与所述单词/单词的一部分的其他字母有关的其他信息。例如,通过参考图51,并考虑只把口语符号分配给所述小键盘提供字母的按键,如果用户希望输入单词“fund”,他首先按下相应于字母“f”的按键同时说出“fund”,并在释放所述按键之后,所述用户连续按下例如相应于字母“n”和“d”的两个其他按键而不说话。
如上所述,本发明的单词/单词的一部分数据输入系统也可以在没有对组合的所选择的字符集和单词/单词的一部分的词典进行比较的步骤下进行工作。用户可以逐部分地输入单词,并使它们直接被输入。如上所述,这对以不同语言输入单词/单词的一部分是有用的,而不用担心它们是否在单词/单词的一部分中存在。例如模式按键的装置可以被用于通知系统,没有所述比较的组合字符集将被输入/输出。如果已产生多于一个组合字符集,可以把它们显示给用户(例如,在显示器显示的列表中),并且,用户可以通过例如按下“select”按键对它们其中之一进行选择。在另一个实施例中,如果已产生多于一个组合字符集,通过进入到例如输入下一个单词/单词的一部分、标点符号、例如“enter”的功能等,可以自动输入具有最高优先级的组合字符集。
同样,根据本申请中已描述的所述原理,可以通过逐部分地输入而具有/没有与单词词典进行比较的步骤,对单词进行输入。同样,如上所述,所述部分可以是字符或单词的字符集(宏)。
根据本发明的一个实施例,除了字母表字母之外,本发明的逐字符数据输入系统可以使用有限数目的频繁使用的单词的一部分(例如“tion”、“ing”、“sion”、“ment”、“ship”、“ed”等)和/或有限数目的频繁使用的单词(例如“the”、“and”、“will”等),用于提供需要少量存储器和更快处理的快速而准确的数据输入系统。如在本申请和以前提交的申请中所描述的,根据本发明的数据输入系统的原理,把所述有限数目的单词/单词的一部分分配给小键盘的相应按键。同样,很明显,如在本申请和以前提交的申请中所描述的,它们可以根据本发明的数据输入系统原理进行输入。根据该实施例,例如,用户可以用四个部分“p”、“o”、“r”和“tion”输入单词“portion”。为此,例如通过使用图45C的小键盘,所述用户可能首先说出“p”并(优选的,几乎同时)按下相应的按键4533。然后,他可以说出“o”并(优选的,几乎同时)按下相应的按键4533。然后,所述用户可以说出“r”并(优选的,几乎同时)按下相应的按键4530。而最后,他可以说出“shen”(例如,单词的一部分的发音“tion”)并(优选的,几乎同时)按下把部分“tion”分配给的(例如相应于字母“t”的,单词的一部分“tion”的首字母)按键4530。
如上所述,可以使用/不用如在本申请中前述的对输入单词和单词词典的单词进行比较的步骤,对本发明的该实施例进行处理。在不使用所述比较步骤的情况下,可以逐部分地输入/输出数据。如上所述,本发明的该实施例有利于在小型设备(例如腕带电子设备、移动电话)中集成本发明的数据输入系统,其中,存储容量和处理器速度受到限制。除了(或取代)频繁使用的单词/单词的一部分的所述列表之外,用户也可以把他喜欢的单词/单词的一部分添加到所述列表中。
如上所述,本发明的数据输入系统可以使用少数按键,用于完整的数据输入。可以理解,可以提供具有不同预定部分的单个多模式/多部分按钮,而不是所述少数按键,其中,每个部分对用户在所述多模式/多部分按钮的所述每个所述不同预定部分上的用户动作/接触进行不同的响应,其中,可以把如在本发明所述的字符/音素集/字符集分配给带有所述预定部分的所述动作/接触。图52示出了多模式/多部分按钮5200的示例(例如类似在许多电子游戏、移动电话、TV远程控制器等中使用的多/模式按钮),其中,所述按钮的五个部分5201-5205的每一个对用户在所述部分上的手指动作(例如按下)/接触进行不同地响应。例如,可以把不同字母表字符和标点分配给四个所述部分5201-5204,并可以把空格字符分配给中间部分5205。可以理解,所述按钮5200具有例如椭圆形的不同形状,并可以具有不同数目的部分,其中,不同的符号配置可以被分配给每个所述部分。
如上所述,并如在图47a到47i的示例所示出的,可以提供包括宽显示器和小数据输入单元、具有由本发明的数据输入系统导致的快速数据输入能力的例如移动计算/通信设备的电子设备。同样如上所述,所述电子设备可以包括其他按钮。图53示出了电子设备5300,其包括用于输入文本和相应功能的按键5302、5303(在该示例中,双向按键),以及其他按钮行5304、5305,用于输入例如拨电话号码(例如,不说出所述数字)、在显示器内导航、发送/接收呼叫等的其他功能。如在本发明中所述的,用于至少文本输入的一组符号可以被分配给按下例如按键5302-5303的双向按键的每一侧。一个双向按键可以对应于两个单独的按键。操作一个双向按键可能比操作两个单独的按键更容易。在该实施例的示例中,用户可以通过使用双手的拇指5306、5307输入数据。
如在本专利申请的不同段落和由本发明人以前提交的申请中所述的,可以理解,本发明的数据输入系统可以使用例如虚拟(软)按键的其他类型的按键。同样,在本专利申请和由本发明人以前提交的申请中所描述的其他数据输入特点的至少部分可以集成在本发明的计算机/电信设备中。例如,如以前所述的,可以对可延伸的(例如可拆卸的)麦克风/照相机/天线5301和在所述设备后侧内的鼠标(未示出)进行实施,其中,鼠标的相应按键在所述计算机/电信设备的前侧或任何其他侧上。
如上所述,对完整的数据输入可用的部分/全部符号可以被分配给少数按键,并用于本发明的数据输入系统,以便提供完整的快速容易的数据输入。所述少数按键可以是小键盘的部分按键。图54示出了把PC键盘的符号分配给少数按键5400的另一个示例。在该示例中,把用于在显示器上(例如在文本中)导航光标的箭头分配给口语模式。例如,用户可以单击按键5401并说出“left”,用于把(例如,在显示器上显示出的文本中的)光标向左移动一个字符。为了把光标向左移动几个字符,所述用户可以按下按键5401,同时说出“left”,并保持所述按键被按下。光标可以保持向左移动,直到用户释放所述按键5401。为了把所述光标向右移动,用户可以按下按键5402同时说出例如“right”,并使用刚刚描述的过程。可以使用类似的过程,用于通过按下相应的按键并说出相应的单词,在文本内上下移动光标。
根据本发明的一个实施例,在多个方向上(例如左、右、上和下)移动光标可以被分配给至少一个按键。继续参考图54,作为示例,在不同的方向上移动光标可以被分配给单个按键5403。例如,用户可以按下按键5403并说出“left”,使所述光标向左移动。为了使光标向右、上或下移动,所述用户可以按下按键5403并分别说出“right”、“up”或“down”。
可以理解,在该示例中,(对于完整的数据输入可用的部分/全部符号可以被分配给的)按键数目只作为示例被示出。根据例如电子设备设计的需要,所述按键数目可以不同。
根据本发明的一个实施例,具有少数按键的本发明的小键盘/数据输入单元可以包括例如麦克风、扬声器、照相机等其他特征。所述小键盘可以是连接到相应电子设备的独立单元。所述独立小键盘可以允许集成基本覆盖所述电子设备的整个侧面的显示单元。图55a示出了本发明的具有至少少数按键(或至少相应于所述少数按键的多向按键)5501、5507、5508、5509的独立小键盘5500,对于完整的数据输入可用的部分/所有符号被分配给所述少数按键,用于数据(例如文本)输入。所述小键盘也可以包括例如麦克风5502、扬声器5505、照相机5503等其他特征。所述其他特征可以集成在所述小键盘内,或与其相系缚/相连等。如图55b所示,所述小键盘5500(通过侧面图表示)可以包括系缚装置5504,用于把所述小键盘系缚到例如用户的手指/腕部的另一个对象上。所述小键盘可以(无线地或通过导线)连接到相应的电子设备上。图55C示出了根据刚刚描述的原理的独立小键盘5510。如上所述,通过使用与本发明的数据输入系统相结合的少数按键,用于完整数据输入,在短时间的训练后,用户可以通过所述少数按键输入例如文本的数据,而不用看着所述按键。基于该原理,用户可以把所述小键盘5510持在其手(例如手掌)5511中,使其靠近口的位置(通过使他的手接近他的嘴),并根据本发明的数据输入系统的原理,按下所需按键而不说话/说出该符号(例如相应于所述按键按下的字符、字母、单词/单词的一部分、功能),而不用看着所述按键。如上所述,所述小键盘可以无线地或通过导线连接到相应的电子设备上。在该示例中,小键盘通过导线5512连接到相应的设备(未示出)上。同样,在该示例中,麦克风5513被系缚到所述导线5512上。把所述小键盘5510放在靠近嘴的手(例如手掌)中用于数据输入,具有许多优点,例如:
-用户不需要带上戴在头上的麦克风
-所述用户可以非常靠近麦克风而说话,因此他可以间断地说话
-用户手掌的空洞可能加重用户的声音,用于通过麦克风更好地接收
-用户的手(例如手掌)大致消除说话时的外部噪音
-用户的手(例如手掌)防止用户的声音被扩散(例如,不干扰别人)
可以理解,本发明的独立小键盘/数据输入单元也可以包括在本申请和由本发明人以前提交的申请中所描述的部分/所有特征。例如,所述独立小键盘/数据输入单元可以包括照相机,例如用于本发明的唇读系统。其还可以包括基于本发明的牙齿识别系统的装置。所述小键盘还可以包括例如电池、把所述小键盘与相应的装置相连的无线装置的其他特征。利用所述小键盘也可以实施天线。在导线连接的情况下,所述导线还可以包括小键盘和/或相应电子设备的天线系统。
根据本发明的一个实施例,如图55d所示,本发明的独立小键盘5520可以用作项链/下垂物。这使本发明的小键盘/数据输入单元的使用能够容易、间断、便携。
根据本发明的一个实施例,如图55e所示,本发明的独立小键盘5530可以与例如PDA/平板PC的显示器的触摸敏感显示器的笔进行系缚/集成。这使本发明的小键盘/数据输入单元的使用能够容易、间断、便携。
根据本发明的一个实施例,如图55f所示,具有少数按键的本发明的小键盘可以是多部分小键盘5540(以接近的位置被示出)。这将允许更加减少所述小键盘的尺寸,允许提供非常小尺寸的小键盘,通过该小键盘,提供完整的数据输入。多部分小键盘已由本发明人发明,并且专利申请已经提交。在所述申请中所描述的一些/所有描述以及特征已应用到具有少数按键的本发明的多部分小键盘中。
根据本发明的一个实施例,如图55g所示,具有少数按键5550的本发明的小键盘/数据输入单元在所述小键盘的后侧(或其他侧)内可以包括指示单元(例如鼠标)。所述指示单元可以是例如平板型5551或球型(未示出)的任何类型。所述指示单元的按键可以位于所述数据输入单元的前侧。位于例如数据输入单元后侧的一侧的点击(例如鼠标)单元已由本发明人发明,并因此已提交专利申请。在所述申请中所描述的一些/所有描述以及特征可以应用到具有少数按键的本发明多部分小键盘中。例如,所述小键盘的至少一个按键也可以象所述指示单元的按键那样工作,所述指示单元位于所述小键盘的后侧。
图55h示出了包括少数按键5565-5568的数据输入单元5561的本发明数据输入装置5560。所述装置还具有点击(例如鼠标)单元,用于与所述数据输入单元相结合进行工作,用于完整的数据输入和操作数据。所述装置和它在表面上的移动可以类似于常规的计算机鼠标装置。所述集成装置可以无线地或通过导线5562连接到例如计算机的相应电子设备上。如图55i所示,指示(例如鼠标)单元5569可以位于例如所述的所述数据输入单元5561(在这里未示出,位于所述装置的另一侧)后侧的一侧内。所述指示(例如鼠标)单元5569可以是滚球类型的鼠标。用户可以与使用与本发明的数据输入系统相结合的所述集成数据输入装置5560的计算机一起操作/工作,集成数据输入装置5560取代常规的PC键盘和鼠标。鼠标按键可以是例如5563、6664的常规按键(参见图55h),或把它们的功能分配给所述数据输入单元5561的所述少数按键(在该示例中,5565-5568)。
根据本发明的一个实施例,如在本专利申请和由本发明人以前提交的专利申请中所述的,本发明的数据输入系统可以与单词预报(predictive)软件相结合。当按下相应按键时,用户可以通过使用本发明的数据输入系统(例如说出相应于至少一个字符的单词的一部分)输入单词的至少一个开始字符,并继续按下相应于所述单词剩余部分的按键而不说话。(由于本发明的准确的数据输入系统导致的)精确输入所述单词的开始字母伴随按下相应于所述单词的剩余字母的按键(而不说话),可能使准确的数据输入系统还允许更少的语音。可以理解,在本实施例中,优选的,可以把不是字母的符号分配给单独的按键或与相同按键的单独交互。
根据本发明的一个实施例,具有少数按键的本发明的小键盘/数据输入单元可以与例如移动电话的电子设备的常规耳机进行连接/集成。图55j示出了由用户使用的常规耳机5570。耳机可以包括扬声器5571、麦克风5572和本发明的小键盘/数据输入单元5573(在该示例中,多部分小键盘)。可以理解,当单独的头部麦克风被用于输入用户的相应语音时,本发明的小键盘/数据输入单元可以与相应的电子设备一起使用,用于对按键按下进行输入。
与本发明的数据输入系统相结合的扫过过程
如上所述,本发明的数据输入系统可以使用例如少数按键、一个或多个多模式(例如多方向的)按键、一个或多个敏感垫、用户的手指等任何种类的对象。同样如上所述,例如所述按键的所述对象可以是例如常规的移动电话类型按键、接触敏感按键、相应于其上的两种或多种压力水平的按键(例如,触摸级和多种压力水平)、软按键、与光学识别相结合的虚拟按键等任何类型。
如上所述,当根据本发明的数据输入系统输入单词的一部分时,为了更好地识别,除了提供相应于所述部分的首字符/音素的信息(例如,按键按下和速度)之外,用户可以提供相应于例如最后字符、和/或所述部分的中间字符的更多字符的其他信息。
根据本发明的一个实施例,如图56所示,具有例如区域/按键5601-5604的少数预定区域/按键的接触敏感表面/垫5600可以被设置,并与本发明的数据输入系统一起工作。根据本发明的数据输入系统,把符号组分配给每个所述区域/按键。该实施例的目的是增强本发明的单词/单词的一部分(例如,包括逐字符)数据/文本输入系统。根据该实施例,为了提供单个字符数据输入,用户可以例如单击/双击按下相应的区域/按键,其(如上所述,根据本发明的数据输入系统)与语音相结合/不结合。为了输入具有至少两个字符的单词/单词的一部分,当说出所述单词/单词的一部分时,用户可以用例如他的手指或笔扫过所述表面的至少一个区域/按键,其与所述单词/单词的一部分的至少一个字母相关。优选的,扫过过程可以从相应于所述单词/单词的一部分的首字符的区域开始,并且优选的,以相应于所述单词/单词的一部分的最后字符的区域结束,并最终(例如,为了更容易的识别)在相应于所述单词/单词的一部分的一个或多个中间字符的区域上经过。当所述用户从所述表面/敏感垫移开(例如抬起)所述手指(或所述对象)时,相应于所述单词/单词的一部分的信息输入可以结束。可以理解,可以在所述相应的扫过动作结束之前结束用户的语音,但是,系统可以考虑所述整个相应的扫过动作。
根据本发明另一个实施例,为了输入单词/单词的一部分,当说出它时,用户可以用他的手指扫过区域/按键(如果多于一个连续的字符由相同区域/按键进行表示,相应地,在所述相同区域/按键上的多个不同方向上扫过),该区域/按键相应于被输入的所述单词/单词的一部分的所有字母。参考图56a,例如,为了输入单词/单词的一部分“for”,当说出它时,用户可以用例如他的手指或笔扫过区域/按键5612、5614和5611,其分别相应于字母“f”、“o”、和“r”(由多方向箭头5615示出)。然后,用户可以从所述表面(例如敏感垫)上抬起他的手指,通知系统相应于所述单词/单词的一部分的信息输入结束。
根据本发明另一个实施例,为了更快的交互,为了输入单词,用户可以用他的手指扫过相应于被输入的所述单词/单词的一部分的一些字母的区域。参考图56b,例如,为了输入单词/单词的一部分“for”,当说出它时,用户可以在从(例如,相应于字母“f”的)区域5622开始并于(例如,相应于字母“r”的)区域5621结束的区域5622、5621(由箭头5625表示)上用他的手指或笔扫过,而不经过相应于字母“o”的区域5624。
在敏感垫上的扫过过程优于常规非敏感按键的按下/释放动作之处在于,当使用扫过过程时,只有在完成相应于多个(或所有)单词/单词的一部分的字母的区域/按键上扫过之后,用户才可以把他的手指从所述敏感表面上抬起。即使用户在相应的扫过动作结束之前结束了所述部分的语音,系统还考虑整个相应的扫过动作(例如,从用户首次接触所述表面的第一个区域/按键的时间、直到用户从所述表面抬起他的手指的时间)。接触/扫过并从所述表面抬起手指也可以通知系统:相应的语音的开始点和结束点(例如,优选的,所述语音大约在所述时间期限内)。
总而言之,根据本发明的一个实施例,与相应于具有预定数目的区域/按键的表面进行扫过交互的轨迹(例如,相应于具有至少两个字符的单词)可以包括下面的点(例如轨迹点),其中,每个所述点对应于所述单词/单词的一部分的字母,其中预定数目的区域/按键相应于所述交互:
1)开始点,相应于单词/单词的一部分的首字符
2)扫过方向改变点(例如,不是必须的,对只有两个字符的单词不存在),通常相应于所述单词/单词的一部分的中间字符(如果存在)
3)相应于所述单词/单词的一部分P271的其他字符(优选的,最后字符(优选的,可发音的))
图57示出了一个示例,在表面5700上相应于单词“bring”的扫过动作的轨道5705具有四个区域/按键5701-5704。开始点5706通知系统所述单词的首字母位于区域/按键5703上。相应于方向改变和扫过动作结束的其他三个点/角度5707-5709通知系统:所述单词包括由分配给区域5701、5704和5702的字符之一表示的至少三个的多个字母。优选的,在所述单词(例如,在该例中,“bring”)中所述字母的顺序对应于所述轨迹点的顺序。可以理解,相应于方向改变的所述角度可能被较少地强调,并形成例如曲线形式。图57a示出了相应于单词“time”的扫过轨迹(由具有弯曲的角度5715的箭头5714示出)的示例。在该示例中,根据字母“t”(例如,由按键/区域5711表示)、“i”(例如,由按键/区域5712表示)和“m”(例如,由按键/区域5713表示),已提供扫过动作。可以理解,当扫过时,用户说出所述单词(例如在该示例中,“time”)。
本发明的敲击/按下和/或扫过数据输入系统将显著地减少字母和以所述字母开始并具有类似发音的单词之间的含糊。基于刚刚描述的原理,例如,为了输入字母“b”,和单词/单词的一部分“be”和“bee”,可以考虑以下过程:
-为了输入字母“b”,如图58a所示,用户可以照旧单击/接触(而不扫过)相应于字母“b”的敏感区域/按键(例如,在该示例中,区域/按键5801),同时发出所述字母的音。
-为了输入单词/单词的一部分“be”,如图58b和上面描述的所示,当发出所述单词/单词的一部分的音时,用户可以在敏感表面5810上扫过,从相应于字母“b”的区域5811开始,接着经过/结束于相应于字母“e”的区域5812。箭头5813表示相应的扫过路径/轨迹。
-为了输入单词/单词的一部分“bee”,如图58c和以上描述的所示,当发出所述单词/单词的一部分的音时,用户可以在敏感平面5820上扫过,其开始于相应于字母“b”的区域5821,经过/扫过相应于(例如首)字母“e”的区域5822,接着相应于(第二)字母“e”在相同区域5822上改变扫过方向。使两个轨迹点(例如,在该示例中,中间点和终点)在相同区域/按键上可以通知系统:所述单词/单词的一部分的至少两个字母位于/分配给所述区域/按键,并位于在述单词/单词的一部分中相应于前面的区域/按键的字母之后。箭头5823表示相应的扫过路径。
必须注意,如所示出的,在扫过方向上的每次改变可能对应于单词中其他相应的字母。当从一个区域扫到另一个区域时,用户可能经过他不希望经过的区域。系统可以不考虑所述路径,例如,在所述区域上的扫过轨迹是否不重要(例如,参见图58c的区域/按键5825的扫过路径5824),和/或在所述区域中是否没有角度(例如,没有方向的改变)等。同样,为了减少和/或消除含混,可以考虑例如区域5826的穿越(例如中间)区域。
如上所述,可以对本发明的逐字符数据系统和本发明的逐单词/单词的一部分数据输入系统进行结合。同样,可以对本发明的扫过和按下实施例进行结合。例如,为了书写例如“stop”的单词,用户可以用两个部分“s”和“top”输入该单词。为了输入字母“s”,用户可以(单次)触摸/按下相应于字母“s”的区域/按键,并同时发出所述字母的音。然后,为了输入部分“top”,当发出所述部分的音时,根据所述的本发明的扫过过程的原理,用户可以用例如他的手指在相应的区域/按键上扫过。
为了减少或消除与敏感表面的区域/按键的偶然接触的含混性,除了接触敏感特征以外,例如点击/较重压力系统(例如,设置有常规移动电话小键盘的按键的系统)的其他特征可以被提供有各自的区域/按键。在这种情况下,例如,为了(例如,根据本发明的逐字符数据输入系统)输入单个符号,而不是轻微接触,用户可以更重地按下相应的区域/按键,用于输入所述符号。为了进入到本发明的逐单词/单词的一部分数据输入系统,用户可以通过用例如他的手指在相应的区域/按键上轻微(例如,使用轻微压力)扫过,使用前述的扫过过程。
如果单词/单词的一部分包括在单个区域/按键上表示的字母,当说出所述单词/单词的一部分时,在多个连续的不同方向(例如,至少一个方向,并至多方向数等于构成所述单词/单词的一部分的字母数(n)减一(例如,n-1个方向))上,用户可以用例如他的手指扫过所述区域/按键。例如,为了输入单词“you”,如图59a所示,除了说出所述单词之外,用户可以把他的手指在区域/按键5901上扫过一次,用于通知系统把所述单词/单词的一部分的至少两个字母分配给所述区域/按键(根据本发明的一个实施例,输入单个字符由在所述区域/按键上的敲击进行表示)。为了通过向系统提供更多信息而输入相同单词,如图59b所示,所述用户可以用他的手指扫过在相应于所述单词/单词的一部分的至少三个字母(例如,在该示例中,构成单词“you”的所有字母)的区域/按键5911上的两个连续的不同方向5912、5913(例如,两个直的/几乎直的方向),而不从所述区域/按键(例如,在本示例中提供三个轨迹点,一个开始,一个中间,一个结束)上移开(例如抬起)他的手指。
如上所述,为了输入单词/单词的一部分,用户可以说出所述单词/单词的一部分,并在表示单词/单词的一部分的相应符号(例如字母)的至少部分区域/按键上扫过例如他的手指的对象。根据本发明的一个实施例,优选的,用户可以扫过表示首字母、至少所述单词/单词的一部分的一个中间字母(例如,如果存在)和最后字母的区域/按键。优选的,考虑要扫过的最后字母可以是相应于单词/单词的一部分中的最后可发音的音素的最后字母。例如,单词“write”的要被扫过的最后字母可以考虑是(例如,可发音的)字母“t”而不是字母“e”(例如,在该示例中,字母“e”不发音)。可以理解,如果需要,用户可以根据两个字母“t”和“e”而扫过。
根据另一个示例,用户可以根据单词/单词的一部分的首字母和所述单词/单词的一部分的至少一个剩余辅音而扫过。例如,为了输入单词“force”,用户可以根据字母“f”、“r”和“c”而扫过。
根据本发明的一个实施例,为了以至少两个部分输入单词,用户首先(例如,通过用其手指)扫过根据第一部分的区域/按键,同时说出所述部分。然后,他可以从敏感表面上抬起(例如移开)他的手指,用于通知系统所述(例如,在该示例中,第一)部分的输入已结束。接着,用户进入到根据相同原理输入下一个部分(诸如此类)。在单词的末尾,用户可以提供例如按下/接触空格键的动作。
为了以至少两个部分输入单词,根据本发明另一个实施例,用户首先(例如,通过用其手指)扫过根据第一部分的区域/按键,同时说出它。然后,他(不从所述敏感表面抬起/移开他的手指)进入到根据相同原理输入下一个部分(诸如此类)。在单词的末尾,用户可以从敏感表面抬起(例如移开)他的手指,用于通知系统所述整个单词的输入已结束。然后,用户可以提供例如按下/接触空格键的动作。在该实施例中,如所述的,从书写表面上抬起手指可以对应于整个单词输入的结束。因此,在所述单词之前/之后可以自动提供空格键。
可以理解,优选的,扫过区域/按键和,如果需要,所述区域/按键内的不同方向的顺序可以对应于相应的字母在相应的单词/单词的一部分中的位置顺序(例如,从左到右、从右到左、从上到下等)。例如,当以英语输入单词/单词的一部分时,用户可以扫过相应于/或根据在所述单词/单词的一部分中从左到右位置的字母的区域/按键。在另一示例中,当以例如阿拉伯语或希伯来语输入单词/单词的一部分时,用户可以扫过相应于/或根据在所述单词/单词的一部分中从右到左位置的字母的区域/按键。如所述的和前述的,可以理解,用户可以根据/相应于所述单词/单词的一部分扫过区域(和方向),或根据/相应于所述单词/单词的一部分的一些字母扫过区域(和方向)。
如上所述,在本专利申请和由本发明人以前提交的专利申请中所描述的部分或所有系统、方法、特征等可以进行结合,用于提供不同的实施例/产品。例如,在逐部分输入单词之后(例如,通过使用本发明的扫过数据输入),如上所述,对于每个部分的输入,可以通过系统选择多于一个的相关的字母串。在这种情况下,如上所述,可以提供所述选择的不同组合并与单词数据库的单词进行比较。如果所述组合对应于多于一个所述词典的单词,则可以根据它们的使用频率显示给用户,从最频繁使用的单词到最不频繁使用的单词。该问题已在前面详细描述过。
可以把本发明的自动空格过程应用于使用本发明的扫过方法的数据输入系统。
如上所述,不同的自动空格过程可以被考虑,并与本发明的数据输入系统相结合。根据本发明的一个实施例(如上所述),每个单词/单词的一部分可以具有特殊的空格特性,例如以下描述的这些:
-优选的,单词的一部分可以是默认连接到前面单词/单词的一部分上的那种(例如“ing”、“ment”、“tion”等)
-优选的,单词的一部分可以是连接到前面单词/单词的一部分上、并也需要下一个单词/单词的一部分连接于它的那种(例如单词“information”中的“ma”)-单词的一部分可以是独立的有意义的单词,可以不连接到以前的单词/单词的一部分上。默认的,在所述单词之前或之后自动提供空格字符,除非,例如用户或短语上下文需要它连接到所述前面/下一个单词/单词的一部分上(例如“for”、“less”)
-可以考虑(例如默认)例如字母、数字、标点符号的单个字符是自动连接到前面/下一个单词/单词的一部分上,除非另作决定
根据本发明的一个实施例,基于本发明的逐字符数据输入系统,例如字母的单个字符的输入可以分配给与语音结合/不结合的触摸敏感表面的相应区域/按键的按下/敲击,而单词/单词的一部分输入可以被分配给说出所述单词/单词的一部分,同时在所述单词的开始字符被分配给的区域/按键上提供单方向(例如,几乎直的方向)扫过动作。例如,为了输入字母“z”,当说出所述字母时,用户可以按下/触摸(不扫过)把所述字母“z”分配给的按键。为了输入单词/单词的一部分“zoo”,当说出所述单词/单词的一部分时,用户可以扫过把所述字母“z”(例如,相应于单词“zoo”的开始字母)分配给的区域/按键。这可以使系统容易理解字符输入过程或单词/单词的一部分输入过程的用户意图。
如所述的和/或所示出的,本发明的数据输入系统可以基于由本发明人提交的专利申请中描述的原理提供许多实施例。基于所述原理并根据本发明的不同实施例,例如,可以考虑具有不同数目按键和/或不同的按键映射(例如,在小键盘上符号的不同布置)的不同小键盘。电子设备可以包括多于一个所述实施例,其可能需要一些所述不同的小键盘和/或不同的按键映射。为了在相同电子设备内允许提供所述小键盘和/或按键映射,可以提供物理和/或虚拟的小键盘和/或按键映射。
根据本发明的一个实施例,根据本发明的当前实施例,电子设备上的不同的小键盘和/或按键映射可以自动设置在所述电子设备的显示单元上。用户可以例如根据需要或他的偏好,从所述电子设备内存在的一组不同实施例中选择一个实施例。为此,在所述电子设备内(例如)可以设置例如模式的装置,通过所述用户可以对其进行使用,用于选择所述实施例之一和相应的相应小键盘和/或按键映射。
根据另一个实施例,例如,所述设备的小键盘的按键(例如,如果所述电子设备是电话,它的小键盘的按键)可以被用于在所述小键盘的至少一些按键上显示不同的按键映射,而不是使用电子设备的显示单元,用于显示小键盘和/或按键映射。为此,所述小键盘的所述按键可以包括电子可更改的显示键帽(printing keycaps)(例如,按键表面)。
再根据另一个实施例并参考以前的实施例,根据相应的数据输入实施例,不同的硬按键映射可以被设置,并与所述电子设备一起交付使用,而不使用具有电子可更改的显示键帽的小键盘。图60示出了移动电话的可交换的(例如,前)盖6000的示例,其具有相应于物理键帽(通常由移动电话制造商以橡胶材料制造)的许多空洞(例如,例如洞6001)。使用所述移动电话和可交换的盖,相应于本发明的相关实施例的不同的可替换的硬(例如,物理)按键映射(例如,例如按键映射6011-6013)可以被提供。在选择数据输入系统的所需实施例之后,用户可以手工地在所述盖(和所述电话)内替换相应的按键映射。
可以理解,可以提供相应于每个所述区域的不同的预定垫、触摸和/或按下敏感键等,而不是具有不同预定区域的单个垫。同样,用户的手指可以被用于把所述符号组和所述扫过移动分配给与接触敏感表面或任何其他手指识别系统(例如,光学扫描)相结合的所述手指,如在本申请和以前提交的申请中所述的其他手指识别系统。必须注意,例如,可以使用任何类型的技术和例如两种压力水平的交互代替本发明的扫过数据输入方法,以提供相同的结果。同样,可以使用例如按键的任何类型和数目的对象。这些问题已在本专利申请和由本发明人以前提交的专利申请中描述过。
根据本发明的一个实施例,(例如,在不同的申请中描述过的)符号及其配置可以被分配给例如少数用户的几个手指和所述手指的用户操作的其他对象,而不是少数按键和所述按键的操作方式。所述用户的所述手指可以取代小键盘的按键,以及,所述手指的所述移动可以取代例如单次和/或两次按下、扫过过程等不同模式。所述手指和所述手指的所述操作可以用于例如声音和/或唇移动的用户行为。用于识别所述对象(例如手指、手指的一部分、指印识别系统、扫描系统、光学系统等)的不同识别系统和用于识别所述行为(例如声音和/或唇部识别系统)的不同识别系统可以被用于提供如上所述和以后要描述的本发明的不同实施例。
根据本发明的一个实施例和通过参考使用四个按键用于数据输入的系统的实施例,可以使用用户的四个手指、而不是四个按键对被分配给所述按键的符号进行分配。同样,例如,例如光学识别系统和/或敏感表面的装置可以被用于识别所述手指的交互/移动。例如,为了输入字母“to”,用户可以在表面上敲击(例如单击)字母“t”被分配给的手指之一,同时发出所述字母的音。仍然基于本发明的数据输入系统,例如声音识别系统的其他识别装置可以用于识别用户的语音,并帮助系统提供准确的输出。
多方向按钮或轨迹球的使用,用于单词/单词的一部分数据输入
例如轨迹球或具有少数(例如,4个)预定按下区域/按键的多方向按钮的其他装置可以与本发明的数据输入系统一起被提供,而不使用具有与本发明的扫过过程相结合的少数预定区域/按键的接触敏感表面/垫,用于输入单词/单词的一部分。这种系统的原理可以类似于用于所述扫过过程和本发明的其他数据输入系统的所描述的原理。
根据本发明的一个实施例,具有转动的轨迹球可以用于本发明的数据输入系统,该转动可以朝向所述轨迹球周围的一组预定点/区域,并且其中,根据本发明的数据输入系统的符号组可以被分配给每个所述预定点/区域。如所述的,所述系统的原理可以类似于对使用具有少数预定区域/按键的接触敏感表面/垫的扫过过程所描述的原理。这两个系统之间的不同在于,这里,轨迹球取代所述接触敏感表面/垫,而所述轨迹球朝所述预定点/区域的转动取代在所述接触敏感表面/垫的所述预定区域/按键上的扫过/按下动作。如上所述,在具有少数预定区域/按键的接触敏感表面/垫上使用扫过过程的本发明的数据输入系统的所有描述可以被应用于使用所述轨迹球的所述数据输入系统。图61a示出了轨迹球6100的示例,其可以朝四个预定区域6101-6104转动,其中,对于每个所述区域,根据在本申请和由本发明人以前提交的申请中所描述的本发明的不同数据输入系统,例如字母表字符、单词、单词的一部分等预定符号组可以被分配,并用于和与本发明的说话/不说话数据输入系统相结合的按下/扫过的原理。为了与所述轨迹球更好地交互,所述区域和分配给它们的所述符号可以在显示单元上进行显示,并且所述轨迹球可以在所述显示单元和所述区域上操作指针。根据另一种方法,在每次使用之前和之后,所述轨迹球可以位于预定位置中。所述轨迹球的中心可以通过点标记6105进行标志。为了输入符号,用户可以首先把他的手指(例如拇指)放在所述点上,并在根据要被输入的符号的方向上开始移动。
继续参考当前实施例,如图61b所示,例如,为了输入单词/单词的一部分“ram”,用户可以朝相应于字符“r”、“a”和“m”的区域6111、6112和6113转动轨迹球6110,并且优选的,同时说出单词/单词的一部分“ram”。
根据本发明另一个实施例,本发明的数据输入系统可以使用具有少数(例如4个)预定按下区域/按键的多方向按钮,并且其中,根据本发明的数据输入系统的符号组被分配给每个所述区域/按键。所述多方向按钮可以为本发明的数据输入系统提供两类信息。相应于所述按钮上的按下动作的第一类信息,以及相应于所述按钮的按键/区域的第二类信息,其中,所述按下动作被应用。用户可以按下相应于所述符号(例如第一个字符)的所述按钮的单个区域/按键,并说出/不说出所述符号,或者,他可以按下相应于所述符号的首字符的所述按钮的区域/按键,并用他的手指扫过所述按钮的不同区域/按键(例如,如对扫过实施例所述的,当所述符号包括多于一个字符时,用于提供关于构成所述符号的字符的更多信息),同时继续保持所述按键处于按下位置,并且优选的,同时说出所述符号。在所述符号输入过程结束时,用户可以释放所述按键上所述持续按下的动作。如所述的,本发明的实施例的原理可以类似于对使用具有少数预定区域/按键的接触敏感表面/垫的扫过过程所描述的原理。这两个系统的区别在于,这里,多方向按钮取代所述接触敏感表面/垫,而在所述多方向按钮的所述预定区域/按键上的单次/连续按下动作取代所述敏感表面/垫的所述预定区域/按键的扫过/按下动作。如上所述的在具有少数预定区域/按键的接触敏感表面/垫上使用扫过过程的本发明的数据输入系统的所有描述可以被应用于使用所述多方向按钮的本发明的当前数据输入系统。图61c示出了多方向按钮6120的例子,如这里所述的,其中,所述按钮包括四个预定区域/按键6121-6124,其中,对每个所述区域/按键,根据本发明的不同数据输入系统(如在本申请和由本发明人以前提交的申请中所描述的),例如字母表字符、单词、单词的一部分等预定符号组可以被分配,并用于本发明的按下和说话数据输入系统的原理。
具有多用户接口的计算/通信设备
根据本发明的一个实施例,例如在本申请中以前描述的和在例如图47a-47i的多幅图的示例中示出的计算通信设备可以包括在其一侧上的小键盘,用于至少拨电话号码。所述小键盘可以是标准电话型小键盘。图62a示出了包括使用少数按键(这里,以两行6201-6202进行布置)的数据/文本输入系统的移动通信设备6200,以及相关的显示单元6203,如上所述。为了间断地拨号,可以考虑位于所述设备另一侧的电话形小键盘。图62b示出了所述设备6200的后侧,其中,电话形小键盘6211与所述设备的所述后侧成为一体。用户可以使用小键盘6211用于例如常规拨号,或用于提供例如选择菜单的其他电话功能。也可以在所述侧上设置例如发送/结束按键6212-6213的其他电话功能按键。也可以在该侧设置与所述数据/文本输入系统的显示单元分开布置的显示单元6214,用于显示例如拨出号或接收号的电话操作。在所述设备(如上所述)内实施的本发明的数据/文本输入系统涉及的点击设备6215也可以集成在该侧。如在本申请和由本发明人以前提交的专利申请中前面所描述的,涉及所述点击设备的(点击)按键可以位于例如涉及所述点击设备的所述电子设备的相反侧的另一侧。
配备手写数据输入系统的计算/通信设备
根据本发明的一个实施例,除了本发明的数据输入系统之外,本发明的计算和/或通信设备可以包括手写识别系统,用于至少拨电话号码。所述手写系统可以是例如基于在书写表面上设备的书写端(tip)的声音/振动的识别的手写系统的任何类型。该问题已在2001年12月26日提交的名为“笔式计算机”的PCT申请中详细描述过。基于手写识别系统的数据输入是较慢的。另一方面,所述数据输入是间断的。优选的,手写识别系统可以在包括本发明的按下和说话数据输入系统的设备中用于短而间断的数据输入任务。图63a示出了例如以前描述和在例如47a-47i的许多图中作为示例示出的计算和/或通信设备6300。在该示例中,所述设备使用六个按键6301-6306,其中,如上所述,可以把语言的字母表(同样,最后是数字的)字符分配给四个所述按键6302-6305(在每端2个)。其他两个按键6301和6306可以包括例如至少一些标点符号和/或功能(例如,为了编辑文本)的其他符号。
如上所述,使用少数按键的本发明的数据输入系统是非常快而准确的系统。在一些情况下,通常,当需要例如拨电话号码的短期努力时,用户可能宁愿使用间断的数据输入系统。手写数据输入系统通常需要不是很小的接触敏感表面(例如,显示器/垫)。它也需要笔,用于在所述表面上书写。由本发明人发明的手写数据输入和识别系统一般不需要所述敏感表面和所述笔。其可以在任何设备内进行实施,并在具有小尺寸的设备中的不能由其他手写识别系统。
继续参考图63a,由本发明人发明的手写识别系统可以在所述设备6300中实施。为此,在例如所述设备的一端可以设置书写端6307。由所述手写识别系统需要的例如至少麦克风的其他特征可以在所述设备6300中进行实施。可以理解,例如基于光学传感器或使用加速器的系统的其他手写识别系统可以用于所述设备。用户可以按照对他/她方便的方式,分开使用所述数据输入系统,和/或彼此相结合使用所述数据输入系统。例如,所述用户可以通过只使用手写数据输入系统进行拨号。另一方面,所述用户可以通过使用本发明的按下和说话数据输入系统书写文本。在例如书写文本的数据输入期间也可以结合所述系统。例如,在书写文本期间,用户可以通过使用本发明的按下和说话数据输入系统书写部分所述文本并转换到手写数据输入系统(例如,例如由本发明人发明的,使用书写声音/振动的所述手写系统)。用户可以通过在表面上用笔头书写,或说话/不说话并按下相应的按键,从一个数据输入系统转换到另一个。
如上所述,可以理解,基于本发明的按下和说话/不说话数据输入系统的不同实施例可以考虑不同的按键布置和分配给所述按键的不同的符号配置。图63b示出了根据本发明另一个实施例、类似于图63a的设备6300的设备6310的示例,区别在于,这里,本发明的数据输入系统在其每侧6311、6312可以使用四个按键(在每侧一个其他的按键,其中,把例如标点符号字符和/或功能的符号集分配给每个所述其他按键)。具有其他按键可以帮助在本发明的数据输入系统中考虑更多符号。通过把分配给其他按键的一些符号分配给所述其他按键,可以有助于提供更好的输入准确度,导致为本系统使用的按键分配更少的符号。
根据本发明另一个实施例,为了容易地区别本发明的逐字符数据输入系统和本发明的单词/单词的一部分数据输入系统,可以把字母表字符分配给不同于单词/单词的一部分被分配给的另一个按键组的按键组。这可以显著地提高数据输入的准确度。图63C示出了类似于图63b的设备6310的设备6320的示例,其在每侧具有两套四个按键(2*2)。在该示例中,按键6321-6324可以相应地相应于在所述按键上印出的字母表字符,而按键6325-6328可以相应地相应于单词/单词的一部分,其开始于在所述按键上印出的字符。例如,为了输入例如字母“t”的单个字母,用户可以按下按键6321并说出所述字母。同样,例如,为了输入单词的一部分“til”,用户可以按下按键6325并说出所述单词的一部分。
可以理解,如以上描述和示出的,所述按键在其布置中可以与所述电子设备分开布置,例如,在一个或多个小键盘内,其中,所述小键盘可以无线地或通过导线连接到所述电子设备。同样,如在本发明的任何实施例中的不同段落中所述的和将要描述的,所述少数按键、它们在设备上的布置、把符号分配给所述按键的所述分配以及与所述按键的交互、所述设备自身等都只作为示例被示出。很明显,通过本领域技术人员可以考虑其他变化。
必须注意,如在图63a-63c和图47b-47d所示出的,根据本发明的一个实施例,本发明的数据输入系统可以具有笔的形状。同样,如上所述,笔形状的计算机/通信设备及其特征已被发明,并在2001年12月26日提交的名为“笔式计算机”的PCT申请中描述过。本发明的笔形状的设备可以包括所述“笔式计算机”PCT专利申请的部分或所有特征和应用。例如,本发明的笔形状的设备可以是圆柱体形的设备,具有覆盖其表面的显示单元。同样,例如,本发明的笔形状的设备可以包括指示和点击设备,以及类似于所述“笔式计算机”PCT的手写识别系统的手写识别系统。
根据本发明的一个实施例,本发明的笔形状的设备可以包括用于通过例如把所述设备系缚到用户的衣服或耳朵,把它系缚到用户的系缚设备。图63d示出了例如图63a的设备6300的电子设备的后侧的例子。如图所示,可以在所述设备内设置系缚设备6331,用于把所述设备系缚到例如用户的口袋或用户的耳朵。同样,在所述系缚设备内设置扬声器6332,用于提供紧靠所述用户耳朵的耳腔的所述扬声器。在所述设备内还可以设置例如由本发明人提出的指示单元6333。
继续参考当前实施例,如图63e所示,作为示例,所述设备6340也可以系缚到用户的耳朵,用于允许当例如所述用户行走或开车时,允许不用手的交谈。笔形状的的所述设备6340和所述麦克风6341以及所述扬声器6342和系缚装置6343分别在所述设备中的位置可以允许所述麦克风和所述扬声器分别靠近用户的嘴和耳朵。可以理解,所述麦克风、扬声器或系缚装置可以位于所述设备内的任何位置。
具有少数按键的本发明的独立数据输入单元包括显示单元
根据本发明的一个实施例,如图55a-55j所描述和示出的,具有至少少数按键的本发明的独立数据输入单元可以包括显示单元,并可以被连接到相应的电子设备上。图64a示出了基于前面描述的原理的独立数据输入单元6400的示例,其包括显示单元6401。(特别是所述单元作为悬挂物被携带时)在所述单元内具有显示器的优势在于,例如,用户可以把所述电子设备(例如移动电话)插入例如他的口袋,并通过所述设备使用所述数据输入单元,用于输入/接收数据。通过连接到所述设备,通过看所述数据输入单元的显示单元,用户可以看见他输入(例如发送SMS)或接收(例如接收SMS)的数据。可以理解,所述显示单元根据不同系统可以是任何类型,并根据不同系统被布置在所述单元中。例如,如图64b所示,本发明6410的独立数据输入单元的显示单元6411可以被布置在所述数据输入单元的盖子6412内侧。可以理解,本发明的独立数据输入单元可以包括在前面描述的相应的实施例中的部分或所有特征(例如,例如嵌入式麦克风)。
如上所述,使用少数按键的本发明的数据输入系统可以在例如PDA或平板PC的任何设备内进行实施,图65a示出了例如平板PC设备6500的电子设备的示例,其包括使用少数按键的本发明的数据输入系统。在所述设备内已经设置有基于本发明的数据输入系统原理的按键布置和符号分配。在该示例中,所述平板PC6500可以包括四个按键6501-6504,至少语言的字母表和最后的数字字符可以被分配给这四个按键。除了所述四个按键之外,所述设备还包括例如按键6505-6506的其他按键,例如,可以把例如至少标点符号和功能的符号分配给这些按键。可以理解,在所述平板PC的显示单元上可以定义虚拟(例如,软)按键,并用于数据输入系统,而不是物理按键(例如6501-6506)。本发明的数据输入系统、按键布置和把符号分配给所述按键的分配已被详细描述。部分按键或设置在所述设备内的其他按键可以与例如在所述设备的背面内集成的指示设备相结合。该问题已在由本发明人提交的不同专利申请中详细描述过。所述平板PC可以包括其他按键6507,用于例如打开/关闭功能等其他目的。图65b示出了图65a的平板PC6500后侧的示例。如图所示,为了更好地稳定性,在例如数据输入期间,所述平板PC还可以包括一个或多个当例如输入数据时由用户使用的把手设备6511-6512。可以理解,所述把手设备可以是任何类型,并可以位于所述设备中的任何位置(例如在不同侧)。如上所述,所述设备可以包括至少指示和点击系统,其中,所述系统的至少一个指示单元6513可以位于所述设备的后侧内。如上所述,相应于所述指示的按键可以位于所述平板PC的前侧(在方便的位置处),用于允许容易地操作所述指示和点击设备(如所需,用左手或右手)。根据一种设计,所述平板PC可以包括两个所述指示和点击设备,其分别位于所述平板PC的左侧和右侧,而所述指示和点击设备的部件可以彼此协同工作。可以理解,例如内置麦克风或单独的有线/无线麦克风的任何类型的麦克风可以被用于在数据输入期间接收用户的语音。这些问题已详细描述过。所述电子设备还使用本发明的独立数据输入单元。
同样,使用少数按键的本发明的数据输入系统可以在例如自动、模拟或游戏环境的许多环境中使用。根据本发明的一个实施例,所述系统的按键可以位于例如汽车的交通工具中。图65C示出了包括少数按键(在该示例中,在所述方向盘6520上布置在相对侧6521-6522上)的接通工具的方向盘6520,所述少数按键被用于本发明的数据输入系统。本发明的数据输入系统、按键布置、和把符号分配给所述按键的分配已详细描述过。如这里所示出的,开车时用户可以输入例如文本的数据。为此,当使用用户的手把持所述方向盘6520时,例如,在开车期间,驾驶员可以通过按下所述按键和相应地说话/不说话使用本发明的按下和说话数据输入系统。可以理解,例如内置式麦克风和/或例如蓝牙麦克风的有线/无线麦克风的任何类型的麦克风可以被用于在数据输入期间接收用户的语音。在例如飞行器的任何类型交通工具中的任何位置上也可以考虑任何按键布置和为所述按键的符号分配。
如上所述,本发明的数据输入系统以及一般而言特别是使用少数按键的本发明的数据输入系统(例如,其中,把字母表和最后的数字字符分配给以两对相邻按键进行布置的四个按键,并且其中,用户可以把他的两个拇指的每一个放于按键的所述每一对上,用于按下所述按键之一)的巨大优势在于,用户可以提供快速而准确的数据输入,而不需要(频繁地)看按键以及显示单元。
可以理解,在看相应的显示器用于输入验证是不可能的/不被允许的环境(例如黑暗)和情况(例如开车)中,通知系统可以被用于通知用户被输入的一个或多个最后的字符/短语。所述系统可以是文本-语音TTS系统,其中,当通过本发明的数据输入系统识别出字符时,系统说出所述字符。可能需要用户通过例如不提供任何动作而对所述识别出的符号进行确认。同样例如,如果识别出的符号是错误的符号,用户可以提供例如使用删除按键的预定动作,用于删除所述符号。然后,他可以重复所述符号的输入。
网络实施
如在与本发明的数据输入系统相关的以前提交的专利申请中所述的,本发明的数据输入系统可以在例如局域网系统的网络环境中实施,该局域网系统包括连接到服务器/主计算机的客户终端。根据本发明的一个实施例,在所述网络环境中,所述终端通常可以是不具有处理能力的小型设备,或具有至多有限处理能力的设备。相反,服务器计算机可以具有强大的处理能力。在这种情况下,服务器计算机可以处理通过所述网络系统的终端传送给它的信息。通过使用终端,用户可以根据本发明的数据输入系统的原理,输入关于把符号输入到所述服务器的信息(例如按键、语音)。在处理所述信息并识别出相应的符号之后,服务器计算机可以把结果传送到所述终端的显示单元。可以理解,所述终端可以包括用于把所述信息输入和传送到所述服务器计算机所需的本发明的数据输入系统的所有特征(例如,例如按键布置、分配给所述按键的符号、至少麦克风、照相机等)。图66示出了作为例子的连接到中心服务器/计算机6600的终端/数据输入单元6601-6606,其中,在相应的显示器上显示由不同数据输入单元/终端输入的不同数据/文本的部分结果。
可以在例如航空公司飞机的许多环境中使用上述实施例。在进来的民航飞机中,每个旅客位置包括具有有限数目按键的遥控单元,所述按键被连接到通常安装在所述位置前面(例如,通常位于前面座位的后侧)的显示单元。所述遥控可以与内置或单独的麦克风相结合,并可以被连接到所述飞机中的服务器/主计算机。其他的个人计算或数据输入设备可以通过把它们(例如,通过安装在所述座位中的USB端口)连接到所述服务器/主计算机而被使用,而不是所述遥控。如上所述,所述设备可以例如是本发明的数据输入单元、PDA、移动电话、或甚至笔记本等。这可能成为航行期间通过航空公司提供给其乘客的最有吸引力的娱乐服务。乘客可以编辑信件、发送信息、使用因特网、或与所述飞机中的其他乘客聊天。类似系统可以在组织或商业(例如,连锁商店的销售点)的联网系统中实施,其中,包括必要特征(例如按键、麦克风)用于基于本发明的数据输入系统输入数据/文本的数据输入单元可以连同服务器计算机一起被使用。上述本发明的数据/文本输入系统允许通过一般不具有处理能力、或具有有限处理能力的终端设备的快速而准确的数据输入系统。
使用少数按键的本发明的数据输入系统(例如,包括四个按键,其中,至少字母表字符被分配给所述按键)在许多环境中可能是有用的。如上所述,基于本发明的数据输入系统的原理,用户可以使用与其声音相结合的例如他的脸/头/眼的移动,而不使用按键,用于数据/文本输入。根据本发明的一个实施例,为此,在本申请和以前申请中所描述的符号(例如至少,大致上是语言的所有字母表字符)可以被分配给例如用户头部在例如四个方向(例如左、右、前、后)上的移动,而不分配给少数按键。符号配置分配可以与对按键所描述的相同。例如,如果字母“Q”、“W”、“E”、“R”、“T”和“Y”被分配给用户头部向左的移动,用于输入字母“t”,用户可以向左移动头部并说出“T”。可以把相同原理分配给用户眼睛的移动(例如左、右、上、下)。通过参考最后所述的示例,为了输入字母“T”,用户可以向左移动眼睛并说出“T”。通过设置在用户身体上的例如照相机或传感器的装置,对头、眼、脸等的移动进行检测。
不使用按键的上述实施例,对通过具有有限运动能力的人进行数据输入可能是有用的。例如,盲人可以使用他/她的头部移动结合其声音,不能使用其手指用于按下按键的人可以使用他的眼/头移动结合其声音。
根据本发明另一个实施例,如上所述,把所述符号分配给用户的手指的移动,而不是把符号分配给少数按键。例如,图67示出了用户的手6700,其中,基于分配给本发明少数按键的符号配置,可以把符号配置分配给所述用户手的四个手指6701-6704(例如,每只手的两个手指)。例如,可以把字母“Q”、“W”、“E”、“R”、“T”和“Y”(或者,以所述字母开始的单词/单词的一部分)分配给预定移动或手指6701的手势。作为示例,所述移动可以是向下移动所述手指。同样,例如,为了输入字母“T”,用户可以向下移动手指6701,并且优选的,同时说“T”。可以理解,基于本申请和以前提交的申请中所描述的本发明的数据输入系统的原理,可以对符号的任何配置进行考虑,并把其分配给任何数目的用户的手指。
继续描述上述实施例,可以考虑许多系统,用于检测所述用户的手指的移动/手势。例如,通过所述手指相对于另一手指的位置可以检测用户的手指的移动。根据一种方法,如图67所示,用于数据输入的手指6701-6702可以设置有传感器6705-6706(例如这里,以环的形式)。根据一个实施例,基于所述相邻环6705-6706的摩擦,基于例如由所述传感器接收的振动,可以识别用户的手指的移动(例如,可以理解,所述环的表面可以是使得所述手指的向上移动和向下移动的摩擦振动可以是不同的)。
根据另一种方法,传感器6707、6708可以安装在环形装置上(或安装在用户的手指的其他装置上),并且其中,所述传感器互相的位置可以确定手指的移动。
可以理解,这里描述的手指移动/手势检测装置只是作为示例进行描述。可以考虑例如光检测装置的其他检测装置。
单词类别
根据本发明的一个实施例,可以在例如医疗或司法环境的预定环境中使用本发明的单词/单词的一部分级数据输入系统。在这种情况下,所述系统不使用单词/单词的一部分的大数据库,而可以考虑涉及所述环境的单词/单词的一部分的有限数据库。这将显著地提高本系统的准确度和速度。可以逐字符地输入所述数据库之外的单词/单词的一部分。
用于临时的逐字符数据输入的模式键
根据本发明的一个实施例,在结合了逐字符数据/文本输入和单词/单词的一部分数据输入的本发明的数据输入系统中,可以使用预定按键通知系统,用户正在临时输入单个字符。例如,在文本输入期间,用户可以根据本发明的单词/单词的一部分数据输入系统的原理,输入部分文本,而不按下所述预定按键。在这种情况下,系统可以不考虑分配给所述用户按下按键的字母。系统可以仅考虑分配给所述按键的单词/单词的一部分。如果所述预定按键例如与涉及所述文本输入的其他按键按下同时被按下,则系统可以只考虑分配给所述按键按下的单个字母,并忽视分配给所述按键按下的单词/单词的一部分数据输入。
短语输入
根据本发明另一个实施例,如上所述,本发明的数据输入系统可以包括短语级文本输入系统。例如,在输入整个短语之后,通过例如使用结合本发明的逐字符数据/文本输入和/或单词/单词的一部分数据输入系统的本发明的数据输入系统,系统可以对识别出的所述短语的进行分析,并基于所述语言的语言特性/模式和/或所述短语的意义,系统可以校正、添加或替换所述短语的部分单词,用于提供无错的短语。例如,如果用户输入短语“let’s meet at noon”,而识别出的单词是“letsmeet at noon”,通过分析所述短语,系统可以用单词“let’s”替换单词“lets”,并提供短语“let’s meet at noon”。本实施例的优点在于,因为本发明的数据输入系统是高度准确的系统,所以用户不必担心校正发生在短语输入期间的少数错误。系统可以自动校正所述错误。可以理解,在短语的末尾提供的例如“.”的一些符号或返回命令可以通知系统关于所述短语的结束点。
短语输入
根据本发明的一个实施例,分配给例如按键的对象的符号可以表示短语。例如,单词组(例如,“Best regards”)可以被分配给按键(例如,优选的,也表示字母“b”的按键)。用户可以按下所述按键并提供例如说出所述短语或部分所述短语的语音(例如,在该示例中,说出“best regards”),用于输入所述短语。
对于单个字符和对于单词/单词的一部分的不同模式
如上所述,本发明的数据输入系统可以使用不同模式(例如,与例如按键的对象的不同交互),其中,可以把分配给对象的预定符号组分配给每个所述模式。同样如上所述,例如,所述模式可以是按键上短/单次按下动作、在按键上的长按下动作、在按键上的两次按下动作、使用手指/眼睛等的短/长/两个姿势等。
根据本发明的一个实施例,包括多于字符或短语的单个字符、单词、单词的一部分、短语等可以被分配给不同模式。例如,例如字母的单个字符可以被分配给按键上的单次/短按下动作,而包括至少两个字符的单词/单词的一部分可以被分配给按键(例如,相同按键或其他按键)上的两次按下动作或长按下动作,或反之亦然(例如,同样例如,包括至少两个字符的单词/单词的一部分可以被分配给不同的按键上的单次按下动作)。同样,例如,如上所述,引起语音(例如,声音、唇)识别系统含混的单词/单词的一部分的一部分可以被分配给按键上的两次按下动作。同样,不同的单个字符、单词等可以被分配给按键上的轻、重或两次按下动作。同样例如,不与分配给与按键交互的模式的单个字母产生含混的单词/单词的一部分可以被分配给与所述按键交互的所述模式。不同的交互模式已在本申请和由本发明人以前提交的其他专利申请中描述过。
可以理解,可以考虑用不同预定时间段/压力水平定义按下动作/模式。例如,在按键上短时间(例如,至多0.20秒)按下动作可以被认为是(第一符号组可以被分配给的)短按下动作,长时间按下动作(例如,大于0.20至0.40秒)可以被认为是(第二符号组可以被分配给的)长按下动作,而更长按下动作(例如,大于0.40秒)可以被认为是另一模式,可以把(例如,前述的)重复过程分配给该模式。例如,为了输入字母“a”,用户可以短按下按键(其中,把字母“a”分配给所述按键和与所述按键的所述交互),并说出“a”。他可以更长按下所述按键并说出“a”,用于例如获得单词/单词的一部分“ai”(例如,其中,把单词/单词的一部分“ai”分配给所述按键和与所述按键的所述交互)。用户可以按下所述按键并说出“a”,并按需要(例如,更长时间段)使所述按键保持在按下位置上,用于重复输入字母“a”。字母“a”将被重复,直到用户释放(停止所述按下动作)所述按键。
如上所述,包括(例如,在所述单词前面/后面的)空格字符的单词可以被分配给与例如按键的对象的本发明交互模式。根据本发明的一个实施例,所述与按键的交互模式可以是刚刚描述的所述按键的所述更长/重按下动作。
如上所述,可以考虑对象、交互模式、字符集等的任何组合,并用于本发明的数据输入系统。
退格
删除已输入的单词/单词的一部分的退格过程已在本申请前面描述过。根据不同发实施例,至少一种退格过程可以被分配给至少一种交互模式,例如,可以提供退格按键,其中,通过按下所述按键,至少一个所需话语、单词/单词的一部分、短语等可以被删除。例如,在所述按键上每个单次按下动作可以删除相应于位于所述输出之后、光标之前的单个话语的输出。例如,如果用户已输入单词/单词的一部分“call”,和“ing”,根据一个过程,他例如可以通过单次按下所述按键一次,删除最后的话语“ing”。在所述按键上的另一次单次按下动作可以删除相应于另一话语的输出“call”。根据预定过程,例如,在所述按键上的单次/两次按下动作可以删除整个单词“calling”。因此,根据本发明的退格过程的原理,很明显,本领域技术人员可以考虑许多预定删除过程。
小型化键盘
小型化键盘被用于小型/移动电子设备。使用所述键盘的主要不方便之处在于,因为按键很小并互相靠近,使用用户的手指按下按键可能引起错误按下所述按键。这就是为什么在PDA中,通常用笔按下所述按键。本发明的数据输入系统可以消除所述缺点。本发明的数据输入系统可以使用PC型小型化/虚拟键盘。通过把按键作为目标,用于按下它,即使用户错误按下所述按键(通过例如,按下相邻按键),根据本发明的一个实施例,并基于本发明的数据输入系统的原理,用户也可以说出相应于所述按键的语音。如果用户的语音不相应于被按下的按键,则系统可以认为所述按键被错误按下。然后,系统可以考虑相邻按键,并把所述语音对应于所述按键之一。通过使用该实施例,普通的用户手指可以容易地使用小型化键盘,使通过这些键盘的数据输入容易和加快。可以理解,可以考虑基于本发明的数据输入系统原理的全部特征和系统,并被用于这种键盘。例如,本发明的单词/单词的一部分数据输入系统也可以用于这种实施例。
同样,如所述的并通过不同实施例被示出的,本发明的数据输入系统的原理是通过把更少数目的符号分配给与预定对象的预定交互,并通过使用/不使用相应于所述符号的语音从所述更少数目的符号中对符号进行选择,从较大数目的符号中对预定的更少数目的(例如,候选的)符号进行选择。
同样如上所述,所述对象和与所述对象的所述交互可以是任何类型。如上所述,例如,所述对象可以是用户身体的部位(例如手指、眼睛等),而所述预定交互可以是向例如左、右、上、下等不同预定方向移动所述对象。
根据本发明的一个实施例,所述对象可以是电子设备,而与所述对象的所述交互可以是在预定方向倾斜所述电子装置。例如,包括部分较大符号组的符号的每个所述不同的较小符号组可以被分配给应用于所述电子设备的预定倾斜/动作方向,较大符号组例如语言的字母、标点符号、单词/单词的一部分、功能等(如上所述)。然后,仍基于本发明的数据输入系统的原理(如上所述),通过提供/不提供相应于所述符号的语音选择所述较小符号组的所述符号之一。图68示出了例如移动电话6800的电子设备的示例。作为示例,四个符号组6801-6804可以被分配给被应用于所述设备的四个倾斜方向(例如左、上、右、下)6805-6808。仍例如,为了输入字母“t”,用户可以向右倾斜设备并发出相应于所述字母的语音的音(例如,说所述字母)。本发明的倾斜系统的优点之一在于系统可以不使用任何按键,并可以使用一只手用于数据输入。它还允许在设备内提供大显示器。图68a示出了使用本发明的倾斜的数据输入系统的电子设备6810,并且其中,大显示器6811基本覆盖所述电子设备的至少一侧的表面。可以理解,例如在按键上单次/两次按下动作的模式在这里可以被应用于设备的单次/两次倾斜方向/动作取代。
撇号的处理
根据本发明的一个实施例,可以产生包括撇号的预定单词,并把其分配给一个或多个按键并被输入。例如,例如“it’s”、“we’re”、“he’ll”、“they’ve”、“isn’t”等单词可以被分配给至少一个预定按键。通过按下相应的按键并说出所述单词可以输入每个所述单词。
根据本发明的另一个实施例,为了相同目的,可以产生例如“’s”、“’ll”、“’ve”、“n’t”等的(例如,缩写)单词,并把其分配给一个或多个按键。由它们的原始发音发出所述单词的音。例如:
“’s”可以被发音成“s/is/has”;
“’re”可以被发音成“are”;
“’ve”可以被发音成“have”;
“n’t”可以被发音成“not”等
所述单词可以被输入到例如被连接到前面已输入单词/字符的末尾。例如,为了输入单词“they’ve”,用户可以输入两个单独的单词“they”和“’ve”(例如,根据本发明的数据输入系统进行输入)而不在之间设置空格。如上所述,分配给包括撇号的单词(例如,例如单词“not”的“n’t”的缩写单词)的语音可以与原始单词一样。例如,单词“n’t”和“not”都可以发出“not”的音。在这种情况下,每个所述单词可以被分配给与相同按键的不同交互模式,或它们的每个可以被分配给不同的按键。例如,用户可以单次按下相应的按键(例如,与单词“not”被分配给的所述按键的预定交互)并说出“not”,用于输入单词“not”。为了输入单词“n’t”,用户可以例如两次按下相同按键(例如,与单词“n’t”被分配给的所述按键的预定交互)并说出“not”。根据本发明的另一个实施例,包括撇号的单词的一部分/全部可以被分配给撇号标点符号自身被分配给的按键。
根据本发明的一个实施例,包括撇号的例如“’s”、“’d”等的单词的一部分可以被分配给按键和与所述按键交互的模式,并发出例如“s”、“d”等相应字母的音。所述按键或所述交互模式可以不同于分配给所述相应字母的按键或交互模式,用于避免含混。
在四个按键上的字母配置
如上所述,为了提高语音识别系统的准确度,具有接近发音(例如,对用于选择它们其中之一的语音系统引起含混)的符号可以被分配给不同的按键。图69示出了把字母表字符分配给小键盘6900的四个按键6901-6904的另一个示例。虽然它们可以被分配给任何按键,但是优选的,包括多于一个字符的单词/单词的一部分可以被分配给表示所述单词和/或所述单词的一部分的首字符的按键。该示例的字符布置不仅消除了使用包括字母的四个按键的本发明的逐字符文本输入系统的含混性,而且其显著降低了本发明的单词/单词的一部分数据输入系统的含混性。例如,字母“n”和以“n”开始的单词/单词的一部分可以被分配给按键6903,而字母“i”和以“i”开始的单词/单词的一部分可以被分配给按键6901。这是因为,例如,(分配给按键6901的)单词“in”和(分配给按键6903的)字母“n”可以具有含混的、大致类似的发音。很明显,如上所述,通过本领域技术人员可以考虑基于刚刚描述的原理在按键上的其他符号配置,或任何其他数目和布置的按键。
同样,如上所述,根据另一个示例,如果两个符号的语音具有大致类似的发音,并且所述符号被分配给相同按键并通过与按键相同类型的(例如,与相应语音结合的)交互进行输入,为了避免含混,与第二符号具有大致不类似发音的另一个语音可以被分配给多个符号的至少第一符号。例如,如果例如“I”和“hi”的两个符号(例如分别具有大致类似发音的字母和单词)被分配给按键,并通过例如与按键的单次按下动作同时说出它们进行输入,为了避免含混,例如,例如“hey”(其与“i”是大致不同的发音)的另一语音可以被分配给符号(例如,单词)“hi”。
快速输入
如前面和这里在图69a中所示出的,把至少字母表字符分配给仅四个按键的优点之一在于,用户可以把他的2个手指(例如左和右拇指)6915、6916的每一个放在两个按键(例如,两个按键6911-6912,和在该示例中,两个按键6913-6914)的相应列上,使得所述手指能够同时接触所述两个按键。这允许在文本输入期间不从按键上移开(或很少移开)手指,并因此用户知道按下哪个按键而不看着小键盘。即使所述用户在运动时,这也允许快速输入。可以理解,为此,按键尺寸、按键之间的距离以及例如所述按键的物理特性的其他参数可以是使得上述过程被优化。
如上所示,可以理解,可以根据需要考虑其他的按键配置。例如,所述四个按键可以用以下方式进行配置,即,当用户使用一只手输入所述文本时,优选的,他的手指能够同时接触所述四个按键。同样,可以根据不同需要,考虑把所述至少字母表字符分配给的不同预定数目的按键。
如上所述并在例如图52的图中所示出的,多方向按键可以被用于本发明的数据输入系统。同样,如所述的,可以考虑不同数目的按键、按键的不同类型/配置,以用于本发明的数据输入系统。同样,如所述的,语言的字母表字母或文本字符可以被分配给例如由本发明的数据输入系统使用的四个按键。图69b示出了具有两个多方向(例如,在该示例中,四个方向)的按键6927-6928的电子设备6920的示例,其中,语言的字母表字符被分配给它们的四个子按键6921-6924。在电子设备的两侧上用于数据(例如,文本)输入的四个按键的布置和使用已在前面描述过,并由例如图63b的示例性图示出。
具有可延伸的灵活显示单元的设备
如上所述,根据本发明的一个实施例,包括例如OLED显示器的灵活显示器以及本发明的数据输入系统和它的特征的设备可以被提供。图70a示出了灵活显示单元7000的示例。通过例如在至少显示单元的一侧7001卷起显示单元,可以收回所述显示单元。可以通过打开所述显示器而展开它。图70b示出了例如包括灵活显示单元7011的计算机/通信单元7010的电子设备。所述电子设备也可以包括本发明的数据输入系统和本发明的按键布置。在该示例中,所述设备包括两个部分7018-7019,其上布置所述按键7012-7013。在所述设备7010的至少一个所述部分7018、7019上实施所述设备的组件。所述两个部分可以通过有线或无线互相连接。同样,至少所述显示单元的一部分可以被布置(例如卷起)在所述设备的所述两个部分7018-7019的至少一个之中。所述设备的所述两个部分可以在预定距离或由用户所需的任何距离处互相相对地展开和收回(例如,最大距离可以是所述显示单元的最大长度的函数)。在该示例中,所述两个部分处于互相相对的适度距离。通过互相相对地展开所述两个部分,也可以展开(例如,通过打开)所述显示单元。用户可以把每个所述两个部分7018-7019保持在其每只手中,并用相应的手使用每个所述部分的按键7012-7013,用于通过例如本发明的数据输入系统把数据输入所述设备7010和所述显示单元7011中。图70c示出了所述设备7010和更加展开状态的所述显示单元7011。例如至少一个按钮的装置可以被用于互相相对地释放和/或固定和/或收回所述部分。通过例如按钮和/或弹簧的装置自动提供这些功能。本领域技术人员已知所述功能。图70d示出了处于关闭状态的所述设备7010。如所述的,所述设备可以是通信设备。在该示例中,可以使用所述设备作为电话单元。为此,麦克风7031和扬声器7032可以被布置在所述设备内,(优选的,在其两端),使得所述麦克风和所述扬声器之间的距离对应于用户的嘴和耳朵。因为所述显示器是灵活显示器,它可能是易碎的。如图70e所示,为了在展开状态下保护所述设备的所述显示器,所述设备7010可以包括多部分的例如大致刚性的组件7041,其当展开和收回所述设备的所述两个部分时,也互相相对地展开和收回,使得处于展开状态时,所述部分提供平的表面,其中,所述显示器(未示出)可以放在所述表面上。可以理解,所述组件可以是任何类型,并包括任何形式和任何收回/展开系统。同样,通过例如折叠/展开或滑动/非滑动方法的不同方法可以收回/展开所述显示单元。
根据本发明的一个实施例,如图70f所示,例如刚刚描述的电子设备7010可以包括与其成为一体的打印/扫描/拷贝单元(未示出)。虽然该设备可以具有任何宽度,优选的,所述电子设备的设计(例如,在该示例中,具有大致A4纸张的高度)可以是使得用户可以装入A4纸张7015,用于打印例如编辑的信件的文档页面。
对移动计算/通信设备提供完整的解决方案在许多情况下是极其有用的。例如,用户可以起草例如信的文档并立即打印它们。同样例如,售货员可以在客户的同意下编辑例如发票的文档并打印它,用于立即交付。
根据另一个实施例,可以考虑包括可展开的显示单元和本发明的数据输入系统的可折叠设备。所述显示器可以是例如OLED显示器的灵活显示器。图70g示出了处于关闭状态的所述设备7050。图70h示出了包括所述可展开显示单元7051和所述数据输入系统的按键7053-7054的所述设备7050。所述设备可以具有通信能力。在该示例中,在所述设备内设置麦克风7055和扬声器7056,优选的,每个在所述设备的不同部分上。
可以理解,该实施例和相关图示作为示例被描述和示出。本领域技术人员可以考虑根据本发明原理的许多其他实施例和图。例如,通过参考图70b,当把所述显示单元展开到所需长度时,只有所述显示单元的所述展开部分可以被所述设备所使用。例如,例如所述设备的操作系统的系统可以对输出到所述显示单元的所述张开(例如,展开)部分进行管理和指导。同样,所述设备可以至少包括在本申请和由本发明人提交的其他专利申请中所描述的至少部分系统特征。
可连接的/可拆卸的数据输入单元
如上所述,例如平板PC的电子设备可以包括本发明的数据输入特征,例如布置在所述设备前侧的本发明的按键配置、布置在其后侧的点击设备,其中,所述点击设备使用在所述设备的前侧的至少一个按键,以及,反之亦然。同样如上所述,所述设备可以包括从所述设备伸向用户的嘴的可延伸的麦克风/照相机。如以上描述和示出的,所述特征可以构成用于所述设备的外部数据输入单元。图71a示出了用于例如平板PC的电子设备的可拆卸数据输入单元7100的示例。所述单元可以包括两个部分7101-7102,其中,每个所述部分包括本发明的按键布置的按键7103-7104,用于向所述设备提供信号。在该示例中,所述部分7101和7102被设计成用于连接到所述电子设备的两个侧端。所述部分的至少一个可以包括点击设备(例如,鼠标,未示出),其中,当所述可拆卸数据输入单元连接到所述电子设备时,所述点击设备可以位于所述设备的后侧内,并且涉及所述点击设备的至少一个按键(例如,所述按键配置的按键)将位于所述设备的前侧,使得用户使用至少相同的手同时使用所述点击设备,和布置在所述部分上的所述至少一个相关按键和/或按键配置。所述数据输入单元也包括布置在可延伸组件7107内用于接收用户的语音的可延伸的麦克风7105和/或照相机7106。本发明的数据输入单元的特征在前面已被详细描述。所述数据输入单元的两个部分7101-7102通过例如带子(例如,弹性带)的装置互相连接,从而使所述单元固定到所述电子设备上。所述数据输入单元通过导线7108连接到所述设备上。其可以通过例如连接所述电子设备的USB端口的USB部件7109进行连接。所述数据输入单元也可以无线连接到所述设备上。同样,部分7101、7102可以是单独的部分,使得用户可以例如以一只手持有它们的每个(例如,他的手可以在他的口袋中),而不是把它们连接到电子设备,用于数据输入。
可以考虑用于把所述数据输入单元连接到所述电子设备的其他连接装置。例如,如图71b所示,所述设备7100可以包括滑动的和/或连接/分离的组件7111-7112,用于所述目的。
可以理解,所述数据输入单元可以包括任何数目的部分。例如,所述数据输入单元可以只包括一个部分,其中,例如刚刚描述的特征(例如,小键盘的按键、点击设备等)可以与所述部分成为一体。
图71c示出了系缚/连接到例如计算机(例如平板PC)的电子设备的所述数据输入单元7100。如图所示,所述数据输入单元7103-7104的按键位于所述设备的两端。麦克风伸向用户的嘴,而指示设备7105(未示出,这里,在后面或所述设备的一侧上)被布置在所述数据输入单元的后侧(例如,很明显,在所述设备的后侧)。相应于所述指示设备的至少一个按键7126位于所述数据输入单元的前侧。很明显,所述指示设备及其相应的按键可以位于任何侧(例如左、右、下)端。同样,可以使用多个(例如,两个,一个在左、另一个在右)指示和点击设备,其中,所述多个指示和点击设备可以彼此协同工作。用户可以使用他的双手持有所述设备,并同时使用所述按键和所述麦克风,用于通过本发明的数据输入系统输入例如文本的数据。所述用户还可以同时使用所述指示设备及其相应的按键。
可以理解,所述数据输入单元也可以无线连接到例如所述平板PC的相应设备。同样,所述指示设备和/或其按键可以一起或单独位于所述电子设备的任一侧。
根据本发明的一个实施例,可以提供例如OLED显示器的灵活显示单元,使得在关闭的状态下,所述显示单元具有腕带的形式,其被带在佩带者腕部上或连接到腕部安放设备的腕带上,并最终连接到所述设备。图72a示出了例如腕部电子设备的电子设备7210的腕带7211的示例,其中,处于关闭状态的所述显示单元被连接到所述带。图72b示出了处于拆下状态的所述显示单元7215。图72C示出了处于打开状态的显示单元7215。
根据本发明的一个实施例,为了帮助系统更好地在具有大致类似发音的例如字母/单词/单词的一部分的两个符号的语音之间进行区分,大致类似所述符号的第一个符号、而较少类似于其他符号的至少一个不同的音素集可以被分配给所述第一个符号,使得当用户说出所述第一个符号时,通过声音识别系统识别所述符号的机会提高了。例如,如果字母“d”和字母“b”被分配给与相同按键的相同预定交互,除了音素集“de”之外,另一个类似的音素集“tē”(在该示例中,把字母“t”分配给另一个按键)也可能被分配给字母“d”的语音。另一方面,除了音素集“bē”之外,也分配另一个类似音素集“pē”(在该示例中,把字母“p”分配给另一个按键)。字母“b”和“d”具有大致类似的发音,但是字母“t”(音素集“te”)和“p”的发音很显著的不同。例如,如果用户按下相应于字母“b”和“d”的按键并说出“dē”,系统可能错误识别所述语音为“tē”。在这种情况下,系统将提供分配给与所述按键按下相结合的所述语音的字符,并提供字母“d”。可以理解,这里提供的示例只用于描述该实施例。本领域技术人员可以考虑根据所描述的原理,把音素/音素集分配到任何字母/单词/单词的一部分的多种配置和分配。
在本申请和由本发明人提交的其他申请中描述的系统、特征、增强等可以应用于本发明的所有实施例。同样,本发明的实施例可以单独工作或结合本发明一个或多个实施例进行工作。
因此,当已示出和描述并且指出了当应用到可选实施例的本发明的基本新颖特征时,可以理解,本领域技术人员可以在不偏离本发明的精神的情况下,可以对本公开发明的形式和细节进行多种省略和替代和变更。因此,本发明只受到由附加的权利要求的精神所指出的限制。可以理解,图示不必按比例画出,而是在本质上,它们仅仅是概念上的。
例如,虽然在不同实施例中使用电话型小键盘用于表示本发明的不同实施例,很明显,具有分配给所述小键盘的按键的任何类型的符号配置的任何类型的小键盘可以用于本发明的实施例。
因为不是频繁重复本发明的数据输入系统的原理,在本申请的许多段落中提到,可以把例如字符/单词/单词的一部分/功能等的一个或多个符号分配给(例如,相应的)按键(或除了按键的其他对象)。可以理解,根据在许多其他实施例中解释的数据输入系统的原理,假设符号由与按键的预定交互进行输入。例如,除非另作陈述,优选的,可以通过可能是在所述按键上(如在本发明的许多实施例中解释的)单次按下的与所述按键的预定的最容易的交互,输入所述符号。同样,在许多段落中,在解释把例如字母/音素集/字符(字母)集/字母串/等的符号(例如,通常要被说出的符号)分配给按键之后,为了避免重复用于输入所述符号的本发明的数据输入系统的原理,所述原理可以不再提及。可以理解,除非另作陈述,很明显,(如在本发明许多实施例中所解释的)优选的,通过在相应按键上相应的按下动作同时结合相应于所述符号的语音,对所述类型的符号(例如,通常要被说出的符号)进行输入。
必须注意,在本申请的许多段落中,术语“字符集”或“字符-集”已用于定义字符串。
虽然在本发明的不同实施例中,声音识别系统已被提及,或希望被用于感知和识别用户的语音,但是,除了所述声音识别系统之外或作为所述声音识别系统的替代,唇读系统可以被用于感知和识别所述用户的语音(并且反之亦然)。