CN101002455A - 在移动和固定环境中增强数据输入的系统 - Google Patents

在移动和固定环境中增强数据输入的系统 Download PDF

Info

Publication number
CN101002455A
CN101002455A CNA200580025250XA CN200580025250A CN101002455A CN 101002455 A CN101002455 A CN 101002455A CN A200580025250X A CNA200580025250X A CN A200580025250XA CN 200580025250 A CN200580025250 A CN 200580025250A CN 101002455 A CN101002455 A CN 101002455A
Authority
CN
China
Prior art keywords
word
user
button
keypad
present
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200580025250XA
Other languages
English (en)
Other versions
CN101002455B (zh
Inventor
B·F·加萨比安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Keyless Systems Ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority claimed from PCT/US2005/019582 external-priority patent/WO2005122401A2/en
Publication of CN101002455A publication Critical patent/CN101002455A/zh
Application granted granted Critical
Publication of CN101002455B publication Critical patent/CN101002455B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Input From Keyboards Or The Like (AREA)

Abstract

一个电子设备,包括:用于输入字符的第一装置,其被耦合到该设备以产生第一字符输入数据;用于输入字符的第二装置,也被耦合到该设备以用于产生第二字符输入数据,其中,用于输入字符的第二装置包括一个用于监控用户语音的系统。一个显示器在那上面显示该字符。一个处理器被耦合到用于输入字符的第一和第二设备,被配置来接收第一和第二字符输入数据,因此显示器上显示的字符对应于第一和第二字符输入数据。

Description

在移动和固定环境中增强数据输入的系统
相关申请
本申请与下列美国临时申请相关,并且要求来自于它们的优先权益:2004年6月4日申请的60/577,444;2004年6月16日申请的60/580,339;2004年7月16日申请的60/588,564;2004年7月20日申请的60/590,071;2004年9月9日申请的60/609,221;2004年10月14日申请的60/618,937;2004年11月15日申请的60/628,304;2004年11月30日申请的60/632,434;2005年2月1日申请的60/649,072;2005年3月15日申请的60/662,140;2005年4月8日申请的60/669,867;和2005年4月21日申请的60/673,525,这些申请在此通过参考集中。
技术领域
本申请涉及一种用于输入字符的系统和方法。更确切地说,本申请涉及一个使用按键、语音或其结合来输入字符的系统和方法。
背景技术
用于电子地输入字符的典型系统和方法包括使用诸如QWERTY键盘等类似的标准键盘。然而,随着现代电子设备尺寸已经变得越来越小,新方法已经被开发出来以便于输入所期望的字符。
这类方法在标准电话数字键区(keypad)上使用一个多按系统,其中多个字母数字字符被分配给同一按键。这类系统的一个缺点是它需要多次按下单个按键以便输入某个字符,从而增加了总的按下按键的数量,减缓了字符输入过程。
在愈来愈小的设备上容纳字符输入的第二种方法已经把设备上的标准QWERTY键区简单地小型化。然而,这类小型化键区往往是笨拙的,并且在按键之间没有充分的间距,从而导致在只希望按下一个按键的时候按下多个按键。
在较小的电子设备上提供字符输入的又一个尝试是使用语音识别软件。这类方法已被使用了一段时间,但是也有了许多缺点。最显著的是,语音识别软件不能区别同音异义字,并且往往需要显著的提前输入以便系统识别一个特定的说话人,他们的特定风格以及说话习惯。此外,试图减轻这些问题的语音识别软件已经变得很大并且需要许多处理,尤其不适用于能量和处理能力有限的诸如移动电话以及文本传呼机之类的较小电子设备。
发明内容
本发明的目的是克服与现有技术相关联的缺点,并且提供一个用于快速、可靠地输入字符并且不需要大量的配置和能量/处理消耗的系统和方法。
为此,本发明意在一个具有定义多个按键的键区的数据输入系统,其中,每个按键都至少包括一个符号组的一个符号。该符号组被划分成至少具有一个字母符号、至少一个数字符号以及至少一个命令符号中的多个子组,其中,每个子组都与用户手指的至少一部分相关联。
提供一个手指识别系统来与多个按键的至少一个按键进行通信,其中,所述至少一个按键具有来自第一子组的至少一个第一符号和来自第二子组的至少一个第二符号,其中,手指识别系统配置为在手指与按键相互作用时认出用户手指的部分,以便选择在对应于与用户手指部分相关联的子组的按键上的符号。
附图说明
根据本发明的一个实施例,图1说明了一个键区;
根据本发明的一个实施例,图2说明了一个键区;
根据本发明的一个实施例,图3说明了一个具有显示器的键区;
根据本发明的一个实施例,图4说明了一个键区;
根据本发明的一个实施例,图5说明了一个键区;
根据本发明的一个实施例,图6说明了一个具有显示器的键区;
根据本发明的一个实施例,图7说明了一个具有显示器的键区;
根据本发明的一个实施例,图7a说明了一个用于进行校正的流程图;
根据本发明的一个实施例,图8说明了一个折叠式键区;
根据本发明的一个实施例,图9说明了一个折叠式键区;
根据本发明的一个实施例,图10说明了一个折叠式键区;
根据本发明的一个实施例,图11说明了一个折叠式键区;
根据本发明的一个实施例,图12说明了一个折叠式键区;
根据本发明的一个实施例,图13说明了一个具有显示器的键区;
根据本发明的一个实施例,图14说明了一个具有显示器的键区;
根据本发明的一个实施例,图15说明了一个具有鼠标的键区;
根据本发明的一个实施例,图16说明了一个具有鼠标的键区;
根据本发明的一个实施例,图17说明了用键区来使用的许多设备;
根据本发明的一个实施例,图18说明了一个具有麦克风的键区;
根据本发明的一个实施例,图18b说明了一个具有麦克风的键区;
根据本发明的一个实施例,图18c说明了一个具有麦克风的键区;
根据本发明的一个实施例,图18d说明了一个具有麦克风的键区;
根据本发明的一个实施例,图18e说明了一个具有天线的键区;
根据本发明的一个实施例,图18f说明了一个具有天线的键区;
根据本发明的一个实施例,图18g说明了一个具有麦克风的键区;
根据本发明的一个实施例,图18h说明了一个具有麦克风的键区;
根据本发明的一个实施例,图18i说明了一个具有麦克风的键盘;
根据本发明的一个实施例,图19说明了一个具有显示器和PC的键区;
根据本发明的一个实施例,图20说明了一个具有显示器和PC的键区;
根据本发明的一个实施例,图21说明了一个具有显示器和膝上型计算机的键区;
根据本发明的一个实施例,图22说明了一个具有显示器和显示屏的键区;
根据本发明的一个实施例,图22a说明了一个具有折叠式显示器的键区;
根据本发明的一个实施例,图22b说明了一个腕装键区和一个遥控显示器;
根据本发明的一个实施例,图23a说明了一个腕装键区和折叠式显示器;
根据本发明的一个实施例,图23b说明了一个腕装键区和折叠式显示器;
根据本发明的一个实施例,图23c说明了一个腕装折叠式键区;
根据本发明的一个实施例,图24a说明了一个具有折叠式显示器的键区;
根据本发明的一个实施例,图24b说明了一个具有折叠式显示器的键区;
根据本发明的一个实施例,图25a说明了一个具有折叠式显示器的键区;
根据本发明的一个实施例,图25b说明了一个具有折叠式显示器的键区;
根据本发明的一个实施例,图26说明了一个具有延伸杆的键区;
根据本发明的一个实施例,图27说明了一个具有延伸杆的键区;
根据本发明的一个实施例,图27a说明了一个具有延伸杆的键区;
根据本发明的一个实施例,图27b说明了一个具有延伸杆的键区;
根据本发明的一个实施例,图28说明了一个键区;
根据本发明的一个实施例,图29说明了一个话筒;
根据本发明的一个实施例,图29a说明了一个键区和话筒的结合;
根据本发明的一个实施例,图30说明了一个耳塞;
根据本发明的一个实施例,图31说明了一个耳塞和键区的结合;
根据本发明的一个实施例,图32说明了一个耳塞;
根据本发明的一个实施例,图33说明了一个键区;
根据本发明的一个实施例,图34说明了一个语音识别表;
根据本发明的一个实施例,图35说明了一个语音识别表;
根据本发明的一个实施例,图36说明了一个示例语音识别;
根据本发明的一个实施例,图37说明了一个语音识别表;
根据本发明的一个实施例,图38说明了一个语音识别表;
根据本发明的一个实施例,图39说明了一个语音识别表;
根据本发明的一个实施例,图40说明了一个语音识别表;
根据本发明的一个实施例,图41说明了一个语音识别表;
根据本发明的一个实施例,图42说明了一个传统的键盘;
根据本发明的一个实施例,图43说明了一个键区;
根据本发明的一个实施例,图43a说明了一个键区;
根据本发明的一个实施例,图43b说明了一个键区;
根据本发明的一个实施例,图44a说明了一个键区;
根据本发明的一个实施例,图44b说明了一个键区;
根据本发明的一个实施例,图45说明了一个键盘;
根据本发明的一个实施例,图45a说明了一个键区;
根据本发明的一个实施例,图45b说明了一个键区;
根据本发明的一个实施例,图45c说明了一个键区;
根据本发明的一个实施例,图45d说明了一个键区;
根据本发明的一个实施例,图46a说明了一个键区;
根据本发明的一个实施例,图46b说明了一个键区;
根据本发明的一个实施例,图46c说明了一个键区;
根据本发明的一个实施例,图47a说明了一个具有显示器的键区;
根据本发明的一个实施例,图47b说明了一个具有显示器的键区;
根据本发明的一个实施例,图47c说明了一个具有显示器的键区;
根据本发明的一个实施例,图47d说明了一个具有显示器的键区;
根据本发明的一个实施例,图47e说明了一个具有显示器的键区;
根据本发明的一个实施例,图47f说明了一个具有显示器的键区;
根据本发明的一个实施例,图47g说明了一个标准的折合纸;
根据本发明的一个实施例,图47h说明了一个标准的折合纸;
根据本发明的一个实施例,图47i说明了一个具有键区和显示打印机的标准折合纸;
根据本发明的一个实施例,图48说明了一个键区;
根据本发明的一个实施例,图49说明了一个具有键区和显示器的手表;
根据本发明的一个实施例,图49a说明了一个具有折叠型键区和显示器的手表;
根据本发明的一个实施例,图49b说明了一个具有键区和显示器的关闭的手表;
根据本发明的一个实施例,图50a说明了一个面对键区的关闭的折叠型手表;
根据本发明的一个实施例,图50b说明了一个面对键区的打开的折叠型手表;
根据本发明的一个实施例,图51说明了一个键区;
根据本发明的一个实施例,图51a说明了一个键区;
根据本发明的一个实施例,图51b说明了一个键区;
根据本发明的一个实施例,图52说明了一个键区;
根据本发明的一个实施例,图53说明了一个键区和显示器;
根据本发明的一个实施例,图54说明了一个键区;
根据本发明的一个实施例,图55a说明了一个键区;
根据本发明的一个实施例,图55b说明了一个键区;
根据本发明的一个实施例,图55c说明了一个在用户手上的键区;
根据本发明的一个实施例,图55d说明了一个麦克风和摄像头;
根据本发明的一个实施例,图55e说明了一个麦克风和摄像头;
根据本发明的一个实施例,图55f说明了一个折叠型键区;
根据本发明的一个实施例,图55g说明了一个用于键区的按键;
根据本发明的一个实施例,图55h说明了在鼠标上的键区;
根据本发明的一个实施例,图55i说明了键区上的一个鼠标的下侧;
根据本发明的一个实施例,图55j说明了一个具有键区的耳机和麦克风;
根据本发明的一个实施例,图56说明了一个键区;
根据本发明的一个实施例,图56a说明了一个键区;
根据本发明的一个实施例,图56b说明了一个键区;
根据本发明的一个实施例,图57说明了一个键区;
根据本发明的一个实施例,图57a说明了一个键区;
根据本发明的一个实施例,图58a说明了一个键区;
根据本发明的一个实施例,图58b说明了一个键区;
根据本发明的一个实施例,图58c说明了一个键区;
根据本发明的一个实施例,图59a说明了一个键区;
根据本发明的一个实施例,图59b说明了一个键区;
根据本发明的一个实施例,图60说明了一个键区和显示器外壳;
根据本发明的一个实施例,图61a说明了一个键区;
根据本发明的一个实施例,图61b说明了一个键区;
根据本发明的一个实施例,图61c说明了一个键区;
根据本发明的一个实施例,图62a说明了一个键区和显示器;
根据本发明的一个实施例,图62b说明了一个键区和显示器;
根据本发明的一个实施例,图63a说明了一个键区和显示器;
根据本发明的一个实施例,图63b说明了一个键区和显示器;
根据本发明的一个实施例,图63c说明了一个键区和显示器;
根据本发明的一个实施例,图63d说明了一个键区和显示器;
根据本发明的一个实施例,图63e说明了一个在头戴式耳机上的键区和显示器;
根据本发明的一个实施例,图64a说明了一个键区和显示器;
根据本发明的一个实施例,图64b说明了一个可折叠的键区和显示器;
根据本发明的一个实施例,图65a说明了一个键区和显示器;
根据本发明的一个实施例,图65b说明了一个键区和显示器的背面;
根据本发明的一个实施例,图65c说明了一个键区和显示器;
根据本发明的一个实施例,图66说明了通过主服务器/计算机连接的多个键区和显示器;
根据本发明的一个实施例,图67说明了一个环形传感器形式的键区;
根据本发明的一个实施例,图68说明了一个键区和显示器;
根据本发明的一个实施例,图68a说明了一个显示器;
根据本发明的一个实施例,图69说明了一个键区;
根据本发明的一个实施例,图69a说明了一个键区;
根据本发明的一个实施例,图69b说明了一个键区和显示器;
根据本发明的一个实施例,图70a说明了一个灵活显示器;
根据本发明的一个实施例,图70b说明了一个具有键区的灵活的显示器;
根据本发明的一个实施例,图70c说明了一个具有键区的灵活的显示器;
根据本发明的一个实施例,图70d说明了一个具有键区的关闭的可折叠显示器;
根据本发明的一个实施例,图70e说明了一个具有键区的打开的可折叠显示器;
根据本发明的一个实施例,图70f说明了具有键区和打印机的灵活显示器;
根据本发明的一个实施例,图70g说明了一个具有键区的关闭的可折叠显示器;
根据本发明的一个实施例,图70h说明了一个具有键区的打开的可折叠的显示器;
根据本发明的一个实施例,图71a说明了一个具有键区和天线的灵活的显示器;
根据本发明的一个实施例,图71b说明了一个具有键区和天线的灵活的显示器;
根据本发明的一个实施例,图71c说明了一个具有键区和可伸出麦克风的显示器;
根据本发明的一个实施例,图72a说明了一个电子设备的腕带;
根据本发明的一个实施例,图72b说明了一个在关闭位置中的被分离的灵活显示器;
根据本发明的一个实施例,图72c说明了一个在开启位置中的被分离的灵活显示器;
根据本发明的一个实施例,图73说明了一个键区;
根据本发明的一个实施例,图74说明了一个可折叠键区;
根据本发明的一个实施例,图74a说明了一个可折叠键区;
根据本发明的一个实施例,图75说明了一个键区;
根据本发明的一个实施例,图75a说明了一个显示器;
根据本发明的一个实施例,图76a说明了来自图75a的一个显示器的背面;
根据本发明的一个实施例,图77是一个音节表;
根据本发明的一个实施例,图78是一个音节表和一个键区;
根据本发明的一个实施例,图79是一个流程图;
根据本发明的一个实施例,图80是一个键区和显示器;
根据本发明的一个实施例,图81是一个显示器;
根据本发明的一个实施例,图81a是一个显示器;
根据本发明的一个实施例,图81b是一个显示器;
根据本发明的一个实施例,图81c是一个显示器;
根据本发明的一个实施例,图81d是一个显示器;
根据本发明的一个实施例,图81e是一个显示器;
根据本发明的一个实施例,图81f是一个显示器;
根据本发明的一个实施例,图81g是一个显示器;
根据本发明的一个实施例,图81h是一个显示器;
根据本发明的一个实施例,图81i是一个显示器;
根据本发明的一个实施例,图81j是一个显示器;
根据本发明的一个实施例,图82是一个键区和显示器;
根据本发明的一个实施例,图83是一个键区;
根据本发明的一个实施例,图83a是一个键区;
根据本发明的一个实施例,图83b是一个键区;
根据本发明的一个实施例,图83c是一个键区;
根据本发明的一个实施例,图84a是一个在显示器内的键区布局;
根据本发明的一个实施例,图84b是一个在显示器内的键区布局;
根据本发明的一个实施例,图84c是一个在显示器内的键区布局;
根据本发明的一个实施例,图84d是一个在显示器内的键区布局;
根据本发明的一个实施例,图84e是一个键区;
根据本发明的一个实施例,图85是一个键区和笔划命令表;
根据本发明的一个实施例,图85a是一个笔划命令表;
根据本发明的一个实施例,图85b说明了一个键区和一个显示器;
根据本发明的一个实施例,图85c说明了一个显示器;
根据本发明的一个实施例,图86是一个在显示器内的键区布局;
根据本发明的一个实施例,图87说明了一个触控笔;
根据本发明的一个实施例,图87a说明了一个触控笔;
根据本发明的一个实施例,图87b说明了一个触控笔;
根据本发明的一个实施例,图87c说明了一个触控笔;
根据本发明的一个实施例,图88a说明了一个触控笔和显示器;
根据本发明的一个实施例,图88b说明了一个触控笔和显示器;
根据本发明的一个实施例,图89说明了一个具有天线的触控笔;
根据本发明的一个实施例,图89a说明了一个具有天线的触控笔;
根据本发明的一个实施例,图89b说明了一个具有天线的触控笔;
根据本发明的一个实施例,图89c说明了一个具有天线的触控笔;
根据本发明的一个实施例,图90说明了一个显示器和触控笔;
根据本发明的一个实施例,图90a说明了一个键区显示器和触控笔;
根据本发明的一个实施例,图90b说明了一个显示器和触控笔;
根据本发明的一个实施例,图91说明了一个键区;
根据本发明的一个实施例,图92说明了一个键区;
根据本发明的一个实施例,图93说明了一个显示器;
根据本发明的一个实施例,图93a说明了一个显示器;
根据本发明的一个实施例,图94说明了一个在显示器上的键区布局;
根据本发明的一个实施例,图95说明了一个键区;
根据本发明的一个实施例,图96说明了一个键区和音节表;
根据本发明的一个实施例,图97说明了一个键区和一个显示器;
根据本发明的一个实施例,图98a说明了一个键区和显示器;
根据本发明的一个实施例,图98b说明了一个显示器;
根据本发明的一个实施例,图99是一个数据输入单元、电话和计算机的图表;
根据本发明的一个实施例,图100说明了一个键区;
根据本发明的一个实施例,图101说明了一个键区;
根据本发明的一个实施例,图102是一个数据输入单元和语音输入设备的图表;
根据本发明的一个实施例,图103a说明了一个显示器及其相连接的键区;
根据本发明的一个实施例,图103b说明了一个显示器及其相连接的键区;
根据本发明的一个实施例,图104a是一个数据输入单元的图表;
根据本发明的一个实施例,图104b说明了一个显示器及其相连接的键区;
根据本发明的一个实施例,图105说明了一个键区和一个显示器;
根据本发明的一个实施例,图106是一个键区、数据输入单元和多个显示器的图表;
根据本发明的一个实施例,106a说明了一个连结到用户手指的显示器;
根据本发明的一个实施例,106b说明了一个连结到用户手指的显示器;
根据本发明的一个实施例,106c说明了一个连结到用户手指的显示器;
根据本发明的一个实施例,106d说明了一个连结到用户手指的显示器;
根据本发明的一个实施例,图107说明了一个连结到用户手指的数据输入单元;
根据本发明的一个实施例,图107a说明了一个连结到用户手指的键区和数据输入单元;
根据本发明的一个实施例,图107b说明了一个连结到用户手指的键区和数据输入单元;
根据本发明的一个实施例,图108a说明了一个连结到用户手指的数据输入单元;
根据本发明的一个实施例,图108b说明了一个连结到用户手指的数据输入单元;
根据本发明的一个实施例,图109说明了一个连结到用户手指的数据输入单元;
根据本发明的一个实施例,图110a说明了一个在手表上的显示器;
根据本发明的一个实施例,图110b说明了一个在用户手腕上的显示器;
根据本发明的一个实施例,图111a说明了一个在用户佩戴的手套上的显示器;
根据本发明的一个实施例,图111b说明了一个在用户佩戴的手套上的显示器;
根据本发明的一个实施例,图112说明了一个在用户佩戴的手套上的显示器;
根据本发明的一个实施例,图113说明了一个连结到用户手指的键区和数据输入单元;
根据本发明的一个实施例,图114a说明了一个具有两个端片键区的可闭合显示器;
根据本发明的一个实施例,图114b说明了一个具有两个端片键区的已闭合显示器;
根据本发明的一个实施例,图115a说明了一个用户佩戴的具有连接的语音数据输入单元的眼镜上的显示器;
根据本发明的一个实施例,图115b说明了一个用户佩戴的具有连接的语音数据输入单元的眼镜上的显示器;
根据本发明的一个实施例,图116a说明了一个手表和键区;
根据本发明的一个实施例,图116b说明了一个它们之间具有显示器的手表和键区;
根据本发明的一个实施例,图116c说明了一个它们之间具有显示器的手表和键区;
根据本发明的一个实施例,图117a说明一个手表;
根据本发明的一个实施例,图117b说明一个在其下面有显示器并且在其背面有键区的手表;
根据本发明的一个实施例,图117c说明一个在其下面有显示器并且在其背面有键区的手表;
根据本发明的一个实施例,图118a说明了一个在用户手指上的数据输入单元;
根据本发明的一个实施例,图118b说明了一个在用户手指上的数据输入单元;
根据本发明的一个实施例,图118c说明了一个在用户手指上的数据输入单元;
根据本发明的一个实施例,图118d说明了一个在用户手指上的数据输入单元;
根据本发明的一个实施例,图119说明了一个连结到用户手指的键区和数据输入单元;
根据本发明的一个实施例,图120a说明了一个在用户佩戴的手套上的数据输入单元;
根据本发明的一个实施例,图120b说明了一个在用户佩戴的手套上的数据输入单元;
根据本发明的一个实施例,图121说明了一个键区和一个显示器;
根据本发明的一个实施例,图122说明了一个键区、显示器和数据输入单元;
根据本发明的一个实施例,图123说明了一个在头戴式耳机上的数据输入单元和一个连接的显示器;以及
根据本发明的一个实施例,图124说明了一个键区。
具体实施方式
在下文中描述的本发明涉及诸如字符、标点、函数等等之类的符号(例如计算机键盘的符号)在按键数量有限的小键区上的配置方法,通常用于数据输入,并且特别地用于合并了用户语音/话音和在键区上的按键交互作用(例如按键按压)的数据和/或文本输入方法。这个方法简化了这类键区的使用。
图1示出了一个集成的键区100的示例,其用于使用按键和声音/语音识别系统的数据输入方法。在这个示例中,键区的按键可以对它们的一种或多种类型的交互作用做出响应。所述交互作用可以是诸如:
-用一个特定手指或手指的一部分(用手指识别系统)按下一个按键
-在一个按键上的单次敲击(例如按下)或者在一个按键上的两次敲击(例如短时间间隔内的两次连续按压)。
-一个按键上的轻压(或一个触摸),或者一个按键上的重压
-与一个按键的短时间交互作用(例如,一个按键的短时间按压)或者一个按键的较长时间的按压等等。
所述键区上的一个符号组可以被分配给每个所述交互作用或者被分配给它们与键区按键的任何结合。例如,键区100的按键顶侧上所示的符号可以被分配给键区按键上的单按。如果一个用户例如按压按键101,则符号”DEF3.”可以被选择。在同一示例中,在键区100的按键底侧上配置的符号例如可以被分配给在所述按键上的两次敲击。如果一个用户例如双敲按键101,则符号“{}′”被选择。
取决于用键区的按键来实现的系统,与诸如之前所描述的选择之类的其它交互作用相同的选择也是可能的。例如,轻压(或触摸)按键101将选择在所述按键顶侧上配置的符号,而较重按压同一按键将选择配置在所述按键底侧上的符号。
如前所述,当用户与按键交互作用时,一个识别系统候选被分配给所述类型的交互作用的所述按键上的符号。例如,如果用户触摸或轻压按键102,则系统候选符号”A”、”B”、”C”、”2”和″,”。为了选择其中一个所述候选符号,所述用户例如可以说出所述按键上的所述符号或所述符号的位置名称。为此,要使用一个声音/语音识别系统。
如果用户没有说话,则那些候选符号当中的一个预定义符号可以被选择为缺省值。在这个示例中,在方框103中被示出的标点″,”被选择。为了选择其它候选符号中的一个,例如字母”B”,用户可以说出所述字母。
在相同的示例中,如果用户重重地按下按键102,则符号“[”、“]”、和““”可以被候选。如上所述,如果用户没有说话,则所述按压动作选择的那些符号当中的一个预定义符号可以被选择为缺省值。在这个示例中,标点““”被选择。也在这个示例中,为了在两个其它的候选符号“[”、“]”当中选择一个期望符号,用户可使用诸如说出所述期望符号、和/或说出其与其它符号有关的位置、和/或说出其颜色(如果每个符号具有不同的颜色),和/或任何预定义名称(例如,由用户生成的一个预定义语音或声音)之类的不同方法。例如,如果用户说“左”,则字符“[”被选择。如果用户说“右”,则字符“]”被选择。
当然,如果不使用使用语音/话音,与一个按键交互作用相结合的用户行为可以选择一个符号。例如,一个用户可以重重地按下按键102并且用他的手指向一个期望符号猛击。
上述的数据输入方法还可以被应用到一个具有与所述按键交互作用的单个类型对应的按键的键区(例如,一个具有按钮的标准电话键区)。如图2中所示,键区200具有与所述按键的单次交互作用对应的按键。当用户按下一个按键时,所述按键上的全部符号被该系统候选。例如,如果用户按下按键202,那么符号“A”、“B”、“C”、“2”、“,”、“[”和“]”被候选。
在这个示例中,如果用户没有说话,则系统可以选择一个预定义的缺省符号。在这个示例中,标点“,”203被选择。
仍然在同一示例中,为了选择所述候选者当中的一个期望符号,用户可以或者说出一个期望符号,或者例如说出所述符号在所述按键上的位置名称或者与所述按键上其它符号有关的位置名称,或者之前描述的任何其它名称。例如,在该按键上设置的那些符号当中的一个符号(例如”A”、”B”、”C”、或”2”)可以通过说出它而被选择。另一方面,例如在该按键的底侧上设置的符号之一(例如”[“、″,”或″]”)可以通过说出其例如与所述按键的底侧上的两个其它符号相关的位置例如通过说出″左″、″中″或″右″而被选择。例如,为了选择”[“204,用户可以按下按键202并说″左″。
正如所提及的那样,图1键区的按键可以响应至少两种预定义类型的与它们的交互作用。与所述键区按键的每一种交互作用都可以候选所述按键上的一组所述字符。
如之前所述,在诸如文本之类的一个数据输入期间,与按键的不同交互作用(例如单敲,双敲)以及与所述按键交互作用相结合的不同用户行为(例如说话,不说话)可能是需要的。尽管本发明的数据输入方法是一种快速容易的数据输入,但是在本发明的键区按键上一个好的符号配置可以导致一个更容易更快速的数据输入系统。这个方法将稍后描述。
根据一个实施例,如图3中所示,许多符号(例如计算机键盘上的符号)物理上被分成至少两组并按照它们的优先顺序(例如使用频率,用户对于诸如标准电话键区上的字母和数字之类的某些符号的现有布局的熟悉度)被安排在一个电话键区按键上,如下所示:
第一组,被分配给与一个按键的第一类型交互作用
a)使用语音/话音的第一子组
按照标准配置,数字0-9和字母A-Z可以位于一个键区的按键上并被分配给与所述按键的第一类型的交互作用(例如第一级按压)。在它们当中的一个期望符号可以通过与一个对应按键的交互作用(例如所述第一类型的交互作用)并自然地说出所述符号而被选择。在图3中,所述符号(例如301)被设置在按键的顶部上。
字母和数字例如在一个文本输入期间可能被频繁使用。它们二者都可能例如在对应按键上敲击的同时很自然被说出。因此,为了更快捷,并且优选地,它们可以被分配给与一个键区的按键的同类型的交互作用。
b)不使用语音/话音的第二子组
在数据(例如文本)输入期间频繁使用的至少部分其它符号(例如标点,功能等等)可以位于该键区的按键(每个按键一个符号)上并且被分配给与所述按键的所述第一类型交互作用(例如单次敲击)。缺省地,一个期望符号可以只通过与对应按键的所述交互作用来选择而不使用话音/语音。在图3中,所述符号(例如302)被设置在按键的顶部上的框中。
当然,所述符号也可以在与一个对应按键的交互作用的同时说出它们而被选择,但是因为说出这种符号(例如标点,功能)并不总是自然的行为,因此最好是不说出它们。
至少一个第二组,其被分配给与至少一个按键的至少一个第二类 型交互作用。
至少部分剩余符号可以被分配给与所述键区的所述按键的交互作用的至少一个第二类型。它们可以被划分成两组如下:
c)不使用语音/话音的第三子组
第三子组包括剩余频繁使用的符号和难以发音和/或正常情况下不读的符号,第三子组可以位于所述键区的所述按键上(每个按键上一个符合)并被分配给与所述按键的交互作用(例如双敲,更大的压力级别,同时按下两个按键,通过手指的一部分触摸该按键等等)的第二类型。
缺省时,一个期望符号可以只通过与对应按键的所述交互作用来选择而不使用话音/语音。在图3中,所述符号(例如303)被设置在按键底侧上的框中。当然,所述符号也可以在与一个对应按键的交互作用的同时说出它们而被选择,但是因为说出这种符号(例如标点,功能)并不总是自然行为,因此最好是不说出它们。
d)使用语音/话音的至少一个第四子组
包括至少部分剩余符号的第四子组也可以被分配给与所述键区按键的所述第二类型交互作用并且与诸如语音之类的用户行为结合。在图3中,所述符号(例如304)被设置在按键的底侧上。所述符号可以通过与一个对应按键的所述第二类型交互作用并以如下的不同方式使用语音/话音而被选择:
-通过符号的名称自然发音来选择符号;
-通过在一个文本中使用它们时自然说出在一个按键上它们相互之间的位置或者它们的位置来选择符号(例如“<”,“>”在这个示例中,所述符号不属于所述第二类型的交互作用,这只是一个示例),例如通过说“左,右,打开,关闭”等等。
-极少使用(这种情况非常少)和/或很难发音(例如304)的符号。对于一个快速且容易的数据输入方法,所述符号还可以通过说出它们在一个按键上的位置或者在所述按键上相互之间的位置而被选择。当然,它们可以通过使用其它话音(例如读出它们)而被选择。
e)其它
如果需要,则诸如”F1-F12”等等之类的其它符号可以被提供在键区的按键上并且被分配一种类型的交互作用。例如,它们可以被分配给所述第二类型的交互作用(有或者没有使用话音),或者被分配给另一种类的交互作用,比如:同时按下两个按键、在对应的(一个或多个)按键上三次敲击、进入另一模式的切换等等。
增强所述键区及其使用的更多考虑
因为按照标准配置,数字0-9和字母A-Z可以位于一个键区的按键上,并被分配给与所述按键的第一类型的交互作用(例如第一级按压,单次敲击等等),并且与话音结合,诸如311、312、313和314之类的某些按键可以包含在所述配置中使用的至多一个符号(例如按键311上的数字1或者按键313上的数字0)。因此,为了所述按键的更好使用,某些容易且发音自然的符号321-324可以在所述按键上被加上并且被分配给所述第一类型交互作用。例如,用户可以通过使用与按键311的第一类型交互作用并说″左″或″打开″来选择字符″(″。为了选择字符″)″,用户可以使用相同的与所述按键311的第一类型交互作用并例如说″右″或″关闭″。这是所述符号的一种快速的、更重要的是一种自然的话音。因为在所述按键311-314上被分配给所述第一类型交互作用的候选符号的数量没有超出其它按键上的符号数量,所以语音识别系统仍然可以具有像其它按键那样类似的精确度。
同时,某些符号可以被用于两个模式(与按键的交互作用)。所述符号可以在键区上被配置不止一次(例如在单个按键上或者在不同按键上),并被分配给与(一个或多个)对应按键的第一和/或第二类型的交互作用。
图3说明了一种本发明用于计算机数据输入系统的优选实施例。键区300的按键响应它们上的两个或更多不同的交互作用(比如不同的按压级别、单次或两次敲击等等)。如图所示,诸如字母数字字符、标点、功能键和PC命令之类的许多符号在所述按键中分配如下:
模式1
第一组-字母A-Z和数字0-9是在诸如书写文本之类的数据输入期间非常频繁使用的符号。它们可以在按下对应按键的同时,很容易且最重要的是很自然地被发音。因此,它们一起被安排在按键上的同一侧上,属于诸如在按键上单次敲击(例如单次按下)之类的同一类型的交互作用,并且通过说出它们而被选择。
第二组-诸如在诸如书写文本之类的数据输入期间非常频繁使用的标点与功能之类的字符可以属于被用于选择所述字母和数字(例如所述第一模式)的同一类型的交互作用。这是尽可能在输入数据的同时继续与按键的同一类型的交互作用。每个按键只可以具有所述第二组的所述字符中的一个。这个符号组可以通过只按下一个对应按键而不使用语音就被选择。为了更好地区别,它们在按键的顶端(例如与字母和数字同一侧)的框中被示出。
模式2
所述多个符号中的其它符号在键区按键的底侧上被示出。它们被分配给与所述按键的第二类型交互作用(例如两次敲击)。
第三组-缺省的符号(例如需要与一个按键的交互作用并且可能不需要使用语音的那些符号)在框中被示出。所述符号包括字符、标点、功能键等等,其当前很少被用户使用。
第四组-最后,在一个数据输入中很少使用并且拼写不规则的符号,在这个示例中位于按键底侧上的左侧。它们可以通过与对应按键的对应交互作用(例如两次敲击),并且,或者(例如几乎同时)读出它们,或者通过说出分配给所述符号的一个预定义话音或语音(例如“左、右”或者“蓝、红”等等。)呼叫它们来被选择。
通过使用这样一个键区,该键区具有对应于与按键的不同类型(优选地,两个类型,以免复杂按键的使用)交互作用的按键,并且具有某些不需要话音(例如缺省值)的符号,当所述键区的一个按键交互作用时,或者一个期望按键被直接交互作用(例如缺省值),或者通过诸如语音/话音之类的用户行为被选择的候选符号能够最少。这加强了语音识别系统的准确度。
例如,当一个用户轻压一个按键时,系统在位于所述按键上的那些符号当中选择在所述按键上部的符号。如果用户同时使用一个语音,那么系统在所述选定符号当中选择需要语音的那些符号。这个缩减候选数量并且需要语音识别技术来选定他们其中之一的程序,被用来通过一个按键数量有限的键区使一个数据输入具有高准确度。所述缩减程序通过诸如按下一个按键和/或说话之类的用户的自然行为进行。
如图4中所示,按键411、412、413和414具有不超过一个的符号(所述按键的上部示出)需要语音交互作用,并被分配给与所述按键的第一类型交互作用。另一方面,底侧上的同一按键包含两个符号,其需要与所述按键的第二类型交互作用并且还需要语音交互作用。所述两个符号可能比属于同一类别的其它符号使用更频繁(例如在算术数据输入中或者当编写软件时等等)。在这种情况下,并且为了在与按键的交互作用(例如按下)的同时将用户差错最小化,所述符号还可以被分配给与所述按键的所述第一类型交互作用。候选符号的总量保持在低水平。用户可以在他期望时按下所述按键并说话。
额外的布局可以被提供在前述的键区上,以简化用户对其的使用。例如,“-”和“”、“″和““”,或“;”和“:”可以被配置为在同一按键411上或者在两个邻近按键415、416上的缺省符号。同样,”Sp”和“”(例如Tab)也可以被认为是缺省符号并被配置在同一按键412上,每一个响应于与所述按键的不同类型交互作用(例如按压级别)。例如,通过按压一次按键412,字符”Sp”被选定。通过两次敲击同一按键,”tab”功能键被选定。
在与一个按键的交互作用(例如按下一个按键一次或在其上双击)的同时,通过不松开所述按键,对应于所述交互作用(如果需要的话,则包括话音)的一个符号可以被选定并重复,直到按键被松开为止。例如,通过两次敲击按键415并在第二次敲击之后保持按键被按压但不说话,则分配给所述交互作用的缺省符号(例如”&”)被选定并重复直到用户松开所述按键。为了输入字母”X”并重复它,用户例如可以按压相应的按键415(不松开它)并说”X”。字母”X”将被重复直到用户松开所述按键为止。
同时,为了获得一个更显熟悉的键区外观,诸如”#″和”*”之类的字母、数字和字符可以按照标准电话键区配置位于所述按键上。
与所述键区的按键分开排列的辅助按键,可以被用来包括所述符号或附加符号的一部分。在图6的示例中,光标在不同方向上由与键区600的按键分开排列的至少一个按键来导航。单个按键601可以被分配给所有的方向602。例如,用户可以按压所述按键并说“上、下、左、右”,以便在相应方向中导航光标。按键601也可以是一个多方向按键(例如,类似于在视频游戏或某些蜂窝电话中用来导航菜单的按键)。因此,用户可以按压键601的顶、右、底、左侧来导航光标。此外,多个辅助按键也可以被例如分别分配给至少一个诸如”″之类26-28的符号。
所述的辅助按键可以是一个电子设备上现有的按键。例如,在一个蜂窝电话中,除了标准电话键区的十二个按键之外,诸如菜单键或开/关键之类的附加功能键被提供。当系统例如在一个文本输入模式中时,包括了许多符号的那些按键中的至少一部分可以被用作辅助数据输入按键。这释放了标准电话键区按键上的一部分空间。被释放空间可以允许一个更准确的语音识别系统和/或一个在按键上更加用户友好的符号配置。
之前所示的配置和示例的上述方法只是作为示例被示出。当然,也可以考虑许多其它的符号配置和对与按键交互作用的不同用户的不同分配。例如,一个按键可能没有缺省符号,或在一个按键上不存在被分配给话音/语音的符号。
此外,不是所有的键区按键都可以响应一个相同类别的交互作用。例如,一个键区的第一个按键可以对两个压力做出响应,而同一键区的另一按键可以对其上的单次或两次敲击做出响应。
图1-7示出了键区按键上的符号的不同配置。
上述数据输入系统允许通过一个计算机键区的诸如全文本数据输入之类的完全数据输入。通过逐个地输入诸如字母、标点符号、功能键等等之类的字符,单词和句子可以被输入。
这将对电信市场造成很大的影响,允许增强许多已经在使用中的应用和方法。在下文中将列出其中的一部分。可以理解的是,上述交互作用的任何结合可以被用于输入一个期望符号。
根据本发明的一个实施例,用户使用语音/话音来输入一个诸如字母之类的期望符号,而无需诸如按键之类的其它交互作用。用户可以使用键区的按键(例如单按、双按、三按等等)来输入诸如标点之类的符号而不用说出它们。
可以理解的是,本申请中描述的数据输入方法可以被应用于诸如中文、韩文、日文等等之类的所有其它语言。
符号的校正和重复
不同的方法可以被用来校正一个被错误输入的符号。正如所提及的那样,为了输入一个符号,一个用户例如可以按下一个相应的按键并且说出在所述按键上配置的所述期望符号。有可能发生的是,话音/语音识别系统误解用户的语音,并且系统选择了一个在所述按键上配置的非期望符号。
例如,如果用户:
a)在输入下一个期望符号(例如光标位于在所述的错误符号之后,紧接它)之前,识别出一个被错误地输入的符号,则他可以在进行一个在下文中解释的校正程序;
b)在输入至少一个下一个符号之后,识别出一个被错误地输入的符号,他首先可以通过诸如按键101(图1)、或202(图2)之类的具有导航功能的相应装置在文本中导航,并且在紧接所述错误符号之后放置光标。然后,他进行一个在下文中解释的校正程序;
把光标定位在所述的错误符号之后,与此紧接,用户可以或者说出所述的期望符号,或者其位置名称而不用再按压所述的相应按键。如果系统又选择相同的的被删除符号,则它将自动地拒绝所述选择,并且在所述按键上配置的剩余符号中选择一个符号,其中,其名称或其位置名称对应于下一个对应于所述的用户语音的最高可能性。如果系统仍然选择了一个错误的符号,则用户再说出期望符号以及在所述按键上的剩余符号当中具有最高可能性的的下一个符号选择的程序,可以继续直到所述期望符号被系统选择为止。
不言而喻,在一个使用具有按键响应(例如,两次压力)的键区的数据输入系统中,当进行校正时,识别系统可以首先着手在那些属于相同的符号组的符号当中选择一个符号,该符号组属于应用于选择所述错误符号的压力级。如果那些符号中没有一个被用户接受,则系统可以着手在属于所述按键上的其它压力级的符号当中选择一个符号。
图7B示出一个对应于校正方法的一个实施例的流程图。如果一个用户由于任何原因想校正一个已输入符号,则他可以进入这个校正程序。
校正程序起始于步骤701。如果替换符号不与将被替换符号位于同一按键(步骤702),则用户删除将被替换符号(步骤704),并且通过按下一个相应按键而且如有需要则用附加语音来输入替换符号(步骤706),以及退出(步骤724)。
如果替换符号与将被替换符号位于同一按键上(步骤708),并且替换符号不需要语音(步骤710),则系统继续到步骤704和706,并且相应地如之前所述的那样操作并且退出(步骤724)。
如果替换符号与将被替换符号位于同一按键上(步骤708),并且替换符号需要语音(步骤712),则考虑两种可能性:
a)光标不在将被替换符号之后(步骤714)。在这种情况下,用户将光标置于将被替换符号之后,紧跟着它(步骤716),并且进行下一步骤718;
b)光标位于将被替换符号之后(步骤714)(例如,用户立即识别出一个被错误地输入的符号)。在这种情况下,用户进行下一步骤718;
在步骤718,用户说出期望符号但不按下一个按键。通过不按下一个按键而只是说话,系统理解一个位于被置于光标之前的按键的符号必须被属于同一按键的另一符号替换。然后,系统将用对应于所述语音的最高可能性在所述按键上的剩余符号(例如排除已选择符号)中选择一个符号(步骤720)。如果新选择的符号还是一个非期望符号(步骤722),则系统(和用户)重新进入步骤718。如果所选符号是被期望符号,则系统退出校正程序(步骤724)。
当然,如果不使用上述方法,一个符号校正的常规方法也可以被提供。例如用于校正一个已输入符号,用户可以简单地首先删除所述符号并且然后通过按下一个相应按键,并且如有需要用附加语音来再输入一个新的符号。
文本输入系统同样可以被应用于单词级(例如,用户说出一个单词并且通过使用键区来键入它)。一个相同的文本输入程序可以结合单词级输入(例如用于数据库中包括的字)和字符级输入。因此,上述的校正程序还可以被应用于单词级数据输入。
例如,为了输入一个单词,用户可以说出所述单词并且按下相应的按键。如果由于诸如两个单词之间发音相近的不明确性以及类似的按键按压之类的任何原因,识别系统选择了一个非期望单词,则用户可以再说出所述的期望单词而不必再按压所述的相应按键。然后,系统将用对应于所述语音的最高可能性在对应于所述按键按下的剩余候选单词(例如排除已选择单词)当中选择一个单词。如果新选择的单词还不是所期望的,则用户可再次说出所述单词。这个程序可以被一直重复到所述期望单词被系统选择或不存在其它候选单词为止。在这种情况下,用户可以通过如之前所解释的逐字符输入系统来输入所述期望单词。
可以理解的是,在单词级中,在校正时,光标应该被置于所述将被替换的单词之后。为此,并且为了避免使用字符校正模式而引起的不明确,当更改整个单词(单词校正级别)时,用户可以将光标置于所述将被替换的单词之后,其中至少一个空格符分隔所述单词和所述光标。这是因为,例如,如果一个用户想校正已输入单词的最后一个字符,则他应该将光标定位在紧接所述字符之后。通过把光标置于单词后的至少一个空格之后(或者如果所述单词是前一行的最后一个单词,则置于下一行的开头),并且不按压按键说话,系统识别出用户可能希望校正光标之前的最后一个单词。为了更好的结果,可理解的,如果将被替换的单词包括标点符号(例如“.”“?”“,”等等),则光标可以放在标点符号后的一个空格之后。这是因为在某些情况下,用户可能希望更改一个必须位于单词结尾的错误的标点符号。为此,用户可以在次于所述标点符号的位置放置光标。
为了避免意外的校正(例如,光标被置于文本中某处,并且有人说话而不是有意数据输入),则各种方法可以被应用。例如,当一个用户希望在文本输入期间休息时,一个暂停或者非文本按键可以被使用。另一个解决方案是在光标被置于文本中的一个位置中之后,在一段时间消逝(例如两秒)之后,系统不接受对光标之前的最后一个单词或字符的校正。如果用户希望校正所述单词或者所述字符,则他例如可以导航所述光标(至少向任何方向移动一格)并且将其带回到所述的期望位置。在光标被复位到期望位置之后,时间将从开始计数并且用户应该在所述的时间段期满之前开始校正所述单词或所述字符。
重复符号
为了重复一个期望符号,用户首先按下相应的按键,并且如有需要则说出所述符号,或者他根据所述按键上的其它符号说出其相应按键上的所述符号的位置名称。系统然后选择期望的符号。用户继续不中断地按下所述按键。在一个预定义的时间段之后,系统识别出用户意在重复所述符号。系统重复所述符号,直到用户停止按压所述按键为止。
应当指出,校正并重复按键符号的上述方法可以结合任何输入方法被使用,包括但不限于单次/两次敲击、压敏按键、同时按压按键、只按下其一部分的按键等等。
电话目录
为了进行一个电话呼叫,不拨打一个号码,用户可以通过诸如名字(例如,个人、公司等等)之类的任何信息输入一个将被呼叫的目的地,并且必要时输入诸如所述被叫方地址等等之类的更多信息。一个中央目录可以自动地把所述呼叫指向所述目的地。如果被分配给所述目的地(例如当事人)的电话线路不止一条,或者对于用户输入的所述期望信息不止一个选择,则一个相应的选择表(例如电话号码,或被分配给所述电话线路的任何其它预定义分配)可以被传送到呼叫者的电话并且例如被显示在他的电话显示单元上。然后,用户可以选择一个所期望的选择并且进行该电话呼叫。
上述呼叫方法(例如拨号)可以允许消除通过他/她的电话号码来呼叫一方(例如,一个人)的需要。因此,不需要再记住电话号码、携带电话号码薄或使用话务员帮助(或者至少被降低)。
使用话音/语音的交互式目录
话音目录越来越多地被公司、机构等等所使用。这个与另一方交互作用的方法对于用户来说是一个非常费时且烦躁的程序。许多人在电话另一侧上听话音目录的时候直接断开通信。即使当一个人尝试与所述系统交互作用的时候,呼叫者在花费很多时间之后却没有成功地接入一个期望服务或者个人的情况常常发生。
这种系统模糊的主要原因在于,当听取一个话音目录指示时,用户常常必须一直等到所有的选项都被通告。他(用户)常常记不住所通知的所有选项。他必须再次听取那些选项。
此外,话音目录常常要求用户输入一个数据。这个数据输入由于电话键区的有限按键数量或通过它的符号输入复杂性而在变化上受限制。
上述的数据输入方法允许与目录进行快速可视交互作用。被呼叫方可以向呼叫者发送一个视觉交互式目录,并且呼叫者可以几乎立即看见所有的选择,并且容易并迅速地用他的电话键区(包括上述数据输入系统)做出响应或提出问题。
语音邮件
语音邮件也可以被文本邮件替换。这个方法已投入使用。当用户必须向另一方回答或写出消息时,上述数据输入方法的优点是显著的。本发明的数据输入方法还显著增强了通过诸如蜂窝电话之类的移动电子设备对消息系统的使用。其中一个最为著名的使用是SMS。
使用电话型键区的电子设备的数量是巨大的。本发明的数据输入方法允许通过所述设备的键区显著地增强数据输入。当然,这个方法不被限制为电话型的键区。它可以被用于任何键区,其中,所述键区的至少一个按键包括多于一个的符号。
多部分(multi-sectioned)的键区
使用上述数据输入方法的一个键区的大小仍然可以通过使用一个具有多部分的键区被最小化。所述键区在闭合位置的尺寸可以是最小的(例如,与最大部分一样,例如与一个成年用户指尖或小键区按键的大小一样),并且在键区在打开位置时依照要求被最大化(取决于被使用和/或打开的部分的数量)。
理论上,在闭合位置中,键区甚至可以如所述键区的一个按键一样大小。
图8示出了包括至少三个部分801的所述键区800的一个实施例,其中,所述部分中的每一个都包括电话键区的一列按键。当所述键区处于开启位置时,一个电话型的键区800被提供。在闭合位置802中,所述键区可以具有其中一个所述部分的宽度。
所述键区的另一个实施例在图9中被示出。所述键区900包括至少两个部分901-902,其中,第一部分901包括电话型键区的两列按键911-912,并且所述键区的第二部分902至少包括所述电话型键区的第三列913。当所述键区处于开启位置时,一个电话型的键区被提供。所述键区还可以具有一个安排在所述第二部分上的的辅助按键列914。在闭合位置920中,所述键区可以具有其中一个所述部分的宽度。
如图10中所示,所述键区1000的另一个实施例包括至少四个部分1001-1004,其中,所述部分中的每一个都包括电话键区的一行按键。当所述键区处于开启位置时,一个电话型的键区被提供。在闭合位置1005中,所述键区的长度可以是所述键区的一行按键的宽度。
图11示出了包括至少两个部分1101-1102的所述键区1100的另一个实施例,其中,第一部分包括电话型键区的两行按键,而所述键区的第二部分包括所述电话型键区的另外两行。当所述键区处于开启位置时,一个电话型的键区被提供。在闭合位置1103中,键区长度可以与所述键区的一行按键的宽度相同。
上述的多部分键区已经在本发明人已申请的专利申请中被描述。
通过使用所述多部分键区来使用上述的数据输入方法,一个易于使用的小型化完全数据输入键区可以被提供。这类键区可以被用于许多设备,特别可用于那些尺寸受限的设备。
当然,上述的符号配置也可以在所述多部分键区上被使用。
图12示出了多部分键区1200的另一个实施例。具有按键1201的各部分之间的距离可以用任何方法来增加。例如,空部分1202(例如不包括按键)可以被提供在包括按键的部分之间。这个将允许在所述键区处于开启位置时更加扩大所述部分之间的距离。另一方面,它还允许在闭合位置1203中具有一个仍然较薄的键区。
一个具有集成的键区和鼠标或点击设备的数据输入设备
为了增强通常上通过一个键区、而特别通过通过本发明键区数据输入方法,一个点击系统(下文称鼠标)可以被集成到一个电子设备的背面,该电子设备在其正面具有一个用于数据输入的键区。
图13示出了一个诸如蜂窝电话1300之类的电子设备,其中,用户将其握在他的手掌1301中。所述用户可以只用一只手握住所述设备1300,并且同时操作位于正面的键区1303,以及操作位于所述设备背面的鼠标或点击设备(未示出)。所述用户的拇指1302可以使用键区1303,而他的食指1304可以操作所述鼠标(背面)。另外三个手指1305可以帮助把设备握在用户手中。
集成在所述设备背面的鼠标或点击设备可以具有与电脑鼠标类似的功能。此外,电话型键区或所述设备的辅助按键当中的几个按键(例如两个按键)可以被分配给鼠标点击功能。例如,按键1308及1318可以与所述设备1300的集成鼠标起作用,并且具有电脑鼠标按键的类似功能。所述按键可以具有与电脑鼠标按键相同的功能。例如,通过操作鼠标,用户可以在所述设备的屏幕1307上导航一个标准选择(光标)指示符1306,并且将其置于一个期望菜单1311上。与电脑鼠标相同,所述用户然后例如可以敲击(单击)或两次敲击(双击)所述(被分配给鼠标的)键区的一个预定义按键1308,例如用于选择或打开所述的期望菜单1311,该菜单被所述的标准选择(光标)指示符1306所指向。
因为诸如蜂窝电话之类的移动装置显示比较小,所以一个旋转调节按钮1310可以在所述设备中提供来例如允许用户旋转选择菜单列表。例如,在期望菜单1311显示在屏幕1307上之后,用户可以用鼠标把标准选择(光标)指示符带到所述期望菜单上,并且通过使用一个诸如电话型键区1303的其中一个按键1313或所述设备上的辅助按键1308其中一个等等之类的预定义按键来选择它。
就像计算机一样,用户然后可以按下所述按键来打开相关的菜单条1312。为了选择所述菜单栏1312的功能键1313,用户可以按住所述按键不放,并且在把标准选择(光标)指示符1306带到所述功能键上之后,可以通过释放所述按键来选择所述功能键。
类似于计算机的其它功能可以通过使用所述键区和所述鼠标而被提供。
同时,如果不使用使用被分配给鼠标的所述按键,用户可以使用一个预定义话音/语音或其它(一个或多个)预定义行为来代替所述按键的功能。例如,在把标准选择(光标)指示符1306置于一个图标上之后,不是按压一个按键,用户可以说″选择″或″打开″来选择或打开由所述图标代表的应用。
图14示出了一个诸如移动电话1400之类的电子设备。表示不同应用的多个不同的图标1411-1414被显示在所述设备的屏幕1402上。为了选择和/或打开其中一个应用,如计算机一样,用户可以通过使用鼠标把标准选择(光标)指示符1403带到一个期望图标1411上。然后,所述用户可以例如通过按压所述键区的预定义按键1404一次来选择所述的图标。为了打开由所述图标表示的应用,用户例如可以双击所述键区的一个预定义按键1404。
在电子设备的背面集成的鼠标可以是任何类型。例如,图15示出了诸如图13-14中所示之类的一个电子设备1500的背面。鼠标1501类似于一个传统的电脑鼠标。它可以如所述地由用户手指来操作。通过把设备放在诸如书桌之类的表面上并且在所述表面上拖拽所述鼠标,它也可以像传统电脑鼠标那样被操作。
图16示出了被集成在诸如图13-14所示之类的电子设备1600的背面上的鼠标(感光垫35-26)的另一个常用类型。鼠标1601类似于一个传统的电脑鼠标。如前所述,它可以用用户手指来操作。在这个示例中,优选地如之前所述,当用户将设备握在手掌中时,他用他的食指1602来使用(例如操作)所述鼠标。因此,在这个位置,用户用他的拇指(未示出)来操作位于所述设备正面(例如,另一侧)的键区(未示出)的按键。
优选地,移动装置应该只通过一只手来操作。这个是因为当用户在运动中时(例如在公共汽车或火车中),用户可以将另一只手用于其它目的,比如当站在火车中时抓住握杆或者用一只手来握住报纸或公文包。
通过将鼠标实现在诸如移动电话之类的一个设备的背面,用户可以操作所述设备并且用一只手来输入数据。他可以同时使用键区和所述设备的鼠标。
当然,如果他期望,则所述用户可以用他的双手来操作所述设备及其鼠标。
所述设备的另一个用法是将其放在一个诸如书桌之类的表面上,并且用与常规电脑鼠标相同的方法在所述表面上滑动所述设备,并且使用所述键区来输入数据。
可以理解的是,包括之前描述的任何类型的鼠标都可以被集成到一个移动装置的任何部分中。例如,一个鼠标可以位于所述设备的正面。此外,所述鼠标可以被置于所述设备的一侧并且同时通过之前解释的手指用键区来操作。
应当指出,在这个讨论中已经使用了鼠标,然而诸如集成在电子设备中并且与电话型键区结合的触控笔计算机之类的任何点击数据输入设备都在本发明的考虑范围之内。
外部集成的数据输入单元
此外,一个包括键区和鼠标的外部集成的数据输入单元可以被提供,并用于需要诸如键盘(或键区)和/或鼠标的之类的数据输入装置的电子设备。在所述单元的前面可以提供一个具有键区(例如一个电话型键区)按键的集成数据输入单元,并且一个鼠标被集成在所述单元的背面内。所述数据输入单元可以被连接到一个诸如计算机、PDA、照像机、电视机、传真机之类的期望设备。
图19示出了一个计算机1900,包括键盘1901、鼠标1902、监视器1903和其它的计算机附件(未示出)。在一些情况下(例如用户不希望坐在监视器前的书桌椅子上,而优选地例如躺在他的床上与所述计算机交互作用),不使用一个大键盘和/或相应的鼠标,用户可能利用一个小的外部集成数据输入单元。一个外部数据输入单元1904可以被提供,其包括诸如下列的特征:键区按键1911被置于所述数据输入单元的正面,麦克风可以是一个可伸出麦克风1906,鼠标(未示出)被集成在所述数据输入单元的背面内(如前所述)。所述数据输入单元可以被(无线或有线地)连接到所述的电子设备(例如所述计算机1900)。诸如之前所述(例如使用结合用户的按键交互作用的语音识别系统)之类的一个集成数据输入系统可以被集成在所述电子设备(例如所述计算机1900)或所述数据输入单元1904内。此外,一个麦克风可以被集成在所述的电子设备内(例如计算机)。所述的集成数据输入系统可以使用位于所述数据输入单元或在所述的电子设备内的一个或两个麦克风(例如计算机)。
为了在交互作用时能更好地查看,特别是当从远距离与诸如所述计算机1900之类的电子设备交互作用时,显示单元1905可以被集成在诸如所述的本发明的集成数据输入单元1904之类的所述输入单元内。当从远处与所述电子设备1900的监视器1903交互作用时,用户可以具有对所述监视器1903的显示器1910的概览。用鼠标在所述监视器1903的显示器1910上选择的箭头1909周围的封闭区域1908或另一个区域,可以同时被显示在所述数据输入单元1904的所述显示器1905上。所述区域1908的大小可以由厂商或用户来定义。优选地,所述区域1908的大小可以接近所述数据输入单元1904的显示器1905的大小。这样,可以允许用户用于查看一个相近和/或按需真实大小的交互作用区域1908(例如通过看见数据输入屏幕1905上的所述区域)。当具有对监视器1903的显示器1910的总览时,用户可以具有交互作用区域1908的一个特定近视图,交互作用区域1908同时被显示在所述数据输入单元1904的显示1905上。例如,用户可能使用键区鼠标(未示出,在键区背面)在计算机显示1910上导航箭头1909。同时,所述计算机显示器1910上的所述箭头1909和围绕所述箭头1909的区域1908可以被显示在键区显示器1905上。
为了诸如打开文件之类的一个交互作用,用户例如可以在所述计算机屏幕1910上导航箭头1909,并将其置于期望文件1907上。所述导航区域1908和所述文件1907可以在所述的数据输入屏幕1905上被看见。通过将所述数据输入单元1904的显示器1905靠近他的眼睛,用户可以清楚地看见他在所述数据输入单元1904的显示器1905上的交互作用,同时在所述电子设备1900(例如计算机)的大显示器1910上具有一个总览。
可以理解的是,所述交互作用区域1908可以根据不同的需要或定义来定义和改变。例如,所述的交互作用区域可以是围绕箭头1909的区域,其中,所述箭头在所述区域的中心或所述区域在所述箭头的右、左、顶、底的区域或者所述监视器屏幕上的任何区域,而与所述监视器的显示器上的所述箭头无关。
图20示出了一个诸如之前所述的被连接到计算机2001之类的数据输入单元2000。在诸如文字输入之类的数据输入期间,围绕交互作用光标2003(例如光标)的区域2002同时被显示在键区显示2004上。
图21a-21b示出了一个可以使用上述数据输入单元的不同电子设备的示例。图21a示出了一个计算机2100,而图21b示出一个电视机2101。所述电视机2101的数据输入单元2102也可以作为所述电视机2101的遥控器。例如,通过使用位于所述数据输入单元2102背面的鼠标(未示出),用户可以把选择箭头2103定位在表示电影或频道的图标2104,并且通过两次敲击(双击)所述数据输入单元的按键2105来打开它。当然,所述电视机的所述数据输入单元2102还可以被用于数据输入,诸如通过电视机的互联网或通过电视机、有线电视发送消息等等之类的。在这种情况下,本发明的集成数据输入系统可以例如被集成在电视机的调制解调器2106内。
可扩展麦克风
一个可扩展和/或可旋转的麦克风可以被集成到诸如蜂窝电话之类的电子设备中。所述麦克风可以是一个延伸向用户嘴唇的一个刚性麦克风。
随着技术的提高,新的输入系统和设备将出现在市场上,以便允许与仪器的容易的交互作用。那些输入系统中的许多系统多使用话音/语音识别系统,其中,用户说出将被输入的数据或命令。因为它是一个自然的输入数据方法,所以语音识别系统很受欢迎。计算机、电话、玩具、和许多其它的仪器都配备了各种这类使用语音识别系统的数据输入系统。
尽管这个是一个好的输入方法,然而它具有一个重大的缺点。它不是一个能隔离的输入方法。通常,用户不想要别人听见他所说的话,而另一方面,人们不喜欢听见别人大声说话。
为了显著地克服(或至少减轻)这个问题,用户必须轻声地说话。为了不造成语音识别系统对用户话音/语音的误译,麦克风必须接近用户的嘴唇。
本发明的目的是提供将用户话音用作数据的仪器,其具有一个从所述仪器延伸向用户嘴边的麦克风。
使用这类麦克风具有许多优点。这类麦克风的一个优点是,通过把所述麦克风延伸向所述用户的嘴边并且靠近它来说话,话音/语音识别系统可以更好地区分并识别所述的话音/语音。另一个优点是,通过把所述麦克风靠近用户嘴部来放置(例如紧挨着嘴部),用户可以轻声地对其说话(例如耳语)。这个允许一个几乎无声并且与外界隔离的数据输入。同样,所述麦克风的另一个优点还在于,由于被集成到相应的电子设备中,所以为了把所述麦克风保持在期望位置(例如接近于用户的嘴),用户可以不通过他的(一只或两只)手来握住所述的麦克风。此外,所述用户不必与所述电子设备分开携带所述的麦克风。
通过用诸如之前所解释方式之类的方法把诸如本发明的键区、鼠标、可扩展麦克风和数据输入方法之类的特征,或者结合在一个电子设备中或者将其结合为将被连接到电子设备的一个外部单元,一个完全增强的数据输入系统可以被提供。例如,用户可以通过只使用一只手来握住一个诸如数据输入设备(例如移动电话、PDA等等)之类的电子设备,使用诸如增强式键区、集成鼠标和可扩展麦克风等等之类的部件,并且同时通过使用他的自然习惯(例如按压键区按键并且在所需要时说话)来提供一个迅速、容易并特别是自然的数据输入。
可扩展麦克风的其中一个最重要的应用,是在移动通信装置的数据输入系统结合键区和话音/语音识别系统的使用的时候。使用这个方法,用户与按键(例如通过推动它)交互作用,并同时他可以例如说出所述按键上的一个符号。为了按下一个包括期望符号的按键,用户可能需要看着键区。他可能还需要看着设备的显示器上的数据。另一方面,用户可能更喜欢轻声地说出所述符号。可扩展麦克风允许把移动电话置于远离眼睛的地方,但足够能看见那个键区,并且同时让麦克风接近于嘴部,从而允许小声地说话。
如同许多人习以为常的,他们可以用一只手握住他们的移动电话,同时用同一只手的拇指来按压键区的按键。第二只手可以被用来以所述手围绕麦克风以便降低外界噪声,或者为了保持麦克风和嘴部的一个最佳位置关系。
如果仪器的麦克风是无线的,或连接它与仪器的构件由非刚性材料组成,则用户可以用一种方法以两个手指握住麦克风来将其置于他的手掌侧。然后,通过把所述手的手掌置于嘴部周围,他可以在说话时显著地降低外界噪声。
可以理解的是,保护了使用用户话音来输入数据的电子设备的数据输入单元和显示的用户接口可以是任何类型。例如,不是一个键区,它可以包括一个触摸敏感垫,或它可以只配备一个语音识别系统而不需要一个键区。
图18根据本发明的一个实施例,示出了一个诸如蜂窝电话或PDA之类的电子设备1800。如图所示,键区1801位于所述设备1800的正面。一个鼠标(未示出)位于所述设备1800的背面。一个可扩展麦克风1802也被集成在所述设备内。所述麦克风可以被用户延伸并置于一个期望位置(例如紧挨着用户的嘴)。所述设备还可能包括一个之前所述的数据输入方法。通过只使用一只手,用户可以以很高的精确度来进行一个迅速并且容易的数据输入。通过把所述麦克风置于紧挨着用户的嘴,这允许系统更好地识别用户的话音/语音。所述用户还可以悄悄地(例如耳语)对所述麦克风说话。这个允许一个几乎无声的数据输入。
在本发明的替换实施例中,图18b到18c示出了一个具有键区1801和显示单元的移动电话1800。移动电话配备有一个转轴部分1803,该部分一端上安装了一个麦克风1802。通过把麦克风延伸向他的嘴,用户可以小声地对电话说话,并同时能够看见他的电话的显示和键区1801并且最后在对麦克风1802说话时同时使用它们。
图18d示出一个旋转可扩展麦克风1810,其允许用户以与他关系方便的位置来安置仪器,并且同时通过旋转并延伸麦克风,从而把麦克风1810带到接近于他的嘴或接近于一个期望位置。必须指出,连接麦克风与仪器的构件可能具有至少两个部分,从而根据彼此以及根据仪器而被延伸/缩回。他们可以具有折叠、滑动、可伸缩地以及其它移动以便延伸或缩回。
图18e和18f示出了一个伸缩地可扩展的集成旋转麦克风1820。在这个实施例中,包括麦克风1820的可扩展部分可以位于仪器中。当期望时,用户可以将这部分拉出并且向他的嘴延伸。麦克风1820在它没有被拉出时也可以被使用。
根据在图18g和18f中所示的本发明的另一个实施例,包括麦克风1831的延伸构件1830可以是多部分设备的一部分。这个部分可以被用作所述设备的机盖。包括麦克风1831的该部分可以自身便是将是按需要可扩展和/或可调整的多部分。
根据图18i中所示的实施例,之前所述的可扩展麦克风1840可以被安装在一个计算机或类似设备中。
此外,根据本发明的另一个实施例,仪器的麦克风可以附于用户的戒指或麦克风本身的形状就像一个戒指,并且可以被用户佩戴。这个麦克风可以被无线或有线地连接到所述仪器。在使用时,用户把他的手接近他的嘴并说话。
可以理解的是,附图中所示的仪器被示为示例。可扩展麦克风可以被安装在任何仪器中。它也可以被安装在延伸部分上的任何位置。
在通信设备中,包括麦克风的延伸部分可以被用作所述仪器的天线。在这种情况下,天线可以被制造成所述部分,并且包括集成的麦克风。
必须指出,除了至少一个可扩展麦克风之外,一个仪器还可能包括至少一个辅助的常规麦克风,其中,所述麦克风可以与所述可扩展麦克风分开或同时被使用。
必须指出,包括麦克风的可扩展构件可以用刚性材料来制造以便允许将麦克风置于一个期望位置而不需要用手保持它。为了更好的操作,麦克风的部分此外可以通过半刚性或软性材料来制造。
必须指出,诸如展开/折叠方法之类的任何延伸/缩回方法都可以被使用。
如前所述,本发明的集成键区和/或鼠标和/或可扩展麦克风还可以被集成在多种电子设备内,比如PDA、电视机的遥控器、以及很多种类的其它电子设备。例如,通过使用集成在电视机遥控器内的键区和鼠标,用户可以指向电视屏幕上所示的与电影有关的图标,并且通过使用所述遥控器的一个预定义按键来选择所述电影。
此外,如所描述的,所述的集成键区和/或鼠标和/或可扩展麦克风,可以被制造为一个被分离并且将被连接到所述电子设备的设备。
当然,独立或与所述鼠标和/或所述可扩展麦克风集成的所述键区,可以与一个诸如本发明的数据输入方法之类的数据与文本输入方法相结合。
图17示出了可以使用增强式键区、增强式鼠标、可扩展麦克风以及本发明的数据输入方法的电子设备的一部分。
一个电子设备至少可以包括本发明的一个或多个特征。例如,它可以包括所述的本发明的所有特征。
通过陆地有线电话的数据输入
之前所述的数据输入方法还可以在陆地有线电话及其相应的网络中被使用。众所周知,电话键区的每个按键都生成一个通过陆地有线网络被发送的预定义音调(tone)。共有十二个预定义音调被分配给电话键区的十二个按键。为了诸如输入文本之类的数据输入目的,通过使用陆地有线电话及其键区,辅助音调可能需要被生成。每个符号都被分配一个不同的音调,以便网络根据被分配给所述符号的所生成音调而识别出一个符号。
腕戴式多部分数据输入单元
图22a举例地示出了之前所述的本发明的数据输入单元2201-2203的不同实施例。为了降低所述数据输入单元的尺寸,可以具有如前所述的多部分键区2212-2222的一个多部分数据输入单元2202-2203可以被提供。所述多部分数据输入单元可以具有本发明的一部分或全部特征。它还可能具有一个在本申请中描述的集成的数据输入系统。例如,数据输入单元2202包括显示2213、天线2214(可能是可扩展的)、麦克风2215(可能是可扩展的)、集成在所述数据输入单元的背面的鼠标(未示出)。
本发明的数据输入单元的一个实施例可以被带在手腕上。它可以被集成在诸如手表之类的手腕佩戴设备内,或者被集成在诸如手表带之类的手镯内。所述数据输入单元可以具有本发明的集成数据输入单元的一部分或全部特征。这将允许一个很小的数据输入单元附着于用户手腕上。所述腕戴式数据输入单元可以被用作任何电子设备的数据输入单元。通过将其腕戴式数据输入单元连接到一个期望的电子设备,用户例如可以打开他的公寓门、与电视机交互作用、与计算机交互作用、拨打电话号码等等。同一数据输入单元可以被用于操作不同的电子设备。为此,一个访问码可以被分配给每个电子设备。通过输入(例如,通过所述的数据输入单元)一个期望电子设备的访问码,所述数据输入单元和所述电子设备之间的一个连接可以被建立。
图22b示出了本发明(在开启位置)中的一个腕戴式数据输入单元(例如具有多部分键区2291的多部分数据输入单元),其(无线或者通过线路2292)被连接到一个诸如PDA2293之类的手持设备。所述多部分数据输入单元2290还可以包括诸如本申请中所述的一部分或全部特征之类的附加部件。在这个示例中提供了显示单元2294、天线2295、麦克风2296和鼠标2297。
可以理解的是,所述多部分键区可以从手腕佩戴设备/手镯2298上摘下。为此,本领域技术人员所知的不同的拆件/附件可以被提供。例如图23a中所示,对于容纳所述的数据输入设备的外壳2301可以被提供在手镯2302内。图23b示出了在开启位置中的所述外壳230343-29。一个可拆卸的数据输入单元2304可以被提供在所述外壳2301内。图23c示出了在开启位置2305和闭合位置2306中的所述外壳。处于开启位置(例如在使用所述数据输入单元)时,所述数据输入单元的元件2311的一部分(例如按键和/或显示屏部分等等)可以卧在所述外壳的盖子2312内。
根据本发明的一个实施例,一个诸如手表2307之类的设备可以被提供于同一手镯内的手腕上的另一侧中。例如,一个具有容纳数据输入单元的外壳的手表带可以被提供。所述手表带可以附于诸如手表、腕式照像机等等之类的任何腕式设备。数据输入设备的外壳可以位于佩带者手腕的一侧2308,而所述的其它腕式设备的外壳可以位于所述佩带者手腕的另一侧2309。为了把所述表带连结于一个诸如手表之类的设备,传统的手表带附加装置2310(例如狭钢条)可以被提供。
上述的表带外壳还可以被用来容纳任何其它的腕式设备。例如,不是容纳一个数据输入单元,所述腕式外壳可以适用于容纳诸如腕式电话之类的多种电子设备。
在使用本发明的腕戴式数据输入单元时有许多优点。例如,用户可以在其口袋中携带一个电子设备,并且他的手中有所述电子设备的显示单元(可能是灵活的)。与所述电子设备的交互作用可以通过所述腕戴式数据输入单元来提供。在另一个示例中,本发明的腕戴式数据输入单元可以被用来操作一个电子新闻显示屏(2000年10月27日申请的PCT专利申请PCT/US00/29647,其与一个电子新闻显示屏有关并且在此通过参考被合并)。
因此,虽然本发明的基本新颖特征被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略以及置换和改变。可以理解的是,附图不一定是按比例描绘的,而本质上仅仅是概念性的。例如,不是向键区的每个按键都提供一个分离的压力系统,单个压敏系统(例如压力感应垫)可以被提供给它们全部(例如在按键上面或下面的单个大垫片)。此外,一个用户可以用他的手指之外其它方式与按键交互作用。例如,所述用户可以使用笔来按下一个按键。
本发明的数据输入方法还可以使用其它的数据输入装置。例如,不是向键区的按键分配符号,所述符号可以被分配给诸如用户手指(或手指的一部分)之类的其它对象。在本申请中提及的这些主题和数据输入方法已经在合并的于2000年10月27日申请的参考PCT专利申请PCT/US00/29647中被详细描述。
可扩展显示单元
根据本发明的一个实施例,一个可扩展显示单元可以被提供在一个诸如本发明的数据输入单元之类的电子设备或一个移动电话内。图24a示出了一个在闭合位置中的可扩展显示单元2400。这个显示单元可以由刚性和/或半刚性材料组成,并通过相应的铰链2401可以被折叠或展开,或者可以被伸缩地延伸或缩回,或具有装置以允许它通过任何方法被延长并且被缩回。
图24b示出了一个诸如移动电话之类的移动计算设备2402,其具有在开启位置中的本发明的所述可扩展显示器2404。所述的被延伸显示单元在开启时具有A4标准纸张的宽度,从而例如当所述用户正在用单词处理程序书写字母或者浏览网页时,允许用户看见并且处理文档的真实宽度大小。
本发明的显示单元同时可能由柔性材料组成。图25a示出了一个在闭合位置中的柔性显示单元2500。
可以理解的是,本发明的显示单元可以显示至少与它的其它侧2505(例如外部)相关的信息。这些是重要的,因为在某些情况中用户希望可以不必展开它就能使用显示单元。
图25b示出了一个具有本发明的柔性显示单元2500的处于开启位置中的电子设备2501。
通过具有一个诸如本发明的数据输入单元之类的电子设备,移动电话、PDA等等,具有诸如包括如前所述的电信装置的可扩展/不可扩展显示单元之类的本发明的至少一项改进后的特征、本发明的鼠标、可扩展麦克风、可扩展照像机、本发明的数据输入系统、语音识别系统、或本申请中所述的的任何其它特征中的至少一个、一个用户可以手握并且操作的完整的数据输入/计算设备被提供。这是非常重要的,因为众所周知的是,在移动环境计算/数据输入中用户的至少一只手必须是空闲的。
可扩展摄像头
如同对于可扩展麦克风所描述的,一个电子设备可以配备一个可扩展摄像头。例如,对于结合按键按压和唇读(代替用户的话音/语音或在其以外)之外的本发明的数据输入系统,一个可扩展摄像头可以在相应的电子设备或数据输入单元中被提供。
图26示出了一个配备有转轴部分2601的移动计算设备2600。所述的转轴部分可以具有例如安装在其一端的摄像头2602和/或麦克风2603。通过把摄像头延伸向他的嘴部,用户可以对摄像头说话,并且摄像头可以在使用按键按压和嘴唇的相结合的本发明数据输入期间发送用户的嘴部图像。同时,用户能够看见他的电话的显示屏和键区,并且最后能够在向摄像头说话时同时使用它们。当然,可扩展部分上安装的麦克风可以向数据输入系统的语音识别系统发送用户的话音。
可扩展部分2601可以容纳一个天线,或其自身就是电子设备的天线。
此外,本发明的可扩展麦克风和/或摄像头可以可拆卸地连结于一个诸如移动电话或PDA之类的电子设备上。这些是因为在许多情况中,电子设备(比如移动电话)厂商不希望为新应用更改他们的硬件。
根据本发明的一个实施例,包括麦克风和/或摄像头的外部转轴部分可以是一个可拆卸地连结于相应的电子设备上的分离单元。图27示出了一个处于分开位置中的可拆卸单元2701和一个电子仪表2700,比如一个移动电话。可拆卸单元2701可以包括许多元件的任何一个,包括但不限于麦克风2702、摄像头2703、扬声器2704、光学读取器(未示出)或其它有必要靠近用户以便与电子仪器更好地交互作用的元件。所述单元还可以包括至少一个天线或自身就是一个天线。所述单元还可以包括连结和/或连接装置2705,用于把单元2701连结到电子设备2700上,并且把单元2701上可用的元件连接到电子仪器2700。为了连结和连接目的,连结于连接装置2705可以被适配来使用在一个诸如移动电话2700或计算机之类的电子设备内可用的端口2706,所述端口被提供用于诸如麦克风、扬声器、摄像头、天线等等之类的外设元件的连接。可以理解的是,端口2706可以是诸如送话器插孔或USB端口之类的标准端口,或在电子仪器中可用的任何其它类似的连接装置。在这种情况下,连结/连接装置例如可以是插进电子仪器内的(一个或多个)可用相应端口的标准连接装置。
可以理解的是,外部单元的连结和/或连接装置可以被提供或者具有机械连结功能或者电气/电子连接功能或其二者兼而有之。如图27a中所示,例如,外部单元2701可以包括固定地置于外部单元上的插针2705,以便把外部单元机械地连结到电子仪器。插针同时可以例如把单元2701内可用的麦克风元件2702电气/电子地连接到之前示出的电子仪器。除了所述插针之外,外部单元可以容纳诸如USB连接器之类的另一个连接器2707,例如通过线路2708被连接到外部单元2701内安装的摄像头2703。在这种情况下,连接器2707可以只被电子地/电气地把单元2701连接到电子仪器。
为了更好的机械连结,外部单元的连结与连接装置可以使用超过一个的端口。例如,连结于连接装置可以包括诸如固定地置于外部单元上的两个插针之类的两个连结装置,其中,第一插针插进例如对应于外接传声器的电子仪器的第一端口,而第二插针插进例如对应于外接扬声器的端口。
图27b示出了在连结位置中本发明的可拆卸外部单元2701和电子仪器2700。
在把外部单元2701连结到电子仪器2700之后(例如,通过把插针2705插入相应端口2706),用户可以通过之前在本申请中对于可扩展麦克风和摄像头所述来延伸并旋转移动,从而把外部单元2701调整到期望位置。再次,如之前在本申请中对于外接传声器及摄像头所述,必须指出,本发明的可拆卸单元可以具有类似于本发明的可扩展部分的特性。例如,本发明的可拆卸单元2701可以是具有至少两个部分2710-2711的多部分,其中,每部分都具有诸如回转运动、旋转并延伸(伸缩地,可折叠的/不可折叠的)之类的与彼此以及外部单元有关的移动。连结部分2712-2714可以被用于这些目的。
所述可拆卸单元允许向电子仪器附加外部/外围元件,并且将它们当作原始仪器的一部分来使用。首先,这允许使用该单元而不必将元件持于手中或者将其连结在用户身体上(例如一个必须附于用户头部的头戴式受话器),以及,其次,允许向电子仪器附加元件而不会迫使电子仪器(比如移动电话)厂商更改他们的硬件。
本发明的数据输入方法还可以使用其它的数据输入装置。例如,不是向键区的按键分配符号,所述符号可以被分配给诸如用户手指(或手指的一部分)之类的其它目标。此外,不使用话音/语音输入(或在其之外),系统可以通过读取用户嘴唇的(识别其运动)并结合/不结合键压来识别数据输入。用户可以按下键区的一个按键并且说出所述按键上的符号当中的一个期望字母。通过结合所述键压来识别用户说出所述字母的嘴唇运动,系统可以容易地识别并输入想要的字母。
此外,如所提及的,在本申请中描述的配置方法中给出的示例被示出为例子。符号的不同配置和分配的多样性可以取决于需要的数据输入单元来考虑。这个配置方法中的原则是根据诸如使用频率、自然发音、自然非发音等等之类的不同因素定义来定义不同的符号群,并且相应地向它们分配优先权率。最高优先级率群(有或者没有说话)被分配给最容易的并且最自然的按键交互作用(例如,单次按压)。这个群此外包括最高等级的非语言符号。然后,第二最高优先级被分配给第二稍少容易的交互作用(例如两次按压)等等。
继续参考之前所述的数据输入系统,对键区按键的符号分配可以使用通过话音/语音或唇读系统更被增强识别的方式来做出。图28示出了一个键区2800,其中,发音相近的字母符号用一种方法被分配给所述键区的按键以免它们之间含糊不清。如图所示,发音相近的字母”c”和”d”、”j”和”k”、”m”和”n”、”v”和”t”被分离并且放置在不同的按键上。这个将有助于语音识别系统更加容易地识别所述字母。例如,用户可以按压按键2801并且说”c”来选择字母”c”。用户按压按键2802并且说”d”来选择字母”d”。诸如”b”和”p”、”t”和”d”、”f”和”s”之类的发音相近的其它字母也被分配给不同的按键。
用于小设备的嵌入式语音识别系统被设计为尽可能少地使用存储器。分隔发音相似的符号并且分配给不同按键,这能显著地简化了较少使用存储器的识别算法。
继续参考图28,如图所示,以这样一种方式提供字母配置以便保持字母a-z处于连续的顺序(例如a,b,c......z)。以这样一种方法进行键区2800上的符号配置,以便将其尽可能类似地保持为一个标准电话型的键区。可以理解的是,这个顺序可以按照需要被改变。
此外,相似嘴唇清晰发音符号的分隔可以帮助唇读(口形识别)系统更加容易地识别它们。例如,把字母”j”和”k”分配给不同的按键将显著地简化它们的识别。
可以理解的是,为了识别一个诸如字母之类的口语符号,在说出所述字母期间,用户嘴唇在不同时间的多于一个的图像可以被提供给口形识别/读取系统。
本发明的唇读(识别)系统可以使用任何图像产生和图像识别处理技术以用于识别目的。例如,如之前提及,当所述用户正在说一个诸如字母之类的符号并且按压对应于键区上的所述符号的按键时,一个摄像头可以被用来收到用户嘴唇的(一个或多个)图像。其它的图像产生和/或图像捕获技术也可以被使用。例如,不使用一个摄像头,当所述用户正在说一个诸如字母之类的符号并且按压对应于键区上的所述符号的按键时,一个诸如光线或光波之类的投影仪和接收器装置可以被用来把所述装置投影到用户的嘴唇(并且最后投影到面部)并且接收回所述装置,从而提供用户嘴唇的一个数字图象(并且最后提供用户面部的数字图象)。
结合键压和用户行为(例如语音)的本发明的数据输入系统可以使用不同的行为(例如语音)识别技术。例如,除了嘴唇的运动之外,用户舌头在用户牙齿上的按压动作也可以被检测以便更好地识别语音。
根据本发明的一个实施例,如图29中所示,不使用或除了摄像头之外,本发明的唇读系统可以使用一个可移动地安装在用户牙齿和/或嘴唇上的触/压敏元件2900。所述元件可以用其表面上分布的传感器2903来检测对它任何部分的压力作用,允许测量用户的舌头和所述元件之间的冲击的大小、位置、压力测量等等。所述元件可以具有两个部分。第一部分2901被放置在所述用户的两嘴唇(上下嘴唇)之间,而第二部分2902位于用户的牙齿(优选地是上前牙)上。连结装置2904允许把所述元件连结/固定在用户的牙齿上。
图29a示出了一个如上所述的敏感元件2910,其用一种方法被安装在用户的牙齿2919上,即元件的部分2911位于所述用户的上下唇之间(在这个附图中,元件、用户的牙齿和舌头被示出在用户的身体之外)。所述用户可以按下键区2918的包括字母”abc”的键2913,并且说出字母”b”。通过说出”b”,用户的嘴唇2914-2915按压嘴唇之间的所述灵敏部分2911。因为两个其它的字母(例如”ac”)不需要彼此按压嘴唇,所以系统识别出想要的字母是字母”b”。如果用户按下按键2913并且发出字母”c”的音,则用户的舌头2916将轻压位于用户上牙的元件的牙齿部分的内在部分2912。系统将认识到想要符号是字母”c”,因为所述按键上的其它字母(例如”ab”)在所述元件部分上不需要所述按压动作。如果用户按压按键2913并且说出字母”a”,则没有按压动作将被施加在所述元件上。然后,系统识别出想要的字母是字母”a”。在其它示例中,如果用户按压按键2917并且说出字母”j”,则用户舌头按压元件的牙齿部分的内上部。如果用户按下按键2917并且说出字母”l”,则用户的舌头将几乎按压元件牙齿部分的整个内在部分。在这种情况下,几乎元件牙齿部分的内部部分内分布的全部传感器都将被按下,并且系统识别出想要的字母是字母”l”。
上述的唇读/识别系统允许一个具有高精确度的分隔并且有效的数据输入方法。数据输入系统尤其可以在诸如军队、警察或情报之类的部门中被使用。
此后,根据本发明的一个实施例,一个通过电话型键区的字母输入识别系统的示例:
ABC按键
A B C
无压力 嘴唇部分被按压 齿列部分的内上部分被轻微按压
DEF按键
D E F
整个内部齿列部分被按压 无压力 嘴唇部分被按压
GHI按键
G H I
齿列部分的内上部分被猛烈按压 齿列部分的内上部分被轻微按压 无压力
  JKL按键
  J   K   L
  齿列部分的内上部分被轻微按压   无压力   整个内部齿列部分都被按压
    MNO按键
    M   N     O
    嘴唇部分被按压   整个内部齿列部分被按压     无压力
    PQRS按键
    P     Q     R   S
    嘴唇部分被按压(两边)     嘴唇部分被按压     无压力   齿列部分的内上部分被轻微按压
    TUV按键
    T     U     V
    整个内部齿列部分被按压     嘴唇部分被按压(两边)     嘴唇部分被按压
    WXYZ按键
    W  X     Y   Z(zed)
    嘴唇部分被按压  齿列部分的内上部分被按压     无压力   齿列的整个内部部分被按压
必须指出,上表只是作为一个示例来示出通过说出一个期望字母(同时使用所述硬件)并且按压相应按键来容易地区别字母。可以理解的是,基于这个系统的诸如硬件上的压力计时(例如当说出”g”或说出”h”时,都在同一按键上并且具有类似的压力级)之类的其它区别参数可以被识别系统以及本领域技术人员考虑到。此外,上述系统也可以考虑到用户说出诸如数字(例如0-9)并且识别这些数字。
另外,本发明的感应元件可以被无线或有线地连接到处理设备(例如手机)。如果它被无线地连接,则该元件可以包括一个用于发送压力信息的发射机。该元件还可以包括用于为其功能块供电的蓄电池电源。
如前所述,本发明结合了键压和语音以便改进识别准确性。在一个实施例中,一个语法被即时地做出来允许识别只对应于键压的字母。
通常在通过话音/语音的数据(例如文本)输入期间,麦克风/传感器察觉用户的话音/语音,并且将其发送到期望电子设备的处理器以用于话音/语音识别系统的识别处理。话音/语音识别系统的有效的语音到数据/文本的转换的一个很大的障碍(特别是在移动环境中),是输入音频的恶劣质量,所述的恶劣质量起因于外界噪声。必须指出,麦克风会无差异地″听见″每件事。
研究人员已经做出许多努力来区别外界噪声,并且将其从期望音频中消除。直到现在,那些成果只允许部分地降低外界噪声,但是必须做出更多的工作来实现一个可接受的结果。令人遗憾地,当前的噪声消除/降低技术也降低了期望音频的质量,从而使得所述音频不适用于被话音/语音识别系统识别。
为了降低(乃至完全地消除)外界噪声,在数据输入通过话音/语音输入的数据输入期间,不会降低所述话音/语音输入的质量的、置于用户耳中的一个耳朵集成的麦克风/传感器单元可以被提供。即使所述用户低声说话或耳语,所述的麦克风/传感器也可以允许用户话音/语音的一个更好的接收质量。
众所周知,当人说话时引起耳骨振动,并且对应地,所述语音被传导到耳朵,从而在内耳和耳道中引起对应于所述语音的空气振动。
根据一个方法,所述空气振动可以被置于耳中(优选的在耳道中)的耳戴麦克风察觉到。根据另一个方法,所述的耳骨振动自己可以通过被置于耳中的耳戴传感器从内耳被察觉到。
图30示出了一个用一种方法被设计集成在用户耳朵内的麦克风/传感器单元3000,麦克风/传感器元件3001位于用户耳内(优选地位于用户的耳道内)。
优选地,除了麦克风/传感器元件3001之外,所述单元3000同时可以具有封闭隔离装置3002,其中,当所述麦克风3001被安装在用户耳中时(优选地在用户耳道中),所述的封闭隔离装置3002可以隔离所述麦克风与外部(耳朵)环境噪声,从而允许所述麦克风3001只察觉到在耳朵内部形成的用户话音/语音。作为话音/语音识别系统的主要问题的外界噪声将被显著地降低或者甚至将被完全地消除。
用户可以根据需要调整封闭隔离的级别。例如,为了消除耳道中的语音回声,所述麦克风可以通过从所述用户耳道中稍微拨出所述麦克风单元来较少地与外部耳朵环境隔离。麦克风单元也可以具有集成的隔离/非隔离级别装置。
所述麦克风/传感器3001可以借助于线路3003或者借助于无线通信系统被连接到一个相应的电子设备。无线通信系统可以是诸如蓝牙、红外、射频等等之类的任何类型。
如上所述,在使用本发明的结合键压和相应语音(现称为按压并说话KIKS技术)的数据输入系统的话音/语音到数据(例如文本)输入系统期间,耳集成的麦克风/传感器可以被用来察觉用户的话音/语音。如前所述,通过按压一个按键和说出被分配给所述按键的期望符号(例如一个字母),话音/语音识别系统尝试把所述语音只匹配到少数被分配给所述按键的符号的其中一个语音模式。在这种情况下,即使一个耳戴麦克风/传感器的音频感知质量比标准麦克风低,所述耳戴麦克风/传感器察觉到的被说出符号的质量将仍然清楚到足够允许话音/语音识别系统容易地识别那些按键上的所述少数符号当中的一个被说出符号。
根据本发明的一个实施例,如图31中所示,一个耳戴麦克风3100可以被提供并且被连接到一个诸如移动电话3102之类的移动电子设备。如图所示,麦克风3101用一种方法被设计得置于用户耳道中,并且在所述用户说话时察觉在用户耳朵中产生的用户语音/话音振动。然后,所述语音可以借助于线路3103或者无线地被发送到所述移动电话3102。
通过被安装在用户的耳朵中并且具有封闭隔离装置3104,所述的麦克风3101将只察觉到用户的话音/语音。作为话音/语音识别系统的主要问题的外界噪声将被显著地降低乃至完全被消除。如之前所提及,隔离级别可以自动地或者通过用户来调整。
例如,当用户按压按键3105并且说出位于所述按键上的字母”k”时,用户耳朵中的所述语音的振动可以被所述耳戴传感器/麦克风察觉到并且被发送到一个期望的电子设备。本发明的话音/语音识别系统必须把所述语音匹配到位于所述按键的几符号的已经存储的语音模式(例如在这个示例中,”J、K、L、5”)。即使所述语音的质量不够好(例如因为用户低声说话),所述语音也可以容易地与期望字母的存储模式相匹配。
如以上指出,这个系统的另一个优点是用户可以低声说话乃至耳语。因为,一方面,麦克风被安装在用户耳朵中并且直接察觉用户话音而不会被外界噪声干扰,另一方面,识别系统尝试只把被符号匹配到少数几个选择,所以即使一个用户低声说话乃至耳语,用户的话音质量对于话音/语音识别系统的使用来说也足够好。为了同样的理由,识别系统可以是与用户无关的。当然,用用户话音对系统进行训练(例如扬声器从属的方法)将能显著地实现识别系统的更好的识别准确率。
除了麦克风/传感器之外,耳戴单元也可以包括一个位于麦克风/传感器旁边并且还被集成在用户耳中以用于收听的扬声器。
根据本发明的一个实施例,如图32中所示,一个耳戴麦克风和扬声器3200可以以这样一个方式被提供,即麦克风3201被安装在第一用户的耳朵(如此处所述)中,而扬声器3202被安装在第二用户的耳朵中。
上述说明不应该被看作是限制本发明的范围,而应该被看作是仅仅描述了本发明的一部分优选实施例。许多变化在本发明的范围内被考虑。例如,在图32的耳戴单元的示例中,两个耳朵可以被提供麦克风和扬声器元件。在另一个示例中,当所述的耳戴单元被无线连接到一个相应的电子设备时,一个蓄电池电源可以被提供在所述耳戴单元内。此外,为了更好的语音接收质量,本发明的耳戴麦克风单元还可以包括至少一个被设置在耳朵外边的辅助标准麦克风(例如,在发送线路上)。耳内麦克风与耳外麦克风相结合可以向本发明的语音/话音识别系统提供更多的音频信号信息。此外还应当注意,本发明的数据输入系统可以使用任何使用任何技术的麦克风或者传感器来察觉耳内语音振动。
正如前面提到的那样,一个结合键压和语音(例如根据用户的话音或嘴唇运动)的通用数据输入方法已经在2000年10月27日申请的PCT申请PCT/US00/29647中被解释。
如所述申请中所描述的,通过按压一个按键并且说出或没有说出被分配给所述按键的符号群当中的一个诸如字符之类的期望符号,所述的期望符号可以被选择。例如,为了通过标准电话型键区3300(看见图33)输入单词″早晨″,用户可以
-按压键3308并且说出′m′;
-按压键3308并且说出′o′;
-按压键3306并且说出′r′;
-按压键3308并且说出′n′;
-按压键3303并且说出′i′;
-按压键3308并且说出′n′;
-按压键3303并且说出′g′。
通过逐个字母(或逐个符号)地说出一个单词,并且按压相应的按键,所述单词可以被输入。
在PCT/US00/29647中描述的数据输入系统可以允许一个减少了按键数量的键盘(例如电话键区)充当一个全尺寸的PC键盘(例如每个符号有一个按压动作)。
逐字数据输入系统
到增强上述的数据输入系统,一个单词级数据输入系统已经在所述的PCT申请中被建议。在所述申请中所描述的是,用户可以通过说出所述单词并且按压对应于构成所述单词的字母的按键来输入一个单词。
每个单词在一种语言中的语音可以包括一组(一个或多个)音素,其中,所述的(一个或多个)音素组包括一个或多个音素。图34作为示例示出了一个单词字典3400,其中,对于每个输入(例如单词)3401,其字符集(例如它相应的字符串)3402,相关的键压值3403(例如使用诸如图33中所示之类的电话键区)、对应于所述单词的音素组3404、以及所述音素组的语音模型3405(最后将被话音/语音识别系统使用)被示出。
根据一个语音(例如话音)识别方法,当用户说出一个单词时,他的语音可以与所记住的语音模型相比较,并且一个或多个最佳匹配模式将被系统选择。根据另一个语音识别方法,当用户例如说出一个单词时,他的语音可以基于一组构成所述语音的音素的识别而被识别。
然后,(一个或多个)对应于所述的被选择的(一个或多个)语音模型或音素组的单词(例如,字符组)可以被系统选择。如果该选择包括一个单词,则所述单词可以变成最后的选择。如果该选择包括多于一个的单词,则所述单词可以(例如在显示屏打印的列表中)被显示给用户,并且用户例如通过按压一个″选择″按键来选择它们中的一个。
上述的基于它们的语音的单词识别方法只作为示例而被描述。可以理解的是,其它通过语音的识别方法也可以被本领域的技术人员考虑到。
只基于它的语音来识别一个单词不是一个准确的系统。对此存在很多原因。例如,许多单词可以具有实质上类似、或混淆的发音。此外,诸如外界噪声之类的因素可能在单词级数据输入系统中造成不明确。通过话音来输入任意的单词需要复杂化的软件,考虑到非常多的诸如口音、话音变调、用户意图或噪声交互作用之类的参数。为此,语音识别系统是基于短语的识别,其中例如,发音类似的单词可以根据所述短语的环境在一个短语中被去掉其模糊性。此外,基于短语识别的语音识别系统需要大量的存储器和CPU使用,从而使得它们在诸如移动电话之类的小设备中的集成在这种情况下不可能。
由本发明人发明并且在其他的PCT和US专利申请中被描述的按压说话技术可以解决上述问题。除了在所述申请中所述的逐字符输入系统之外或与之相结合,本发明的单词级数据输入技术可以向小型/移动/固定设备的用户提供一个自然迅速的(逐字)文本/数据输入系统。
如所提及,在PCT申请PCT/US00/29647中描述了用户可以说出一个单词并且同时按压对应于构成所述单词的字母的按键。为此还提到了一个词典数据库可以被使用。根据那个并且通过参考图33,举例来说,当用户单词说出“card”并且按压相应按键(例如电话型键区的按键3302、3302、3306、3309)时,系统可以从字典数据库(比如图34中所示的)选择对应于所述键压的单词。在这个示例中,相同的键压组还可以对应于诸如“care”、“bare”、“base”、“cape”以及“case”之类的其它单词。然后,系统可以比较用户的(单词)语音与所述单词的语音(被记住的模式或音素组),所述单词对应于同一键压,并且如果它们中的一个匹配所述的用户语音,则系统选择所述单词。如果没有所述单词的语音匹配用户的语音,则系统可以选择它的(它们的)语音最匹配用户语音的所述单词当中的(一个或多个)单词。
根据这个方法,识别系统将只在少数候选者(例如上述示例中的6个单词)当中选择一个单词。从而,识别结果是容易并且语音识别系统的准确性显著地加强,从而允许一个高准确性的通用单词级文本输入。此外还应当注意,在说出一个单词的同时键入它是一个常见的人类行为。
根据本发明的另一个实施例,对于输入一个单词,用户可以按压对应于所述单词的至少一部分字符的少数(例如一个、两个并且如有需要则更多)按键,(优选地,开始)并且(优选地,同时)说出所述单词。根据所述键压和所述语音,系统可以识别出想要的单词。为了这个目的,根据一个方法,例如,系统可以第一选择字典数据库的单词,其中,所述单词的相应部分字符对应于所述键压,并且比较所述选择单词的语音与用户语音。然后,系统选择一个或多个单词,其中,它们的语音与所述的用户语音最佳匹配。根据对应于所述单词的至少开始字符的至少少数键压来选择词典数据库中存在的单词,显著地降低了将用于和用户语音相比较的所述选择单词的数量。这允许一个准确性很高的期望单词的输入。例如根据另一个方法,系统可以首先选择字典的单词,其中,它们的语音最佳匹配所述用户的语音。然后,系统可以估计(构成所述单词字符组)所述单词的所述至少开始字符(估计他们属于哪个键压)与所述用户的相应键压,以便最终选择匹配所述用户的键压的(一个或多个)字符组。
在上述实施例中,如果选择包括一个单词,则所述单词可以变成最终选择。如果该选择包括多于一个的单词,则所述单词可以被显示给用户(例如在显示屏打印的列表中),并且用户例如通过按压一个″选择″按键来选择它们中的一个。可以理解的是,通过结合键压并且语音输入单词并且通过前述系统来选择相应单词的系统,是用于举例说明的。显然,为了同一目的,基于本发明的数据输入系统原则的其它系统可以是已知的并且被本领域的技术人员考虑到。
上述方法,即说出一个单词并且按压对应于至少构成所述单词一部分的字符的按键,并且比较所述键压与对应于词典中的单词字母的键压,所述方法需要使用一个足够容量的存储器。通过存储一种语言中可用的所有单词的音素组/语音(例如模式),对应于一个或多个语言中可用的所述单词的字符串的数据库,以及具有对应于所述字典数据库中可用的所述单词的键压数据库需要大容量的存储器。
此外,如之前申请中所述,根据本发明的数据输入系统,一个诸如标点符号之类的符号可以被分配给键区的一种按键,并且通过按压所述按键而不说出语音被输入为缺省值。在如前所述的本发明的单词级数据输入系统中,用户可以在结束输入一个单词的所有相应键压之前结束说出该单词。因为用户语音未包含的最后键压可以被认为是所述的缺省字符,所以这可能使识别系统迷惑。存在一些解决方案来克服这个问题。例如,用户可以首先说出一个话并且然后按压相应的按键。这可以向系统指出在语音之后出现的键压组对应于所述语音。
在另一个示例中,通过一个诸如按压一个模式按键之类的预定义动作,系统可以退出文本模式并且进入诸如标点/功能键模式之类的另一个模式(例如特殊字符模式)。根据这一示例,在所述文本模式中,系统可以将所有键压考虑为对应于最后的语音。通过当系统在特殊字符模式中时按压一个按键,一个诸如标点符号之类的符号可以在单词结尾(或任何其它位置)被输入,同时向系统指出所述单词的结束。
如所述的PCT申请中所述,至少一个诸如标点符号、空格符或功能键之类的特殊字符可以被分配给键区的按键。通过单次按压所述键区的一个按键而不说话,一个诸如所述按键上的标点符号之类的符号可以被输入。两次按压同一按键而不语音可以提供另一个被分配给所述按键的符号(例如标点)。
基于子语音的数据输入系统
必须考虑到,当用户在键入一个单词时说出它,他可能例如根据所述语音的音节,自然地把所述单词的所述语音打断成一个或多个子语音(sub-speech)部分(例如,当他键入对应于每个子语音的字母时)。例如,当使用一个诸如键区之类的键盘键入单词”morning”时,用户可能自然地首先说出第一子语音”mor”然后或同时按压相应的按键。然后,用户可能发出接下来子语音”ning”的音并且键入相应的按键。为了容易的示范,在本申请中,单词″子语音″被用于单词的一部分语音的语音。例如,单词”perhaps”可以用两个子语音”per”和”haps”来说出。还例如,单词”pet”可以用单个子语音”pet”被说出。
还例如,为了输入单词”playing”,用户可能首先发出对应于第一音节(例如”pla”)的音,同时键入对应于字母”pla”的按键,以及,然后发出对应于第二音节(例如”ying”)的音,同时键入字符组”ying”。
必须指出,一个用户可以不同与另一个用户把一个单词划分成部分。因此,对于每个部分的子语音和相应的键压可能不同。在所述用户完成所述单词所有部分的数据(例如键压和子语音)输入之后,最后结果将是类似的。
在上面提及的示例中,所述的另一个用户可以发出第一部分”pla”的音并且按压相应的字符组”play”的按键。然后,他可以”ing′并且按压对应于字符串”ing”的按键。还例如,第三用户可以用子语音并且键压的三个序列来输入单词”playing”。所述用户可以说”pla”、”yin”和”g”(例如拼写字符”g”或发出相应声音的音)并且同时键入相应按键。可以理解的是,把一个单词划分成不同的语音序列和键压的最自然的方式是语音的每个序列都对应于所述单词的一个音节。因此,必须指出,尽管在本申请的许多段落中我们把音节指出为单词的一个部分/序列,然而本发明的数据输入系统适用于用任何形式把一个单词划分成一个或多个部分。
根据上述原则,例如,单词”trying”可以用两个部分(例如音节)”tr″和”ing”来发音。还例如,单词”playground”可以用两个部分(例如根据它的两个音节)”pla”和”ground”被划分和输入(例如在本申请的许多段落中,音素(例如话音)根据韦伯斯特字典通过相应字符来举例说明)。
正如在上述示例中所示,用一种(或多种)语言的不同单词的部分语音可以具有类似的发音(例如通过相同的音素组被合成)。例如,单词”trying”和”playing”在它们的语音内具有公共的子语音部分”ing”(或”ying”)。
根据上述原则可以创建一个数据输入方法,其中,通过考虑/记住对应于一个单词子语音的音素/语音模式的预定义组,并且至少考虑对应于被分配给音素/语音模式的相应组的字符组的部分键压,整个单词的识别在本发明的按压并说话的数据输入系统中可以变得有效。图35示出了一个对应于整个词典3502的子语音的示范性音素组字典(例如音素组)3501,和对应于所述音素组字典3501的音素组的字符组字典3503,还包括对应于所述字符组字典3503的键压值字典3504(根据电话键区),字符组字典3503对应于所述的音素组字典3501。根据本发明的不同实施例,一个或多个这些数据库可以被本发明的数据输入系统所使用。
因为在很多情况下,相同的音素组(或子语音模型)可以按顺序被用来识别不同的单词(在它们的语音中具有相同的子语音发音),不太被记住的音素组/语音模式被要求用于识别一个或多个词典中可用的全部单词,从而降低了所需的存储量。这将降低分配给一个诸如电话型键区之类的键盘的相应按键的音素组/字符组数量,并将显著地加强语音识别系统(例如任意的文本输入)的准确性。
图36示出了具有类似语音部分3602的示范性的英语单词样本3601。如图所示,四个短音素组3602可以产生至少七个整个单词3601的语音。可以理解的是,所述的音素组3602也可以表示用英语或其它语言的许多其它单词的语音部分。
基于上面提及的原则,一个自然的按压并说话的数据输入系统可以被提供,它通过一个移动装置使用降低数量的音素组来输入任何单词(例如通用指令、任意的文本输入),该移动装置具有限制大小的存储器(例如移动电话、PDA)和有限的按键数量(例如电话键区)。该系统同时可以例如通过使用用于诸如个人电脑之类的固定装置的PC键盘,来增强数据输入。在这种情况下,(因为PC键盘具有更多的按键),数量更加降低的音素组将被分配给每个按键,从而加强了语音识别系统的准确性。此后,本发明的不同的详细实施例被描述。
所有按键-至少音素部分
根据本发明的一个实施例,用户可以把单词的语音划分成不同的子语音,其中,每个子语音都可以由一个对应于构成所述单词相应部分的字符串(例如字符组)的音素组来表示。通过说出每个音素组并且/同时按压对应于字母(对应于所述音素组/字符组)的按键,并且(按从开始到最后的顺序)对于所有(或至少一部分)所述子语音重复这个程序,所述的整个的单词(例如以字符串的形式)可以被输入。
如图33中所示,例如,字母”t”位于键区3300的按键3301上。对于所述按键,诸如”te”“ti”“ta”“to”等等之类的(在这个示例中,所述音素组对应于从所述字母”t”开始的字符组)不同音素组和/或相应的语音模型可以被分配(参见图37的表格)。发音”te”可以对应于诸如”tea”、”tee”乃至”the”(例如如果用户不以美语/英语为母语)之类的不同字母组。举例来说,对于产生单词”teabag”,用户可以按压”t”按键3301并且说”te”并且继续按压对应于剩余字母”ea”的剩余按键。根据一个方法,该系统可以比较用户语音与被分配给第一按键(在这个示例中是”t”按键3301)的语音(例如模式)或音素组。在把说用户的语音匹配到一个(或更多)被分配给所述按键的所述音素组/语音模式之后,系统选择一个或多个被分配给所述(一个或多个)音素组/(一个或多个)语音模式的(一个或多个)字符组。如所提及,在这个示例中,一个相同的语音可以对应于两个不同的字符组,一个对应于字母”tea”(例如键压值832)而其它对应于字母”tee”(例如键压值833)。系统比较用户按压的按键(例如其值)与对应于所选字符组的键压(例如其值),并且如果它们中的一个匹配用户键压,则系统选择它来最终被输入/输出。在这个示例中,字母”tea”可以是这个阶段的最终选择。一个诸如空格键按压之类的终点(例如单词末尾)信号可以通知系统,用于当前整个单词的键压和语音已经终止。
必须指出,表示字符串(例如tac)的音素组(例如”tak”)可以优选地被分配给与另一个表示所述字符串的第一字符(例如”t”)音素(例如”t”)被分配的相同按键。此外,由字母串(例如”th”)表示并且代表字符串(例如”th”)的单个音素(例如”th”),可以优选地被分配给与另一个由表示所述字符串(例如”t”)的另一个音素(例如”t”)被分配的相同按键。
在上面提及的示例中,选择并不是最终的(例如因此用户没有提供所述的终点)。然后,用户可以按压对应于字母”b”(例如,单词下一个音节中的第一个字符)按键3302并说出”bag”,并且继续按压对应于剩余字母”ag”的剩余按键。系统像之前所述一样进行并且选择相应的字符组”bag”。现在,用户通过例如按压一个空格键来发信号告知单词的结束。
通过说出”te”并且按压按键3301、3309、3302(例如基本值”8 3、1”)并且然后说”bag”并且按压按键3302、3302、3303(例如键值”1、1、4”),单词”teabag”可以被产生。如前面所提,单词”teabag”通过语音并键压被产生,而不必在存储器中有其整个的语音模型/音素组。事实上,单词”teabag”的语音模型/音素组通过存储器中可用的其它两个子语音模式/音素组(例如”te”和”bag”)被产生,每个都表示整个的单词”teabag”的说语音模型/音素组的一部分并一起产生所述的整个语音模型/音素组。”te”或”bag”的语音模型/音素组可以分别被用作诸如”teaming”或”Baggage”之类的其它单词的语音模式/音素组的一部分。
尽管在这个实施例中的识别准确性很高,然而最终选择有时一个不存在字典数据库中的错误单词也可能发生。由于这个缘故,根据本发明的一个实施例,在输入/输出所述单词之前,系统可以比较最终选择与期望语言的单词字典的单词。如果所述选择不匹配所述字典中的单词,则它可以被拒绝。
此外,根据一个方法,当按压单词一部分的相应按键并说出它时,用户可以用他的语音在所述输入期间覆盖所述的相应键压的方式来说话。这将有这样一个优点,即用户语音在每一刻都对应于被同时按压的按键,从而允许更容易地识别所述语音。另一方面,在单词输入的结束,用户可以按压任何键而不说话。这可能通知系统,该单词被输入(例如按压一个按键并且不说话可以被分配给诸如标点符号、PC功能键等等之类的字符)。这个问题已经在由本发明人提出的PCT申请中被解释。
在完成上述的识别程序之后,如果所选输出包括超过一个的单词,则根据一个实施例,所述单词可以被显示给该用户(例如在显示屏上打印的列表中),并且用户可以例如通过按压一个″选择″按键来选择它们中的一个。
必须指出,在某些情况下,识别单词的一个或多个子语音的一部分音素(优选地,那些在所述子语音开始时)足以在本发明的按压并说话的数据输入系统中识别相应单词。
根据本发明的一个实施例,不是考虑所有对应于单词子语音的音素,少数几个音素(优选地是那些在所述子语音开始时的音素)可以被考虑,并优选地被分配给一个或多个按键,这些按键对应于所述音素组的(一个或多个)字符组的第一字母。所述音素组可以被用于通过本发明的按压和语音数据输入系统的识别目的。根据这方法,识别许多整个的单词所必需的语音模式/音素组的数量可以被显著地降低。在这种情况下,对于一个诸如键区之类的键盘的每个按键将只分配少数音素组,从而允许话音/语音识别系统更容易地识别所述音素组。
通过使用一个用于估计单词每个子语音(优选地是第一子语音)的所有/少数(优选地是开始)字符并且考虑对应于所述单词所有字符的所有键压,一个语言的单词可以被本发明的数据输入系统识别。
如前面所提及,根据一个语言中的单词子语音,不同的音素组(或语音模型)可以被考虑并且优选地被记住。每个所述的音素组都可以对应于所述单词内任何位置的一个单词的一部分。每个所述的音素组都可以对应于具有类似/实质上类似发音的一个或多个字符组(例如串)。所述音素组可以根据它们的相应字符组的第一字符分配给按键。例如,表示字符组”tee”和”tea”的音素组”te”可以被分配给也表示字母”t”的按键3301。如果一个音素组表示分别从不同字母开始的两个字符串,则所述音素组可以被分配给分别表示其中一个所述字符串的第一字母的两个不同的按键。例如,为了增强本发明的语音识别系统的准确性,实质上具有类似发音的字符组”and”和”hand”可以被分配给音素组”and”。在这种情况下,所述音素组可以被分配给两个不同的按键3302和3303,它们分别表示字母”a”和”h”。可以理解的是,当按压按键3302和说出”hand”时,相应的字符组优选地将是”and”,并且当按压按键3303并且说”hand”时,相应的字符组优选地将是”hand”。
图37示出了一个示范表,它示出了可以出现在从字母”t”开始的单词音节开始处(或别处)的一些音素组。该表的最后一行还示出了字母”i”的音素组和相关字符组的一个附例。
尽管具有更多音素(例如诸如taps、take、tast等等)之类的较长音素组可以被考虑、模式化、并且被记住来帮助识别单词,然而在这个实施例中,其中,用户实质上按压所有对应于单词字母的按键,通过结合话音/语音识别并且还使用词典数据库和图35如中所示的相关数据库(诸如之类的键压值)来估计/识别所述单词的一个或多个部分(例如音节)的少数开始字符,对于产生所述单词来说是足够的。显而易见,必要时,较长的音素组还可以被用于更好的识别和明确。
举例来说,通过考虑图33并且还使用图37的表格来产生单词”title”,用户可以按压对应于字母”t”的按键3301和所述”ti”并且然后按压对应于剩余字母”itle”的剩余键压。在该单词的结尾,用户可以例如按压一个诸如空格键之类的单词结束按键。如说表格中所示,诸如”ti、ty、tie”之类的字符组被分配给音素组”ti”。第一字母”t”显而易见地被选择。第二字母由于按压按键3303(例如”y”在按键3304上)将是”i”。下一个被按压的按键是与字母”t”有关的按键3301。在这种情况下,字符组”tie”的可能性被拒绝。因此,”ti”将被确定地选择。现在,系统考虑”ti”以及剩余键压(值)8(例如”t、u、v”),5(例如”g、h、i”)和3(例如”d、e、f”)。比较这些输入与一个具有相应的键压数据库的词典可以揭示对应于这些输入的唯一单词是单词”title”。系统然后选择单词”title”。
为了更好的识别,用户可以说出单词超过一个的子语音并且同时按压相应的按键。在这种情况下,系统可以考虑通过语音的所述输入来更好地识别对应于的所述超过一个的子语音的字符。
通过经由键盘/键区键入一个单词(具有一个或多个部分/音节)并且部分地/彻底地说出所述单词,几乎在每种情况中,(受益于相应键压的估计的)语音识别系统对所述单词的至少其中一个所述部分/音节(优选地是第一部分/音节)的少数开始字符的识别,并且与对应于所述单词的剩余字符的键压估计相结合,将产生所述的单词。
在另一个示例中,为了输入包括两个子语音/音节”ta”和”ken”的单词”taken”,当键入第一字符”t”(按键3301)时,用户说出”ta”并且然后按压对应于第一音节的剩余字符的剩余按键(例如”a”)。然后,用户自然地进行下一个音节和在按下对应于字母”k”的键3305的时候说出”ken”,并且继续按压对应于字母”en”的所述下一个音节的剩余按键。然后,他可以例如按压一个空格键来通知系统数据输入的结束。
在完成上述的识别程序之后,如果所选输出包括超过一个的单词,则根据一个实施例,所述单词可以被显示给该用户(例如在显示屏上打印的列表中),并且用户可以例如通过按压一个″选择″按键来选择它们中的一个。
捷径:结合至少一部分音素的较少键压
具有有限按键数量的键区的小型移动电子设备是全世界常用的。用户通过使用一只手的手指(例如大拇指、食指)来按压所述键区的按键。甚至在上述数据输入系统中,其中,每个符号通过对相应按键的单次按压动作而被输入,数据输入速度比使用PC键盘的数据输入速度慢,在PC键盘中,用户通常使用双手的手指来按压键盘的按键。
为了增强本发明的数据输入系统并且允许更快的数据(例如文本)输入,一个宏级数据/文本输入系统已经在PCT申请PCT/US00/29647中被建议。在所述的PCT申请中提到,宏(例如字母/字符串)可以被分配给键区按键,并且通过结合/不结合话音/语音的单次按压动作被输入。通过把单词的至少一部分字符分配给单个键压,整个单词可以通过少数键压被输入。通过在本发明的按压并说话的数据输入方法内应用这个方法,一个快速数据输入可以被提供用于移动环境/小型设备。用这种方法,键压数量通常小于单词字符的数量(除了单个字符和诸如字典外单词之类的可能需要逐字符输入的某些单词之外)。
如之前所提及,对应于一种或多种语言的单词语音(包括一个或多个音节)的至少一部分的音素组可以被分配给一个键区的不同预定义按键。还如之前所提及,所述音素组中的每一个都可能表示一种语言中的至少一个字符组。如之前所提及,表示诸如字母(例如字符组)之类的字符串的音素组可以优选地被分配给与表示所述字符串的第一字符的另一个音素被分配的相同的按键。
根据本发明的一种优选实施例,用户可以按压优选地对应于单词一部分的第一字母的(一个或多个)按键,并且同时优选地说出所述的相应部分。为了这个目的,用户可以将单词划分成不同的部分(例如根据所述单词的语音的音节)。说出单词的每个部分/音节在本申请中被称作″子语音″。可以理解的是,对应于所述单词的所述被划分部分的音素组(及其相应的字符组)必须在系统内是可用的。
根据这些实施例,例如,为了输入可以(例如在这个示例中根据它的音节)被分成两个子语音”tip”和”top”的单词”tiptop”,用户可以首先按压按键3301(例如音素/字母”t”被分配给所述按键)并(优选地同时)说出”tip”(例如单词”tiptop″的第一子语音),然后可以按压按键3301并且(优选地同时)说出”top”(例如单词”tiptop”的第二子语音)。使用图37中的示范表格,字符组”tip”被分配给音素组”tip″并且给分配给按键3301上的字母”t”。当用户按压按键3301并且说出”tip”时,系统比较用户语音与被分配给按键3301的所有音素组/语音模式。在选择一个(或更多)最佳匹配所述的用户语音的所述音素组/模式之后,系统选择被分配给所述的(一个或多个)被选择音素组的字符组。在当前的示例中,只一个字符组(例如tip)被分配给音素组”tip”。然后,系统用相同的方式进行到单词的下一个部分(例如子语音),依此类推。在这个示例中,字符组”top”是被分配给音素组”top”的唯一字符组。系统选择所述的字符组。根据本发明的一个实施例,在选择对应于单词的所有子语音/音素组的所有字符组之后,系统然后可以组合提供了不同字符串/群的所述字符组(例如一个组合程序的示例在下一个段落中被描述)。然后,系统可以比较每个所述的字符群与存储器中可用词典数据库的字(例如字符组)。例如,在选择最佳匹配所述字符群中的一个的字典的其中一个单词之后,系统可以把所述单词选择为最终选择。在这个示例中,在输入第二部分/音节之后,用户例如按压一种空格键或另一个按键而不说话来通知系统,该单词被彻底地输入(例如,按压按键并且不说话可以被分配给诸如标点符号、PC功能键等等之类的字符)。这个问题已经在由本发明人提出的PCT申请中被解释。系统组合字符组′tip′和”top′并且产生字符群′tiptop”。如果期望,则系统比较所述字符群与系统的词典数据库(例如英语字典)中可用的单词,并且如果其中一个所述单词匹配所述的字符群,则系统输入/输出所述的单词。在这个示例中,单词“tiptop”存在于系统的英语字典中。所述单词最终被输入/输出。
图38示出了实施例的被选择字符组的组合方法。例如,当用户尝试通过使用本发明的实施例用三个序列来输入单词”envelope”时,系统选择一个到两个字符组3801用于每个部分。如图39中所示,系统然后可以根据它们在所述单词内的相应位置来组合所述字符组,从而提供不同的字符群3802。所述字符群3802将与系统词典的单词相比较,并且(一个或多个)匹配一个或多个所述单词的字符群最终将被选择并输入。在这个示例中,字符组3803(例如”envelope”)是匹配所述字典中的单词的唯一的字符组。所述单词最终被选择。
如所提到的,在某些情况下,语音识别系统可以为单词的所有/部分语音(例如音节)选择超过一个的音素组/语音模型。例如,如果具有″不好″口音的用户尝试根据本发明的当前实施例来输入单词”teabag”,则他首先按压按键3301并且同时说出”te”。系统可能不肯定用户是否说出都被分配给所述按键的”te”或”the”。在这种情况下,系统可以选择对应于两个音素组的不同字符组。通过使用相同的程序,用户然后输入单词的第二部分。在这个示例中,唯一的一个字符组”bag”被系统选择。用户最后按压空格键。然后,系统可以(以不同方案)组合所述字符组来产生不同的字符群,并且比较每个所述的字符群与词典数据库的单词。在这个示例中,可能的字符群可以是:
-“teebag”
-“teabag”
-“thebag”
匹配词典中的单词的唯一的字符群例如在英语中是单词”teabag”。这单词可以被认为是最后的选择。
仅仅作为举例说明,系统为字的每个/一些音素组选择超过一个的字符组可能发生。在这种情况下,超过一个的字符群可以被组合。因此,字典的超过一个的单词可能匹配所述的被组合字符群。在这种情况下,所述单词可以被显示给用户(例如在显示屏打印的列表中),并且用户可以通过例如按压一个″选择″按键来选择它们中的一个。此外,如果系统包括足够的存储器和足够的处理速度,则语音识别系统可以被用来例如根据相应的短语语境来选择其中一个所述的被选择单词。
如果一个单词/单词部分包括许多音素,但是它的语音包括单个音节,则根据一个方法,包括/考虑所述单词/单词部分的所有所述音素的音素组/模式可以被分配给所述单词。例如,为了输入单词”thirst”,构成所述单词的所有音素的音素组可以被分配给所述单词,并且被分配给(例如被置于/被分配给按键3301)字母”t”(的按键)。例如,用户按压按键3301并且说出”thirst”。如之前所解释的,系统选择该单词的(一个或多个)子语音(在这个示例中是一个子语音)的(一个或多个)字符组(在这个示例中,只有一个,”thirst”),并且组合它们(在这个示例中没有组合)。然后,系统可以比较所述字符组与系统词典的单词,并且如果所述字符组匹配字典中的其中一个所述单词,则它把所述单词选择为最后的选择。在这种情况下,单词”thirst”最后将被选择。
在某些情况下,特别是当单词由仅仅一个音节组成时,可能需要对于一个音节的超过一个的键压来消除单词的歧义。为了这个目的,不同的用户友好方法可以被实现。例如,初始包括一个音节的单词”fire”可以用包括音素组”fi”并且”re”两个音节分别来发音。在这种情况下,用户可以首先按压对应于字母“f”的按键并且说出”fi”。然后,他可以按压对应于字母”r”的按键并且可以说出”re”。
还例如,单词”times”可以用两个音节”ti”和”mes”或”tim”和”es”来发音。此外,一个诸如”listen”之类的单词可以用两个音节”lis”和”ten”来发音,它们可能分别需要对应于字母”l′和”t”的键压。此外根据这些原则,单词”thirst”可以被分成三个部分”thir”、”s”和”t”。例如,通过考虑音素组”thir”可能已经被分配给包括字母”t”的按键(例如按键3301),用户可以按压按键3301和说出”thir”,然后他可以按压对应于字母”s”的按键3306并且发出音素”s”的音或说出所述字母。然后,他可以按压对应于字母”t”的按键3301和发出音素”t′的音或者所述字母。在单词结束时,用户可能按压一个诸如空格键3307之类的单词结束按键。
此外,为了更好的消除歧义并且为了降低在其开始处例如具有相同语音的单词(例如”bring”和”brings”)所必需的音素组数量,除了按压音节的第一按键并且说出所述音节之外,在某些情况下,话/音节的一个或多个诸如(一个或多个)最后字符(在这个示例中例如”s”)之类的字符可以被按下并且说出。例如,用户可以按压一个对应于字符”b”的按键和“bring”(例如音素组”bring”被分配给按键3302)。然后,他可以按压对应于字母”s”的按键,并且或者发出”s”的音或者说出音素“s”的音。在提供一个诸如按压″空格″按键之类的单词结束信号之后,系统将考虑两个数据输入序列,并且提供相应的单词”brings”(例如,它的音素组没有被分配给按键3302)。可以理解的是,用此处的方法来输入一个或多个单个字符在单词内的任何位置(比如开头、中间、或结尾)中都是可能的。为了不淆乱系统,当用户输入包括字母的一个(单词的)部分时,通过本发明的单词/部分单词输入系统,他可以优选地说出所述字母的发音。例如,用户可以发出音素”m”的音而不说出”em”。此外在一个类似的情况中,说出所述”t”可以被系统关系到字符串”tea”、”tea”以及字母”t”,而发出音素”t′的音可能只与字母”t”有关。
如前所述,为了更好地消除歧义,具有实际上的音素组数量的单词/单词部分/单词音节/单词子语音(比如”thirst”或”brings”)可以被划分成超过一个的部分,其中,某些所述部分可能只包括一个音素/字符,并且根据本发明的数据输入系统被输入。还如所提到的,根据这个方法,分别包括较少音素数量的多个音素组可能代替一个包括很多音素数量的单个音素组,以便表示单词的一部分(例如一个音节)。还如前所述,把单词的长部分的语音(例如包括很多音素数量的长音节)划分成较短的子语音/音素组部分,将降低字典数据库中可用的所有单词的识别所必需的音素组的总数。还如之前所述,这将允许把较少的音素组分配给键盘/键区的每个按键。
根据本发明的一个实施例,基于以上所述的原则,包括少数音素的短音素组可以被分配给键盘/键区的每个按键。为了这个目的,例如,如果一个音素组从辅音开始,则它可以包括下列结构/音素:
-只有所述的辅音
-以所述辅音开始,并且接下来有至少一个元音
-以所述辅音开始,在所述辅音之后有至少一个元音,并且在所述(一个或多个)元音之后有一个辅音。
如果音素组从元音开始,则它可以具有下列结构:
-以至少一个元音开始
-以所述的(一个或多个)元音开始,并且之后有一个辅音。
根据本发明的这个实施例,图40示出了用于辅音”t”4002和元音”u′4003的音素组4001的一些示例。列4004、4005、4006根据构成所述音素组的声音群(例如辅音/元音)示出了所述音素组的不同部分。列4007示出了相应的示范单词,其中,相应的音素组构成了所述单词的一部分语音。例如,音素组”tar”4008构成了单词”stair”的部分4009。列4010示出了用于输入相应单词的一个估计的示范性键压数量(根据本发明的这实施例,一个键压对应于单词每部分的第一字符)。例如,为了输入单词”until”4011,用户将首先按压对应于字母”u”的按键3301(参见图33)并且优选地同时说出”un”。然后,他再次按压对应于字母”t”的按键3301并且还优选地同时说出”til”。为了结束单词,用户然后通过一个诸如按压空格键之类的单词结束信号来通知系统。单词until通过两个键压(排除单词结束信号)以及用户语音被输入。根据基于之前所述原则的当前实施例,在它前后没有紧挨元音的辅音音素可以被认为是单词语音的一个分离部分。例如,单词”study”4012开头的”s”和话”understood”4013中间的”s”可以遵循这个规则。这将极大地降低输入字典中可用的大部分单词所必需的音素组的数量(例如,当使用一个电话型键区时,或许针对每个单词部分的开始音素/字符,大约一百个音素组足以识别识别例如英语中的大部分单词)。图40作为示例示出了被分配给电话型键区的按键3301的诸如”v”4014和”th”4015之类的其它的开始音素/字符。根据上述原则,音素组可以被考虑以用于每个所述的开始音素/字符。
可以理解的是,如有需要/期望,具有更多音素的单词的较长子语音部分还可以与系统的短音素组一起考虑。还例如,表示超过一个的单词音节的音素组同时可以被考虑并分配给一个所述的相应按键。此外,如前一实施例所述地为了更容易的识别,为了允许更好地识别用户发音的语音(在很多情况下可能不以英语为母语),具有含糊不清的类似发音的对应于音素组的字符组(比如“to”和“to”)可以被分配给所有的所述音素组。
相同的预定义(优选地,简短的)音素组/语音模式可以允许以多种语言来识别并输入单词。例如,音素组“sha“可以被用于识别诸如下列之类的单词:
“shadow”, 英语,
“chaleur”,法语,
“shalom”, 希伯来语
“shabab”, 阿拉伯语,
“Geisha”, 日本语,等等。
以相应语言的相应字符组可以被分配给所述的每个音素组。如前所提及,通过这样做可以提供一个基于音素组识别的强大的多语言数据输入系统。为此,以不同语言的一个或多个数据库在系统内可能是可获得的。以不同语言输入不同文本的不同的方法可以被考虑。
根据一个方法,通过具有以多种语言的公共音素组的数据库以及相应的字符组数据库,为了以期望语言来输入文本,用户可以通过用预定义装置通知系统来选择一个语言模式。例如,所述用户可以按压一个模式按键来进入一个期望的语言模式。在这种情况下,在根据本发明的相应实施例输入所述单词的部分来输入一个单词之后,系统将比较所选的相应被组合字符组群/串与对应于所述的被选择期望语言的词典的单词。在匹配所述字符群与所述字典的一个或多个单词之后,系统将所述的(一个或多个)匹配单词选择为将被输入/输出的最后选择。如果该选择包括一个单词,则所述单词可以变成最终选择。如果该选择包括多于一个的单词,则所述单词可以(例如在显示屏打印的列表中)被显示给用户,并且用户例如通过使用一个″选择″按键来选择它们中的一个。
根据另一个方法,系统可用的以不同语言的所有数据库将被同时使用,从而允许以不同语言来输入一个任意的单词(例如在一个相同的文档中)。例如,在根据本发明的一个实施例通过输入所述单词的部分来输入一个单词之后,系统可以比较被选择的相应字符群与系统可用的所有词典的单词。在匹配所述字符群与系统可用的不同字典中可用的单词之后,系统把所述的(一个或多个)匹配单词选择为将被输入/输出的最终选择。如果该选择包括一个单词,则所述单词可以变成最终选择。如果该选择包括多于一个的单词,则所述单词可以(例如在显示屏打印的列表中)被显示给用户,并且用户例如通过使用一个″选择″按键来选择它们中的一个。
在一些诸如希伯来语或阿拉伯语之类的语言中,其中,大部分元音不是由分隔字符来示出的,该系统甚至可以用高准确性来工作。
不与词典比较
系统也可以不经过比较被组合的选择字符组与词典的步骤而工作。这对于不用担心它们在系统词典中是否存在来输入不同语言的文本是有用的。例如,如果系统不包括希伯来语词典,则用户可以用罗马字母来输入希伯来文的文本。为了输入单词”Shalom”,用户将使用存在的音素组”sha”和”lom”以及它们在系统内可用的相应字符组。一个诸如模式按键之类的装置可以被用来通知系统,被组合的字符组将被输入/输出或被显示给用户,而不用所述的与字典数据库的比较来进行确认。如果已经产生了超过一个的组合字符组,则它们将可以被显示给用户(例如在显示器上显示的列表中),并且用户可以通过例如按压一个″选择″按键来选择它们中的一个。
在本发明的单词/单词各部分输入实施例中,如果被输入/输出的单词没有是用户期望的,则一个单词擦除功能可以被分配给一个按键。类似于一个字符擦除功能(例如删除、退格)按键,按压一个单词擦除按键例如将在显示器上擦除光标之前的单词。
根据本发明的另一个实施例,系统的大多数音素组可以优选地只具有一个辅音。图41作为示例示出了它们中的一部分。根据这个实施例,例如为了输入单词”teabag”4101,用户首先按压按键3301并同时说出”te”。然后,他按压按键3302并同时说出”ba”。最后,他按压按键3303并同时说出”g”(或者发出音素”g”的音)。在其它的实施例中,他可以在单词结尾按压一个诸如空格键之类的按键。
为了更好的响应并且为了加强系统的准确性,一个自动校正软件可以与本发明的实施例相结合。自动校正软件已被本领域的技术人员公知。例如,(通过考虑图33的键区)当用户尝试输入单词”network”时,他首先按压键区的按键3308并且同时说出”net”,字母”n”被分配给键区的按键3308。字母”m”也被分配给相同的按键3308。在有些情况中,系统可能把用户语音误识别为”met”并且为所述语音选择一个诸如”met”之类的字符组。用户进行到通过按压对应于说出音节的第一字母”w”的按键3304来输入下一个音节并且说出”work”。系统识别出用户发音的音素组”work”并且选择一个相应的字符组”work”。现在,系统组合两个被选择的字符组并且得到单词”network”。通过比较这个单词与系统的词典数据库中存在的单词,系统可能不能匹配所述的组合单词与所述数据库的任何所述单词。然后,系统将设法匹配所述的组合单词与大多数相似的单词。在这种情况下,根据一个假设,系统可以用字母”n”来代替字母”m”,从而提供所述字典中可用的单词”network”。根据另一个假设,通过考虑到”m”和”n”可能被语音识别系统误识别并且两者位于同一按键上,系统可以用音素组”net”来代替音素组”met”并且选择被分配给音素组”net”的字符组”net”。然后,通过用字符组”net”来代替字符组”met”,单词”network”将被组合。所述单词在系统词典中是可用的。它将最后被选择。
在另一个示例中,输入“that”可以被系统认为是”vat”。相同的程序将去掉所述单词的不明确性并且将提供正确的单词”that”。
在另一个示例中,如果系统不匹配一个组合字符组与字典的单词,则系统的自动校正软件可以估计在相应部分中(例如音节)和/或所述的组合字符组内的所述组合字符组(彼此相关)的字符位置,并且尝试把所述字符组匹配到字典的单词。例如,如果一个字符在所述字符串/组内丢失,则通过与字典单词的所述比较,系统可以识别该差错并且输出/输入正确的单词。例如,如果输入单词”un-der-s-tand”(例如4部分)的用户忘记输入所述单词的部分”s”,则其中一个组合字符组可以是字符串”undertand”。通过考虑所述字符串的字符及其在所述链中彼此相关的位置,并且通过比较所述字符串与字典的单词,系统可以认识到想要的单词是单词”understand”,并且最终将输入/输出所述单词或者可以将其呈现给用户以便用户做出决定。另外,系统的自动校正软件包括本领域的技术人员所知的其它自动校正软件的部分或者全部功能。
发音相同(例如并且被分配给同一按键)的诸如”to”、”too”或者”two”之类的单词可以遵循特殊处理措施。例如,这些单词当中的最常用单词是单词”to”。这个单词可以根据本发明的实施例被输入。这个操作的输出可以是作为默认的单词”to”。通过按压对应于字母”t”的按键并同时说出”too”,单词”too”可以被输入(用两个部分”to”和”o”)。在按压单词结束按键之前,用户还可以通过按压对应于字母”o”的按键和说出”o”来输入一个附加符号”o”。现在他可以按压终点键。单词”too”将被识别并且输入。为了输入单词”two”,系统可以逐字符将其输入或者为所述单词分配一个诸如”tro”之类的特别语音并且用这个实施例来输入它。还例如为了输入”two”,用户可以按压按键3301并且发出长的”too”的音。为了输入数字”2”,用户按下相应的按键3302并且说出所述的数字。可以理解的是,此处所示的示例被举例说明为样本。实质上具有类似发音的单词的其它输入方法可以被本领域的技术人员考虑到。
一个非常有趣的问题刚刚被提及。例如,通过说出”fiv”并且按压对应于单词”five”第一字母的按键3309,单词”five”将被输入。有趣地,通过说出”fiv”并且按压对应于数字”5”的按键3305,数字”five”将被输入。通过说出一个对应于两个不同符号的单词并且用键压,用户的意图被清晰化。这些是单独通过语音来输入数据的其中一个缺点,其中,用户意图可能不被话音/语音识别系统考虑到。还例如,超过一个的语音可以被分配给一个相同的数字。例如,两个语音”four”和”forty”可以被分配给数字”4”。通过说出”four”、”five”并同时按压相应的按键,或者他可以说出”forty five”并同时按压相同的按键,用户可以产生数字”45”。此外,当用户按压按键3306并且说出”seven”时,数字”7”将被输入。这个是因为为了输入单词”seven”,用户可以按压键3306并且说出”se”。他然后可以按压按键3301并且说出″ven”。
在诸如法语之类的其它语言中,其中,在中”7”的语音包括一个音节,为了歧义消除的目的,一个具有两个音节的定制语音可以被分配给字符组”sept”。例如,单词”septo”可以被用户创建并且被添加到词典。这个单词可以被指向字典中的单词”sept”。当用户输入单词”septo”时,(根据本发明的当前实施例),系统将在系统的词典中发现所述的单词。不是输入/输出所述单词,系统将输入/输出由单词”septo”指向的单词。所述单词是单词”sept”。指向字典数据库的单词的被创建符号可以被安排在一个单独数据库中。
根据另一个方法,一个数字可以被分配给与按键交互作用的第一模式,并且一个表示所述数字的字符组可以被分配给与所述按键交互作用另一个模式。例如,数字”7”可以被分配给对按键3306的单压动作(例如当说它时),并且字符串”sept”可以被分配给对同一按键3306的双压动作(例如当说它时)。
必须指出,本发明的子语音级数据输入系统是基于单词至少一部分(例如单词的子语音)的语音识别。考虑到以一个或多个语言的许多单词可能具有共同的子语音,所以通过稍微更改/附加音素组并且把相应的字符分配给所述的音素组,一个多种语言的数据输入系统可以变得可用。例如,诸如英语、德语、阿拉伯语、希伯来语乃至汉语之类的许多语言都可能包括有具有类似发音的部分/音节的单词。
可以理解的是,用户可以向系统的字典数据库附加新标准或定制的字以及相应的语音。因此,系统可以产生相应的键压值和语音模型并且添加到相应的数据库。
如之前所提及,为了输入一个字,用户可以按压一个对应于单词第一部分的第一字符/字母的按键并且说出所述部分(的音素)。如果所述单词用超过一个的部分被说出,则用户可以对所述单词的每个剩余部分来重复这程序。
根据本发明的一个实施例,当用户按压对应于一个单词部分(诸如之类的一个音节)的第一字母的按键并且说出所述部分时,话音/语音识别系统听到所述用户的语音并且尝试把所述语音的至少一部分(优选地至少开始部分)匹配到被所述按键的音素组。最佳匹配的音素组被选择,并且相应的字符组可以被系统选择。在通过对所述单词的每个部分(例如音节)重复相同的程序来输入整个单词之后,用于所述单词的每个部分(例如音节)的一个或多个字符组可以分别被选择。现在,系统可以具有一个或多个用于一个单词的每个部分(例如音节)的一个或多个字符组,其中,每个字符组可以包括所述音节的至少一部分字符(优选地是开始部分)。然后,系统将设法把每个所述的字符组匹配到系统的词典数据库的相应的单词音节的(例如开始)字符。最佳匹配的(一个或多个)单词被选择。在很多情况下,只有一个字典的单词将被选择。所述单词将被输入/输出。如果超过一个的单词被选择,则所述单词可以(例如在显示器打印的列表中)被显示给用户,并且用户例如通过按压一个″选择″按键来选择它们中的一个。
例如,通过使用图37的表格以及图33的键区,为了输入单词”trying”(例如音素组“tri-ing”),用户可以首先按压键3301并且说出”tri”。系统把用户语音匹配到被分配给按键3301的相应音素组并且选择相应的字符组(例如在这个示例中是”try”、”tri”)。然后,用户按压对应于字符”i”的按键3303并且说出”ing”。在这种情况下,系统把用户语音的开头部分匹配到被分配给按键3303的音素组”in”(例如,音素组”ing”不存在于示范数据库中,因此它没有被分配给所述的按键)并且选择相应的字符组”in”。现在,用户已经结束单词输入,并且他输入一个诸如按压空格键或按压任何按键而不说话之类的终点(例如单词结束)符号(例如,按压按键并且不说话可以被分配给诸如标点符号、PC功能键等等之类的字符。这个问题已经在本发明人提出的PCT申请中被解释)。现在,系统可以创建不同的字符组,每个字符组都包括期望单词的每个部分/音节的开始字符的至少一部分的可能字符。在这个示例中,两个字符组可以被创建。所述的字符组是:
“tri-in”
和;
“try-in”
只有第二个字符组(例如”try in”)对应于英语字典中的一个存在单词,其中,所述单词在它的首先音节开头处包括字母”try”,并且还在所述单词的另一个(例如第二)音节的开头处包括字母”in”。所述单词是单词”trying”。
在这个系统中,识别许多整个单词所必需的音素组/语音模型的数量可以被显著地降低。另一方面,表示所述音素组的字符组的数量可以被增加,但是将对所需要的存储量不具有重大的影响。
在很多情况下,只有其中一个所述的组合字符可以匹配字典中的一个单词。所述单词将被输入/输出。如果对应于字典中可用的单词的字符组组合超过一个,则所述单词可以(例如在显示器打印的列表中)被显示给用户,并且用户例如通过按压一个″选择″按键来选择它们中的一个。
如之前所提及,系统可以根据对应于所述单词的语音/子语音的一个或多个所述的被选择字符/音素组来选择一个单词。
在某些情况下,系统可能不考虑一个或多个所述的被选择字符/音素组,因为它们被系统错误地选择。此外,系统可以根据需要只考虑系统选择的音素组/字符组的音素/字符的一部分(优选地是开始部分)。例如,如果用户试图用四个部分”de-mons-tra-ting”输入字”demonstrating”,并且系统根据一个识别方法(例如所述字符组与字典单词的比较)错误地选择了字符组”des-month-tra-ting”,则系统可能没有发现对应于所述字符组组合的一个单词。然后,系统可能注意到,通过考虑第一被选择字符组的字母”de”(例如少数begging字母)以及第二字符组的字母”mon”(少数begging字母),还通过考虑第三并且第四字符组,想要的单词可能是单词”demonstrating”。同时根据需要,系统可以向(被选择字符组的)组合字符串附加字符或者从所述的字符串删除字符,以便把它匹配到字典的一个最佳匹配单词。例如,如果用户试图用两个部分输入单词”sit-ting”,并且系统根据一个识别方法(例如,比较所述字符/音素组与字典的单词)错误地选择了字符组”si-ting”,则系统可以判断出字母”t”必须被添加在字母”i”之后,从而在所述字符串内将其匹配到单词”sitting”。在另一个示例中,如果用户企图用两个部分输入单词”mee-ting”,并且系统根据一个识别方法(在另一个示例中,比较所述字符/音素组与字典的单词)错误地选择了字符组”meet-ting”,则系统可以判断出字母”t”必须在字母”i”之后被删除,从而在所述字符串内将其匹配到单词”meeting”。
在单词一部分(例如所述单词已经超过一个的部分/音节)的结尾处与在所述单词接下来的部分开头处具有相同的音素可以允许系统有更好的识别准确性。
根据本发明的一个实施例,例如,对于用诸如元音之类的音素终止的(被分配给一个按键的)音素组,在其结尾包括所述音素组和一个诸如辅音之类的辅助音素的辅助音素组可以被考虑并且分配给所述按键。这可以增加识别准确性。例如,通过参考图33,当输入包括两个部分”co-ming”的单词”coming”时,用户可以按压按键3302并且说出”co”,然后他可以立即按压按键3308并且说出”ming”。因为子语音的第一部分太短,所以如果音素组”com”没有被分配给音素组”co”被分配的按键3302,并同时按压所述按键并且说出”co”,则系统可能误识别用户所述部分的语音并且选择一个诸如″col”之类的错误音素组(例如,字符组”call”被分配给该音素组)。另一方面,如果音素组″com”也被分配给所述按键,则部分”ming”的开始音素”m”将类似于音素组”com”的结束音素”m”。在这种情况下,系统可以选择两个音素组”com-ming”以及它们的相应字符组,(例如”com/come”,和”ming”)。在比较组合字符组与字典的单词之后,系统可以决定消除其中一个所述的组合字符组中的一个”m”,并且把所述的组合字符组匹配到字典数据库的单词”coming”。
为了更好地识别在很多情况下不是以英语为母语的用户发出的语音,相应地分配给(比如”vo”并且”tho”)具有含糊不清地实质上类似发音的音素组的字符组可以被分配给所有的所述音素组。例如,相同的(例如公共)字符组”tho”、”vo”和”vau”等等可以被分配给每个音素组”vo”和”tho”,其中,在系统选择所述字符组并且因此创建不同的字符组的情况下,所述组与系统的字典数据库的单词的比较可以产生所述字典的一个期望单词的选择。
经由小键区来输入诸如文本之类的数据严重地降低了数据输入速度。基于按压用于单词每个部分/音节的单个按键并同时说出所述部分/音节的本发明的数据输入系统显著地增加了数据输入速度。该系统还具有许多其它的优点。该系统的一个优点是它可以通过所述单词的每个部分(例如音节)按压大概单个按键来(以高准确性)识别一个单词。该系统的另一个很大的优点是用户不必担心(例如通过键入每个部分的第一字母)误拼写/误键入一个单词,而这尤其在单词预测数据输入系统中产生整个单词的误识别/不识别。此外,该系统的另一个很大的优点是当用户按压对应于单词一部分的第一字母的按键时,他在所述键压期间说出(所述部分)。在一个单词的结尾,用户可以通过按压所述按键而不说话来输入一个诸如(被分配给一个按键)标点符号之类的缺省符号。如之前所提及,这键压还可以被用作单词结束信号。例如,用户可以通过按压按键3303并且同时说出”hi”来输入单词”hi”。他然后可以按压键3306而不说话。这将通知单词输入被结束并且符号″,”必须被添加在所述单词的结尾。最后的输入/输出将是字符组”hi,″。
在本发明中描述的数据输入系统是发明人提出的PCT以及US专利申请中描述的数据输入系统的衍生。结合之前申请中描述的提供了完全PC键盘功能逐字符数据输入系统以及在所述PCT申请和在此处的本申请中描述的单词/单词各部分级数据输入系统,将在移动(乃至固定)环境中提供一个快速、容易并且自然的数据输入,其允许经由具有小电子设备的较少按键数量(例如键区)的键盘来进行快速的数据输入。
如之前所提及,本发明的数据输入系统可以使用诸如PC键盘之类的任何键盘。此外如之前所提及,根据本发明的数据输入系统,键盘按键上的符号可以通过按压所述按键而不说话被输入。本发明的数据输入系统可以用一个诸如标准PC键盘之类的键盘来最佳地起作用,其中,单个符号被分配给一个或多个按键上的预定义按压动作。使用如图42中所示的使用计算机键盘的人员知道,例如,字母”b”可以通过按压PC键盘4200的按键4201而被输入。还例如,符号”#”可以通过同时按压移位键4202和按键4203而被输入。
通过结合本发明的数据输入系统与这类键盘,一方面,用户可以通过按压对应期望数据的按键而不说话来使用所述键盘(这允许输入单个字母、标点字符、数字、命令等等,而不必说话),另一方面,所述用户可以通过说出所述数据并按下(优选地同时)相应的(一个或多个)按键来输入一个期望数据(例如单词/单词各部分)。例如,通过使用一个诸如PC键盘之类的键盘,用户可以按压按键4201而不说话来输入字母”b”。为了输入单词/音节”band”,用户可以按压按键4201并且(优选地同时)说出”band”。无须用于改变模式的辅助操作,这一方面允许用户照常用键盘来工作,并且另一方面让所述用户能够通过所述宏并且(优选地同时)按压对应的一个或多个按键来输入一个诸如单词/单词各部分之类的宏。此外例如,为了输入由两个部分(例如两个音节)”bi”和”ble”构成的单词”bible”,用户(如同所述地根据本发明的数据输入系统的原则)可以按压按键4201并且说出”bi”。然后,他可以按压按键4201并且说出”bel”。
如之前所提及,如之前申请中描述的提供一个完全PC键盘功能的逐字符数据输入系统以及如所述PCT申请和此处的本申请中所述的字/单词各部分级数据输入系统的结合,将提供一个完整的快速、容易并自然的数据输入系统。
单词的语音可能由一个或多个还对应于单个字符的子语音组成。例如,通过参考图33,当用户按压键区3300的按键3302并且说出”b”时,所述的被输入数据可以对应于字母”b”、单词”be”以及单词”bee”。根据一个实施例,考虑到(例如在这个示例中字母”b”)第一选择最终被输入/呈现给用户,系统可以把最高优先权分配给字符级数据。如果这不是用户想输入的,则他可以或者继续逐字符输入剩余单词,或者他例如可以按压一个结束键来结束所述单词的输入,并且然后例如操作一个选择键在其它选择(例如在这个示例中是”be”和”bee”)之间导航并且选择一个他期望的单词。
根据这方法,还例如,当输入一个从对应于单个字符、并且最终也对应于被所述按键的单词/单词各部分的语音的子语音链开始的字/字符链时,所述字符可以被给予最高优先权、并且最终在对应设备的显示器上被显示,甚至在单词结束信号被用户输入之前。如果下一个被输入的语音部分/子语音仍然可能对应/还对应于单个字母,则这个程序可以被重复。如果一个诸如空格键之类的单词结束信号出现,则所述字符串可以被给予最高优先权,并且可以保持在显示器上。进行诸如输入下一个单词之类的下一个任务将被认为是用户对接受所述字符串的确认。如果被输入的同一数据还对应于由系统匹配的一个或多个单词,则所述单词还可用于/被呈现给用户。如果所述被显示的单个字符串不是用户想输入的,则用户可以例如使用一个选择键在所述单词之间导航并且选择一个他期望的字符。
用本发明这个实施例的连续说明,如果在输入字/单词各部分期间输入的其中一个数据(语音/语音部分和/或键压)不对应于单个字符并且单词结束信号已经被输入,则所述被显示字符可以被擦除,并且替代地,具有最高优先级的单词(对应于所述数据)可以被显示给用户。如果被输入的相同数据对应于更多的单词,则所述单词还可以按照他所期望地被显示给用户。在这种情况下,用户例如可以使用一个选择键在所述单词之间导航并且选择他期望的单词。
通过使用标准电话键区和本发明系统的数据输入,可以注意到,在英语中不存在具有超过一个音节的单词,其中,所有所述音节的语音同时对应于对应按键上的单个字母。
存在着几个对应于对应按键上的一个字符的单音节单词(例如,”b、be、bee”或”t、tea、tee”)。如之前所提及,在那些情况中,所述单个字母可以被赋予最高优先权。
根据上述原则,例如:
-为了输入”b”,用户按压对应于所述字母的按键并且说出”b”
为了输入”bmx”,用户按压对应的按键并同时发出对应字母的音
-为了输入”bmx95”,用户按压对应的按键并且发出对应字符的音
-为了输入单词”before”,用户可以或者按压对应的按键并同时发出对应字母的音(例如逐字符数据输入),或者例如他可以首先按压对应于字母”b”的键并且(优选地同时)说出”be”,并且然后他按下对应于字母”f”的按键并且说出”for”。在结束时,他输入一个诸如按压空格键之类的单词结束信号(例如单词/单词各部分数据输入系统)。
这个方法的优点在于用户可以结合本发明的逐字符数据输入与本发明的单词/单词各部分的数据输入系统,而不必在不同模式之间切换。
本发明的数据输入系统是一个完整的数据输入系统,它使用户随时可以输入包括诸如字母、数字、标点字符、(PC)命令之类的符号的任意字符串或者能够输入存在于字典数据库的单词。
根据本发明的一个实施例,在程序组合并且与字典数据库的单词的比较开始之前,系统选择的字符组(对应于字/单词各部分的语音)可以被显示给用户。例如,在每输入单词的一部分之后,对应于所述输入数据的字符组可以立即被显示给用户。这个方法的优点是,在输入单词的一部分之后,用户可以立即校验该单词的所述部分是否被系统误识别。在这种情况下,用户可以擦除所述部分,并且重复(或必要时逐字符输入所述部分)所述输入直到对应于所述部分的正确字符被输入为止。不是一个一个擦除对应于单词被输入部分的字符,一个允许擦除对应于所述部分的整个字符的按键可以被提供。根据本发明的一个实施例,一个相同的按键可以被用来擦除整个单词和/或单词的一部分。例如,对所述按键的单压可以导致擦除单词的被输入部分的结果(例如,在所述部分之后紧接的由系统/用户设置的光标向系统指出所述部分将被删除)。显而易见地,每个额外的相同按压动作可以擦除所述光标之前的单词的一个额外部分。还例如,对所述按键的双压可能导致擦除所述单词的所有被输入部分(例如,一个光标可以被紧接置于将被删除的部分之后,以便向系统通知位于所述光标之前的所有单词部分都必须被删除)。
用户希望输入诸如包括(一个或多个)完整单词和(一个或多个)单个字符的”systemXB5”之类的字符串的情况也可能发生。
根据一个实施例,在输入对应于所述字符串一部分的各个数据之后,或者在所述的完整字符串输入结束时,系统可以认识到在字典中不存在对应于被选择字符组(对应于单词各部分)的单词。另一方面,系统可以认识到一些连续的所选字符组的组合对应于字典数据库中的单词,而其它一些则对应于单个字符。在这种情况下,系统将形成一个包括所述字符以及单个字符串的单词的输出。在上述的示例中,单词”systemXB5”可以用五部分被输入,”sys-tem-x-b-5”。
例如,通过使用一个诸如图33中所示之类的电话键区,对应于键压和各部分语音的所选字符组可以如下所示:
部分 sys tem x b 5
字符组 sis/sys tem/theme x b/be/bee 5
在组合所述字符组并将其与字典单词比较之后,系统可以认识到在数据库中不存在匹配所述被选择字符组的组合的单词。然后,系统可以认识到:一方面,存在一些对应于单个字符的部分,另一方面,单个字符组或连续的其它字符组的结合对应于所述数据库的(一个或多个)单词。然后,系统输入/输出所述结合。在这个示例中,系统可以认识到第一和第二字符组”sys”和”tem”的组合匹配单词”system”。第三和第五字符组分别对应于字母”x”和数字”5”。第四部分可以对应于字母”b”或单词”be”和”bee”。
系统可以根据他们的优先权向用户呈现下列选择:
“systemxb5”
“systemxbe5”
“systemxbee5”
可以理解的是,为了简化包括单个字符和一个完整单词的字符串的识别过程,用户可以由一个诸如按压预定义按键之类的预定义信号来发信号告知所述串中的所述单词/字符的开始/结束。
根据本发明的一个实施例,被划分成超过一个的部分以用于输入的单词可以优选地用这样一个方式来划分,即当可能时,所述部分的语音从元音开始。例如,单词”merchandize”可以被分成部分”merch-and-ize”。还例如,单词”manipulate”可以被划分成”man-ip-ul-ate”。
此外为了更好的结果,当所述字符组被与字典数据库的单词相比较时,对应于一个对应于单词一部分语音的音素组的被选字符组可以考虑到对应的音素组。例如,在英语,音素组”ar”的对应字符组可以是诸如”air”、”ar”和”are”之类的字符组。用于音素组”r”的对应字符组可以是”are”和”ar”。在这个示例中,两个音素组都具有类似的字符组”are”和”ar”。在对输入误识别的情况下,系统可以尝试一个(例如反向)歧义消除或校正程序。知道一个字符组与哪个音素组相关可以帮助系统更好地进行所述程序。例如,用户是否想输入单词”ar”,并且系统是否错误地把所述语音识别为”ab”(例如在这个示例中毫无意义)。所述被错误识别的音素组的相关字符可以是诸如”abe”、”ab”之类的字符组。通过考虑所述的音素组,系统将引导到诸如”aim”、”ail、”air”(例如与音素”a”有关)等等之类的单词,而非诸如”an”、”am”(例如与音素”a”有关)之类的单词。
如之前所提及,表示超过一个音节的单词的音素组也可以被考虑并且被分配给一个按键,并且通过本发明的实施例被输入(例如,对应于具有两个音节的单词一部分的一个音素组可以通过它并且按压一个对应于所述部分的第一字符的按键而被输入)。也如之前所提及,一个完整的单词可以通过说出它并且同时按压一个对应于所述单词的第一音素/字符的按键而被输入。甚至单词串也可以被分配给一个按键并且如前所述地被输入。系统没有识别出具有超过一个子语音(例如音节)的单词的音素组(例如子语音)的情况可能发生。在这种情况下,所述单词的两个或更多连续的子语音(例如音节)可以被分配给一个按键。参考图33,例如,单词”da-ta”(例如,其中,系统误识别音素组”ta”)可以被分配给按键3309。为了输入所述单词,用户可以按压按键3309并且说出”data”。
本发明的按压并说话数据输入系统允许输入单词,因此一个单词结束程序可以分别自动地或人工地由系统或用户来管理。
如前所述,存在各种被输入单词,比如:
-通过与对应的(一个或多个)键压结合的单个子语音/语音(例如具有一个音节的单词)、用一个部分被输入的单词
-被划分成超过一个部分(例如,具有超过一个音节的单词,或具有一个音节但是包括多个连续辅音或元音的单词),并且通过对应于与各部分的对应(一个或多个)键压结合的各部分的子语音/语音被输入的单词。
根据本发明的一个实施例,当对应于一种语言的单词数据库中的一个存在单词的完整单词被输入,并且用户输入一个诸如″单词结束″按键之类的单词结束信号时,所述单词可以被认为是被输入用于输入/输出的所述数据的结果。根据预定义的系统设计/模式,系统可以考虑在所述结果结束处添加或不添加诸如空格符之类的字符。如果系统或用户没有在所述单词之后输入一个诸如空格符或输入功能键之类的符号,则下一个被输入的字/字符将可以被连结到所述单词的末尾。
示例:
“FOR”后面跟随一个″单词结束″按键(没有空格)产生“FOR”
根据本发明的另一个实施例,当对应于一种语言的单词数据库中的存在单词的一个完整单词被输入,并且用户在所述单词末尾输入诸如至少一个空格符、至少一个标点符号、或至少一个″回车″功能符之类的附加符号时,所述单词并且所述的附加符号被输入。
示例:
“FOR”后面跟随“”产生“FOR”
“FOR”后面跟随“,”产生“FOR,”
“FOR”后面跟随“.”产生“FOR.”
根据本发明的一个实施例,当用户输入一个对应于一种语言的单词字典数据库中的存在单词的单词,并且然后所述用户输入下一个也对应于字典中的存在单词单词(不在所述两个连续单词之间输入诸如空格符之类的单词结束信号)时,但是所述两个单词的组合不对应于词典数据库中的单词,则系统可能自动地在所述两个单词之间添加一个空格符。
示例:”FOR”后面跟随”SOME”产生”FOR SOME”
根据本发明的一个实施例,当用户输入一个对应于一种语言的单词字典数据库中的存在单词的单词,并且然后所述用户输入下一个也对应于字典中的存在单词单词(不在所述两个连续单词之间输入诸如空格符之类的单词结束信号)时,并且所述两个单词的组合也对应于词典数据库中的单词,则系统可能自动地把两个选择呈现为了用户。第一选择可以是所述两个单词的组合(它们之间没有空格符),而第二选择将是在它们之间包括一个(或多个)空格符的所述两个单词。根据诸如预定义系统设计、所述单词的组合和分离意义、短语含义之类的因素,系统可以向其中一个所述选择赋予一个较高的优先级,并且可以将其打印在对应设备的显示器上以便用户确认。然后,用户将决定选择哪一个。例如,进行下一个单词/字符的输入可以通知用户第一选择被确认。
示例1:
“FOR”后面跟随”GIVE”可以产生第一选择”FORGIVE”
“FOR”后面跟随”GIVE”可以产生第二选择”FOR GIVE”
示例2:
“WORK”后面跟随”MAN”可以产生”WORKMAN”
“WORK”后面跟随”MAN”还可以产生”WORK MAN”
上述程序可以适用于诸如也对应于原则的下列(一个或多个)单词之类的单词。
示例:
“WORKMAN”后面跟随”SHIP”可以产生”WORKMANSHIP”
“WORKMAN”后面跟随”SHIP”还可以产生”WORKMAN SHIP”
根据本发明的一个实施例,当对应于一个语言的单词数据库中的存在单词的第一单词被输入,并且用户在所述第一单词末尾输入下一个单词/单词各部分(它们之间没有空格符),并且所述下一个单词/部分不对应于字典中的存在单词时,但是与所述第一单短结合的所述下一个单词/部分对应于字典中的一个单词,则系统将自动地连结被所述第一单词和所述第二单词/部分来提供单个单词。
示例:
“FOR”后面跟随”CING”产生”FORCING”
“FORGIVE”后面跟随”NESS”产生”FORGIVENESS”
根据本发明的一个实施例,当第一被输入单词/单词各部分不存在于一种语言的单词数据库中,并且用户输入下一个单词/单词部分时,系统将组合所述第一和下一个部分并且比较所述组合与字典中的单词。如果所述组合对应于所述字典中的一个单词,则系统选择所述单词并且最终将其呈现给用户以用于确认。
示例:
“SYS”后面跟随”TEM”产生”SYSTEM”
可以理解的是,为了更好的结果并且为了降低不明确性,自动单词结束程序可以与用户干预相结合。例如,在一个部分结束时按压一个预定义按键可以向系统通知,所述部分必须与它之前的至少一个部分组合。如果这样定义,则系统还可以在所述组合单词末尾放置一个空格符。
示例1:在没有用户干涉的情况下可能出现下列情况:
“FOR”后面跟随”GIVE”可以产生第一选择”FORGIVE”
“FOR”后面跟随”GIVE”也可以产生第二选择”FOR GIVE”
示例2:在用户干涉的情况下可能出现下列情况:
“FOR”后面跟随后面接着”″的”GIVE”可以产生一个选择”FORGIVE”
让系统进入人工/半自动/自动的单词结束模式/程序是可选择的。用户可以通过一个诸如模式按钮之类的装置通知系统以便进入所述程序或从中退出。这是因为在很多情况下用户可能更喜欢人工地处理单词结束问题。
如在前一实施例中所提及,用户可能希望任意地输入字符串内的一个或多个单词。这问题已经在本发明的其中一个之前的实施例中被描述。
示例:”91SYSTEMep7”
根据本发明的一个实施例,在其输入(例如语音和对应键压)之后(例如立即)并且在″单词结束″信号已经被输入之前,系统可以向用户呈现当前被输入的单词/单词部分。系统可以匹配所述部分与字典单词,把所述部分与前一单词/单词部分、当前片语语境相关联来决定向用户呈现哪个输出。系统还可以简单地按原样向用户呈现所述部分。这个程序同时可以让用户能够输入单词而不在它们之间设置空格。例如,在一个被呈现给用户的被选择结果(例如单词)已经被他选择之后,该用户可以进行输入接下来的单词/单词部分,而不在所述第一单词和所述后续单词/单词部分之间添加空格符。系统将连结所述的两个单词。
示例:
“PRESS”后面跟随”SPEAK”产生”PRESSSPEAK”
除了字典中的标准单词之外,系统的单词数据库还可以包括缩写、包括特殊字符(例如”it′s”)的单词、用户自造单词等等。
参考图33,例如,当用户按压按键3303并且说出”its”时,系统可以选择被分配给对所述按键的所述按压动作和所述(部分)语音的单词”its”和”it′s”。系统或者可以自己将其中一个所述单词(例如根据短语概念、前一单词等等)挑选为最终选择,或者它可以把所述被选择单词呈现给用户以便其最终选择。在这种情况下,系统例如可以在对应设备的显示器上打印具有最高优先级(例如”its”)的单词。如果这是用户希望输入的单词,则用户可以使用一个诸如按压预定义按键之类的预定义确认方法或者进行输入后续数据(例如文本)。进行输入后续数据(例如文本)被系统认为是对当前建议单词的接受的确认。如果所述被打印/建议的单词不是用户想输入的,则用户可以通过一个系统内提供的装置来选择其它被选择的单词(例如”it′s”)。根据另一个实施例,当两个单词发音类似时,表示其中一个所述单词(例如在上面提及的示例中的单词”its”)的音素组可以分配给第一类与按键的交互作用(例如单压),而表示其它单词(例如单词”it′s”)的类似音素组可以被分配给第二类与所述按键的交互作用(例如双压)。
先前提到,符号(例如,语音/音素组/字符组等等)可以被分配给一个诸如对按键的双压并结合/不结合说话之类的模式/动作。根据本发明的一个实施例,(一个或多个)不明确的单词/单词各部分可以被分配给所述的模式/动作。例如,单词”tom”和”tone”(例如被分配给相同的按键3301)可能在它们被用户说出时造成不明确性。一个去掉它们的不明确性的解决方案可以是把它们分别分配给对所述按键的不同模式/动作。例如,用户可以单压(例如按下一次)按键3301并且说出”tom”(例如音素组”tom”被分配给与所述按键交互作用的所述模式)来输入示例的字符组”tom”。此外,所述用户可以双压按键3301并且说出”ton”(例如音素组”ton”被分配给与所述按键交互作用所述模式)来输入示例的字符组”tone”。
还例如,以元音结束的第一音素组(例如对应于单词语音的至少一部分)可能造成与第二音素组的歧义,第二音素组包括在其开头包括所述的第一音素组并且包括额外的(一个或多个)音素。所述的第一音素组和所述的第二音素组可以被分配给与按键交互作用的两个不同模式。这可以显著地增加噪声环境中的话音/语音识别的准确性。例如,对应于字符组”mo”的音素组可以造成与对应于字符组”mall”的音素组的歧义(当它们被用户说出时)。为了更好地消除歧义,它们可以被分别分配给一个不同模式。例如,字符串”mo”的音素组可以被分配给对应按键的单压,而字符串”mall”的音素组可以被分配给对所述对应按键的双压。
根据本发明的另一个实施例,产生歧义的符号(例如音素组)可以被分配给诸如按压不同按键之类的不同的对应模式/动作。尽管它显然是不方便的,然而在上述的示例中,第一音素组(例如”mo”的音素组)例如可以被分配给诸如3308之类的第一按键,而第二音素组(例如”mall”的音素组)可以被分配给另一个按键。
此外,根据本发明的一个实施例,由表示所述第一音素组的开始音素的至少一个字符表示的第一音素组可以被分配给(例如与对应按键的)第一动作/模式,而由表示所述第二音素组的开始音素的至少一个字符表示的第二音素组可以被分配给第二动作/模式等等。例如,从表示字符”s”开始的音素组可以被分配给对键3301的单压,而从诸如”sh”之类的表示字符开始的音素组可以被分配给对按键3301或另一个按键的双压。
根据本发明的一个实施例,单个字母(例如”a”到”z”)可以被分配给(例如与对应按键的)第一模式/动作,而单词/单词部分可以被分配给第二动作/模式。例如,单个字母可以被分配给对对应按键的单压(例如,与所述字母的用户语音相结合),而单词/单词各部分可以被分配给对对应按键的双压(例如,与所述单词/单词各部分的用户语音相结合)。根据这个示例,用户可以结合逐字母数据输入以及单词/单词各部分的数据输入。为此,一方面,所述用户可以通过单压对应于将被输入字母的按键并同时说出所述字母来提供一个逐字母数据输入,并且另一方面,所述用户可以通过双压对应于将被输入的单词/单词部分并同时说出所述单词/单词部分来提供一个单词/单词各部分的数据输入。
根据本发明的一个实施例,一个诸如按钮按压之类的装置可以被提供用于上述目的。例如,通过按压一个模式按钮,系统可以进入一个逐字符数据输入系统,和通过再按压相同的按钮或按压另一个按钮,系统可以进入一个单词/单词各部分的数据输入系统。根据这个实施例,在一个对应模式中,用户例如可以通过对对应按键的单压动作并且说出对应字符(例如字母)或单词/单词各部分来输入一个字符或单词/单词各部分。
此外,例如通常根据它们的优先权或者根据当前的短语语境,发音类似的单词/单词部分(并且显然地,它们的对应音素组)可以被分配给不同的模式。在这种情况下,例如,第一单词/单词部分可以被分配给一个诸如单压之类的模式,而第二单词/单词部分可以被分配给一个诸如双压对应按键之类的模式,等等。例如,单词”by”和”buy”具有类似的发音。用户可以通过单压被分配给字母”b”的按键并且说出”bi”来输入该单词。所述用户可以通过双压一个对应于字母”b”的按键并且说出”bi”来输入单词”buy”(例如通常具有较低的优先权)。还例如,音节/字符组”bi”(也被发音为”bi”)可以被分配给诸如三次敲击一个按键之类的第三模式,诸如此类。可以理解的是,至少其中一个所述的单词/单词各部分可以被分配给一个与另一个按键交互作用的模式(例如并且显然地与所述单词/单词各部分的语音相结合)。
如之前所提及,与单词的至少一部分的语音有关的所选字符组的不同组合,可以对应于字典数据库中超过一个的单词。还如之前所提及,一个诸如″所选按键″之类的选择装置可以被用来在那些被匹配的单词当中选择一个想要的单词。一个较高优先级(在存在超过一个的单词时)可以根据它所属的短语语境而被分配给一个单词。此外,较高优先级(当存在超过一个的被选择单词时)可能根据前面和/或后续的(一个或多个)单词部分/单词的至少其中一个的语境而被分配给一个单词。
根据本发明的一个实施例,所述的单词/单词部分可以被分别分配给本发明的数据输入系统的不同模式(例如交互作用模式)。例如,当用户按压一个对应于字母”b”的按键并且说出”be”时,两个单词”be”和”bee”都可以被系统选择。为了避免例如″选择键″的使用,根据这个实施例,例如,第一单词”be”可以被分配给一个诸如单压模式之类的模式,而第二单词”bee”可以被分配给诸如双压模式之类的另一个模式。根据这个实施例,在上述的示例中,用户可以单压对应于”b”的按键并且说出”be”来提供单词”be”。他还可能双压同一按键并且说出”be”来提供单词”bee”。
根据本发明的一个实施例,一部分空格问题还可以被分配给一个诸如单压模式或双压模式之类的模式(例如与一个按键的交互作用)。例如,在一个自动空格程序中,连结/分开(例如单词部分/单词)功能可以被分配给单压或双压模式。根据这个实施例,例如,一个被分配给双压模式的将被输入的单词/单词各部分可以在所述的已输入单词/部分之前和/或之后被连结到一个已经输入单词/部分。例如,当用户通过单压(例如并同时说出它)输入一个诸如”for”之类的单词时,一个空格符可以自动地被提供在所述单词之前(或之后,或之前以及之后)。如果通过双压(例如并同时说出它)输入相同的单词,则所述单词可以被连结到前一单词/单词部分,或被连结到在它之后输入的单词/单词部分。
在上述的示例中,还例如,单词/单词各部分的输入之后的双压可能造成相同的结果。
根据本发明的一个实施例,为了自动空格的目的,被分配给对应音素组的一部分单词/单词各部分可以在它们结尾处包括至少一个空格符。在这种情况下,当所述空格不需要时,它可以自动地被系统删除。诸如标点符号之类的在单词末尾被输入字符可以被(例如被系统)置于所述空格之前。例如:
“word”后面跟随″,”产生”word,”
根据本发明的另一个实施例,为了自动空格目的,被分配给对应音素组的一部分单词/单词各部分可以在它们开头处包括至少一个空格符。在这种情况下,当所述空格是不需要时(例如对于一行的第一个单词),它可以被系统删除。因为空格符位于单词开头处,所以诸如单个字母或标点符号之类的字符照旧可以在单词结尾处被输入(例如与之连结)。
根据本发明的一个实施例,在包括自动空格程序的数据输入期间,一个诸如预定义键压之类的动作可以被提供用于把当前部分/单词连结到前一/后续的部分/单词。例如,如果一个空格被自动地提供在两个(例如当前和先前的)单词/部分之间,则一个诸如键压之类的预定义动作可以消除所述空格并且连结所述的两个单词/部分。
示例:
“for”+”give”+预定义按键产生”forgive”
根据本发明的另一个实施例,以所述元音结束的单词/音节/单词各部分的较长持续时间的元音发音,可以产生本发明语音识别的一个更好的歧义消除程序。例如,通过发音更久的时间段,当说出”o”时,元音″vo”可以向系统通知将被输入的单词/单词各部分是″vo″而不是例如单词/单词各部分″voL″。
根据本发明的一个实施例,通过使用一个诸如预定义键压动作之类的预定义装置,将被输入的数据可以被大写。例如,通过按下”CapsLock”按键,之后将被输入的字母/单词/单词部分可以用大写字母来输入/输出。对所述的”Caps Lock”按键的另一个按压动作可以把系统切换回小写模式。可以理解的是,所述功能键(例如”Caps Lock”)可以被分配给一个发言模式。例如,为了提供大写程序的开始,用户可以按压对应于”Caps Lock”符号的按键并且发出被分配给所述符号的对应语音(比如”caps”或”lock”或”caps lock”等等)。
根据本发明的一个实施例,小写的字母/单词/单词部分可以被分配给诸如单压对应按键之类的第一模式(例如结合/不结合所述字母/单词/单词部分的语音),而大写的字母/单词/单词部分可以被分配给诸如双压对应按键之类的第二模式(例如结合/不结合所述字母/单词/单词部分的语音)。例如,为了提供单词(例如字符组)”thought”,用户可以单压按键3301并且说出”thought”。为了产生单词(例如字符组)”THOUGHT”,所述用户可以双压按键3301并且说出”thought”。这可以允许局部地大写一个输入。
此外,根据一个类似的原则,第一字母大写而其剩余部分小写的单词/单词部分可以能被分配给一个诸如单压模式、双压模式等等之类的模式。
根据本发明的一个实施例,如在逐字符数据输入的先前申请中所述,字母/单词/单词各部分可以被分配给超过一个的单个动作,比如同时按压两个按键。例如,以”th”开始的单词/单词各部分可以被分配给同时按压分别被分配给字母”t”和”h″的两个不同按键,并且(最终)说出所述的单词/单词各部分。相同的原则可以分配给以”ch”“sh”、或字母表任何其它字母(例如”a”、”b”等等)开始单词/单词部分。
根据本发明的一个实施例,以由字符表示的音素开始的单词/单词各部分可以被分配给诸如单压对应按键之类的第一模式,而以由超过一个的字符表示的音素开始的单词/单词各部分可以被分配给诸如双压对应按键(其可以是一个不同的按键)之类的第二模式。例如,以”t”开始的单词/单词部分可以被分配给单压对应的按键(例如与所述单词的语音相结合),而以”th”开始的单词/单词各部分可以被分配给双压所述的对应按键或另一个按键(例如与所述单词的语音相结合)。
如之前所提及,取决于本发明的不同实施例,在诸如以一种或多种语言的词典之类的不同类别的不同字典中,音节/单词部分(字符组)的字典,语音模型(例如音节/单词部分)的字典等等可以被使用。必要时,各有类别或同一类别的两个或更多的字典可以被合并。例如,一个单词词典和单词部分的词典可以被合并。
如前所述,本发明的数据输入系统可以使用任何键盘和可以与诸如″多次击键″系统、单词预测系统、虚拟键盘等等之类的许多数据输入系统作用。例如,一方面,用户可以通过按压对应键盘的按键而不说出(例如在所述系统中惯用的)输入用所述的其它系统来输入文本(例如字母、单词),另一方面,所述用户可以通过按压对应按键并且说出所述数据(例如字母、单词/单词部分,并且如果这样设计,则说出诸如标点符号等等之类的其它字符)来输入诸如文本(例如字母、单词/单词部分)之类的数据。
如之前所提及,本发明的数据输入系统可以使用任何话音/语音识别系统和方法来识别诸如字符、单词的单词部份、短语等等之类的被说出符号。系统还可以使用诸如唇读、眼读等等之类的其它识别系统,并结合诸如不同按键模式、手指识别、指纹识别、手指运动识别(例如通过使用摄像头)等等之类的用户动作识别系统。这些识别系统和用户的动作已经在本发明人之前提出的专利申请中被描述。所述的先前申请中的所有特征(例如涉及逐符号的数据输入)还可以被应用到本发明的宏(例如,单词/逐单词的部分/单词部分)数据输入系统。
根据本发明的另一个实施例,(如在涉及逐字符输入级的先前申请中所描述的),系统可以设计为以便用户可以说出单词/单词部份而不必按压对应按键来输入文本。另一方面,所述用户可以按压一个按键向系统通知语音(例如字符、单词各部分、单词、片语等等)、标点符号、功能符等等的结束/开始。
本发明的数据输入系统还可以被应用于诸如多于一个单词序列之类的宏输入,或者甚至被应用到短语输入系统。例如,用户可以说出两个单词(例如同时)并且按压对应于所述两个单词的第一单词的第一字母的按键。
尽管在本申请和先前申请的许多段落中,为了数据输入目的而结合用户话音/语音的键压已经作为示例被提及,然而本发明的数据输入系统可以被应用到其它的数据输入装置(例如,诸如字符、字/单词部分等等可以被分配的用户手指之类的对象),并且可以使用其它的用户行为以及对应的识别系统。例如(已经在本发明人先前申请的专利申请中被描述),不是(或结合)分析键盘按键的按压动作,系统(通过例如使用摄像头)可以识别出用户手指在空中的动作。例如,用户可以在表格上敲击他的右拇指(字母”m、n、o”被分配给右拇指)和说出”milk”(例如,单词”milk”预定义地被分配给右拇指)。在这个示例中,与所述用户语音相结合的所述用户的手指运动可以被用来输入单词”milk”。
在另一个示例中并且根据相同的原则,所述的其它数据输入装置可以是诸如字母之类的用户的手写体符号(例如乱画),并且所述行为可以是用户的语音。例如,通过使用一个使用手写识别系统的笔式设备(例如PDA、触控笔等等),用户可以书写一个诸如字母之类的符号并且说出所述字母来增强系统的识别系统的准确性。在另一个示例中,所述用户可以写出对应于单词/单词各部分的语音的至少第一音素的一个字母并且说出所述的单词/单词各部分。当所述用户写出所述字母时,设备的手写识别系统识别出所述字母并且将其关联到被分配给所述的至少一个信(或符号)的单词/单词各部分和/或音素组。当系统听到用户话音时,它尝试将其匹配到至少其中一个所述的音素组。如果在所述音素组当中存在一个匹配所述语音的音素组,则系统选择对应于所述音素组的字符组。程序的其余部分(例如发现最末单词的程序)可以类似于在本申请以及本发明人之前提出的申请中所描述的。
根据一个实施例,如本申请以及本发明人先前提出的申请所描述的本发明的数据输入系统可以被概述如下:
表示至少字母数字的字符和/或至少一种语言的单词和/或单词各部分、标点符号、功能符等等的预定义数量符号可以被分配给一个预定义数量的对象,通常是按键,所述符号在一个诸如文本输入系统之类的数据中被使用,其中,一个符号可以通过提供一个与对应对象的预定义交互作用而被输入,对应于所述符号、所述附加信息的至少一个附加信息的存在通常被提供而不用与所述对象交互作用,其中,所述附加信息通常是对应于所述符号的语音的存在,或最终是所述语音的不存在,并且其中,所述对象还可以是诸如用户手指、用户眼睛、键盘按键等等的对象,并且所述用户的行为可以是诸如用户语音、用户手指运动方向(包括不运动)、用户指纹、用户嘴唇或眼睛运动等等的行为。
与其它的用许多键压来输入少数字符的数据输入系统相对比,本发明的数据输入系统可以使用少数的键压来提供许多字符的输入。
符号在键区上的配置方法
在本发明人提出的在先专利申请中已经建议了不同的符号配置方法。图43示出了把符号分配到键区4300的按键上的方法。
如同以前,字母a-z和数字0-9被放在电话类型的键区上它们的标准位置上并且可以在说出它们的同时通过按压相应的按键来输入。
同样如前所述,许多标点字符与功能键被分配到所述键区的按键上并且可以通过按压(或者双压)相应的按键而不必说出它们来输入。
在这个配置中,被用户自然说出的诸如″+″号4301之类的标点符号被分配给某些按键并且可以通过按压一个相应的按键并说出它们而被输入。
同时根据这种布局,诸如″-″号4302之类的某些符号可能具有不同的含意并且根据语境可能被发音或者根据数据的语境可能不被发音,这些符号在一个按键中被放在两个位置中。它们有时与那些在输入它们时需要说出来的符号组在一起,但是也与那些在输入它们时也许不被说出来的符号组在一起。对于一个需要话音的符号,根据语境或数据可以分配一个以上的话音,例如,被分配到按键4303上的符号″-″4302可以以不同的方式被输入。
·用户可以按下按键4303并说″minus″(减号)
·用户可以按下按键4303并说″dash″(短划线)
·用户可以按下按键4303而不讲话。
在键区按键上互换模糊的符号
正如前面提到的那样,诸如被分配到键区/键盘的同一按键上的字母之类的某些符号可能具有实质上类似的发音。这可能引起本发明的语音/话音识别系统的不明确性。图43a示出了一个标准电话类型的键区4300。被分配到该按键4301的一对字母″d″和″e″,在所述按键被按下并且所述字母之一被发音时可能引起本发明的语音/话音识别系统的不明确性。分配到邻接按键4302上的一对字母″m″和″n″在它们中的一个被发音时也可能在它们之间引起不明确性。另一方面,字母″e″或″ d″可能很容易与字母″m″或″n″区分。通过互换把每一对中的字母之一与另外一对中的相应按键互换,则所述四个字母的识别问题(例如通过使用本发明的按压并说话的数据输入系统)将被解决。这可能稍微修改了键区的字母顺序配置,但是将显著增大数据输入的准确性。图43b示出了在所述修改之后的一个键区4310。
自动空格方法
正如前面提到的那样,一种用于连结/分开(attaching/detaching)单词/单词各个部分的自动空格程序可以被分配给诸如单按模式或双按模式之类的一个模式。正如已经描述的那样,用户可以输入诸如单词的至少一部分(例如在其结尾处不必提供空格符)之类的一个符号,通过说出所述符号同时按压一个与所述符号的开始字符/音素对应的按键(例如所述符号所分配的按键)(在本发明的逐字符数据输入系统中,所述开始字符通常是所述符号)。按照所述程序,例如,通过说出所述符号同时双按与所述符号的开始字符/音素对应的所述键,用户可以输入诸如单词的至少一部分之类的一个符号(例如包括在其结尾处的空格符)。在需要许多按键按压输入一个单词的数据输入系统中,自动空格可能尤其有益。
按照上述原理,例如在本发明的逐字符数据输入系统中,例如通过在单按一个相应按键的同时说出/不说出所述字符,则一个字符可以被输入并与前一字符连结。包括双按动作的相同动作可能引起输入所述字符并将其与所述前一字符连结,而且可以在当前字符之后加一个空格符。要被输入的下一字符将被放在所述空格符之后(例如将与所述空格符连结)。例如,为了输入单词″see you″,用户可以首先通过说出字母″s″和″e″同时单按它们相应的按键来输入字母″s″和″e″。然后他可以在双按″e″的相应按键的同时说″e″。然后用户可以通过说出字母″y″和″o″同时单按相应按键来输入字母″y″和″o″。然后他可以说″u″同时双按相应按键。
根据本发明的另一实施例,不是在所述当前字符之后设置所述空格符,系统可以在所述当前字符之前设置所述空格符。
可以理解的是:不是空格符,在所述字符之后或之前都可以考虑任何其它符号(或符号组)。当然,如先前所述,考虑到一个字母是一个单词的一部分,同样的程序可以适用于本发明的单词一部分/单词级别的数据输入系统。同样,例如用户可以输入单词″prepare it″,通过说出一部分″pre″同时单按对应于字母″p″的按键来首先输入一部分″pre″。然后他可以通过说″pare″同时双按对应于字母″p″的按键来输入″pare″(例如包括其结尾处的一个空格)。然后,用户可以通过说单词″it″同时双按对应于字母″i″的按键来输入单词″it″(例如也包括其结尾处的一个空格)。
在按键数量减少的键区上的QWERTY配置
根据本发明的一个实施例,在一个键区上的字母配置和/或分配可以按照QWERTY键盘上的字母配置。这可以吸引许多不使用电话类型的键区用于数据输入的人,因为他们不熟悉标准电话键区上字母顺序的字母配置。根据本发明的一个实施例,使用与本发明的数据输入系统结合的这种键区还可以通过本发明的语音/话音识别系统提供更好的识别准确性。
图44a作为一个示例示出了一个电话类型的键区4400,其中字母字符按照QWERTY键盘上所述字母的配置而被排列在/分配到其按键上。如图所示,一个QWERTY键盘的字母键的上面一行上的字母,按照所述QWERTY键盘上所述字母的相同顺序(彼此相关)被分布在所述键区4400的上面一行4404的按键4401-4403上。位于QWERTY键盘的中间字母行上的字母按照所述字母在一个QWERTY键盘上被排列的相同顺序(彼此相关)被分布在所述键区4400的第二行4405的按键上。最后,QWERTY键盘的下面的字母行上的字母按照它们被放在一个QWERTY键盘上的相同顺序(彼此相关)被分布在所述键区4400的第三行4406的按键上。
继续参考这个实施例,所述字母表的字母可以按照在不同按键上设置模糊字母的方式被分布在所述键区的按键上。图44b作为一个示例示出了具有较小改动的QWERTY排列的键区4407。在所述键区中,字母″M”4408和″Z”4409的按键分配以一种方式互换以便消除字母″M″和″N″之间的不明确性。在这个示例中,QWERTY配置已被稍微修改,但是通过使用具有本发明数据输入系统的所述键区,可以增加识别准确性。可以理解的是:任何其它字母布局和修改可以被考虑。
如图所示,本发明的QWERTY键区可以包括诸如标点字符、数字、功能键等等之类的其它符号。它们可以通过使用如本申请以及本发明人提出的早先申请中描述的发明的数据输入系统来被输入。
必须指出:具有QWERTY(或任何其它)布局的字母表的字母可以被分配到按键数量较低的任何键盘的按键上。所述键盘可以与本发明的数据输入系统结合与使用。可以理解的是:为了更好的准确性,可以修改任何标准布局。
六个按键上的QWERTY布局
根据本发明的一个实施例,本发明的数据输入系统可以使用一个键盘/键区,其中,具有一个QWERTY布局的字母表的字母被分配给所述键盘/键区的六个按键。显然,单词/单词一部分也可以按照本发明数据输入系统的原理被分配给所述按键。
正如已知的那样,字母表的字母按照被称为QWERTY的配置顺序被排列在PC机键盘的三行按键的按键上。图45示出了一个QWERTY键盘4500,其中,字母A到Z被排列在所述键盘的三行按键4507、4508、4509上。通常,用户使用其双手手指用于在所述键盘上(触摸)键入。例如,用户通过使用他的左手手指键入如所述键盘4500的左侧4501上所示的字母按键,并且用户例如通过使用他的右手手指键入位于所述键盘4500的右侧4502上的字母按键。按照这些原理,可以认为一个QWERTY键盘的字母按键按照两列4501-4502乘三行4507、4508、4509的表格来排列。
根据本发明的一个实施例,一个较小键盘的一组六个按键(例如3乘2)可用来在它们上面复制一台PC键盘的所述QWERTY布局并且以本发明的数据输入系统来使用。图45a作为一个示例,示出了优选地被排列在三行4517-4519和两列4511-4512中用于在它们上面复制所述QWERTY布局的六个按键。作为一个示例,左上方按键4513包含字母″QWERT″,对应于位于图45的QWERTY键盘4500的上面一行4507的左侧按键4501上的字母。六个按键的所述组的其它按键遵循相同的原理,并且包含位于所述PC机键盘的相应行和侧的按键上的相应字母。
QWERTY键盘用户通常清楚了解每个字母的位置。一种运动反射允许他在QWERTY键盘上快速键入。在此如上所述在六个按键上复制一个QWERTY布局允许用户在按键数量较少的键盘上触摸键入(快速键入)。所述用户例如可以使用双手拇指(左拇指用于左列,右拇指用于右列)用于数据输入。这看上去像在允许快速数据输入的PC机键盘的键盘输入。
可以理解的是:在该示例中描述的键盘的左侧和右侧字符定义仅仅作为示例被示出。所述定义可以按照用户的习惯重新考虑。例如,字母″G″可以被认为属于右侧而非左侧。
根据本发明的一个实施例,具有包含以QWERTY布局分配(如上所述)到所述按键的字母表字母的至少六个按键的一个键区,可以与利用本发明的逐字符/逐单词的至少一部分的数据输入系统一同使用。除了已经描述的优点之外,所述布局还包括其它益处,比如:
-位于相同按键上的字母通常可通过本发明的语音/话音识别系统区别,
-数据输入的高准确度、字母键数量非常少、以及所述字母在所述键区上非常熟悉的布局(例如QWERTY)向用户允许了一种快速数据输入系统而不需要频繁看着键区或者看着相应设备的显示单元。
为了更好的准确度,可以考虑对这种布局的修改。例如,图45b示出一个具有以如前所述的QWERTY字母布局的至少六个按键的键区4520,其中,字母″Z”4521和″M″4522已经互换以便分开字母″M”4522和字母″N”4523。可以理解的是,这只是一个示例,其它形式的修改也可以被考虑。
必须指出,如上所述分配到数量很少的按键上的QWERTY布局只是作为示例被示出并描述。其它的(任何语言中的)字母表字母配置,可以被分配到任何形状键盘(例如任何键区)上按照任何按键布局形式排列的任意数量的按键上,并且以本发明的按压并说话的数据输入系统来使用。同时,可以理解的是,诸如标点符号、数字、功能键等等之类的其它符号可以被分布在所述按键或者键区的其它按键之中,包括所述字母按键或者所述键区的其它按键,并且按照这个申请以及本发明人之前提出的申请中所述的本发明的数据输入系统而被输入。
根据本发明的一个实施例,数量较少的按键可用来包含字母表的字母(以及如前所述的其它符号),并用本发明的按压并说话的数据输入系统而被使用。图45c作为一个示例示出了四个按键4530-4533,英文字母表字符被分配到它们之上。为了保持这种布局的熟悉,图45b的键区4520的上面两行的字母的QWERTY布局被保持,并且以这样一种方式把图45b的所述键区4520的最下面一行的字母分布在所述四个按键4530-4533的相应栏的按键内(例如左,右),以便保持″几乎是QWERTY″的键盘的熟悉度以及本发明的语音识别系统的高准确度。例如,已经位于图45b的键区4520的最右下边按键上的字母″n”4537和″m″4538,在这儿被分开并分别被分配给键区4530的右边按键4533和4532。可以理解的是,诸如标点符号、数字、功能键等等之类的其它符号可以被分布在所述按键或者键区的其它按键之中,并且按照这个申请以及本发明人之前提出的申请中所述的本发明的数据输入系统而被输入。
同时,可以理解的是,只要不影响识别准确度,可使用甚至更少的按键来包含所有的字母表字符,并且用本发明的按压并说话的数据输入系统而被使用。图45d示出了英文字母表的字母被分配到的(例如一个键区的)两个按键4541-4542。所述键区可以用本发明的按压并说话的数据输入系统来使用,但是在相同的按键上具有发音基本上相似的字母,可能引起不明确性。
理论上,所有的字母表字母都可以被分配给单个按键,但是这可能极大地降低了识别准确性。
虽然,按下一个按键并说出分配到所述按键的期望符号对于所述符号的输入可能已经足够,但是由于诸如不期望说出某些符号之类的某些原因,诸如本申请中以及早先申请中所述的关于本发明的数据输入系统的方法之类的一些方法可以被提供。正如所述的那样,一个符号可以通过按下一个按键而不说出所述符号来输入。例如,通过参见图45c,用户可以按下按键4530而不说出来提供空格符。根据另一方法,可以通过按下第一按键,保持所述按键被按压并同时按下第二按键来输入一个符号。根据另一方法,通过在松开对应于一个符号的按键之前按下一个预定义按键(例如对应于一个特殊字符),可以在诸如字母之类的一个符号后提供诸如空格符之类的所述特殊字符。
当只有很少的按键用于数据输入时,为了更快的数据输入,诸如空格符之类频繁使用的不用说出的符号的输入可以被分配给一个预定义按键的双按动作而不必说出。这可能很有效,因为如果空格符被分配给诸如单压一个按钮之类的一个模式(其中在所述模式中其它诸如字母之类要说出的字符被指定给所述按钮),在输入一个被说出的字符之后,(为了不混淆语音/话音识别系统)用户必须在按下用于输入所述空格符的按键(同时不讲话)之前暂停一个很短的时间。把空格符分配给一个按键的双按模式解决了那个问题,其中不用说出的符号被分配给对所述按键的一个双按动作。不是暂停并按下所述按键一次,用户只双按所述按键而不必所述暂停。正如前面提到的那样,另一解决方案是把说出和不说出的符号分配给不同的按键,但是这可能需要更多的按键。
同时,可以理解的是,如上所述,字母在一组按键上的QWERTY配置作为一个示例被提供。其它诸如字母顺序之类的符号配置、其它数目的按键或者任意按键布局可以被考虑。例如,根据本发明的一个实施例,一个键区可以包含用于分配最常使用的字母的两个按键,并且它可以有另外两个按键,在其上分配较不频繁使用的字母。
当今,允许数据输入的大部分电子设备装备有电话类型的键区。如前所述字母表字母的配置和分配可以用电话类型的键区的按键上。
图46a作为一个示例示出了一个电话类型的键区4600,其中具有QWERTY配置的字母表字母被分配(例如如前所述)给所述键区的两个邻接栏4601、4602的六个按键。由于处于相邻的栏中,通过单手(的拇指)输入这些字母变得更容易。正如前面提到的那样,为了快速的数据输入,用户可以使用他的两个拇指(例如左拇指用于左列,右拇指用于右列)。可以理解的是:诸如标点符号、数字、功能键等等之类的其它符号可以被分布在所述键区的按键之中,并且如本应用以及本发明人之前提出的申请中所述的本发明的数据输入系统来输入。
图46b示出了另一电话类型的键区4610,其中具有QWERTY配置的字母表字母被分配(例如如前所述)给所述键区的两个外部列4611、4612的六个按键。由于处于两个外面的列中,通过两只手(的拇指)输入这些字母变得更容易。同样正如前面提到的那样,用户可以使用一只手用于数据输入。在这个示例中,应用了较小的改动增强了本发明的语音/话音识别系统的准确性。例如,字母″m″和″k″在相应的按键4613、4614上已经互换,以避免字母″m″和″n″之间的不明确性。同样,字母″f″和″z″在相应的按键上已经互换以避免字母″f″和″s″之间的不明确性。可以理解的是,配置中的其它改变都可以被考虑。为了更快的数据输入,诸如空格符之类的某些字符可以被分配到好几个按键4615、4616。
图46c示出了另一电话类型的键区4620,其中,基于前述原理并如图45c所示的字母表字母布局被分配给所述键区的四个按键。
可以理解的是,字母在诸如键区之类的一个键盘的少数(例如6、4、2等等)按键上的QWERTY配置作为示例被描述。诸如字母顺序之类的其它种类的字母布局也可以被考虑,并被分配到诸如2/3/4/5/6个按键等等之类的少数按键上。
很显然地,诸如本发明的逐字符的数据输入和/或单词/单词一部分的数据输入系统之类的本发明的所有数据输入系统(以及它们相应的应用)可以使用刚刚所述的上述键区(例如具有比如4到6个按键之类的少数按键)。
个人移动计算机/电信设备
移动设备必须很小以提供简便的便携性。一个理想的需要数据(例如文本)输入和/或数据通信的移动设备,必须有小型的数据输入单元(例如最多只有很少的按键)和一个大的(例如宽的)显示器。
字母表字母(以及其它符号)在少数按键上的布局以及通过所述少数按键由本发明的数据输入系统提供的快速又准确的完整数据输入的性能,可以允许重新考虑某些当前产品的设计以使它们更加有效率。
那些产品之一是移动电话,其现在被用于诸如文本信息和互联网之类的任务,并且预测将变成一个移动计算设备。实际的移动电话设计与上述原理相反。这是因为移动电话的(复杂的)数据输入系统需要使用许多按键,使用电话的主要表面、提供很慢的数据输入并且剩下一个很小的区域给小(例如窄)显示单元。
计算机最通常使用的应用之一是文字处理过程。随着互联网的使用,写信也将变成移动计算机/通信设备最常使用的应用。优选地,所述应用需要一个宽显示器来允许在其完整宽度下起草、编排格式以及查看文档。例如,在编辑一封信件时,用户必须在其整个宽度中查看所述文档,而不必被迫滚动它到左边或右边。
根据本发明的一个实施例,可以提供诸如移动计算/通信设备之类的一个电子设备,其包括宽显示器和快速数据输入性能的小数据输入单元。图47a示出了具有两行按键4701、4702的移动计算/通信设备4700,其中字母表字母(例如优选地,如前所述具有QWERTY布局)被分配给它们。诸如数字、标点符号、功能键等等之类的其它符号也可以被分配给所述按键(或其它按键),如前所述。所述通信设备的所述按键可以与本发明的按压并说话的数据输入系统结合,来提供一个完整的快速数据输入。使用少数按键(例如只有两行)用于数据输入,允许在所述设备内部集成一个宽显示器4703。所述移动设备(并且很显然,所述显示单元)的宽度可以大致是一张A4纸的宽度来提供一个几乎实际尺寸(例如宽度)的文档用于查看。所述移动计算/通信设备还可以具有诸如按钮4704、4705之类的其它按钮用于诸如向上/向下、向左/向右滚动文档、在所述显示器4703内定位光标4706之类的功能、发送/结束功能等等。所述设备还可以包括一个例如在其背面或任何其它侧内的鼠标(例如点击设备)。在本发明人提出的好几个专利申请(比如″触笔计算机″和″增强数据输入的特征部件″)中,已经描述了在显示器上的鼠标/浏览问题以及其它数据输入增强手段。所述申请的所有所述问题/特征都可以在它们之间进行合并和/或与本发明的数据输入系统和数据通信设备结合。
对于图47a的继续说明,在所述通信设备4700的左边和右边的两行4701、4702中的按键布局允许用户用他的两只手进行拇指键入,而同时拿着所述设备4700。可以理解的是,在所述设备上的其它按键布局上的字母和其它符号的其它配置可以被考虑。例如,设备可以只包括排列在仅仅一行中的少数按键,其中所述符号(例如字母)被分配给它们。
同样正如前面提到以及在相应的专利申请中描述的那样,通过在所述设备的背面提供一个鼠标(未示出),其中所述鼠标的按键(组)优选地位于所述电子设备的相反侧(例如前侧)中,用户例如可以使用他的食指操作所述鼠标,而同时用他的拇指按下一个相关按钮。
同样正如所提及的,所述设备可以作为电话被使用。它可以包括至少一个麦克风4707和至少一个扬声器4708。所述麦克风和所述扬声器在所述设备上的位置之间的距离可以对应于用户的嘴和耳朵之间的距离。
图47b作为一个示例,示出了一个与图47的设备类似的设备4710,其中,其输入单元包括分两行4711、4712排列的仅仅四个按键,其中字母表字母和通用数字(generally numbers)按照已经描述的原理被分配给所述按键。其它符号与功能(未示出)也可以按照已经描述的原理被分配给所述按键和/或其它按键。用户可以使用他的两个拇指4713、4714用于键入。
图47c作为一个示例,示出了一个与图47b的设备类似的设备4720,其中,其输入单元包括排列在位于所述电子设备一侧之上的两行4721、4722中的仅仅四个按键,其中字母表字母和通用数字按照已经描述的原理被分配给所述按键。其它符号与功能(未示出)也可以按照已经描述的原理被分配给所述按键和/或其它按键。用户可以使用一只手(或两只手)用于数据输入。点4723可以被提供于所述四个按键布局的中心,来允许数据输入而不必看着键区。
图47d作为一个示例,示出了一个与图47c的设备类似的设备4730,在其中:其输入单元包括排列在位于所述电子设备一侧之上的两行4731、4732中的仅仅四个按键,其中字母表字母和通用数字按照已经描述的原理被分配给所述按键。重复所述开头两行按键之一(在这个示例中是4731)的第三行按键4733被放在所述电子设备4730的相反一侧。这种按键布局允许用户按照他的选择用一只或两只手输入数据。其它符号与功能(未示出)也可以按照已经描述的原理被分配给所述按键和/或其它按键。
图47e作为一个示例,示出了按照本申请中所述的原理设计的电子设备4740,其类似于在前实施例,差别在于:在这里,可以在所述电子设备内部提供一个可展开/可收回/可折叠的显示器4741,来在需要时以获得一个大的显示器。例如,通过使用有机发光二极管(OLED)显示器,所述电子设备可以装备有一个单页式可扩展显示器。可以理解的是:所述显示器可以扩展为如期望的那么多。例如,所述显示单元可以多次展开以提供一个大的显示器。它也可以是一个滚动/打开的显示单元以便被扩展为如期望的那么多。可以理解的是:本发明的所述数据输入系统的按键可以是在所述电子设备的所述显示单元的一个表面内实现的软按键。
根据本发明的一个实施例,如图47f所示,诸如前述一个之类的电子设备4750可以包括集成在它内部的一个打印单元(未示出)。虽然所述设备可以具有任何宽度,但是优选地,所述电子设备的设计(例如在这个示例中,具有大约一张A4纸的宽度)可以如此以使一个例如使用A4纸的打印/扫描/复印单元可以被集成到所述设备内部。例如,用户可以送入一张A4纸4751以打印一页面。
提供一个完整的移动计算/通信设备解决方案可能在许多情形下都非常有用。例如,用户可以编辑诸如信件之类的文档并立即打印。同时例如,售货员可以编辑诸如客户约定中的发货单之类的一个文档并打印它用于立即递送。
为了允许降低所述移动计算/通信设备的尺寸以及仍然能够打印诸如A4纸之类的标准尺寸的纸张,一个对应于所述标准尺寸纸张一半大小的设备可以被提供。
图47g示出了诸如A4纸之类的一个标准空白文档4760。如图47h所示,所述纸张可以在其中间处折叠,提供两个半表面4761、4762。如图47i所示,所述折叠的文档4771可以被馈送到诸如本发明的移动计算/通信设备之类的电子设备4770的打印单元中来在其两个半表面4761、4762上打印诸如已编辑信件之类的一个文档的页面,提供一个标准尺寸打印的信件。这将允许制造一个打印标准尺寸文档的小型移动电子设备。
圆形键盘
根据本发明的一个实施例,键区的至少一部分按键可以以特定方式被放在所述键区上从而创建一个圆形模式。图48作为一个示例,示出了一个键区4800,它包括围绕居中按键4807放置的六个按键4801-4806。所述居中按键4807物理上可能与所述其它六个按键不同。例如,所述按键4807可以比其它按键大,或者它可以在其表面上有一个点。例如具有QWERTY配置的字母表字母可以被分布在所述按键之中。空格符可以被分配到位于中心的按键4807上。当然,所述按键也可以包括如本申请以及之前的申请中早先描述的并被本发明的数据输入系统使用的诸如数字、标点符号、功能等等之类的其它符号。在键区上的这种按键布局(例如圆形)的优点是:通过触摸识别所述居中的按键来识别它,则用户可在所述按键上键入而不必看着所述键区。
一个腕式通信设备
本发明的数据输入系统可以允许创造具有完整快速数据输入性能的小型电子设备。具有前景的未来电信设备之一是腕式通信设备。已经提供了许多努力来创造一种可使用的腕式通信/管理器设备。此类设备的主要问题是可使用的相对快速的数据输入系统。一些生产商已经提供了使用语音/话音识别技术用于数据输入的腕式电话原型。当然,此类设备的硬件和软件局限性提供了较差的数据输入结果。如本申请和本发明人之前提出的那些申请中所述的与少数按键的使用相结合的本发明的数据输入系统可以解决这个问题并允许在很小的设备上的快速数据输入。图49作为一个示例,示出了一个包括少数按键(例如在这个示例中,安排在两行4901、4902中的四个按键)的腕式电子设备4900,在其中诸如字母表字母、数字、标点符号、等等之类的符号按照本发明数据输入系统的原理被分配给所述按键。所述电子设备还包括使用至少所述按键的本发明的一个数据输入系统。所述按键可以是与移动电话的规则按键相似的任何类别,或者是触摸感应的等等。触摸感应按键可以允许用一只手的两个手指4903、4904触摸键入。也可以提供一个显示单元4905用于查看输入的数据、接收的数据等等。还可以组合一个手表单元4906到所述腕式设备,所述腕式设备还可以包括诸如发送/结束之类的功能4907、4908之类的其它按钮。必须指出:为了更快的数据输入,用户可以从他的手腕上取下该腕式设备并使用两个手指的拇指,每个拇指用于按压一行按键上的按键。可以理解的是:其它数量的按键(例如如前所述6个按键)和其它按键布局(例如前述的圆形按键布局)都可以被考虑。
同样可以理解的是:其它种类的腕式通信/管理器设备的设计可以被考虑。例如,如图49a所示,一个翻盖部分4911可以被提供给腕式设备4910。所述设备4910例如可以包括用于数据输入的大部分按键4913,而所述翻盖4911可以包括显示单元4912(或者反之亦然)。如图49b所示,在所述翻盖的另外一边,可以安装手表单元的显示单元4921。在闭合位置,所述腕式设备可以类似于并被使用为手表。
可以理解的是:在此所示出并描述的腕式设备只是作为示例被示出。其它类型的具有本发明按压并说话的数据输入系统的需要使用仅仅少数按键的腕式设备可以被考虑。例如,如图50a所示,包括本发明数据输入系统的使用少数按键5003的腕式通信设备5000可以与手表单元5002的手镯5001分开连结或者与之集成在一起。图50b示出了类似于图50a的腕式设备5000的一个腕式设备5010,其区别在于:在这里,显示单元5011和数据输入按键5012分开并分别位于翻盖5013和设备主体5014上(或者反之)。应当指出:所述按键和所述手表单元可以围绕用户的手腕按照相对的关系而被设置。
正如所提及的,本发明的数据输入系统可以被集成到具有少数按键的设备内。PDA是通常使用手写体识别系统或小型化虚拟QWERTY键盘的电子管理器,在其中:两个方法都有数据输入程序慢且令人沮丧的主要缺点。通常,大部分PDA设备包含至少四个按键。本发明的数据输入系统可以根据前述的原理使用所述按键来为PDA设备提供一个快速且准确的数据输入。诸如平板PC机之类的其它设备也可以使用本发明的数据输入系统。同时,例如根据所提及的另一方法,诸如图49a中所示的那些按键之类的少数较大的虚拟(例如软)按键(例如4、5、6、8等等)可以被指明在诸如PDA、平板PC机等等之类的电子设备的显示设备上并用本发明的数据输入系统来使用。作为一个示例,按键在诸如平板PC机的显示单元之类的大显示器上的布局和配置可以与如图47a-47d所示的那些相类似。
数据输入的移动-跟踪
把诸如字母表字母、数字、标点符号、功能等等之类的一组符号划分在几个子组中、并利用本发明的按压并说话的系统使用它们,这可以允许不使用按钮按压动作,而通过最终用诸如识别他的移动之类的其它用户行为识别系统替代它。所述移动可以是用户的手指、眼睛、脸等等的移动。这对于运动能力有限的用户来说或者在需要多个分离的数据输入系统的环境中可能极有益。例如,不是使用四个按键,诸如一个或多个手指或者他的眼睛之类的用户身体组成部分的四个移动方向可以被考虑。
根据本发明的一个实施例,并且通过参见图45c并且考虑作为一个示例,数据输入系统的符号被排列在四个区域上,用户可以把他的眼睛(或者在脸跟踪系统的情况下是他的脸,或者在手指跟踪系统的情况下是他的手指)移动到右上侧并说″Y″用于输入所述字母。不说话的相同的移动例如可以被分配给标点符号″.″4535。为了输入字母″s″,用户可以把他的眼睛移向左下侧并说″S″。通过使用用户的仅仅很少清楚/容易识别的移动分配给与诸如说出一个期望符号之类的(本发明的数据输入系统的)一个特征相结合的少数符号子组,则本发明的数据输入系统将提供快速且准确的数据输入而不需要硬件操作(例如按钮)。正如所提及的,在本实施例中,用户身体组成部分的一个预定义移动可以代替其它实施例中一个按键的按压。本发明数据输入系统程序的其余部分可以保持不变。
可以理解的是:如早先申请中所述那样,不采用按键,诸如感应键区或用户手指之类的其它对象可以用于把所述符号子组分配给它们。例如,为了输入一个期望的符号,用户可以在桌子上敲击他的手指(所述符号被分配的那个手指)并说出分配给所述手指和所述移动的所述字母。同时,不是识别用户的声音(例如语音声音),可以使用诸如唇读系统之类的其它用户行为和/或行为识别系统。
本发明的单词的至少一部分级别(例如音节级别)的数据输入的主要问题之一是:如果存在一个外部噪音并且该单词的所述部分的语音以一个元音结束时,则该系统可能会错误识别所述话音,并提供一个通常对应于期望部分开始但是以辅音结尾的输出,例如,如果用户说″mo″(同时按压对应于字母″m″的按键)则系统可以提供诸如″mall″的一个输出。为了消除这个问题,对于本发明的数据输入系统可以应用某些方法。
根据本发明的一个实施例,正如先前建议的那样,以元音发音结尾的单词/单词一部分可以与具有相似开始发音但是以辅音结尾的单词/单词一部分归组在一起。在所述单词/部分被输入之后,词典比较和短语结构将判断什么是要被输入的期望部分。例如,被分配给一个相同按键的单词/单词一部分″mo″和″mall″也可以被归组在相同的一个类别中,这意味着当在所述情况的每种情况下用户按下所述按键并且或者还说″mo″或者″mall″时,该系统考虑两个音素组的相应的字符组。这是因为这里应该认为所述两个音素组″mo″和″mall″的发音(特别在有噪声的环境中)基本上类似并且可能被语音识别系统错误识别。
根据本发明的一个实施例,其中字母表的字母例如被排列在键区的两行按键上的一个键区至少可以被用于本发明的单词的至少一部分级别(例如音节级别)的数据输入系统。
图51作为一个示例示出了一个键区5100,在其中:字母表的字母被排列在两行按键5101和5102上。所述布局把具有相近发音114-25的字母/音素放在不同的按键上。所述布局还令人回想起了一个有某些改动的QWERTY布局。在这个示例中,中间的行不包含字母字符。如早先所述的本发明的“单词的至少一部分级别”(例如音节级别)的数据输入系统的各种方法可以使用所述所述类型的键区或者如先前图中所示具有少数按键的那些键区之类的其它键区,这些图例如有图45a到45d。
如早先所述,根据本发明的一个实施例,如果一个单词/单词一部分以元音结束,则用户可以按下所述键区中与所述单词/单词一部分的开始音素/字母相对应的一个按键并说出所述单词/单词一部分,用于输入。如果必要的话,为了提供关于所述部分的更多信息,用户可以按下与构成所述部分的至少一部分字母对应的辅助按键。例如,如果所述单词/单词一部分以辅音音素结束,则用户可以按下与所述辅音对应的一个辅助按键。
为了允许系统区分一个与单词/单词一部分的开始字母/音素对应的按键按压以及一个与单词/单词一部分的最后一个字母/音素对应的按键按压,可以提供诸如以下所述的各种方法。
根据本发明的一个实施例,当用户按下对应于一个单词/单词一部分的开始音素/字母的第一按键并说出时,他可以保持按下的所述按键,并且按下对应于所述单词/单词一部分的另一字母(优选地,最后一个辅音)的至少一个辅助按键。
如果所述另一字母位于相同的开始按键上,则用户可以双按所述按键同时说出所述单词/单词一部分。
图51a示出了一个键区5110,在其中:字母表的字符(用大写字母示出)被排列在它的两行按键5111、5112上。包含所述字母表字符的每个所述按键还包含被分配给同一行的相对按键的字母表字符(用小写字母示出)。根据本发明的一个实施例,当用户尝试输入一个单词/单词一部分时,他按下对应于用大写字母印出的(例如在所述按键上用大写字母印出的)所述单词/单词一部分的开始字符/音素的按键并说出所述单词/单词一部分。如果所述用户期望提供诸如按压与所述单词/单词一部分的辅助字母对应的一个按键之类的更多信息(当保持按压所述第一按键时),则所述用户可以按下位于与所述单词/单词一部分的所述辅助字母(例如在所述相对列的一个按键上用大写字母或小写字母印刷的)对应的相对列上的一个按键。例如,如果用户期望输入单词″fund″,则他首先按下按键5113并说出所述单词,并且(同时保持所述按键5113被按下)所述用户例如连续按下与辅音″n″和″d″对应的两个辅助按键5114和5115。
图51b示出了与图51a的键区类似的一个键区5120,其差别在于:在这里,两列5121和5122被分配给对应于一个单词/单词一部分的开始音素/字母的字母/音素,并且通过按压对应于不同于所述单词/单词一部分的开始字母之外的至少一个字母的至少一个按键,一个辅助列5123被用来提供关于所述单词/单词一部分的更多信息。这可以允许只使用一只手来进行数据输入。例如,如果用户期望输入单词″fund″,则他首先按下按键5124并说出所述单词,并且(在松开所述按键5124之后)所述用户例如连续按下与辅音″n″和″d″对应的两个辅助按键5125和5126。
根据本发明的另一实施例,如上所述,需要话音(用于输入它们)的符号可以被分配给第一预定义数量的对象/按键,并且不需要语音就输入的符号可以与所述第一预定义数量按键相分开地被分配给另一预定义数量的按键。
根据本发明的另一实施例,如果提供字母的按键只包括被说出的符号,那么用户可以按压对应于所述单词/单词一部分的第一个字母/音素的一个按键,并且优选地,同时说出所述单词/单词一部分。然后,他可以按下对应于构成所述单词/单词一部分的一个或多个辅助字母的辅助按键而不必说话。该系统认出不带语音的按键按压对应于关于所述单词/单词一部分的一个或多个辅助字母的附加信息。例如,通过参见图51并且考虑只有说出了的符号被分配到那里的提供字母的所述键区的按键,如果用户期望输入单词″fund″,则他首先按下对应于字母″f″的按键同时说″fund″,并且在松开所述按键之后,所述用户例如连续按下对应于字母″n″和″d″的两个辅助按键而不必说话。
正如前面提到的那样,本发明的单词/单词一部分的数据输入系统还可以起作用而不需要把组合的选定字符组与单词/单词一部分词典进行比较的步骤。用户可以按部分输入一个单词,并且使它们被直接输入。正如提及的那样,这对于以各种语言输入一个单词/单词一部分是有用的,而不用担心它是否存在于单词/单词一部分的词典中。诸如模式按键之类的一种装置可用来通知系统组合的字符组将被组合的字符组输入/输出而不需要所述比较。如果一个以上组合的字符组已产生,则它们可以被呈递给用户(例如在显示器中打印的一个列表中)并且用户例如可以通过按压″选择″键来挑选他们中之一。在另一个实施例中,如果一个以上组合的字符组已经产生,则具有最高优先权的一个组合字符组例如可以通过进行到下一单词/单词一部分、标点符号、诸如″enter″之类的功能的输入等等而自动被输入。
同时,根据在本申请中早先描述的所述原理,可以通过按部分输入一个单词同时带/不带与单词词典的比较步骤就输入该单词。同样如前所述,所述部分可以是一个字符或者一个单词的一组字符(一个宏)。
根据本发明的一个实施例,除字母表的字母之外,逐字符的本发明数据输入系统可以使用有限数量、频繁使用的单词的一部分(例如″tion″、″ing″、″sion″、″ment″、″ship″、″ed″等等)和/或有限数量、频繁使用的单词(例如″the″、″and″、″will″等等)来提供一种需要少量存储器并且处理更快的快速准确的数据输入系统。所述有限数量的单词/单词一部分可以根据如本申请以及之前提出的那些申请中所述的本发明数据输入系统的原理,来被分配给键区相应的(与之相互作用的)按键。同样,很显然,符号可以根据如本申请以及之前提出的申请中所述的本发明数据输入系统的原理来被输入。例如根据本实施例,用户可以按照四个部分″p″、″o″、″r″、和″tion″来输入单词″portion″。为此,例如通过使用图45c的键区,所述用户可以首先说″p″并按下(优选地,几乎同时地)相应的按键4533。他然后可以说″o″并按下(优选地,几乎同时地)相应的按键4533。然后所述用户可以说″r″并按下(优选地,几乎同时地)相应的按键4530。最后,他可以说″shen″(例如单词的一部分″tion″的发音)并按下(优选地,几乎同时地)单词部分″tion″被分配到其上的按键4530(例如对应于字母″t″,单词的一部分″tion″的第一个字母)。
正如前面提到的那样,本发明的实施例可以使用输入单词与如本申请中前面所述的单词词典的单词的比较步骤来处理,或者不使用。在不使用所述比较步骤的情况下,数据可以按部分被输入/输出。
正如所提及的那样,本发明的实施例对于本发明的数据输入系统集成到内存大小和处理器速度都有限的小型设备(例如腕式安装的电子设备、蜂窝电话机)内部是有益的。除了(或者代替)频繁使用的单词/单词一部分的所述列表之外,用户还可以把他优选的单词/单词一部分加到所述列表中。
如前所述,本发明的数据输入系统可以使用少数按键用于完整的数据输入。可以理解的是:不用所述少数按键,而是可以提供一个具有不同预定义部分的多模/多部分的按钮,在其中:每个部分不同地响应用户在所述多模/多部分按钮的所述不同预定义部分的每一个上的动作/接触,并且其中如本发明中所述的字符/音素组/字符组可以用所述预定义部分被分配给所述动作/接触。图52作为一个示例示,出了多模式/多部分按钮5200(例如与使用于许多电子游戏、蜂窝电话机、电视遥控器等等之中的多模式按钮相似),在其中:所述按钮的五个部分5201-5205每个部分都不同地响应用户在所述部分上的手指动作(例如按压)/接触。作为一个示例,不同的字母数字字符和标点符号可以被分配给所述部分的四个5201-5204,而空格符可以被分配给居中部分5205。可以理解的是:所述按钮5200可以有不同的形状,比如椭圆形,并且可以有不同数量的部分,在其中:不同的符号配置可以被分配给所述部分的每一个。
如前所述并且如图47a到47i中作为示例所示出的那样,可以提供一个诸如移动计算/通信设备之类包括一个宽显示器和小数据输入单元的电子设备,其具有本发明数据输入系统的快速数据输入性能。同时正如前面提到的那样,所述电子设备可以包括辅助的按钮。图53示出了一个电子设备5300,它包括用于输入文字和相应功能的按键5302、5303(在这个示例中是双向按键)以及用于输入诸如拨叫电话号码(例如不说出所述数字)、在显示器内定位、发送/接收一个呼叫等等之类的其它功能的一排按钮5304、5305。如本发明中所述,至少用于文本输入的一组符号可以被分配给按压诸如按键5302-5303之类的一个双向按键的每一侧。一个双向按键可以相当于两个分开的按键。操纵一个双向按键可能比操纵两个分开的按键更容易。在这个实施例的示例中,用户可以通过使用他两只手的拇指5306、5307来输入数据。
正如在本专利申请以及本发明人提出的早先申请的不同段落中提及的那样,可以理解的是:诸如虚拟(软)按键之类的其它种类的按键可以利用本发明的数据输入系统来被使用。同时,在本专利申请以及本发明人提出的早先申请中所述的至少一部分附加数据输入特征可以被集成在本发明的计算机/通信设备内部。例如,在所述设备背面内的一个可扩展(例如可拆卸的)麦克风/摄像头/天线5301和一个鼠标(未示出)(例如通过用户的食指操纵的)可以被实现,其中,如前所述,它的相应按键在所述计算机/通信设备的前面或任何其它侧面上。
正如前面提到的那样,对于一次完整的数据输入可用的部分/所有符号可以被分配到少数按键,并且利用本发明的数据输入系统而被使用来提供一种完整的快速简单的数据输入。所述少数按键可以是键区的部分按键。图54示出了PC机键盘对少数按键5400的符号分配的另一示例。在这个示例中,在显示器上用于光标导航的箭头(例如在一个文本中)可以被分配给一个说话模式。例如,用户可以单按按键5401并说″左″来把(例如在显示器上印好的一个文本中)光标左移一个字符。为了把光标左移好几个字符,所述用户可以按下按键5401同时说″左″并保持所述按键被按下。光标可以一直左移直到用户松开所述按键5401。为了右移所述光标,用户例如可以按下按键5402同时说″右″,并且使用刚刚描述的程序。通过按压相应的按键并说出对应的单词,则类似的程序可以被用于在一个文本中上下移动光标。
根据本发明的一个实施例,在几个方向(诸如左、右、上和下)上移动光标可以被分配到至少一个按键。继续参考图54,作为一个示例,在不同方向上移动光标可以被分配到单个按键5403。例如,用户可以按下按键5403并说″左″来向左移动所述光标。为了向右、向上或向下移动光标,所述用户可以分别按下按键5403并说″右″、″上″或″下″。
可以理解的是:在这个示例中,按键数目(对于一个完整的数据输入可用的部分/所有符号可以分配到其上)只是作为一个示例被示出。所述按键数量可以根据诸如电子设备的设计之类的需要而有所不同。
根据本发明的一个实施例,具有很少按键的本发明的键区/数据输入单元可以包括一些附加特征,比如麦克风、扬声器、摄像头等等。所述键区可以是连接到相应电子设备上的一个独立的单元。所述独立键区可以允许集成一个基本上覆盖所述电子设备整个侧面的显示单元。图55a示出了具有至少几个按键(或者对应于所述几个按键的至少一个多向按键)5501、5507、5508、5509的本发明的一个独立键区5500,其中对于一个完整数据输入可用的部分/所有符号可以被分配给这些按键用于数据(例如文本)输入。所述键区还可以包括诸如麦克风5502、扬声器5505、摄像头5503等等之类的附加特征。所述附加特征可以被集成在所述键区内或者被附到所述键区上/与之连接等等。如图55b所示,所述键区5500(通过它的侧视图示出)还可以包括附属装置5504以便把所述键区附到诸如用户手指/手腕之类的另一物体上。所述键区可以被连接(无线或通过有线)到一个相应的电子设备。图55c示出了按照刚刚描述的原理的一个独立键区5510。正如前面提到的那样,通过使用与本发明的数据输入系统结合的少数按键用于一个完整的数据输入,在一个短时间的练习之后,用户可以通过所述几个按键输入诸如文本之类的完整数据而不必看着所述按键。基于这个原理,用户可以在他的手(例如手掌)中握住所述键区5510,把它放到靠近他的嘴边(通过把他的手举起靠近他的嘴),并按照本发明数据输入系统的原理按下期望的按键同时不说出/说出那些符号(例如字符、字母、单词/单词一部分、对应于所述按键按下的功能)而不必看着按键。正如所提及的那样,所述键区可以无线或有线连接到一个相应的电子设备。在这个示例中键区通过一条线路55 12连接到相应的设备(未示出)。同样在这个示例中,麦克风5513附装到所述线路5512上。在手的(例如手掌)中握住所述键区5510靠近到嘴边用于数据输入有如下许多优点:
-用户不必戴着头戴式麦克风
-所述用户可以非常靠近麦克风说话从而他可以分离地说话
-用户的手掌心可以加强用户的声音便于麦克风的更好接收
-用户手的(例如手掌)基本上消除了在说话时的外部噪声
-用户手的(例如手掌)防止用户的声音被扩散(例如不打扰别人)。
可以理解的是:本发明的独立键区/输入输入单元也可以包括在本申请以及本发明人提出的早先申请中描述的部分/所有特征。例如,所述独立键区/数据输入单元例如可以包括与本发明的唇读系统一起使用的摄像头。它还可以包括一个基于本发明的齿列识别系统(denturerecognition system)的装置。所述键区还可以包括诸如电池、把所述键区连接到一个相应设备的无线装置之类的其它特征部件。还可以为所述键区实现一个天线。在有线连接的情况下,所述线路还可以包括键区的天线系统和/或相应的电子设备。
根据本发明的一个实施例,如图55d所示,本发明的独立键区5520可以被使用作为一条项链/吊链。这实现了本发明的键区/数据输入单元的简单且分立的便携性和使用性。
根据本发明的一个实施例,如图55e所示,本发明的独立键区5530可以被附装到诸如PDA/平板PC的显示器之类的触摸感应显示器的笔上或者与这个笔集成在一起。这实现了本发明的键区/数据输入单元的简单且分立的便携性和使用性。
根据本发明的一个实施例,如图55f所示,具有很少按键的本发明的键区可以是一个多部分的键区5540(如闭合位置所示)。这将允许更加缩小所述键区的尺寸,允许提供一个尺寸非常小的键区,通过此键区可以提供一个完整的数据输入。一个多部分键区已经被本发明人发明出来并已经申请专利申请。在所述申请中描述的一些/所有描述和特征都可以被应用于具有少量按键的本发明的多部分键区。
根据本发明的一个实施例,如图55g所示,按键5550数量很少的本发明的键区/数据输入单元可以包括在所述键区的背面(或者其它侧面)内的一个点击单元(例如鼠标)。所述点击单元可以是诸如衬垫类型5551或者球形(未示出)之类的任何类型。所述点击单元的按键可以是可位于所述数据输入单元前侧上的单元。位于诸如数据输入单元背面之类的一个侧面中的一个点击(例如鼠标)单元已经被本发明人发明出来并相应地已经申请专利申请。在所述申请中描述的一些/所有描述和特征都可以被应用于具有少量按键的本发明的多部分键区。例如,所述键区的至少一个按键也可以起作用为位于所述键区背面的所述点击单元的按键(组)。
图55h示出了本发明的数据输入设备5560,其具有包括很少按键5565-5568的一个数据输入单元5561。所述设备还有一个点击(例如鼠标单元与所述数据输入单元结合工作用于完整的数据输入以及数据的操作。所述设备及其在一个表面上的移动可能与一个传统的电脑鼠标设备相似。所述集成设备可以无线或通过线路5562连接到诸如计算机之类的一个相应的电子仪器上。如图55i所示,一个点击(例如鼠标)单元5569可以位于诸如所述的所述数据输入单元5561(未在这里示出,位于所述设备的另一面)的背面之类的一面中。所述点击(例如鼠标)单元5569可以是轨迹球类型的鼠标。用户可以操纵/运行使用与本发明数据输入系统结合的所述集成数据输入设备5560的一台计算机,替代传统的PC键盘和鼠标。鼠标按键可以是诸如5563、6664(参见图55h)之类的传统按键,或者它们的功能可以被分配到所述数据输入单元5561的所述几个按键(在本示例中是5565-5568)。
根据本发明的一个实施例,正如本专利申请以及本发明人提出的早先专利申请中提及的那样,本发明的数据输入系统可以与单词预测软件结合。例如,用户可以通过使用本发明的数据输入系统(例如说出对应于至少一个字符的单词的一部分)同时按压相应的键(组)来输入一个单词的至少一个开始字符,并继续按下对应于所述单词其余部分的按键而不必说出它们。所述单词的开始字母的精确输入(由于本发明准确的数据输入系统)以及对应于所述单词剩余字母的按键的按压(不说话),可允许一个准确的数据输入系统同时允许较少话音。可以理解的是:在本实施例中,优选地,除了字母之外的符号可以被分配给分开的按键或者分配给与同一按键分离的相互作用。
根据本发明的一个实施例,具有很少的按键的本发明的键区/数据输入单元可以与诸如蜂窝电话之类的电子设备的传统的耳机(earbud)连结或集成。图55j示出了用户使用的一个传统的耳机5570。耳蕾耳机可以包括扬声器5571、麦克风5572和本发明的键区/数据输入单元5573(在本示例中是多部分键区),可以理解的是:本发明的键区/数据输入单元可以与一个相应的电子设备一起使用,用于输入按键按压同时一个分离的头戴麦克风被用于输入用户的相应话音。
与本发明数据输入系统结合的扫动(sweeping)程序
正如前面提到的那样,本发明的数据输入系统可以使用任何种类的物体,比如很少的几个按键、一个或多个多模(例如多向)按键、一个或多个感应垫、用户的手指等等。同样正如所提及的那样,诸如所述按键之类的所述物体可以是任何种类,比如传统的移动电话类型的按键、触摸感应按键、对它们上面的两级或更多级别压力响应的按键(例如触摸级别以及更大压力级别)、软键、与光学识别结合的虚拟按键等等。
正如前面提到的那样,当根据本发明的数据输入系统输入一个单词的一部分时,为了更好的识别,除了提供对应于所述部分的第一个字符/音素的信息(例如按键按下并说话)之外,用户可以提供对应于诸如所述部分的最后一个字符(组)和/或中间字符(组)之类的更多字符的附加信息。
根据本发明的一个实施例,如图56所示,可以提供一个具有诸如区域/按键5601-5604之类的几个预定义区域/按键的触摸感应表面/垫5600,并且其利用本发明的数据输入系统进行工作。根据本发明的数据输入系统的一组符号可以被分配给所述区域/按键的每一个。这个实施例的目的是增强本发明的单词/单词一部分(例如包括按照字符)的数据/文本输入系统。根据本实施例,为了提供单个字符数据输入,用户例如可以单按/双按一个与话音结合或者未结合的相应区域/按键(如前所述,根据本发明的数据输入系统)。为了输入具有至少两个字符的单词/单词一部分同时说出所述单词/单词一部分,用户例如可以与所述单词/单词一部分的至少一个字母有关地在所述表面的区域/按键之一上扫过他的手指或笔。优选地,扫动程序可以从对应于所述单词/单词一部分的第一个字符的区域开始,并且优选地,在对应于所述单词/单词一部分的最后一个字符的区域结束,最终,(例如为了有助于识别更容易)越过对应于所述单词/单词一部分的一个或多个中间字符的区域。对应于所述单词/单词一部分的信息的输入可以在用户从所述表面/感应垫上移走(例如举起)所述手指(或所述物体)时结束。可以理解的是:用户的话音可以在所述相应的扫动动作结束之前结束,但是该系统可以考虑所述整个相应的扫动动作。
根据本发明的另一实施例,为了在说出它的同时输入一个单词/单词一部分,用户可以在对应于要被输入的所述单词/单词一部分的所有字母的区域/按键(如果更多,那么由同一区域/按键表示一个连续的字符,相应地,在所述同一区域/按键上在几个不同方向上扫动)上扫动他的手指头。例如参考图56a,为了输入单词/单词一部分″for″同时说出它,用户例如可以在分别对应于字母″f″、″o″和″r″的区域/按键5612、5614和5611上扫动他的手指或者笔(多向箭头5615所示)。然后用户可以从所述表面(例如感应垫)抬起他的手指,通知系统结束对应于所述单词/单词一部分的信息的输入。
根据本发明的另一实施例,对于更快速的交互作用,为了输入一个单词,用户可以在对应于要被输入的所述单词/单词一部分的某些字母的区域上扫动他的手指。例如参考图56b,为了输入单词/单词一部分″for″同时说出它,用户例如可以在从区域5622(例如对应于字母″f″)开始并终止于区域5621(例如对应于字母″r″)的区域5622、5621上扫动他的手指或笔,而不必越过对应于字母″o″的区域5624。
在感应垫上的扫动程序优于传统非感应按键(例如传统电话键区的按键)的按下/松开动作的优点是:当使用该扫动程序时,用户可以只是在在对应于一个单词/单词一部分的好几个字母的区域/按键上完成扫动之后才从所述感应表面抬起他的手指。即使用户在相应的扫过动作结束之前结束所述部分的话音,系统考虑整个相应的扫过动作(例如从用户第一次触摸所述表面的第一个区域/按键的时间直到用户从所述表面抬起他的手指的时间为止)。触摸/扫过并从所述表面上抬起手指还可以通知系统一次相应的话音的起始点和终点(例如所述话音优选地大致在所述时限内)。
总之,根据本发明的一个实施例,响应所述交互作用,与具有预定义数量区域/按键的一个表面的扫过交互作用的轨迹(例如对应于具有至少两个字符的单词)可以包括如下点(例如轨迹点),其中所述点的每一个对应于所述单词/单词一部分的一个字母:
1)起始点,对应于一个单词/单词一部分的第一个字符
2)扫过方向改变点(例如非必要的,对于只有两个字符的单词不存在该点),通常对应于所述单词/单词一部分的中间字符
3)结束点,对应于所述单词/单词一部分的一个附加字符(优选地,最后一个)(优选地,可发音的)第271页。
图57作为一个示例示出了在具有四个区域/按键5701-5704的一个表面5700上对应于单词″bring″的一个扫过动作的轨迹5705。起始点5706通知系统:所述单词的第一个字母位于区域/按键5703上。对应于扫过动作中的方向变化和结尾的其它三个点/角度5707-5709通知系统:所述单词包括由分配到区域5701、5704和5702的字符之一表示的至少三个字母。优选地,在所述单词(例如在这个示例中是″bring″)中所述字母的顺序对应于所述轨迹点的顺序。可以理解的是:对应于方向变化的所述角度可以不用那么强调而可以具有诸如弧形的之类的形式。图57a作为一个示例示出了对应于单词″time″的一个扫过轨迹(由具有弧形角度5715的箭头5714示出)。在这个示例中,已经根据字母″t″(例如由按键/区域5711呈现)、″i″(例如由按键/区域5712呈现)和″m″(例如由按键/区域5713呈现)来提供了扫过动作。可以理解的是:用户说出所述单词(例如在这个示例中是″time″)同时扫过。
本发明的敲击/按压和/或扫过数据输入系统将显著减少一个字母以及以所述字母开始并具有类似发音的单词之间的不明确性。基于刚刚所述的原理,例如为了输入字母″b″和单词/单词一部分″be″以及″bee″,可以考虑如下程序:
-为了输入字母″b″,如图58a所示,用户像平常一样可以单按/单触(不扫过)一个对应于字母″b″的感应区域/按键(例如这个示例中的区域/按键5801)同时发所述字母的音。
-为了输入单词/单词一部分″be″,如图58b所示以及如前所述,在发所述单词/单词一部分的发音的同时,用户可以在从对应于字母″b″的区域5811开始并越过/结束于对应于字母″e″的区域5812的感应表面5810上扫过。箭头5813显示了相应的扫过路径/轨迹。
-为了输入单词/单词一部分″bee″,如图58c所示以及如前所述,在发所述单词/单词一部分的发音的同时,用户可以在感应表面5820上扫过:从对应于字母″b″的区域5821开始并越过/拖过对应于(例如第一个)字母″e″的区域5822并在对应于(例如第二)字母″e″的同一区域5822上改变扫过方向。在相同的区域/按键上具有两个轨迹点(例如在这个示例中是中间点和结束点)可以通知系统所述单词/单词一部分的至少两个字母位于/被分配给所述区域/按键,并且在所述单词/单词一部分中位于对应于前一区域/按键的字母之后。箭头5823显示了相应的扫过路径。
必须指出:如图所示,扫过方向中的每个变化可以对应于一个单词中的一个附加的相应字母。在从一个区域扫过到另一区域的同时,用户可以通过他未打算的一个区域。如果或者例如所述区域上的扫过轨迹不重要(例如参见图58c的区域/按键5825中的扫过路径5824),和/或在所述区域中已经没有角度(例如没有方向变化)等等,则系统可以不必考虑所述通过。同样为了减少和/或消除混淆性,可以考虑诸如区域5826之类的一个穿越(例如中立)区域。
正如前面提到的那样,本发明的逐字符数据输入系统和本发明的逐单词/单词一部分的数据输入系统可以被合并。同时,本发明的扫过和按压实施例可以被合并。例如,为了书写一个单词比如″stop″,用户可以分两个部分″s″和″top″输入它。为了输入字母″s″,用户可以(单)触/按对应于字母″s″的区域/按键同时发所述字母的音。然后,为了输入″top″部分,在发所述部分音的同时,用户例如可以根据所述本发明的扫过程序的原理在相应的区域/按键上扫过(例如拖动)他的手指。
为了减少或消除与感应表面的一个区域/按键的意外接触的不明确性,除了触摸感应特征之外,一个诸如按击/更重压力系统(click/heavierpressure system)(比如装备有传统移动电话键区按键的系统)之类的另一特征可以被提供给每个区域/按键。在这种情况下,例如为了输入单个符号(例如根据本发明的逐字符数据输入系统),用户不是轻微触摸,而是可能更用力按下一个相应的区域/按键以便输入所述符号。为了继续本发明的逐单词/单词一部分的数据输入系统,用户例如可以通过在相应的区域/按键上稍微扫过(例如使用轻微的压力)他的手指来使用如前所述的扫过程序。
如果一个单词/单词一部分包含在单个区域/按键上代表的字母,则在说出所述单词/单词一部分的同时,用户例如可以在几个连续的不同方向中在所述区域/按键上扫过他的手指(例如至少一个方向,并且最多相当于构成所述单词/单词一部分的字母数目(n)减一的方向数(例如n-1个方向))。例如,为了输入单词″you″,如图59a所示,除了说出所述单词之外,用户可以在区域/按键5901上扫过他的手指一次(例如优选地,在一个笔直的/几乎笔直的方向5902上)以便通知系统,所述单词/单词一部分的至少两个字母被分配给所述区域/按键(根据本发明的一个实施例,输入单个字符通过在所述区域/按键上敲击来表示)。为了通过向系统提供更多信息来输入同一单词,如图59b所示,所述用户例如可以在对应于所述一个单词/单词一部分的至少三个字母(例如,在这个示例中,构成单词″you″的所有字母)的区域/按键5911上在两个连续的不同方向5912、5913(例如两个笔直的/几乎笔直的方向)中扫过他的手指,而不必把他的手指从所述区域/按键(例如在这个示例中,提供三个轨迹点:1个开始点、1个中间点、一个结束点)中移走(抬起)。
正如所提及的那样,为了输入一个单词/单词一部分,用户可以说出所述单词/单词一部分并且在表示单词/单词一部分的相应符号(例如字母)的至少一部分区域/按键上扫过一个对象,比如他的手指。根据本发明的一个实施例,优选地,用户可以在表示所述单词/单词一部分的第一个字母、至少一个中间字母(例如如果存在任何中间字母)以及最后一个字母上扫过。优选地,被认为要被扫过的最后一个字母可以是对应于一个单词/单词一部分中的最后一个可发音音素的最后一个字母。例如,单词″write″中要被扫过的最后一个字母可以被认为是字母″t″(例如可发音的)而非字母″e″(例如在这个示例中,字母″e″不被发音)。可以理解的是:如果期望的话,用户可以根据两个字母″t″和″e″来扫过。
根据另一示例,用户可以根据一个单词/单词一部分的第一个字母和所述单词/单词一部分的至少一个剩余辅音。例如,为了输入单词″force″,用户可以根据字母″f″、″r″和″c″来扫过。
为了分至少两个部分输入一个单词,根据本发明的一个实施例,用户首先根据第一个部分在区域/按键上扫过(例如通过使用他的手指)同时说出所述部分。他然后可以从感应表面抬起(例如移走)他的手指,以便通知系统所述(例如在这个示例中是第一)部分的输入已经结束。用户然后继续根据同一原理输入下一部分(等等)。在该单词结束时,用户可以提供一个诸如按下/触摸一个空格键之类的动作。
为了分至少两个部分输入一个单词,根据本发明的另一实施例,用户首先根据第一部分在区域/按键上扫过(例如通过使用他的手指)同时说出它。他然后(不必从感应表面抬起/移走他的手指)继续根据同一原理输入下一部分(等等)。在该单词结束时,用户可以从感应表面抬起(例如移走)他的手指,以便通知系统所述整个单词的输入已经结束。然后用户可以提供一个诸如按下/触摸一个空格键之类的动作。在本实施例中,正如所述的那样,从书写表面抬起手指可以对应于一个完整单词输入的结束。相应地,可以在所述单词之前或之后自动提供一个空格符。
可以理解的是,优选地,扫过区域/按键的顺序以及(如果必要的话)在所述区域/按键内的不同方向可以对应于在相应单词/单词一部分中相应字母的位置顺序(例如从左至右,从右至左、从上到下等等)。例如,在以英文输入一个单词/单词一部分的同时,用户可以在对应于和/或根据在所述单词/单词一部分中从左至右设置的字母的区域/按键上扫过。在另一示例中,在例如以阿拉伯语或希伯来文输入一个单词/单词一部分的时候,用户可以在对应于和/或根据在所述单词/单词一部分中从右到左设置的字母的区域/按键上扫过。正如之前提及和示范的那样,可以理解的是:用户或者可以根据/对应于所述单词/单词一部分的所有字母、或者根据/对应于所述单词/单词一部分的某些字母扫过区域(和方向)。
正如前面提到的那样,在本专利申请以及本发明人之前提出的专利申请中描述的部分或全部系统、方法、特征等等可以被合并来提供不同的实施例/产品。例如,在逐部分输入一个单词(例如通过使用本发明的扫过数据输入)之后,如前所述,对于一个部分的每个输入,可以通过该系统选择一个以上相关的字母链。在这种情况下,如前所述,不同组合的所述选择可以被提供并与单词词典的单词相比较。如果所述组合对应于所述词典中的一个以上单词,那么它们可以从最常用单词到最不常用单词开始按照它们的使用频率而被呈递给用户。这个问题先前已经详细描述。
本发明的自动空格程序也可以被应用到使用本发明扫过方法的数据输入系统。
如前所述,不同的自动空格程序可以被考虑并与本发明的数据输入系统结合。根据本发明的一个实施例(如前所述),每个单词/单词一部分可以具有诸如在下面所述之类的特殊的空格特性:
-单词的一部分可以是(优选地,缺省时)与前一单词/单词一部分连结的一类(示例″ing″、″ment″、″tion″等等),
-单词/单词一部分可以是与前一单词/单词一部分连结并且还可能需要下一单词/单词一部分与它连结的一类(例如单词″information″中的″ma″)
-单词的一部分可以是一个独立有意义的单词,其可以不必那样与前一单词/单词一部分连结。缺省时,可以在所述单词之前或之后自动提供一个空格符,除非用户或该短语语境需要它与所述前一/下一单词/单词一部分连结(例如″for″、″less″)。
-诸如字母、数字、标点符号之类的单个字符可以被认为(例如缺省时)自动地与前一/下一单词/单词一部分连结,除非另有决定。
根据本发明的一个实施例,基于本发明的逐字符数据输入系统,诸如字母之类的单个字符的输入可以被分配给按下/敲击触摸感应表面的一个相应区域/按键(结合/未结合话音),并且单词/单词一部分的输入可以被分配给说出所述单词/单词一部分同时在所述单词的开始字符被分配的一个区域/按键上提供单向扫过动作(例如几乎笔直的方向)。例如,为了输入字母″z″,在发所述字母的音时,用户可以按下/触摸(不扫过)所述字母″z″所被分配的一个按键。为了输入单词/单词一部分″zoo″,在发所述单词/单词一部分的发音时,用户可以扫过所述字母″z″(例如对应于单词″zoo″的开始字母)所被分配的一个区域/按键。这可以允许系统很容易理解用户的意图是一个字符输入程序还是一个单词/单词一部分输入程序。
正如所述的和/或示出的那样,本发明的数据输入系统基于在本发明人提出的专利申请中所述的原理可以提供许多实施例。基于所述原理并且根据本发明的不同实施例,例如,具有不同数量按键的不同键区、和/或不同的按键映射(例如在键区上不同的符号布局)可以被考虑。一个电子设备可以包括一个以上的所述实施例,其可能需要所述不同键区和/或不同按键映射中的一些。为了允许在相同的电子设备内提供所述键区和/或按键映射,可以提供物理和/或虚拟键区和/或按键映射。
根据本发明的一个实施例,根据本发明一个当前实施例,在一个电子设备上的不同键区和/或按键映射可以自动地被提供在所述电子设备的显示单元上。用户例如根据需要或者他的偏爱,可以从存在于所述电子设备内的一组不同实施例中选择一个实施例。为此,诸如模式(例如)之类的一种工具可以被提供于所述电子设备内,其可以被所述用户用于选择所述实施例之一并因此选择一个相应的键区和/或按键映射。
根据另一实施例,例如,不是使用电子设备的显示单元用于显示键区和/或按键映射,所述设备的键区按键(例如,如果所述电子设备是电话,其键区按键)可用来在所述键区的至少一些按键上显示不同按键映射。为此目的,所述键区的所述按键可以包括可电子修正的印刷键帽(例如按键表面)。
根据另一实施例并且参见前一实施例,不是使用具有可电子修改的印刷键帽的键区,根据相应数据输入实施例的不同硬度的按键映射可以被提供并利用所述电子设备被传送。图60作为一个示例,示出了移动电话的一个可换的(例如前)外壳6000,其具有对应于一个物理键帽(通常由移动电话生产商用橡胶材料制成)的许多空孔(例如孔6001)。利用所述移动电话和可换外壳,还可以提供对应于本发明相关实施例的不同的可替换硬(例如物理)按键映射(例如按键映射6011-6013之类的)。在选择数据输入系统的一个期望实施例之后,用户可以手动替换所述外壳(和所述电话)内部的一个相应的按键映射。
可以理解的是:不使用具有不同预定义区域的单个垫,可以提供对应于所述每个区域的触摸和/或按下感应按键等等。同时,用户的手指可用来把所述符号组和所述扫过移动分配给与触摸感应表面(组)或者本申请和之前提出的申请中所述的任何其它手指识别系统(比如光扫描)相结合的所述手指。必须指出:例如,诸如两级压力之类的任何种类的技术和交互作用可以被使用代替本发明的扫过数据输入方法,来提供相同的结果。同样,诸如按键之类的任何种类和数量的对象可以被使用。这些内容已经在本专利申请以及本发明人提出的早先专利申请中被描述。
根据本发明的一个实施例,代替很少按键以及所述按键的操作方式,它们的符号和配置(例如在各种申请中描述的那样)可以被分配给其它对象,比如用户的少数手指以及所述手指的用户操作之类的。所述用户的所述手指可以代替一个键区的按键,并且所述手指的所述移动可以代替诸如单按和/或双按、扫过程序等等之类的各种模式。所述手指和所述手指的所述操作可以与诸如声音和/或唇移之类的用户行为一起使用。用于识别所述对象的各种识别系统(例如手指、手指的各个部分、指纹识别系统、扫描系统、光学系统等等)和用于识别所述行为的各种识别系统(例如,声音和/或唇识别系统)可用来提供如前所述的本发明的各种实施例并且可以稍后被描述。
根据本发明的一个实施例以及通过参见使用四个按键用于数据输入的系统实施例,代替四个按键,用户的四个手指可用来分配那些原先被分配给所述按键的符号。同样,例如,一个诸如光学识别系统和/或感应表面之类的工具可以被用于识别所述手指的交互作用/移动。例如为了输入字母″to″,用户可以在一个表面上敲击(例如单叩)字母″t″所被分配的他的手指之一同时发所述字母的音。仍然基于本发明的数据输入系统,诸如语音识别系统之类的一个附加的识别装置可以被用于识别用户的话音并帮助系统提供一个准确的输出。
用于单词/单词部分的数据输入的多向按钮或轨迹球的使用
不是使用按下与本发明的扫过程序相结合的、具有少数预定义区域/按键的感应表面/垫来输入单词/单词一部分,可以对于本发明的数据输入系统,提供诸如轨迹球或者具有少数(例如四个)预定义按压区域/按键的一个多向按钮之类的其它装置。此类系统的原理可能类似于对所述扫过程序所描述的系统以及本发明的其它数据输入系统。
根据本发明的一个实施例,对于本发明的数据输入系统可以使用一个具有旋转移动的轨迹球,它可以指向围绕所述轨迹球的一组预定义的点/区域,并且其中:对于所述预定义点/区域的每一个,根据本发明的数据输入系统,一组符号可以被分配。正如所提及的那样,所述系统的原理可能类似于对使用具有少数预定义的区域/按键的触摸感应表面/垫的扫过程序所描述的那些系统。两种系统之间的区别在于:在这里,轨迹球代替所述触摸感应表面/垫,并且所述轨迹球向所述预定义点/区域的旋转移动代替在所述触摸感应表面/垫的所述预定义区域/按键上的扫过/按压动作。如前所述的在具有少数预定义区域/按键的触摸感应表面/垫上使用扫除程序的本发明的数据输入系统的全部描述,可以被应用到使用所述轨迹球的所述数据输入系统上。图61a作为示例,示出了一个轨迹球系统6100,它可以向四个预定义区域6101-6104旋转,其中:根据如本申请以及本发明人提出的早先申请中所述的本发明的各种数据输入系统,向所述每个区域可以分配诸如字母数字混合编制的字符、单词、单词的一部分等等,并且利用与本发明的说话/不说话的数据输入系统相结合的按压/扫过原理而被使用。为了与所述轨迹球更好的相互作用,所述区域和分配给它们的所述符号可以被显示在一个显示单元上,并且所述轨迹球可以操纵所述显示单元和所述区域上的一个光标。根据另一方法,在每次使用前后,所述轨迹球可以放在一个预定义位置中,所述轨迹球的中心可以由一个点记号6105标记。为了输入一个符号,用户可以一开始把他的手指(例如拇指)放在所述点上,并且在根据被输入的符号的(一个或多个)方向上开始移动。
继续参考当前实施例,如图61b所示,例如为了输入单词/单词一部分″ram″,用户可以向对应于字符″r″、″a″和″m″的区域6111、6112和6113转动轨迹球6110,并且优选地,同时说出该单词/单词一部分″ram″。
根据本发明的另一实施例,利用本发明的数据输入系统可以使用一个多向按钮,所述多向按钮具有少数(例如四个)预定义按压区域/按键,并且在其中,根据本发明的数据输入系统向所述区域/按键的每一个分配一组符号。所述多向按钮可以提供两类信息给本发明的数据输入系统。第一种信息对应于所述按钮上的按压动作,而第二种信息对应于在其中应用所述按压动作的所述按钮的按键/区域。用户可以压住对应于所述符号(例如的第一字符)的所述按钮单个区域/按键,并说出/不说出所述符号,或者,他可以压住对应于所述符号的第一字符的所述按钮的一个区域/按键,并在所述按钮的不同区域/按键上扫过他的手指(例如,如扫过实施例所述,当所述符号包括一个以上字符时,用于提供关于构成所述符号的字符的更多信息)同时继续保持所述按键处于被按压位置,且优选地,同时说出所述符号。在所述符号的输入程序结束时,用户可以松开在所述按键上的连续按压动作。正如所提及的那样,本发明这个实施例的原理可能类似于对使用具有少数预定义的区域/按键的触摸感应表面/垫的扫过程序所描述的那些系统。两种系统之间的区别在于:在这里,多向按钮代替所述触摸感应表面/垫,并且在所述多向按钮的所述预定义区域/按键上的单按/连续按压动作代替在所述触摸感应表面/垫的所述预定义区域/按键上的扫过/按压动作。如前所述当前的在具有少数预定义区域/按键的触摸感应表面/垫上使用扫除程序的本发明的数据输入系统的全部描述,可以被应用到使用所述多向按钮的本发明的当前数据输入系统上。图61c作为一个示例,示出了如在此所述的一个多向按钮6120,其中:所述按钮包括四个预定义区域/按键6121-6124,其中:根据本发明的各种数据输入系统(如本申请和本发明人提出的早先申请中所述的那样)向所述区域/按键的每一个可以分配诸如字母数字混合编制的字符、单词、单词的一部分等等之类的一个预定义符号组,并利用本发明的按下并讲话数据输入系统的原理来被使用。
具有多用户接口的计算/通信设备
根据本发明的一个实施例,诸如在本申请中早先所述以及作为示例在图47a-47i之类的多个附图中示出的设备之类的一个计算通信设备,可以包括位于它一侧中的至少用于拨叫电话号码的一个键区。所述键区可以是一个标准电话类型的键区。图62a示出了包括如前所述的本发明使用几个按键(在这里,分两行6201-6202排列)的数据/文本输入系统的一个移动通信设备6200,和一个相关显示单元6203。为了分开地拨号码,位于所述设备另一侧的一个电话类型的键区可以被考虑。图62b示出了所述设备6200的背面,在其中一个电话类型的键区6211被集成在所述设备的所述背面内。用户例如可以使用键区6211依照惯例拨号码,或者提供诸如选择菜单之类的其它电话功能。也可以在所述侧面提供诸如发送/结束按键6212-6213之类的电话功能按键。与所述数据/文本输入系统的显示单元分开布局的一个显示单元6214也可以被提供在这个侧面,以便显示出诸如拨号码或接收号码之类的电话操作。在所述设备内实现的与本发明的数据/文本输入系统相关的点击设备6215(如前所述)也可以被集成在这个侧面。如先前在本专利申请以及本发明人提出的早先专利申请中所述,与所述点击设备有关的(点击)按键(组)可以位于另一侧,比如与所述点击设备有关的所述电子设备相对的那一侧。
装备有手写数据输入系统的计算/通信设备
根据本发明的一个实施例,除了本发明的数据输入系统之外,本发明的一个计算和/或通信设备可以包括用于至少拨电话号码的手写识别系统。所述手写系统可以是这样一种类别,例如一个基于在书写表面上识别设备书写提示的声音/振动的手写系统。这个内容已经在2001年12月26日申请的题为″触控笔计算机″的PCT申请中详细描述。基于手写识别系统的数据输入比较慢。另一方面,所述数据输入是不会混淆的。优选地,一个手写识别系统可以在包括本发明按下并说话的数据输入系统的设备中被用于简短的不混淆的输入工作。图63a示出了一个诸如早先在图47a-47i之类的几个附图中作为示例描述并示出的设备之类的计算与/或通信设备6300。在这个示例中,所述设备使用六个按键6301-6306,在其中,如前所述,可以向所述按键6302-6305的四个(在每个端的2个)分配至少一种语言的字母表的(同时最终数字的)字符。另外两个按键6301和6306可以包括诸如至少一些标点符号和/或功能(例如用于编辑一个文本)之类的其它符号。
如前所述,使用少数按键的本发明的数据输入系统是一个极其快速且准确的系统。在一些条件下,通常,当需要诸如拨电话号码之类的一个简短努力时,用户可能宁愿使用一个不连续的数据输入系统。通常,一个手写数据输入系统需要一个不很小的触摸感应表面(例如显示器/垫)。它还需要一支用于在所述表面上进行书写的笔。本发明人发明的手写数据输入和识别系统通常不需要所述感应表面和所述笔。它可以被实现于任何设备内部,并且在小尺寸的设备中不可被其它手写识别系统所替代。
继续参考图63a,本发明人发明的手写识别系统可以被实现于所述设备6300内部。为此目的,一个书写尖头6307例如可以被提供在所述设备的一端。诸如至少一个麦克风之类的所述手写识别系统需要的其它特征,可以被实现于所述设备6300内部。可以理解的是:诸如基于光传感器或使用加速测量仪的系统之类的其它手写识别系统可以利用所述设备而被使用。用户根据他/她自己便利,可以分开使用所述数据输入系统和/或彼此结合地使用所述数据输入系统。例如,所述用户可以通过只使用手写数据输入系统来拨号码。另一方面,所述用户可以通过使用本发明的按下并说话的数据输入系统书写文本。所述系统还可以在诸如书写一个文本的数据输入期间被组合。例如,在书写一个文本期间,用户可以通过使用本发明的按下并说话的数据输入系统,书写所述文本的一部分,然后切换手写数据输入系统(例如本发明人发明的使用书写声音/振动的所述手写系统)。用户可以通过在一个表面上用触控笔书写或者说话/不说话并按压相应按键来从一个数据输入系统切换到另一数据输入系统。
正如前面提到的那样,可以理解的是:对于基于本发明的按压并说话/不说话的数据输入系统的各个实施例,不同的按键布局以及分配给所述按键的不同符号配置可以被考虑。图63b作为一个示例,根据本发明的另一实施例示出了一个与图63a的设备6300相似的设备6310,其区别在于:在这里,本发明的数据输入系统可以使用在每一侧6311、6312的四个按键(在每一侧有一个辅助按键,在其中可以向所述辅助按键的每一个分配诸如标点符号字符和/或功能之类的一组符号)。拥有辅助按键可有助于在本发明的数据输入系统内考虑更多符号。它还可能通过把分配到其它按键的一些符号分配给所述辅助按键、导致分配较少符号给利用该系统使用的按键而有助于提供更好的输入准确性。
根据本发明的另一实施例,为了在本发明逐字符的数据输入系统和本发明逐单词/单词一部分的数据输入系统之间容易区分,字母表的字符可以被分配给一组按键,其中这组按键不同于单词/单词一部分所被分配到的另一组按键。这可以显著提高数据输入的准确性。图63c作为一个示例,示出了与图63b的设备6310相似的设备6320,它在每一侧具有两组四个按键(2×2)。在这个示例中,按键6321-6324因此可以对应于在所述按键上显示的字母表的字符,而按键6325-6328因此可以对应于以在所述按键上显示的字符开始的单词/单词一部分。例如,为了输入诸如字母″t″之类的单个字母,用户可以按下按键6321并说出所述字母。同时例如,为了输入单词的一部分″til″,用户可以按下按键6325并说出所述单词的一部分。
可以理解的是:正如先前所述并示出的那样,在它们的布局中的所述按键例如在一个或多个键区内部可以与所述电子装置分开放置,在其中:所述键区可以无线或通过有线连接到所述电子设备。同样正如在各种段落中提及的以及将被提及的那样,在本发明的任何实施例中,所述少数按键、它们在一个设备上的布局、符号对所述按键的所述分配以及与所述按键的相互作用、所述设备本身等等都只是作为示例示出。很显然,本领域技术人员可以考虑其它变型。
必须指出:如图63a-63c以及图47b-47d所示,根据本发明的一个实施例,本发明的数据输入系统可以具有触控笔的形状。同样,正如前面提到的那样,触控笔形状的计算机/通信设备及其特征已被发明出来并在2001年12月26日申请的标题为″触控笔计算机″的PCT申请中被描述。本发明的触控笔形状的设备可以包括所述″触控笔计算机”PCT专利申请的特征和应用中的一些或全部。例如,本发明的触控笔形状的设备可以是一个圆柱形状的设备,有一个显示单元覆盖其表面。同时,例如,本发明的触控笔形状的设备可以包括一个点击设备和一个类似于所述″触控笔计算机”PCT的手写识别系统。
根据本发明的一个实施例,本发明的触控笔形状的设备可以包括连结装置,例如通过把它连结到其衣物或其耳朵上来把所述设备连结到用户。图63d作为一个示例示出了诸如图63a的设备6300之类的电子设备的后部。如图所示,连结装置6331可以被提供于所述设备内部,用于例如将其连结到用户的口袋或用户的耳朵。同时,扬声器6332可以被提供于所述附加装置内部,用于接近于所述用户耳洞提供所述扬声器。同时,诸如本发明人建议的指向单元之类的点击单元6333可以被提供于所述设备内部。
继续参考当前实施例,如图63e所示,作为一个示例,所述设备6340还可以被连结到用户的耳朵,以便例如在所述用户走路或开车时允许免提会话。触控笔形状的所述设备6340以及所述麦克风6341和所述扬声器6342分别在所述设备及其连结装置6343内的位置,可以允许所述麦克风和所述扬声器分别接近用户的嘴和耳朵。可以理解的是:所述麦克风、扬声器或连结装置可以位于所述设备内的任何其它位置中。
包括显示单元的具有少数按键的本发明的独立数据输入单元
根据本发明的一个实施例,如图55a-55j所述并示出的那样,至少具有少数按键的本发明的独立数据输入单元,可以包括一个显示单元并被连接到相应电子设备。图64a作为一个示例,示出了基于早先所述的原理包括一个显示单元6401的独立数据输入单元6400。在所述单元内具有显示器的优点(特别当所述单元作为吊链被携带时)是:例如,用户可以把所述电子设备(例如移动电话)插入他的口袋中并使用所述数据输入用于经由所述设备输入/接收数据。通过连接到所述设备,用户可以通过在所述数据输入单元的显示单元上看见数据来看到他输入(例如一条发送SMS)或接收(例如一条传入SMS)的数据。可以理解的是:根据不同的系统,所述显示单元可以是任何种类,并且可以被布局在所述单元内。例如,如图64b所示,本发明的独立数据输入单元6410的显示单元6411可以被布局在所述数据输入单元的外壳6412的内侧面。可以理解的是:本发明的独立数据输入单元可以包括早先在相应的实施例中描述的一些或全部特征(例如嵌入式麦克风)。
如前所述,使用少数按键的本发明的数据输入系统可以被实现于诸如PDA或平板PC之类的任何设备内。图65a作为一个示例,示出了诸如平板PC设备之类的一个电子设备6500,它包括使用少数按键的本发明的数据输入系统。基于本发明的数据输入系统原理的按键布局与符号分配可能已经被提供于所述设备内。在这个示例中,所述平板PC6500可以包括四个按键6501-6504,至少一种语言的字母表的和最后数字字符可以被分配给这些按键。除了所述四个按键之外,所述设备可以包括诸如按键6505-6506之类的辅助按键,诸如至少标点符号与功能之类的符号例如可以被分配给这些按键。可以理解的是:不使用物理按键(例如6501-6506),虚拟(例如软)按键可以被定义在所述平板PC的显示设备上并利用数据输入系统来被使用。本发明的数据输入系统、按键布局以及符号对所述按键的分配早已被详细描述。提供于所述设备内的相同按键或者辅助按键可以结合例如被集成在所述设备后部的点击设备而被使用。这个内容早已在本发明人提出的不同专利申请中被详细描述。所述平板PC可以包括用于其它目的的其它按键6507,比如开/关功能等等。图65b作为一个示例示出了图65a的平板PC 6500的背面。如图所示,用于例如在数据输入期间稳定性更好,所述平板PC可以包括在用户输入数据时被用户使用的一个或多个手柄装置6511-6512。可以理解的是:所述处理可以是任何种类并且可以被放在所述设备内的任何位置(例如放在不同侧)。正如前面提到的那样,所述设备可以包括至少一个点击系统,其中:所述系统的至少一个指向单元6513可以位于所述设备的背面。如前所述,对应于所述指向的按键可以位于所述平板PC的前侧(在一个方便的位置)以便许可所述点击设备(如期望的那样用左手或右手)易于操作。根据一个设计,所述平板PC可以包括分别位于所述平板PC左右两侧的两个所述点击设备,并且所述点击设备的元件可以彼此结合工作。可以理解的是:诸如内置麦克风或分离式有线/无线麦克风之类的任何种类的麦克风可用来在数据输入期间感知用户的语音。这些问题先前已经详细描述。同样,本发明的独立数据输入单元可以利用所述电子设备被使用。
同时,使用少数按键的本发明的数据输入系统可以被使用于许多环境中,比如汽车、仿真或游戏环境中。根据本发明的一个实施例,所述系统的按键可以被放在交通工具(比如汽车)内。图65c示出了包括少数按键的一辆车的方向盘6520(在这个示例中,按键被排列在所述方向盘6520上的相对侧6521-6522上),方向盘6520利用本发明的数据输入系统而被使用。本发明的数据输入系统、按键布局以及符号对所述按键的分配早已被详细描述。如图所示,在这里,用户可以在开车时输入诸如文本之类的数据。为此目的,例如在开车期间,在用他的手握住所述方向盘6520的同时,司机可以通过按压所述按键并相应地说话/不说话来使用本发明的按压并说话的数据输入系统。可以理解的是:诸如内置麦克风或分离式有线/无线麦克风(比如蓝牙麦克风)之类的任何种类的麦克风可用来在数据输入期间感知用户的语音。同样,任何按键布局与对所述按键的符号分配可以被考虑在例如飞机之类的任何种类的交通工具内的任何位置中。
正如前面提到的那样,本发明的数据输入系统(总的来说,使用少数按键的本发明的数据输入系统)的显著优点,特别(例如在其中字母表的和最终数字的字符被分配给排列在两对相邻按键中的四个按键并且在其中用户可以把他的两个拇指每个放在所述按键对的每个上来按下一个所述按键),在于:用户可以提供快速准确的数据输入而不必(频繁)看着按键或者显示单元。
可以理解的是:在为了输入确认看着相应显示器不可能/不允许的环境(例如黑暗)和情形(例如开车时)中,一个通知系统可用来通知用户被输入的一个或多个最后的符号/短语。所述系统可以是文语转换TTS系统,其中在所述符号被本发明的数据输入系统识别时,系统说出所述符号。用户可以被要求例如通过不提供任何动作来确认所述识别的符号。同样,例如,如果被识别的符号是一个错误的符号,则用户可以提供一个预定义的动作,比如使用删除键清除所述符号。然后他可以重复所述符号的输入。
网络实现
正如在与本发明的数据输入系统有关的先前申请的专利申请中提及的那样,本发明的数据输入系统可以被实现在诸如包括连接到服务器/主机的客户终端在内的局域网系统之类的网络系统内。根据本发明的一个实施例,在所述网络系统中,所述终端通常可能是没有处理能力的小设备或者最多有有限处理能力的设备。相比之下,服务器计算机可能具有强大的处理能力。在这种情况下,服务器计算机可以通过所述网络系统的一个终端处理发送给它的信息。通过使用一个终端,用户可以按照本发明的数据输入系统的原理,把关于符号输入的信息(例如按键按下、语音)输到所述服务器。在处理所述信息并识别一个相应符号之后,服务器计算机可以把结果发送给所述终端的显示单元。可以理解的是:所述终端可以包括本发明的数据输入系统中用于输入并发送所述信息给所述服务器计算机所必须的全部特征(例如按键布局、分配给所述按键的符号、至少一个麦克风、一个摄像头等等)。图66作为一个示例,示出了连接到中央服务器/计算机6600的终端/数据输入单元6601-6606,在其中:不同数据输入单元/终端输入的不同数据/文本的部分结果在相应的显示器上被显示出来。
上述实施例可以被使用于许多环境中,比如飞机上。在目前的客机中,每个乘客座位包括一个具有有限数量按键的遥控器,它连接到通常安装在所述座位前面的一个显示单元上(例如通常位于前座的背面)。所述遥控器可以与一个内置或独立的麦克风结合,并且可以连接到所述飞机上的一个服务器/主机。不使用所述遥控器,其它个人计算或数据输入设备可以通过把它们与所述服务器/主机(例如经由安装在所述座位内的USB端口)连接在一起来被使用。正如所提及的那样,所述设备例如可以是本发明的数据输入单元、PDA、移动电话甚至笔记本等等。这可能会变成航空公司在航行期间向他们的乘客提供的最有吸引力的娱乐服务。乘客可以编辑信件、发送消息、使用互联网或者与所述飞机上的其它乘客聊天。一个类似的系统可以在团体或企业(例如连锁店的销售点)的网络系统内被实现,在其中基于本发明的数据输入系统包括必要特征(例如按键、麦克风)用于输入数据/文本的数据输入单元可以连接到一个服务器计算机而被使用。本发明的上述数据/文本输入系统允许通过通常没有处理能力或者处理能力有限的终端设备实现快速准确的数据输入系统。
使用少数按键的本发明的数据输入系统(例如包括四个按键,其中至少字母表的字符被分配给所述按键)在许多情况中可能很有用。正如前面提到的那样,不使用按键,基于本发明数据输入系统的原理,用户例如可以使用他的脸/头/眼的移动并且结合他的声音用于数据/文本输入。根据本发明的一个实施例,为此目的,不使用被分配给少数按键,在本申请和早先申请中描述的符号(例如至少基本上一种语言的全部字母表的字符)可以被分配给例如用户头部在例如四个方向(例如左、右、前、后)上的移动。符号配置分配可以与对于按键所描述的相同。例如,如果字母″Q″、″W″、″E″、″R″、″T″和″Y″被分配给用户头部向左的移动,为了输入字母″t″,用户可以向左移动他的头部并说″T″。同样的原理可以被分配给用户眼睛的移动(例如左、右、上、下)。通过参考上一个提及的示例,为了输入字母″T″,用户可以向左移动他的眼睛并说″T″。头、眼、脸等等的移动可以通过诸如提供在用户身体上的摄像头或传感器之类的装置来检测到。
上面提及的没有使用按键的实施例对于运动能力有限的人群的数据输入可能是很有用的。例如,盲人可以使用他/她头部的移动结合他的声音,并且不能使用他的手指按压按键的人可以使用他的眼睛/头部的移动结合他的声音。
根据本发明的另一实施例,正如前面提到的那样,不是分配符号给少数按键,所述符号可以被分配给用户手指的移动。作为一个示例,图67示出了用户的手6700,其中:基于向本发明的少数按键分配符号的配置原则,可以向所述用户手部的四个手指6701-6704(例如每只手上的两个手指)分配符号配置。例如,可以向手指6701的一个预定义移动或手势分配字母″Q″、″W″、″E″、″R″、″T″、和″Y″(或者以所述字母开始的单词/单词一部分)。作为一个示例,所述移动可以是向下移动所述手指。同样,例如为了输入字母″T″,用户可以向下移动手指6701,并且优选地,同时说″T″。可以理解的是:基于如本申请和之前提出的申请中所述的本发明的数据输入系统的原理,任何符号配置都可以被考虑并被分配给任意数量的用户手指上。
连续说明上述实施例,用于检测所述用户手指的移动/手势的许多系统可以被考虑。例如,用户手指的移动可以通过所述手指相对于另一手指的位置来检测。根据一个方法,如图67所示,传感器6705-6706(例如在这里是环状形式)可以被提供给手指6701-6702用于数据输入。根据一个实施例,基于所述相邻环6705-6706的摩擦,例如可以基于所述传感器感觉到的振动来识别用户手指的移动(例如,可以理解的是:所述环表面可以如此以使所述手指向下移动和向上移动的摩擦振动可能不同)。
根据另一方法,传感器6707、6708可以被安装在环形装置(或安装在用户手指上的其它装置)上,并且其中彼此相关的所述传感器的位置可以定义手指的移动。
可以理解的是:在这里所述的手指移动/手势检测装置只是作为示例被描述。诸如光学检测装置之类的其它检测装置可以被考虑。
单词类别
根据本发明的一个实施例,本发明的单词/单词一部分级别的数据输入系统可以被使用于诸如医学或司法环境之类的预定义环境中。在这种情况下,不是对于所述系统使用单词/单词一部分的大数据库,可以考虑与所述环境有关的单词/单词一部分的有限数据库。这将显著增加系统的准确性和速度。所述数据库之外的单词/单词一部分可以逐字符输入。
用于临时逐字符数据输入的模式按键
根据本发明的一个实施例,在合并了逐字符数据/文本输入和单词/单词一部分数据输入的本发明的数据输入系统中,一个预定义按键可用来通知系统:用户临时输入单个字符。例如,在文本输入期间,不按压所述预定义按键,用户可以按照本发明的单词/单词一部分的数据输入系统的原理输入一部分文本。在这种情况下,系统可以不必考虑分配给所述用户按下的按键的字母。系统可以只考虑分配给所述按键按压的单词/单词一部分。如果所述预定义按键被按下,同时与所述文本输入有关的其它按键按压,那么系统可以只考虑分配给所述按键按压的单个字母,并忽略分配给所述按键按压的单词/单词一部分的数据输入。
短语输入
根据本发明的另一实施例,正如前面提到的那样,本发明的数据输入系统可以包括短语级别的文本输入系统。例如,在输入整个短语之后,例如通过使用合并了本发明的逐字符数据/文本输入和/或单词/单词一部分数据输入系统的本发明的数据输入系统,系统可以分析所述短语的已识别单词,并且基于所述语言的语言学特性/模型和/或所述短语的语感,系统可以纠正、添加或替换所述短语的一些单词,以便提供一个无差错的短语。例如,如果用户输入短语″let′s meet atnoon″,而识别出的单词是″lets meet at noon″,通过分析所述短语,系统可以用单词″let′s″替换单词″lets″并且提供短语″let′s meet at noon″。这个实施例的优点是:因为本发明的数据输入系统是一个高度准确的系统,所以用户可以不必担心纠正在短语输入期间发生的个别错误。该系统可以自动纠正所述错误。可以理解的是:提供于一个短语末尾处的诸如″.″之类的一些符号或一个返回命令可以通知系统所述短语的结束点。
短语输入
根据本发明的一个实施例,分配给诸如按键之类的对象的一个符号可以表示一个短语。例如,一组单词(例如″Best regards″)可以被分配给一个按键(例如优选地,还是表示字母″b″的按键)。用户可以按下所述按键并提供诸如说出所述短语或所述短语一部分之类的一个语音(例如在这个示例中是说″best regards″),以便输入所述短语。
对于单个字符以及单词/单词一部分的各种模式
正如前面提到的那样,本发明的数据输入系统可以使用不同的模式(例如与诸如按键之类的一个对象的不同的相互作用),其中:可以向所述模式的每一个分配一个被分配给所述对象的预定义组的符号。同样正如所提及的那样,例如所述模式可以是按键上的一个短按/单按动作,按键上的一个长按动作、按键上的一个双按动作、用手指/眼睛的短/长/双手势等等。
根据本发明的一个实施例,单个字符、单词、单词的一部分、包括超过字符的短语等等可以被分配给不同的模式。例如,诸如字母之类的单个字符可以被分配给按键上的单按/短按动作,而包括至少两个字符的单词/单词一部分可以被分配给按键上的一个双按动作或长按动作(例如同一按键或另一按键),或者反之(例如,包括至少两个字符的单词/单词一部分可以被分配给另一按键上的一个单按动作。同样,例如,正如前面提到的那样,单词/单词一部分引起语音(例如声音,嘴唇)识别系统的不明确性可以被分配给按键上的一个双按动作。同时,不同的单个字符、单词等等可以被分配给一个按键上的轻按、重按或双按动作。同样例如,未对分配给与一个按键相互作用的一个模式的单个字母构成不明确性的单词/单词一部分可以被分配给与所述按键的相互作用的所述模式。不同的相互作用模式已经在本申请以及本发明人提出的早先专利申请中被描述。
可以理解的是:不同预定义时长/压力级别的按压可以被考虑来定义一种按压动作/模式。例如,在一个按键上的一个短时按压(例如等于0.20秒)动作可以被认为是一个短按压动作(第一组符号可以被分配给它),一个长时按压动作(例如大于0.20到0.40秒)可以被认为是一个长按压动作(第二组符号可以被分配给它),并且一个更长按压动作(例如大于0.40秒)可以被认为是重复程序(例如前述的)可以被分配给之的另一模式。例如,为了输入字母″a″,用户可以短按一个按键(其中:字母″a″被分配给所述按键以及与所述按键的所述相互作用)并且说″a″。他可以较长按下所述按键并说″a″,例如来获得单词/单词一部分″ai″(例如其中:单词/单词一部分″ai″被分配给所述按键以及与所述按键的所述相互作用)。用户可以按下所述按键并说″a″,并如需要时那样保持所述按键处于按下位置(例如仍然更长时间周期)以便反复地输入字母″a″。字母″a″将被重复直到用户松开(停止所述按键上的按压动作)所述按键。
正如前面提到的那样,包括一个空格符的单词(例如在所述单词前/后)可以与诸如按键之类的一个对象被分配给本发明的一个交互作用模式。根据本发明的一个实施例,与按键的所述交互作用模式可以是刚刚描述的所述按键的所述长/重按压动作。
正如前面提到的那样,对象、相互作用模式、字符组等等的任何组合可以被考虑,并与本发明的数据输入系统而被使用。
退格
删除已经输入的单词/单词一部分的一个退格程序前面已经在本申请中描述。根据不同的实施例,至少一种退格程序可以被分配给至少一个模式的相互作用。例如,可以提供一个退格键,在其中:通过按压所述按键,至少一个期望的发音、单词/单词一部分、短语等等可以被擦除。例如,在所述按键上的每个单按动作可以擦除一个输出,该输出与位于所述输出之后的一个光标之前的单个发音对应。例如,如果用户已经输入单词/单词一部分″call″和″ing″,根据一个程序,例如他可以通过单按所述按键一次来擦除上一次发音″ing″。在所述按键上的另一单按动作可以擦除对应于另一发音的输出″call″。根据预定义程序,例如,在所述按键上的一个单按/双按动作可以擦除整个单词″calling″。因此,基于本发明的退格程序的原理,很显然,许多预定义的擦除程序可以被本领域技术人员考虑。
小型化键盘
小型化键盘被小型/移动电子设备所使用。使用所述键盘的主要不便之处是:因为按键很小并且彼此靠近,因此用用户的手指按压一个按键可能引起错按所述按键。这就是为何在PDA中通常所述键盘都用一支笔来按压。本发明的数据输入系统可以消除所述缺点。本发明的数据输入系统可以使用PC机类型的小型化/虚拟键盘。通过对准(targeting)一个按键按压它,即使用户错按所述按键(例如按下了旁边一个按键),根据本发明的一个实施例并基于本发明的数据输入系统的原理,用户可以说出对应于所述按键的语音。如果用户的语音没有对应于被按下的按键,那么所述系统可以提出所述按键被错误按压。那么系统可以认为那是旁边的按键并将所述语音对应到所述按键之一。通过使用这个实施例,小型化键盘可以很容易地用正常的用户手指来使用,易化并加速通过那些键盘的数据输入。可以理解的是:基于本发明的数据输入系统原理的全部特征和系统可以被考虑并用这样的键盘来使用。例如,本发明的单词/单词一部分的数据输入系统还可以借此实施例而被使用。
同样,正如通过不同的实施例提及并显示的那样,本发明的数据输入系统的原理是通过把较小数量的符号分配给与一个预定义对象的一个预定义交互作用,来在一个较大数量的符号之中选择(例如候选)一个预定义较小数量的符号,并且通过使用/不使用对应于所述符号的语音来在所述较小数量的符号之中选择一个符号。
同样正如所提及的那样,所述对象和与所述对象的所述交互作用可以是任何种类。如前所述,例如所述对象可以是用户身体的部分(诸如手指、眼睛等等),并且所述预定义交互作用可以是向不同的预定义方向(比如左、右、上、下等等)移动所述对象。
根据本发明的一个实施例,所述对象可以是一个电子设备,并且与所述对象的所述交互作用可以是在预定义方向上斜移所述电子设备。例如,所述不同的较小符号组的每一个包含一种语言的诸如字母、标点符号、单词/单词一部分、功能等等(如前所述)之类的较大符号组的一部分符号,所述每个较小符号组可以被分配给应用到所述电子设备上的一个预定义斜移/动作方向。然,后仍然基于本发明的数据输入系统的原理(如前所述),所述较小符号组的所述符号之一可以通过提供/不提供对应于所述符号的语音而被选择。图68作为一个示例,示出了诸如移动电话之类的一个电子设备6800。作为一个示例,四组符号6801-6804可以被分配给应用于所述设备上的四个斜移方向(例如左、上、右、下)6805-6808。仍然作为一个示例,为了输入字母″t″,用户可以向右斜移设备并发出一个对应于所述字母的语音(例如说出所述字母)。本发明的斜移系统的优点之一是:系统可以不使用任何按键并可以使用一只手用于数据输入。它还允许在该设备内提供一个大的显示器。图68a示出了使用本发明的斜移数据输入系统的电子设备6810,并且其中:一个大的显示器6811基本上覆盖了所述电子设备的至少一边的表面。可以理解的是:诸如按键上的单按/双按动作之类的一个模式在这里可以被应用到该设备上的单斜移/双斜移方向/动作替换。
撇号的处理
根据本发明的一个实施例,包括撇号的预定义单词可以产生并被分配给一个或多个按键并被输入。例如,诸如″it′s″、″we’re″、″he′ll″、″they’ve″″isn’t″等等之类的单词可以被分配给至少一个预定义按键。所述单词的每个都可以通过按压一个相应的按键并说出所述单词而被输入。
根据本发明的另一实施例,为了同一目的,诸如s″、ll″、ve″、″n’t″等等之类的(例如缩写)单词可以被产生并被分配给一个或多个按键。所述单词可以用它们的原始发音来发音。例如:
s″可以发音为″s/is/has″;
re″可以发音为″are″;
ve″可以发音为″have″;
″n′t″可以发音为″not″等等。
所述单词例如可以被输入,来与已经输入的前一单词/字符的末尾相连结。例如,为了输入单词″they’ve″,用户可以输入两个分开的单词″they″和ve″(例如按照本发明的数据输入系统来输入)而不在它们之间提供一个空格。正如所提及的那样,分配给包括撇号的一个单词(例如单词″not″的″n′t″之类的缩写单词)的语音可以与原始单词相同。例如,单词″n′t″和″not″两个都可以发音为″not″。在这种情况下,所述单词的每一个可以被分配给与同一按键的不同模式的相互作用,或者它们中的每一个可以被分配给不同的按键。例如,用户可以单按一个相应的按键(例如与单词″not″被分配到其上的所述按键的预定义相互作用)并说″not″来输入单词″not″。为了输入单词″n′t″,用户例如可以双按同一按键(例如与单词″n′t″被分配到其上的所述按键的一个预定义相互作用)并说″not″。根据本发明的另一实施例,包括一个撇号的部分单词/所有单词可以被分配给撇号标点符号本身被分配的那个按键。
根据本发明的一个实施例,包括一个撇号的诸如s″、d″等等之类的单词的一部分可以被分配给一个按键和与所述按键的一个相互作用模式,并被发音为诸如″s″、″d″等等之类的相应字母。所述按键或者所述模式的交互作用可以与分配给所述相应字母的所述按键或所述模式的交互作用不同,以避免不明确性。
字母在四个按键上的配置
正如前面提到的那样,为了增加语音识别系统的准确性,相近发音的符号(例如在选择他们中之一时引起语音识别不明确性)的符号可以被分配给不同的按键。图69示出了字母表的字符对键区6900的四个按键6901-6904的分配的另一示例。虽然,它们可以被分配给任意按键,但是,优选地,包括一个以上字符的单词/单词一部分可以被分配给表示所述单词和/或所述单词一部分的第一字符的那个按键。这个示例的字符的布局不仅消除了包括字母的使用四个按键的本发明的逐字符文本输入系统的不明确性,而且它还显著降低了本发明的单词/单词一部分的数据输入系统的不明确性。例如,字母″n″和以″n″开头的单词/单词一部分可以被分配给按键6903,而字母″i″和以″i″开头的单词/单词一部分可以被分配给按键6901。这是因为:例如,单词″in″(分配给按键6901)和字母″n″(分配给按键6903)可能具有相互不明确地、实质上类似的发音。很显然,正如前面提到的那样,基于刚刚描述的原理的符号在按键上的其它配置或任何其它数量的按键和按键布局可以被本领域技术人员考虑。
同样,正如早先提及的那样,根据另一示例,如果两个符号的语音具有基本上类似的发音,并且所述符号被分配给同一按键并用与该按键的同类相互作用(例如与相应的语音结合)来输入,为了避免不明确性,具有与第二符号基本上不类似的发音的另一语音可以被分配给所述符号的至少一个第一符号。例如,如果诸如″I″和″hi″之类的两个符号(例如分别是一个字母和一个单词,具有基本上类似的发音),被分配给一个按键并且例如通过与该按键的单按动作同时说出它们而被输入,为了避免不明确性,例如,诸如″hey″之类的另一语音(其大体上与″i″发音不同)可以被分配给该符号(例如单词)″hi″。
快速键入
如先前以及在这里图69a中所示,至少将字母表字符分配给仅仅四个按键的分配的优点之一为:用户可以把他两个手指6915、6916中的每一个(例如左右拇指)放在两个按键的相应栏(例如,在这个示例中是两个按键6911-6912和两个按键6913-6914),以使所述手指同时触摸所述两个按键。这允许在文本输入期间手指不从按键上移走(或很少移走),并且因此,用户知道按下哪个按键而不用看着键区。这甚至在所述用户处于移动时允许快速键入。可以理解的是:为此目的,按键的尺寸、它们之间的距离以及诸如所述按键的物理性能之类的其它参数可以如此以使优化上述程序。
正如前面提到的那样,可以理解的是:根据需要,其它按键配置可以被考虑。例如,所述四个按键可以以这样一种方式来配置:当用户使用单个手指输入所述文本时,优选地,他的手指能够同时触摸所述四个按键。同时,根据不同的需要可以考虑不同预定义数量的按键,其中,所述至少字母表的字符被分配给所述按键。
正如前面提到并在诸如图52之类的附图中显示的那样,多向按键可以用于本发明的数据输入系统。同样,正如所提及的那样,不同数目的按键、不同类型/配置的按键,可以被考虑用本发明的数据输入系统来被使用。仍然如所提及的那样,一种语言的字母表字母或文本字符例如可以被分配给用于本发明的数据输入系统的四个按键上。图69b作为一个示例,示出了一个具有两个多方向的(例如这个示例中为四个方向)按键6927-6928的电子设备6920,其中:一种语言的字母表字符被分配给它们的四个子按键6921-6924。用于数据(例如文本)输入而在电子设备的两侧上的四个按键的布局和使用,已被描述并通过诸如图63b之类的可示范附图示出。
具有可伸展灵活显示单元的设备
如前所述,根据本发明的一个实施例,一个包括诸如OLED显示器之类的灵活显示器和本发明的数据输入系统及其特征的设备可以被提供。图70a作为一个示例,示出了一个灵活显示单元7000。所述显示单元例如可以通过在至少它的侧面之一7001卷起它而缩回。所述显示器可以通过打开它而展开。图70b示出了一个诸如计算机/通信单元7010之类、包括一个灵活显示单元7011的电子设备。所述电子设备还可以包括本发明的数据输入系统以及本发明的按键布局。在这个示例中,所述设备包括两个部分7018-7019,所述按键7012-7013被布局在那上面。所述设备的组件可以被实现在所述设备7010的所述部分7018、7019中的至少一个上。所述两个部分可以通过有线或无线彼此连接。同时,所述显示单元的至少一部分可以被布局(例如卷)在所述设备的所述两个部分7018-7019的至少一个中。所述设备的所述两个部分可以以一个预定义距离或者以用户期望的任何距离相对于彼此被展开并缩回(例如最大距离可以是所述显示单元的最大长度的函数)。在这个示例中,所述两个部分例如相对于彼此处于一个中等距离。通过相对于彼此展开所述两个部分,所述显示单元也可以被展开(例如通过打开)。用户可以保持所述两个部分7018-7019的每一个在他的一个手中,并例如通过本发明的数据输入系统用对应的手使用所述部分的每个的按键7012-7013用于输入数据到所述设备7010和所述设备的显示单元7011。图70c示出了处于一个展开更大的位置中的所述设备7010和所述显示单元7011。诸如至少一个按钮之类的一个装置可用来相对于彼此松开和/或固定和/或缩回所述部分。这些功能可以由诸如按钮和/或弹簧之类的装置自动提供。所述功能是本领域技术人员已知的。图70d示出了处于关闭位置中的所述设备7010。正如所提及的那样,所述设备可以是一个通信设备。在这个示例中,所述设备可以被使用作为电话单元。为此目的,麦克风7031和扬声器7032可以被布局在所述设备内部,(优选地,在它的两端)以使所述麦克风和所述扬声器之间的距离对应于用户的嘴和耳。因为所述显示器是一个灵活显示器,所以它可能易碎。如图70e所示,为了保护位于展开位置中的所述设备的所述显示器,所述设备7010例如可以包括在展开和缩回所述设备的所述两个部分的时候也相对于彼此展开和缩回的多部分的实质上坚硬的元件7041,因此在展开位置中,所述部分提供一个平坦的表面,在其中所述显示器(未示出)可以位于所述表面上。可以理解的是:所述元件可以是任何种类并包括任何形式和任何缩回/展开的系统。同样,所述显示单元可以通过诸如折叠/伸展或者滑动/滑开方法之类的不同方法来缩回/展开。
根据本发明的一个实施例,如图70f所示,诸如刚刚所述那样的电子设备7010可以包括一个集成在它内部的打印/扫描/复印单元(未示出)。虽然该设备可以是任意宽度,但是优选地,所述电子设备的设计(例如在这个示例中,高度大约是一张A4纸)可以如此以使用户可以送入一张A4纸7015来打印诸如已编辑信件之类的一个文档页面。
提供一个完整的移动计算/通信设备解决方案可能在许多情形下都非常有用。例如,用户可以编写诸如信件之类的文档并立即打印。同时例如,售货员可以编辑诸如客户约定中的发货单之类的一个文档并打印它用于立即递送。
根据另一实施例,包括可展开显示单元和本发明的数据输入系统的一个可折叠设备可以被考虑。所述显示器可以是诸如OLED显示器之类的一个灵活显示器。图70g示出了处于关闭位置中的所述设备7050。图70h示出了包括所述可展开显示单元7051和所述数据输入系统的按键7053-7054的所述设备7050。所述设备可以具有通信能力。在这个示例中,麦克风7055和扬声器7056被提供在所述设备内部,优选地,每个位于所述设备的不同部分上。
可以理解的是:这个实施例和相关附图作为示例被描述并示出。基于本发明原理的许多其它实施例和附图可以被本领域技术人员考虑。例如,通过参见图70b,当展开所述显示单元到一个期望长度时,只是所述显示单元的所述展开部分可以被所述设备使用。例如,诸如所述设备的操作系统之类的一个系统可以管理并引导输出到所述显示单元的所述打开(例如展开)部分。同时,所述设备可以至少包括在本专利申请以及本发明人提出的早先专利申请中描述的系统的至少一部分特征。
一个可连结/可拆卸数据输入单元
如前所述,诸如平板PC之类的一个电子设备可以包括本发明的数据输入特征,比如布局在所述设备前侧的本发明的按键配置,布局在其背面的点击设备,在其中:所述点击设备使用在所述设备的前侧的至少一个按键,反之亦然。同样正如前面提到的那样,所述设备可以包括从所述设备向用户的嘴部延伸的一个可展开麦克风/摄像头。如之前所述并示出的那样,所述特征可以构成所述设备的一个外部数据输入单元。图71a作为一个示例,示出了诸如平板PC之类的电子设备的一个可拆卸数据输入单元7100。所述单元可以包括两个部分7101-7102,在其中:所述部分的每一个包括本发明的按键布局的按键7103-7104以便提供信号给所述设备。在这个示例中,所述部分7101、7102被设计为连结所述电子设备的两端。至少一个所述部分可以包括一个点击设备(例如鼠标,未示出),在其中:当所述可拆卸数据输入单元被连结到所述电子设备时,所述点击设备可以设置在所述设备的背面,并且与所述点击设备有关的至少一个按键(例如所述按键配置的一个按键)将位于所述设备的正面,因此用户可以用至少同样的一只手同时使用所述点击设备、所述至少一个相关按键和/或布局在所述部分上的按键配置。所述数据输入单元还可以包括一个被放置在一个可展开构件7107内的可展开麦克风7105和/或摄像头7106来感知用户的语音。本发明的数据输入单元的特征先前已详细描述。所述数据输入单元的两个部分7101-7102可以通过诸如带子(例如橡皮带)71010之类的装置彼此连结,以便把所述单元固定在所述电子设备上。所述数据输入单元可以通过线7108连接到所述设备。它例如可以通过连接到所述电子设备的一个USB端口上的一个USB元件7109而被连接。所述数据输入单元还可以无线连接到所述设备。同时,所述部分7101、7102可以是分开的部分,以使不是把它们连结到电子设备上,用户例如可以把它们中的每一个握在一只手(例如他的手可以放在他的口袋中)中用于数据输入。
用于把所述数据输入单元连结到所述电子设备上的其它连结装置可以被考虑。例如,如图71b所示,所述设备7100可以包括用于所述目的的滑动与/或连结/拆卸构件7111-7112。
可以理解的是:所述数据输入单元可以包括任意数量的部分。例如,所述数据输入单元可以只包括一个部分,在其中:诸如刚刚描述的那些之类的特征(例如键区的按键,点击装置等等)可以被集成在所述部分内。
图71c示出了连结/连接到诸如计算机(例如平板PC)之类的一个电子设备上的所述数据输入单元7100。如图所示,所述数据输入单元7103-7104的按键位于所述设备的两端,麦克风被伸展到用户的嘴部,而一个点击设备7105(未示出,在这里位于所述设备的后部或者一侧)被放置在所述数据输入单元的背面(例如并且很显然位于所述设备的背面)。对应于所述点击设备的至少一个按键7126位于所述数据输入单元的前侧。很显然,所述点击设备及其相应的按键可以位于任意端侧(例如左、右、下)。同时,多个(例如两个,一个在左边,另外一个在右边)点击设备可以被使用,在其中:所述多个点击设备的元件可以彼此结合地工作。用户可以使用他的双手来握住所述设备,并同时通过使用本发明的数据输入系统来使用所述按键和所述麦克风用于输入诸如文本之类的数据。所述用户还可以同时使用所述点击设备及其相应的按键。
可以理解的是:所述数据输入单元还可以无线连接到诸如所述平板PC之类的一个相应的设备上。同时,所述点击设备和/或它的按键可以一起或分离地位于所述电子设备的任何侧面。
根据本发明的一个实施例,诸如OLED显示器之类的一个灵活显示单元可以被提供,以使处于闭合位置中的所述显示单元具有围绕穿戴者手腕带着的腕带形式,或者连结到腕式安装设备的腕带上并最终连接到所述设备的形式。图72a作为一个示例示出了诸如腕式电子设备之类的一个电子设备7210的腕带7211。图72b示出了位于分离位置中的所述显示单元7215。图72c示出了位于打开位置中的所述显示单元7215。
根据本发明的一个实施例,为了帮助系统更好的区分具有基本上相似发音的诸如字母/单词/单词一部分之类的两个符号的语音,与所述符号的第一个符号基本上相似但是与其它符号较不相似的至少一个不同的音素组可以被分配到所述第一个符号,以使当用户说出所述第一个符号时,所述符号被语音识别系统识别的机会增大。例如,如果字母″d″和字母″b″被分配给与同一按键的同一预定义交互作用,则除了音素组″dē″之外,还可以向字母″d″的语音分配另一相似音素组″te″(在这个示例中,字母″t″被分配给另一按键)。另一方面,除了音素组″bē″之外,还可以分配另一相似音素组″pē″(在这个示例中,字母″p″被分配给另一按键)。字母″b″和″d″具有基本上相似的发音,但是字母″t″(音素组″te″)和″p″的发音更加明显不同。例如,如果用户按下对应于字母″b″和″d″的按键并说″de″,则系统可能把所述语音错误地识别为″tē″。在这种情况下,系统将提供分配给与所述按键按压结合的所述语音的字符,并提供字母″d″。可以理解的是:在这里提供的示例只是示范这个实施例。基于所述原理,字母/单词/单词一部分的音素/音素组的各种配置和分配可以被本领域技术人员考虑。
在本申请和本发明人提出的其它申请中所述的系统、特征、改善等等可以适用于本发明的全部实施例。同时,本发明的一个实施例可以分别地运行,或者它可以结合与本发明的一个或多个其它实施例结合运行。
因此,虽然本发明的基本新颖特征被示出和描述,并且,如被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略以及置换和改变。因此,其目的在于,仅限于为这里所附权利要求的范围所示。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。
例如,虽然在不同的实施例中,电话类型的键区被用来示范本发明的不同实施例,但是很显然,对于本发明的实施例,可以使用具有分配到所述键区按键上的任意符号配置种类的任意种类的键区。
为了不频繁重复本发明的数据输入系统的原理,在本申请的许多段落中,提及诸如字符/单词/单词一部分/功能等等之类的一个或多个符号可以被分配给(例如对应于)一个按键(或者除了按键之外的一个对象)。可以理解的是:按照在许多其它实施例中解释的数据输入系统的原理,所述符号应该通过与按键的一个预定义相互作用而被输入。例如,除非另作说明,优选地,所述符号可以通过与所述按键的一个预定义最简单的相互作用而被输入,该相互作用可以是在所述按键上的单按动作(如本发明的许多实施例中所解释的那样)。同时,在解释诸如字母/音素组/字符(字母)组/字母链等等(例如,通常被说出的符号)之类的符号对一个按键的分配之后的许多段落中,为了避免重复用于输入所述符号的本发明数据输入系统的原理,所述原理也许不被提及。可以理解的是,除非另作说明,很显然,(正如在本发明的许多实施例中所解释的那样),所述种类的符号(例如,通常被说出的符号)最好意指通过与(优选地同时)对应于所述符号的语音结合在相应按键上的相应的按压动作而被输入。
必须指出:在本申请的许多中,术语″character-set″或者″characterset″已经被用于定义字符串。
虽然在本发明的不同实施例中,一个语音识别系统已被提及或者意欲被用于感知并识别用户的语音,但是代替所述语音识别系统或者除该语音识别系统之外,可以使用一个唇读系统来感知并识别所述用户的语音(反之亦然)。
正如前面提到的那样,为了输入一个单词/单词一部分,用户可以按下例如对应于所述部分开头的至少一个按键,并且最好同时说出对应于所述部分的语音。同样正如所述的那样,所述语音可以是诸如说出对应于所述部分的音素组(例如音素串)或者说出对应于所述部分的字母(组)之类的一个语音。
根据本发明的一个实施例,一个基于按压例如对应于所述部分开头的一个按键并说话构成所述部分的字母而用于输入单词的一部分的系统可以被考虑。
根据一个方法,一个单词可以被分成各个部分,其中,每个部分由不同类型的字母串构成,比如如下串中的任何一个:
-一个辅音和紧跟在它之后的一个元音(优选地,例如所述部分被分配给所述部分的第一个字母被分配给的同一按键)
-单个辅音--如果在它之后没有元音
-单个元音或者两个连续的元音(例如,如果一个以上元音,优选地,所述部分被分配给所述部分的第一个字母被分配给的同一按键)。
例如,单词″invention″可以被分成七个部分:″i″,”n″,”ve″,”n″,”ti″,”o″,”n″
为了输入一个单词,用户可以通过按压对应于所述部分每个开始字母的一个按键并同时优选地按顺序说出所述部分的字母,来一个接一个地输入所述部分。
在上述方法中,考虑在其末尾有一个辅音的一个部分,由于准确性问题而不被建议(例如被分配给表示字母″a″的相同按键上的″ad″和″at″,可能会彼此模糊)。这个问题可以在如下方法中被解决。
根据另一方法,一个单词可以被分成各个部分,其中,每个部分由不同类型的字母串构成,比如如下串中的任何一个:
-一个辅音和紧跟在它之后的一个元音(优选地,例如所述部分被分配给所述部分的辅音字母被分配给的同一按键)
-一个元音和紧跟在它之后的一个辅音(优选地,例如所述部分被分配给所述部分的辅音字母被分配给的同一按键)
-单个辅音--如果在它之前或之后没有元音
-单个元音或者两个连续的元音(例如如果一个以上元音,优选地,所述部分被分配给所述部分的第一个字母被分配给的同一按键)。
依据这种方法,例如单词″invention″可以被分成五个部分:
″in″,”ve″,”n″,”ti″,”on″
依据这种方法,为了输入一个单词,用户可以通过按压每个所述部分的一个相应按键并同时优选地按顺序说出所述部分的字母,来一个接一个地输入所述部分。如果所述部分不包含一个辅音字母,则对应于一个元音字母的按键(如果一个以上元音,优选地,第一个元音)可以被按下并且说出所述元音字母(组)。
必须指出:刚刚描述的实施例只是作为示例被示出。可以理解的是:基于刚刚所述的原理,一个单词的许多其它划分法可以被考虑。例如,在一些情况下,一个部分可能包含两个连续的辅音(优选地,没有导致不明确性的那些)。通过在相应按键上单按,这可能对用于输入两个连续的辅音字母(诸如许多英文单词中相邻的那些″ch″、″sh″、″ng″、″st″等等)有用。所述部分可以被分配给最好对应于第一个辅音的按键。
同时,例如,各个部分可以包含三个字母或更多。同样可以理解的是:刚刚所述的方法可以结合本发明的数据输入系统的其它实施例或者其它现有的数据输入方法而被使用。例如,为了输入单词″finalist″,用户可以把所述单词划分成三个部分″fi″、″na″和″list″。开头两个部分可以根据刚刚所述的方法来输入(例如按压对应于所述部分的一个按键并/同时优选地按顺序说出所述部分的字母),并且最后一个部分可以按照本发明的另一实施例来输入(例如按压对应于所述部分开始字母的按键并/同时说出对应于所述部分的音素串)
刚刚所述的系统,通过自然地说出每个单词/单词一部分的字母来提供一个单词/单词一部分。除了对于每个单词需要很少的按键按压之外,说出一部分的字母而非说出对应于所述部分的音素组(例如音素串),为每个部分提供更多声音(例如音素),这帮助本发明的语音识别系统更容易更好地识别所述部分。
可以理解的是:虽然在许多实施例中,英文字符/单词/单词一部分作为示例已被示范,但是数据输入系统可用来以任何语言或语言组合的形式输入数据。
正如前面提到的那样,为了增加语音识别系统的准确性,相近发音的符号(例如在选择他们中之一时引起语音识别不明确性)的符号可以被分配给不同的按键。图73示出了字母表的字符对键区7300的四个按键7301-7304的分配的另一示例。虽然,它们可以被分配给任意按键,但是,优选地,包括至少两个字符的单词/单词一部分可以被分配给表示所述单词/单词一部分的第一个字符的那个按键。这个示例的字符布局不仅消除了使用至少四个按键(英文字母表字符被分配到其上)的本发明逐字符文本输入系统的不明确性,而且它还极大降低了本发明的单词/单词一部分的数据输入系统对于所述语言的不明确性。语音识别器可能有时为对应于字母″l″的用户语音选择字母″n″,反之亦然。为了仍然减少字母″l″和″n″之间的不明确性,它们中的一个可以被分配给另一按键(例如字母″l″可以被分配给按键7304),或者可以向字母″n″分配音素组(音素串)″em″(字母″m″的语音)。字母″m″和″n″有非常接近的发音,但是字母″l″和″m″具有更容易区别的发音。因此当用户说″n″时,系统把所述语音与音素组″em″匹配而不是音素组″el″匹配,并且提供相应的字符--字母″n″。
同样,当用户说″l″时,系统把所述语音与音素组″el″匹配而不是音素组″em″,并且提供字母″l″。可以理解的是:这只是一个示例。基于这个方法,可以在给分配到同一按键(或对象)并且具有大体上相似发音的字母/单词一部分/单词之间更好的区分提供许多改善。
1999年10月27日在美国申请的临时美专利申请中,本发明人公开了一种用于通过小型设备输入数字和字母的可展开(例如多部分的)键区。附图之一示范了一个具有可张开听筒的手机,其中具有一个可张开的键区,在其中:所述键区的一排排按键在所述手机的长边方向上展开。所述按键数目和所述按键四行配置可以允许在所述按键上复制一个QWERTY键盘的符号布局。
根据本发明的一个实施例,如图74所示,可张开的键区7401(例如在这里是打开的)可以被提供于设备7400内。诸如在所述申请中所述之类的所述键区可以如此以使所述键区的一排排按键7402-7405在所述手机7400的长边方向上展开。所述按键数目和所述按键的布局(例如至少三行)可以允许在所述按键上复制一个QWERTY键盘的符号布局。在所述展开键区的顶部,可以提供一个与所述键区7401相关的显示单元7406。所述设备可以是任意种类的电子设备,例如蜂窝电话、PDA、平板PC等等。在闭合位置中,所述键区基本上可以整合到所述设备的主体内。通过在扩展位置提供这样一个键区,诸如蜂窝电话之类的一个设备可以装备有一个甚至允许触摸键入的大键盘。如果必要的话,辅助按键可以被提供给所述键区,或者如果必要的话,可以考虑更少的按键。例如,所述键区可以包括三行并且数字可以被分配给一行所述按键,在其中:字母数字混合编制的字母被分配。图74a作为一个示例,示出了当所述设备和/或所述键区处于闭合位置时的所述设备7400。
例如在所述键区被展开时,显示单元7406也可以被展开。可以理解的是:所述显示器7406可以是任意种类,比如OLED显示器。在展开时,所述显示器可以由一片灵活显示器组成,其例如可以被折叠/打开以便允许无断开地缩回/展开。可以理解的是:在扩展位置,所述键区可以扩展出所述所述设备7400的主体之外。根据一个实施例,在闭合位置时,所述键区的按键可以位于所述设备之内,同时根据另一实施例,所述键区的至少一些按键可以位于所述设备的外表面。可以理解的是:所述键区可以对于如前所述的本发明的数据输入系统而被使用。
因此,虽然本发明的基本新颖特征被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略以及置换和改变。因此,其目的在于,仅限于为这里所附权利要求的范围所示。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。
根据本发明的不同实施例,一个单词/单词一部分可以通过按对应于所述单词的至少一个字母(例如开始字母(组))的至少一个按键并说出所述单词/单词一部分(例如,所述语音可以是诸如所述单词/单词一部分的语音,或者正如早先提及的那样,可以一个接一个说出/发音所述单词/单词一部分的字符)而被输入。
根据本发明的一个实施例,至少一个单词/单词一部分可以通过按对应于所述单词的最后一个字母(例如优选地,最后一个辅音字母)的一个按键并说出所述单词/单词一部分(例如,所述语音可以是诸如所述单词/单词一部分的语音,或者正如早先提及的那样,可以一个接一个说出/发音所述单词/单词一部分的字符)而被输入。这个实施例的优点在于:当一个按键被按下时,单词/单词一部分的最后一个字母(例如或者最后一个辅音字母)被定义(例如当一个按键表示一个以上字母时,所述最后一个字母被限制为在所述按键上的所述字母之一)。这可以定义所述语音的结尾(例如最后一个字母),即使语音在相应的按键被松开之后才结束(在大多数情况下,当一个按键按压被松开时,相应的语音也许未终止)。另一方面,由于通常当用户按下一个按键时,他还要开始说出相关语音,所以所述话音的开始大体上基于所述按键按压动作的开始来被定义。通过按压对应于至少一个单词/单词一部分的最后一个字母(例如或者最后一个辅音字母)的一个按键按键并说出对应于所述至少一个单词/单词一部分的一个语音,用户基本上定义了所述语音的开始和结尾。
这还能极大帮助忽视按键按压松开之后的外部噪音,否则在某些情况下,这种噪音会被语音(例如话音)识别系统翻译成为所述语音的一部分。该实施例的另一优点是:系统更容易在单词/单词一部分以及单个字母之间进行区分。正如所提及的那样,在需要对应于至少一个单词/单词一部分的开始字母的按键按压的实施例中,由于在大多数情况下语音的结尾未清楚定义,系统可能选择一个错误的输出。例如,输入字母″d″会被系统翻译为″deal″(例如如果单词″deal″被分配给与字母″d″所分配的相同按键)。这种错误识别问题在吵杂的环境中被放大。在当前实施例中,这种差错不可能发生,因为单词/单词一部分″deal″被分配给字母″l″所分配的按键(例如所述单词/单词一部分的最后一个辅音/字母)。因为单词″deal″的最后一个字母基本上被定义(例如,如果用PC键盘使用该系统,则它被精确地定义),则外部噪音不可能错误地定义所述语音的结尾。
如本发明的各个实施例中所述,可以理解的是:在说出对应于所述至少一个单词/单词一部分的语音时,一个以上按键可以被按下,其中,所述按键之一(例如优选地,最后一个)是对应于所述至少一个单词/单词一部分的最后一个字母(优选地,最后一个辅音字母)的按键。在这个示例中,所述按键按压的另外一个(例如优选地,第一个按键按压)可以对应于所述至少一个单词/单词一部分的第一个字母(或者第一个辅音字母)。
继续描述当前实施例,根据实施例的原理,发音基本上相同并且理论上可以被分配给同一按键(例如在这个示例中,该按键表示字母″m″)的两个元素(例如字母″m″和单词/单词一部分″am″),可以按照不同的方式被输入。为了把它们彼此区别,基于本发明的数据输入系统原理的不同方法可以被提供。根据一个方法,如果两个元素被分配给相同的按键和相同的按键按压动作,单词/单词一部分可以通过一个接一个说出它的字符同时按压例如对应于其最后一个辅音字母的按键而被输入。例如,单词/单词一部分″am″可以通过按压对应于字母″m″的按键并一个接一个发出其字母的音来被输入。根据另一方法,只有字母″m″可以被分配给表示字母″m″的按键。为了输入单词/单词一部分″am″,用户像平常一样可以通过按压对应于所述单词的字母的按键并说出所述字母,来逐字符输入。可以理解的是:根据本发明数据输入系统的原理的其它方法可以被提供,例如,所述元素(例如字符″m″和单词/单词一部分″am″)可以被分配给与同一按键的不同模式的相互作用,或者它们可以被分配给不同的按键。
可以理解的是:所述至少一个单词/单词一部分或者可以被预定义地分配给一个相应的按键(例如根据相应的实施例,第一个、最后一个按键)并且辅助的按键按压提供附加信息来在分配给所述按键上的其它之中选择所述至少一个单词/单词一部分,或者所述至少一个单词/单词一部分可以是具有许多输入(例如元素)的至少一个单词/单词一部分的词典的一个输入(例如元素),并且其中:它们全体的所述按键按压提供对应于一个期望单词/单词一部分的至少一些字符的信息,以便在所述词典的入口之中选择所述至少一个单词/单词一部分。
按压对应于构成一个单词/单词一部分的一些字母的多个按键已经在本发明的不同实施例中描述。当一种语言的基本上所有字母表字符被分配给少数按键,特别是四个按键时,这个系统极其用户友好。这是因为当用户使用所述四个按键(例如如图69a所示,优选地,按照两个按键两栏的方式排列的,在其中两个用户的拇指放在所述按键上)时,他可以按下所述按键的任何而不必在所述键区上移动他的手指。例如,通过参见图73,为了输入单词″mall″,根据如前所述本发明的一个实施例,用户可以说出所述单词并优选地同时按下对应于所述单词的两个字母(例如第一个字母和最后一个字母)的两个按键。用户可以按下对应于所述单词的第一个字母(例如″m″)的按键7304和对应于最后一个字母(例如″l″)的按键7303。这可以极快速地完成,因为用户的手指(例如两个拇指)几乎盖住了全部所述四个按键。正如在本发明的早先实施例中提及的那样,可以理解的是:在一些情况下,所述字母(例如第一个字母和最后一个字母)可以在同一个按键上,在这种情况下,用户相应地按下同一按键多次(例如两次)。例如,通过参见图73的键区,为了输入单词/单词一部分″ment″,在说出所述单词/单词一部分(例如说″ment″)的同时,用户按下按键7304两次。
继续参考当前实施例,为了在对应于至少一个单词/单词一部分的最后一个按键按压和对应于下一字符/至少一个单词/单词一部分的第一个按键按压之间进行区分,不同的方法可以被考虑。所述方法可以是诸如预定义的时间暂停逝去、诸如空格符等等之类的一个字符之类的方法。根据另一方法,可以考虑,总的来说,至少一个单词/单词一部分的每一个,或者在所述至少一个单词/单词一部分的不同类别的每个类别中的至少一个单词/单词一部分的每一个,其所对应预定义固定数量的按键按压。所述类别可以是诸如所述至少一个单词/单词一部分的长度、类型、字母合成等等之类。
提供多个(例如两个或多个)按键按压,用于提供本发明的至少一个单词/单词一部分的输入系统可能有一些优点。所述系统可以与需要单个按键按压动作的系统区分开来。正如前面提到的那样,需要单按动作用于输入一个符号的本发明的系统之一是本发明的单字符输入系统。正如提及的那样,为了输入单个字符,用户通常按下对应于所述字符的单个按键并且优选地同时说出所述符号。通过合并如前所述的本发明的单按语音系统以及多按语音系统,在相同的一个文本内可以以高准确度输入单字符和单词/单词一部分,而不需要在不同的数据输入模式之间切换。同时正如前面提到的那样,根据另一方法,至少一个单词/单词一部分可以通过相应按键上的单按动作同时逐字符发所述部分的音来输入。这个系统还可以与刚刚描述的两个其它系统的结合合并在一起。
因此,虽然本发明的基本新颖特征被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略以及置换和改变。因此,其目的在于,仅限于为这里所附权利要求的范围所示。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。例如,很显然,本发明以及本发明人的其它发明的全部或一部分实施例和/或它们的特征可以分别被使用或者组合使用。例如,至少一个单词/单词一部分或者一个文本可以通过合并本发明的数据输入系统的不同方法而被输入。
如前所述并且如图65a到65b所示,一个点击设备可以被安装在一个电子设备的背面,同时相应的按键可以在所述设备的前面(反之亦然)。根据本发明的一个实施例,点击设备的按键和本发明的数据输入系统的按键的功能可以通过公共按键。
图75作为一个示例,示出了诸如八个按键7500之类的少数按键,用于根据本发明的数据输入系统输入诸如文本之类的数据。在这个示例中,点击设备的两个按键的单击功能7513、7514(未示出,例如在所述设备的背面,同时在所述设备的前面的两个按键)也被分配给两个所述按键7511、7512。本发明的数据输入系统的一些符号和功能也可以被分配给同一按键。例如,用户可以单按按键7511而不说话以便提供左鼠标单击。为了提供诸如″@″之类的一个符号,用户可以单按同一按键并且说″at″(例如音素串″at″对应于符号″@″)。通过把点击设备的按键功能分配给被本发明的数据输入系统使用的按键,可以提供一个通过少数按键的完整数据输入和操作系统。这将非常有利于移动和小型设备内的集成。
继续描述图75,键区7500示出了其按键的优选符号配置。如前所述,键区的一个按键可以不同地响应与所述按键的一种或多种相互作用中的每一个。例如,按键7515上的单按动作可以对应于符号″qwekos?″(正中线7518上所示),并且所述按键上的双按动作可以对应于符号″QWEKOS″(正中线下所示)。在这个示例中,符号″?″(在所述按键的右上侧所示)可以通过单按所述按键而不说话来被输入。为了输入其它符号之一(例如小写字母“qwekos”),用户可以单按所述按键并且发所述符号的音(例如说出一个字母)。为了输入符号″_″,用户可以双按按键7515而不提供语音。为了输入其它符号之一(例如大写字母“QWEKOS”),用户可以双按所述按键并且发所述符号的音(例如说出一个字母)。这些问题已经被详细地解释。在这个示例中,″Sp″(例如空格符号)位于右侧按键7506上,而″Bk″符号(例如退格符号)位于左侧按键7507上。文本符号(例如字母)基本上被分配给四个按键,以使特别在使用诸如左和右拇指之类的两个手指(例如之前已详细解释)时允许快速文本输入。为了提供高准确度文本输入,诸如数字7508之类需要语音的大部分其它符号以及除了字母7509、7510之外某些文本符号,被分配给除了那些字母所被分配给的那些按键之外的按键上。″Ent″(例如,输入)7502以及″Sup Bk”7501(例如高级退格,用一个按压动作清除一个以上字符,如前所述,用于清除至少单词的至少一部分等等)被指定给在它们相应的按键上的双按动作。
同样,在不同情况下诸如″.″之类需要不同语音或者不需要语音的符号,相应地被分配给那些按键中的一些。例如,符号″.″通常在一个单词的结尾处不被说出来。为了那个原因,所述符号″.″7503在这个示例中一度被分配给按键7504,以使不用说出来就被输入。所述符号有时可以被说出″dot″。为了那个原因,在这个示例中所述码元″.″7519被分配给按键7504,如此以使通过说出它而被输入(例如按压所述按键并说″dot″)。如图所示,数字″0-9”7508被分配给按键7512。为了输入数字中的一个点(例如″2.4″),用户可能更喜欢在数字的同一个按键上有符号″.″。符号″.″7516还被分配给按键7512,以使通过说出它而被输入(所述符号的语音在这里可以是单词″point″)。
可以理解的是:在此所述的按键布局、所使用的按键数量、符号在所述按键上的配置、鼠标按键布局和分配等等只是示范性的。基于本发明的原理,其它按键布局、所使用的按键数量、符号在所述按键上的配置、鼠标按键布局和分配等等可以被考虑。
图75a示出了与图65a到65b类似的、诸如平板PC之类的电子设备,在其中:图65中包括诸如字母和数字分配、鼠标键功能分配等等之类全部按键相应的符号分配在内的所述按键被放置在所述电子设备的侧面(例如左右两侧),如此以使所述按键可以通过所述用户两只手的两个手指(例如拇指)来操纵。这个问题早已被详细描述。如图所示,按键7533和7534分别对应于安装在所述设备的背面(所述点击设备6511在图65b中被示出)上的点击设备的左击和右击功能。通过用他的两只手握住所述电子设备,用户例如可以使用他的两个拇指操纵所述按键(包括点击设备按键),并且在同一时间通过诸如他的食指之类的另外一个手指操纵安装在所述电子设备背面上的点击设备。这些问题早已被详细描述。
可以理解的是:在此所述的按键布局、所使用的按键数量、符号在所述按键上的配置、鼠标按键布局和分配等等只是示范性的。基于本发明的原理,其它按键布局、所使用的按键数量、符号在所述按键上的配置、鼠标按键布局和分配等等可以被考虑。例如,基本上全部所述按键可以被放置在所述电子设备的前面的一侧。
根据一个实施例,分开或者合并在一起的所述按键和所述鼠标可以可拆卸地连结到所述电子设备或者任何其它电子设备。这特别有用,因为所述按键和所述点击设备例如可以经由一个USB连接器连结并连接到一个电子设备。这些问题早已被详细描述。
如前所述,一个点击设备可以被安装在一个电子设备的背面,同时相应的按键可以在所述设备的前面(反之亦然)。根据本发明的一个实施例,鼠标的按键也可以被安装在所述设备的背面。图76a作为一个示例,示出了与图65a的类似的电子设备7600,其中:在这里点击设备7603的按键7601、7602也被安装在所述电子设备7600的背面。根据一个实施例,点击设备7603和所述相应的按键7601、7602可以被安装在所述电子设备的背面的任何位置上。例如,所述点击设备可以被安装在所述电子设备的后表面的一侧7604(例如右侧)上,并且所述点击设备的按键可以在所述后表面上被安装在与所述点击设备相对的一侧7605(例如左侧)之中,如此以使用户可以用一只手操纵所述点击设备并另外一只手操纵所述按键。
可以理解的是:代替前面的按键或者在前面的按键之外,所述点击设备的背面上的所述按键可以被提供。同时,正如前面提到的那样,所述鼠标及其相关按键可以可拆卸地连结到所述电子设备。所述鼠标及其相关按键可以是与不同电子设备连结/起作用的一个分离单元。同时,一个点击设备的按键数目可以根据需要而变化。例如,那个数字可以是一、二、三或更多按键。
如前在本专利申请以及本发明人提出的早先专利申请中所述,可以对于本发明的数据输入系统而被使用的一个键区的按键可以如此制成,以便识别按下按键的手指部分,并且系统可以根据所述识别进行响应。例如,用户可以通过手指的指尖部分按下一个按键,或者他可以通过手指的指肚部分按下所述按键。根据本发明的一个实施例,为了输入字母(例如逐字符的文本输入系统),用户用其手指的指尖部分按下对应于所述字母的按键,并且为了通过单词一部分/单词的数据输入系统提供单词一部分/单词,用户可以用其手指的指肚部分按下所述按键(反之亦然)。正如前面提到的那样,与一个按键的不同的相互作用模式可以被组合并用本发明的数据输入系统而被使用。与一个按键的相互作用的这种方法(例如使用用户手指的不同预定义部分)可以与一个按键的其它相互作用模式结合,并且基于本发明的数据输入系统对于不同的数据输入实施例和方法而被使用。
诸如基于逐个输入单词一部分/单词的文本输入系统之类的数据早已被详细描述。根据本发明的一个实施例,语言限制可用来限制一组音素组/语音模型中的被分配给一个按键的音素组(例如音素串)/语音模型的数目,以便与对应于所述按键的单词一部分/单词的输入相对应的用户语音进行比较。
正如前面提到的那样,一种语言的一个单词或者自定义的一个单词可以被分成预定义的不同部分(例如基于所述单词的音节)。正如前面提到的那样,例如单词″playing″基于其两个音节可以被分成两部分。根据一个方法,所述部分可以是″pla-ying″(例如发音为″plā″和″ing″),而根据另一方法,所述部分可以是″play-ing″(例如发音为″ple″和″ying)。同时正如前面提到的那样,划分单词的其它变体也可以被考虑。例如,根据输入所述单词的不同的方法,可以按照不同的方式预先明确且任意地进行划分。正如之前在一个示例中提及的那样,一个单词也可以不考虑它的音节结构而被分成不同部分。作为一个示例,所述单词″playing″可以被分成三个部分″pla-yin-g″(例如发音为″ple″、″yin″和″g″(例如拼写字符″g″或者发相应的声音))。
正如前面提到的那样,基于所提及的原理,一个单词数据库,在其中,所述单词被分成预定义的单词部分(例如单词部分通常基于它们的音节而被划分),可以被创建并用本发明的数据输入系统而被使用。所述预定义部分可以被分配给一个用本发明的数据输入系统使用的输入设备的相应按键。例如,所述部分的每一个可以被分配给表示所述部分的第一个字母或最后一个字母或者另外一个字母的按键(这些问题早已在本专利申请以及本发明人提出的早先专利申请中被描述)。图77的表A示出了一个示范性数据库的一个示范部分。
如前详细所述,根据本发明的数据输入系统,一个单词可以逐部分输入。例如,单词″seeing″作为一个示例被划分成为两个预定义部分″see″和″ing″,它可以逐部分被输入。例如,通过使用图75的键区7500的按键,用户可以按下诸如按键7515之类的一个按键(例如表示该部分/音节″see″的第一个字母)并说″sē″。然后他可以按下按键7519(例如表示该部分/音节″ing″的第一个字母)并说″ing″。系统然后将把所述话音的每一个,与分配到每一个对应按键上的音素组/语音模型相比较,并且在与一个组合和优选地与词典程序的之后,系统可以提供用于被输入/输出的一个或多个候选。这些问题早已被详细描述。
正如前面提到的那样,不是分配单词/单词一部分给表示所述单词/单词一部分的第一个字母的一个按键,所述单词/单词一部分可以被分配给一个例如基于最后一个字母、最后一个辅音字母等等的按键。同样,必须再一次提到:构成有一个音节的一个单词的字符组(例如字符串),可以被认为是一个部分并且被整合到单词部分的所述数据库中。同样正如前面提到的那样,很显然,优选地,单词部分按顺序被输入。这些问题先前早已被详细描述。
如果一个单词包括超过两个部分,根据本发明的一个实施例,当用户输入一个单词的一部分并试图输入所述单词的下一部分时,他按下对应于下一部分的按键并说出相应的语音,而不比较所述话音与分配到所述按键(例如或者分配给与一个按键的一个预定义相互作用)的全部音素组/语音模型组。
这个问题早已被详细描述。为了不频繁重复这个注释,每当符号对一个按键的分配被提及时,它也可能意指所述符号对与所述按键的一个预定义相互作用的分配,系统把所述语音只与所述组的音素组/语音模型进行比较,其中所述音素组/语音模型是与和所述用户的语音的相比较相关。基于早已输入的在前部分(组),系统定义所述组的哪些所述音素组/语音模型可以被考虑用于所述比较。通过比较在前输入的部分(组)与上述单词词典的单词(例如在其中,所述词典的单词被分成预定义部分),系统考虑选择以已输入的部分(组)开始的单词。基于对应于被输入的下一部分的按键按压,系统然后只考虑这样的单词:其中,所述单词下一部分被分配给在单词的所述选择之中的所述按键按压。该系统然后把对应于所述下一部分的用户语音,与被系统考虑的所述单词的下一部分的音素组/语音模型相比较。
这个方法显著降低了与用户语音相比较的电话组/语音模型的数目,并因此显著增加了本发明逐部分的数据(例如文本)输入系统的准确性。这种输入方法还提供了稍后在本申请中描述的更多优点。
作为一个示例,以下是以部分″sim″(例如基于音节)开始的单词的一个选择列表。所述单词根据构成它们的音节被分为不同的部分。
各个部分(例如:基于音节)
1        2        3        4        5
Sim  -i       -an
Sim  -il     -ar
Sim  -il     -ar      -i      -ties
Sim  -il     -ar      -i      -ty
Sim  -il     -ar     -ly
Sim  -il     -i      -tude
Sim  -pa     -ti     -co
Sim          -ple
Sim          -pli    -ci      -ties
Sim          -pli    -ci      -ty
Sim          -pli   -fi     -ca     -tion
Sim          -pli   -fi     -er
Sim          -pli   -fy
Sim          -plis  -tic
Sim          -ply
Sim          -u    -late
Sim          -u    -lat      -ing
Sim    -u      -la     -tion
Sim    -u      -la        -tor
Sim    -ul      -ta       -ne       -ous
Sim     -ul        -ta        -ne        -ous      -ly
例如,通过使用图75的键区7500的按键,为了输入单词″simplify″,用户可以按照三个部分(优选地,根据音节)输入所述单词″sim-pli-fy″。用户首先可以通过按压例如对应于所述部分的开始字母的按键7515输入部分″sim″并说″sim″。如果该部分被正确输入,则用户继续输入第二部分″pli″。因此他可以按下对应于字母″p″的按键7504并说″pli″。
通过知道该单词的第一部分(例如,在这个示例中是″sim″),该系统考虑以所述第一部分开始的(例如该系统可用的一个或多个语言的)一个单词数据库的单词的第一选择。基于对应于所述单词的第二部分的按键按压,该系统考虑在所述第一选择的单词内的第二选择,其中:它们的下一预定义部分对应于由用户提供的所述第二按键按压。在这个示例中,那些第二部分以对应于按键7504的一个字母(例如以字母″ghlnprv″之一开始的)开始的单词是这些单词:
Sim  -ple
Sim  -pli  -ci  -ties
Sim  -pli  -ci  -ty
Sim  -pli  -fi  -ca  -tion
Sim  -pli  -fi  -er
Sim  -pli  -fy
Sim  -plis  -tic
Sim  -ply
该系统现在可以考虑所述第二选择的单词的仅仅第二部分的音素组/语音模型,用于与对应于被输入的单词的第二部分的用户语音相比较。在这个示例中,所述部分是″ple″、″pli″、″pli″、″pli″、″pli″、″pli″、″plis″和″ply″(例如具有与部分″pli″相同的发音)。
因此,不是把所述用户的第二语音与分配给所述第二按键按压的全部的单词部分的语音进行比较,系统把所述用户的语音与仅仅八个部分的语音(例如,实际上,它们对应于仅仅三个不同的音素组/语音模型″pel″,″pli″和″plis″)进行比较。
在这个阶段之后,按照这些原理,单词的随后的第三选择(在其中:它们的第二部分也与用户的第二按键按压和语音相匹配)可以被系统考虑:
Sim  -pli  -ci  -ties
Sim  -pli  -ci  -ty
Sim  -pli  -fi  -ca  -tion
Sim  -pli  -fi  -er
Sim  -pli  -fy
Sim  -ply
如果用户输入诸如空格符、标点符号字符、″回车(enter)″功能等等之类的一个单词结尾信号,那么该系统选择在这里结尾的单词。所述单词是单词″simply″。在这个示例中,用户不提供一个单词结尾信号,并通过重复同一程序继续输入期望单词的下一部分。该系统相应地行动(如为前一部分所描述的那样)。在这个示例中,用户按下对应于字母″f′的按键7520并说出该部分″fy″。包括以对应于按键7520的一个字母开始的第三部分的单词有:
Sim  -pli  -fi  -ca  -tion
Sim  -pli  -fi  -er
Sim  -pli  -fy
该系统现在可以把第三用户语音与仅仅三个部分的语音″fi″、″fi″和″fy″(实际上只有两个不同的语音″fē″和″ft″)进行比较。系统可以很容易把所述语音与相应的部分匹配,并且选择部分″fy″,并因此选择单词″simplify″。如果期望并如此设置的话,则系统可以在输入的每个单词结尾处自动提供一个空格符。
如果用户输入的最后一个部分只对应于所述数据库内的一个单词,并且所述部分不是所述单词的最后一个部分,则一个单词完成系统可以自动地输入所述单词的剩余字符。
根据本发明的一个实施例,当用户试图通过按下一个相应的密钥并提供对应于所述部分的一个语音来输入一个部分时,并且由于诸如上面解释的任何原因,只有一个音素组/语音模型被系统考虑用于与用户的语音比较,那么或者所述音素组/语音模型可以自动被选择而不管所述用户的语音,或者它可以被强迫与所述用户的语音匹配。例如,为了输入单词″read-ing″,用户首先输入部分″read″,然后通过按压按键7519并说″ing″来输入部分″ing″。基于第一部分的输入以及对应于第二部分的按键按压,并且通过考虑上述原理,该系统可以只找到在所述按键上相应的一个音素组/语音模型用于与所述用户语音的比较。例如,在正确输入部分″read″之后音素组/语音模型″ing″是唯一的候选,那么该系统或者强迫所述用户的语音与所述音素组/语音模型匹配,或者它可能不提供所述比较。系统然后相应地选择单词″reading″。如果所述单词有另外的部分,则这个程序可以被重复。
如前所述,单词的一部分可以逐字符输入(例如所述部分可以包括一个或多个字符)。根据本发明的一个实施例,至少一个单词的第一部分可以逐字符输入。单词的其余部分可以逐部分输入。逐字符输入第一部分的程序对于正确地输入一个单词的开始部分可能是有益的。一个单词的第一部分的正确输入将极大帮助所述单词的下一部分(组)的正确输入。
在上述示例中,例如通过按压按键7515并说″sim″来输入部分″sim″,可能错误地提供一个单词部分″sin″。由于这个原因,优选地,用户可以逐字母地输入第一部分,然后逐部分地输入一个单词的其余部分。
根据另一实施例,该系统可以为一个单词的第一部分考虑一个以上的选择。在上面的示例中,该系统可以考虑两个部分″sin″和″sim″,并通过考虑以两个部分″sin″和″sim″开始的单词的剩余部分,来继续识别一个单词的剩余部分。
根据本发明的另一实施例,如果把对应于一个单词部分的用户语音与一个相应按键的一个音素组/语音模型进行匹配时存在不明确性,那么该系统可以选择对应于一个或多个与所述用户语音最佳匹配的音素组/语音模型的一个或多个部分(例如字符组)。如果要被输入的所述部分是单词的最后一个部分,那么该系统可以把系统考虑的部分/字符组的组合(不同字符组的组合早已在本发明人提出的不同专利申请中被详细描述)与该系统的单词词典的单词进行比较,并且按照在本发明人提出的早先申请中描述的选择程序继续。
继续描述实施例,如果所述部分不是要被输入的单词的最后一个部分,那么用户可以继续输入下一部分,并且基于所述下一部分的输入,系统可以或者仍然考虑所述前面的一个或多个字符组,或者系统可以用另一字符组替换它。
例如,为了输入单词″rea-dy″,用户首先按下对应于部分″rea″的第一个字母的按键7504,并说出所述部分。系统可以考虑两个部分(例如字符组)″re″和″rea″,在其中:它们的语音对应于用户的语音,但是基于使用频率,系统可能临时在屏幕上打印部分″re″。然后用户输入下一部分″dy″。基于所述下一部分的的输入,系统可以正确地识别所述下一部分,并且通过考虑以字符组″re″和″rea″开始的单词,系统可以把前一部分修正为″rea″以便输入输出单词″ready″。可以理解的是:如果所述下一部分仍然不明确,并且用户在所述下一部分之后输入一个部分,那么所述最后一个部分可以定义前一部分等等。
基于一种或多种语言的所述数据的单词的预定义部分(它们被分配给一个输入设备的按键)可以分类为两种类别。第一类别可以是分别构成所述数据库的所述单词之一的那些部分,并且第二类别可以是这样一些单词:这些单词可能只是在所述数据库中由至少两个预定义部分构成的单词部分。
根据本发明的一个实施例,当输入只由一个部分构成的一个单词(例如整个单词预先明确地被认为是一个部分)时,系统可能不考虑如下这样的任何预定义部分:即,这些预定义部分只能成为由至少两个预定义部分构成的单词部分。这可以极大帮助只有一个部分的单词的正确输入。在通过按压对应于所述部分的一个按键并说出所述部分来输入所述单词的第一(并且唯一的)部分之后,用户可以提供(优选地,立刻)诸如空格符之类的单词结尾信号来通知该系统所述单词只有一个部分。
例如,当用户通过按压对应于所述部分的一个按键并说出所述单词来输入只有一个预定义部分的一个单词,然后所述用户按下一个空格符来通知系统那个单词的输入结束时,系统理解一个单词或单个字符已被输入。在这种情况下,系统可以不必考虑对应于所述按键的单词部分,在其中:所述部分可能只是那些至少具有两个预定义部分的单词的一部分。系统可以只把用户的语音与分配给所述按键的那些部分的音素组/语音模型进行比较,其中:所述部分独立地构成所述单词数据库中的一个单词。根据本发明的至少一个实施例,除了所述部分之外,对于所述比较程序,可能还要考虑分配给所述按键的字母的音素组/语音模型。作为一个示例,如果用户试图通过按压按键7520并说出所述单词来输入单词″few″,然后他按下一个空格键,则系统可能不考虑诸如″fu″、″cu″等等之类被分配给所述按键但是并未独立构成(例如一种语言的)单词数据库的一个单词的那些单词部分。这极大减少了要与用户语音进行比较的音素组/语音模型的数目,并因此实质上增加了系统的准确度。
另一方面,当用户输入有一个以上预定义部分的一个单词的第一部分、并通过按压对应于所述第二部分的一个按键且说出所述部分来继续输入所述单词的第二部分时,系统可能不考虑分配到所述按键上的这样的单词部分,其中,所述部分构成数据库中的只有一个预定义部分的单词。
例如,如果用户通过以两个预定义部分″fu″和″ture″的形式输入它来输入单词″future″,在输入第一部分并开始输入下一部分(例如在所述两个部分之间没有任何间隔字符或功能键)之后,那么系统可能不考虑只有一个(预定义)部分的单词。在上述示例中,可以已经被分配到与部分″fu″所分配的按键相同的按键上的部分″few″可以被系统排除。
根据另一方法,在通过按压对应于所述部分的一个按键并说出所述部分来输入一个部分之后,用户可以提供诸如一个预定义暂停时间的逝去之类的一个部分结束信号。在这种情况下,系统可以不必等待下一音节的输入而输入/输出对应于分配到相应按键上、与用户语音最佳匹配的音素组/语音模型的字符组。如果输入/输出部分正确,那么用户可以继续输入下一部分,如果否,则可以考虑各种修正程序,比如:
-用户可以擦除该输入输出并重新尝试所述部分的输入。
-系统可以自动提供对应于与所述用户语音匹配度次佳的音素组的字符串;
-系统可以为所述输入显示一个候选字符串列表;
-等等。
正如前面提到的那样,一个单词的第一音节/部分可以逐字符输入。根据本发明的另一实施例,一个预定义暂停时间的逝去可以通知系统所述第一部分的输入结束。
根据另一实施例,如果前面的部分(组)未被正确地识别,并且下一部分(组)被正确地识别,那么系统可以基于下一部分(组)纠正前面的部分(组)。
例如,如果用户期望输入单词″watch-ing″,并且系统识别为″which-ing″,则系统可以识别:
-单词″whiching″在词典中不存在;
-部分″ing″通常输入正确;
系统可以选择在同一相应的按键(例如对应于所述部分″which″的第一字母的按键7515)上、具有与字符组″which″的语音最靠近的语音的一个字符。那个部分可能是部分″watch″。系统然后可以提供单词″watching″作为最后的输入输出。
同时,可以基于许多因素(比如所述部分在一个单词内的常见位置)来自动矫正诸如最后一个部分之类的一个部分。例如,如果用户期望输入单词″watch-inc″,并且系统识别为″watch-inc″,则系统可以识别:
-单词″watchinc″在词典中不存在;
-所述部分″inc″通常不位于一个单词的末尾;
因此,系统可以通过用分配到同一相应的按键上的一个部分替代它来矫正所述部分,在其中所述部分具有与所述被错误输入的部分基本上相似的语音,并且在其中所述替代部分通常位于一个单词的末尾。在这个示例中,系统可以用替代部分″ing″来提供单词″watching″。
可以理解的是:基于如在本专利申请以及本发明人提出的早先专利申请,本发明人编写的文章,或者由本发明人创造、与本发明人合作的产品,或者根据本发明人的监督,或者基于本发明人的本发明原理中所述的本发明的数据输入方法,许多形式的数据输入、手动和自动修改、矫正、空格等等可以被考虑。
例如,根据一个实施例,可以通过按压对应于所述部分的单个按键并通过语音拼写所述部分的全部/部分字符来输入一个单词的第一部分。例如,正如所提及的那样,一个单词例如基于其音节可以被分成好几个部分。同时,一个单词到不同的部分/音节的划分对于两个用户可以不同。一个好的系统应该考虑这个问题并且提供一个允许用户自由选择的系统。这些问题早已被本发明人详细描述。根据另一方法,在正确输入一个单词的第一部分/音节之后,所述单词的其余部分可以通过说出它而不必提供按键按压就可被输入。
同时,虽然在许多实施例中一个单词的″第一″和″第二″部分已被提及,但是同一程序可以相应地被应用到一个单词的″当前″以及″下一″或″前一″部分。正如前面提到的那样,为了该系统更好的功能性,除了至少一种语言的单词数据库的至少一个词典之外,对于本发明的数据输入系统,还可以使用单词一部分的字符组的一个词典(例如,基于至少一种语言的单词的音节)。同时,考虑并选择一个单词部分的程序已经作为一个示例被描述。基于同一原理的其它程序可以被考虑。例如,为了输入一个单词的一部分,系统可以首先把用户的语音与一个相应按键按压的全部音素组/语音模型进行比较,并且选择与所述用户语音相匹配的那些音素组/语音模型的相应部分(例如字符组)。系统然后可以基于所述部分与所述单词数据库内的单词选择的相应部分的比较,来在所述选定的部分(组)之中考虑一个新的选择,在其中:所述选定的单词已经基于所述用户输入的所述单词的预先输入部分(组)而早已被选择。
同时,根据一个实施例,除了选择/输入一个单词的一个部分,基于用户的按键按压和语音,系统还可以记住与所述用户语音匹配的所述部分的音素组/语音模型。例如,如果系统选择的部分是字符组/部分″re″,并且对应于所述部分的音素组是″rē″(例如在单词″remember″中)而不是″re″(例如在单词″render″中),那么它对于记住所述信息可能很有用。例如,在输入具有两个部分(在其中:第一部分是字符组″ve″并且其相应的音素组是″vē″)的一个单词之后,系统例如根据早先描述的原因之一,可以识别所述部分应该是″re″而非″ve″。通过记住对应于所述错误的部分的音素组/语音模型,系统只考虑其相应部分是字符组″re″、并且其相应音素组/语音模型是″rē″(例如具有相同的元音)的那些单词。
基于对应于一个单词的部分(例如具有至少一个字符)的按键按压以及用户提供的相应的语音,并且使用一个消除歧义的方法,系统可以识别用户试图输入的一个单词。
根据本发明的另一实施例并且根据本发明的逐部分的数据输入系统,用户可以通过逐部分地输入一个单词来尝试输入它。正如对于输入每个所述部分所提及的那样,用户可以按下对应于所述部分的一个按键(例如所述部分被预先明确地分配到所述按键)并说出所述部分。在所述单词的输入结束时,用户可以提供诸如空格符之类的一个单词结尾信号。
在结束所述单词的输入之后,系统可以考虑系统的单词数据库内的单词的第一选择(例如,如上所述,在其中:例如基于它们的音节预先明确地划分单词),如此以使:
-所述单词具有对应于用户提供的按键按压次数的若干部分;并且在其中;
-一个单词的一部分被预先明确地分配给所述用户提供的所述相应的按键按压,其中:所述单词的一部分在其各自的单词内的位置对应于用户提供的一个按键按压。
在选择所述单词之后,系统把为所述期望单词的每一个部分的输入而提供的用户语音与所述选定单词的相应部分的音素组/语音模型进行比较。那些其所有部分都与相应的用户语音相匹配的单词可以被系统选择。如果选择包括一个单词,则所述单词可以被输入或输出。如果选择包括一个以上单词,则系统或者例如通过为用户呈现人工选择的所述选择来提供一个人工选择程序,系统或者可以自动地选择所述单词之一作为最后的选择。自动和手动选择程序早已在本专利申请以及本发明人提出的早先专利申请中被描述。
正如前面提到的那样,基于所提及的原理,一个单词数据库(在其中,所述单词被分成预定义的单词部分(例如,单词部分通常基于它们的音节而被划分))可以被创建并与本发明的数据输入系统而被使用。所述预定义部分可以被分配给一个与本发明的数据输入系统使用的输入设备的相应按键。例如,所述部分的每一个可以被分配给表示所述部分的第一个字母或最后一个字母或者另外一个字母的按键(这些问题早已在本专利申请以及本发明人提出的早先专利申请中被描述)。图78的表b示出了一个示范性数据库7810的一个示范部分。作为一个示例,所述数据库可以被与本发明的逐部分的数据输入系统结合的所述消除歧义方法所使用。作为一个示例,系统可以使用键盘7800,在其中:数据库的单词的每一个部分被分配给按键7801-7804之一:按键7801-7804表示所述部分的第一个字母。所述按键数字根据所述部分的每一个而被编写。
作为一个示例,如果用户试图输入单词″entering″,在这个示例中它包括三个预定义部分″en-ter-ing″,所述用户:
-首先按下按键7801,并说″en″;
-然后他按下按键7802,并说″ter″;
-然后他按下按键7802,并说″ing″。
基于所述按键按压,系统搜索所述单词数据库7810内的单词,以便找到具有三个预定义部分并且每个所述部分被分配给用户提供的相应按键按压的那些单词。在这个示例中,存在两个与所述搜索匹配的单词。所述单词是:
-″entering”(例如,“en  -ter  -ing”),
和:-″sentiment″(例如,“sent  -i  -ment″)。
系统然后把对应于所述部分的音素组/语音模型与对应的用户语音进行比较。
所述系统:
-把为第一部分的输入所提供的用户语音与部分″en″和″sent″的音素组/语音模型进行比较;
-把为第二部分的输入所提供的用户语音与部分″ter″和″i″的音素组/语音模型进行比较;
-把为第三部分的输入所提供的用户语音与部分″ing″和″ment″的音素组/语音模型进行比较。
基于所述比较,系统可以识别其全部音素组/语音模型与用户语音相匹配的唯一单词是单词″entering″。所述单词可以被输入/输出。
可以理解的是:基于刚刚所述的原理来选择、比较和输入一个单词的程序可以有差异地被提供但是不偏离所述原理。例如,该系统可以首先把用户的语音与相应按键的音素组/语音模型进行比较,并且在此之后把所述部分与单词数据库的相应单词部分进行比较,用于选择其全部的部分语音已经与相应的用户语音匹配的那些单词。同样可以理解的是:一种语言的字母表字母可以被认为是单词的一部分。
因此,虽然本发明的基本新颖特征被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略以及置换和改变。因此,其目的在于,仅限于为这里所附权利要求的范围所示。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。例如,在不同实施例中描述的逐部分的数据输入系统可以被合并来提供一个极精确的系统。例如在用户逐部分输入一个单词时,系统可以逐部分识别并输入所述单词,并且在所述单词被所述用户输入的末尾处,为了再次确认输入的所述单词,系统可以用刚刚描述的语言约束方法和消除歧义的方法中的一个或多个继续所述单词的平行输入。
例如,虽然在不同的实施例中电话类型的键区被用来示范本发明的不同实施例,但是很显然,对于本发明的实施例,可以使用具有分配到所述键区按键上的任意符号配置种类的任意种类的键区。
为了不频繁重复本发明的数据输入系统的原理,在本申请的许多段落中,提及诸如字符/单词/单词一部分/功能等等之类的一个或多个符号可以被分配给一个按键(或者除了按键之外的一个对象)。可以理解的是:除非另作说明,所述符号通常意欲被分配给与所述按键的一个预定义最简单的相互作用,该相互作用可以是在所述按键上的单按动作(如本发明的许多实施例中所解释的那样)。同时,在解释诸如字母/音素组/字符(字母)组/字母链等等(例如,通常被说出的符号)之类的符号对一个按键的分配之后的许多段落中,为了避免用于输入所述符号的本发明数据输入系统的原理的重复,所述原理也许不被提及。可以理解的是,除非另作说明,很显然,(正如在本发明的许多实施例中所解释的那样),所述种类的符号(例如,通常被说出的符号)通常意指通过在相应按键上的相应的按压动作并结合与(优选地同时)对应于所述符号的语音而被输入。
必须指出:在本申请的许多中,名词″character-set″或者″characterset″已经被用于定义字符串。
虽然在本发明的不同实施例中,一个语音识别系统已被提及或者意欲被用于感知并识别用户的语音,但是代替所述语音识别系统或者出了该语音识别系统之外,可以使用一个唇读系统来感知并识别所述用户的语音(反之亦然)。
继续描述语言约束和消除歧义的方法,根据本发明的一个实施例,在用户结束逐部分(例如通过按压对应于所述部分的按键并说出所述部分)输入一个单词之后,系统可以被告知各种信息来帮助它识别所述单词;
-系统可以知晓所述单词由多少预定义部分构成(例如基于按键按压次数),并且;
-系统知道所述部分的每一个对应哪个按键(例如对应于每个部分的第一个字母的按键)。
系统前进到通过把对应于每个所述部分的用户语音与分配给用户已经按压的、与对应于所述部分的用户语音相关的一个按键上的音素组/语音模型进行比较来识别每个所述部分的步骤。识别程序在本发明人提出的各个专利申请中已经详细描述。基于所述比较,该系统可以正确地识别期望单词的至少一个部分。
基于所述信息和所述已识别的部分(组),系统可以考虑在一个预定义单词数据库中的单词的第一选择,在其中所述选择由所述数据库内的这样的单词组成:
-具有所述数目的预定义部分,并且;
-所述单词包含类似于系统正确识别的部分(组)的部分(组),在其中:每个所述已识别部分(组)在用户输入的单词内的位置,对应于所述选定单词内一个相似部分(组)的位置,并且;
-每个所述单词的每一个其它部分(组)被分配给被用户按下的一个相应按键(例如所述单词的第一部分对应于被用户按下的第一按键,所述单词的第二部分对应于被用户按下的第二按键等等)。
按照这些原理,被系统考虑的相关单词的数目将显著减少。
然后如果需要,系统可以继续附加的消除歧义的方法,来基于如下方法在所述选择内选择一个单词,比如:
-基于所述已识别的部分识别在所述正确识别的部分之前或之后的一个部分;
-选择其别的部分(组)与用户的语音最匹配的一个单词,和/或;
-单词的一个部分在所述单词内的常见位置,和/或
-具有所述特性的一个单词在诸如一个句子之类的一个文本内的常见位置,和/或;
-诸如前面在本申请以及本发明人提出的其它专利申请中所描述之类的消除歧义的方法的其它原理。
根据另一实施例,在所述基于诸如一个或多个已识别部分之类的所述信息选择单词数据库的单词之后,系统继续另一识别步骤,通过仅仅把对应于所述未识别部分的用户语音与选择的单词的相应部分的语音进行第二次比较来识别其它未识别的部分。这一次,系统可以只把所述每一个未识别部分的用户语音与一个按键的音素组/语音模型进行比较,其中:所述音素组/语音模型表示只存在于所述选定单词的单词内的一个相应部分。
在上述识别程序结束时,根据一个实施例,如果存在系统选定的一个单词,那么所述单词可以被输入输出。如果一个以上单词被系统选择,那么系统可以继续一个自动或人工选择程序(例如在多个组合的单词内一个单词的最终选择已经在本发明人提出的不同专利申请中被描述)。
作为一个示例,如果用户试图输入单词″revocation″,则他可以分四个部分″re-vo-ca-tion″输入它。因此,例如通过使用图78的按键,用户可以按下按键7804、7804、77803和7802同时说出相应的部分。在所述单词的输入末尾,用户按下空格键。系统然后可以继续识别步骤。基于按键按压,系统知道存在构成所述单词的四个部分,并且所述部分分别以分配给按键7804(第一部分以字母″qwekos″之一开始)、7804(第二部分以字母″qwekos″之一开始)、7803(第三部分以字母″acdfxy″之一开始)和7802(第四部分以字母″tiuzbmj″之一开始)的字母之一开始。系统然后把对应于用户提供的每一个按键按压的用户语音与分配给相应按键的音素组/语音模型进行比较。在所述比较之后,系统可以正确识别至少一个所述部分。系统然后在一个预定义单词数据库内选择单词,其中所述单词:
-具有四个部分;
-每个所述部分对应于一个相应的用户按键按压;
-包含在用户期望的单词的所述单词内的相同部分位置中的所述已识别部分(组)。
根据本实施例,不用尝试识别一个单词的第一部分,系统可以试图识别所述单词的任何部分。这是因为在大多数情况下,一个单词的至少一个部分可以被正确地识别并且在其中:那个部分可以帮助系统识别整个单词。例如,通过考虑单词″re-vo-ca-tion″,部分″ca″(例如″ca″的语音与″k″的语音相似,因此这里可能是一个已训练的语音模型),并且″tion″(例如以辅音结尾)可能比部分″re″或″vo″更容易识别。基于至少所述已识别的部分、其它部分的语音以及单词包括四个预定义部分的事实,整个单词可以被识别。
可以理解的是:一个单词的一个或多个预定义部分可以被逐字符输入、其余的被逐部分输入。例如,为了输入单词″revocation″,用户可以首先逐字符输入部分″re″,然后暂停。用户然后逐部分输入剩余部分″vo-ca-tion″。最后,用户可以按下一个空格键然后暂停。这个问题早已被详细描述。系统可以识别第一输入尝试对应于一个部分并且因此单词包括四个部分,在其中:至少它们中之一(例如第一个)被正确地识别。系统继续到如前所述的单词识别步骤。
可以理解的是:依据这种方法,被正确识别的部分(组)可以是一个单词中诸如开始、中间或最后一个部分之类的至少一个部分。然后按照所述已识别的部分,相对于所述单词的至少一个下一部分和/或至少一个前一部分可以被识别。
正如前面提到的那样,根据本发明的数据输入系统的原理,不同类型的数据输入系统可以提供。所述系统至少可以是如下系统(每个系统分别存在或者合并在一起)之一:
-一个逐字符文本输入(例如按压与被分配给按键的一个期望字母相对应的一个按键并且提供对应于所述字母的一个语音);
-逐个单词的至少一部分的文本输入系统(例如按压与被分配给所述按键的至少一个单词部分相对应的一个按键并且提供对应于所述至少一个单词部分的语音,并且在其中所述至少一个单词部分通常具有一个以上字符)。
很显然,本发明的逐字符的数据输入系统可以很准确。合并本发明的逐个至少一个单词部分的文本输入系统与本发明的逐字符的数据输入系统一方面可以使系统更加用户友好,另一方面因为更多符号变化(例如单词部分)可以被分配给被系统使用的按键,所以在诸如噪声环境之类的某些条件下系统的准确度可能降低。正如前面提到的那样,例如在噪声环境中,以发音元音结尾的一个单词的一部分(例如,在单词″revocation″中的″vo″)可能被系统错误识别(例如,部分/单词″vol″)。另一方面,甚至在噪声环境中,一个单词的一部分(例如″tion″)仍然被系统正确地识别。
因此,创建一个组合所述逐字符数据输入系统和所述逐个至少一个单词部分的数据输入系统可能是有利的,这样使得用户按照他的方便可以在一个数据如文本输入期间使用所述系统的任何一个(例如,甚至在同一文本的编辑期间合并两个方法),并且在其中:所述组合系统至少没有降低逐所述逐字符数据输入系统。
在输入诸如文本之类的数据时合并所述系统的一个解决方案是使两个系统分别可用,并且用户例如通过使用诸如模式按键或声音命令之类的一种手段从一个系统切换到另一系统。可以理解的是:这个系统可能不合适使用。例如,如果用户尝试通过逐字符输入开始部分″re″来输入单词″recognition″并且逐部分输入所述单词的其余部分(例如预定义部分″cog-ni-tion),则他例如可以按下一个模式按键进入到逐字符模式(例如系统)来输入所述开始部分,其次按下所述模式按键以便进入到逐部分模式并输入所述剩余部分。用户可能常常不知道系统的当前模式,这使得数据输入工作更加累赘。
因此,必须创建一个系统,其合并本发明的所述逐字符数据输入系统和本发明的所述逐至少一个单词部分的系统,如此以使合并的系统可以按照用户的意愿通过所述系统之一处理用户的输入(例如对应于一个字符或者一个单词部分的一个按键按压和语音),而不需要来自用户的附加的操纵(例如辅助的按键按压或者语音命令)。
根据本发明的一个实施例,在为了输入包括一个或多个字符、或者一个或多个单词/单词一部分的一部分文本的一个按压并发声动作期间(例如所述按压并发声动作从用户按下对应于所述一部分文本的第一字符或者第一个预定义单词部分的第一按键并提供对应于所述一个或多个字符或部分的每一个的语音信息开始,直到他暂停的时间为止,其中:在一个按键上的按压动作期间不存在语音可以被认为是对应于所述按键的一个符号的一个语音信息,并且其中:所述语音信息被诸如语音识别系统或唇读系统之类的一个语音识别系统检测到。
用户可以提供逐字符类型的数据输入或者逐部分类型的数据输入。用户可以通知系统所述类型的输入不提供附加操作,并且系统可以按照用户的意图(例如他提供的输入类型)处理所述按压并发声动作。
继续描述实施例,为了通知系统:刚刚提供的一个按压并发声动作必须被本发明的逐字符数据输入系统处理(例如系统在用户的语音与分配给所述相应按键的音素组/语音模型比较期间基本上排除分配给相应按键的预定义单词部分/单词的全部音素组/语音模型,但是考虑诸如至少分配给所述按键的字母之类的其它符号的音素组/语音模型),用户完成所述按压并发声动作而不在所述按压并发声动作末尾提供诸如空格符之类的一个单词结尾信息,然后他暂停。例如,他可以在一个单词的中间或者在所述单词的末尾结束一个按压并发声动作但是在他暂停至少一个预定义时间逝去之前不提供空格符。空格符在所述暂停之前刚刚输入的文本的所述部分结尾处的所述不存在通知系统刚刚提供的按压并发声动作是一个逐字符数据(例如文本)并相应地处理它。
在被系统提供结果(例如所述文本部分的输入输出打印在一个屏幕上)之后或者在所述暂停之后:
-如果在通过所述按压并发声动作提供的所述文本部分的最后一个字符之后将有一个空格符,则用户可以在所述暂停之后(例如在看见输入输出结果被打印在一个屏幕上之后)通过系统输入所述空格符。所述空格符还可以在下一单个数据输入尝试开始的时候被提供。
-如果用户在一连串的字符(比如一个单词)的中间已经结束按压并发声动作,那么在由系统提供结果(例如输入输出打印在一个屏幕上)之后,用户可以继续输入下一按压并发声动作。
下一按压并发声动作可以再一次是一个逐字符数据输入,或者是逐个至少一个单词部分的文本输入。例如,用户可以通过提供两个逐字符的按压并发声动作″r-e-c-o-g″和″n-i-t-i-o-n″来输入单词″recognition″。他首先可以根据本发明的逐字符数据输入系统来输入第一按压并发声动作″r-e-c-o-g″。在所述按压并发声动作之后,他可以暂停一段(例如短)时间逝去(在说话期间暂停是一个自然的人类行为)。系统识别有一个暂停但是没有空格符被提供。系统相应地提供输入输出″recog″,并且用户继续输入下一按压并发声动作″n-i-t-i-o-n″。系统如前所述地运转并连结到第一字符串″recog″的末尾输出/输入字符串″nition″,以便完成单词″recognition″的输入输出。
必须指出:在逐字符数据输入期间,用户可以在单个按压并发声动作期间提供一个以上单词。例如,他可以至少输入一个当前单词的结尾部分并且至少输入紧跟在所述当前单词之后的一个单词的开始部分。在这种情况下,在所述按压并发声动作在期间,在第一个单词的末尾,用户还输入空格符,然后继续(例如所述下一单词的)按压并发声动作。可以理解的是:为了通知系统所述按压并发声动作是一个逐字符输入,用户结束按压并发声动作但在所述按压并发声动作的末尾不提供空格符。例如,为了输入短语″happy birthday″,用户可以在两个逐字符按压并发声动作″h-a-p-p-y--b-i-r″和″t-h-d-a-y″中输入所述短语(例如在每个按压并发声动作的末尾暂停)。注意:在第一个按压并发声动作中,在字母″y″之后,用户输入一个空格符(例如通过按压空格键但不说话)。在第一个按压并发声动作末尾或者第二个按压并发声动作开始时没有空格符或者特殊字符已被提供,因此字母″t″将被连结到字母″r″,来提供短语″happy birthday″。
总之,根据本实施例,为了通知系统逐字符按压并发声动作,用户只需要在他暂停之前在所述按压并发声动作结尾处不输入空格符。
作为一个示例,为了输入短语:
″he is writing a letter to his mother″:
用户例如可以在三个按压并发声动作中逐字符输入所述短语:
″he is writ″
″ing a letter″
″to his mother″
注意:用户:
-在单词″writing″的中间结束了第一个按压并发声动作;
-在第一个按压并发声动作中输入的最后一个字符之后立即开始第二个按压并发声动作,并且在单词″letter″的末尾结束了所述第二个按压并发声动作,但不提供一个空格符,并且;
-以一个空格符(例如,它显然是所述短语的一部分)开始第三个按压并发声动作并且继续所述按压并发声动作的剩余字符的输入,并且在所述短语的末尾结束按压并发声动作,但不提供空格符。
正如所提及的那样,逐部分的数据输入系统可以与上述逐字符的数据输入系统结合如此以使用户可以通知系统一个逐部分的按压并发声动作,而不提供附加的操作。为此目的,与逐字符按压并发声动作相反,用户在一个单词的末尾处完成一个按压并发声动作并且在所述单词之后、在他结束按压并发声动作之前提供一个空格符,然后他暂停。该按压并发声动作可以在一连串字符的开始或中间处开始。例如,单词″recognition″可以分四个部分″re-cog-ni-tion″被输入(例如在所述按压并发声动作期间在所述单词的末尾处提供一个空格符,然后暂停)。
一个单词还可以通过逐字符输入所述单词的开始部分然后逐部分输入所述单词的剩余部分(组)来被输入。例如,单词″recognition″的开始部分″recog″可以通过逐字符按压并发声动作(例如″r-e-c-o-g″,在其中:在所述按压并发声动作的结尾处提供一个暂停)来输入,而剩余部分″nition″可以逐部分来输入(例如″ni-tion″,在其中:在所述按压并发声动作期间在所述单词的末尾处提供一个空格符)。
必须指出:在逐部分的数据输入期间,用户可以在单个按压并发声动作期间提供一个以上单词。例如,用户可以至少输入一个当前单词的结尾部分并且至少输入紧跟在所述当前单词之后的一个单词。在这种情况下,在相应的按压并发声动作期间,在第一个单词的末尾,用户还输入空格符,然后继续(例如所述至少一个下一单词的)按压并发声动作。可以理解的是:为了通知系统所述按压并发声动作是一个逐部分的数据输入,用户通过在他暂停之前在所述按压并发声动作的末尾提供一个空格符来结束按压并发声动作。
总之,根据本实施例,为了通知系统逐部分的按压并发声动作,用户只需要在一个单词的末尾完成所述按压并发声动作并且在他暂停之前在所述按压并发声动作结尾处输入一个空格符。
作为一个示例,为了输入短语:
″he is writing a letter to his mother″;
用户例如可以在三个按压并发声动作中逐部分输入所述短语:
″he is wrtit-ing”
″a let-ter to”
″his mo-ther”
注意:用户:
-总是在完全输入一个单词之后结束每个按压并发声动作并在他暂停之前提供一个空格符。
正如所提及的那样,在逐部分的按压并发声动作期间,用户只需要在他暂停之前在所述按压并发声动作结尾处输入一个空格符。用户可自由选择在各个部分或单词的所述按压并发声动作内是否提供其它空格符。例如,用户可以通过在两个单词之间提供一个空格符来在所述按压并发声动作内分开两个单词。另一方面,所述用户可以通过在两个单词之间不提供空格符来连结一个按压并发声动作内的两个单词。例如,在一个按压并发声动作内,用户可以通过在单词″for″之后输入一个空格符来输入两个单词″for″和″give″。另一方面,用户可以通过输入部分/单词″for″和″give″但在它们之间不提供空格符来输入单词″forgive″。
如果用户期望逐字符输入在字符串的开头、和/或在中间、和/或在末尾处包括至少一个特殊字符在内的一串字符,则他可以在一个或多个按压并发声动作中逐字符输入所述字符串。用户可以通过在输入一个特殊字符之前或之后暂停来在所述特殊字符之前或之后结束所述按压并发声动作。
如果用户期望逐部分输入在一个文本部分的开头、和/或在中间处包括至少一个特殊字符在内的一个文本部分,则他可以在一个或多个按压并发声动作中逐部分(例如同时相应地插入所述特殊字符)输入所述文本部分。只有当逐部分类型的按压并发声动作以诸如标点符号字符之类的至少一个特殊字符结束时,那么用户可以分别输入所述部分和所述特殊字符(组),然后他在暂停之前输入空格符。然后,用户暂停。
必须指出:因为通常空格符出现在一个单词的末尾,在暂停之前在逐部分类型的按压并发声动作的末尾提供一个空格符被预先明确地选择来向所述类型的按压并发声动作的系统发出信号。可以理解的是:代替空格符,诸如标点符号或者命令之类的另一预定义信号可以被用于同一目的。
根据另一实施例,根据另一实施例,逐字符类型的按压并发声动作可以预先明确地以一个字符结尾,而逐部分类型的按压并发声动作可以以除了字母之外的一个字符结束,或者例如以一个命令结束。
根据所述原理,具有相似语音的部分和字符可以被系统区分。例如,如果字母″u″和单词″you″被分配给同一按键,为了输入单词″you″,用户可以按下所述按键并说″yōō″并且在暂停之前,他按下空格键。为了输入单个字符″u″,用户可以按下同一按键,说出所述字母,并暂停。如果用户期望在″u″之后输入一个空格符,那么在所述暂停之后(例如在系统处理用户为所述字符的输入提供的输入之后),用户按下空格键。
根据本发明的另一实施例,一种用于识别用户提供的按压并发声动作的类型(例如逐字符或者逐部分)的统计或概率方法可以被该系统使用。根据所述方法,例如:
-如果在一个或两个或更多连续的按压并发声动作中的一个按压并发声动作期间,在一个空格符之前或之后提供许多按键按压(系统可以记住在前面的按压并发声动作中在最后一个空格符之后的按键按压数目并且把它们加到在下一按压并发声动作中提供的按键按压数目上——如果在所述两个按压并发声动作之间没有空格符被提供),那么很可能所述按压并发声动作是一个逐字符类型按压并发声动作(例如通常按照其音节被划分成不同的部分并且每一部分需要一次按键按压的这样一个单词可能不需要许多按键按压);
-如果在一个按压并发声动作期间,在一个空格符之前或之后至少两次很少的(例如一二个)按键按压被提供,那么很可能所述按压并发声动作是一个逐部分类型的按压并发声动作(例如通常例如按照其音节被划分成不同的部分并且每一部分需要一次按键按压的这样一个单词可能不需要许多按键按压);
-如果在一个按压并发声动作期间,在两个空格符之间的按键按压数目通常是三个或更多按键按压,那么所述按压并发声动作通常是逐字符的按压并发声动作(例如,通常不是所有的顺序单词都有多于三个音节或更多)。
通过使用一种基于至少上述原理或根据每一单词的按键按压数量的其它原理的统计方法(例如独立地或与合并了本发明的逐字符和逐部分数据输入系统的实施例相结合),按压并发声动作的类型可以被本发明的数据输入系统识别。
根据一个实施例,除了依赖向系统通知按压并发声动作的类型的用户信号之外,系统可以使用一种统计或概率方法来确认所述信号。
根据另一实施例,系统首先基于关于所述按压并发声动作的类型的用户信号来处理按压并发声动作,并且如果基于用户通知的所述类型,它没有为所述按压并发声动作识别任何输入输出,则系统使用所述统计或概率方法,并且如果它找到它的需要,则它基于其它类型的按压并发声动作来处理所述按压并发声动作。
例如,如果用户提供逐字符按压并发声动作并且在所述按压并发声动作结尾处错误地输入一个空格符并且暂停,那么根据本发明的一个实施例,系统试图基于逐部分的数据输入系统(例如因为所述空格在所述按压并发声动作的结尾处、在暂停之前)来识别所述按压并发声动作,并且如果它没有发现一个适当的输入输出,则它使用所述统计方法来查看是否用户提供了一个错误的信号。
根据本发明的另一实施例,如果系统基于在所述按压并发声动作的末尾处提供的信号来通过第一类型的输入(例如逐字符或逐部分)处理用户的按压并发声动作,并且系统提供一个并未对应于用户意图的输入输出,则用户可以通过诸如按压一个按压并发声动作的删除按键之类的删除方法来删除所述输入输出。所述删除动作还可以被系统翻译,如此以使系统基于另一类型的输入(例如逐部分或者逐字符)重新处理所述按压并发声动作。反之亦然。图79示出了示范基于本发明这个实施例的一个程序的可仿效流程图。
可以理解的是:在例如一个段落末尾处的一个单词之类的一些情况下,代替空格符,在所述单词之后发出一个″return″命令。依据这个原理,在一个按压并发声动作的末尾处并且在用户的暂停之前用户提供的一个″return″命令还可能被系统认为是所述逐部分信号。
可以理解的是:根据本发明的另一实施例,可以在同一按压并发声动作内提供一个逐字符和逐部分数据。
必须指出:在某些段落中,名词″逐部分″已经被用于简化名词″逐个至少一个单词部分(组)″。
因此,虽然本发明的基本新颖特征被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略以及置换和改变。因此,其目的在于,仅限于为这里所附权利要求的范围所示。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。例如,在不同实施例中描述的逐部分的数据输入系统可以被合并来提供一个极精确的系统。例如在用户逐部分输入一个单词时,系统可以逐部分识别并输入所述单词,并且在所述单词被所述用户输入的末尾处,为了再次确认输入的所述单词,系统可以用刚刚描述的语言约束方法和消除歧义的方法中的一个或多个继续所述单词的平行输入。
例如,虽然在不同的实施例中电话类型的键区被用来示范本发明的不同实施例,但是很显然,对于本发明的实施例,可以使用具有分配到所述键区按键上的任意符号配置种类的任意种类的键区。
为了不频繁重复本发明的数据输入系统的原理,在本申请的许多段落中,提及诸如字符/单词/单词一部分/功能等等之类的一个或多个符号可以被分配给一个按键(或者除了按键之外的一个对象)。可以理解的是:除非另作说明,所述符号通常意欲被分配给与所述按键的一个预定义最简单的相互作用,该相互作用可以是在所述按键上的单按动作(如本发明的许多实施例中所解释的那样)。同时,在解释诸如字母/音素组/字符(字母)组/字母链等等(例如,通常被说出的符号)之类的符号对一个按键的分配之后的许多段落中,为了避免用于输入所述符号的本发明数据输入系统的原理的重复,所述原理也许不被提及。可以理解的是,除非另作说明,很显然,(正如在本发明的许多实施例中所解释的那样),所述种类的符号(例如,通常被说出的符号)通常意指通过与(优选地同时)对应于所述符号的语音结合在相应按键上的相应的按压动作而被输入。
必须指出:在本申请的许多中,名词″character-set″或者″characterset″已经被用于定义字符串。
虽然在本发明的不同实施例中,一个语音识别系统已被提及或者意欲被用于感知并识别用户的语音,但是代替所述语音识别系统或者出了该语音识别系统之外,可以使用一个唇读系统来感知并识别所述用户的语音(反之亦然)。
继续参考本发明的逐部分的数据输入系统,正如所提及的那样,用户可以继续逐部分输入一个单词并且在所述单词的中间暂停。他然后可以继续输入所述单词的其余部分(例如,并且最终,随后单词的随后部分(组))并且最后他输入一个预定义单词结束信号,比如按压一个空格键。
根据一个实施例,在所述单词(组)输入的结尾处的单词结束信号可以通知系统在所述单词的中间的所述暂停前后所述单词(组)已被逐部分输入。根据另一实施例,系统可以把在所述单词的中间处所述暂停之前的部分考虑为逐字符数据输入或者逐部分数据输入。然后,通过考虑在所述暂停之后输入的其余部分,并且通过考虑组合程序以及本发明的词典比较(例如早先所述),系统提供期望的单词(组)。刚刚所述的实施例允许用户在逐部分的数据/输入的中间暂停,同时仍然通知系统数据/文本输入的类型(例如逐字符,逐部分,等等)。可以理解的是:根据本实施例,优选地,一个单词的最后一个部分的输入后面跟着单词结束信号,然后用户暂停。另一方面,如果用户逐字符地输入一个单字的最后一个部分,则在他输入最后一个字母之后,他可以暂停。系统理解所属部分被逐字符输入。然后用户可以输入一个空格符(例如这早已被描述)。
正如早先提及的那样,就在一次发声结束时的诸如预定义字符(例如空格符)之类的一个单词结束信号可以通知系统:最后一个发声是逐部分的数据/文本输入。根据一个实施例,所述预定义信号可以是诸如标点符号字符中的一个、一些或者全部之类的任何种类。例如,为了输入单词″cover?″(例如在其末尾包括一个问号),用户可以分两部分″co″和″ver″输入之,然后他立即可以输入字符″?″,然后暂停。根据本实施例,在所述单词末尾的标点符号标记字符″?″可以通知系统所述单词已被逐部分地输入。另一方面为了逐字符地输入一个单词,并且还在其末尾提供诸如标点符号字符之类的特殊字符,用户可以逐字符输入所述单词,并且在最后一个字符的输入末尾处,他可以首先暂停以便通知系统所述发声为逐字符输入。然后他可以输入所述特殊字符。例如,为了输入单词″cover?″(例如在其末尾包括一个问号),用户逐字母输入所述单词。在输入最后一个字符″r″之后,用户暂停。然后,他可以输入字符″?″。
可以理解的是:为了不频繁重复本发明的数据输入系统的全部名词,可以理解的是:通过使用合并了对应于部分/字符的语音以及对应按键按压的本发明的数据输入系统来输入所述部分/字符。
正如之前所提及并示出的那样,本发明的数据输入系统可以使用至少十个按键,其中:优选地,可以向所述按键的四个分配至少一种语言的字母。还可以向所述十位按键分配数字从0到9如此以使向所述按键的每一个分配一个不同的数字。例如可以通过按压相应的按键但不说话(例如作为一个不说出来的符号,或者通过进入拨叫模式程序)来输入所述数字。所述按键数目和字母数字混合编制的字符在所述按键上的所述布局对于诸如电话之类的设备来说是有利的,其中:一方面,用户可以通过使用语音(例如声音)和按键按压来使用本发明的数据(例如文本)输入系统,另一方面,所述用户可以不说话(例如分开地)来拨号码。图80a根据本实施例作为示例示出了一个键区的十位按键,其中:字母和数字被安排在所述按键上,如此以使所述数字的每一个被分配给所述按键之一。
可以理解的是:除了从0到9的第一组数字的分配(在其中:所述数字的每一个都被指定给所述十位按键的一个不同按键上并且例如被使用于拨号模式(例如通过按压一个相应的按键但不说话来输入每个数字)之外,另一组数字(例如0到9)另外可以被分配给所述键区的一个或多个按键并且利用本发明的数据/文本输入系统来被使用(例如通过按压一个相应的按键并说出对应于所述数字的语音来输入每个数字)。作为一个示例,图80a还示出了被分配给按键8001并利用本发明(例如按下&说话)数据输入系统的数字从0到9。
图80b示出了所述按键的(在它们之间并且在诸如通信设备之类的一个电子设备上)另一布局。所述按键例如可以彼此分开,或者它们可以是单向或多向按键的一部分(例如所述多向按键对一个按压器在四个方向的每一个及其中心上进行响应)。在图80b的示例中,设备可以包括两个多向按键,在其中:它们中的每一个相异地在所述按键的四个角的每一个和中心进行响应。
可以理解的是:根据本发明的另一实施例,可以在同一按压并发声动作内提供一个逐字符和逐部分数据。
必须指出:在某些段落中,名词″逐部分″已经被用于简化名词″逐个至少一个单词部分(组)″。
因此,虽然本发明的基本新颖特征被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略以及置换和改变。因此,其目的在于,仅限于为这里所附权利要求的范围所示。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。例如,在不同实施例中描述的逐部分的数据输入系统可以被合并来提供一个极精确的系统。例如在用户逐部分输入一个单词时,系统可以逐部分识别并输入所述单词,并且在所述单词被所述用户输入的末尾处,为了再次确认输入的所述单词,系统可以用刚刚描述的语言约束方法和消除歧义的方法中的一个或多个继续所述单词的平行输入。
例如,虽然在不同的实施例中电话类型的键区被用来示范本发明的不同实施例,但是很显然,对于本发明的实施例,可以使用具有分配到所述键区按键上的任意符号配置种类的任意种类的键区。
为了不频繁重复本发明的数据输入系统的原理,在本申请的许多段落中,提及诸如字符/单词/单词一部分/功能等等之类的一个或多个符号可以被分配给一个按键(或者除了按键之外的一个对象)。可以理解的是:除非另作说明,所述符号通常意欲被分配给与所述按键的一个预定义最简单的相互作用,该相互作用可以是在所述按键上的单按动作(如本发明的许多实施例中所解释的那样)。同时,在解释诸如字母/音素组/字符(字母)组/字母链等等(例如,通常被说出的符号)之类的符号对一个按键的分配之后的许多段落中,为了避免用于输入所述符号的本发明数据输入系统的原理的重复,所述原理也许不被提及。可以理解的是,除非另作说明,很显然,(正如在本发明的许多实施例中所解释的那样),所述种类的符号(例如,通常被说出的符号)通常意指通过与(优选地同时)对应于所述符号的语音结合在相应按键上的相应的按压动作而被输入。
必须指出:在本申请的许多中,名词″character-set″或者″characterset″已经被用于定义字符串。
虽然在本发明的不同实施例中,一个语音识别系统已被提及或者意欲被用于感知并识别用户的语音,但是代替所述语音识别系统或者出了该语音识别系统之外,可以使用一个唇读系统来感知并识别所述用户的语音(反之亦然)。
同样正如前面提到的那样,本发明的数据输入系统的某些或所有方法,诸如本发明的逐个至少一个单词的至少一个部分之类的,可以利用语言上的文本输入识别系统来被使用,比如可能匹配的单词的音节数目、可能识别的句子的单词数目、一个单词在一个短语内的位置等等。这个问题是本领域技术人员已知的。
具有不同按键数量(例如1,2,3,4,6,8,10,12等等)的不同键区、不同种类的按键(例如软按键,硬按键等等)、按键在所述键区内的不同布局(例如配置)、以及符号对所述按键的不同分配等已经被描述并且被示出用本发明的数据输入系统而被使用。图81示出了另一键区,在其中:英文字母表的字母按照另一优选的方式被分配给所述按键的四个。
正如前面提到的那样,本发明的数据输入系统可以使用诸如一个表面(包括但是不限制为触摸感应表面(例如触摸感应垫,触摸屏等等))的软/虚拟/区域之类的任何种类的按键/区域。同样正如所提及的那样,一个感应垫的不同区域可以对应于一个键区的不同按键,在其中:通常可以向所述区域的每一个分配本发明的数据输入系统的符号的不同符号子组。
同样,正如前面提到的那样,本发明的数据输入系统通常可以使用一个预定义数目的按键/区域(例如1,2,3,4,6,8,10,12等等,这取决于系统设计)。所述按键/区域的每一个通常可以具有一个相对于所述表面的至少另一按键/区域的预定义位置。正如前面提到的那样,根据本发明的一个实施例,系统可以使用具有包括四个按键的若干按键的一个键区:
-对其分配至少一种语音的字母表字符,和/或;
-表示一种语言的字母表的字符。
把至少一种语言的所有字母表字母(例如并且最终,至少一部分诸如数字标记之类的其它符号)实质上分配给形成2×2按键表格(例如优选地用一只手来使用),或形成按键上的两个分离列(例如优选地,将被两只手使用的)四个按键的优点已经在本发明人申请的不同专利申请中被详细描述。
简要地,一方面,所述按键编号和布局允许用户触摸所有的所述四个按键(例如用一个或两个大拇指),因此在允许快速键入的键入时不注意按键,而另一方面,用分离具有与彼此有关的歧义相似语音的字母的方法把字母表字符分配给所述四个按键,并且把它们中的每一个分别地分配给所述四个按键中的一个。基于这些原理创建的原型所示的测试示出:一个具有极高准确性的超高速数据输入可以被专家提供。如在本发明人申请的不同专利申请中所示并解释,更多诸如在所述四个按键每边的一个或两个按键之类的按键可以被提供。优选地,所述四个按键可以彼此接近,并且所述更多按键可以实质上与所述四个按键相距较远。
可以理解的是,如之前在本发明人申请的不同专利申请中所提及,所述表面可以是任何类型的表面,并且被用来定义区域/按键的系统可以使用诸如压力传感器、热传感器、光学系统之类的任何类型的技术来例如跟踪用户手指的运动等等。
此外还如在所述申请中所提及,用户手指在感应表面上的不同位置可以对应于不同的按键,其中,一种语言的不同符号群可以被分配给各个所述位置(例如按键)。此外还描述了,所述按键在一种表面上的位置可以被动态地定义,因此用户手指对所述表面的第一冲击可以在所述表面上定义一种对应按键,其中,根据本发明的一个实施例,还定义与对所述表面的所述第一冲击(例如按键)有关的至少一部分其它按键的位置。显然,替代于使用其手指,用户可以使用触控笔与所述感应表面交互作用。可以理解的是,所述按键/区域是假想的按键/区域,并且实际上用户手指/触控笔对所述表面的彼此相关的不同冲击位置被系统检测并且分析,因此把所述冲击相关到对应键区的对应按键/区域。
当用使用诸如四个按键(诸如一种语言的至少字母表字母之类的符号被分配给所述按键)之类的少数按键本发明的数据输入系统来使用时,动态按键/区域可以是非常有利的。
尽管任意数量的按键,以及具有被分配给所述按键的任何符号配置的按键配置可以被考虑的与动态键区一起使用,然而根据本发明的优选实施例,与本发明的数据输入系统一起使用的动态按键的预定义数量可以包括四个按键,实质上一种语言的所有字母表字母都被分配给所述四个按键。这可以允许用户与诸如电子设备的触摸屏显示单元之类的表面的(例如软)动态按键交互作用而不需要看着所述表面。当一个电子设备的显示单元还被用作包括虚拟(软)按键的输入设备时,这是非常重要的。在所述显示单元上具有诸如四个按键之类的少数用于输入数据的软按键允许最终不显示所述按键以及它们的键帽(例如在所述按键上打印的对应符号)。用户可以记住每个按键/区域的近似位置以及被分配各个按键/区域的符号。这允许系统使用整个显示屏来显示其它的输出。在诸如PDA之类的小计算设备中,这可以是非常有利的。
根据本发明的一个实施例,基于用户对诸如与本发明数据输入系统一起使用的感应表面之类的表面的触碰(例如用他的(一个或多个)手指或者用触控笔等等),系统可以动态地在所述表面上定义预定义的按键/区域,其中,所述区域/按键复制用户/系统所使用的预定义键区模式的按键布局,并且系统使用所述动态按键/区域与本发明的数据输入系统。所述感应表面可以是一个电子设备的触屏(例如显示单元)。每个不同的预定义键区模式可以包括区域/按键的不同预定义数量,和/或不同的区域/按键配置(例如相对于所述数量的区域/按键的其它区域/按键具有预定义位置的每个所述区域/按键)等等,(例如不同)符号配置可以被分配给所述模式。这些问题已经在之前被详细描述。
通过继续说明实施例,图81a作为例子示出了一个诸如平板计算机8100之类的电子设备,平板计算机8100具有触摸感应屏8101并且包括本发明的按压/扫过并发言的数据输入系统。在这个例子中,所述数据输入系统可以使用软(例如虚拟)键区8102,其具有四个固定地位于所述屏幕8101的软区域/按键,符号(如前所述地比如字母表字母等等)被分配给所述屏幕8101。尽管所述触摸感应屏可以包括在所述屏幕上固定地预定义位置的区域/按键,然而为了诸如具有用户友好的用户接口之类的不同原因,用户可以被允许在所述屏幕的任何期望位置上键入/扫过。例如,用户可以希望在所述屏幕的另一个位置8103键入。为此,如在本发明人先前的专利申请中所提及,系统可以基于所述屏幕上的一个8014或多个用户(例如手指、触控笔)的一个或多个触碰来动态地定义所述区域/按键。所述(一个或多个)触碰可以定义所述动态键区的一个8105或多个区域/按键的位置,并且基于定义所述一个或多个区域/按键的位置并且通过考虑对应的预定义键区模式,所述动态键区8109的所有按键8105-8108实质上都可以在所述表面上被定义,因此与所述屏幕8101上每个有关的所述动态区域/按键8105-8108的位置都复制彼此相关的所述预定义键区模式的按键的位置。例如,如果所述预定义键区模式类似于键区8102,则所述动态键区8109可以具有相同的按键/区域配置。
用于在诸如感应垫或触摸屏之类的表面上定义动态按键布局(例如动态键区)的动态按键/区域的位置和大小的不同方法可以被提供。为了定义所述按键/区域,诸如预定义按键数量、彼此相关的所述按键位置、所述按键/区域的大小等等之类的不同参数可以被考虑。
根据本发明的一个实施例,当用户使用他其中一只手的一个或多只手指来按压所述四个区域/按键时,对于一个更好的识别系统,所述四个区域/按键(通常实质上被分配了至少一种语言的字母表字母)可以优选地形成一个2×2的按键表格(例如类似于一个具有四个角的多方向按键)。如果存在更多的按键(比如在所述四个按键每边的一个或两个按键),则优选地,所述四个按键可以彼此接近,并且所述更多按键可以实质上与所述四个按键相隔较远的距离。例如,为了允许更多的灵活性,在所述四个按键的右、左、上和下的任意远距离的任何用户的(例如触控笔或手指)都可以对应于所述按键数量的另一个预定义按键。根据本发明的一个实施例,为了在数据输入期间给予用户更多的自由度,动态键区的外部区域/按键的大小可以是位于具有其它按键的所述按键和感应表面外部边界之间的表面。
根据本发明的一个实施例,在(通过使用本发明的按压/扫过并说话的数据输入系统)数据/文本输入序列之前,通过敲击/扫过所述表面的一个(例如新的)部分,一个人工校准程序可以被提供用于在诸如触摸(感应)屏幕或触碰感应垫之类的表面上定义动态键区按键/区域的位置。基于诸如按键/区域的预定义数量、彼此相关的所述按键/区域的位置、所述按键/区域的大小等等之类的不同参数的不同的人工校准程序可以被考虑。例如,一个数据/文本输入序列通常通过经由本发明的数据输入系统(例如通过按压/扫过与对应语音信息相结合的对应按键)输入多个连续符号(例如字符)并且在输入所述多个符号之后至少暂停一个预定义时间消逝而被定义。
例如,通过参考一个诸如具有在2x2的按键表格中安排的四个区域/按键的图81的键区8102之类的键区,并且通过参考图81a,如果用户希望在诸如触摸屏8100之类的触摸感应表面的部分8111上创建一个动态键区,则在数据/文本输入之前,他可以首先在他想键入(例如按压/扫过)的所述屏幕部分上画出一个诸如交叉符号8112之类的符号。所述屏幕部分上的交叉符号可以告知系统至少一个数据/文本输入序列将在屏幕那个部分被提供,并且优选地,所述屏幕上的所述交叉符号的两条直线的开始和结束位置8113-8116可以近似地定义用户将使用的动态键区8119(例如对应的假想按键/区域在此由中断线画出)的四个动态区域/按键。然后,用户因此而开始输入数据/文本。
除了所述四个按键(例如形成一个2×2的按键表格或形成分别具有两个按键的两列分离按键)之外,如果对应的预定义键区模式的预定义按键数量包括额外按键,其中,所述按键相对于所述四个按键具有预定义位置(例如分别在所述四个按键的左右边的一个按键(例如参见图69的键区6900),则系统还可以基于所述交叉符号来定义对应的额外动态按键的近似位置。图81b示出了一个类似于图81a的8119的动态键区81010,其具有两个额外的按键8117、8118。在此,动态键区及其按键/区域已经基于一个类似于图69的键区6900的预定义键区模式被定义。因为与所述键区的其它按键有关的它们的位置(例如在所述键区的外部(例如左右)位置),所述按键8117、8118可以具有较大的大小以便允许更多的灵活性。
请注意,通常例如为了允许更多的灵活性,与所述2×2按键表格或所述每列按键的右、左、上和下有任意远距离的任何用户(例如触控笔或手指)触摸可以对应于一个键区模式的对应按键。
除了所述动态键区之外,在所述感应表面(例如屏幕)的预定义固定位置处的一个相似的软键区81011也可以配备有该系统。
必须指出,画出一个诸如所述交叉之类的预定义符号同时可以告知系统数据输入序列的开始。
可以理解的是,上述的动态键区和按键配置是作为示例被示出并描述的。具有不同的按键数量、和/或不同的按键配置的其它键区也可以被考虑。此外,替代于一个交叉符号,其它符号也可以定义一个对应于预定义键区模型的动态键区。例如,为了定义图81a的相同的键区8119,在感应表面一部分上画出一个预定义线条(例如水平线、对角线、垂直线)可以定义对应于对应的预定义键区模型的动态按键的两个动态按键(例如分别在所述线条两端),并且基于所述两个动态按键和所述键区模型,所述感应表面上的所述动态键区的其它按键也可以被定义。图81c示出了在感应表面8130上画出的对角线8131。如所述,所述对角线的两端8134、8135定义了所述动态键区8133的两个对应按键8136、8137,并且基于所述表面上的所述两个动态按键的位置并且基于所述键区模型,所述感应表面上的所述动态键区8133的其它按键也已经被定义。
校准程序甚至可以基于感应表面的期望部分上的单个敲击/触摸。例如,所述单个敲击可以定义对应于键区模式的对应按键的动态键区的预定义动态按键的位置。然后,基于所述第一动态按键和所述键区模式,所述感应表面上的所述动态键区的其它按键也可以被定义。参考图81d,例如,如果用户预定义地按压/触摸一个新的屏幕部分8139上的位置,则系统可以认识到用户正在使用所述屏幕的一个新的部分来输入数据/文本。系统可以在所述触摸点(例如触点)81310处分配第一个动态区域/按键81311,其中,所述动态按键/区域表示/对应于一个对应键区模式的预定义按键,并且基于所述第一动态区域/按键和预定义键区模式(例如按键配置),系统在所述感应表面(例如触摸屏)的所述新部分8139上定义新动态键区81317的其它动态区域/按键的位置。在这个例子中,用户在新的屏幕部分8139上的(例如第一)触摸点81310定义了所述动态键区81317的右上方区域/按键81311。基于所述动态区域/按键81311,系统还定义了所述动态键区81317的其它动态按键/区域81312-81316。
本发明的数据输入系统所使用的动态按键/区域可以具有几个优点。例如图81e中所示,用户可以用单手或双手以一个期望位置(例如斜)握住电子设备8140并且通过在屏幕8141上的方便部分8142处通过敲击/扫过来输入数据。根据一个实施例,所述电子设备可以包括一个装置来动态地定义一个诸如水平线(例如,对应线条8143可以被打印在所述屏幕上)之类的(虚拟/假想)线条,因此当用户在所述屏幕上提供单次触摸8144时,系统能够定义对应的动态区域/按键4145,以及相对于所述区域/按键4145和所述水平线4143的其它区域/按键。
仍然根据另一个校验方法,用户可以触摸对应于一个对应于预定义键区模式的虚拟键区的虚拟按键的所有点。
根据本发明的一个实施例,系统可以记住用户所使用的最后的动态键区及其在屏幕上的位置,因此除非另外决定,否则所述动态键区可以是他/她下次使用所述屏幕部分来进行一个新的数据/文本序列输入时的缺省动态键区。这些可以避免每当用户通过使用最后的动态键区来提供一个新的数据/文本序列时对一个新的校准程序的需要。如果用户希望改变他与所述表面的交互作用的所述位置(例如,使用所述感应表面的另一个部分来进行按压动作),则他可以在新的期望位置重复一个新的校准程序。
如在本发明人申请的先前专利申请中所述,通过预定义的手指、指纹或手指部分来按压感应表面上的一个位置可以定义一个对应的预定义动态按键/区域,并且显然如前所述,基于所述一个预定义按键/区域,系统可以在所述表面上定义对应的动态键区的所有按键。例如,用户可以向他的大拇指(例如,当所述大拇指按下屏幕时被预定义地分配用于告知系统校准程序)来按压触摸屏上的一个位置以便定义所述表面上的预定义键区的第一动态按键的位置,并且基于所述第一动态按键,所述触摸屏上的所述键区的其它动态按键的位置也可以通过该系统被定义。使用预定义的手指、指纹、手指部分等等来定义一个动态键区可以具有许多优点。例如,与屏幕的意外交互作用不会造成诸如定义用户不希望的错误键区之类的错误交互作用。其它优点可以是例如通过使用他/她的指纹在屏幕上定义一个动态键区,用户可以使用一个不具有最初集成键盘的电子设备。所述设备还可以不接受外部键盘。在这种情况下,用户只能通过定义一个动态键区来操作所述电子设备。这可以提供一个安全特性,因此其它用户不可以使用所述用户的电子设备。手指、指纹、手指部分等等的识别,以及使用与语音(例如,话音/嘴唇)识别系统相结合的所述识别系统的数据输入系统已经在本发明人申请的不同专利申请中被详细描述。如之前所提及,所述手指识别系统和所述数据输入系统可以被合并例如来提供更加增强的数据输入系统。
另一个键区按键的键入配置已经在本发明的不同实施例中被描述并示出(例如图63a),其中,键区按键被划分成两个按键子群并且其中,按键的每个所述子群都被置于电子设备的一侧,因此当用户用双手握住所述设备时,他可以用他的对应的一只手的大拇指来操作所述每个按键子群。这类键区的优点已经在本发明人申请的不同专利申请中被描述。
根据本发明的一个实施例,如果用户希望通过使用每个所述按键子群的触摸感应表面各个边上的新位置,以便用前述类型的键区来输入数据,则他首先可以提供一个诸如之前所述之类的预定义校准程序。例如图81f中所示,用大拇指对预定义边8152的预定义按压动作8154可以定义对应动态键区的第一区域/按键8155,并且通过考虑键区模式8156,因此所述动态键区的其它区域/按键(例如,每个边的每个动态的按键子群8157、8158的区域/按键)可以在对应边8152、8151上被(例如对称地)定义。
根据本发明的一个实施例,如果用户希望通过使用每个所述按键子群的触摸感应表面每边上的新位置来使用一个前述的键区类型来输入数据,则他首先可以为所述每个按键子群提供一个预定义校准程序,并且然后开始输入所述数据/文本。为所述每个按键子群提供一个校准程序的原因是用户两个大拇指在对应于两个对应键区模式的对称按键(例如,一个按键在所述键区的每边上)的所述表面(每个在一边上)上的接触点可能在所述感应表面上不对称。
图81g作为示例示出了一个诸如具有触摸屏8169的平板计算机8160之类的电子设备。根据本发明的一个实施例,用户希望在所述屏幕的每边8161、8162上创建一个具有许多按键的动态键区,因此通过使用每边的按键用对应的大拇指来键入信息。为了创建一个对应的动态键区,用户可以通过为所述每个按键子群提供一个信息来提供一个校准程序。所述信息可以是诸如之前解释之类的任何类型的信息。例如,用户可以用他的每个大拇指在触摸屏8169的对应部分上提供一个预定义的按压/触摸动作8163、8164。基于对应边上的所述每个触摸点,所述动态键区的动态按键的每个子群的对应动态按键/区域(在屏幕的对应边上)可以被定义,并且因此,所述表面每边上的每个区域/按键子群的其它区域/按键也可以被定义。
如之前所提及,为了校准目的,用户可以按压感应表面上的所有区域,所述区域对应于其手指在数据序列输入期间在所述感应表面上的位置。如之前所提及,所述位置可以被用来定义所述表面上用于本发明的数据输入系统的区域/按键的位置。通过参考图81g,例如,根据本发明的一个实施例,用户可以分别用双手大拇指来按压/触摸对应于所述感应屏幕上的所述键区的对应接近动态区域/按键的所有位置(例如,通过每个对应的大拇指来三次触摸每边的不同位置)。
请注意,动态键区的两组按键中每组按键之间的距离可能彼此显著地不同。例如例如图81f中所示,按键子群8157的按键之间的距离可能显著地短于而第一按键子群8157的按键和另一按键子群8158的按键之间的距离。用户可以被允许在屏幕上的方便位置处定义动态键区的区域/按键。
根据本发明的一个实施例,基于用户决策,用户可以动态地定义按键数量、它们在对应表面上的位置、以及符号对所述按键的分配。
必须指出,当在文本输入期间定义用户的手指或触控笔(例如对应于区域/按键)在一个表面上的近似位置时,系统可能需要两个相邻位置之间的最短距离。根据一个例子,两个相邻位置之间的所述最短距离可以是一个成年人指尖的大小。根据另一个实施例,如图81h所示,当系统创建一个动态键区时,它在两个区域/按键(例如8171、8172)之间定义一个边界(线)8179。当用户试图按压区域/按键8172并且同时错误地按压了两个区域/按键8172、8171时(例如按压了所述边界线8179),那么系统可以分析所述按压动作的碰撞区域8178来判断用户意图按压哪个按键(例如,所述区域/按键可能是具有较大部分的所述碰撞区域8178的区域/按键8172)。
根据本发明的一个优选实施例,通过开始诸如通过敲击/滑动电子设备相关/的期望(感应)表面部分来写入文本之类的输入数据,用户可以避免一个校准程序。基于在输入所述数据时对所述表面上的不同位置的不同按压/滑动碰撞的位置,并且通过考虑系统使用或者用户选择的预定义键区模式(例如具有预定义按键配置),系统定义了所述表面上的动态键区的对应动态区域/按键(例如对应于所述键区模式)。例如,通过使用图81i的键区模式(例如按键配置)8189并且通过考虑所述键区模式的符号配置,如果例如用户通过敲击屏幕8180上的不同位置(例如并且提供对应的语音信息)来输入字″write″,其中,所述屏幕8180上的所述敲击位置对应于所述预定义键区模式8189的按键位置,则基于所述表面上彼此相关的所述敲击位置,系统识别出对应于所述表面上的所述预定义键区模式的动态键区的所有动态区域/按键的位置。在这个例子中,在只有三个键压之后,动态区域/按键8181、8183和8183(例如分别对应于字母″w″、″r″和″i″)被定义,并且系统可以定义所述动态键区的第四动态按键/区域8183的位置。所述动态区域/按键8183位于与其它按键有关的左下侧位置。
可以理解的是,如同之前所描述的,被分配给每个按键的具有不同按键数量和/或不同按键配置和/或不同符号的不同预定义键区模式可以和本发明的数据输入系统一起使用,并且基于刚描述过的原则,因此不同的对应动态键区可以在一个(感应)表面上被定义。
必须指出,如果用户希望输入一个具有至少少数单词的文本,则一个好的校准方法正在输入几个单词,因此基于对应数据输入系统所使用的预定义对应按键配置(例如键区模式),用户手指/笔在表面上的触摸碰撞自动地在所述表面上定义了所述区域/按键的位置。这个方法不需要来自用户的额外操作。在这种情况下,系统可以记住按键的按压/扫过以及对应的语音,直到用户提供至少一个定义所述动态键区的所有动态区域/按键位置所必需的最小数量的键压为止。然后,系统可以开始识别系统提供的包括所述最初记住的输入在内的输入。
另一方面,如果用户希望只输入诸如少数字符之类的少数符号并且所述少数符号不足以为定义对应于所述键压的动态区域/按键位置的标识提供必需的信息,则用户可以提供一个诸如之前所述之类的校准步骤,或者提供诸如用系统/设备来使用可用于此目的的固定软或硬按键之类的另一个方法。
根据本发明的一个实施例,除了动态区域/按键之外,一个电子设备还可以包括诸如图81a中所示的软按键81010或硬按键81011-81012之类的固定的软或硬按键。为了避免用于输入少数字符的校准步骤,用户可以使用与对应语音信息(例如,语音或没有对应键压)相结合的所述按键。
为了避免意外的数据输入,一个诸如按压一个预定义模式按键、话音命令等等之类的预定义信号可以被提供给系统以便告知系统数据/文本输入模式的进入或退出。根据另一个方法,校准程序可以告知系统数据/文本输入的开始。
根据本发明的一个实施例,系统可以记住用户最后所用的动态键区及其在屏幕上的位置,因此所述动态键区将是他/她下次进行一个新发言(一个发言是用户在两个暂停之间输入(例如通过按压与对应语音信息相结合的对应按键)的多个符号(例如字符),其中每个暂停定义为在一次发言后暂停一段预先定义的最短时间流逝)时的缺省动态键区。这可以避免每当用户使用最后的动态键区来输入一个发言时需要新的校准程序。根据本发明的一个实施例,动态按键/区域和至少一部分被分配给所述区域/按键的符号可以动态地在触摸屏表面上的对应区域/按键上被打印,因此用户看得见它们(例如当输入数据时)。根据另一个实施例,当被期望时,所述区域/按键及其对应的被打印符号可以被隐藏(例如当被隐藏时,所述区域/按键可以仍然在活动中)。一个可用于系统并且被用户所用的告警装置可以告知系统显示或隐藏所述区域/按键布局和所述符号。隐藏所述区域/按键和所述被打印符号可以允许用户例如在输入数据/文本时将整个屏幕用于其它信息。
尽管在上面提及的实施例中,触摸屏被指定用于创建和使用动态按键,然而可以理解的是,诸如感应垫之类的任何其它类型的表面,用于检测用户手指触摸表面并且在所述表面上定义对应的按键配置的光学装置等等可以被用于相同的目的。
必须指出,在文本输入期间,基于在除了最后的动态键区占用的所述表面部分之外的所述表面部分上的用户笔划,系统可以动态地再定义(例如再校准)对应表面上的区域/按键动态键区的位置。例如,通过考虑图81j中所示的图81i的键区模式8189,用户可以通过(例如感应)表面8190的第一部分8191上的扫过/按压来输入单词″thank″(例如分别按压所述第一部分8191的接触1到5),并且通过所述(例如感应)表面8190的第二部分8192上的扫过/按压来输入单词″you″(例如分别按压所述第二部分8191上的接触1到3)。在这个例子中,通过使用具有四个按键的所述键区模式(例如一个2×2的按键表格)以及对所述按键的对应字母分配,在输入(例如第一单词″thank″的)三个开始字母“t、h、a”之后,通过按压所述表面8190上的第一部分8191的三个位置(分别,碰撞1、2、3),系统动态地定位用户正在使用的对应动态键区的动态区域/按键8193、8194、8195的位置。基于定义所述三个动态区域/按键的位置并且通过考虑键区模式,系统定义对应动态键区的其它(一个或多个)区域/(一个或多个)按键8196的位置。请注意,触摸其它位置上的触碰(例如在此,对应于字母″k″是触碰5)还可能定义所述动态键区的其它对应区域/按键(例如在此是第四动态区域/按键)的位置。
对于输入第二单词″you″,用户可以通过使用相同的键区模式和符号分配来使用所述(例如感应)表面8190的另一个部分8192。在输入三个字母″y、o、u″之后,通过按压所述表面8190上的第二部分8192上的三个位置(分别是触碰1、2、3),系统可以认识到用户正在使用所述(例如感应)表面8190的第二部分8192来输入当前的数据。系统动态地定位用户正在使用的新动态键区的新动态区域/按键8197、8198、8199的位置。基于定义所述三个新动态区域/按键的位置并且通过考虑键区模式,系统定义新动态键区的其它(一个或多个)区域/(一个或多个)按键81910的位置。
请注意,在数据/文本序列输入的开始符号输入期间,用户对(例如感应)表面的扫过/按压对应于一个符号的输入(例如字母″w″),其中,通常由语音识别系统单独正确地辨别的所述符号可能足以在其对应于一个预定义键区模式的对应动态键区内定义对应于所述触碰的动态区域/按键,并且基于所述区域/按键,系统可以定义所述动态键区的所有动态按键/区域位置。
应当指出,数据输入系统可能包括几个被记住的键区模式(例如按键配置),并且其中,基于用户按压动作对(例如感应)表面的触碰,系统识别出用户使用哪个所述预定义键区并且因此动态地定义所述表面上的对应动态键区按键位置。此外请注意,几个活动键区(例如固定、动态)可以在屏幕上可用。例如,如果用户已经在屏幕上创建了两个动态键区,则这两个动态键区都同时可用。
根据本发明的一个实施例,用户提供的键压不断地被系统分析以便定义它们是否属于当前的动态键区按键。如果在某一时刻,系统识别出用户提供的键压不对应于直到那时都在被使用的动态键区,则系统可以自动地设法基于最近的键压来定义一个新的动态键区。本发明的扫过(例如滑动)和/或按压(结合语音信息)的数据/文本输入系统已经被详细地解释。简而言之,如上所述,为了输入一个单词/单词一部分(例如或者至少一个单词的至少一个部分),用户可以在对应于构成所述单词/单词一部分的至少一部分字母的(感应)表面的按键/区域上扫过其手指或笔,并且优选地,同时提供一个对应于所述单词/单词一部分的语音信息(例如先前提到,所述单词/部分的语音可以是说出所述单词/单词一部分,或者逐字符说出它的字符(例如字母),等等)。然后,系统在其单词/单词一部分的数据库内选择包括许多包括每个字母组的字母的单词/单词一部分,正在被扫过/按压的每个所述区域/按键表示所述字母组,并且正在被扫过/按压的所述按键的顺序(例如第一、第二、第三、...)类似于所述单词内的彼此相关的所述字母编号的字母顺序(例如第一、第二、第三、...)。根据一个优选实施例,扫过轨迹的开始和结束点(例如按键/区域)可以优选地对应于所述单词/单词一部分的开始和结束字母。这些问题已经在本发明人申请的先前申请中通过附图被详细描述并示出。
本发明的按压和/或扫过的数据/文本输入系统可以使用上述的动态按键/区域布局。
根据本发明的一个实施例,通过经由本发明的扫过并说话的数据输入系统输入诸如文本之类的数据,系统可以定义对应于用户所用的预定义键区模式的对应动态键区的区域/按键。所述预定义键区可以由系统来建议(例如,作为缺省)或者是系统可用的预定义记住键区中的一个。图82示出了一个可仿效的键区模式(例如82010),基于所述键区模式82010,通过扫过数据输入系统在感应表面8200的部分8209上输入可仿效单词″thank″的一个可仿效步骤。例如,通过提供对应的扫过轨迹8104中的三个(开始点8201,和两个角度8202、8203),系统可以在所述表面上定义对应的动态键区的区域/按键8205-8208(例如包括第四按键8208)的位置。
必须指出,在文本输入期间,系统可以基于用户在所述表面的不同部分上的扫过轨迹/笔划来动态地再定义(例如再校准)区域/按键的位置。例如,用户可以通过扫过表面的一个部分8209来输入单词″thank″,并且通过扫过所述(例如感应)表面的另一边82019来输入单词″you″。在这个例子中,在感应表面8200的第一部分8209上输入单词″thank″之后,为了输入第二单词″you″,用户可以使用所述(例如感应)表面8200的另一个部分82019来提供对应的扫过动作/笔划82014。系统可以认识到用户正在使用所述(例如感应)表面8200的另一个部分82019,并且基于对应于字母″y、o、u″的所述三个点82011、82012、82013,系统如前所述地再创建一个对应于预定义键区模式的新的当前动态键区82015。
已经继续说明了使用动态键区的扫过数据输入系统,正如前面详细地提到的那样,尽管在很多情况下只提供单词/单词一部分的开始和结束字母就足以识别所述单词/单词一部分,然而为了数据输入系统的更好的准确性,(例如通过扫过它们的对应区域/按键)提供所述单词/单词一部分的更多字母可能是有利的。例如图83中所示,通过考虑键区8300,如果用户的扫过动作/笔划的轨迹8308分别只通过按键8301和8302,分别对应于所述第一和最后字母(例如当说出期望单词时),则歧义地具有实质上类似的语音并且都具有相同的首尾字母(t、k)的单词″thank″和″think″可以造成歧义。系统可能错误地输出其它的单词。因此,(例如通过在所述扫过动作/笔划期间分别还扫过所述额外按键)提供至少一个额外的按键信息可以帮助系统准确地识别想要的单词/部分。仍然通过参考图83,例如,为了如图所示通过扫过轨迹8309来输入单词″thank″,用户可以分别在对应于单词″thank″字母″t、a、k″的区域/按键8301、8304、8302上扫过并且(例如同时)说出所述单词。
如前所述,通常,只有对应于单词/部分的字母及其语音的一部分按键信息(例如通常,按键信息对应于开头、最后、以及最终对应于所述单词/单词一部分的一部分中间字母)就足以识别所述单词/部分。
先前提到,如果用户希望连续地输入位于同一按键上以便更好识别的单词/部分的两个或更多字母,则用户因此可以显著地改变所述按键上的扫过轨迹(例如笔划)的方向(例如,所述按键上的轨迹线中的连续角度数目对应于所述字母数目。这个问题已经在前面被详细地描述)。图83a-83b作为例子示出了用于输入单词″dime″的两个不同的扫过轨迹。图83a的扫过轨迹8319示出用户已经扫过三个按键8311、8312、8313并同时说出单词″dime″。系统分析所述语音并尝试把所述语音匹配到它的数据库的单词和单词部分(如前所述,在本发明的单词/单词一部分的数据输入系统,通常,被分配给系统所用按键的一种语言的单词是具有一个音节的单词。这允许在数据库的单词数受到限制。甚至一部分具有一个音节的单词也可以被划分成两个或更多的部分。这些问题已经被详细描述,其包括三个或多个的字母并且其中,所述单词/部分内的所述字母及其彼此相关的顺序对应于区域/按键及所述区域/按键被扫过的顺序。例如,除了单词″dime″之外,诸如表格C中所示之类的其它单词/单词一部分在下面可以被系统考虑到(例如所述单词遵循下列选择条件):
区域/按键    对应于单词内的字母的键压
单词/部分    8311    8312    8313
Dime         d       i/m     e
Crime        c    r  i/m     e
Cieve        c       i    ev     e
Cus          c       u            s
Lite         l        i/t          e
表C
如表格C中所示,例如,对应于键压8311的单词″crime″的第一字母(例如在此是开头的字母)是字母″c″。所述单词内的对应于下一键压8312的下一个字母(例如在此是所述单词中间的字母)是字母″i″。并且最后,对应于下一键压(例如在此是最后键压)8313的下一个字母(例如在此是最后的字母)是字母″e″。
还例如,单词″dime″对应于键压8311的第一字母(例如,在此是开头字母)是字母″d″。所述单词内对应于下一键压8312的下一个字母(例如在此是所述单词中间的字母)是字母″i″或″m″中的任意一个(例如,键压8312对应于一个字母,因此″i″或″m″中的任意一个对应于第二键压)。并且最后,对应于下一键压(例如在此是最后键压)83 13的下一个字母(例如在此是最后的字母)是字母″e″。
通过比较用户语音(例如话音)来记住对应于上述的单词/单词一部分的语音模型,系统可以容易地识别想要的单词″dime″。
图83b的扫过轨迹8329示出了通过提供更多的按键信息被输入的相同单词″dime″。扫过轨迹8321示出已经扫过按键8321、8322、8323,并同时说出单词″dime″,但是他具有提供了两个连续角度8325、8326(例如,按键8322上的轨迹线条8329的两个被改变的连续时间和方向)。
在所述单词内,在对应于键压8321的字母(例如在这个例子中是开头字母)之后和对应于键压8323的字母(在这个例子中是最后字母)之前,系统被告知对应的单词/部分必须包括两个对应于键压8322、8322的字母。系统分析所述语音并且尝试把所述语音匹配到其包括四个或多个的字母的数据库的词和单词的一部分,并且其中,它的四个字母被分配给用户已经扫过的区域/按键,并且其中,所述字母中的两个位于相同的按键8322上,并且其中,按键的被扫过顺序对应于所述每个单词/单词一部分内的对应字母的顺序。在这个例子中,除了单词″dime″之外,诸如表格D中所示之类的其它单词/部分在下面可以被系统考虑到:
        8321     8322     8322     8323
dime       d       i            m     e
crime      c     r      i           m        e
lite       l              i           t      e
表D
如图所示,在这个例子中只有三个单词/单词一部分对应于用户输入。系统可以更容易地把用户语音匹配到单词″dime″。表格C的其它单词不遵循被选择条件。例如,在所述单词内,在对应于键压8321的字母之后和对应于键压8323的字母之前,单词的一部分″cus″只有三个字母,而单词的一部分″cieve″不包括对应于键压8322、8322的两个字母。
请注意,轨迹的不同预定义类型可以被提供用于相同目的。例如,根据本发明的一个实施例,替代于提供对按键的不同连续扫过方位变化(例如8325、8326),用户可以在扫过轨迹内在所述区域/按键上提供一个或多个圆形扫过运动(例如取决于字母编号)。第一圆可以对应于两个字母,而按键上的每个辅助圆可以对应于所述单词对应于所述按键的一个额外字母。
图83c复制了图83b的键区并且通过提供另一个类型的轨迹8339而提供了由图83b的轨迹8329提供的相同信息。按键8332上提供的圆8338告知系统,在所述单词内,在对应于按键8331的字母(例如在这个例子中是开头字母)之后和对应于键压8333的字母(例如在这个例子中是最后字母)之前,对应的单词/部分必须包括两个对应于按键8332的字母。
请注意,任何其它用于操作软/硬按键来提供对应于单词/部分内的字母的信息的装置可以被本领域的技术人员考虑到。
如前所述,本发明的扫过和/或按压的数据输入系统可以允许一个快速并准确的诸如文本之类数据输入。系统可以消除歧义地识别具有类似语音的字符/单词/单词一部分。为此,除了所述语音之外,用户可以为每个对应的单词/单词一部分提供一个不同种类的按键按压/扫过轨迹。例如,具有类似的语音的单词/单词一部分″by、buy、bye、bi″中的每一个都可以通过不同的对应扫过(滑动)轨迹并同时说话所述单词/单词一部分而被输入。图84a-84d通过使用四个按键/区域(例如2×2按键)示出了所述单词/单词一部分中每一个的对应的扫过动作轨迹,其中,字母表字母根据一个优选配置被安排在所述四个按键上。
简而言之,在这个例子中,所述所有单词都具有相同的发音″bi″。在图84a中,轨迹8409包括按键8402上的角度(例如一个方向变化)8405,因此对应单词的两个字母(例如开头字母和一个中间字母)被分配给按键8402,并且最后一个字母在按键8404上。因此,所述单词/部分是″buy″。
在图84b中,轨迹8419示出对应单词的开头字母被分配给按键8412,而所述单词的末尾字母被分配给按键8414。因此,所述单词/部分是″by″。
在图84c中,轨迹8429示出对应单词的开头字母被分配给按键8412,所述单词的中间字母被分配给按键8424,而所述单词的末尾字母被分配给按键8421。因此,所述单词/部分是″bye″。
在图84d中,轨迹8439示出对应单词的开头字母被分配给按键8432,而所述单词的末尾字母也被分配给按键8432。因此,所述单词/部分是″bi″。圆形轨迹8438被示出为轨迹8439的一个替换(例如如前所述)。
根据本发明的一个实施例,在提供一个扫过动作以及对应的语音之后,如果系统由于字母具有含糊不清地相似的语音而在两个或更多的单词/部分之间犹豫不决,则具有对应于用户提供的按键信息的所述字母的单词/部分可以被系统选择为第一选择并且推荐给用户。例如图84e中所示,如果用户在按键8451和8452上滑动(参见轨迹8454)并且说出″time″,则系统把所述语音匹配到两个单词/单词一部分″tine″和″time″,然后,系统可以缺省地把较高优先级分配给单词″time″,这是因为字母″m″被分配给由所述轨迹8554表示的对应按键的按键/区域。为了输入单词的一部分″tine″,用户可以分别在按键8451、8453和8452上滑动(参见轨迹8455)。
基于本发明的按压/扫过并说话的数据输入系统,通过使用一个预定义的按键配置模式(例如一个预定义的键区模式),对应于所述预定义按键配置模式的预定义扫过轨迹(例如轨迹模式)可以被创建并记住,因此当用户在(感应)表面的任何部分上画出其中一个所述模式时,系统将其对应到一个对应于不同的区域/按键按压/扫过的预定义扫过轨迹。图85示出了一个具有2×2按键表格中安排的四个按键8501、8502、8503、8504的键区8500,和表格8505,基于彼此相关的所述键区8500的按键位置来举例说明一部分预定义模式8506,当它们在一个表面上被画出时,系统把它们相关到对应的键压8507。
可以理解的是,在这个系统中,直到用户画出的模式保持一个与其对应被记住模式有关的相似形式,所述模式或其每个线条都可以具有任意的大小(参见符号8508和8509)。这可以向用户提供大量的自由度,因此当他输入诸如字母之类的字符串时,他可以不担心他正在使用的表面部分或者两个按键之间的距离。
继续参考图85,根据一个实施例,一个水平曲线轨迹(例如弧形朝上)85010可以对应于在两个上方按键上的扫过(滑动)动作,而另一个水平曲线轨迹(例如弧形朝下)85011可以对应于所述键区的下方按键上的滑动,或者相反。此外,例如垂直曲线轨迹(例如弧形朝左)85012可以对应于左方按键上的滑动动作,而另一个垂直曲线轨迹(例如弧形朝右)85013可以对应于所述键区的右方按键上的滑动,或者相反。此外,不同的较长斜直较长轨迹85014-185017中的每一个都可以对应于彼此具有对角位置的所述两个按键上的扫过动作。
可以理解的是,通过如同所述地精确告知所述两个按键的标识的在键区两个按键上的扫过动作的方法只是作为例子被说明。基于这个思想的其它方法也可以被考虑。例如,一个较短或较长的直线水平轨迹可以分别对应于扫过所述键区的上方或下方按键,一个较短或较长的直线垂直轨迹可以分别对应于扫过所述键区的左方或右方按键。
通过敲击基于在所述表面上画出前一扫过模式或下一扫过模式的动态键区的区域/按键位置定义而创建的动态键区按键,单个字符可以被输入。
与前一或下一笔划无关地输入单个字符或命令的另一个方法是通过用户手指的预定义部分来按压感应表面上的任何位置,其中,所述手指的所述部分对应于所述键区的一个按键。例如,用右手食指的指肚部分按压所述表面上的一个位置可以对应于按键8501,而用右手食指的指尖部分按压所述表面上的一个位置可以对应于按键8503,或者相反。还例如,用右手食指的指肚部分按压所述表面上的一个位置可以对应于按键8502,而用右手食指的食指按压所述表面上的一个位置可以对应于按键8504,或者相反。结合用户语音将用户手指用于数据输入已经在本发明人申请的以前专利申请中被详细描述。所述系统可以和本发明的任何按压/扫过并说话的数据输入系统一起使用。
如前所述,通过使用本发明的按压/扫过并说话的数据输入系统,输入一个单词(例如通常具有一个音节)或者单词一部分可能需要只引入对应于所述单词/单词一部分的少数(例如在大多数情况下是2-3个)按键。基于这个,扫过轨迹的短模式可以被用来输入所述单词/单词一部分。这可以允许一个快速、容易并准确诸的如文本之类的数据输入。可以理解的是,如前所述,单个笔划(例如轨迹)还可以对应于超过一个的单词。图85a示出了用于每个具有一个或多个部分的不同单词的扫过轨迹。可以理解的是,根据本发明的数据输入系统提供了每个扫过笔划并优选地同时提供了其对应的语音信息。
先前提到,在本发明的结合式按压并扫过的数据输入系统中,诸如字母、数字、标点符号字符以及命令之类的每个单字符可以通过其对应区域/按键上的按压(例如敲击)动作并且通过提供其预定义的语音信息而被输入。这些问题已经被详细地描述。
根据一个实施例,一个电子设备的屏幕可以被划分成不同的预定义区域,因此用户可以输入一个或多个字符而不必提供校准程序。例如图85b中所示,基于第一键区模式85210,电子设备的触摸屏8520可以被划分成四个(例如2×2)区域/按键8521-8524,因此用户经由所述四个按键至少可以输入单个字符。除了另一个动态键区之外,这个键区可以基于相同的键区模式或者基于另一个键区模式。用户可以通过扫过基于预定义轨迹符号轨迹来输入包括两个或更多的字符的单词的一部分,并且通过敲击与所述扫过动作无关的所述四个区域的对应区域/按键来输入单个字母。例如,为了输入单词″cooperative″,通过把所述单词划分成五个部分″co-o-pe-ra-tive″,用户可以提供下列步骤:
1)-在屏幕上任意一处画出轨迹(例如轨迹类型)8525然后/同时说出″co″
2)-敲击8526按键/区域8521然后/同时说出″o″
3)-在屏幕上任意一处画出轨迹8527然后/同时说出″pe″
4)-在屏幕上任意一处画出轨迹8528然后/同时说出″ra″
5)-在屏幕上任意一处画出轨迹8529然后/同时说出″tive″(例如在此,通过提供对应于″tive″部分的开头字母″t″、中间字母″v″以及末尾字母″e″的按键信息。可以理解的是,如之前所提及地也可以考虑其它轨迹)。
根据本发明的另一个实施例并且基于本发明如前所述数据输入系统并且通过考虑相同的键区模型,图85c示出了用于输入相同单词的可仿效步骤。因此,用户可以:
1)-在屏幕8530的一部分上画出轨迹8535,然后/同时说出″co″。基于所画,对应的动态键区85319可以被创建。
2)-在所述动态键区85320的按键/区域8531敲击8536,然后/同时说出″o″
3)-在屏幕(例如这可以造成一个新的对应键区的创建)或所述键区85320的对应按键8534、8531(例如轨迹85317示出相同的轨迹8537扫过所述按键)上任意一处画出轨迹模式/符号8537,然后/同时说出″pe″
4)-在屏幕(例如这可以造成一个新的对应键区的创建)或所述键区85320的对应按键8534、8533上任意一处画出轨迹8538,然后/同时说出″ra″,或;
-在所述键区的对应按键上画出轨迹85318,然后/同时说出″pe″(例如在此,因为用户使用所创建的动态键区85320的按键,所以他可以使用直线轨迹85318)
5)-在屏幕上任意位置(例如,这可能造成一个新的对应键区的创建)或者在所述键区85320的对应按键8532、8531上画出轨迹8539,然后/同时说出″ra″(例如在此,提供对应于″tive″部分的开头和末尾字母的按键信息。可以理解的是,其它轨迹如之前所提及地也可以被考虑),或者;
-在所述键区85320的对应按键8532、8331上画出轨迹85319,然后/同时说出″pe″(例如在此,因为用户使用所创建动态键区85320的按键,所以他可以使用直线轨迹85319)。
可以理解的是,当画出/扫过所述轨迹时,,用户必须通过考虑对应的按键顺序如同所述画出所述轨迹(例如如前所述,例如图85中所示,用相反的方向画出两个轨迹符号(例如85015、85016)可以对应于两个不同的连续键压链。
如同所述并所示,用户可以自由地在数据/文本输入期间的任何时候结合不同的扫过/按压方法,只要用户与屏幕的交互作用提供足够的信息来定义屏幕上的当前、或以前、或下一个笔划的区域/按键的位置。
两个笔划甚至可以在彼此上被画出。例如,在图85b中,彼此独立的两个轨迹8528和8529已经在彼此上被画出。每个所述笔划都提供足够的信息来定义想要的被扫过的按键/区域(例如和最终是对应的动态键区)。
根据本发明的一个实施例,一个单词完成系统可以和本发明的数据输入系统一起使用。单词完整方法已为本领域的技术人员所知。
不同的自动空格方法已经在前面被描述。根据本发明的一个实施例,另一个自动空格方法可以与本发明的数据输入系统相结合。图86作为示例示出了一个具有两组(例如优选地相同)按键8601、8602的电子设备8600,其中,所述每组按键位于所述电子设备8600的一侧,并且其中,所述每组按键至少复制被分配给其它按键组的字母表字母的分配。用户可以通过使用第一组按键8601来输入每个单词的第一部分。如果一个被输入单词只包括一个部分,则用户通过使用相同侧的按键来输入下一个单词。系统可以自动地在以前的单词后提供一个空格。如果该单词包括超过一个的部分,则所述单词的(一个或多个)其它部分可以通过使用第二组按键8602被输入(例如或者相反)。系统不在所述单词的各部分之间提供一个空格符。在输入所述单词之后,用户可以通过使用设备8600的所述第一组按键8601来输入下一个单词的第一部分。系统理解一个新的单词正在被输入并且在以前的单词后插入一个空格,等等。
根据另一个方法,除非用户在输入多个连续的单词的至少一部分之前提供一个单词开始信号,并且在输入所述多个连续单词的至少一部分的最后的单词的至少一部分之后提供一个单词结束信号,否则系统可以自动地在用户输入的每个单词的至少一部分后输入一个空格符。或者反之亦然。
诸如平板计算机或PDAs之类的许多计算设备具有一个触摸感应显示单元。一些所述显示屏对配备有所述电子设备的触控笔按压动作(例如,或一个差不多的按压动作)做出响应。所述触控笔主要被用作所述电子设备的点击(例如鼠标)。一些显示屏还对用户手指对所述它们的按压动作做出响应。
根据本发明的一个实施例,替代于或除了用户的(一个或多个)手指之外,所述触控笔可以被用来用本发明的按压/扫过的数据/文本输入系统来创建并且使用上述的动态键区。所述触控笔还可以被用来完成诸如书写输入之类的其它原始任务,或者被用作一个指向与选择单元(例如鼠标)。
根据另一个实施例,例如,所述触控笔一侧的尖端可以被用于鼠标功能,并且所述另一侧的尖端(例如通过比鼠标侧的尖端更粗,反之亦然)可以被用于本发明的数据输入系统(例如创建按键,和/或敲击按键,画出扫过轨迹等等)。图87作为示例示出了一个触控笔8700,其中,所述触控笔的一个笔尖8701可以被用于提供在对应感应表面上的鼠标功能,并且所述触控笔的另一个笔尖8702可以被用于在所述感应表面上提供诸如文本之类的数据。触控笔8700可以具有一个笔夹型按钮8704。通过推动所述笔夹按钮的几个预定义位置,不同的功能或命令可以被执行。所述笔夹按钮还可以被用来把所述触控笔连结到用户衣服上,比如连结到他的口袋上。
根据图87a中所示的另一个实施例,相同的笔尖8701可以被用于鼠标功能以本发明的及数据/文本输入功能(例如创建按键,和/或敲击按键,画出扫过轨迹等等)。一个诸如按钮之类的装置可以被提供用于在鼠标模式和数据/文本输入模式之间切换触控笔模式。例如,所述装置可以是一个实现在触控笔或电子设备内的按钮、一个预定义的话音命令、或者触控笔在对应感应表面上的预定义交互作用等等。
用于在模式(例如鼠标模式、数据/文本输入模式、手写模式等等)之间切换的按钮可以是之前所述笔夹型按钮(8704)。通过按下所述笔夹按钮的不同预定义位置,该触控笔可以进入一个不同的模式。例如图87a中所示,通过按下笔夹按钮8704的第一边8711,笔尖8701可以被用于数据/文本输入。同一边8711上的另一个按压动作可以使该笔尖起鼠标的作用等等。
根据另一个方法,通过按下笔夹按钮8704的第一边8711,该笔尖可以起一个数据输入装置的作用,并且如图87b中所示,通过按下同一笔夹按钮8704的另一边8721,该笔尖可以起一个鼠标的作用。
笔夹按钮也可以被用于其它的功能。例如,按下笔夹按钮的一边还可以输入一个命令符号。例如,通过按下笔夹按钮8704的一边8721,一个诸如″输入″之类的预定义功能可以被执行。还例如,通过按下笔夹按钮8704的另一个位置8711,一个″Tab″功能可以被执行。所述位置8711上的每个辅助按压都可以使光标跳至屏幕上的下一个制表键的位置。诸如空格符之类的符号也可以被分配给对笔夹按钮8704上的一个位置的按压动作。例如,在一个本发明的扫过并说话的数据输入系统中,在输入一个具有一个或多个部分的单词的一个部分(例如,最后部分)之后或者在那期间,用户可以按压位于触控笔8704上的预定义按钮来告知系统应该在所述部分之后插入一个空格符。所述按钮可以是所述笔夹按钮8711的其中一个按钮。通过告知系统在单词的一部分之后提供一个空格符,可以在输入所述部分期间提供一个更快的数据/文本输入。
触控笔可以被用于更多的功能。例如,如果用户按压笔夹按钮的预定义位置(例如,所述笔夹按钮的预定义按键)并且将其保持在按压位置中,则被分配给所述被按压位置的符号或功能可以被重复,直到该用户松开(例如停止按压)所述按键为止。还例如,一次或两次点击笔夹按钮的不同位置可以被分配给不同的功能。例如,双击笔夹按钮的左边可以被分配给″Caps Lock″功能等等。
通过参考作为示例的图87c,一个诸如单压或双压笔夹按钮8704的一个位置(例如一个诸如按键8711、8721、8731之类的按键等等)之类的交互作用可以结合触控笔的指向笔尖8701被使用来复制一个标准的指向与选择单元(例如一个鼠标)的功能。笔夹按钮的至少一部分按键可以起所述鼠标按键的作用。所述与鼠标和笔夹按钮按键的结合交互作用可以代替鼠标点击功能,或者它可以向已被描述的触控笔鼠标功能添加补充功能性。例如,用户可以用笔尖指向一个文件图标,并且双击笔夹按钮的一个预定义按键来打开所述文件。
根据一个实施例,当触控笔在数据输入方式中时,所述按钮(例如,笔夹按钮的按钮)提供预定义的数据输入符号(例如,空格符、″回车″功能等等),而当触控笔是鼠标模式时,所述按钮(例如,笔夹按钮的按钮)起一个鼠标按钮的作用。
可以理解的是,所述触控笔可以包括其所有的标准指向与选择功能(例如,PC鼠标的功能),并且所述鼠标按纽复制一部分所述功能性。
笔夹按钮可以位于触控笔计算机上的不同位置。例如图87中所示,本发明的触控笔8700可以包括本发明的多功能笔夹按钮8704,其接近于相对于所述触控笔的指向笔尖8701的一端。可以理解的是,由于诸如便于使用之类的原因,如图87a中所示,所述笔夹按钮8704可以位于触控笔8700上的任何位置,比如靠近指向笔尖8701,或在触控笔中间等等。另外,所述笔夹按钮可以用一种方法被设计用于把触控笔计算机例如连结到用户口袋(例如,类似于把常规钢笔连结到用户口袋)。此外,如有需要,则超过一个的笔夹按钮可以被提供在触控笔计算机上。
根据本发明的另一个实施例,如图88a中所示,例如,所述触控笔8800的鼠标笔尖8801可以被用于鼠标功能,并且如图88b中所示,所述触控笔8800的主体的另一部分8802(例如,接近所述鼠标尖端)可以被用来输入数据/文本,反之亦然。两种接触类型之间的区别可以基于接触碰撞的厚度(例如,第一尖端可以提供一个窄线条,而用于数据输入的其它部分可以在所述表面上提供粗线条)。
根据本发明的一个实施例,如图89中所示,触控笔8900可以包括所述触控笔8900内提供的至少一个麦克风和/或一个摄像头,当所述用户说话时(例如,提供对应于键压/扫过的语音信息),它们分别用一种方法来接收用户话音和/或接收用户的嘴唇运动图像。因此,优选地,所述至少一个麦克风可以被容纳在所述触控笔8900的至少其中一端内,因此当用户将该触控笔用于数据/文本输入功能(例如,敲击/扫过并且说话)时,至少一个麦克风8902和/或一个摄像头8905位于端8904的相对一端8903,端8904包括触控笔8900用来接触写入表面的尖端8901。所述相对端8903通常是在数据/文本输入期间靠近用户嘴的一端。
根据本发明的一个实施例,如图89a中所示,触控笔8900可以包括麦克风8911和/或摄像头8912,它们用一种方法从所述触控笔8900的主体延伸分别用于接收用户话音,和/或接收用户的嘴唇运动图像。所述麦克风8911和/或摄像头8912可以用一种方法延伸向所述用户的嘴,以便清楚地察觉所述用户的话音和/或嘴唇运动图像。所述麦克风和/或摄像头可以被安装在一个从所述触控笔8900的主体延伸的结构8913上。所述结构8913可以是一个至少具有两个部分8914、8915的多部分结构,这两部分彼此从收回位置移动到伸展位置(例如,反之亦然)。
继续参考图89a,所述可扩展结构8913的部分8914可以是触控笔8900的笔夹或笔夹按钮8914。所述笔夹按钮可以是所述多部分结构8913的其中一个部分。如图89b中所示,笔夹按钮8914自己可以被回转和/或旋转来帮助把麦克风8911和/或摄像头8912调整到一个期望位置。如果笔夹按钮系统包括按钮8917、8918(例如,在所述笔夹按钮下),当旋转所述笔夹按钮89 1 4例如用于把麦克风和/或摄像头延伸向一个位置并且所述按钮变成被揭开时,则所述按钮可以直接由用户的手指来操作。可以理解的是,笔夹按钮的结构可以包括本领域的技术人员已知的任何延伸技术。例如图89c中所示,触控笔8900的可扩展结构8913可以具有第一固定结构8914、以及辅助延伸/回转结构8925、8926。
当输入数据/文本时,所述可伸出麦克风/摄像头可以用一种方法起作用,以便自动地并且永久地停留在靠近用户嘴的地方。为此,例如,一个诸如接线之类的偏置装置可以被提供用把麦克风/摄像头例如连结到用户身体的某一部分或其衣服上。可以理解的是,替代于具有一个多部分的结构,麦克风/摄像头可以通过一个接线被延伸向用户的嘴。
可以理解的是,本发明的任何类型的触控笔都可以包括本发明的任何特征,比如之前所述笔夹按钮。
触控笔和对应电子设备之间可以被有线(例如,经由一个诸如USB之类的端口)或无线地连接。如果所述连接是无线的,则该技术可以是诸如射频、蓝牙等等之类的任何类型。因此,所述触控笔和设备可以包括无线元件。触控笔还可以包括一个蓄电池电源。
根据一个实施例,在数据/文本输入期间,触控笔可以记住用户提供的输入(例如,触控笔按钮被按压,触控笔的麦克风在数据输入期间察觉到的话音,触控笔的摄像头在数据输入期间察觉到的图像,对应于所述事件的计时等等),并且电子设备可以记住在所述电子设备内提供的信息(例如,键压、扫过、对应于所述事件的计时等等),并且每当触控笔与所述设备接触时(例如,在下一键压/扫过动作期间),触控笔内被记住的信息(例如之前所提及)被发送到所述对应电子设备(例如,写入/敲击尖端和写入(例如,感应)表面可以具有传导装置,因此所述写入笔尖和写入表面之间的接触可以允许所述触控笔接收的信息被传送到所述电子设备),并且通过结合所述信息与所述电子设备内被记住的对应信息(例如,键压/扫过等等),本发明的按压/扫过并说话的数据输入系统提供了对应的输出。因为这个程序(例如,记住、发送)可能在数据/文本输入(例如,每当触控笔触碰写入表面)期间被重复地进行,所以用户在大多数情况下可能不会注意到延迟。请注意,所述被延迟发送可以基于任何其它的技术和计时。
根据一个实施例,麦克风和/或摄像头的笔夹按钮结构或可伸出结构可以被用作触控笔的天线。所述天线可以是一个分集式天线。在闭合位置中,所述可伸出结构可以上述的触控笔笔夹按钮的外貌和/或功能。
如所知,一个诸如计算设备之类的电子设备可以包括用于与其它电子设备通信的诸如蜂窝电话系统之类的通信装置。根据通过图90举例说明的本发明的一个实施例,所述电子设备9000可以具有一个触控笔9001,其具有在这上面所述至少一部分特征。所述触控笔9001还可以起所述电子设备的所述电话系统的手机的作用。触控笔9001可以配备有本发明的一部分或全部特征和系统以及未提及的辅助必需特征。所述触控笔和所述电子设备之间的局部通信可以是无线或有线的。例如,如果所述局部通信是无线的,则所述触控笔9001和所述电子设备可以配备有对应的收发信机(未示出)以及所述通信(例如,射频、蓝牙等等)必需的所有其它特征。触控笔9001可以包括至少一个扬声器9003、一个麦克风9002、一个摄像头等等。本发明的按压/扫过并说话的数据输入系统或其它输入系统可以允许拨打号码、编辑并发送消息、发送并接收文件、接收数据、记住数据、操作数据等等。电话功能和菜单可以类似于其它计算机的功能和菜单来组织。例如,包括一个或多个功能的一个或多个菜单列表和菜单栏可以(例如,预定义地或通过用户)被组织用于诸如电话目录、被接收/发送的呼叫等等之类的电话操作。另外,电子设备9000可以配备有语音识别系统以便替换地通过话音来允许输入数据和功能、命令等等。它还可以通过语音来拨打号码。此外,所述触控笔上的至少一个按钮(比如所述笔夹按钮9004的至少其中一个按钮)可以起所述电话系统的发送/结束按钮的作用。
可以理解的是,所述触控笔可以从所述电子设备独立地起一个蜂窝电话设备的作用。
近年来,计算设备的大小被缩小,而同时所述设备的技术能力被增强。处理器足够快并且存储器足够大以便在一个小设备中运行现代的整个操作系统。在不久的将来,单个小电子设备将包括我们携带的所有不同的电子设备。一个具有完整操作系统的计算机、电话系统、管理器、音频/视频播放器等等将被一起结合在一个小电子设备中。所述电子设备将足够小并且轻到在人的口袋中携带。由于这类设备的尺寸被减小,因而一个用户友好的用户接口和数据输入系统是紧要的。本发明的数据输入系统提供了对这个需求的解决方案,比如如同所述地使用触摸屏或感应表面并结合具有不同特征的所述电子设备的触控笔。
一个(独立的)触控笔计算机已经被本发明人发明并且描述在PCT专利申请号PCT/US01/49450中被描述。如所述申请中所描述,可以使用所述触控笔的数据输入系统的其中一个方法是一个手写识别系统,其基于识别由于在写入预定义符号时以不同方向扫过(例如,所述写入笔尖被这样构造,因此所述写入笔尖以所述表面上的各个不同扫过方向接触表面,从而提供一个不同的声音或不同类型的振动)所述触控笔的写入笔尖所引起的振动或声音。
如之前所提及,所述触控笔可以配备有其它的手写识别方法,比如一个能够在写入符号时识别点击设备尖端方向及其在写入表面上或空间中(例如,加速计)的位置的方向识别系统。这些问题已经在所述PCT申请中被详细描述。
根据本发明的一个实施例,一个诸如在所述PCT申请中已描述之类的独立触控笔计算机可以使用本发明的按压/扫过并说话的数据输入系统。为此,一个手写识别系统可以和所述触控笔一起使用,该系统识别所述触控笔在表面上提供的敲击动作的碰撞和/或扫过动作的轨迹的位置(例如,基于诸如振动识别、声音识别、光学、加速计等等之类的不同技术)。所述敲击动作在表面上(或在空间中)彼此相关的位置可以对应于正在被按压的所述虚拟键区的区域/按键。此外,扫过轨迹的开头、中间(例如,表示所述轨迹内的方向变化的角度)或终点的位置可以对应于所述虚拟键区按键的区域/按键。这些问题已经被详细地描述。当用所述触控笔(尖端)敲击/扫过时,用户可以基于本发明的按压/扫过并说话的数据输入系统来提供对应的语音信息。根据这个实施例,系统优选地不可以使用一个感应写入表面,从而允许基本上在所述触控笔计算机内集成本发明的数据输入系统的所有特征。用户可以将所述独立触控笔计算机用于计算程序和通信(例如,电话、电子邮件、消息发送等等)程序。本发明的触控笔计算机的特征与功能已经在所述PCT申请中被详细描述。通过考虑一个具有至少基本上被分配了一种语言的所有字母表字母的四个按键的键区模式90110并且通过考虑基于所述键区创建的图85的可仿效轨迹模式,图90a示出了使用所述触控笔计算机的数据/文本输入的一个例子。图90a示出了本发明的一个触控笔计算机和通信设备9010,其具有一个写入笔尖9014,扫过轨迹符号9012已经用该写入笔尖9014在写入表面9011上画出(例如,或许一个虚拟地被画出的符号)。当画出所述轨迹符号9012时,用户可能已经说出单词″hi″。因此,系统分析所述轨迹9012并且将其对应到两个对应按键(例如,对应于所述键区的右下方按键和右上方按键)。通过使用所述按键信息和用户语音信息,系统识别出用户语音和输入/输出单词″hi″。所述单词9017可以在触控笔的显示9018上被打印。
如之前所提及,所述触控笔还可以包括一个诸如电话系统之类的电信技术。为此,麦克风单元9016和扬声器9015可以被提供在所述触控笔内。所述单元9015、9016之间的距离可以是如此以至对应于用户耳朵和嘴之间的距离。本发明的触控笔计算机的特征与功能已经在所述PCT申请中被详细描述。
根据本发明的另一个实施例,替代地或除了刚才提及的独立触控笔的运动识别系统之外,一个诸如感应垫或感应显示屏之类的小感应表面(例如,数字转换器)可以配备有所述独立触控笔计算机,因此用所述触控笔敲击/扫过所述小感应表面复制了使用感应表面的本发明的数据输入系统。所述表面上的写入(例如,敲击/扫过、计时)信息可以被无线或有线地,或者每当触控笔与所述表面接触(例如,写入笔尖和写入表面可以具有传导装置,因此所述写入笔尖和写入表面之间的所述接触可以允许所述写入表面接收到的信息被传送到触控笔)时传送到所述触控笔。因为四个按键/区域通常对于本发明的准确数据输入系统是足够的,所以所述感应表面可以是所述触控笔容易便携的非常小的尺寸。图90b示出了本发明的触控笔9020的一个例子,其与对应的感应写入表面(例如,数字转换器)9021一起用于根据这个实施例的数据/文本输入。可以理解的是,所述写入表面9021可以可拆卸地被连结/连接到所述触控笔9020。此外还须注意,所述触控笔计算机可能包括在本申请和本发明人申请的其它专利申请的不同实施例中描述的至少一部分特征。例如,所述触控笔9020可以包括被置于所述触控笔一端9029上的麦克风9022和/或摄像头9023,其中,所述端9029与所述触控笔9020的所述触控笔上的写入笔尖所位于的另一端9028相对。替代于或除了所述麦克风和/或所述摄像头之外,所述9020可以具有从所述触控笔9020的主体延伸的另一麦克风9024和/或摄像头9025。为此可以使用一个延伸结构9026。这些问题已经被详细地描述。
可以理解的是,尽管一个圆柱形触控笔已经在本发明的实施例中被举例说明,然而所述触控笔也可以具有诸如立方体形状之类的其它形状。
如前所述,根据本发明的数据输入系统的一个实施例,通过提供一个诸如按压动作之类的与所述至少所述按键的预定义交互作用然后/同时提供一个对应于所述符号的预定义语音信息,一个被分配给按键的符号可以被输入。所述语音信息通常是语音的存在或不存在,其中,所述语音存在或不存在由系统来检测。例如所述,一个字母可以通过对应按键的单压动作并且说出所述字母而被输入,而一个标点符号字符可以通过不说话对(例如,所述)按键的单压动作而被输入。这些问题已经在本发明人申请的几个专利申请中被详细描述。
根据本发明的按压/扫过并提供语音信息的数据输入系统的一个实施例,在存在预定义语音时,对感应表面上的一个或多个按键/区域(例如,软键区按键/区域)的一个预定义扫过程序可以输入/输出一个对应的预定义符号,而在没有语音时,对所述表面上的一个或多个按键/区域(例如,所述软键区的所述按键/区域)的一个预定义扫过程序可以输入/输出另一个预定义符号。图91示出了一个诸如之前所述之类的(感应)键区。例如,为了输入单词/单词一部分″by″,用户可以分别提供按键/区域9102和9104(例如,查看轨迹9106)上的扫过动作并同时说出″by″。系统检测到说出语音,并通过考虑所述扫过动作提供的按键信息,系统输入/输出单词/部分(例如,字符串)″by″。另一方面,作为示例,提供同一扫过动作轨迹9106而不提供语音可以预定义地对应于另一个符号(例如,“(”)。
在没有语音时提供不同的扫过轨迹可以预定义地对应于不同的预定义符号。这可以允许只通过扫过动作(例如,不说话)来输入许多预定义的符号。所述符号可以是诸如标点符号字符或PC命令之类的标准符号,或者它们可以是用户定义的定制符号。图91示出了少数可仿效的扫过轨迹。例如,扫过轨迹9105可以对应于左括号(例如,″(″),扫过轨迹9107可以对应于″BkSp″功能键,而扫过轨迹9108可以对应于″Enter″功能键等等。
上述的在没有语音时把符号分配给扫过动作的方法可以与本发明的所有按压/扫过与语音信息的数据输入系统相结合。例如,基于轨迹模式(例如,参见图85的示例)的不同动态扫过轨迹可以不用说话在(例如,感应)表面的任何部分上被画出,其中,在没有语音时的每个所述被画出扫过轨迹可以对应于预定义对应符号的输入/输出。
如之前所提及,诸如基于识别用户书写体的数据输入系统之类的其它数据输入系统可以与本发明的按压/扫过并说话的数据输入系统相结合。
根据本发明的按压/扫过的数据输入系统的一个实施例,在存在预定义语音时对感应表面的扫过(例如,轨迹)动作(例如,详细地如前所述)可以对应于通过本发明的按压/扫过并说话的数据输入系统的符号输入,而不说话时对所述表面的扫过动作可以对应于通过书写(例如,使用手写识别系统来转换用户书写体以便键入字符)的数据/文本的输入。基于在扫过(例如,滑动)笔划期间用户语音的存在或不存在,对应的数据输入系统(例如,分别是按压/扫过并说话的数据输入系统或手写识别系统)将分析用户输入来输入/输出对应的字符串(例如,键入字符)。在某些情况下,这个结合不同数据输入系统(例如,刚才所述)的方法可以是非常有利的。例如,用户可以通过使用本发明的按压/扫过并说话的数据输入系统来输入一个标准文本,而另一方面,用户可以通过他的书写来输入诸如输入数学公式之类的复杂文本。通过使用这个实施例,基于用户语音的存在或不存在,系统自动地使用对应的识别(例如,数据输入)系统。根据一个实施例,如果系统没有识别出用户的书写图形,则所述手写图形可以被系统″按原样″输入/输出。
根据本发明的按压/扫过的数据输入系统的一个实施例,在存在预定义语音时对感应表面(例如,详细地如前所述)的扫过(轨迹)动作可以对应于通过本发明的按压/扫过的数据输入系统的数据/文本输入,而不说话时对所述表面的扫过动作可以对应于用户手写图形的输入(例如,乱画、诸如书写字符之类的图形符号、图画等等)。基于在扫过(例如,滑动)笔划期间的用户语音的存在或不存在,对应的数据输入系统(例如,分别是按压/扫过并说话的数据输入系统或手写图形输入系统)可以输入对应的数据。例如,用户通过使用本发明的按压/扫过并说话的数据输入系统来输入键入字符,而(例如,同时在文档中)输入用户的手写图形(例如,诸如字符、图画等等之类的图形符号)。这在诸如平板计算机或PDAs之类的许多设备中是极其有利的。
根据本发明的按压/扫过的数据输入系统的一个实施例,在存在预定义语音时对感应表面(例如,详细地如前所述)的扫过/按压动作可以对应于通过本发明的按压/扫过的数据输入系统的数据/文本输入,而不说话时对所述表面的扫过程序可以对应于鼠标功能。
根据本发明的按压/扫过数据输入系统的一个实施例,在存在预定义语音时对一个(例如,感应)表面(例如,详细地如前所述)上的键区(例如,可以是一个动态键区)的区域/按键的扫过/按压动作可以对应于通过本发明的按压/扫过的数据输入系统的数据/文本输入。所述数据输入系统可以被其它的数据输入系统结合,因此:
-当不说话时,所述键区的所述区域/按键上的扫过轨迹可以对应于一个诸如标点符号字符、功能键之类的预定义符号,和/或;
-在有或者没有对应语音时,所述键区的区域/按键外的敲击动作或扫过轨迹可以对应于通过手写识别系统的键入符号的输入,和/或;
-在不说话时,所述键区的区域/按键外部的敲击动作或扫过轨迹可以对应于鼠标功能。
结合了本发明的按压/扫过并说话的数据输入系统与其它数据输入系统的上述的实施例只是作为例子被说明。可以理解的是,本发明的按压/扫过并说话的数据输入系统与其它数据输入系统的结合的许多变化可以被本领域的技术人员考虑到。例如,根据本发明的按压/扫过的数据输入系统一个实施例,在存在预定义对应语音时,感应表面上的扫过(例如,轨迹)动作(例如,详细地如前所述)可以对应于通过本发明的按压/扫过的数据输入系统的符号输入,而在不说话时,所述表面上的扫过动作可以对应于手写数据/文本的输入(例如,通过使用一个手写识别系统)。另外,一个诸如按键之类的模式装置可以配备有该系统,因此当用户在所述表面书写时,其手写图形作为输入/输出被输入(例如,在由所述两个之前的数据输入系统使用/产生的同一文档中)。还例如,根据本发明的按压/扫过数据输入系统的一个实施例,在存在预定义的对应语音时,感应表面上的扫过(例如,轨迹)动作(例如,如前详细地所述)可以对应于通过本发明的按压/扫过的数据输入系统的符号输入,而不说话时,所述表面上的扫过动作可以对应于如详细所述用于创建一个动态键区的校准程序。
根据另一个实施例,(感应)表面上的文件宽度可以定义用户所用的数据输入系统。例如,使用用户手指(例如,用于敲击/扫过)可以对应于本发明的按压/扫过的数据输入系统,而使用触控笔(例如所述)可以对应于鼠标功能或手写数据输入系统(例如,反之亦然)。还例如,用用户手指的指尖(较窄)部分或用用户的较窄手指来滑动可以预定义地被用于本发明的按压/扫过的数据输入系统,而用用户手指的指肚(较宽)部分或用户的较宽手指来滑动可以预定义地被用于鼠标功能(例如,反之亦然)。通过使用用户的手指、手指的一部分、指纹等等的本发明的按压/扫过并说话的数据输入系统已经在本发明人申请的不同专利申请中被描述。
一个手写识别系统可以与语音识别系统相结合以便提供更准确的数据输入。例如,用户可以写入一个字符、单词的一部分、单词、或超过一个的单词,并且优选地同时提供一个对应于所述字符、单词一部分、单词、或超过一个的单词的语音。系统可以分析所述手写和所述语音从而提供一个准确的对应的输入/输出。如果一个单词的不同部分是手写的(例如,对于按压/扫过并说话的数据输入系统被详细描述),则在提供对应的字符串并且组合它们来提供不同可能的组合单词(例如,在按压/扫过并说话的数据输入系统中被详细描述)之后,所述组合单词可以与系统的词典相比较从而输入/输出匹配所述系统单词数据库的单词的(一个或多个)组合单词(例如,在按压/扫过并说话的数据输入系统中被详细描述),如之前所述,如果存在一个匹配的单词,则所述单词可以被输入/输出。如果存在超过一个的匹配单词,则根据一个方法,具有最高优先权的单词可以被显示给用户,或者根据一个实施例所述单词可以被显示给用户以便选择(例如,在按压/扫过并说话的数据输入系统中被详细描述)。可以理解的是,刚才所述结合的手写并且语音识别系统可以通过使用诸如任何类型的诸如本发明的触控笔计算机之类的触控笔(例如,具有所述麦克风或摄像头)之类的书写工具被输入。
根据另一个方法,如前所述,一个电子识别手写系统(通过使用电子墨水)可以使用用户语音并结合用户在上(例如,感应)表面在上手写。此外如之前所提及,例如,为了输入至少一个单词/单词一部分,用户可以写入所述至少一个单词/单词一部分的至少一个字母并且提供一个对应于所述至少一个单词/单词一部分的语音。
根据本发明的一个实施例,为了告知系统具有一个或多个部分并且刚才所提及的输入系统输入的单词的结束,用户可以提供至少一个较早所述的方法,比如提供诸如敲击(例如,此外可以对应于空格符)所述表面之类的单词结束信号。根据另一个方法,在结合对应于所述单词(各部分)的语音在写入(感应)表面(例如,或者在空中)上通过输入所述单词彼此接近的至少一部分字母来输入一个当前单词之后,用户可以在所述表面上以与前一单词相隔充分距离来写入下一个单词。仍然根据另一个方法,用户可以用它们之间的短暂停来输入单词的一部分,并且在结束输入对应于所述单词的信息(例如,写入和说话信息),用户可以暂停一个预定义的充分的(例如,较长)时间消逝。可以理解的是,用于同一目的的其它方法也可以被考虑。
如之前所提及,一个增强式手写系统可以结合提供一个(例如,至少一部分)单词的至少一部分字母与用户的(一个或多个)对应语音。如之前所提及,根据本发明的一个实施例,如果用户提供的手写字符在没有语音的情况下被提供,则系统可以通过一个(标准)手写识别系统来考虑并分析所述输入。如果用户提供的手写字符在存在对应的(一个或多个)语音的情况下被提供,则系统可以通过本发明的写入并说话的系统来考虑并分析所述输入,从而复制本发明的按压/滑动并说话的数据输入系统。例如,为了用两个部分″sin″和″gle″来输入单词″single″,用户可以首先在写入表面上写入字母″s″和说出部分″sin″。然后,用户可以在写入表面上写入字母″g″并且说出部分″gle″。为了告知用于输入所述单词的输入信息已结束,用户可以使用诸如之前所述之类的方法。
必须指出可能发生这种情况,即当用户输入一个单词的当前部分时,用户在结束写入所述至少一部分对应字符(例如,字母)之前结束所述语音。为了告知系统在结束所述语音之后写入的字符仍然与所述语音相关,不同的预定义方法可以预定义地被使用。根据第一个方法用户不从写入表面抬起写入指尖直到他结束所述部分。根据第二个方法,一部分的结束(例如,敲击)可以在所述部分末尾处被提供。根据第三个方法,系统考虑将被写入字母保持为当前部分的一部分直到另一个语音被提供为止。从所述另一个语音被提供那时起,系统考虑将被写入字母作为下一部分的一部分来输入。
根据另一个方法,在结合对应于所述部分(各部分)的语音在写入(感应)表面(例如,或者在空中)上通过输入所述部分彼此接近的至少一部分字母来输入当前部分之后,用户可以在所述表面上以与前一部分相隔充分距离来写入下一部分。可以理解的是,用于同一目的的其它方法也可以被考虑。
根据本发明的一个实施例,单个字母可以通过在没有语音时写入它们而被输入,而(一个或多个)单词的至少一部分可以通过写入所述(一个或多个)单词的至少一部分的至少一部分字母并且说出对应的(一个或多个)语音而被输入。
如之前详细地所述,根据本发明的一个实施例,当用户希望输入单词/单词一部分时,他可以按压一个对应于所述部分(例如,第一字母)的按键并且逐字母地(例如,拼写所述部分)说出所述部分的字符(例如,字母)。
字母(例如,″d″)的语音可以以元音音素(例如,音素″e″)结束。如果用户希望迅速地输入具有第一字母(例如″d″)的单词一部分,其中,所述字母的语音用元音音素(例如,″e″)结束并且所述部分(例如,″de″)的下一个字母(例如,″e″)是元音字母(例如,″e″),其中,其发音类似于先前字母的所述结束元音音素的发音,则系统可能错误地认识到只拼写了一个字母。这可能造成错误识别的结果。例如,为了输入单词″de″的一部分,用户可以按压对应于字母″d″的按键并且说出(例如,拼读)字母″d″和″e″。因为字母″e″在字母″d″的元音音素″e″之后立即被说出,所以系统可能错误地认为只说出了一个字母″d″并且输出可能是″d″而非″de″。不同的解决方案可以被建议来分析这个问题。
根据一个方法,用户可以把前述类型的字母(例如,″d″、″c″、″b″等等)分配给与所述按键的第一类交互作用(例如,单压),而把所述字母的对应部分(例如,″de″、″ce″、″be″等等)分配给与所述按键的第二类交互作用(例如,双压)。根据另一个方法,所述类型字母的元音音素的相对较短的发音可以只对应于所述字母,而所述类型字母元音音素的相对较长发音可以对应于所述字母和表示所述音素语音的另一个元音字母。可以理解的是,用于解决所述问题的其它方法也可以被考虑。
因此,虽然本发明的基本新颖设计被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略、置换和改变。因此,本发明只通过被附加于此的权利要求范围所指的来限制。可以理解的是,附图不一定是按比例描绘的,而是其本质仅仅是概念上的。例如,在不同实施例中描述的数据输入系统逐个部分可以与单词完成系统相结合来提供一个非常准确的系统。还例如,当用户逐部分地输入一个单词时,系统可以逐部分地识别并输入所述单词,并且在所述用户结束输入所述单词时,和在系统结束识别并输入所述单词时,为了所述被输入单词的再验证,系统可以通过所述语言约束方法和歧义消除方法中的一个或全部来进行所述单词的一个并行输入。
例如,尽管一个电话型键区在不同的实施例中被用来举例说明本发明的不同实施例,然而具有被分配给所述键区按键的任何类型的符号配置的任何类型键区都可以和本发明的实施例一起使用。
为了不频繁地重复本发明的数据输入系统的原理,在本申请的许多段落中都提到诸如字符/单词/单词一部分/功能键等等之类的一个或多个符号可以被分配给一个按键(例如,或除了按键之外的一个对象)。可以理解的是,除非另作说明,否则所述符号通常意在被分配给一个与所述按键的最简单预定义交互作用,它可以是对所述按键的单压动作(如在本发明的许多实施例中所解释)。此外,在许多段落中,在解释了把诸如字母/音素组/字符(字母)组/字母串等等(例如,通常是将被说出的符号)之类的符号分配给一个按键之后,为了避免重复本发明的数据输入系统输入所述符号的原理,所述原理可能没有被提及。可以理解的是,除非另作说明,否则所述类型的符号(例如,在现实生活中通常是将被说出的符号)显然(如在本发明的许多实施例中所解释的)通常意指通过对应按键的对应按压动作并优选地同时结合对应于所述符号的语音而被输入。
必须指出,在本申请的许多段落中,术语″字符组″或″字符组″被用来定义字符串。
尽管在本发明的不同实施例中提及一个语音识别系统并且意在用它来察觉并识别用户语音,然而一个唇读系统可以被替代地或另外地添加到所述语音识别系统以察觉并识别所述用户的语音(并且反之亦然)。
此外如之前所提及,本发明的一部分或全部方法,比如本发明的至少一个单词的至少一部分接着至少一个单词的至少一部分可以和语言学文本输入识别系统一起使用,比如可能匹配单词的音节数量、可能识别句子的单词数量、短语内的单词位置等等。这个问题已为本领域的技术人员所知。
可以理解的是,根据本发明的另一个实施例,逐字符和逐部分的数据可以在结合对应语音信息的同一按压并发声动作内被提供。
必须指出,在某些段落中,术语″逐部分″被用于简化术语″(一个或多个)单词的至少一部分接着(一个或多个)单词的至少一部分″。
请注意,尽管为了简化起见,在许多段落中,本发明的数据输入系统用诸如″本发明的数据输入系统″、″本发明的按压/扫过的数据输入系统″、″本发明的按压/扫过并说话的数据输入系统″等等之类的短语被提及,然而可以理解的是,如在许多段落中被详细描述的,这类短语指的是考虑了结合用户语音信息的按压/扫过动作的本发明的数据输入系统的原理,其中,所述语音信息是对应语音的存在或用户语音的不存在。这些问题已经被详细地描述。
必须指出,如上所述,尽管在许多实施例中,一个至少具有被分配了基本上一种语言的所有字母表字母的四个按键的键区作为示例被举例说明,然而可以理解的是,具有任意数量按键、任意按键配置以及被所述按键的任意符号配置的任何类型的键区都可以被考虑与本发明的数据输入系统一起使用。这些问题已经被详细地描述。
请注意,尽管在许多实施例中(例如,按压/扫过和语音信息的数据输入实施例),一个诸如触摸感应垫、触摸屏之类的感应表面已经被用作示例,然而可以理解的是,检测并分析用户与任意表面的交互作用的任何其它技术都可以被用来定义和/或使用软(例如,动态)键区的区域/按键。例如所提及,所述技术可以是光学检测技术或在一个(标准)表面上提供虚拟键区(例如,具有少数按键/区域,其中,例如,至少基本上一种语言的所有字母都被分配给所述键区的4个按键/区域)的红外线技术,并且可以检测触碰所述键区按键/区域的用户手指。
如前所述,根据本发明的一个实施例,为了经由本发明的数据输入系统来输入一个字符,用户可以例如单/双压对应的区域/按键并结合/不结合对应于所述字符的语音(根据如前所述本发明的数据输入系统)。为了输入至少具有两个字符的单词/单词一部分,当说出所述单词/单词一部分时,用户可以例如将其手指或钢笔扫过所述表面的至少其中一个与所述单词/单词一部分的至少其中一个字母(例如,优选地开头字母)有关的区域/按键。例如,所述语音可以是说出所述部分,或者它可以是逐字母地(例如,拼读所述部分)说出所述部分的字符(例如,字母)等等。此外如所提及,单词/单词一部分可以被分配给一个按键(例如,对应于所述部分的开头字母)并且通过预定义的与所述按键交互作用而被输入,该交互作用比如是所述按键上的扫过动作以及提供对应于所述部分的语音。如之前所提及,所述语音例如可以是说出所述部分,或者它可以是逐字母地(例如,拼读所述部分)说出所述部分的字符(例如,字母)等等。在这种情况下,所述按键上的按压动作(例如,结合对应的语音)可以被用于输入单个字符。作为示例,通过参考图92的键区9200,为了通过将其划分成三个(例如,预定义的)部分″a-lo-ne″来输入单词″alone″,用户可以首先按压对应于字母″a″的按键9203并且说出″a″。然后,他可以在对应于字母″l″的按键9203上扫过/滑动(例如,看可仿效的轨迹9205)并且说出″lo″。并且最后,他可以在对应于部分″ne″的字母″n″的按键9204上扫过/滑动(例如,看可仿效的轨迹9206),并且逐字母地说出字母″n″和″e″。显然必须指出,根据一个方法,一个按键上的上述扫过可以在所述按键上具有任意的扫过轨迹。
与本发明的数据输入系统一起使用的感应表面可以是诸如计算机之类的电子设备的鼠标垫。当将鼠标用于数据输入时,用户可以在所述鼠标垫上的不同位置上敲击或扫过(例如,对应于固定/动态的按键/区域)(例如,如在使用感应表面的本发明的不同实施例中所述)。为了区分数据输入动作和鼠标功能,根据一个实施例,一个诸如按钮之类的模式切换装置可以被配备到该系统。根据另一个实施例,当提供对应语音时与所述鼠标的交互作用可以对应于经由本发明的数据输入系统的数据输入,而不提供语音时与所述鼠标的交互作用可以对应于(例如,标准)鼠标功能。
根据本发明的一个实施例,将与本发明的按压/扫过并说话的数据输入系统一起使用的按键数量可以基于在所述按键上分布所述数据输入系统的符号(例如,至少一个字母组、标点符号、功能键、单词、单词一部分等等)所需的按键数量来定义,因此被分配给一个与每个所述按键的预定义交互作用符号基本上具有彼此相关的可区别语音,其中,所述符号为了被输入需要一个对应的语音。例如图92的键区9200上所示,英语字母可以被分布在四个按键上,因此被分配给每个所述按键(例如,通过诸如单压动作之类的与所述按键的相同预定义交互作用而被输入)的字母基本上具有彼此相关的可区别语音。
如之前所提及,为了输入数据(例如,文本),用户可以使用动态的按键/区域(例如,与本发明的数据输入系统一起使用的动态按键/区域已经被描述)。根据本发明的一个实施例,每当用户把其手放在(例如,感应)(写入)表面上并且通过敲击/扫过所述感应表面开始输入数据时,系统在所述表面上检测到用户的(一只或两只)手并且基于用户的敲击/扫过,来再校准(对应于一个预定义的键区模式的)动态键区的动态按键。在感应表面上检测用户的手并且在所述表面上再校准动态按键已经在本发明人于2000年10月27日申请的美国临时专利申请及其对应的PCT专利申请中被描述。
根据一个实施例,当用户把其手放在一个诸如感应表面之类的表面上以便通过本发明的数据输入系统来(例如,通过钢笔或其手指)输入数据时,系统可以检测到用户的(一只或两只)手并且可以决定可能必需一个新的校准程序(例如,人工、自动)。例如,基于用户提供的(例如,起始的)敲击/扫过,系统可以动态地定义对应动态键区的动态按键的位置。根据所述实施例,每当用户从所述表面拿开其手并且再次放上其手来提供数据输入时,系统如所述地根据用户的敲击/扫过来再校准所述键区的所述动态按键。图93作为示例示出了一个诸如平板计算机9300之类的电子设备,其中,用户把其手9301放在所述电子设备9300的感应表面9302(例如,诸如之类的触摸屏)上,以便通过在所述感应表面9302上用触控笔9303来滑动/敲击来输入数据。当所述用户最初把其手9301放在所述表面9302上时,系统(例如,基于用户手和所述感应表面之间的大接触区)检测到用户的手被放在所述表面上,并且根据一个实施例,当用户开始在所述表面上敲击/滑动时,系统基于用户提供的(例如,至少起始的)敲击/滑动动作来自动地再校准动态键区的动态按键。可以理解的是,替代于一个自动校准方法,一个人工校准方法可以被用户提供(例如,几个人工/自动的校准方法示例已经在之前被描述)。
根据一个实施例,如果系统在所述表面上检测到一个交互作用(例如,用钢笔/手指/滑动)但是没有在所述表面上检测到用户的手的放置,则它可能认为敲击/扫过动作可能被意外地提供,并且因此系统可以忽略所述交互作用。在这种情况下,与所述表面的意外交互作用(例如,意外的敲击/滑动动作)可以被系统忽略。
可以理解的是,所述敲击/扫过动作可以用诸如用户手指或触控笔之类的任何装置来提供。例如,用户可以把他的(一只或两只)手放在所述感应表面并且通过他的(一只或两只)手指在所述感应表面上扫过/敲击。系统(例如,基于用户手和所述感应表面之间的大接触区)检测到用户的手放在所述设备上,并且根据一个实施例,当用户开始敲击/滑动(例如,用户指尖与所述感应表面的接触区远远小于用户把手放在所述表面上的接触区)时,系统自动地再校准动态键区的动态按键。可以理解的是,替代于一个自动校准方法,一个人工校准方法可以被用户提供(例如,几个人工/自动的校准方法示例已经在之前被描述)。
此外,当在一个感应表面上输入数据时,用户的手可以被放在对应电子设备的所述感应表面之外的一个表面上。在这种情况下,所述电子设备可以配备有适当装置来检测放在所述电子设备一个位置上的所述用户的(一只或两只)手。
如在本发明人申请的专利申请中所述,根据一个实施例,用户可以使用他的十只手指经由本发明的(例如,触摸型)数据输入系统来输入数据(例如,文本)。
简言之,如在所述专利申请中所述,根据一个实施例,用户可以在开始键入之前最初把他的双手的十只手指放在一个诸如平板计算机的触摸屏之类的感应表面上,因此系统定义对应于所述用户手指在所述表面上位置的动态按键位置(例如,对应于一个预定义的键区模式)。如所提及,本发明的数据输入系统的预定义符号群(例如,字符、命令、功能键、单词/单词一部分等等)可以被分配给所述每只手指(例如,并且明显地被分配给对应的每个动态按键)(例如,符号以及把符号分配给按键/区域/对象已经在本发明人申请的不同专利申请中被详细描述)。然后,用户可以根据本发明的数据输入系统在所述(例如,所述动态按键)感应表面上开始键入(例如,并且说话)。可以理解的是,基于本发明的不同数据输入系统,与所述每个动态按键的不同交互作用可以被考虑。例如,用户可以用他的指尖,用他手指的指肚部分在所述表面(例如,在一个对应的动态键区上)上单压、双压、滑动,其中,不同的字符群被分配给所述每个动作,并且用户可以为了选择其中一个所述符号而提供一个对应语音。此外,如之前所提及,所述每只手指都可以与所述表面上多于一个的位置进行交互作用,其中,不同的字符群可以被分配给所述每个位置。这些问题已经在本发明的数据输入系统的不同实施例中被详细描述。
继续参考上述的实施例,图93作为示例示出了用户的十只手指,它们同时触碰/按压感应表面9310来提供对应的预定义键区模式9319的十个对应动态按键(例如,一个校准程序),其中,诸如基本上至少PC键盘的所有符号之类的一个预定义符号群被分配给所述每个动态按键。用户可以根据本发明的数据输入系统的原理在所述表面上(例如,在所述动态按键上)键入。例如,为了逐字母地输入单词″go″,用户可以首先用其手指9311在所述表面9310上敲击并且说出字母″l″。然后,用户可以用其手指9312在所述表面上敲击并且说出字母″o″。还例如,为了输入标点符号″?″,用户可以用手指9313双压所述表面而不说话。本发明的数据输入系统的原理已经被详细描述。用户的手指(例如,并且明显地,它们对应的虚拟/动态按键/区域)可以被用作一个与本发明的数据输入系统一起使用的键区按键。本发明的数据输入系统的所有原理都可以被应用于这个实施例(例如,用户手指,并且明显地,它们对应的虚拟/动态按键/区域)。在这个例子中,英语字母分配给所述可仿效预定义键区模式9319,因此用来提醒一个QWERTY布局,并且因此实质上所述每个字母都通过用户惯用的手指而被输入。此外,所述字母还被分配给所述键区模式,因此,实质上具有彼此相关的相似语音的字母被分配给所述键区的不同按键。必须指出,其它布局以及向所述键区分配所述符号可以被考虑。
必须指出,当所述动态按键被校准和/或定义时,系统可以动态地在所述电子设备的屏幕上示出所述区域/按键和/或它们的对应符号(例如,在上面提及的例子中,所述感应表面是所述电子设备的触摸屏)。根据另一个实施例,所述(例如,活动)区域/按键可能没有被示出。此外,对应的键区模式9319最终可以被显示在屏幕的一个位置上,以便允许用户看见被分配给所述每个动态按键的对应符号(例如,并且明显地,被分配给用户的每只手指)。
先前提到,替代于人工校准,一个自动校准程序可以在用户的数据输入(例如,开始)期间由系统来执行。这可以被应用到用户使用其(例如,十只)手指的键入。当用户开始在所述感应表面上键入时,基于他的至少一部分手指与所述表面彼此相关的碰撞位置,系统可以动态地定义对应于与本发明的数据输入系统一起使用的用户所有手指(例如,十只手指)的按键/区域的位置。
如所提及,根据一个实施例,当用户从所述表面移开其手并且把它们再次放在所述表面上时,系统再校准所述动态按键。此外,可以理解的是,替代于十只手指,用户的单手或双手的任意预定义数量的手指(例如,定义动态按键的对应数量)可以和本发明的数据输入系统一起使用。
根据一个实施例,替代于一个按压动作,按键/区域上的松开动作可以被系统考虑到。例如,用户可以长期地把其手指放在所述触摸屏上,并且每当他从所述表面移开他的其中一只手指时,系统把所述移开动作考虑为所述按键/区域上的按压动作。这可以允许用户双手在键入时处于一个休息位置中。
必须指出,在触摸屏上打印并且被本发明的数据输入系统所用的键区可以被用户拖动到表面上的一个期望位置。
如之前所提及,用户可以在感应表面的不同位置上提供扫过动作,其中,所述表面上的每个所述扫过动作彼此无关。例如,如前所述并且通过考虑图94的键区模式9400,当用户扫过感应表面9409上的一个位置上的弧形轨迹9406时,通过考虑对应的键区模式9400,系统可以认为所述扫过轨迹分别对应于与按键9402和9404的交互作用。
根据本发明的一个实施例,替代于一个对应于所述键区的两个相邻按键的弧形扫过轨迹,一个直线扫过轨迹可以被提供。例如,替代于所述弧形扫过轨迹9406,用户可以提供一个直线扫过轨迹9405。如果所述直线轨迹被提供因此与所述面上的前一或下一轨迹的位置无关,则系统可以认为所述垂直轨迹(例如,从上向下)可以对应于与按键对9401、9403的交互作用,或者对应于与按键对9402、9404的交互作用。系统可以考虑两个按键对以便分析用户的语音输入。
如果所述轨迹对应于输入一个完整的单词(例如,在所述交互作用之后,一个单词结束信号被用户提供),则系统可以比较用户的对应语音与对应于两个轨迹的单词语音(例如,在这个例子中,以一个被分配给按键9401字母开始并且以一个被分配给按键9403的字母结束的单词,以及以一个被分配给按键9402的字母开始并且以一个被分配给按键9404的字母结束的单词)。基于所述程序,系统可以把最佳匹配单词提供为输入/输出,或者(例如,如果存在歧义),则它还可以考虑诸如短语语境、语言规则等等之类的其它信息来提供最终单词。如果仍然存在歧义,则系统可以呈现一个最佳匹配单词的列表,因此用户可以挑选它们中的一个。
如果所述直线轨迹9405及其对应的语音对应于输入单词的一部分,则系统可以一直等到用户输入所述单词的其它部分为止(例如,通过连续地输入所述部分,并且例如在结束时提供一个单词结束信号)。系统可以考虑对应于所述两个轨迹中每一个的最佳匹配字符组(例如,字符串),并且还通过考虑对应于扫过动作和对应语音的由用户提供为所述单词的所述其它部分的输入的其它字符组,系统可以组合不同的被组合字符串并且将它们与词典的单词相比较来提供所期望的单词。组合不同的字符串并且将它们与词典数据库的单词相比较以及选择最终结果的程序已经在之前被描述。
可以理解的是,上述的扫过并说话的数据输入的实施例只是其中一个被考虑的方法。诸如之前详细描述之类的基于本发明的扫过/敲击并说话的原理的其它扫过方法可以被考虑。例如之前所提及,扫过轨迹可以在由之前所述校准(例如,人工、自动)程序创建的动态键区的区域/按键上被提供。在这种情况下,如之前所提及,明显地,两个所述动态按键上的直线扫过轨迹的对应按键/区域可以容易地被系统识别(例如,因为所述表面上的所述区域/按键的位置已经由所述校准程序定义,并且用户在所述动态按键/区域上扫过,所以所述两个按键上的弧形轨迹可能不需要)。
根据本发明的一个实施例(尽管识别准确性可能受影响并且用户与显示单元的交互作用可能被频繁地需要),然而本发明的数据输入系统的至少一部分实施例可以不需要用户语音。例如,不用提供对应于所述单词/单词一部分的语音,单词/单词一部分的对应按键上的敲击/扫过程序可以被提供。一个猜测系统可以被用来帮助识别想要的单词。例如,通过使用图95的键区9500,用户可以扫过对应于字母″s、i、n、g″的按键9502、9505、9504和9502(例如,轨迹9508)来输入单词″sing″。系统可以比较交互作用的按键链与对应于系统可用的词典数据库的单词字母的键压链(例如,通过考虑所述键区9500而被定义)。如果只存在一个匹配单词,则系统输入/输出所述单词。如果存在超过一个的单词,则系统例如可以挑选最常使用的单词,或者它可以把所述单词呈现给用户以便用户选择它们中的一个。在存在超过一个的对应于被交互作用按键的单词时的歧义消除方法和单词选择程序已经被人们所知。它们中的一个是在大多数移动电话中被使用的T9。
继续参考这个实施例,如果用户想用多于一个的部分来输入一个单词,则他可以为所述每个部分提供一个对应的扫过轨迹。在结束时,用户可以提供一个诸如空格符之类的单词结束信号。系统可以组合由所述轨迹交互作用的所述按键并且可以将它们与对应于系统可用的字典数据库的单词的键压相比较。如果只存在一个匹配单词,则系统输入/输出所述单词。如果存在超过一个的单词,则系统例如可以挑选最常使用的单词,或者它可以把所述单词呈现给用户以便用户选择它们中的一个。如所提及,在存在超过一个的对应于被交互作用按键的单词时的歧义消除方法和单词选择程序已经被人们所知。
例如,通过使用键区模式9500,为了两个部分″sing-ers″输入单词″singers″,用户可以首先扫过(例如,由触控笔)对应于字母″s、i、n、g″的按键9502、9505、9504和9502(例如,轨迹9508),并且然后把他的触控笔从所述表面上移开。然后,用户可以(例如,用触控笔)扫过对应于字母″e、r、s″的区域/按键9501、9501、9502(例如,轨迹9509)。然后,用户可以提供一个诸如按压″空格键″9507之类的单词结束信号。然后,系统组合由所述两个轨迹9508、9509交互作用的所述按键,并且如所提及地将它们与对应于系统可用的词典数据库的键压相比较。如果存在一个匹配单词,则系统输入/输出所述单词″singers″。如果存在超过一个的单词,则系统例如可以选择最常使用的单词,或者它可以把所述单词呈现给用户以便用户选择它们中的一个。如所提及,在存在超过一个的对应于被交互作用按键的单词时的歧义消除方法和单词选择程序已经被人们所知。
如同所述并所示,通过把一个单词划分成多个预定义部分(例如基于其音节),替代于提供一个具有对应于一个长单词的许多方向的长图形(例如,长扫过轨迹),对应于所述单词的不同(例如,连续)部分(例如,基于音节)的多个短图形可以被提供。这可以具有许多优点,比如更自然,不迫使用户记住用于一个长单词的长轨迹图形等等。可以理解的是,所述轨迹可以在对应的按键(例如,固定、动态)上被提供,或者它们可以是预定义的对应于系统所用键区的图形模型(例如,如前述并且作为例子被图85到图86的模式被示出,对应于键区8500),在感应表面上的任意期望位置上被画出。
在这个实施例中,单个字符可以通过诸如多次击键程序之类的已知方法而被输入。多次击键方法已为使用蜂窝电话的人们所知。
必须指出,键区9500已经被用作一个例子。具有任意其它预定义数量按键并且具有任何符号配置的任何其它键区可以被考虑。这些问题已经在之前被描述。
因此,虽然本发明的基本新颖设计被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略、置换和改变。因此,本发明只通过被附加于此的权利要求范围所指的来限制。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。例如,在不同实施例中描述的数据输入系统逐个部分可以与单词完成系统相结合来提供一个非常准确的系统。还例如,当用户逐部分地输入一个单词时,系统可以逐部分地识别并输入所述单词,并且在所述用户结束输入所述单词时,和在系统结束识别并输入所述单词时,为了所述被输入单词的再验证,系统可以通过所述语言约束方法和歧义消除方法中的一个或全部来进行所述单词的一个并行输入。
例如,尽管一个电话型键区在不同的实施例中被用来举例说明本发明的不同实施例,然而具有被分配给所述键区按键的任何类型的符号配置的任何类型键区都可以和本发明的实施例一起使用。
为了不频繁地重复本发明的数据输入系统的原理,在本申请的许多段落中都提到诸如字符/单词/单词一部分/功能键等等之类的一个或多个符号可以被分配给一个按键(例如,或除了按键之外的一个对象)。可以理解的是,除非另作说明,否则所述符号通常意在被分配给一个与所述按键的最简单预定义交互作用,它可以是对所述按键的单压动作(如在本发明的许多实施例中所解释)。此外,在许多段落中,在解释了把诸如字母/音素组/字符(字母)组/字母串等等(例如,通常是将被说出的符号)之类的符号分配给一个按键之后,为了避免重复本发明的数据输入系统输入所述符号的原理,所述原理可能没有被提及。可以理解的是,除非另作说明,否则所述类型的符号(例如,在现实生活中通常是将被说出的符号)显然(如在本发明的许多实施例中所解释的)通常意指通过对应按键的对应按压动作并优选地同时结合对应于所述符号的语音而被输入。
必须指出,在本申请的许多段落中,术语″字符组″或″字符组″被用来定义字符串。尽管在本发明的不同实施例中提及一个语音识别系统并且意在用它来察觉并识别用户语音,然而一个唇读系统可以被替代地或另外地添加到所述语音识别系统以察觉并识别所述用户的语音(并且反之亦然)。
此外如之前所提及,本发明的一部分或全部方法,比如本发明的至少一个单词的至少一部分接着至少一个单词的至少一部分可以和语言学文本输入识别系统一起使用,比如可能匹配单词的音节数量、可能识别句子的单词数量、短语内的单词位置等等。这个问题已为本领域的技术人员所知。
可以理解的是,根据本发明的另一个实施例,逐字符和逐部分数据输入可以在结合对应语音信息的同一按压并发声动作内被提供。
必须指出,在某些段落中,术语″逐部分″被用于简化术语″(一个或多个)单词的至少一部分接着(一个或多个)单词的至少一部分″。
请注意,尽管为了简化起见,在许多段落中,本发明的数据输入系统用诸如″本发明的数据输入系统″、″本发明的按压/扫过的数据输入系统″、″本发明的按压/扫过并说话的数据输入系统″等等之类的短语被提及,然而可以理解的是,如在许多段落中被详细描述的,这类短语指的是考虑了结合用户语音信息的按压/扫过动作的本发明的数据输入系统的原理,其中,所述语音信息是对应语音的存在或用户语音的不存在。这些问题已经被详细地描述。
必须指出,如上所述,尽管在许多实施例中,一个至少具有被分配了基本上一种语言的所有字母表字母的四个按键的键区作为示例被举例说明,然而可以理解的是,具有任意数量按键、任意按键配置以及被所述按键的任意符号配置的任何类型的键区都可以被考虑与本发明的数据输入系统一起使用。这些问题已经被详细地描述。
请注意,尽管在许多实施例中(例如,按压/扫过与语音信息的数据输入实施例),一个诸如触摸感应垫、触摸屏之类的感应表面已经被用作例子,然而可以理解的是,检测并分析用户与任何表面的交互作用的任何其它技术都可以被用来定义和/或使用软(例如,动态)键区的区域/按键。例如所提及,所述技术可以是光学检测技术或在一个(标准)表面上提供虚拟键区(例如,具有少数按键/区域,其中,例如,至少基本上一种语言的所有字母都被分配给所述键区的4个按键/区域)的红外线技术,并且可以检测触碰所述键区按键/区域的用户手指。
如之前所提及,一个诸如被分配给一个按键的特别退位符号之类的删除装置可以被用来删除一个已输入单词的预定义部分。根据本发明的一个实施例,在提供用于输入所述部分的键压和语音信息之后(例如,并且在所述部分被打印之前),提供所述删除装置可以告知系统不考虑所述键压(例如,键压)和语音信息。例如,所述删除装置可以和本发明的其中一个所述逐部分数据输入方法一起使用,该方法在所述单词被打印之前需要一个单词结束信号。例如,通过考虑所述数据输入方法,在用两个部分″sim-ple″来输入单词″simple″期间,在提供例如对应于部分″sim″的键压和语音信息之后,所述信息可能不被处理,直到用户提供对应于所述单词的剩余部分的信息并且提供一个诸如空格符之类的单词结束信号为止。例如,如果用户识别出他提供来输入部分″sim″的信息是错误的,则他可以按压所述特别退格键来删除所述错误信息并且提供对应于所述部分的新键压和语音信息。
如之前所提及,根据本发明的逐部分的数据输入系统的一个实施例,为了输入一个至少具有一个预定义部分的单词,用户可以首先提供对应于所述(一个或多个)每个部分的按键信息(例如,一个或多个键压)和语音信息,然后他可以提供一个诸如空格符之类的单词结束信号。如所提及,在接收到所述信息之后,系统可以首先在其单词数据库(例如,其中,每个单词都被预定义地分成不同的预定义部分)内进行选择,那些单词:
-具有数量等于用户输入的部分数量的部分;和其中;
-用户连续地按压以输入所述每个部分(例如,如前所述,优选地,表示开头字母和/或末尾字母,并且按需表示至少其中一个中间字母的按键)的一个或多个按键中的每一个都表示所述选择每个单词的对应部分的其中一个对应字母,因此,优选地,彼此相关被按压以用于输入所述部分的所述按键的顺序对应于所选择单词所述部分内彼此相关的所述被表示字母的顺序。
如之前所提及,在选择所述单词之后,根据一个方法,系统比较被提供用于输入所述期望单词每个部分的用户语音与所述被选单词的对应部分的音素组/语音模式。所有部分都匹配对应的用户语音的单词可以被系统选择。如果该选择包括一个单词,则所述单词可以被输入/输出。如果该选择包括超过一个的单词,则系统例如通过把所述选择呈现给用户以用于人工选择来提供一个人工选择程序,或者系统可以自动地把其中一个所述单词选择为最终选择。人工并且自动选择程序已经在本发明人的这个和以前的专利申请中被描述。
通过这个实施例的继续说明,明显地,替代于按压对应于单词一部分的字母的连续键压数量,本发明的扫过轨迹(例如,详细地如前所述)可以被提供在所述按键上。例如,图96示出了本发明的键区9600和一个可仿效的英语词典9609,其中,所述字典的单词被划分成预定义部分(例如,如较早所描述的)。通过考虑所述键区和所述词典,例如,如果用户希望输入单词″master″,则他可以用两个部分″mas-ter″来输入它。为了所述目的,用户可以首先通过分别在按键9602和9601上扫过(如轨迹9605所示)并同时提供对应于所述部分″mas″的语音信息(例如,说出所述部分)来输入对应于部分″mas″的按键信息(例如,预定义地,至少开头和末尾字母)。然后,通过分别在按键9602和9604上扫过(如轨迹9606所示)并同时提供对应于所述部分″ter″的语音信息(例如,说出所述部分),用户可以输入对应于部分″ter″的按键信息(例如,预定义地,至少其开头和末尾的字母)。然后,用户可以提供一个诸如空格符之类的单词结束信号(例如,如之前所提及,根据一个诸如自动空格方法之类的方法,系统可以无须输入单词结束信号而自动地识别出一个单词的结束。这个问题已经被详细地描述。)通过继续参考这个实施例,系统然后可以考虑选择所述字典9609的单词,因此:
-所述单词具有两个预定义部分,和;
-被所述第一轨迹9605扫过的第一按键和最后按键分别表示每个所述选择单词的第一部分的开头和末尾字母,和;
-被所述第二轨迹9606扫过的第一按键和最后按键分别表示所述每个被选单词的第二部分的开头和末尾字母。
在这个例子中,对应于上述条件的单词是:
Bo     dy
bow    ing
mas    ter
toa    ster
tru    sty
(例如,在上述例子中,作为示例,替代于轨迹9606,用户可以通过在对应于部分″ter″的开头字母、中间字母和末尾字母的按键9602、9601、9604上扫过来提供诸如轨迹9607之类的另一个轨迹。在这种情况下,系统只考虑到两个单词″master″和″toaster″)。
根据一个方法,在选择所述单词之后,系统可以比较被提供用于输入所述期望单词每个部分的用户语音与所述被选单词的对应部分的音素组/语音模式。
在这个例子中,系统可以:
-比较被提供用于输入第一部分″mas″的用户语音与所述被选单词第一部分的音素组/语音模式;
-比较被提供用于输入第二部分″ter″的用户语音与所述被选单词第二部分的音素组/语音模式;
基于所述比较,系统可以识别出只有其所有部分的音素组/语音模式都匹配用户语音的单词是单词″master″。所述单词可以被输入/输出。
根据另一个方法,在提供上述的基于键压的单词选择之后,替代于比较用户提供用于期望单词每个部分的语音与所述每个被选单词的对应部分的语音,系统可以结合被提供用于所述部分的所述用户语音,并且比较所述被结合语音与所述每个单词的完整单词语音。基于所述比较,系统可以识别出只有其所有部分的音素组/语音模式都匹配用户语音的单词是单词″master″。所述单词可以被输入/输出。
可以理解的是,刚才所述语音比较方法是可仿效的方法。其它的方法也可以被本领域的技术人员考虑到。
如图所示,通过基于被提供用于所述单词输入的信息来考虑期望单词的部分数量并且通过考虑对应于所述单词每个部分的被提供的按键信息,将被系统考虑用于语音比较的(例如,对应的词典数据库内的)单词数量将显著地降低。这可以极大地帮助系统更准确地识别正确的单词。
可以理解的是,为了更好的准确性,诸如基于所述单词的前一或者下一部分来识别单词一部分的之类的辅助歧义消除方法(例如,之前所述)等等可以与上述实施例相结合。
必须指出,本发明的按压和/或扫过和语音/无语音的数据输入系统的许多衍生形式可以基于本发明人描述的原理被考虑到。例如所示,限制用于语音比较的单词数量的不同方法可以被考虑。还须指出,本发明的数据输入系统的不同的实施例、方法、特征、硬件等等的一部分或全部可以被分开地使用,被结合在一起,或者与市场上可用的其它(例如,数据输入)系统和产品相结合。
如之前所提及,根据本发明的按压和/或扫过并说话的数据输入系统的一个实施例,基于扫过模式的扫过动作可以在一个表面上的不同位置上被提供,其中,系统分析与它们在所述表面上彼此相关的位置无关的所述扫过动作。如所提及,根据本发明的一个实施例,诸如一个按键上的短直线滑动动作之类的预定义滑动动作可以对应于由所述按键表示的至少两个字母。如果所述滑动动作在写入表面一个与所述表面上的前一或下一滑动位置独立的位置上被提供,则为了告知系统对应于所述扫过动作的动态按键,预定义的扫过轨迹可以被考虑。例如,通过参考图97,通过考虑键区模式9700和感应表面97010,以不同预定义方向被提供的短直线独立扫过动作(例如,轨迹9705-9708)可以分别对应于按键9701-9704。还例如,辅助的短扫过轨迹97011-97014中的每一个都可以对应于在所述四个按键9701-9704的左边、右边、上边和下边上的(可能存在的任何)辅助按键。可以理解的是,其它的键区模式和/或其它的预定义轨迹可以基于这些原理而被考虑。
根据本发明的一个实施例,当用户把其手放在电子设备(例如,具有触碰感应表面的平板计算机、PDA等等)的表面上以用于输入数据时,基于所述用户手在所述设备上的位置(优选地,所述手被置于所述感应表面中,因此系统可以基于用户手在所述感应表面上的位置来定义所述键区),系统可以动态地定义对应于一个预定义键区模式的动态键区按键位置。所述动态键区按键位置还可以取决于诸如用户使用触控笔、手指或多只手指等等来进行数据输入之类的其它预定参数。这个键区校准方法可以代替早先描述的其它校准程序。此后的例子将更详细地描述这个校准方法。
图98a示出了一个诸如具有感应表面9800平板计算机之类的电子设备,其中,将所述计算机触控笔9807握在其手中用于数据输入的用户手9809被放在所述表面上。通常,每当同一用户把触控笔握在他手中并且最初把其手放在所述表面上以用于数据输入时,用户手(例如,与所述表面的)接触位置9808和所述触控笔笔尖9805之间的位置实质上是相同的。此外,用户手接触位置9808和所述触控笔笔尖9805之间的距离实质上是相同的。因此,通过至少考虑所述参数,一个对应于预定义键区模式9808的预定义动态键区可以取决于用户手在所述表面山的放置位置而被定义。在图98a的例子中,按键9802可以对应于用户手中握的触控笔9807的指向笔尖9805,其中,所述用户的手以自然放松位置以起始的敲击/滑行位置被放置在所述表面上。所述动态键区的其它按键9801、9803、9804因此可以被定义。必须指出,为了不淆乱系统,所述键区按键之间的预定义距离可以被考虑。
可以理解的是,每个用户都可能具有不同尺寸的手、不同尺寸的手指、不同的触控笔握住方法等等。因此,每个用户可以″教给″系统他自己的习性(例如,通过最初把触控笔握在手中并且在所述表面上提供第一预定义敲击)。系统可以记住所述信息以便在之后使用它。基于这些原理,系统可以包括一个或多个被记住信息以用于每个用户。
根据本发明的一个实施例,基于用户手正在接触的感应表面一部分的当前形状,当在所述表面上敲击/滑动时,系统可以动态地识别用户当前交互作用的动态键区按键。例如,当用户正在与感应表面上的预定义键区的左边按键交互作用(例如,按压、滑动)时用户手接触的感应表面一部分的形状不同于当用户正在与所述键区的右边按键交互作用时用户手接触的感应表面一部分的形状。
把手放在感应表面上来输入数据可以对完整的数据输入和鼠标功能有好处。例如,当用户通过用触控笔来敲击/滑动(例如,并且通过提供对应的语音信息)正在输入数据(例如,文本)时,他可以把其手放在感应表面上。用户可以通过不把其手放在所述表面上而用所述触控笔来提供鼠标功能。在这种情况下,当系统在所述感应表面上检测到用户的手时,它可以认识到用户提供的敲击或扫过动作可以预定义地对应于数据输入。另一方面,当系统在所述感应表面上检测到笔尖笔划但是没有检测到用户的手时,它可以认识到用户提供的敲击或扫过动作可以预定义地对应于鼠标功能(例如,反之亦然)。
图98b示出了当前实施例的另一个例子,差别在与这里,用户将其手指9816用于在触碰感应9810上敲击/滑动。基于用户放在所述表面上的手来定义对应动态键区9818的按键的原理可以类似于对于使用触控笔被描述的原理,其差别在于在此替代于笔尖,用户指尖9817可以被系统考虑到。
因此,虽然本发明的基本新颖设计被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略、置换和改变。因此,本发明只通过被附加于此的权利要求范围所指的来限制。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。例如,在不同实施例中描述的数据输入系统逐个部分可以与单词完成系统相结合来提供一个非常准确的系统。还例如,当用户逐部分地输入一个单词时,系统可以逐部分地识别并输入所述单词,并且在所述用户结束输入所述单词时,和在系统结束识别并输入所述单词时,为了所述被输入单词的再验证,系统可以通过所述语言约束方法和歧义消除方法中的一个或全部来进行所述单词的一个并行输入。
例如,尽管一个电话型键区在不同的实施例中被用来举例说明本发明的不同实施例,然而具有被分配给所述键区按键的任何类型的符号配置的任何类型键区都可以和本发明的实施例一起使用。
为了不频繁地重复本发明的数据输入系统的原理,在本申请的许多段落中都提到诸如字符/单词/单词一部分/功能键等等之类的一个或多个符号可以被分配给一个按键(例如,或除了按键之外的一个对象)。可以理解的是,除非另作说明,否则所述符号通常意在被分配给一个与所述按键的最简单预定义交互作用,它可以是对所述按键的单压动作(如在本发明的许多实施例中所解释)。此外,在许多段落中,在解释了把诸如字母/音素组/字符(字母)组/字母串等等(例如,通常是将被说出的符号)之类的符号分配给一个按键之后,为了避免重复本发明的数据输入系统输入所述符号的原理,所述原理可能没有被提及。可以理解的是,除非另作说明,否则所述类型的符号(例如,在现实生活中通常是将被说出的符号)显然(如在本发明的许多实施例中所解释的)通常意指通过对应按键的对应按压动作并优选地同时结合对应于所述符号的语音而被输入。
必须指出,在本申请的许多段落中,术语″字符组″或″字符组″被用来定义字符串。
尽管在本发明的不同实施例中提及一个语音识别系统并且意在用它来察觉并识别用户语音,然而一个唇读系统可以被替代地或另外地添加到所述语音识别系统以察觉并识别所述用户的语音(并且反之亦然)。
此外如之前所提及,本发明的一部分或全部方法,比如本发明的至少一个单词的至少一部分接着至少一个单词的至少一部分可以和语言学文本输入识别系统一起使用,比如可能匹配单词的音节数量、可能识别句子的单词数量、短语内的单词位置等等。这个问题已为本领域的技术人员所知。
可以理解的是,根据本发明的另一个实施例,逐字符和逐部分的数据可以在结合对应语音信息的同一按压并发声动作内被提供。
必须指出,在某些段落中,术语″逐部分″被用于简化术语″(一个或多个)单词的至少一部分接着(一个或多个)单词的至少一部分″。
请注意,尽管为了简化起见,在许多段落中,本发明的数据输入系统用诸如″本发明的数据输入系统″、″本发明的按压/扫过的数据输入系统″、″本发明的按压/扫过并说话的数据输入系统″等等之类的短语被提及,然而可以理解的是,如在许多段落中被详细描述的,这类短语指的是考虑了结合用户语音信息的按压/扫过动作的本发明的数据输入系统的原理,其中,所述语音信息是对应语音的存在或用户语音的不存在。这些问题已经被详细地描述。
必须指出,如上所述,尽管在许多实施例中,一个至少具有被分配了基本上一种语言的所有字母表字母的四个按键的键区作为示例被举例说明,然而可以理解的是,具有任意数量按键、任意按键配置以及被所述按键的任意符号配置的任何类型的键区都可以被考虑与本发明的数据输入系统一起使用。这些问题已经被详细地描述。
请注意,尽管在许多实施例中(例如,按压/扫过&语音信息的数据输入实施例),一个诸如触摸感应垫、触摸屏之类的感应表面已经被用作例子,然而可以理解的是,检测并分析用户与任何表面的交互作用的任何其它技术都可以被用来定义和/或使用软(例如,动态)键区的区域/按键。例如所提及,所述技术可以是光学检测技术或在一个(标准)表面上提供虚拟键区(例如,具有少数按键/区域,其中,例如,至少基本上一种语言的所有字母都被分配给所述键区的4个按键/区域)的红外线技术,并且可以检测触碰所述键区按键/区域的用户手指。
今天,陆地线路(固定)电话和DECT电话还被用于诸如SMS之类的任务。所述电话通常没有处理器和存储器,或者它们可能具有有限处理器和存储器。根据本发明的一个实施例,本发明的数据输入系统可以与所述电话一起被使用。为此,所述电话可以被连接到一个诸如PC或服务器之类的计算设备。用户使用所述电话键区和麦克风(例如,所述电话的麦克风,或一个独立的麦克风)来提供的键压和语音(例如,对应于输入一个文本)可以被发送到所述计算单元,并且结果输出(例如,一个被打印的文本)可以通过所述计算单元被例如发送到所述电话的显示单元。例如,图99示出了一个具有被连接到计算机9902的基站9901的DECT电话。所述电话可以具有一个可以与所述基站或所述计算机无线通信的手机9903。本发明的数据输入系统可以在所述计算机9902内被实现。用户可以通过使用所述手机(例如,的键区9904和/或麦克风9905)来提供键压信息和对应的语音信息。所述信息可以被发送(例如,经由所述基站,或直接地)到所述计算机9902中并且由所述计算机来处理。结果(例如,被输出文本)可以被发送回(例如,经由所述基站,或直接地)所述手机9903并且在其显示9906上被打印以用于用户验证。在结束输入所述文本之后,用户可以经由所述陆线电话把所述消息发送到一个期望目标(例如,另一个电话)。可以理解的是,替代于或除了所述手机的麦克风之外,用户可以使用诸如可伸出麦克风之类的另一个麦克风或诸如耳机麦克风之类的分离麦克风。当所述键压可以通过使用所述手机的键区被提供并且被发送到计算机时,所述麦克风可以直接与所述计算机通信。
可以理解的是,所述手机还可能包括诸如摄像头9907之类的辅助装置,以便察觉到在将通过系统的唇读识别系统使用的数据输入期间用户的嘴唇图像,如之前详细地所述。
用户还可以通过将其与本发明的数据输入系统一起使用来把所述手机用作所述计算机的键盘。可以理解的是,尽管在上述的例子中,一个DECT电话已经作为示例被示出,然而这个实施例可以被应用到诸如(常规)有线电话、电子设备的遥控器等等之类的任何其它设备。
英语的字母表字母的不同配置以及对键区四个按键的分配已经在之前被举例说明。图100示出了被分配给四个按键的字母的另一个配置。所述字母可以被集合成四个群,并且所述每个群都可以被分配给所述四个按键的不同按键。通过使用这个配置与本发明的数据输入系统,即使用户几乎耳语期望字母并且按压对应的按键,系统也可以几乎无差错地识别出对应的字母。此外,图100的字母群被配置并且被分配给所述四个按键,因此优选地在很多情况下,所述用户使用两个不同的大拇指来按压对应于英语单词内两个连续字母的两个按键。可以理解的是,对这个配置的修改可以被提供而不会降低准确性。例如,字母″m″和″n″可以在它们的对应按键上被交换。此外,诸如″j″和″k″之类的其它字母也可以被交换。此外,所述四个按键群中的每一群都可以被分配给所述四个按键的任何不同的按键(例如,或者所述键区的其它按键)。
如之前所提及,本发明的数据输入系统可以允许用户通过结合用于输入所述单词的敲击和扫过动作来输入一个具有超过一个部分的单词。例如,具有两个部分的单词的第一部分可以通过用本发明的逐字符数据输入系统来输入它而被输入(例如,通过提供对应于所述部分的字母的按键上的按压动作并同时说出所述字母),而所述单词的第二部分可以通过本发明的逐部分数据输入系统而被输入(例如,通过提供对应于所述部分的至少一部分字母(例如,所述部分的开头和末尾字母)的按键上的扫过动作并同时说出所述部分)。此外如所提及,根据本发明的一个逐部分数据输入系统的实施例,系统在提供一个诸如空格符或标点符号字符之类的单词结束信号之后处理用户的输入。
通过考虑上述方法,如果用户逐字符地输入字符串(例如,通过按压对应于所述每个字母的按键和说出所述字母),并且其中,在它们之前没有一个单词部分通过本发明的逐部分(例如,通过滑动对应于所述部分的一部分字母的按键并且说出所述部分)数据输入系统被输入,则系统可以处理所述信息和优选地打印它,而不论一个稍后可能由用户提供的单词结束信号。这是因为系统可能不知道被输入的所述字符是否对应于一个单词(一个或多个)开始部分,并且不知道用户是否可以通过本发明的逐部分数据输入系统输入所述单词的后续部分。因此,系统优选地打印所述输出以便用户在所述字符不是单词一部分的情况下可以立即看见输出,或者它们是单词的一部分但是所述单词的(一个或多个)剩余部分还可以通过本发明的逐字符数据输入系统而被输入。如果在所述字符串(例如,字母)之后通过本发明的逐部分数据输入系统(例如,滑动并说话)输入一个单词的至少一部分,则系统可以理解,被逐字符输入的所述字符是一个单词的(一个或多个)开始部分,该单词包括然后被逐部分输入的(一个或多个)后续部分。系统一直等待到用户提供一个单词结束信号为止,然后处理逐字符输入的所述整个输入(逐字符输入的(一个或多个)部分,以及逐部分输入的部分)以输入/输出所述字。
根据另一个实施例,如果用户逐字符地输入字符串,并且其中,在它们一个单词的至少一部分通过诸如本发明的扫过以及说话方法而不提供单词结束信号之类的本发明的逐部分数据输入系统被输入之前,则系统可以一直等到用户结束输入所述单词的所有部分为为止并且提供一个单词结束。然后,系统处理对应于所述单词的所述整个输入信息以便识别所述单词。
可以理解的是,在本发明的输入系统的实施例中,其中,用户通过使用本发明的逐字符数据输入系统(例如,按压并说话)来输入一个单词的至少一部分,并且通过本发明的逐部分数据输入系统(例如,滑动并说话)来输入所述单词的至少另一个部分,被逐字符输入的(一个或多个)所述部分可以准确地提供对期望单词内的对应字符串(例如,字母)的识别以便系统可以使用所述信息更容易地识别整个单词。为那个目的,例如,系统可以只考虑它们的一部分具有所述字符串的单词。
必须指出,本发明的逐部分(例如,滑动并按压并说话)数据输入系统可以以诸如保健领域之类的特殊领域作为目标,并且因此替代于考虑对应于大量单词的预定义部分的数据库,系统可以使用一个对应于与所述领域有关的被约束单词数量的受约束的单词部分的数量。
根据本发明的一个实施例,用户可以在数量结束处输入一个诸如″00″、″000″、″000000″之类的预定义数量的零。为此,所述预定义数量的零可以被分配给一个按键,优选地被分配给被分配了数字″0″的按键。为了输入所述预定义数量的按键,用户可以按压对应的键并说出一个对应于所述预定义数量零的语音。例如,″00″可以预定义地称作″百(hundred)″。例如,为了输入数量″200″,用户可以按压对应于数字″2″的按键并且说出″two″。系统打印数字″2″。然后,用户可以按压对应于″00″的按键并且说出″百(hundred)″。系统可以把对应的符号″00″定位在数字″2″之后来提供数字″200″。因此,符号″000″、″000000″等等中的每一个都可以被预定义地并且分别地称作″千(thousand)″、″百万(million)″等等,并且被分配给一个诸如被分配了数字″0″的按键之类的按键,并且通过按压对应的按键并且说出所述符号而被输入。
如之前所提及,在本发明人申请的不同专利申请中,一个符号可以分配给分配给一个按键并且通过提供两个按键上的按压动作而被输入。所述按压动作可以是按压一个对应于所述符号的按键并且在存在或不存在语音的情况下按压至少另一个(例如,预定义)的按键。所述按键上的所述按压动作可以基本上同时被提供。
图101示出了一个具有至少四个按键10101-10104的键区10100,诸如英语字母表字母之类的符号被分配给四个按键10101-10104。例如,通过考虑键10104,用户可以通过按压所述按键10104并且说出字母″a″来输入字母″d″。
对于所述按键的至少一部分中的每一个,一个诸如标点符号字符之类的第一附加符号群也可以被分配,其中,所述辅助群的一个符号可以通过在不存在语音或者存在预定义语音(例如,被分配给所述符号)的情况下提供其对应按键上的按压动作而被预定义地输入。参考图101,例如,按键10104可以包括第一附加符号群″[]-″。例如,为了输入符号″[″,用户可以按压所述按键并且说出″open″。为了输入符号″]″用户可以按压所述按键并且说出″close″。还例如,为了输入符号″-″,用户可以按压所述按键而不说话。这些问题已经被详细地描述。
所述按键至少一部分中的每一个都可以表示第二辅助符号群,其中,所述第二辅助群的一个符号可以在不存在语音或存在预定义语音的情况下通过与所述按键以及至少另一个按键交互作用而被预定义地输入。例如,按键10104可以表示第二附加符号群″ACDFPX{}_″。
用于输入符号的、需要与两个或更多按键交互作用(例如,按压/滑动)的不同预定义程序可以被考虑。所述程序可以是比如:
-按压并保持第一按键(一个预定义键,或任何按键)然后按压一个对应于期望符号(例如,优选地,标点符号字符、功能键、命令等等)期望按键(或反之亦然),并且并不提供语音可以对应于所述期望符号的输入。例如,为了输入由按键10104表示的标点符号″_″,用户可以按压按键10401-10403中任意一个,然后按压按键10104而不提供语音来输入所述符号″_″。
-按压并保持第一按键(一个预定义按键,或任意按键)然后按下一个对应于期望符号(例如,字母、字符串、单词一部分、单词、标点符号字符、功能键、命令等等)的期望按键(或反之亦然),并且提供一个对应于所述符号的语音可以对应于所述符号的输入。例如,为了输入大写字母″A″,用户可以按压并保持除了按键10104之外的任意按键(例如,预定义地,一个预定义按键或除了表示所述符号的按键之外的任意按键),然后按压表示字母″a″的所述按键10104并且说出所述字母以便输入(大写字母)″A″。因此,一个语言的所有大写字母都可以被输入。还例如,为了输入由按键10104表示的字符″{″,用户可以按压按键10401-10403中的任意一个然后按压按键10104并且说出″open″。
-按压并放开一个预定义(例如,修改)按键,然后按压一个对应于所述按键的期望按键并且提供一个预定义语音/不提供对应于所述符号的语音。例如,为了输入字符″{″,(被分配给所述第二辅助群),用户可以在不存在语音或存在一个预定义语音的情况下预定义地按压并放开那个按键10103,以便提供功能″Shift″(例如,改变模式)。然后,他可以按压按键10104并且说出″open″。
-不论哪个按键在其它(一个或多个)按键之前或之后按压,同时按压至少两个按键,并且在不存在或存在所述预定义语音的情况下提供一个对应于被分配给所述按压动作的预定义符号的预定义语音/不提供语音。仍然通过参考键区10100,例如,同时按压对应于命令″Ctrl″、″Alt″以及″Del″的按键10101、10102和10104(例如,不提供语音,或者提供一个预定义语音)可以复制对应于PC的″Ctrl″、″Alt″和″Del″按键上的同时按压动作的功能键。
必须指出,提供一个诸如预定义按压动作之类的与两个或更多按键中的每一个的预定义交互作用可以是本发明人申请的不同专利申请中描述的许多种交互作用中的至少一个。例如,第一按键上的第一符号可以被分配给一个程序,该程序包括按压并保持一个除了所述第一按键之外的按键,然后单压对应于所述符号的所述第一按键并且提供一个预定义的语音信息(例如,没有语音,或者存在一个被分配给所述符号的语音)。还例如,第二按键上的第二符号可以被分配给一个程序,该程序包括按压并保持一个除了所述第二按键之外的按键,然后双压对应于所述符号的所述第二按键并且提供一个预定义的语音信息(例如,不存在语音,或者存在一个被分配给所述符号的语音)。
上述程序可以有用于经由一个具有被(例如,极大)降低了按键数量的键区来分配并且容易地输入更多符号。
必须指出,替代于分配一个符号来与两个或更多的按键交互作用,所述符号可以例如用根据上述不同程序的键压顺序被分配给所述按键上的滑动动作。
根据本发明的一个实施例,少数按键(例如,如较早所述并所示的4-8个)可以被提供在桌面监视器的(例如,两面)内,并且与所述桌面内提供的本发明的数据输入系统一起使用。这可以允许例如在所述键盘不是书桌上的计算机前所期望的时避免使用一个PC键盘。
根据本发明的另一个实施例,一个与本发明的数据输入系统一起使用的麦克风可以被连结到用户的鼻子,因此所述麦克风的接收器(例如,非常)靠近用户的嘴。图102作为示例示出了用户10200,其中,麦克风单元10201被连结到他的鼻子。所述麦克风的连结装置可以是一个预定义种类以便把所述麦克风连结到用户鼻子的预定义部分。在图102的例子中,所述麦克风单元具有一个连结装置10202,用于把所述麦克风连结到用户的鼻子的顶端。所述麦克风单元可以具有一个实质上的刚性构件10206(例如,从所述连结装置延伸向用户鼠标),因此当所述麦克风单元被连结到用户的鼻子时,所述麦克风单元的接收器10203位置非常靠近用户的嘴(例如,在嘴的前面)。所述麦克风单元可以通过无线或有线10205被连接到对应的设备10204。
一个所述麦克风单元可以被由于认为它不舒服或笨重而不希望携带耳机麦克风的用户所用。这个实施例的麦克风单元可以被置于非常靠近用户的嘴,容易地连结到或从用户的鼻子处分开,并且可以是非常小的,从而使得它便于携带。
如之前所提及并示出,本发明的数据输入系统可以使用八个按键(例如,两个四个方向的按键),至少一种语言的字母表字符被分配给那八个按键。图103a作为示例示出了一个具有两个四方向按键10301、10302的(例如,计算)设备10300,其中,一种语言的字母表字符被分配给所述两个多方向按键的所述八个方向按键。如这例子中所示,其中一个分配方法是把电话型键区(例如,英语字母表字母被分配给电话型键区的八个按键)的字母群复制到所述多方向按键的所述八个按键,因此,电话键区的(例如,SMS)用户可以容易地采纳所述八个按键的按键使用。
图103b与类似的图103a具有微小的差别,因此所述设备上彼此相关所述按键位置和被分配给所述按键的字母实质上提示了彼此相关的电话键区按键位置和被分配给所述按键的字母。
可以理解的是,图103和103b中所示的按键类型和字母向所述按键(例如,所述两个多方向按键的按键)的分配只是作为例子被示出。其它分组以及把所述字母分配给八个按键的方法也可以基于例如本发明人较早所述明确原理而被考虑。例如,字母″d″和″m″可以在其对应按键上交换(例如,较早被描述并示出)以便加强(例如,语音识别)系统的准确性。还例如,所述八个按键上的所述字母的布局可以被考虑,因此实质上具有彼此相关的歧义相似语音的两个字母可以分别被分配给不同的按键。必须指出,所述八个按键可能是诸如常规按键之类的任何类型的按键,其可以不是多方向按键的按键的一部分。此外,它们可以被集合成一个群,或者可以被集合成更多的群,比如先前在本发明的不同实施例中所示的四个按键的两个群,因此所述每个群都通过不同用户的大拇指被使用。
如前所述,本发明的(例如,按压/滑动并说话)数据输入系统可以与其它数据输入和编辑方法相结合。例如,用户可以经由本发明的数据输入系统使用诸如平板计算机之类的电子设备的触控笔来输入数据。如之前所提及,当用户试图通过与所述设备的感应表面的(例如,动态按键)交互作用(例如,敲击/滑动)并提供对应语音来输入文本时,系统可以理解用户正在使用本发明的按压和/或滑动并说话的数据输入系统。当所述用户在所述显示屏上滑动而不提供语音时,系统可以理解用户正在通过使用电子墨水输入数据。所述电子墨水绘画可以由手写识别系统翻译来提供打印的字符。
如果用户敲击所述表面而不说话,则例如根据一个方法,系统可以分析所述表面上的所述敲击位置来确定所述敲击动作是否对应于本发明的按压并说话的数据输入系统(例如,如前所述地经由本发明的按压并说话的数据输入系统,一个符号可以在不存在语音的情况下通过按下其对应按键被输入),或者确定它可能对应于使用电子墨水的数据输入系统。例如,通过分析所述表面上彼此相关或者与前一或下一滑动动作有关的所述敲击动作的位置,系统可以认识到所述(一个或多个)敲击动作对应于经由本发明的数据输入系统的数据输入。
根据本发明的一个实施例,如果在不存在所述用户语音的情况下用户提供了敲击和/或滑动动作,则系统可以分析所述敲击/滑动动作以便将其对应到下列中的至少一个:
-本发明的按压并说话的数据输入系统
-手写数据输入系统
-鼠标(例如,点击)功能
根据本发明的一个实施例,至少一部分鼠标(例如,点击)功能中的每一个都可以被分配给在存在预定义对应语音的情况下与一个键区的至少一个(例如,硬或软)按键的交互作用。
因此,虽然本发明的基本新颖设计被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略、置换和改变。因此,本发明只通过被附加于此的权利要求范围所指的来限制。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。例如,在不同实施例中描述的数据输入系统逐个部分可以与单词完整系统相结合来提供一个非常准确的系统。还例如,当用户逐部分地输入一个单词时,系统可以逐部分地识别并输入所述单词,并且在所述用户结束输入所述单词时,和在系统结束识别并输入所述单词时,为了所述被输入单词的再验证,系统可以通过所述语言约束方法和歧义消除方法中的一个或全部来进行所述单词的一个并行输入。例如,尽管一个电话型键区在不同的实施例中被用来举例说明本发明的不同实施例,然而具有被分配给所述键区按键的任何类型的符号配置的任何类型键区都可以和本发明的实施例一起使用。
为了不频繁地重复本发明的数据输入系统的原理,在本申请的许多段落中都提到诸如字符/单词/单词一部分/功能键等等之类的一个或多个符号可以被分配给一个按键(例如,或除了按键之外的一个对象)。可以理解的是,除非另作说明,否则所述符号通常意在被分配给一个与所述按键的最简单预定义交互作用,它可以是对所述按键的单压动作(如在本发明的许多实施例中所解释)。此外,在许多段落中,在解释了把诸如字母/音素组/字符(字母)组/字母串等等(例如,通常是将被说出的符号)之类的符号分配给一个按键之后,为了避免重复本发明的数据输入系统输入所述符号的原理,所述原理可能没有被提及。可以理解的是,除非另作说明,否则所述类型的符号(例如,在现实生活中通常是将被说出的符号)显然(如在本发明的许多实施例中所解释的)通常意指通过对应按键的对应按压动作并优选地同时结合对应于所述符号的语音而被输入。
必须指出,在本申请的许多段落中,术语″字符组″或″字符组″被用来定义字符串。
尽管在本发明的不同实施例中提及一个语音识别系统并且意在用它来察觉并识别用户语音,然而一个唇读系统可以被替代地或另外地添加到所述语音识别系统以察觉并识别所述用户的语音(并且反之亦然)。
此外如之前所提及,本发明的一部分或全部方法,比如本发明的至少一个单词的至少一部分接着至少一个单词的至少一部分可以和语言学文本输入识别系统一起使用,比如可能匹配单词的音节数量、可能识别句子的单词数量、短语内的单词位置等等。这个问题已为本领域的技术人员所知。
可以理解的是,根据本发明的另一个实施例,逐字符和逐部分的数据可以在结合对应语音信息的同一按压并发声动作内被提供。
必须指出,在某些段落中,术语″逐部分″被用于简化术语″(一个或多个)单词的至少一部分接着(一个或多个)单词的至少一部分″。
请注意,尽管为了简化起见,在许多段落中,本发明的数据输入系统用诸如″本发明的数据输入系统″、″本发明的按压/扫过的数据输入系统″、″本发明的按压/扫过并说话的数据输入系统″等等之类的短语被提及,然而可以理解的是,如在许多段落中被详细描述的,这类短语指的是考虑了结合用户语音信息的按压/扫过动作的本发明的数据输入系统的原理,其中,所述语音信息是对应语音的存在或用户语音的不存在。这些问题已经被详细地描述。
必须指出,如上所述,尽管在许多实施例中,一个至少具有被分配了基本上一种语言的所有字母表字母的四个按键的键区作为示例被举例说明,然而可以理解的是,具有任意数量按键、任意按键配置以及被所述按键的任意符号配置的任何类型的键区都可以被考虑与本发明的数据输入系统一起使用。这些问题已经被详细地描述。
请注意,尽管在许多实施例中(例如,按压/扫过和语音信息的数据输入实施例),一个诸如触摸感应垫、触摸屏之类的感应表面已经被用作例子,然而可以理解的是,检测并分析用户与任何表面的交互作用的任何其它技术都可以被用来定义和/或使用软(例如,动态)键区的区域/按键。例如所提及,所述技术可以是光学检测技术或在一个(标准)表面上提供虚拟键区(例如,具有少数按键/区域,其中,例如,至少基本上一种语言的所有字母都被分配给所述键区的4个按键/区域)的红外线技术,并且可以检测触碰所述键区按键/区域的用户手指。
如之前所提及,(例如,在现实生活情况中)需要语音并且提供对应语音的至少一部分符号可以被分配给与对应对象(例如,按键)的交互作用,并且(例如,在现实生活情况下)不需要语音的至少一部分符号可以被分配给不提供语音的与对应对象的交互作用(例如,按压动作),对应对象比如是一个按键(例如,两个类型的符号都可以被分配给相同对象)。
此外如之前所提及,本发明的数据输入系统可以和指定给至少一个特殊领域的设备一起使用。例如,所述设备可以是(例如,可以使用遥控器的)媒体中心娱乐PC、游戏设备、开门器等等。例如图104a中所示,在诸如使用遥控器10401的媒体中心PC 10400之类的媒体中心娱乐设备的情况下,至少一个所述遥控器的按键群,比如按键群10402(例如,4按键)、和/或10403(例如,电话型键区)可以表示本发明的数据输入系统的至少一部分文本符号(例如,至少一种语言的字母、单词的一部分、单词),其中,如之前所提及,一个被分配给诸如按键10404之类的按键的符号可以通过按压所述按键并提供对应于所述符号的语音而被输入。同一按键或另一按键可以被用来输入至少一个用于操作所述娱乐设备的命令符号(例如,播放、倒带、前进、停止等等)。为此,例如,至少其中一个所述命令可以被分配给同一按键10404并且通过按压所述按键并提供一个对应于所述命令的语音信息而被输入,其中,所述语音信息可以预定义地是预定义地被分配给所述命令符号的语音的存在或不存在。
根据另一个例子,如图104b中所示,在诸如设备10410之类的游戏设备的情况下,例如,诸如按键10411-10414(例如,4按键)之类的所述设备的至少一个按键群可以表示本发明的数据输入系统的至少一部分文本符号(例如,至少一种语言的字母、单词的一部分、单词),其中,如之前所提及,一个被分配给诸如按键10414之类的按键的符号可以通过按压所述按键并提供对应于所述符号的语音而被输入。同一按键或另一按键可以被用来输入至少一个用于操作所述游戏设备的命令符号(例如,游戏内的命令)。因此,例如,在玩游戏设备的游戏期间,用户可以与所述游戏设备的按键交互作用,例如向左、右、上、下移动图标10415(例如,游戏的虚拟英雄),并他还可以通过与(例如,表示一部分文本符号的)所述按键交互作用并提供对应语音把文本的至少一部分输入到所述设备中(例如,输入到所述游戏中)。例如,至少其中一个所述命令可以被分配给同一按键10414并且通过按压所述按键并提供对应于所述命令的语音信息而被输入,其中,所述语音信息可以预定义地是语音的不存在或者是被预定义地分配给所述命令符号的预定义语音的存在。可以理解的是,上面所提供的例子只是用来举例说明与诸如游戏或MCEs之类的应用相结合的本发明的数据输入系统的少数应用。例如,玩游戏的按键和输入数据的按键(例如,本发明的文本输入系统)可以被分开地排列在所述游戏设备上。此外,可以理解的是,本发明的数据输入系统可能与目标在于所述设备需要数据(例如,文本)输入的任何市场的任何设备相结合。
必须指出,如之前所提及,一个(移动)设备(例如,没有处理单元(例如,CPU)和/或存储器,或者它具有有限的处理能力和/或有限的存储量)可以无线或有线地被连接到另一个计算机(例如,具有足够的处理能力和/或存储器),以便把经由所述(移动)设备提供的用户交互作用(例如,至少按键交互作用)和对应的用户语音信息输入给所述计算机,并且所述计算机最终把结果发送回所述(移动)设备的(屏幕)。所述设备可以是诸如移动电话、DECT电话、PDA、遥控器、游戏设备等等之类的任何设备。所述(移动)设备和所述计算机之间的所述无线连接系统可以是诸如RF、IR、LAN连接(例如,802a)等等之类的任何无线连接。
如之前所提及,本发明的数据输入系统可以包括一个预定义数量的(例如,文本)可以被集合成(少数)不同群(例如,所述群共同实质上包括所有所述符号,并且其中,一个符号可以被集成在一个或多个所述群内)的符号(例如,至少一种语言的字母表字母),其中,每个群由包括用户其中一个与其中一个预定义对象的预定义交互作用的预定义交互作用(例如,预定义按键上的预定义按压动作、手指的预定义手势、预定义眼睛运动等等)程序来表示,并且其中,其中一个所述符号群的一个符号可以通过提供与对应对象的所述预定义交互作用并且提供被分配给所述符号群内的所述符号的预定义语音信息而被输入,其中,所述语音信息可以是语音的不存在或者被分配给所述群的所述符号的预定义语音。此外,如之前所提及,例如,(感应)表面不同位置上的不同预定义敲击动作分别可以被认为是一个不同的预定义交互作用程序。
触控笔计算机和经由所述触控笔的数据输入系统已经被本发明人发明并且因此专利申请已经被申请。如同所述,所述触控笔的写入笔尖可以被这样构造,因此所述表面不同方向上的滑动动作提供一个不同类型的声音(例如,声波)或振动(例如,振动波)。所述声音或振动可以被一个传感器(例如,所述触控笔内集成的麦克风)察觉到并且分析。
根据本发明的一个实施例,用所述笔尖在一个表面上向几个(例如,四个到八个)方向中的一个方向的每个滑动(例如,扫过)动作可以表示本发明的数据输入系统的一个预定义(例如,文本)符号群。例如,通过考虑键区模式10509,图105示出了一个具有写入笔尖的触控笔10500,该写入笔尖当其分别在四个预定义方向10501-10504的一个中滑动时提供不同的对应声音(或振动)波。每个所述滑动动作可以表示本发明的数据输入系统的一个不同的符号群(例如之前所述,字母、单词一部分、单词标点符号、命令等等)。为了输入其中一个所述符号,用户可以在表示被分配所述符号的符号群的方向中滑动写入笔尖,并且提供一个对应于所述符号的语音信息。例如,为了输入字母″D″,用户在方向10504中滑动10505笔尖并且说出所述符号。还例如,为了输入标点符号″?″,用户在同一方向中提供一个滑动动作而不提供语音。事实上,不同预定义方向中的每个所述滑动动作都可以代替本发明的数据输入系统中的预定义按键上的按压动作。其余的数据输入程序可以类似于在本发明人申请的这个和以前的专利申请中描述的本发明的数据输入系统的实施例。例如,根据另一个实施例,除了捕获不同方向中的滑动动作的声音或振动之外,一个加速传感器可以被集成在所述触控笔内以便捕获所述触控笔(笔尖)的运动方向。例如,在空中不同方向中的触控笔运动(例如,没有滑动声音/振动)可以表示至少一种语言的字符(例如,字母),而表面上的滑动动作可以表示至少一种语言的单词一部分/单词。例如,用户可以通过在空中预定义方向中提供触控笔运动来提供逐字符数据输入,并且通过在表面上的(例如,相同)预定义方向中提供滑移运动来提供本发明的逐部分数据输入系统(或反之亦然)。对于触觉传感,在空间中的每个运动结束时,用户可以在所述表面上敲击笔尖。应当指出,所述单词的一部分可以包括至少两个字母,并且被分配给所述部分的语音可以是说出所述字母。这些问题先前已经被详细描述。例如,为了输入字母″D″,用户在空间中的方向10504中移动笔尖并且说出所述符号。因此,例如,为了输入单词一部分″den″,用户可以在方向10504中滑动10505笔尖并且说出所述部分。
还须指出,本发明的数据输入系统可以使用任何对象(例如,按键手指)、任何类型的交互作用(单压、双压、用指尖或指肚部分触碰,用户手指提供的不同运动或手势,等等)。
根据本发明的一个实施例,一个或多个传感器可以被集成在诸如工作台台面或墙壁之类的表面内,以便当用户敲击所述表面时,所述表面上的所述敲击点位置可以被系统识别。基于所述方法,不同的预定义位置(例如,4到8个位置等等)可以表示本发明的预定义键区并且和本发明的数据输入系统一起使用。例如,用户可以敲击桌子上表示一个例如包括字母″m″的符号群的预定义位置(例如,部分),并且说出所述字母来输入所述字母。所述表面上的所述按键的定义和使用可以基于先前描述的(例如,动态)键区的方法。因此,所述传感器可以是在房屋、办公室等等内的不同表面中并且被连接到一个(包括本发明的数据输入系统的)计算设备,因此用户不必携带键区在所述计算机内输入数据(例如,文本)。
如之前所提及,本发明的数据输入系统可以使用超过一种语言的(例如,文本)符号。例如,所述字母的英语和法语发音可以被分配给被分配给键区按键的罗马字母。根据一个方法,为了输入其中一个所述字母,用户可以按压一个对应键并且说出被分配给所述字母的任何发音(例如,在这个例子中用英文或法语)。根据另一个方法,一个诸如模式按键、话音命令等等之类的装置可以被用来在语言之间切换。例如,当系统在英语模式中时,用户可以按压对应按键并且用英语说出所述字母来回车键字母″A″。用户可以把系统切换到法语模式,按压同一按键并且用法语说出字母″A″来输入所述字母。
因此,虽然本发明的基本新颖设计被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略、置换和改变。因此,本发明只通过被附加于此的权利要求范围所指的来限制。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。例如,在不同实施例中描述的数据输入系统逐个部分可以与单词完整系统相结合来提供一个非常准确的系统。还例如,当用户逐部分地输入一个单词时,系统可以逐部分地识别并输入所述单词,并且在所述用户结束输入所述单词时,和在系统结束识别并输入所述单词时,为了所述被输入单词的再验证,系统可以通过所述语言约束方法和歧义消除方法中的一个或全部来进行所述单词的一个并行输入。
例如,尽管一个电话型键区在不同的实施例中被用来举例说明本发明的不同实施例,然而具有被分配给所述键区按键的任何类型的符号配置的任何类型键区都可以和本发明的实施例一起使用。
为了不频繁地重复本发明的数据输入系统的原理,在本申请的许多段落中都提到诸如字符/单词/单词一部分/功能键等等之类的一个或多个符号可以被分配给一个按键(例如,或除了按键之外的一个对象)。可以理解的是,除非另作说明,否则所述符号通常意在被分配给一个与所述按键的最简单预定义交互作用,它可以是对所述按键的单压动作(如在本发明的许多实施例中所解释)。此外,在许多段落中,在解释了把诸如字母/音素组/字符(字母)组/字母串等等(例如,通常是将被说出的符号)之类的符号分配给一个按键之后,为了避免重复本发明的数据输入系统输入所述符号的原理,所述原理可能没有被提及。可以理解的是,除非另作说明,否则所述类型的符号(例如,在现实生活中通常是将被说出的符号)显然(如在本发明的许多实施例中所解释的)通常意指通过对应按键的对应按压动作并优选地同时结合对应于所述符号的语音而被输入。
必须指出,在本申请的许多段落中,术语″字符组″或″字符组″被用来定义字符串。
尽管在本发明的不同实施例中提及一个语音识别系统并且意在用它来察觉并识别用户语音,然而一个唇读系统可以被替代地或另外地添加到所述语音识别系统以察觉并识别所述用户的语音(并且反之亦然)。
此外如之前所提及,本发明的一部分或全部方法,比如本发明的至少一个单词的至少一部分接着至少一个单词的至少一部分可以和语言学文本输入识别系统一起使用,比如可能匹配单词的音节数量、可能识别句子的单词数量、短语内的单词位置等等。这个问题已为本领域的技术人员所知。
可以理解的是,根据本发明的另一个实施例,逐字符和逐部分的数据可以在结合对应语音信息的同一按压并发声动作内被提供。
必须指出,在某些段落中,术语″逐部分″被用于简化术语″(一个或多个)单词的至少一部分接着(一个或多个)单词的至少一部分″。
请注意,尽管为了简化起见,在许多段落中,本发明的数据输入系统用诸如″本发明的数据输入系统″、″本发明的按压/扫过的数据输入系统″、″本发明的按压/扫过并说话的数据输入系统″等等之类的短语被提及,然而可以理解的是,如在许多段落中被详细描述的,这类短语指的是考虑了结合用户语音信息的按压/扫过动作的本发明的数据输入系统的原理,其中,所述语音信息是对应语音的存在或用户语音的不存在。这些问题已经被详细地描述。
必须指出,如上所述,尽管在许多实施例中,一个至少具有被分配了基本上一种语言的所有字母表字母的四个按键的键区作为示例被举例说明,然而可以理解的是,具有任意数量按键、任意按键配置以及被所述按键的任意符号配置的任何类型的键区都可以被考虑与本发明的数据输入系统一起使用。这些问题已经被详细地描述。
请注意,尽管在许多实施例中(例如,按压/扫过&语音信息的数据输入实施例),一个诸如触摸感应垫、触摸屏之类的感应表面已经被用作例子,然而可以理解的是,检测并分析用户与任何表面的交互作用的任何其它技术都可以被用来定义和/或使用软(例如,动态)键区的区域/按键。例如所提及,所述技术可以是光学检测技术或在一个(标准)表面上提供虚拟键区(例如,具有少数按键/区域,其中,例如,至少基本上一种语言的所有字母都被分配给所述键区的4个按键/区域)的红外线技术,并且可以检测触碰所述键区按键/区域的用户手指。
如之前所提及,在本发明人申请的几个专利申请中,本发明的数据输入系统的(例如所述)不同符号群可以被分配给由诸如用户的一个或多只手指或手指的一部分之类的用户身体部件提供的不同手势/运动(例如,换言之,诸如用户的一个或多只手指或手指的一部分之类的用户身体部件提供的不同手势/运动可以表示本发明的数据输入系统的(例如所述)的不同符号群)。用户手或脚的一个或多个指头的不同(预定义)部分(例如,指尖部分、指肚部分等等)按压/敲击手势/动作可以表示本发明的数据输入系统的不同按键上的按压动作。如所提及,诸如光学(例如,摄像头)、触碰/压力感应装置、热感应装置等等之类的许多一个或多个装置可以被用来识别所述手势/动作。用手指的指尖部分和指肚部分进行的敲击动作可以表示本发明的数据输入系统的按压两个不同的按键。通过使用用户的两只手指,按压本发明的数据输入系统的四个不同的按键可以被复制。每个辅助手指可以表示(例如,两个)更多的按键。所述按压/敲击动作可以是先前描述的任何按压/敲击动作,比如一次敲击、两次敲击、按压并保持动作等等。
根据本发明的一个实施例,本发明的数据输入系统的至少文本符号(例如,至少一种语言的至少字母表字符、单词一部分/单词等等)可以被分配给由用户手指提供的四个不同的按压手势/动作(例如,分别以用户两只手指的每个的指尖部分提供的按压/敲击动作,分别以用户两只手指的每个的指肚部分提供的按压/敲击动作)。此外如之前所提及,诸如触碰感应表面、光学装置、压力传感器等等之类的不同检测装置可以被提供来检测并识别由提供的预定义的用户敲击/按压动作。
根据本发明的一个实施例,感应(例如,手指)指帽可以被用来识别由用户提供的(例如,手指)手势。图106作为示例示出了在用户两只手指10605、10606上排列的两个感应指帽10607、10608。所述指帽可以被(例如,无线或有线地)连接到一个对应的电子设备。诸如压力传感器之类的感测装置可以被集成在所述每个指帽(例如,的表面)内,因此当用户用其中一个所述手指的指尖部分或指肚部分在对象/表面上提供一个按压动作时,系统在所述指帽上那个位置处识别出所述按压动作(例如,当用户用他的指尖按压时,置于所述指帽尖端的传感器被按压,而当用户用他的指肚部分按压时,置于所述指帽的指肚部分上的传感器被按压)。
通过考虑键区模式10600,例如,用左边手指头10605的指肚部分106071按压/敲击可以对应于由左上方按键10601表示的至少字母(例如,并且部分、单词、标点符号、命令、功能等等)。用右边手指10606的指肚部分106081按压/敲击可以对应于由右上方按键10602表示的至少字母(例如,并且部分、单词、标点符号、命令、功能等等)。用左边手指10605的指尖部分106072来按压/敲击可以对应于由左下方按键10603表示的至少字母(例如,以及部分、单词、标点符号、命令、功能等等)用右边手指10606的指尖部分106082来按压/敲击可以对应于由右上方按键10604表示的至少字母(例如,以及部分、单词、标点符号、命令、功能、等等)。(或者反之亦然)。如之前所提及,所述指帽系统可以被无线或有线10609连接到一个对应的设备(例如,移动电话、PDA、游戏设备、平板计算机、腕式设备、可佩带的计算机等等)。该连接装置可以例如是一个USB连接106010。
继续参考图106,例如,通过使用本发明的逐字符按压并说话的数据输入系统,例如为了输入单词″thank″,用户可以首先用他的右边手指10606的指肚部分106081在例如一个表面上按压(例如,提供单击)并且(例如,优选地,近似同时地)说出字母″t″。然后,他可以用他左边手指10605的指肚部分106071在例如一个表面上按压(例如,提供一个单击)并且(例如,优选地,近乎同时地)说出字母″h″。然后,用户可以用他的右边手指10606的指尖部分106082在例如一个表面上按压(例如,提供一个单击)(例如,优选地,近乎同时地)说出字母″a″。然后,他可以用他的左边手指10605的指肚部分106071在例如一个表面上按压并且(例如,优选地,近乎同时地)说出字母″n″。并且最后,用户可以用他的左边手指10605的指尖部分106072在例如一个表面上按压并且(例如,优选地,近乎同时地)说出字母″k″。
使用一个刚才所述由用户手指提供/与之结合的按键复制系统可能在许多情况中并且对于许多设备是有利的。例如,它允许在诸如腕式设备之类的非常小的设备中输入数据/文本。它还允许使用单手(乃至,例如如果系统与用户脚趾相结合,则不使用手)。系统还允许不看着按键(例如,什么按键,因此眼睛空闲。有利于在运动或黑暗中进行数据输入)。系统还允许在与前一按压动作(例如,可能被提供在同一对象或另一对象的另一表面位置上)或下一按压动作(例如,可能被提供在同一对象或另一对象的另一表面位置上)的位置无关的一个位置(例如,对象表面)上提供一个按压动作。
图106示出了和腕式设备10610一起使用的本发明的指帽系统10611。所述腕式设备可以是诸如腕式PDA、腕式电话、管理器等等之类的任何设备。为了用户便利,所述设备10610的显示单元10612上的打印轴10613是可调整的。在这个例子中,打印轴垂直于用户的手臂轴。图106b示出了具有显示单元10611的相同的腕式设备10610,其中,所述显示单元10611上的打印轴10614平行于用户的手臂轴。通过弯曲他的手臂,用户可以把腕式设备方便地放置得靠近他的眼睛,其中,所述设备的显示单元上的打印方向基本上平行于他的眼睛轴。
把手臂保持在一个基本上平行于从用户第一只眼向用户第二只眼延伸的线条轴的轴中可以允许用户把他手臂上略长的设备/显示屏靠近他的眼睛。图106c作为示例示出了一个具有诸如OLED塑性显示屏之类的可伸出(例如,绕性、可靠的等等)显示屏10631单元的腕式设备10630(例如,比如刚才所示的一个)。用户可以将其手臂保持在实质上与他的眼睛(线)轴平行的位置中,并且通过使用所述他的指帽系统10632(例如,以及语音)来输入数据。用户可以在诸如他的身体、或他的另一只手等等之类的任何对象上敲击。还例如,图106d示出了用户手臂所佩戴的一个略长的设备10640。
可以理解的是,一个(例如,传统)手表单元可以被连结到刚才所述腕式计算/通信设备,因此所述手表单元和所述腕式计算/通信设备的(例如,至少显示单元)实质上围绕佩带者手腕彼此相对。这个问题已经在本发明人申请的不同专利申请中被描述。
根据本发明的一个实施例,除了按压/敲击动作之外,用户还可以用指帽提供滑动动作以便至少复制本发明的敲击/滑动并说话的数据输入系统(例如,复制感应表面(例如,键区)上的滑动动作,或触控笔的滑动动作等等)和/或鼠标功能。例如图107中所示,用诸如手指10701之类的手指上佩戴的指帽10703的(例如,预定义部分或任何部分)在方向10702中的滑动动作可以复制对应设备屏幕上的指针(例如,光标)的移动程序。所述手指可以是一个被分配给至少一部分鼠标功能的预定义手指,因此用诸如佩戴指帽10705的手指10704之类的另一只预定义手指进行的滑移运动可以和诸如本发明的逐部分数据输入系统之类的另一程序一起使用。基于这个实施例的数据输入和操作的一个例子将迟些在本节中被给出。
根据另一个方法,在没有语音时用手指(指帽)在不同方向中的滑动动作可以提供电子设备屏幕上的对应指针运动。根据相同的方法,在存在语音的情况下用手指(指帽)(例如可以是相同的手指(指帽))进行的滑动动作可以对应于经由本发明的按压/滑动并说话的数据输入系统的单词一部分的输入。仍然根据另一个方法,用手指(指帽)的第一部分(例如,指尖部分)进行的滑动动作可以例如对应于鼠标指针运动功能,而用手指(指帽)(例如,可以是相同的手指(指帽))的第二部分(例如,指肚部分)进行的滑动动作例如可以对应于本发明的逐部分文本输入系统(例如,反之亦然)。根据另一个方法,用手指(指帽)的第一部分(例如,指尖部分)进行的滑动动作可以例如对应于指针运动功能,而用手指(指帽)(例如,可以是相同的手指)的第二部分(例如,指肚部分)进行的滑动动作可以对应于选择文本的一部分。根据另一个方法,用第一手指(指帽)(任何一部分)进行的滑动动作可以例如对应于指针运动功能,而用第二手指(指帽)(任何一部分)进行的滑动动作可以对应于选择文本的一部分。因此,用(指帽)第三手指(任何一部分)进行的滑动动作可以和本发明的数据/文本输入系统一起使用,依此类推。
如举例所说明的那样,基于许多参数(比如不同的指帽数量,使用不同的手指,使用所述指帽上不同的预定义部分,不同的敲击/按压动作(例如,一次敲击、两次敲击、敲击并保持等等),不同(例如,预定义)方向中的不同滑动动作(例如,在表面上,在空中等等))组合的数据/文本输入和操作,和鼠标功能的不同实施例可以被本领域的技术人员考虑到。所述组合可以基于上述原理来可以提供许多不同的实施例。所述结合可以提供的许多不同实施例描述非常冗长,因此,所述结合的少数优选例子被描述。
基于上述原理,例如图107a中所示,通过考虑键区模式10719,为了用两个部分″i-tem″输入单词″item″,用户可以首先用他的右边手指(指帽)10711的指肚部分提供单个敲击并且说出字母″i″。通过同一手指(指帽)或通过另一手指(指帽)10712,他然后可以提供一个具有对应于假想键区模式(例如,键盘模式10719)的按键上的滑动的轨迹10713的滑动动作并且说出″term″,该假想键区模式对应于所述部分的至少一部分字母。因此,如果用户用手指(指帽)提供一个滑动动作而不说话,则系统可以理解所述滑动动作可以对应于在对应方向中移动对应设备屏幕上的指针(例如,光标)。
用于识别手指(指帽)提供的滑动动作轨迹的不同方法可以被考虑。例如,替代于或除了压力传感器之外,所述指帽的表面可以包括一个预定义的构造,以便为不同的对应滑动方向提供不同的振动(波形)或声音(波形)。指帽系统还可以包括一个加速器或光学系统(例如,集成在指帽系统内或在诸如对应设备内之类的别处)以便识别滑动方向(例如,这系统已经在与用本发明的数据输入系统的触控笔使用有关部分中被本发明人详细描述)。
根据另一个方法,滑动运动可以通过同时使用至少两只手指(例如,指帽)来识别。用户可以用第一手指(指帽)来提供按压并保持的动作并且同时用至少一个第二手指(指帽)来提供一个滑动动作。在(一个表面上的)相对于(例如,在一个表面上)提供所述按压并保持动作的所述第二手指(指帽)的位置的所述滑动动作期间,由所述第二手指(指帽)提供的滑动轨迹可以基于在所述手指(指帽)时间上的动态位置之间的关系来识别。优选地,提供所述按压并保持动作的所述手指可以在所述滑动动作期间固定地保持。根据一个实施例,如果用户抬起提供滑动动作的手指,则光标停止移动。
所述至少第一和第二手指(指帽)中任意一个都可以是还用于输入诸如文本之类的数据的其中一只手指(指帽),或被用于鼠标功能的其中一只手指(指帽)。如图107b中所示,指帽系统可以包括在一个辅助用户手指10715上提供的至少一个辅助指帽10714。
继续参考图107b,例如,用户可以用第一指帽10714提供一个按压并保持动作,并且同时用第二手指(指帽)10712提供一个滑动动作。在用所述第二手指(指帽)10712进行的所述滑动动作期间,由所述第二指帽10712提供的滑动运动轨迹10713可以基于所述第二手指(指帽)10712在相对于提供所述按压并保持动作所述第一手指(指帽)的(例如,固定)位置的时间上的动态位置之间的关系来识别。还例如,如果在所述滑动动作期间没有提供语音,则根据一个实施例,系统可能理解所述滑动动作被用来复制一个鼠标功能(例如,因此移动光标)。另一方面,根据所述实施例或另一个预定义的实施例,如果系统在所述滑动动作期间检测到用户提供的一个语音,则系统可以理解用户试图输入单词一部分/单词。
可以理解的是,基于上述原理,诸如输入包括标点符号、校正、命令、功能、鼠标功能键、游戏功能键等等的文本之类的许多数据输入程序可以被分配给本发明的指帽系统或者经由它来提供。在没有语音或存在由用户提供的对应语音的情况下,单击动作、双击动作、滑动动作、以及它们的不同结合(例如,如较早在本发明人申请的不同专利申请中所述,复制与本发明的数据输入系统一起使用的硬或软按键或触碰感应键区的功能)可以分别地由一个指帽或者同时由几个指帽来提供来输入对应的符号。必须指出,在这上面提供的实施例、方法和示例被提供仅仅用于举例说明概念。基于上文或下文中所述原理的许多其它的实施例、方法和示例可以被本领域技术人员考虑到。例如,用户的一只或多只佩戴本发明的指帽系统的手或脚的任意数量的指头可以被使用。例如,图108a示出了分别佩戴一个指帽的用户手的四只手指。例如,通过考虑到用户可以用他的每只手指(指帽)来提供至少两个类型的按压动作(例如,用指尖部分或指肚部分来按压),这个指帽系统可以复制一个具有八个按键的键区(例如,图75的键区)。可以理解的是,所述键帽可以分布在用户两只手的手指内。例如,用户每只手都可以具有两个所述指帽以便提供由用户两只手的更快速的数据输入。图108b例如示出了分别佩戴一个指帽的用户的一只手的五只手指。例如,用户可以结合另一只手指使用小指10811来工作以便提供上述的滑动功能。
此外,必须指出,识别手指手势(例如,用指尖部分敲击,用指肚部分敲击等等)的其它方法也可以被考虑。例如,图109示出了由用户手指佩戴的较长的指帽10901、10902。根据一个方法,传感器可以被提供于所述每个指帽的不同位置中,因此当用户弯曲一只佩戴指帽(例如,以便用所述手指的指尖部分来提供敲击动作)的手指时,所述指帽内(例如,弯曲部分10903)提供的传感器可以被按压。当用户用所述弯曲手指的尾部10904提供一个敲击动作时,所述尾部内集成的传感器也被按压,因此,系统理解所述用户正在用弯曲手指提供一个按压动作(例如,复制用手指的指尖部分来提供一个按压动作)。另一方面,当用户不弯曲佩戴指帽(以便用所述手指尾部的指肚部分来提供一个敲击动作)的手指时,所述手指弯曲部分内提供的传感器可以不被按压。当用户用所述弯曲手指的尾部10904提供一个敲击动作时,所述尾部内集成的传感器可以被按压,因此,系统理解所述用户正在用弯曲手指提供一个按压动作(例如,复制用手指的指肚部分来提供一个按压动作)。
如之前所提及,对于检测并识别用户的手指手势/运动的许多其它的系统可以被考虑。例如,除了按压所述指帽内排列的传感器之外,一个距离传感系统也可以在所述手指轴的不同位置被集成在所述指帽内,因此当用户弯曲(使用手指的指尖部分)或伸直(使用手指的指肚部分)所述手指时,系统因此识别出所述传感器已经靠近或者彼此远离。当用户用弯曲或不弯曲的手指按压一个表面(例如,按压被按压的传感器)时,系统通过感测所述距离感测传感器之间的距离来识别所述按压动作的类型。
根据本发明的一个实施例,在相对于对应设备(例如,优选地,所述设备在所述滑动动作期间在固定位置中)内集成的(例如,(感测)装置)位置的(在一个表面上的)所述滑动动作期间,手指(指帽)的滑动动作的滑动轨迹可以基于所述手指头(指帽)(例如,内集成的(感测)装置)的时间上的动态位置之间的关系来测量。根据一个实施例,如果用户抬起提供滑动动作的手指,则光标停止移动。这个方法可以复制其它方法或与其它方法相结合以用于如较早所述目的。
根据本发明的一个实施例,所描述的手指手势/运动识别系统可以被集成在用户可佩戴的一个手套内。图110a示出了一个手套11001,其具有一个如同所述手指识别系统(例如,集成在指帽内的压力传感器,未示出)。系统可以被连接到一个对应的电子设备以用于数据输入。在这个例子中,一个诸如腕式通信/PDA/手表之类的腕式设备11002被连接到所述手套(所述手指识别系统)。用户可以在一个表面/对象上敲击/按压/滑动以便把数据输入到具有连结到所述设备中,所述设备已连结到其手腕。
用户可以把许多类型的设备连结到其手并且使用所述手套以用于把数据/文本输入到所述设备中。这个可以允许用户即使在与所述设备交互作用期间也无须用手握住该设备。这在诸如纵向市场(例如,当在一个领域中工作时)之类的许多情况中是有利的。图110b示出了一个被连结到具有本发明的手指手势/运动识别系统以便把数据输入到所述PDA中的用户手/手套11012的PDA11011。
不同的连结系统可以被考虑用于把一个设备连结并连接到本发明的一个对应的手套。例如,该手套可以具有一个外壳以在它之内容纳一个或多个类型的设备。该外壳可以被这样构造,因此当用户在所述外壳内容纳所述设备时,所述设备可以自动地连接到所述手套内集成的手指识别系统。图111a示出了一个具有容纳PDA的外壳的手套11101。该手套可以包括一个中空/透明的视窗11102,因此如图111b中所示,当用户在所述手套内插入PDA 11103时,所述PDA的显示屏部分可以被用户查看。所述手套内集成的手指识别系统可以包括一个诸如也(例如,优选地固定地)集成在所述手套内的USB连接之类的连接装置(未示出),因此当用户把所述PDA滑动到所述外壳中时,所述连接装置连接到所述PDA的一个连接装置。例如,通过把所述PDA推到所述手套中,手套的手指运动识别系统的USB连接器可以被插入到PDA的USB端口中。
根据本发明的另一个实施例,一个手套式电子设备可以被制造。对于所述设备内/经由所述设备的数据/文本,所述设备可以包括所述手指识别系统。它还可以包括一个集成的显示单元。所述显示屏可以是一个可伸出的(例如,可折叠的、可靠的等等)弹性显示屏。图112作为示例示出了在手套11200内集成的一个计算/通信设备。所述设备具有一个在所述手套(未示出)内集成的数据/文本输入系统。该手套还包括一个集成的显示单元11201。
根据本发明的一个实施例,一只手指(例如,指帽)可以和本发明的按压/滑动并说话的数据输入系统一起使用以便提供一个实质上完整的数据/文本输入系统和操作。一个或多个运动和/或压力检测装置可以被提供来检测用户的手指手势/运动。例如,除了包括检测用户手指在伸直位置(例如,用指肚部分按压)或弯曲位置(用笔尖部分按压)中的压力的压力传感器之外,诸如光学传感器之类的另一个运动识别系统可以与所述压力传感系统相结合来检测用户手指在不同方向中的运动。通过考虑一个预定义的键区模式(例如,假想键区),用户可以在对应于与所述假想键区的交互作用的不同预定义方向中移动其手指,从而允许复制一个动态(虚拟)键区的使用。图113作为示例示出了一个与所述手指手势/运动识别系统一起使用的用户手指11301。通过考虑11309的(假想)键区模式,例如为了输入单词″Hide″,用户例如可以把其手(掌)放在一个表面上,然后开始敲击所述表面,就像一个在所述表面那个位置的键区类似于已存在的键区模式一样。用户通过将其手指指肚部分保持在伸直位置并移动到左边,用户可以单击所述表面和说出字母″h″。然后,当将其手指保持在伸直位置中时,他可以将其手指向右移动并且(用其手指的指肚部分(指帽))敲击所述表面并且说出字母″I″。然后,用户可以弯曲其手指,将其手指保持在右边的位置并且敲击(例如,用指尖部分)敲击所述表面并且说出字母″d″。最后,当用户将其手指保持在弯曲位置中时,他可以将其手指向左移动并且(例如,用指尖部分)敲击所述表面并同时说出字母″e″。通过这样做,用户事实上复制了较早被详细描述的一个虚拟动态的使用。用户可以把其手放在任意表面或对象上并且开始根据一个被记住的虚拟键区模式来开始键入。可以理解的是,这个系统可能和超过一个的手指一起使用,并且还可以复制具有任意数量按键和任何类型符号分配的虚拟键区的任意其它形式的使用。
一个悬挂型计算/通信设备或数据/文本输入单元已经在本发明人先前申请的专利申请中被示出并描述。所述悬挂型设备可能包括一个诸如较早被示出并描述之类的可伸出(例如,可卷起的)显示单元。图114a示出了一个具有可伸出显示单元的可伸出计算/通信或数据输入单元。这类设备/单元之前已经在图70a到70d中被描述并显示。通过使所述设备的元件微型化,它可以作为悬架被携带。
通过使用所述设备内合并的按键和麦克风,用户可以用所述设备来输入诸如文本之类的数据,或者经由所述设备向另一个设备输入数据。用户可以使用可伸出显示屏以用于最小限度的所述交互作用。可以理解的是,所述设备可以是一个仅仅用于与另一个设备交互作用的数据/文本输入单元。在这种情况下,仅仅所述单元所必需的元件(例如,少数按键、麦克风、摄像头、可伸出显示屏、局域无线技术等等)可以被集成在所述单元内以便使之更小并且更轻。例如,图114b示出了在闭合位置中的所述设备/单元。
至少本发明的数据输入系统的元件可以被集成在一个镜片状设备内或者被可拆卸地连结到一个镜片状设备。图115a示出了一个镜片11500,诸如包括麦克风(和/或摄像头)单元11502的延伸臂11501之类的延伸元件被连结到镜片11500,因此所述单元将被置于靠近用户的嘴。本发明的一个键区11503可以被连结到从所述眼镜延伸的所述臂11501或者另一个臂。所述结合的设备可以是一个电子设备,或者可以是另一个可以有线或无线连接到所述另一个设备的电子设备的数据输入单元。所述结合设备还可以包括诸如可以置于用户(一只或两只)耳朵附近的扬声器11504、所述眼镜内集成的(例如,变焦距)显示单元11505、通信元件、计算元件等等之类的其它元件。这类设备的优点是显而易见的。用户可以使其手空闲用于任何任务,并且只有当他需要输入数据时,才优选地使用其中一只手通过使用具有本发明的数据输入系统的所述键区和所述麦克风把诸如文本之类的数据输入通过/到所述设备中。可以理解的是,所述延伸臂可以是弹性材料,具有多个部分,可收缩以便容纳在所述眼镜内,等等。
根据另一个实施例,替代于一个物理键区,本发明的虚拟键区11506(例如,具有四个按键)可以被显示在用户的(一只或两只)眼睛前面。一个眼睛跟踪系统(例如,位于用户眼睛前面的摄像头11506)可以被用来检测并识别用户眼睛的运动。在数据/文本输入期间,通过看着表示对应符号的按键并且通过提供对应语音,用户可以通过使用本发明的数据输入系统来输入诸如文本之类的数据(例如,看着不同的方向复制在对应的不同按键上的按压动作)。为了更好的准确性,优选地,诸如四个按键(例如,看着四个方向)之类的少数按键可以被用来表示本发明的数据输入系统的符号。使用具有本发明的数据输入系统的眼睛跟踪系统在之前已经被本发明人描述。这个数据输入单元可以允许完全地免提地携带并操作一个电子设备。可以理解的是,如果所述用户已知哪个方向表示无论哪符号,则所述虚拟键区可以不被显示给用户。
如之前所提及,诸如按键/运动交互作用之类的信息和对应的语音信息可以被发送到一个诸如计算服务器之类的远程计算设备。根据一个与使用有线电视联网中心的家庭娱乐设备有关的实施例,(例如,通过遥控器和麦克风提供的)所述信息可以被发送到所述中心以便处理。所述数据/文本输入的结果可以被发送回用户设备(例如,电视机屏幕、遥控器屏幕等等)。优选地,数据输入信息可以通过使用所述电缆连接和所述中央计算单元的任意家用电器来提供。例如,用户可以使用具有局域网连接装置的固定或移动电话的键区和麦克风向电视机顶盒发送键压和语音信息并从那儿通过有线网发送到一个远程的中央处理单元。所述输入的结果可以被发送回一个对应的用户设备。例如,在文本输入程序的情况下,输出可以被发送回用户设备的显示单元以便显示给用户以用于验证。还例如,如果用户(例如,通过同时使用麦克风的遥控器)输入一个对应于诸如提供将在其家庭电视机上被查看的电影名之类的命令的文本,则所述命令的结果(例如,电影)可以被发送给用户的电视机。
通过使用一个诸如具有远程中央计算单元的有线电视系统之类的联网系统,人们可以使用他们的任何家庭电子设备(例如,固定电话、智能显示屏等等),这些设备为了计算目的(例如,数据/文本输入)而具有按键(例如,具有按键复制能力)并且使用麦克风。例如,家庭固定电话可以被用于浏览互联网,(例如,通过互联网或通过有线电视网)撰写并发送电子邮件,(例如,通过互联网或通过有线电视网)撰写并发送本文消息,控制家用电器(例如,输入将在一个(家庭)电子设备上播放的歌曲名),提供银行功能,与自动电话目录交互作用等等。
触控笔计算机以及所述触控笔与本发明的数据输入系统的使用具有在本发明人申请的不同专利申请中被描述。还须指出,本发明的任何特征都可以被合并来提供一个期望的产品。例如,所述触控笔可以具有诸如运动检测装置和敲击探测装置之类的至少两个检测装置。如所提及,运动检测装置可以是诸如光学检测器(例如,在光学计算机鼠标中使用的那些)、提供不同方向中的不同声音/振动的构造指尖等等之类的装置。按下/敲击探测装置可以是诸如压力传感器、按钮型点击装置(例如,在点击笔提示中使用的那些)等等之类的装置。通过使用所述触控笔并且考虑一个键区模式,用户可以复制所述键区按键使用。例如,通过考虑图113的键区模式11309,用户可以具有他的触控笔提供一个向着表面右上方的滑动并且在那之后提供一个敲击动作,以便复制所述(假想)键区模式右上方按键上的按压动作。这些数据输入问题已经被详细地描述。
通过本发明的(例如,按压并说话)数据输入系统使用遥控器在诸如媒体中心PC或具有机顶盒的电视机之类的设备内输入诸如文本之类的数据已经被描述。必须指出,容纳在所述遥控器内的麦克风和/或摄像头可以较早在本发明人以前申请的专利申请中被详细描述的本发明的延伸/收缩麦克风。所述麦克风可以被可拆卸地连结到所述遥控器。
可以理解的是,与本发明的所有实施例一起使用的麦克风可以是一个无线麦克风或有线麦克风。
而且,必须指出,几只手指手势/运动识别系统可以配备有一个电子设备并且(例如,根据不同的环境、情况)被同时或分别地使用。用户可以不使用一个切换方法就从一个系统切换到另一个系统。
因此,虽然本发明的基本新颖设计被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略、置换和改变。因此,本发明只通过被附加于此的权利要求范围所指的来限制。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。例如,在不同实施例中描述的数据输入系统逐个部分可以与单词完整系统相结合来提供一个非常准确的系统。还例如,当用户逐部分地输入一个单词时,系统可以逐部分地识别并输入所述单词,并且在所述用户结束输入所述单词时,和在系统结束识别并输入所述单词时,为了所述被输入单词的再验证,系统可以通过所述语言约束方法和歧义消除方法中的一个或全部来进行所述单词的一个并行输入。
例如,尽管一个电话型键区在不同的实施例中被用来举例说明本发明的不同实施例,然而具有被分配给所述键区按键的任何类型的符号配置的任何类型键区都可以和本发明的实施例一起使用。
为了不频繁地重复本发明的数据输入系统的原理,在本申请的许多段落中都提到诸如字符/单词/单词一部分/功能键等等之类的一个或多个符号可以被分配给一个按键(例如,或除了按键之外的一个对象)。可以理解的是,除非另作说明,否则所述符号通常意在被分配给一个与所述按键的最简单预定义交互作用,它可以是对所述按键的单压动作(如在本发明的许多实施例中所解释)。此外,在许多段落中,在解释了把诸如字母/音素组/字符(字母)组/字母串等等(例如,通常是将被说出的符号)之类的符号分配给一个按键之后,为了避免重复本发明的数据输入系统输入所述符号的原理,所述原理可能没有被提及。可以理解的是,除非另作说明,否则所述类型的符号(例如,在现实生活中通常是将被说出的符号)显然(如在本发明的许多实施例中所解释的)通常意指通过对应按键的对应按压动作并优选地同时结合对应于所述符号的语音而被输入。
必须指出,在本申请的许多段落中,术语″字符组″或″字符组″被用来定义字符串。
尽管在本发明的不同实施例中提及一个语音识别系统并且意在用它来察觉并识别用户语音,然而一个唇读系统可以被替代地或另外地添加到所述语音识别系统以察觉并识别所述用户的语音(并且反之亦然)。
此外如之前所提及,本发明的一部分或全部方法,比如本发明的至少一个单词的至少一部分接着至少一个单词的至少一部分可以和语言学文本输入识别系统一起使用,比如可能匹配单词的音节数量、可能识别句子的单词数量、短语内的单词位置等等。这个问题已为本领域的技术人员所知。
可以理解的是,根据本发明的另一个实施例,逐字符和逐部分数据输入可以在结合对应语音信息的同一按压并发声动作内被提供。
必须指出,在某些段落中,术语″逐部分″被用于简化术语″(一个或多个)单词的至少一部分接着(一个或多个)单词的至少一部分″。
请注意,尽管为了简化起见,在许多段落中,本发明的数据输入系统用诸如″本发明的数据输入系统″、″本发明的按压/扫过的数据输入系统″、″本发明的按压/扫过并说话的数据输入系统″等等之类的短语被提及,然而可以理解的是,如在许多段落中被详细描述的,这类短语指的是考虑了结合用户语音信息的按压/扫过动作的本发明的数据输入系统的原理,其中,所述语音信息是对应语音的存在或用户语音的不存在。这些问题已经被详细地描述。
必须指出,如上所述,尽管在许多实施例中,一个至少具有被分配了基本上一种语言的所有字母表字母的四个按键的键区作为示例被举例说明,然而可以理解的是,具有任意数量按键、任意按键配置以及被所述按键的任意符号配置的任何类型的键区都可以被考虑与本发明的数据输入系统一起使用。这些问题已经被详细地描述。
请注意,尽管在许多实施例中(例如,按压/扫过&语音信息的数据输入实施例),一个诸如触摸感应垫、触摸屏之类的感应表面已经被用作例子,然而可以理解的是,检测并分析用户与任何表面的交互作用的任何其它技术都可以被用来定义和/或使用软(例如,动态)键区的区域/按键。例如所提及,所述技术可以是光学检测技术或在一个(标准)表面上提供虚拟键区(例如,具有少数按键/区域,其中,例如,至少基本上一种语言的所有字母都被分配给所述键区的4个按键/区域)的红外线技术,并且可以检测触碰所述键区按键/区域的用户手指。
一个具有可伸出显示单元的腕式设备先前已被描述并且它的一个示例已在图106c中被示出。
根据本发明的一个实施例,替代地或除了本发明的按键指帽系统之外,一个具有少数按键的键区可以被容纳或连结到一个腕式设备并且和本发明的数据输入系统一起使用。所述键区可以被如此制造以便从所述设备伸出并且缩回到所述设备。图116a作为示例示出了一个具有包括少数按键的键区单元11601的腕式设备11600。所述手腕设备可以容纳一个可伸出(例如,绕性、可靠的)显示单元(例如,未示出)。所述设备可以包括诸如电话通信之类的通信能力。扬声器单元11603和麦克风单元11604(例如,反之亦然)可以被容纳到所述设备(例如,扬声器单元可以位于所述设备主体上并且麦克风单元可以位于所述设备的键区部分上,或反之亦然,等等)。如图116b中所示,所述键区单元11601可以从手腕设备11600(的主体)伸出。所述显示单元11602可以被这样制造以便从所述手腕设备(的主体)伸出。所述键区和所述显示屏可以被这样制造以便当用户从伸出所述设备向远处伸出所述键区时,所述显示单元还从所述设备伸出(例如,以便提供一个大显示屏)。在这个例子中,沿用户手臂轴方向伸出的所述键区和显示屏。这类伸出方向的一个优点是显示单元11602可以通过被放在用户手/臂上而被保护(可以理解的是,所述键区和/或显示屏可以以诸如相反方向之类的任意方向被伸出)。如同所述,例如通过使用所述键区11601和例如使用所述麦克风(例如,或一个外部麦克风)与本发明的按压并说话的数据输入系统,用户可以输入诸如文本之类的数据。扬声器单元和麦克风单元可以被容纳到所述设备,因此当所述键区和/或显示屏在伸展位置中时,所述麦克风和所述扬声器彼此相隔很远以便例如对应于用户耳朵和嘴之间的距离。例如,用户可以把所述伸出设备握在手中并且对着他的面部放置,因此扬声器接近他的耳朵并且麦克风接近他的嘴。
可以理解的是,如图116c中所示,所述键区11601和/或显示屏11602的伸出方向可以是诸如一个相对于用户手臂轴垂直的方向之类的另一个方向。
因为许多人不希望用其它手腕设备来代替他们的传统手表,所以优选地一个除了手表之外腕式设备应该被这样设计,以便以保持传统手表外观的方式连结到一个手表或被集成到其中。例如,根据本发明的一个实施例,所述设备可以被连结到或者被集成在传统手表单元的腕带内,因此所述手表在佩带者手腕的一边(例如,外边)并且所述腕式设备在所述佩带者手腕的另一边(例如,里边)。
根据另一个例子,如图117a中所示,一个电子设备可以与手表结合,因此当所述设备没有在使用中时它具有传统手表单元11700的外貌。根据一个例子,如图117b中所示,至少所述设备的键区11701可以位于所述手表单元的下面。所述手表可以被回转运动以便让所述键区11701面向用户。然后如图117c中所示,用户可以如前所述地伸出所述键区11701和显示单元11702。
必须指出,此处所述腕式设备可以是数据输入系统或另一个/其它(一个或多个)电子设备的用户接口。
如之前所提及,用户手指的一个、两个或多个部分或运动可以被用来表示本发明的(例如,按压/滑动并说话)数据输入系统的至少一部分符号群。如所提及,用手指指尖部分在表面上(或在空中)的(例如,一次、两次等等)敲击/按压动作可以表示第一符号群,而用手指的指肚部分在表面上(或在空中)的(例如,一次,两次,等等)敲击/按压动作可以表示第二符号群。用手指一部分进行的所述敲击/按压动作可以是诸如一次或两次按压动作之类的各种各样预定义类型的敲击/按压动作,其中,每种类型都表示被分配给所述手指部分的对应符号群的至少一部分符号,复制与一个对应按键的交互作用。这些问题已经被详细地描述。
根据本发明的一个实施例,与本发明的数据输入系统一起使用的所述一个、两个或多只手指部分/运动可以当所述手指倾向左、右等等时用手指提供一个敲击/按压动作,其中,所述每个动作都可以表示本发明的数据输入系统的不同符号群。例如,图118a到118d示出了用户手指的不同部分在表面上提供的按压动作。
图118a从两个观点(例如,背面11801和正面11802)示出了一个数据输入系统,由同一手指(例如,指帽)11800的指尖部分11803在一个表面上提供的可仿效的按压动作。此外还示出,当用手指(例如,指帽)的指尖部分提供所述按压动作时手指的碰撞部分11804。图118b从两个观点(例如,背面11811和正面11812)示出了由同一手指11800的指肚部分11813提供的一个可仿效按压动作。在这个附图中此外示出了当用手指指肚部分提供所述按压动作时的手指碰撞部分11814。图118c从两个观点(例如,背面11821和正面11822)示出了当所述手指倾向于右边时由同一手指提供的一个可仿效按压动作11823。在这个附图中示出了当用所述手指在所述倾斜位置中提供所述按压动作时的手指碰撞部分11824。附图118d从两个观点(例如,背面11831和正面11832)示出了当所述手指倾向于左边时由同一手指11800提供的一个可仿效按压动作11833。在这个附图中示出了当用所述手指在所述倾斜位置中提供所述按压动作时的手指碰撞部分11834。
请注意,所述用户手指(例如,指帽)11800上的所述每个碰撞部分11804、11814、11824、11834的位置(例如,和形状)彼此不相同。在这个例子中,每只手指都可以被用来表示本发明的(例如,按压/滑动并说话)数据输入系统的四个按键。可以理解的是,用手指一部分提供的所述敲击/按压动作可以是各种各样的预定义类型的敲击/按压动作(例如,单击、双击、敲击并保持、短敲击、长敲击等等),其中,每个都表示本发明的数据输入系统的至少一部分符号(被分配给所述部分的对应符号群),每个都复制(与之交互作用)系统的一个对应按键。通过提供相对于对象(例如,主体构件、点击设备、手套等等)运动来复制按键交互作用已经被详细描述。
例如,附图119示出了佩戴本发明的两个指帽11907、11908的用户手的两只手指11905、11906,以用于复制与预定义(例如,假想)键区模式11900的按键的交互作用。用所述每个指帽的几个预定义(例如,估计)部分中的每一个来提供一个诸如按压/敲击动作之类的交互作用可以表示提供一个与预定义键区模式11900的交互作用。在这个例子中,诸如上述部分之类的用户手指(指帽)的四个不同部分中的每一个都可以表示所述键区的一个不同的按键。在这个例子中,手指11905可以对应于(左边)按键群11901,而手指11906可以对应于(右边)按键群11902。例如,为了输入诸如文本之类的数据,用户可以把其手(掌)放在一个表面上,然后用所述两只手指11905、11906来键入,就好像他正在一个(假想)键区上键入一样(例如,就好像它在那个位置存在一样)。
继续参考附图119,例如,为了输入字母群″GHNQUVY″的一个字母,用户可以用其手指的指肚部分11907(例如,其手指在伸直位置中)在所述表面上提供一个单击动作和说出对应的字母。为了输入其中一个字符″()″,用户用其手指11907的指肚部分(例如,其手指在伸直位置中)在所述表面上提供一个双击动作并且提供一个对应于所述字符的预定义语音(例如,open、close)。
还例如,为了输入字母群″ELKRWZ″的一个字母,用户可以用其手指11907的指尖部分(例如,在弯曲位置中)在所述表面上提供一个单击动作并且说出对应的字母。
还例如,为了输入字母群″BIJMOST″的一个字母,用户可以用其手指的指肚部分11908(例如,在伸直位置中)在所述表面上提供一个单击动作并且说出对应的字母。
还例如,为了输入字母群″ACDFPX″的一个字母,用户可以用其手指的指尖部分11908(例如,在弯曲位置中)在所述表面上提供一个单击动作并且说出对应的字母。
还例如,为了输入一个空格符,用户可以用其手指11908右倾来提供一个单压动作而不提供一个语音(例如,或者提供一个被分配给″Sp″(例如,″Space″)符号的预定义语音)。为了输入″Ent″(例如,″回车″)命令,用户可以用他的右倾手指11908提供一个双压动作而不提供一个语音(例如,或者提供一个被分配给″Ent″(例如,″回车″)命令的预定义语音)。为了输入″Caps″(例如,″Caps Lock″)命令,用户可以用他的左倾手指11908提供一个单压动作而不提供一个语音(例如,或者提供一个被分配给″Caps″命令的预定义语音)。
基于相同的原理,为了输入″Tab″命令,用户可以用他的右倾手指11907提供一个单压动作而不提供一个语音(例如,或者提供一个被分配给″Tab″符号的预定义语音)。为了输入一个″Bk″(例如,″BackSpace″)命令,用户可以用他的左倾手指11907提供一个单压动作而不提供一个语音(例如,或者提供一个被分配给″Bk″命令的预定义语音)。
应当理解,如之前所提及,诸如本发明的指帽、本发明的手套、触碰感应表面、诸如光学装置之类的运动检测装置等等之类的任何检测装置可以被用来检测并识别手指的一部分和/或由用户提供的按压/敲击/滑动的键入(例如,一次,两次,等等)动作。
一个包括/集成了一个使用本发明的数据输入系统和特征的计算/电信设备的手套已经在之前被描述。根据本发明的一个实施例,所述设备可以具有电话通信能力。一个麦克风和一个扬声器可以被容纳到所述手套/设备中,因此用户可以把其手(例如,手套)对着他的面部放置以便在使用所述手套状设备来会话的期间说话并收听。所述麦克风和所述扬声器可以被置于所述手套上,因此在所述会话期间,所述麦克风和所述扬声器分别可以接近用户的嘴并用户的耳朵。附图120a作为示例示出了一个佩戴所述手套状计算/通信设备12000的用户的手。麦克风12001和扬声器12002可以被容纳在所述手套的手指内,因此在会话期间,佩戴所述手套的用户可以将其包括所述扬声器和所述麦克风的手指分别靠近他的耳朵和嘴以用于一个方便的会话程序。所述手套(或手套状设备)12000还可以包括之前所述本发明的手指(部分/运动)检测系统(例如,手套手指12003、12004内集成的压力传感器),以便经由所述手套设备由使用本发明的按压/滑动和说话的数据输入系统来进行数据输入。用于分离数据输入(例如,拨打电话号码)的分隔数据输入系统(例如,不需要语音)还可以配备有所述(手套)设备。例如,手套的手指12003的(例如,结束)一部分可以包括一个被如此构造的表面12005,以便通过由所述手指分别在不同方向中提供的滑动动作来提供不同的振动/声音(波形)。用于同一目的的这个技术和其它技术已经在本发明人申请的不同(例如,触控笔)专利申请中被详细描述。可以理解的是,其它检测方法可以被用于相同的目的。例如,一个加速器或光学装置可以被安装在所述手套(的指尖)内以便检测并分析用户为了相同目的而在表面上或空中的(写入)运动。用户可以例如通过在表面上滑动/写入数字将其手指用于拨号(例如,如果系统包括一个如前所述加速器装置,则或者在空中)。附图120b示出了用户用本发明的具有(例如,手)写入识别技术的手套状设备的手指12012输入的拨号号码12010的数字(例如,5)的滑动轨迹12011。如先前所示,所述设备可以包括一个用于打印拨号号码、菜单、文字等等的显示单元12013。通过使用这类手套状的电子设备,用户可以容易地佩戴并携带或携带并佩戴所述设备。所述设备可以是一个计算/通信设备,其具有一个容易并快速的诸如文本之类的数据输入系统(例如,本发明的按压/滑动并说出的数据输入系统),一个分离自然的拨号系统(例如,通过用手指在表面上或在空中写入),一个方便自然的会话方法(例如,通过把用户的手或手指放在耳朵和鼠标附近),一个可以在所述数据输入或拨号程序期间被用户查看的方便的(例如,可伸出的)显示单元,等等。
必须指出,电子设备可以是一个诸如移动电话之类的传统设备,其可以被容纳在至少包括所述用户接口的手套状外壳内。当用户用手套容纳所述设备(例如,电话)时,所述(例如,用户接口)系统然后可以(例如,自动地)变得与所述(电话)设备连接。
本发明的一个(按压并说话)的数据输入系统已经在之前被描述,其中,用户眼睛在(优选地少数)预定义方向中运动来复制按键上的按压/敲击动作。
根据一个方法,在用户看着一个对应于预定义的(例如,假想)键区模式的按键的预定义方向之后,用户可以眨眼来复制所述按键上的单压动作。用户眼睛的两次眨眼动作可以复制所述按键上的一个双压动作。
根据本发明的一个实施例,用户的两只眼睛可以和本发明的数据输入系统一起使用。使用用户的两只眼睛可以具有几个优点。根据一个之前所述方法,每只眼睛可以方便地复制诸如至少四个按键之类的几个按键,因此,通过使用两只眼睛,一个例如具有两倍按键数量(例如,八个按键)的键区模式可以方便地被复制。根据另一个方法,为了更方便,每只眼睛都可以只复制本发明的数据输入系统的两个按键(例如,通过看着诸如上下或左右之类的两个预定义方向)。因此,用户的两只眼睛可以非常方便地复制一个具有四个按键的键区。
附图121作为示例示出了一个诸如之前所示之类的本发明的键区模式12109(例如,具有四个按键)。例如,为了输入单词″thank″,用户可以仰视12108、眨他的右眼12106并且说出字母″t″。然后,他可以(例如,仍然通过向上看12108)眨他的左眼12105并且说出字母″h″。然后用户可以往下看12107,眨他的右眼12106并且说出字母″a″。然后,用户可以向上看12108,眨他的左眼12105并且说出字母″n″。最后,用户然后可以往下看12107,眨他的左眼12105并且说出字母″k″。正如举例说明的,这个方法需要较少的用户运动,此外只需要在较少的方向中。用户眼睛的单眨、双眨、眨眼并保持等等可以复制相应的键压类型。
可以理解的是,根据一个方法,只有在预定义方向的观看程序(例如,不眨眼)和语音可能足以输入一个符号。如果诸如一个单词的两个连续字母之类的两个连续符号通过同一方向表示,则用户可以通过看着对应方向并说出所述字母来首先输入开头字母,在另一个方向中提供一个(例如,快速的)眼睛运动,回看初始方向然后输入第二字母。
如前所述,一个点击设备(例如,鼠标)可以被用来复制(例如,固定或动态)按键和键区的键压并且和本发明的(例如,按压/滑动并说话)数据输入系统一起使用(例如,用户可以使用鼠标指向一个(动态或固定)按键上的光标,单击/双击它并且提供一个对应的语音)。所述点击设备可以是任意类型(例如,使用任何技术),并且被有线或无线地连接到对应的设备等等。例如图122中所示,所述点击设备可以是一个具有诸如激光指向装置之类的指向装置的无线远程点击设备12207,因此用户可以用所述设备指向屏幕上的(假想,或打印的)虚拟键区模式并且点击预定义按键12206来复制与本发明的数据输入系统的键区的交互作用。例如,通过使用这个例子的预定义(例如,假想)键区模式12209,为了输入单词″fine″,用户可以首先把所述点击设备的点击装置指向到表面12200(例如,PC的屏幕)上的位置12214,点击所述指向设备的(例如,预定义)按键12206,并且说出字母″P″。然后,他可以在所述表面(例如,相对于按键12204上方的按键12202)上指向相对于前一被指向位置12214的上方位置12212,点击所述指向设备的一个(例如,预定义)按键12206,并且说出字母″i″。然后,用户可以在所述表面上指向相对于前一位置12212(例如,相对于在按键12202左边的按键12201)的左边位置12211,点击所述指向设备的一个(例如,预定义)按键12206,并且说出字母″n″。最后,用户可以在所述表面上指向一个在前一被指向位置12211(例如,相对于在按键12201下方的按键12203)下面的位置12213,点击所述指向设备的一个(例如,预定义)按键12206,并且说出字母″e″。
可以理解的是,根据一个方法,只有指向程序和语音就足以输入一个符号并且不需要按压一个按键。如果诸如一个单词的两个连续字母之类的两个连续符号由同一按键表示,则用户可以首先输入开头字母,从所述方向中提供一个(例如,快速)指向运动,指回实质上相同的方向然后输入第二字母。
根据另一个实施例,替代于一个按键,用户可以使用所述点击设备的两个按键12205、12206(例如,通过使用诸如两个大拇指之类的两只手指以用于更快的数据输入)以用于一个点击动作。在这种情况下,例如,点击设备12207的按键12205可以对应于左边按键12201,而键区模式12209的12203以及点击设备12207的按键12206可以对应于键区模式12209的右方按键12102、12104。例如,为了输入单词″fine″,用户可以向下指向,按压按键12206并且说出字母″P″。然后,他可以向上指向,按压按键12206,并且说出字母″i″。然后,他(例如,不移动指向,或者通过一个快速的来回移动)可以按压按键12205并且说出字母″n″。最后,用户可以向下指向,按压按键12205并且说出字母″e″。这个方法可以降低数据输入期间的指向运动的数量(例如,在这个例子中只有上下指向)。
尽管它不是优选的,然而根据本发明的一个实施例,两个符号群中的每一个都可以由键区两个按键的不同按键来表示,其中,每个符号群包括一种语言的一部分字母,并且两个群一起实质上包括所述语言的所有字母。对一个按键的单压动作可以表示由所述按键表示的第一字母子群,而对所述按键的双压动作可以表示由所述按键表示的第二字母子群,诸如此类。字母的所述每个子群都可以包括实质上具有彼此相关的可区别的语音的字母。这个问题已经被本发明人在以前描述。使用至少表示至少一种语言的字母的(例如,与诸如他的两个大拇指之类的两个用户手指一起使用的)两个按键可能比使用四个按键更容易,但是数据(例如,文本)准确性可以很大地被降低。
与一个耳式麦克风连结或结合的键区和/或显示单元先前已经被描述。可以理解的是,所述键区和/或显示屏可以与任意类型的麦克风相连结或结合,比如头戴式耳机麦克风。例如,图123示出了一个用户所用的头戴式耳机麦克风12301。本发明的键区12302和/或(例如,可伸出的)显示屏12304可以与所述头戴式耳机麦克风相连结或结合。所述键区和/或显示系统可以通过一个诸如线或(例如,绕性)棒12303之类的装置从所述头戴式耳机麦克风伸出并且缩回到所述头戴式耳机麦克风。
必须指出,尽管在本发明的许多实施例中只提及了用一个麦克风来检测用户语音,然而诸如(如前所述)摄像头之类的其它(例如,语音)检测装置也可以被用来(例如,靠近所述摄像头或靠近用户嘴唇)检测用户提供的用户嘴唇、脸或其它的运动。例如,按压/滑动并说话的数据输入期间的用户嘴唇运动可以被过摄像头检测到,然后通过唇读系统来分析。这些问题已经被详细地描述。可以理解的是,本发明的麦克风、摄像头、键区、显示屏、扬声器等等可以与对应设备结合或者是与对应电子设备一起使用的外部单元。它们还可以从对应设备伸出/缩回到对应设备。
必须指出,所提及或者与本发明的数据输入系统一起使用的所有显示单元都可以是可伸出的/可缩回的。它们可以是绕性的、可卷曲的、可折叠的、等等。
必须指出,尽管在许多实施例中对于更容易的数据输入而已经提及少数按键、少数交互作用、少数运动等等来表示本发明的数据输入系统的符号,然而可以理解的是,任意数量的按键、交互作用、运动等等可以和本发明的数据输入系统一起使用。
此外,尽管在许多实施例中提及只用敲击动作来进行交互作用目的,然而可以理解的是,诸如滑动动作之类的本发明的其它交互作用方法也可以替代于根据本发明的数据输入系统的按压/敲击动作或与之结合地来使用。
必须指出,不同类型的交互作用可被电子设备用于提供本发明的数据输入系统。用户可以根据不同的环境使用一个期望的交互作用例如,并且说话)而不使用切换装置。例如,他可以使用腕式设备的键区来输入数据或者他可以使用本发明的指帽以用于同一目的。
必须指出,尽管在某些实施例中,诸如指帽之类的装置被用于检测用户手指交互作用(例如,用指尖按压等等)的类型,然而用于同一检测目的的任何其它装置也可以被使用。可以理解的是,尽管在许多例子中已经提及指帽并将其示出来描述用户的手指交互作用,然而这类说明的目的是举例说明一个与用户手指(的一部分)的交互作用(例如,或者反之亦然,手指被用来举例说明一个指帽)。
如之前所提及,根据本发明的数据输入系统的原理,诸如至少一种语言的字母之类的符号可以(例如,优选地)通过一个或多个对象上提供的交互作用来表示。所述交互作用可以通过诸如用户身体部件(比如用户的手自身)提供的少数按键、运动之类的对象或在那上面被提供,或者由所述用户的身体部件(例如,用户可以使用本发明的手套)或用户手指、点击设备(例如,鼠标)等等、一次或两次敲击动作、滑动动作、以及许多其它动作来操作。因此,必须指出,交互作用(例如,复制与本发明的键区模式交互作用的按键)的任何预定义类型和数量(优选地,有限数量)可以被使用,因此它们中的每一个都表示/选择本发明的数据输入系统的一个符号群并且与用户的对应预定义语音信息相结合来输入所述群中的一个符号。因为所述交互作用类型可能非常庞大,所以只描述了它们中优选的一部分,比如按键交互作用、手指交互作用、身体部件交互作用、鼠标交互作用等等。可以理解的是,其它类型的交互作用也可以被本领域技术人员考虑到并且与本发明的数据输入系统一起使用。例如,其它的手指运动检测装置可以被集成在本发明的手套内。例如,光学/光传感器可以被集成到手套的不同位置(例如,手指、手掌等等)中和/或手套之外,以便(例如,基于彼此相关的所述光学/光传感器的运动)检测用户手指的运动。
必须指出,在本发明人申请的这个及其它专利申请中示出并描述的实施例和示例只是被用来描述所述技术的基本问题,可以理解的是,基于数据输入系统的原理和所述特征,其它的实施例、方法、特征等等显然也可以被本领域技术人员考虑到。
因此,虽然本发明的基本新颖设计被示出和描述并且被指出被应用于其替换实施例,但是可以理解的是,本领域技术人员可以在不脱离本发明精神的前提下对本公开发明的细节和形式做出各种各样的省略、置换和改变。因此,本发明只通过被附加于此的权利要求范围所指的来限制。可以理解的是,附图不一定是按比例描绘的,而是本质上仅仅是概念性的。例如,在不同实施例中描述的数据输入系统逐个部分可以与单词完整系统相结合来提供一个非常准确的系统。还例如,当用户逐部分地输入一个单词时,系统可以逐部分地识别并输入所述单词,并且在所述用户结束输入所述单词时,和在系统结束识别并输入所述单词时,为了所述被输入单词的再验证,系统可以通过所述语言约束方法和歧义消除方法中的一个或全部来进行所述单词的一个并行输入。
例如,尽管一个电话型键区在不同的实施例中被用来举例说明本发明的不同实施例,然而具有被分配给所述键区按键的任何类型的符号配置的任何类型键区都可以和本发明的实施例一起使用。
为了不频繁地重复本发明的数据输入系统的原理,在本申请的许多段落中都提到诸如字符/单词/单词一部分/功能键等等之类的一个或多个符号可以被分配给一个按键(例如,或除了按键之外的一个对象)。可以理解的是,除非另作说明,否则所述符号通常意在被分配给一个与所述按键的最简单预定义交互作用,它可以是对所述按键的单压动作(如在本发明的许多实施例中所解释)。此外,在许多段落中,在解释了把诸如字母/音素组/字符(字母)组/字母串等等(例如,通常是将被说出的符号)之类的符号分配给一个按键之后,为了避免重复本发明的数据输入系统输入所述符号的原理,所述原理可能没有被提及。可以理解的是,除非另作说明,否则所述类型的符号(例如,在现实生活中通常是将被说出的符号)显然(如在本发明的许多实施例中所解释的)通常意指通过对应按键的对应按压动作并优选地同时结合对应于所述符号的语音而被输入。
必须指出,在本申请的许多段落中,术语″字符组″或″字符组″被用来定义字符串。
尽管在本发明的不同实施例中提及一个语音识别系统并且意在用它来察觉并识别用户语音,然而一个唇读系统可以被替代地或另外地添加到所述语音识别系统以察觉并识别所述用户的语音(并且反之亦然)。
此外如之前所提及,本发明的一部分或全部方法,比如本发明的至少一个单词的至少一部分接着至少一个单词的至少一部分可以和语言学文本输入识别系统一起使用,比如可能匹配单词的音节数量、可能识别句子的单词数量、短语内的单词位置等等。这个问题已为本领域的技术人员所知。
可以理解的是,根据本发明的另一个实施例,逐字符和逐部分的数据可以在结合对应语音信息的同一按压并发声动作内被提供。
必须指出,在某些段落中,术语″逐部分″被用于简化术语″(一个或多个)单词的至少一部分接着(一个或多个)单词的至少一部分″。
请注意,尽管为了简化起见,在许多段落中,本发明的数据输入系统用诸如″本发明的数据输入系统″、″本发明的按压/扫过的数据输入系统″、″本发明的按压/扫过并说话的数据输入系统″等等之类的短语被提及,然而可以理解的是,如在许多段落中被详细描述的,这类短语指的是考虑了结合用户语音信息的按压/扫过动作的本发明的数据输入系统的原理,其中,所述语音信息是对应语音的存在或用户语音的不存在。这些问题已经被详细地描述。
必须指出,如上所述,尽管在许多实施例中,一个至少具有被分配了基本上一种语言的所有字母表字母的四个按键的键区作为示例被举例说明,然而可以理解的是,具有任意数量按键、任意按键配置以及被所述按键的任意符号配置的任何类型的键区都可以被考虑与本发明的数据输入系统一起使用。这些问题已经被详细地描述。
请注意,尽管在许多实施例中(例如,按压/扫过&语音信息的数据输入实施例),一个诸如触摸感应垫、触摸屏之类的感应表面已经被用作例子,然而可以理解的是,检测并分析用户与任何表面的交互作用的任何其它技术都可以被用来定义和/或使用软(例如,动态)键区的区域/按键。例如所提及,所述技术可以是光学检测技术或在一个(标准)表面上提供虚拟键区(例如,具有少数按键/区域,其中,例如,至少基本上一种语言的所有字母都被分配给所述键区的4个按键/区域)的红外线技术,并且可以检测触碰所述键区按键/区域的用户手指。
如前所述,根据本发明的一个实施例,为了增强本发明的被结合的逐字符和逐部分数据输入系统的准确性,通过使用本发明的逐字符数据输入系统来输入字符/字母可以被分配给诸如对应于所述字符/字母的(例如,一种键区的)按键/区域上的单压动作之类的第一类交互作用,而提供一个对应于所述字符/字母的预定义语音,并且通过使用本发明的逐部分数据输入系统来输入一个单词一部分/单词可以被分配给诸如对应于至少所述单词一部分/单词的(例如,所述键区的)至少一个按键/区域上的至少一个双压动作或一个滑动动作中的至少一个之类的第二类交互作用,并且提供一个对应于所述单词一部分/单词的预定义语音(或反之亦然)。先前提及,所述系统还可以使用诸如两次敲击动作之类的其它类型的交互作用来输入数据输入系统的至少一部分符号,包括标点符号字符、命令等等。这些问题已经被详细描述。根据本发明的一个实施例,仍然为了进一步增强系统,所述至少一个区域/按键上的滑动动作的方向可以被系统考虑来更好地区别一个具有彼此相关的歧义类似语音的单词的一部分。例如,通过考虑图122的键区12209,为了输入单词一部分″wil″,用户可以在对应于表示所述部分开头字母的按键12203的(感应)表面上的按键/区域上提供一个滑动动作并且说话一个对应于所述部分的预定义语音。系统部分可能很难区别″wil″的语音与同一按键表示的单词一部分″wel″的语音。根据这个实施例,例如,在所述按键上从左至右的第一预定义滑动动作并与用户对应语音相结合可以对应于部分″wil″,而在所述按键上从右到左(或反之亦然)的第二预定义滑动动作并结合用户对应语音可以对应于部分″wel″。可以理解的是,至少一个按键/区域上的诸如向上、向下等等方向之类的其它滑动方向可以被考虑用于区别单词一部分/单词,单词一部分/单词由同一滑动动作表示并且具有彼此相关的歧义相似语音。
如前所述,必须指出,本发明人申请的不同专利申请中的所述不同的方法、特征、系统可以被结合在一起或者彼此代替,或者与其它数据输入系统相结合。例如,由所述按键等等提供的不同的按键数量、不同的按键类型、不同的交互作用可以被由所述手指等等提供的不同的用户手指数量、不同的用户手指类型、不同的交互作用代替或与之相结合。此外,所述交互作用可以通过眼睛等等位于表面上或在空中。这些问题已经被详细描述。还例如,本发明的按压/滑动并说话的数据输入系统可能与诸如T9之类的单词猜测系统相结合。
例如,通过使用本发明的逐部分数据输入系统(例如,通过提供滑动交互作用并且提供对应语音),用户可以输入具有可区别的单词一部分/单词的文本的一部分。
-他可以只经由按键(例如,T9)(例如,通过按压对应按键而不说话)来输入具有可区别的单词的所述文本的另一部分,并且其中,所述单词被包括在系统所用的一个词典数据库内。
-通过使用本发明的逐字符按压并说话的数据输入系统(例如,通过按压对应按键并且提供对应语音),他可以输入具有诸如URLs或字典外单词之类的任意文本的所述文本的另一部分。
还例如,本发明的数据输入系统所用的另一类型的交互作用可以是键区的至少一个按键上提供的滑动并保持动作,其中,数据输入系统的至少一部分符号可以被分配给所述滑动并保持的交互作用。例如,基于本发明的滑动/按压并说话的数据输入系统,在不存在语音或存在一个对应于所述交互作用的语音的情况下,提供这类交互作用可以输入一个对应的符号。
还例如一个诸如单词猜测系统(例如,基于诸如电话键区之类的缩小键盘上的对应键压来猜测一个单词。例如T9)之类的文本输入系统或一个手写识别系统可以使用本发明的按压并说话的标点/命令输入系统。例如,用户可以通过使用单词猜测系统来输入一个文本的字母和单词,并且可以通过使用本发明的按压并说话标点/命令输入系统来输入在所述文本内使用的标点符号字符和命令。
如之前所提及,本发明的数据输入系统的任何类型的符号都可以被分配给结合/不结合对应语音的对应按键上的滑动动作。所述符号可以比如是标点符号字符、数字字符、命令等等。在不存在/存在对应语音的情况下,通过把诸如单词的至少一部分、字母、标点符号字符、数字字符、命令等等之类的符号分配给与预定义数量的按键/手指的不同预定义类型的交互作用,一个用于移动环境的极大简洁、准确、快速和容易的数据输入系统可以被提供。
例如,根据本发明的一个实施例,实质上,至少一种语言的所有字母可以被分配给一个键区的四个按键,因此为了输入一个字母,用户可以单击表示所述字母的按键并且提供一个对应于所述字母的语音信息。相同的四个按键中的每一个还可以表示与系统一起使用的单词一部分/单词的字典的单词一部分/单词的预定义字母(例如,优选地,开头字母),因此为了输入单词一部分/单词,用户可以在表示所述单词一部分/单词的按键上滑动并且提供一个对应于所述单词一部分/单词的语音信息。诸如数字字符和至少一部分标点符号字符之类的其它符号可以被分配给与所述四个按键的滑动动作或者被分配给比如其它两个按键之类的其它按键数量,因此为了输入其中一个所述符号,用户可以在表示所述符号的按键上滑动并且提供一个对应于所述符号的语音信息。空格符可以被分配给其中一个所述其它按键并且在没有语音时通过所述按键上的敲击动作而被输入。此外,退格符号可以被分配给其中一个所述其它按键并且在没有语音时通过所述按键上的敲击动作而被输入。在没有语音时,返回符号可以被分配给其中一个所述其它按键上的双压动作。可以理解的是,这只是一个示例。其它的实施例也可以被考虑。
不同的(例如,单词之间的)自动空格系统已经在先前被描述。如前所述,根据本发明的一个实施例,单词的至少一部分/单词可以通过至少一个对应按键(例如,与对应语音相结合)上的滑动动作而被输入。根据本发明的一个实施例,如果所述滑动动作从所述键区边界外结束(例如,如果所述数据输入系统只需要表示所述单词的至少一部分/单词的一个按键上的滑动动作,则或者从表示所述单词的至少一部分/单词的按键边界外结束),则系统可以被通知一个单词结束信号。根据一个方法,系统在所述单词的至少一部分/单词之后插入一个空格符。如果所述滑动动作不在所述键区边界外结束(例如,如果所述数据输入系统只需要在表示所述单词的至少一部分/单词上的按键上的滑动,则或者从所述按键结束),则系统在所述单词的至少一部分/单词结束处不提供所述空格符。(或者反之亦然)。如果一个单词包括超过一个的部分,则所述单词除最后部分之外的所有部分可以通过对应键区(或按键)边界内的对应滑动动作而被输入,并且通过提供一个对应于所述部分的滑动动作只可以输入最后部分,其中,所述滑动动作在对应键区(例如,或者按键)边界外结束。伸出所述键区(或者所述按键)边界的滑动动作也可以被系统认为是一个单词结束信号。
继续参考上述实施例,例如,通过考虑图124的键区12400,为了用两个部分″wel-com″输入单词″welcome″,用户可以首先在所述按键边界内提供按键12403上的滑动动作12405并且说出一个对应于所述部分″wil″的预定义语音。然后,用户可以在按键12404上提供一个滑动动作12406并且从所述键区(或按键)边界中结束所述滑动动作并且说出一个对应于所述部分″come″的预定义语音。系统识别出关于输入所述单词的信息(例如,滑动动作及其对应语音)已经结束。系统明白,具有两个部分的单词已经被输入,并且在识别并产生所述单词之后,系统在单词″welcome″之后提供一个空格符。
必须指出,如较早所述,诸如特殊字符(比如,″空格″字符、标点符号字符和命令(例如,″回车″命令))之类的其它单词结束信号也可以被系统认为是一个单词结束信号。
在这种情况下,用户可以在所述键区(例如,所述按键的)边界内提供一个单词的所有部分并且在结束时提供所述单词结束信号。例如,为了输入单词″welcome!″(例如,包括感叹号),用户可以在所述键区(或其对应的(一个或多个)按键)边界内提供对应于所述单词的两部分″wel″和″come″的两个滑动动作12405、12407,并且然后提供所述感叹号字符。系统知道,用户已经结束了对应于所述两个部分的信息输入(例如,由于所提供的感叹号)并且在感叹号之前的所述单词之后不应该提供空格。因此,系统产生字符组(例如,包括所述感叹号的单词″welcome!″)。
因此,如果系统不允许在同一单词内混合单词一部分的数据输入和字符数据输入,则在一个部分输入开始时或者在该部分输入结束时的单个字符输入也可以被认为是所述部分的单词开始信号或单词结束信号。
根据另一个方法,通过在其对应按键/区域上提供一个短滑动动作并且提供一个对应于所述单词的至少一部分的语音信息,单词的至少一部分可以被预定义地输入,并且其中,同一按键上较长的滑动动作并且提供同一语音可以输入包括一个空格符的相同的单词的至少一部分。所述空格符可以在所述单词的至少一部分内的预定义位置被提供,比如在所述单词的至少一部分的开头或结尾处。
必须指出,在这个专利申请中提及的术语″逐部分数据输入系统″已经被用来描述经由所述数据输入系统的单词的至少一部分的输入。此外,在这个专利申请中提及的术语″逐字符数据输入系统″已经被用来描述经由所述数据输入系统的字符输入。优选地,本发明的逐部分数据输入系统通常可以与本发明的″逐字符″数据输入系统相结合。
而且必须指出,本申请中所用的不同术语已经被用于相同的目的。例如,术语″单词一部分/单词″和″单词的至少一部分″已经被用于相同的含义。
如之前所提及,当本发明的字符级数据输入系统(例如,敲击并且说话)和本发明的单词的至少一部分级数据输入系统(例如,滑动并且说话)被结合在一起时,对于不降低本发明的字符(例如,字母)级数据输入系统的准确性,本发明的字符级数据输入系统和单词的至少一部分级数据输入系统可以分别使用不同类型的与按键的交互作用。与本发明的所述单词的至少一部分的数据输入系统一起使用的单词的至少一部分的数据库还可以包括与所述字符级数据输入系统一起使用的相同字母。
还须指出,本发明的数据输入系统的符号(比如字母、单词的一部分/单词、诸如标点符号字符之类的特殊字符、命令等等)可以被划分成不同的群,其中,所述群中的至少一个可以分别被分配给与诸如(对应键区的)按键之类的至少一个对象的不同类型的交互作用。例如,单词的一部分/单词可以被划分成多个群,其中,第一数量的所述群可以分配给第一类与(一个键区的)按键的交互作用,而第二数量的所述群可以被分配给第二类与所述按键或(所述键区的)另一按键的交互作用。
此外,还须指出,这个专利申请中描述的示例、方法和实施例已经只被用来举例说明本发明的数据输入系统的原道。基于本发明的数据输入系统原理的其它示例、方法和实施例也可以被考虑。例如,尽管在与本发明的单词的至少一部分(说话)数据输入系统有关的许多实施例中,字母被提及以便被分配给一个按键上的单压并且该部分已经被提及以便被分配给一个按键上的滑动或双压动作,然而可以理解的是,所述分配可以被反向,因此字母例如可以被分配给按键上的滑动或双压动作并且部分可以被分配给按键上的单击。
虽然本发明的某些特征已经在此被说明并描述,但是本领域技术人员会思考出许多更改、置换、变化或等效物。因此,可以理解的是,本申请的意图是覆盖属于本发明真实精神的所有这类更改和变化。

Claims (1)

1.一个电子设备,包括:
用于输入字符的第一装置,耦合到所述设备用于生成第一字符输入数据;
用于输入字符的第二装置,耦合到所述设备用于生成第二字符输入数据,其中,用于输入字符的所述第二装置包括用于监控用户声音的系统;
显示器,用于在其上显示所述字符;以及
处理器,耦合到用于输入字符的所述第一和第二装置,被配置为接收所述第一和第二字符输入数据,以便显示在所述显示器上的所述字符对应于所述第一和第二字符输入数据。
CN200580025250XA 2004-06-04 2005-06-03 在移动和固定环境中增强数据输入的设备及方法 Expired - Fee Related CN101002455B (zh)

Applications Claiming Priority (23)

Application Number Priority Date Filing Date Title
US57744404P 2004-06-04 2004-06-04
US60/577,444 2004-06-04
US58033904P 2004-06-16 2004-06-16
US60/580,339 2004-06-16
US58856404P 2004-07-16 2004-07-16
US60/588,564 2004-07-16
US59007104P 2004-07-20 2004-07-20
US60/590,071 2004-07-20
US60922104P 2004-09-09 2004-09-09
US60/609,221 2004-09-09
US61893704P 2004-10-14 2004-10-14
US60/618,937 2004-10-14
US62830404P 2004-11-15 2004-11-15
US60/628,304 2004-11-15
US63243404P 2004-11-30 2004-11-30
US60/632,434 2004-11-30
US64907205P 2005-02-01 2005-02-01
US60/649,072 2005-02-01
US66214005P 2005-03-15 2005-03-15
US60/662,140 2005-03-15
US60/669,867 2005-04-08
US60/673,525 2005-04-21
PCT/US2005/019582 WO2005122401A2 (en) 2004-06-04 2005-06-03 Systems to enhance data entry in mobile and fixed environment

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2011101748961A Division CN102393793A (zh) 2004-06-04 2005-06-03 在移动和固定环境中增强数据输入的系统

Publications (2)

Publication Number Publication Date
CN101002455A true CN101002455A (zh) 2007-07-18
CN101002455B CN101002455B (zh) 2011-12-28

Family

ID=38693420

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2011101748961A Pending CN102393793A (zh) 2004-06-04 2005-06-03 在移动和固定环境中增强数据输入的系统
CN200580025250XA Expired - Fee Related CN101002455B (zh) 2004-06-04 2005-06-03 在移动和固定环境中增强数据输入的设备及方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2011101748961A Pending CN102393793A (zh) 2004-06-04 2005-06-03 在移动和固定环境中增强数据输入的系统

Country Status (1)

Country Link
CN (2) CN102393793A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102449560A (zh) * 2009-04-26 2012-05-09 耐克国际有限公司 运动手表
CN103258534A (zh) * 2012-02-21 2013-08-21 联发科技股份有限公司 语音命令识别方法和电子装置
CN108700953A (zh) * 2016-03-15 2018-10-23 雅马哈株式会社 输入辅助装置、智能电话以及输入辅助方法
CN109564468A (zh) * 2016-08-05 2019-04-02 索尼公司 信息处理设备、信息处理方法以及程序
CN109643547A (zh) * 2016-08-31 2019-04-16 索尼公司 信息处理装置、处理信息的方法和程序
CN110308800A (zh) * 2019-06-24 2019-10-08 北京百度网讯科技有限公司 输入方式的切换方法、装置、系统及存储介质
CN110618775A (zh) * 2018-06-19 2019-12-27 宏碁股份有限公司 用于互动控制的电子装置
CN110932959A (zh) * 2019-10-24 2020-03-27 视联动力信息技术股份有限公司 视联网中邮件传输的方法、装置、存储介质及设备
CN111078666A (zh) * 2019-12-11 2020-04-28 中国建设银行股份有限公司 基于跨中心多数据库的自动化卸数供数的方法
CN111460809A (zh) * 2020-03-30 2020-07-28 中国测绘科学研究院 阿拉伯语地名专名音译方法、装置、翻译设备和存储介质
CN111527470A (zh) * 2017-12-14 2020-08-11 法国比克公司 主动式触控笔
CN112309385A (zh) * 2019-08-30 2021-02-02 北京字节跳动网络技术有限公司 一种语音识别方法、装置、电子设备及介质
CN112334975A (zh) * 2018-06-29 2021-02-05 索尼公司 信息处理设备、信息处理方法和程序
CN117202106A (zh) * 2023-10-19 2023-12-08 北京融信数联科技有限公司 基于信令数据的区域空间场所属性标注方法、系统和介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103870201A (zh) * 2012-12-18 2014-06-18 联想(北京)有限公司 一种虚拟键盘显示方法和设备
CN103941846B (zh) * 2013-01-18 2017-11-24 联想(北京)有限公司 电子设备以及输入方法
DE102014224676B4 (de) * 2014-12-02 2022-03-03 Aevi International Gmbh Benutzerschnittstelle und Verfahren zur geschützten Eingabe von Zeichen
CN105677629A (zh) * 2015-12-30 2016-06-15 联想(北京)有限公司 一种信息处理方法及电子设备
CN105930085A (zh) 2016-04-29 2016-09-07 联想(北京)有限公司 一种输入方法及电子设备
CN108427508B (zh) * 2017-02-15 2024-01-19 北京搜狗科技发展有限公司 输入方法和装置、建立局域网词库的方法和装置
CN110825907B (zh) * 2018-08-13 2022-06-21 视联动力信息技术股份有限公司 一种基于分布式数据库的处理方法和系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0840287A3 (en) * 1996-10-31 1999-04-07 Microsoft Corporation Method and system for selecting recognized words when correcting recognized speech
FI990676A (fi) * 1999-03-26 2000-09-27 Nokia Mobile Phones Ltd Syöttöjärjestely tiedon käsisyöttöä varten ja matkapuhelin
CN1217255C (zh) * 1999-12-28 2005-08-31 索尼株式会社 带显示功能的电子设备
US20030044000A1 (en) * 2001-08-29 2003-03-06 Kfoury Tony N. Electronic device with rotatable keypad and display
CN1338671A (zh) * 2001-09-26 2002-03-06 倚天资讯股份有限公司 集手写辨识输入与虚拟键盘式输入为一体的输入装置
FI116425B (fi) * 2002-01-18 2005-11-15 Nokia Corp Menetelmä ja laite laajan näppäimistön integroimiseksi pieneen laitteeseen

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102449560A (zh) * 2009-04-26 2012-05-09 耐克国际有限公司 运动手表
CN103258534A (zh) * 2012-02-21 2013-08-21 联发科技股份有限公司 语音命令识别方法和电子装置
US9691381B2 (en) 2012-02-21 2017-06-27 Mediatek Inc. Voice command recognition method and related electronic device and computer-readable medium
CN103258534B (zh) * 2012-02-21 2017-07-07 联发科技股份有限公司 语音命令识别方法和电子装置
CN108700953B (zh) * 2016-03-15 2024-02-06 雅马哈株式会社 输入辅助装置、智能电话以及输入辅助方法
CN108700953A (zh) * 2016-03-15 2018-10-23 雅马哈株式会社 输入辅助装置、智能电话以及输入辅助方法
CN109564468A (zh) * 2016-08-05 2019-04-02 索尼公司 信息处理设备、信息处理方法以及程序
CN109643547A (zh) * 2016-08-31 2019-04-16 索尼公司 信息处理装置、处理信息的方法和程序
CN111527470A (zh) * 2017-12-14 2020-08-11 法国比克公司 主动式触控笔
CN110618775A (zh) * 2018-06-19 2019-12-27 宏碁股份有限公司 用于互动控制的电子装置
CN110618775B (zh) * 2018-06-19 2022-10-14 宏碁股份有限公司 用于互动控制的电子装置
CN112334975A (zh) * 2018-06-29 2021-02-05 索尼公司 信息处理设备、信息处理方法和程序
CN110308800A (zh) * 2019-06-24 2019-10-08 北京百度网讯科技有限公司 输入方式的切换方法、装置、系统及存储介质
CN110308800B (zh) * 2019-06-24 2023-11-10 北京百度网讯科技有限公司 输入方式的切换方法、装置、系统及存储介质
CN112309385A (zh) * 2019-08-30 2021-02-02 北京字节跳动网络技术有限公司 一种语音识别方法、装置、电子设备及介质
CN110932959B (zh) * 2019-10-24 2022-06-21 视联动力信息技术股份有限公司 视联网中邮件传输的方法、装置、存储介质及设备
CN110932959A (zh) * 2019-10-24 2020-03-27 视联动力信息技术股份有限公司 视联网中邮件传输的方法、装置、存储介质及设备
CN111078666A (zh) * 2019-12-11 2020-04-28 中国建设银行股份有限公司 基于跨中心多数据库的自动化卸数供数的方法
CN111460809A (zh) * 2020-03-30 2020-07-28 中国测绘科学研究院 阿拉伯语地名专名音译方法、装置、翻译设备和存储介质
CN117202106A (zh) * 2023-10-19 2023-12-08 北京融信数联科技有限公司 基于信令数据的区域空间场所属性标注方法、系统和介质
CN117202106B (zh) * 2023-10-19 2024-05-14 北京融信数联科技有限公司 基于信令数据的区域空间场所属性标注方法、系统和介质

Also Published As

Publication number Publication date
CN102393793A (zh) 2012-03-28
CN101002455B (zh) 2011-12-28

Similar Documents

Publication Publication Date Title
CN101002455B (zh) 在移动和固定环境中增强数据输入的设备及方法
AU2005253600B2 (en) Systems to enhance data entry in mobile and fixed environment
US20160005150A1 (en) Systems to enhance data entry in mobile and fixed environment
US20070188472A1 (en) Systems to enhance data entry in mobile and fixed environment
US7020270B1 (en) Integrated keypad system
US6741235B1 (en) Rapid entry of data and information on a reduced size input area
US20150261429A1 (en) Systems to enhance data entry in mobile and fixed environment
NZ564249A (en) Data entry system
CN102378950A (zh) 具有学习能力的虚拟小键盘产生器
JP2008507780A (ja) ハンドヘルド・コンピュータ装置のためのキーボード
US11503144B2 (en) Systems to enhance data entry in mobile and fixed environment
CN102200832A (zh) 在移动和固定的环境中用于增强数据输入的系统
US20220360657A1 (en) Systems to enhance data entry in mobile and fixed environment
ZA200508462B (en) Systems to enhance daya entry in mobile and fixed environment
AU2012201656A1 (en) Data entry system
NZ552439A (en) System to enhance data entry using letters associated with finger movement directions, regardless of point of contact
AU2012203372A1 (en) System to enhance data entry in mobile and fixed environment
CN101627615A (zh) 为按钮提供更大效用的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1103198

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1103198

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: KEYLESS SYSTEMS LTD.

Free format text: FORMER OWNER: GHASSABIAN BENJAMIN FIROOZ

Effective date: 20120815

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20120815

Address after: Israel Jerusalem

Patentee after: Keyless Systems Ltd.

Address before: American New York

Patentee before: Ghassabian Benjamin Firooz

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111228

Termination date: 20160603