CN103258446A

CN103258446A - 用于帮助视障用户的同音字的示例性描述

Info

Publication number: CN103258446A
Application number: CN2013100468604A
Authority: CN
Inventors: K·米斯拉; B·D·拉梅尔斯
Original assignee: Apple Computer Inc
Current assignee: Apple Inc
Priority date: 2012-02-15
Filing date: 2013-02-06
Publication date: 2013-08-21
Also published as: JP2013168158A; US20130209974A1; KR20130094248A

Abstract

本申请涉及用于帮助视障用户的同音字的示例性描述。具体而言，所公开的实现提供通过可听地呈现同音字的示例性描述而对于视障用户提供计算机可访问性的系统、方法和计算机程序产品。可通过使用包含字的常用多字词描述常用字。可通过使用将字分成各个组分的表意文字描述序列（IDS）描述罕见字。各组分然后作为同音字的描述被单独地大声读出。

Description

用于帮助视障用户的同音字的示例性描述

技术领域

本发明一般涉及电子装置的可访问性方案。

背景技术

汉语和日语在对于视障用户设计可访问性方案上具有特有的挑战，原因是，与英语不同，不能“拼写”汉语字符以区分同音字。同音字是发音与另一字符或字符组相同的字符或字符组。例如，在英语中，单词“rain”和“reign”是同音的，并且仅通过拼出单词就可被区分。在汉语中，词语由作为同音字的几个汉字构成。相互区分这些词语的仅有的方式是观看字符，这不是视障用户的选项。

发明内容

所公开的实现提供通过可听地呈现同音字的示例性描述而对于视障用户提供计算机可访问性的系统、方法和计算机程序产品。

在一些实现中，可通过使用包含字符的常用的多字符词语，描述给定的字符。例如，汉字雨（rain）具有发音yǔ，但是其它的汉字，比如语（language）、羽（feature）和宇（universe）共用相同的发音。为了唯一地描述雨（rain），所公开的系统和方法构建“示例性描述”，诸如“下雨的雨”，它在翻译成英语时会如“falling rain”那样说“yǔ”。该方法可以很好地描述作为长的词语的一部分出现的常用汉字（例如，存在约3000～4000个这样的汉字）。

在一些实现中，也可描述罕用字。例如，挧是许多以汉语或日语为母语的人很少遇到的汉字，原因是它不被用于当代的汉语或日语中。为了描述罕见的汉字或日本字，可以使用表意文字描述序列（IDS）以将字符分成其组分。例如，汉字挧可被分成两个字符扌和羽，每个可作为字符挧的描述被单独地大声读出。

可以实现在本说明书中描述的主题的特定的实施例，以实现以下优点。，向不能以其它语言（例如，英语）的用户享受的相同的可访问性水平来使用常规的计算机的说汉语或日语的用户提供可访问性。

在以下附图和描述中阐述一个或更多个所公开的实现的细节。从描述、附图和权利要求来看，其它的特征、方面和优点变得十分明显。

附图说明

图1示出用于可听地呈现同音字的示例性描述的可访问性系统。

图2是用于可听地呈现同音字的示例性描述的示例性软件架构的框图。

图3是用于可听地呈现同音字的示例性描述的示例性过程。

图4是实现参照图1～3描述的特征和过程的示例性装置架构的框图。

在各附图中，类似的附图标记表示类似的要素。

具体实施方式

概要

在一些实现中，可由说母语的人对于各字符手动产生用于区分汉语和日语中的同音字的示例性描述的数据库。在其它的实现中，包含频率信息的语言字典可被用于定位给定字符的最常用多字符词，并且可通过使用该词构建该字符的示例性描述。如果手动或通过使用语言字典不能找到示例性描述，那么可以使用IDS以通过将字符分成其组分（例如，其它字符），每个组分可作为字符的描述被大声读出。示例性描述数据库可被手动修整，以去除错误或者在可用时分配更合适的示例性描述。

在一些实现中，当用户将字符键入电子装置（例如，键入计算机或智能电话）中时，可以使用示例性描述。例如，用户可能希望通过使用计算机、智能电话或电子写字板的虚拟键盘键入具有发音‘yǔ’

的特定的汉字雨（rain）。通过使用汉语拼音（语音学）键盘，用户可输入单词“yu”，从而导致显示“yu”的同音字的候选列表。当用户循环通过候选列表中的候选同音字（均具有发音“yu”）时，用户将听到各同音字的示例性描述。示例性描述允许用户区分候选同音字并选择希望的候选。

示例性汉字键入方案

图1示出用于可听地呈现同音字的示例性描述的可访问性系统100。在一些实现中，系统100可包括与扬声器102a、102b耦合的数据处理装置101。数据处理装置101可以是计算机、电子写字板、智能电话、电视系统、游戏控制台和能够将文本转换成语音的任何其它装置。在一些实现中，除了扬声器102a、102b以外或者作为其替代，数据处理装置101可包含耳机扬声器。数据处理装置101可包含用于显示由用户通过键盘105键入的字符的输出装置103（例如，LED显示器）或者与其耦合。

在本示例性汉字键入方案中，用户希望键入“我叫陳翔”（“Myname is Chen Xiang”），罗马字母拼写为“Wo jiao Chen Xiang”。用户键入“Wo jiao”，从而导致在输出装置103上显示候选字符“我叫”。候选字符产生通过扬声器102a、102b被读出的示例性描述“我們的我，叫做的叫,”(‘wo’as in‘us’and‘jiao’as in‘to be called’)。在听到示例性描述之后，用户可通过按压键盘105上的键（例如，回车键）或者通过执行一些其它的确认动作确认希望的候选同音字。

在另一例子中，用户键入“chenxiang”，从而导致在输出装置103上显示候选字符[沉香,沉,陳…]。在该方案中，希望的候选字符不在候选列表中。但是，第一个字符处于候选列表中的第三位置。由于“沉香”是第一候选，因此，通过扬声器102a、102b读出其示例性描述“沉默的沉，香港的香”(chen as in‘silent’and‘xiang’as in‘HongKong’)。听到它后，用户移动（例如，通过按压键盘105上的tab键或箭头键）到下一候选“沉”，从而导致通过扬声器102a、102b读出其示例性描述“沉默的沉”(chen as in‘silent’）。再一次，用户确定它不是她想要的候选同音字并且移动到候选列表中的下一候选，即“陳”。然后，通过扬声器102a、102b读出其示例性描述“陳列的陳”(chen as in‘to exhibit’)。

基于示例性描述，用户知道它是她正寻找的候选同音字，并且通过按压键盘105上的键（例如，回车键）或者通过执行一些其它的确认动作确定它。此时，可向用户显示“xiang”的候选同音字，并且，用户可前进通过候选列表，从而听到各候选同音字的示例性描述，直到用户到达她确认为希望的候选同音字的“翔”。

示例性日语键入方案

在示例性日语键入方案中，用户希望键入“教会”(“church,”罗马字母拼写为“kyoukai”)。用户键入“kyoukai”并且“協会”是第一候选，并且，通过扬声器102a、102b读出示例性描述“協力の協、会社の会”(‘kyou’as in‘association’and‘kai’as in‘company’)。由于它不是用户想要的候选，因此，她移动到列表中的下一候选（例如，通过按压tab/箭头键）。

下一候选是“境界”，通过扬声器102a、102b读出其描述“境地の境、世界の界”(‘kyou’as in‘territory’and‘kai’as in‘world’)。再一次，它也不是用户想要的候选，因此，她移动到列表中的下一候选。下一候选是“教会”，通过扬声器102a、102b读出其示例性描述“教えるの教、会社の会”(‘kyou’as in‘to teach’and‘kai’as in‘company’)。由于它是用户想要的候选，因此，她通过按压键盘105上的键或者通过执行一些其它的确认动作，确认该候选。

图2是用于可听地呈现同音字的示例性描述的示例性软件架构200的框图。在一些实现中，架构200可包括同音字识别模块201、IDS模块202、文本到语音204、示例性描述数据库205、示例性描述产生器206和频率数据207。

在操作中，一个或更多个字符被提供以输入处理模块201。例如，字符可以是拼音或者罗马字符。模块201可确定对于一个或更多个字符（例如，常见汉字）示例性描述是否是可用的。在一些实现中，确定可包括将一个或更多个字符与示例性描述数据库205相比较以确定对于一个或更多个字符是否示例性描述是可用的。如果示例性描述是可用的，那么示例性描述可被提供给文本到语音模块204，该文本到语音模块204可将文本转换成可以可听地在扬声器或耳机上呈现的语音输出。文本到语音引擎可使用任何已知的文本到语音技术，包括但不限于用于链接合成、共振峰合成、音节合成、基于HMM的合成的技术。

如果对于一个或更多个字符（例如，罕见汉字）示例性描述是不可用的，那么输入处理模块201向IDS模块202提供输入。IDS模块202将字符分成其组分，这些组分被送回输入处理模块201。输入处理模块201然后将各组分的描述发送到文本到语音模块204以将其转换成语音输出。以常用的Unicode标准版本描述IDS数据和算法。

在一些实现中，可由说母语的人手动构建用于各同音字的示例性描述并将其存储在示例性描述数据库205中。在其它的实现中，频率数据库207可被用于构建示例性描述。例如，语言字典可提供用于确定汉语或日语中的最常用的多字符词的频率数据。一旦最常用的多字符词被识别，就可通过使用识别的词构建示例性描述。如果通过使用该方法没有找到示例性描述，那么可以使用IDS以确定同音字的描述。示例性描述数据库205可被定期地修整（例如，手动修整），以处理错误或在可用时分配更合适的示例性描述。

图3是用于可听地呈现同音字的示例性描述的示例性过程300的流程图。可通过软件架构200实现过程300。

在一些实现中，过程300可从接收一个或更多个字符（302）开始。可由用户用例如键盘键入一个或更多个字符。字符可以是汉字或者日本字。过程300可通过确定字符的示例性描述是否可用（304）继续。例如，一个或更多个字符可与示例性描述的数据库相比较，以确定字符的示例性描述是否是可用的。如果示例性描述是可用的，那么示例性描述可被可听地呈现（306）。例如，示例性描述可从文本被转换成语音输出，并且通过扬声器或耳机被可听地呈现。如果示例性描述是不可用的，那么用于字符的IDS可被用于将字符分成组分（308），并且组分然后作为字符的描述被可听地呈现（310）。例如，IDS可将字符分成多个字符，每一个字符可从文本被转换成语音输出，并且作为同音字字符的描述通过扬声器或耳机被可听地呈现。

示例性装置架构

图4是示出实现参照图1～3描述的特征和操作的示例性装置架构的框图。包括具有更多或更少的部件的架构的其它的架构是可能的。在一些实现中，架构400包括一个或更多个处理器402（例如，双核处理器）、一个或更多个输出装置404（例如，LCD）、一个或更多个网络接口406、一个或更多个输入装置408（例如，鼠标、键盘、触摸敏感显示器）和一个或更多个计算机可读介质412（例如，RAM、ROM、SDRAM、硬盘、光盘、快擦写存储器等）。这些部件可在一个或更多个通信信道410（例如，总线）上交换通信和数据，这些通信信道410可利用用于有利于部件之间的数据和控制信号的传送的各种硬件和软件。

术语“计算机可读介质”指的是参与向处理器402提供供执行的指令的介质，包括但不限于非易失性介质（例如，光盘或磁盘）、易失性介质（例如，存储器）和传送介质。传送介质包括但不限于共轴电缆、铜导线或光纤。

计算机可读介质412还可包括操作系统414（例如，

操作系统）、网络通信模块416、可访问性应用418和示例性描述数据库420。操作系统414可以是多用户的、多处理的、多任务的、多线程的、实时的，等等。操作系统414执行基本任务，包括但不限于：识别来自装置406、408的输入和向它们提供输出；保持跟踪和管理计算机可读介质412（例如，存储器或存储装置）上的文件和目录；控制外设装置；和管理一个或更多个通信信道410上的业务量。网络通信模块416包括各种用于建立和保持网络连接的各种部件（例如，用于实现诸如TCP/IP、HTTP等的通信协议的软件）。可访问性应用418与示例性描述数据库420一起可提供并执行参照图1～3描述的特征和过程。

可以在并行处理或对等基础架构中或者在具有一个或更多个处理器的单一装置上实现架构400。软件可包括多个软件部件或者可以是单个代码体。

可有利地在可在可编程系统上执行的一个或更多个计算机程序中实现描述的特征，该可编程系统包含被耦合为从数据存储系统接收数据和指令并向其传送数据和指令的至少一个可编程处理器、至少一个输入装置和至少一个输出装置。计算机程序是可以在计算机中直接或间接使用以执行一定的动作或者带来某些结果的指令组。计算机程序可以以包括编辑或解释语言的任何编程语言的形式（例如，Objective-C、Java）被编写，并且，它可以以任何形式被采用，包括作为独立式程序或者作为模块、部件、子程序或适用于计算环境中的其它单元。

作为例子，适于执行指令的程序的处理器包括通用和特殊用途的微处理器和任何类型的计算机的单独的处理器或者多处理器或核之一。一般地，处理器从只读存储器或随机存取存储器或者两者接收指令和数据。计算机的基本要素是用于执行指令的处理器和一个或更多个用于存储指令和数据的存储器。一般地，计算机还将包括用于存储数据文件的一个或更多个大容量存储装置或者与它们操作耦合和与它们通信，这些装置包括诸如内部硬盘或可去除盘的磁盘、磁光盘和光盘。

适于可触知地体现计算机程序指令和数据的存储装置包括任何形式的非易失性存储器，作为例子，包括诸如EPROM、EEPROM和快擦写存储器装置的半导体存储器装置；诸如内部硬盘和可去除盘的磁盘；磁光盘以及CD-ROM和DVD-ROM盘。处理器和存储器可通过ASIC（专用集成电路）被增补或者加入其中。

为了提供与玩家的交互作用，可以在具有诸如用于向玩家显示信息的CRT（阴极射线管）或LCD（液晶显示器）监视器的显示装置的计算机上实现特征。计算机还可具有使得玩家可向计算机提供输入的诸如游戏控制器、鼠标或跟踪球的键盘和指示装置。

可以在包括诸如数据服务器的后端部件、包括诸如应用服务器或因特网服务器的中间件部件或者包括诸如具有图形用户界面或因特网浏览器的客户端计算机的前端部件或者它们的任意的组合的计算机系统中实现特征。可通过诸如通信网络的数字数据通信的任何形式或介质连接系统的部件。通信网络的一些例子包括LAN、WAN和形成因特网的计算机和网络。

计算机系统可包括客户端和服务器。客户端和服务器一般相互远离，并且一般通过网络交互作用。客户端和服务器借助于在各计算机上运行并且相互具有客户端-服务器关系的计算机程序产生关系。

可通过使用API实现所公开的实现的一个或更多个特征或步骤。API可限定在调用应用和提供服务、提供数据或者执行操作或计算的其它软件代码（例如，操作系统、库程序、函数）之间传送的一个或更多个参数。API可实现为程序代码中的一个或更多个调用，这些调用基于在API规范文件中限定的调用惯例通过参数列表或其它的结构发送或接收一个或更多个参数。参数可以是常数、密钥、数据结构、对象、对象类、变量、数据类型、指针、数组、列表或其它的调用。API调用和参数可在任何的编程语言中被实现。编程语言可限定编程人员降用于访问支持API的功能的词汇和调用惯例。在一些实现中，API调用可向应用报告装置运行应用的能力，诸如输入能力、输出能力、处理能力、功率能力、通信能力等。

已描述了大量的实现。仍然，可以理解，可以提出各种修改。例如，可以提供其它的步骤，或者，可以从描述的流程消除步骤，并且可以向描述的系统添加其它的部件或者从中去除部件。因此，其它的实现在以下权利要求的范围内。

因此，根据以上，本公开的一些例子针对一种方法，该方法包括：接收字符；确定字符的示例性描述可用；获得字符的示例性描述；和可听地呈现示例性描述，其中，该方法由一个或更多个硬件处理器执行。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，接收字符还包括接收字符作为键盘输入。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，确定字符的示例性描述可用包括将字符与示例性描述数据库相比较。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，示例性描述是文本，并且，可听地呈现示例性描述包括将示例性描述从文本转换成语音。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，可听地呈现包括通过扬声器或耳机播放语音。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，示例性描述是基于字符的使用频率构建的。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，字符是汉字或日本字。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，该方法还包括：确定示例性描述不可用；将字符分成组分；和可听地呈现各组分作为字符的描述。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，使用表意文字描述序列（IDS）以将字符分成组分。

另外，根据以上，本公开的一些例子针对一种系统，该系统包括：一个或更多个处理器；与一个或更多个处理器耦合并被配置为存储指令的存储器，这些指令在被一个或更多个处理器执行时导致一个或更多个处理器执行包括以下操作的操作：接收字符；确定字符的示例性描述可用；获得字符的示例性描述；和可听地呈现示例性描述。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，接收字符还包括：接收字符作为键盘输入。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，确定字符的示例性描述可用包括将字符与示例性描述数据库相比较。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，示例性描述是文本，并且，可听地呈现示例性描述包括将示例性描述从文本转换成语音。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，可听地呈现包括通过扬声器或耳机播放语音。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，示例性描述是基于字符的使用频率构建的。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，字符是汉字或日本字。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，一个或更多个处理器执行包括以下操作的操作：确定示例性描述不可用；将字符分成组分；和可听地呈现各组分作为字符的描述。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，使用表意文字描述序列（IDS）以将字符分成组分。

另外，根据以上，本公开的一些例子针对一种系统，该系统包括：用于接收字符的装置；用于确定字符的示例性描述可用的装置；用于获得字符的示例性描述的装置；和用于可听地呈现示例性描述的装置。另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，示例性描述是基于字符的使用频率构建的。

另外，根据以上，本公开的一些例子针对一种系统，该系统包括：一种系统，包括：输入处理模块，被配置为：接收字符；确定字符的示例性描述可用；获得字符的示例性描述；和文本到语音模块，被配置为可听地呈现示例性描述。

另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，输入处理模块进一步被配置为：接收字符作为键盘输入。

另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，输入处理模块进一步被配置为：将字符与示例性描述数据库相比较。

另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，示例性描述是文本，并且，文本到语音模块进一步被配置为将示例性描述从文本转换成语音。

另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，文本到语音模块进一步被配置为通过扬声器或耳机播放语音。

另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，示例性描述是基于字符的使用频率构建的。

另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，字符是汉字或日本字。

另外，或者，作为以上公开的例子中的一个或更多个的替代方案，在一些例子中，输入处理装置进一步被配置为：确定示例性描述不可用；系统还包括：表意文字描述序列模块，被配置为将字符分成组分；并且其中所文本到语音模块进一步被配置为可听地呈现各组分作为字符的描述。

Claims

1.一种方法，包括：

接收字符；

确定所述字符的示例性描述可用；

获得所述字符的示例性描述；和

可听地呈现所述示例性描述，

其中，所述方法由一个或更多个硬件处理器执行。

2.根据权利要求1的方法，其中，接收所述字符还包括：

接收所述字符作为键盘输入。

3.根据权利要求1的方法，其中，确定所述字符的示例性描述可用包括将所述字符与示例性描述数据库相比较。

4.根据权利要求1的方法，其中，所述示例性描述是文本，并且，可听地呈现所述示例性描述包括将所述示例性描述从文本转换成语音。

5.根据权利要求4的方法，其中，可听地呈现包括通过扬声器或耳机播放语音。

6.根据权利要求1的方法，其中，所述示例性描述是基于所述字符的使用频率构建的。

7.根据权利要求1的方法，其中，所述字符是汉字或日本字。

8.根据权利要求1的方法，还包括：

确定示例性描述不可用；

将所述字符分成组分；和

可听地呈现各组分作为所述字符的描述。

9.根据权利要求8的方法，其中，使用表意文字描述序列（IDS）以将所述字符分成组分。

10.一种系统，包括：

一个或更多个处理器；

与所述一个或更多个处理器耦合并被配置为存储指令的存储器，这些指令在被所述一个或更多个处理器执行时导致所述一个或更多个处理器执行包括以下操作的操作：

接收字符；

确定所述字符的示例性描述可用；

获得所述字符的示例性描述；和

可听地呈现所述示例性描述。

11.根据权利要求10的系统，其中，接收字符还包括：

接收所述字符作为键盘输入。

12.根据权利要求10的系统，其中，确定所述字符的示例性描述可用包括将所述字符与示例性描述数据库相比较。

13.根据权利要求10的系统，其中，所述示例性描述是文本，并且，可听地呈现所述示例性描述包括将所述示例性描述从文本转换成语音。

14.根据权利要求13的系统，其中，可听地呈现包括通过扬声器或耳机播放语音。

15.根据权利要求10的系统，其中，所述示例性描述是基于所述字符的使用频率构建的。

16.根据权利要求10的系统，其中，所述字符是汉字或日本字。

17.根据权利要求10的系统，其中，一个或更多个处理器执行包括以下操作的操作：

确定示例性描述不可用；

将所述字符分成组分；和

可听地呈现各组分作为所述字符的描述。

18.根据权利要求17的系统，其中，使用表意文字描述序列（IDS）以将字符分成组分。

19.一种系统，包括：

用于接收字符的装置；

用于确定所述字符的示例性描述可用的装置；

用于获得所述字符的示例性描述的装置；和

用于可听地呈现所述示例性描述的装置。

20.权利要求19的系统，其中，所述示例性描述是基于所述字符的使用频率构建的。

21.一种系统，包括：

输入处理模块，被配置为：

接收字符；

确定所述字符的示例性描述可用；

获得所述字符的示例性描述；和

文本到语音模块，被配置为可听地呈现所述示例性描述。

22.根据权利要求21的系统，其中，所述输入处理模块进一步被配置为：

接收所述字符作为键盘输入。

23.根据权利要求21的系统，其中，所述输入处理模块进一步被配置为：将所述字符与示例性描述数据库相比较。

24.根据权利要求21的系统，其中，所述示例性描述是文本，并且，所述文本到语音模块进一步被配置为将所述示例性描述从文本转换成语音。

25.根据权利要求24的系统，其中，所述文本到语音模块进一步被配置为通过扬声器或耳机播放语音。

26.根据权利要求21的系统，其中，所述示例性描述是基于所述字符的使用频率构建的。

27.根据权利要求21的系统，其中，所述字符是汉字或日本字。

28.根据权利要求21的系统，其中，所述输入处理装置进一步被配置为：确定示例性描述不可用；所述系统还包括：表意文字描述序列模块，被配置为将所述字符分成组分；并且

其中所文本到语音模块进一步被配置为可听地呈现各组分作为所述字符的描述。