CN101131688A - 检查文档拼写的方法和系统 - Google Patents

检查文档拼写的方法和系统 Download PDF

Info

Publication number
CN101131688A
CN101131688A CNA2007101121499A CN200710112149A CN101131688A CN 101131688 A CN101131688 A CN 101131688A CN A2007101121499 A CNA2007101121499 A CN A2007101121499A CN 200710112149 A CN200710112149 A CN 200710112149A CN 101131688 A CN101131688 A CN 101131688A
Authority
CN
China
Prior art keywords
ignore
document
speech
data block
tag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101121499A
Other languages
English (en)
Other versions
CN101131688B (zh
Inventor
詹森·J.·艾尔格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101131688A publication Critical patent/CN101131688A/zh
Application granted granted Critical
Publication of CN101131688B publication Critical patent/CN101131688B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

在实施例中,包括若干数据块的文档子集由开始忽略标记和结束忽略标记标注。随后的拼写检查操作检查该子集的补集的拼写准确性而忽略该子集的拼写准确性。在实施例中,将若干数据块从所述文档或另一个文档中选定的原始位置复制到缓冲区,然后从所述缓冲区粘贴到所述文档。然后,响应与粘贴命令相关联的忽略拼写检查选项,将所述数据块标注为忽略。在另一个实施例中,响应与编辑命令相关联的忽略选项,选择并标注所述数据块。以这种方式,文档子集的拼写检查可以选择性地被激活和禁止。

Description

检查文档拼写的方法和系统
技术领域
一般说来,本发明的实施例涉及计算机系统,更确切地说,涉及其中带有标注为将要忽略的数据块的文档的检查拼写。
背景技术
1948年EDVAC计算机系统的开发往往被引证为计算机时代的开始。从那时以来,计算机系统已经进化为极为精密的设备,并且可以在许多不同的装置中找到计算机系统。典型情况下,计算机系统包括硬件(比如半导体和电路板)与软件(也称为计算机程序)的结合。随着半导体处理和计算机架构的进步推动计算机硬件性能更高,更精密和复杂的计算机软件已经进化为利用了硬件的更高性能,结果是今日的计算机系统比仅仅几年前强有力得多。
计算机系统的一种用途是通过编辑器创建、修改和编辑文档。这样的文档的实例包括信件、电子邮件、书籍、文章、笔记和文件。编辑器提供的一种常见工具是拼写检查器,它将文档中的词与词典中正确拼写的词进行对比。如果拼写检查器判定某词被拼错(因为词典中不存在),拼写检查器可以将该词识别为拼错,为拼错的词提供可能替换词的列表,将拼错的词改变为可能替换词中所选定的一个,或者忽略被拼错的词,取决于用户选定的选项。
尽管拼写检查器可能非常有用,但是它们却要遭遇用户协作进行文档创建和修改时出现的问题。在协作的一个实例中,多位用户可以编辑同一文档,每位用户负责一块数据,比如不同的节、章、页、段或句。协作的另一个实例发生在用户彼此发送电子邮件时。一位用户可以在电子邮件中创建某些信息并将其分发给其他用户,他们依次回复或转发所收到的电子邮件,增加他们自己的信息,同时保留或嵌入所收到的由其他人创建的信息。在增加信息的同时转发和/或回复的这个过程延续的时间可能不确定,而且电子邮件往往会包含一长串嵌入的先前发送、转发和/或回复的电子邮件。尽管用户希望他们自己的信息正确,包括正确的拼写,但是他们未必希望编辑或验证由其他人提供的信息的准确性或正确性,这要占用额外的时间并且可能需要了解关于该信息发信方的意图。
当用户将技术数据粘贴到文档内,然后检查该文档的拼写时也会出现类似的问题,即使并不要求该技术数据或其部分是要在词典中发现的词。技术数据可以包括程序源码的变量名、数据库字段名或带有首字母缩写词或缩写词的信息,并不要求它们是正确拼写的词。例如,数据库有可能具有字段名“fname”、“lname”或“phnum”,读者可以理解它们表示名、姓和电话号码,但是拼写检查器将分别报告它们为拼写错误,强迫用户手工地回应多个个别的拼写错误报告,单调乏味且耗时。
因此,需要更好的技术以处理文档的拼写检查。
发明内容
提供了方法、装置、系统和信号承载介质。在实施例中,包括若干数据块的文档子集由开始忽略标记和结束忽略标记标注。随后的拼写检查操作检查该子集的补集的拼写准确性而忽略该子集的拼写准确性。在实施例中,将若干数据块从所述文档或另一个文档中选定的原始位置复制到缓冲区,然后从所述缓冲区粘贴到所述文档。然后,响应与粘贴命令相关联的忽略拼写检查选项,将所述数据块标注为忽略。在另一个实施例中,响应与编辑命令相关联的忽略选项,选择并标注所述数据块。以这种方式,文档子集的拼写检查可以选择性地被激活和禁止。
附图说明
后文连同附图介绍了本发明的多个实施例:
图1描绘了实现本发明实施例的实例系统的高层次框图;
图2描绘了根据本发明实施例的具有粘贴选项的实例编辑器用户界面的框图;
图3描绘了根据本发明实施例的具有编辑选项的实例编辑器用户界面的框图;
图4描绘了根据本发明实施例的实例文档的框图;
图5描绘了根据本发明实施例的用于处理打开、复制、粘贴和粘贴选项命令的流程图;
图6描绘了根据本发明实施例的用于处理拼写检查和关闭命令的流程图;
图7描绘了根据本发明实施例的用于处理编辑命令的流程图;
图8描绘了根据本发明实施例的用于处理拼写检查操作的流程图。
不过应当指出,附图展示的仅仅是本发明的实例实施例,因此不应当视为是对其范围的限制,因为本发明可以允许其他同等有效的实施例。
具体实施方式
参考附图,其中相同的附图标记表示在几幅图中的相同部分,图1描绘了根据本发明实施例的、连接到网络130的计算机系统100的高层次框图表达。在实施例中,计算机系统100的硬件组件可以由可购自Armonk,New York的国际商用机器公司的eServer iSeries计算机系统实现。不过,本领域的技术人员将认识到,本发明实施例的机制和装置同样适用于任何适当的计算系统。
计算机系统100的主要组件包括一个或多个处理器101、主存储器102、终端接口111、存储器接口112、I/O(输入/输出)设备接口113和通信/网络接口114,它们全部通过存储器总线103、I/O总线104和I/O总线接口单元105连接,用于组件间的通信。
计算机系统100包含一个或多个通用可编程中央处理单元(CPU)101A、101B、101C和101D,本文一般地称为处理器101。在实施例中,计算机系统100包含多个处理器——相对大系统的典型情况;不过,在另一个实施例中,计算机系统100可以替代地为单CPU系统。每个处理器101都执行主存储器102中存储的指令,并且可以包括一级或多级板上高速缓存。
主存储器102是随机存取半导体存储器,用于存储或编码数据和程序。在另一个实施例中,主存储器102代表计算机系统100的整个虚拟存储器,并且还可以包括连接到计算机系统100或通过网络130连接的其他计算机系统的虚拟存储器。主存储器102在概念上是单一的单片电路实体,但是在其他实施例中,主存储器102是更复杂的布局,比如高速缓存与其他存储器器件的层次布局。例如,存储器可以存在于多级高速缓存中,而这些高速缓存可以进一步按功能划分,使得一个高速缓存保存指令而另一个高速缓存保存非指令数据,由一台处理器或多个处理器使用。存储器可以进一步分布并与不同的CPU或CPU组相关联,正如在多种所谓的非一致存储器存取(NUMA)计算机架构的任何一种中所公知的那样。
主存储器102对编辑器150、缓冲区152、文档154和词典156进行存储或编码。尽管编辑器150、缓冲区152、文档154和词典156展示为包含在计算机系统100中的主存储器102之内,但是在其他实施例中,它们中某些或全部可以在不同的计算机系统上,而且可以例如通过网络130远程地进行访问。计算机系统100可以使用虚拟的寻址机制,它允许计算机系统100的程序表现为好像它们仅仅是对大的单一存储器实体进行访问,而不是访问多个较小的存储器实体。因此,尽管编辑器150、缓冲区152、文档154和词典156展示为包含在主存储器102之内,但是这些部分未必全部同时完全地包含在同一存储器设备中。另外,尽管编辑器150、缓冲区152、文档154和词典156展示为分开的实体,但是在其他实施例中,它们的某些或它们中某些的若干部分可以被封装在一起。
编辑器150可以编辑、打开和/或关闭文档154。编辑器150可以进一步通过词典156(它可以包括正确拼写的词列表)检查文档154的拼写。编辑器150可以进一步或者在同一文档154之内或者在若干不同的文档154之间,使用缓冲区152作为媒介,复制、剪切和粘贴数据块。在实施例中,编辑器150包括能够在处理器101上执行的指令或者能够由处理器101上执行的指令所解释的语句,以便运行以下参考图5、图6、图7和图8所进一步介绍的功能。在另一个实施例中,编辑器150可以以微代码实现。在又一个实施例中,编辑器150可以通过逻辑门和/或其他适当的硬件技术用硬件实现。在实施例中,文档154可以是电子邮件、网页、字处理文档、文件或数据库,并且可以包括若干词、控制或排版标记或代码、视频、图像或者其任何部分、组合或多种形式。词是由空格分开的一个或多个字符的序列。词可能是正确拼写的(在词典156中有)也可能是不正确拼写的(在词典156中没有)。以下参考图4将进一步介绍文档154的实例。
存储器总线103提供了在处理器101、主存储器102和I/O总线接口单元105之间传输数据的数据通信通道。I/O总线接口单元105进一步连接到系统I/O总线104,用于对多种I/O单元往返传输数据。I/O总线接口单元105通过系统I/O总线104与多个I/O接口单元111、112、113和114进行通信,它们也称为I/O处理器(IOP)或I/O适配器(IOA)。系统I/O总线104可以是例如工业标准PCI(外设部件接口)总线,也可以是任何其他合适的总线技术。
I/O接口单元支持与各种存储器和I/O设备的通信。例如,终端接口单元111支持附加一个或多个用户终端121、122、123和124。存储器接口单元112支持附加一个或多个直接存取存储设备(DASD)125、126和127(它们是典型的旋转磁盘驱动器存储设备,尽管它们可以替代地是其他设备,包括磁盘驱动器阵列,配置为作为主机的单一大存储设备)。主存储器102的内容在需要时可以存储到直接存取存储设备125、126和127上,以及从其中检索。
I/O设备接口单元113提供了到多种其他输入/输出设备或其他类型设备中任何一种的接口。两种这样的设备,打印机128和传真机129显示在图1的示范实施例中,但是在其他实施例中可以存在许多其他的这样的设备,它们可以是不同的类型。网络接口114提供了从计算机系统100到其他数字设备和计算机系统的一条或多条通信通道;这样的通道可以包括例如一个或多个网络130。
尽管存储器总线103在图1中显示为相对简单的单一总线结构,在处理器101、主存储器102和I/O总线接口单元105之间提供了直接通信通道,事实上存储器总线103可以包括多条不同的总线或通信通道,它们可以安排为多种形式中的任何一种,比如分级的点对点链接、星形或网状结构、多分级总线、若干平行和冗余通道,或者任何其他适当类型的结构。不仅如此,虽然I/O总线接口105和I/O总线104显示为单独的各自单元,计算机系统100事实上可以包含多个I/O总线接口单元105和/或多条I/O总线104。尽管显示了多个I/O接口单元,它们分开了系统I/O总线104与连接到多种I/O设备的多条通信通道,但是在其他实施例中,某些或全部I/O设备都直接连接到一条或多条系统I/O总线。
图1描绘的计算机系统100具有多个附加的终端121、122、123和124,比如可能是典型的多用户“大型”计算机系统。在这种情况下,附加设备的典型实际数量要大于图1显示的数量,尽管本发明不限于任何具体规模的系统。作为替代,计算机系统100可以是单用户的系统,典型情况下仅仅包含单一用户显示器和键盘输入,也可能是服务器或类似的设备,它只有很少的或没有直接的用户接口,但是从其他计算机系统(客户机)接收请求。在其他实施例中,计算机系统100可以实现为个人计算机、便携式计算机、膝上或笔记本计算机、PDA(个人数字助理)、平板计算机、袖珍计算机、电话机、寻呼机、车载机、远程会议系统、家用电器或者任何其他适当类型的电子设备。
网络130可以是任何适当的网络或网络组合,并且可以支持适于往返计算机系统100的数据和/或代码通信的任何适当协议。在各种实施例中,网络130可以表示存储器设备或存储器设备的组合,直接地或间接地连接到计算机系统100。在实施例中,网络130可以支持Infiniband的架构。在另一个实施例中,网络130可以支持无线通信。在又一个实施例中,网络130可以支持固定布线的通信,比如电话线或电缆。在另一个实施例中,网络130可以支持以太网IEEE(电气和电子工程师协会)802.3x规范。在又一个实施例中,网络130可以是因特网并可以支持IP(因特网协议)。
在另一个实施例中,网络130可以是局域网(LAN)或广域网(WAN)。在又一个实施例中,网络130可以是热点服务提供商网络。在另一个实施例中,网络130可以是内联网。在又一个实施例中,网络130可以是GPRS(通用分组无线业务)网络。在另一个实施例中,网络130可以是FRS(家庭无线电服务)网络。在又一个实施例中,网络130可以是任何适当的蜂窝数据网络或基于蜂窝的无线网络技术。在另一个实施例中,网络130可以是IEEE 802.11B无线网络。在又一个实施例中,网络130可以是任何适当的网络或网络组合。虽然显示了一个网络130,但是在其他实施例中,可以出现任何数量的网络(属于相同的或不同的类型)。
应当理解,图1试图在高层次描述计算机系统100和网络130的有代表性的主要部件,各个组件的复杂度可能高于图1中的表达,可以存在不同于图1所示的组件或者它们之外的组件,并且这些组件的数量、类型和结构可以改变。本文公开了这些额外复杂度或额外变化的几个具体实例;应当理解,这些仅仅是举例说明,而未必是仅有的此类变化。
图1中所展示的各种软件组件和实现本发明的各种实施例可以以许多方式实现,包括使用各种计算机软件应用程序、例程、组件、程序、对象、模块、数据结构等,后文称“计算机程序”,或者简称“程序”。典型情况下,计算机程序包括一条或多条指令,不同的时间驻留在计算机系统100的各种存储器和存储设备中,而且由计算机系统100的一个或多个处理器101读取和执行时,使计算机系统100执行若干步骤,它们是执行包括本发明实施例多种方面的若干步骤或要素所需。
此外,尽管已经并在后文将在全功能计算机系统环境中介绍本发明的实施例,但是本发明的各种实施例能够以各种各样的形式作为程序产品发行,而且无论实际进行发行所用的信号承载介质的具体类型如何,本发明都同样适用。定义本实施例功能的程序可以通过各种各样的有形信号承载介质,它们以操作或通信方式(直接或间接地)连接到处理器101,向计算机系统100传递。信号承载介质可以包括但是不限于:
(1)在计算机可读的非可重写存储介质上永久存储或编码的信息,例如联接到计算机系统或在计算机系统之内的只读存储器设备,比如由CD-ROM驱动器可读的CD-ROM;
(2)在计算机可读的可重写存储介质上存储或编码的可变信息,例如硬盘驱动器(如DASD 125、126或127)、存储器102、CD-RW或软盘;或者
(3)由通信媒介向计算机系统100传达的信息,比如通过计算机或电话网络,如网络130。
这样的有形信号承载介质,用指挥本发明功能的计算机可读和可执行指令进行编码即携带着这些指令时,表示了本发明的实施例。
本发明的实施例也可以作为与客户公司、非赢利组织、政府实体、内部组织结构等的服务协定的一部分交付。这些实施例的若干方面可以包括配置要执行的计算机系统,以及部署实现本文所介绍的某些或全部方法的软件系统和网络服务。这些实施例的若干方面还可以包括分析客户公司、创建对应于该分析的建议、产生实现部分建议的软件、将该软件集成到现有过程和基础设施内、记录对本文所介绍方法和系统的使用情况、向用户分配若干费用,以及根据用户使用这些方法和系统对他们开出帐单。
此外,后文介绍的多种程序可以根据它们在本发明的具体实施例中实现的应用而鉴别。但是,以下任何具体程序的名称仅仅是为了方便使用,因此本发明的实施例不应当限于仅仅在由这样的名称所识别的和/或暗示的特定应用中使用。
图1中展示的示范环境并非力图限制本发明。毫无疑问,可以使用其他替代硬件和/或软件环境而不脱离本发明的范围。
图2描绘了根据本发明实施例的包括粘贴选项的实例编辑器用户界面200的框图。编辑器150可以通过终端121、122、123或124呈现即显示用户界面200。用户界面200包括文档显示205,它是文档154在显示屏或视频终端上的视觉呈现。为了在文档显示205中显示文档154,编辑器150在呈现时通过解释文档154中的控制标记或代码,以便对文档154的数据(如词、线、符号、视频或图像)进行排版。
用户界面200包括打开命令210、关闭命令215、复制命令220、粘贴命令225和拼写检查命令230。响应对命令210、215、220、225或230的选择(如通过键盘、鼠标或其他定点设备),用户界面200向编辑器150发送所选定的命令,编辑器150处理该命令。例如,选择打开命令210会请求编辑器150打开文档154,并且呈现和显示打开的文档154作为文档显示205。选择关闭命令215会请求编辑器150关闭文档154,并且在文档显示205中停止显示所关闭的文档154。
选择复制命令220会请求编辑器150将从文档154中选定的原始位置处(如由键盘或定点设备控制的指示器260即光标的操作所选定)所选定的数据块235-1复制或剪切到缓冲区152。在复制操作中,编辑器150创建所选定数据块235-1的备份,并且将该备份加入到缓冲区152。在剪切操作中,编辑器150将所选定的数据块235-1从选定的原始位置处转移到缓冲区152中,使得在剪切操作之后,所选定的数据块235-1在文档154中不再存在。
选择粘贴命令225会请求编辑器150将缓冲区152中的内容(如先前复制到缓冲区152中的数据块235-1)粘贴(复制)到选定的目标位置(如由指示器260的操作选定的位置)。在各种实施例中,选定的目标位置可以在与所选定的原始位置相同的文档154之内,也可以在与所选定的原始位置不同的文档154中。也就是说,编辑器150可以使用缓冲区152在同一文档154之内或在不同的文档154之间复制和备份所选定的数据块235-1,其中缓冲区152是中间存储位置。粘贴命令225可以进一步具有相关联的粘贴选项240,其中之一是在拼写检查期间忽略的粘贴选项250。编辑器150可以响应收到粘贴命令225而显示粘贴选项240,或者是在将数据块235-1从缓冲区152粘贴到文档154中所选定的目标位置之前,或者是在之后。如果用户选择了粘贴选项240的拼写检查期间忽略的选项250,编辑器150响应收到的粘贴选项240的拼写检查期间忽略的选项250,以忽略标记标注所粘贴的数据块235-1,使得编辑器150在(通过拼写检查命令230所请求的)随后的拼写检查操作期间忽略或跳过所粘贴的数据块235-1。
选择拼写检查命令230会请求编辑器150检查或验证文档154中某些或全部词的拼写准确性。编辑器150在拼写检查操作期间忽略以忽略标记标注的数据块。以另一种方式来说,拼写检查命令230请求编辑器150检查文档154某子集的补集的拼写,而该子集包括一个或多个标注的数据块,比如数据块235-1。数据块235-1包括一个或多个词,编辑器150能够将其与词典156中的词进行对比,作为拼写检查操作的一部分。
图3描绘了根据本发明实施例的包括编辑选项的实例编辑器用户界面300的框图。编辑器150可以通过终端121、122、123或124呈现或显示用户界面300。
用户界面300包括文档显示305,它是文档154在显示屏或视频终端上的视觉呈现。为了在文档显示305中显示文档154,编辑器150在呈现时通过解释文档154中的控制标记或代码,以便对文档154的数据(如词、线、符号、视频或图像)进行排版。
用户界面300包括编辑命令305和拼写检查命令230。用户界面300响应选择(如通过键盘、鼠标或其他定点设备)命令305或230,向编辑器150发送所选定的命令,编辑器150处理该命令。例如,选择编辑命令305会请求编辑器150显示编辑选项345,而选择拼写检查命令230会请求编辑器150验证文档154中词的拼写。
编辑选项345包括在拼写检查期间忽略的选项350和拼写检查期间验证的选项352。如果用户选定了数据块235-2并选定了拼写检查期间忽略的选项350,编辑器150就响应选定数据块235-2和收到拼写检查期间忽略的选项350,以忽略标记标注所选定的数据块235-2,使得编辑器150在(通过拼写检查命令230所请求的)随后的拼写检查操作期间忽略或跳过所选定的数据块235-2。用户可以通过对鼠标、其他定点设备或者键盘的操作,通过操纵指示器260选择所选定的数据块235-2。
如果用户选定了数据块235-2并选定了拼写检查期间验证的选项352,编辑器150会响应选定数据块235-2和收到拼写检查期间验证的选项352,从所选定的数据块235-2中删除其中存在的忽略标记,无论存在忽略标记是作为忽略选项350的结果,还是作为忽略选项250(图2)的结果。
图4描绘了根据本发明实施例的实例文档154的框图。实例文档154包括数据块235-1,由数据块235-1之前的开始忽略拼写检查标记405-1和数据块235-1之后的结束忽略拼写检查标记410-1定界。编辑器150响应粘贴选项240的拼写检查期间忽略的粘贴选项250,在文档154中保存了标记405-1和标记410-1。实例文档154进一步包括数据块235-2,由数据块235-2之前的开始忽略拼写检查标记405-2和数据块235-2之后的结束忽略拼写检查标记410-2定界。编辑器150响应编辑选项345的拼写检查期间忽略的编辑选项350,在文档154中保存了标记405-2和标记410-2。数据块235-1由其标记405-1和标记410-1所标明,而数据块235-2由其标记405-2和标记410-2所标明。
文档154中的控制标记,比如标记405-1、405-2、410-1和410-2,也称为控制代码。编辑器150根据控制标记或代码中的指令,对文档154中的数据(如词、线、符号、图示、图像或视频)进行排版、呈现或处理而创建文档显示(图2的205或图3的305)。控制标记或代码在文档显示205和305中不显示,因为它们只是指定文档显示205和305如何排版或文档154中的数据如何处理。在另一个实施例中,编辑器150可以在用户界面200或300中提供显示模式即观看选项,其中控制标记显示在文档显示205或305中。
数据块235-1和数据块235-2共同形成文档154中词的子集,编辑器150在拼写检查操作期间将其跳越即忽略。因此,编辑器150不检查或验证由数据块235-1和数据块235-2所形成的标明子集中词拼写的准确性。但是,编辑器150却的确检查或验证文档154中形成所标明子集补集的词的拼写。所述补集由数据块415-1、415-2和415-3形成,也就是文档154中不是所标明子集(数据块235-1和235-2的并集)部分的全部词。
集是被视为整体的若干不同对象的集合。集的对象被称为元素或成员。关于图4的文档154,文档154中的全部词共同组成该集,而且若干元素就是编辑器150能够进行拼写检查——例如通过将这些词与词典156中正确拼写的词进行对比——或忽略的若干词。注意,在数学的集合论中,集不包含同一元素的多个备份;相反,文档154可以包含同一词的多个备份。但是,如本文所用,文档154中的每个词都具有在文档154之内的唯一位置即定位,所以将元素解释为与其定位相结合的词,文档154就满足了集的定义。
如果假想集A的每个成员也都是假想集B的成员,则A被说成B的子集。例如,数据块235-1和235-2都是文档154中词的子集。若干集或子集可以被加在一起形成“并集”。因此,记为AUB的A与B的并集是全部成员的集合,不是A的成员就是B的成员。使用图4的实例,数据块235-1和235-2的并集是文档154中若干词的子集,并且包括标注为由拼写检查操作要忽略的全部数据块。两个集也能够“相减”形成补集。B中A的补集(也称为B与A的理论差异的集)记为B-A(或者B\A),是属于B的成员但是不属于A的成员的全部元素的集。如果A是B的子集,A的补集记为A′,并且A∪A′=B。使用图4的实例,文档154中被标注为由拼写检查操作忽略的词的子集的补集是未被标注并将进行拼写检查的子集。因此,所标明的子集是数据块235-1和235-2的并集,而所标明的子集的补集是未标明的数据块415-1、415-2和415-3的并集。
图5描绘了根据本发明实施例的用于处理打开、复制、粘贴和粘贴选项命令的流程图。控制起始于方框500处。然后控制继续到方框505,其中编辑器150接收来自编辑器用户界面200或300的命令(图2或图3)。然后控制继续到方框510,其中编辑器150确定所收到的命令是不是打开文档命令210。如果在方框510处的确定为真,那么编辑器150打开由打开文档命令210所指定的文档154,通过任何嵌入的控制标记或代码呈现文档154,并且在显示终端121、122、123或124上通过文档显示205或305显示打开的文档154或打开的文档154的一部分。然后控制返回方框505,其中编辑器150接收下一条命令,如上文先前的介绍。
如果在方框510处的确定为假,那么收到的命令不是打开文档命令210,所以控制继续到方框520,其中编辑器150确定所收到的命令是不是复制命令220。如果在方框520处的确定为真,那么所收到的命令是复制命令220,所以控制继续到方框525,其中编辑器150接收原始位置处数据块的选择,并且将所选定的数据块从文档154中的原始位置复制到缓冲区152中。在实施例中,编辑器150将所有选定的控制标记,比如开始忽略拼写检查标记和结束忽略拼写检查标记,与所选定的数据块一起复制到缓冲区中。在另一个实施例中,编辑器150不复制开始忽略拼写检查标记和结束忽略拼写检查标记。然后控制返回到方框505,其中编辑器150接收下一条命令,如上文先前的介绍。
如果在方框520处的确定为假,那么所收到的命令不是复制命令220,所以控制继续到方框530,其中编辑器150确定所收到的命令是不是粘贴命令225。如果在方框530处的确定为真,那么所收到的命令是粘贴命令225,所以控制继续到方框535,其中编辑器150接收与粘贴命令225相关联的所选定的目的地位置,并且将缓冲区152中已经存在的数据块从缓冲区152粘贴(复制)到所选定的目的地位置。在实施例中,编辑器150也将数据块中包括或嵌入的所有开始忽略拼写检查标记和结束忽略拼写检查标记都粘贴到所选定的目的地位置。在另一个实施例中,编辑器150不将数据块中包括在或嵌入的任何开始忽略拼写检查标记和结束忽略拼写检查标记粘贴(复制)到所选定的目的地位置。然后控制继续到方框540,其中编辑器150通过用户界面200可选地呈现粘贴选项240。然后控制继续到方框545,其中编辑器150确定所收到的通过用户界面200所选定的粘贴选项是不是拼写检查期间忽略的选项250。
如果在方框545处的确定为真,那么所收到的通过用户界面200所选定的粘贴选项是拼写检查期间忽略的选项250,所以控制继续到方框550,其中编辑器150在目的地位置通过在所选定的数据块之前增加开始忽略标记以及在所选定的数据块之后增加结束忽略标记(如果还未存在),标注拼写检查操作要忽略的所粘贴数据块(如数据块235-1)。编辑器150将开始忽略标记和结束忽略标记保存到文档154。然后控制返回方框505,其中编辑器150接收下一条命令,如上文先前的介绍。
如果在方框545处的确定为假,那么所收到的通过用户界面200所选定的粘贴选项不是拼写检查期间忽略的选项250,所以控制继续到方框555,其中编辑器150处理粘贴选项240的另一个选项。然后控制返回方框505,其中编辑器150接收下一条命令,如上文先前的介绍。
如果在方框530处的确定为假,那么所收到的命令不是粘贴命令225,所以控制继续到方框560,其中器150处理其他的命令,正如下面参考图6的进一步介绍。然后控制返回方框505,其中编辑器150接收下一条命令,如上文先前的介绍。
图6描绘了根据本发明实施例的用于处理拼写检查和关闭命令的流程图。控制起始于方框600处。然后控制继续到方框605,其中编辑器150确定所收到的命令是不是拼写检查命令230。如果在方框605处的确定为真,那么所收到的命令是拼写检查命令230,所以控制继续到方框610,其中编辑器150对文档154中所标明子集的补集执行拼写检查操作,正如下面参考图8的进一步介绍。在实施例中,拼写检查操作与子集的标注操作是分开的。也就是说,子集的标注操作发生在拼写检查操作之前,不是拼写检查操作过程的一部分,并且不是响应拼写检查操作发现了不正确拼写词而发生。然后控制继续到方框699,其中图6的逻辑返回。
如果在方框605处的确定为假,那么所收到的命令不是拼写检查命令230,所以控制继续到方框615,其中编辑器150确定所收到的命令是不是关闭文档命令215。如果在方框615处的确定为真,那么所收到的命令是关闭文档命令215,所以控制继续到方框620,其中编辑器150关闭所指定的文档154。所关闭的文档154包括先前保存到文档154中的开始忽略标记和结束忽略标记,以便编辑器150下次打开文档154时,所述开始忽略标记和结束忽略标记存在,而且它们标明了随后的拼写检查操作将要忽略的数据块。然后控制继续到方框699,其中图6的逻辑返回。
如果在方框615处的确定为假,那么所收到的命令不是关闭文档命令215,所以控制继续到方框625,其中编辑器150处理编辑命令,如下面参考图7的进一步介绍。然后控制继续到方框699,其中图6的逻辑返回。
图7描绘了根据本发明实施例的用于处理编辑命令的流程图。控制起始于方框700处。然后控制继续到方框705,其中编辑器150确定所收到的命令是不是编辑命令305。如果在方框705处的确定为真,那么所收到的命令是编辑命令305,所以控制继续到方框710,其中编辑器150确定编辑命令305是否包括编辑选项345,指定了文档154中随后的拼写检查操作将要忽略(拼写检查期间忽略的选项350)的选定数据块。如果在方框710处的确定为真,那么编辑命令305包括编辑选项345,它指定了数据中随后的拼写检查操作将要忽略的选定数据块,所以控制继续到方框715,其中编辑器150接收数据块的选择,并且通过在所选定的数据块之前增加开始忽略标记以及在所选定的数据块之后增加结束忽略标记,标注随后的拼写检查操作要忽略的所选定数据块。然后控制继续到方框799,其中图7的逻辑返回。
如果在方框710处的确定为假,那么该编辑命令305不包括指定了数据中随后的拼写检查操作将要忽略的选定数据块的编辑选项,所以控制继续到方框720,其中编辑器150确定编辑选项是不是拼写检查期间验证的选项352。如果在方框720处的确定为真,那么编辑选项是拼写检查期间验证的选项352,所以控制继续到方框725,其中编辑器150接收块的选择,并且从文档154中删除开始忽略标记和结束忽略标记(如果存在),它们对选定块定界。然后控制继续到方框799,其中图7的逻辑返回。
如果在方框720处的确定为假,那么编辑选项不是拼写检查期间验证的选项352。所以控制继续到方框730,其中编辑器150处理其他编辑选项。然后控制继续到方框799,其中图7的逻辑返回。
如果在方框705处的确定为假,那么所收到的命令不是编辑命令305,所以控制继续到方框735,其中编辑器150处理其他命令。然后控制继续到方框799,其中图7的逻辑返回。
图8描绘了根据本发明实施例的对文档154所标明子集的补集所进行的处理拼写检查操作的流程图。控制起始于方框800处。然后控制继续到方框805,其中编辑器150将文档154中的当前词设置为与光标或指示器260相关联的插入点处的词。因此,编辑器150在文档154中用户通过指示器260所选定的位置处开始拼写检查处理。在另一个实施例中,编辑器150可以在文档154的开始位置或任何其他适当的位置开始拼写检查处理。
然后控制继续到方框810,其中编辑器150确定当前词是否在文档154内的某开始忽略标记之后及对应的结束忽略标记之前。也就是说,编辑器150确定当前词是否在对应的开始和结束忽略标记之间,意味着当前词在先前由标记标注为拼写检查操作将要忽略的(如由编辑器150响应忽略选项250或350而标注的)数据块之内。
如果在方框810处的确定为真,那么当前词在对应的开始和结束忽略标记之间,所以控制继续到方框815,其中编辑器150将当前词设置为结束忽略标记之后的下一个词,它使拼写检查操作跳过由对应的开始和结束忽略标记标明要忽略的数据块。然后控制返回到方框810,其中编辑器150对新的当前词进行确定,如上文先前的介绍。
如果在方框810处的确定为假,那么当前词不在对应的开始和结束忽略标记之间,所以当前词是文档154中所标注数据块的补集,所以控制继续到方框820,其中编辑器150通过将当前词与词典156中正确拼写的词进行对比,检查当前词的拼写。如果当前词在词典156中不存在,那么当前词的拼写不正确,所以编辑器150可选地呈现当前词;可选地建议一个或多个来自词典156的正确拼写的词,作为当前词的替代词;可选地以从词典156选定的正确拼写的词改变或替换当前词;可选地将当前词加入到词典156以及/或者忽略当前词。然后控制继续到方框825,其中编辑器150将当前词设置为文档154中的下一个词。
然后控制继续到方框830,其中编辑器150确定拼写检查操作是否完成。在多种实施例中,如果编辑器150收到了终止拼写检查的请求、如果当前词已经到达了文档154的结尾、如果所标明数据块的补集中的全部词都已经被方框820的重复操作检查过或者如果当前词已经到达了拼写检查操作的开始点(如在光标插入点的词,正如以上参考方框805的先前介绍),拼写检查就可以完成。
如果在方框830处的确定为真,那么拼写检查完成,所以控制继续到方框899,其中图8的逻辑返回。
如果在方框830处的确定为假,那么拼写检查未完成,所以控制返回到方框810,其中编辑器150对新的当前词进行确定,如上文先前的介绍。
在本发明示范实施例的先前详细介绍中,对附图(其中相同的数字表示相同的要素)进行了参考,它组成了本文的一部分,并且以展示的方式显示了可以实践本发明的特定示范实施例。这些实施例的介绍详细到足以使本领域技术人员能够实践本发明,但是也可以采用其他的实施例,并且可以进行逻辑的、机械的、电学的和其他的改变而不脱离本发明的范围。在先前的介绍中阐述了众多的特定细节,以提供对本发明实施例的完全理解。但是,没有这些特定细节也可以实践本发明。在其他事例中,为了不模糊本发明,没有详细显示众所周知的若干电路、结构和技术。
在本说明书内所使用的文字“实施例”的不同事例,未必是指同一实施例,但是它们可以。本文展示的和介绍的任何数据和数据结构仅仅是若干实例,并且在其他实施例中,可以使用不同的数据量、数据类型、字段、字段的号码和类型、字段名、行的号码和类型、记录、项或数据组织。此外,任何数据都可以与逻辑电路组合,所以不必是单独的数据结构。所以,先前的详细介绍不应当视为限制的意义,本发明的范围仅仅由附带的权利要求书定义。

Claims (14)

1.一种方法,包括:
标注文档的子集,其中,所述文档包括多个词;以及
在所述标注后对所述文档执行拼写检查操作,其中,所述执行进一步包括检查所述多个词中所述子集的补集的拼写准确性,并忽略所述子集的拼写准确性,并且所述执行拼写检查操作与所述标注所述子集分离。
2.根据权利要求1的方法,其中,所述标注进一步包括:
将数据块从缓冲区粘贴到所述文档,其中所述子集包括所述数据块;以及
响应所述粘贴,标注所述文档中的所述数据块。
3.根据权利要求2的方法,进一步包括:
将所述数据块从所述文档中选定的原始位置复制到所述缓冲区。
4.根据权利要求2的方法,进一步包括:
将所述数据块从另一个文档中选定的原始位置复制到所述缓冲区。
5.根据权利要求1的方法,其中,所述标注进一步包括:
将所述数据块从缓冲区粘贴到所述文档中的目的地位置,其中所述子集包括所述数据块;以及
如果接收到粘贴命令的忽略拼写检查选项,则标注所述文档中所述目的地位置处的所述数据块,其中所述粘贴命令请求所述粘贴。
6.根据权利要求1的方法,其中,所述标注进一步包括:在数据块之前插入开始忽略标记,在所述数据块之后插入结束忽略标记,其中所述子集包括所述数据块。
7.根据权利要求1的方法,其中,所述标注进一步包括:
标注多个数据块,其中,所述子集包括所述多个数据块,所述标注进一步包括:在所述多个数据块的每一个之前插入各自的开始忽略标记,在所述多个数据块的每一个之后插入各自的结束忽略标记。
8.根据权利要求1的方法,其中,所述标注进一步包括:
响应选择文档的所述子集以及接收到请求所述拼写检查操作忽略所述子集的忽略选项,标注所述文档的子集。
9.根据权利要求6的方法,其中,所述执行所述拼写检查操作进一步包括:
从所述文档中读取所述多个词中的第一个词;
确定所述第一个词是不是在所述开始忽略标记与所述结束忽略标记之间;
如果所述第一个词在所述开始忽略标记与所述结束忽略标记之间,则跳到所述结束忽略标记后的下一个词并将所述下一个词与正确拼写词的词典进行对比;以及
如果所述第一个词不在所述开始忽略标记与所述结束忽略标记之间,则将所述第一个词与正确拼写词的词典进行对比。
10.一种配置计算机的方法,包括:
配置所述计算机以标注文档的子集,其中,所述文档包括多个词,所述配置所述计算机以标注进一步包括:配置所述计算机以将数据块从缓冲区粘贴到所述文档中的目的地位置,如果接收到与粘贴命令相关联的忽略拼写检查选项,则标注所述目的地位置处的所述数据块,并且在数据块之前插入开始忽略标记,在所述数据块之后插入结束忽略标记,其中所述粘贴命令请求所述粘贴,所述子集包括所述数据块;以及
配置所述计算机以在所述标注后对所述文档执行拼写检查操作,其中所述执行进一步包括检查所述多个词中所述子集的补集的拼写准确性,并忽略所述子集的拼写准确性。
11.根据权利要求10的方法,其中,所述配置所述计算机以标注进一步包括:
配置所述计算机以标注多个数据块,其中所述子集包括所述多个数据块,所述标注进一步包括:在所述多个数据块的每一个之前插入各自的开始忽略标记,在所述多个数据块的每一个之后插入各自的结束忽略标记。
12.根据权利要求10的方法,其中,所述配置所述计算机以执行所述拼写检查操作进一步包括:
配置所述计算机以从所述文档中读取所述多个词中的第一个词;
配置所述计算机以确定所述第一个词是不是在所述开始忽略标记与所述结束忽略标记之间;
配置所述计算机,如果所述第一个词在所述开始忽略标记与所述结束忽略标记之间,则跳到所述结束忽略标记后的下一个词并将所述下一个词与正确拼写词的词典进行对比;以及
配置所述计算机,如果所述第一个词不在所述开始忽略标记与所述结束忽略标记之间,则将所述第一个词与正确拼写词的词典进行对比。
13.根据权利要求10的方法,其中,所述配置所述计算机,如果接收到与粘贴命令相关联的忽略拼写检查选项,则标注所述目的地位置处的所述数据块进一步包括:
配置所述计算机以响应所述粘贴而呈现所述忽略拼写检查选项;以及
配置所述计算机,如果选定了所述忽略拼写检查选项,则标注所述数据块。
14.一种系统,包括用于实施根据权利要求1-13中任何一条的方法中的步骤的装置。
CN2007101121499A 2006-08-24 2007-06-19 检查文档拼写的方法和系统 Expired - Fee Related CN101131688B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/466,951 2006-08-24
US11/466,951 US20080052619A1 (en) 2006-08-24 2006-08-24 Spell Checking Documents with Marked Data Blocks

Publications (2)

Publication Number Publication Date
CN101131688A true CN101131688A (zh) 2008-02-27
CN101131688B CN101131688B (zh) 2012-04-25

Family

ID=39128958

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101121499A Expired - Fee Related CN101131688B (zh) 2006-08-24 2007-06-19 检查文档拼写的方法和系统

Country Status (3)

Country Link
US (1) US20080052619A1 (zh)
JP (1) JP2008052740A (zh)
CN (1) CN101131688B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105094564A (zh) * 2015-08-11 2015-11-25 广州视睿电子科技有限公司 基于触摸操作的笔迹编辑方法及系统
CN105786779A (zh) * 2016-03-01 2016-07-20 万达信息股份有限公司 Wps在线插件中实现基于文档模板的多行报告的方法
CN107291683A (zh) * 2016-04-11 2017-10-24 珠海金山办公软件有限公司 一种拼写检查方法及装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7996768B2 (en) * 2006-05-18 2011-08-09 International Business Machines Corporation Operations on document components filtered via text attributes
AR062635A1 (es) 2006-09-01 2008-11-19 Thomson Global Resources Sistema, metodos, software e interfases para dar formato a citas de legislacion
US8108763B2 (en) * 2007-01-19 2012-01-31 Constant Contact, Inc. Visual editor for electronic mail
US9298697B2 (en) * 2010-01-26 2016-03-29 Apollo Education Group, Inc. Techniques for grammar rule composition and testing
US20130124194A1 (en) * 2011-11-10 2013-05-16 Inventive, Inc. Systems and methods for manipulating data using natural language commands
US20160335245A1 (en) * 2015-05-15 2016-11-17 Cox Communications, Inc. Systems and Methods of Enhanced Check in Technical Documents

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57113187A (en) * 1980-12-19 1982-07-14 Ibm Method of processing text
DE3684689D1 (de) * 1985-12-29 1992-05-07 Brother Ind Ltd Schreibmaschine mit mitteln zur automatischen anzeige eines korrekten kandidatenwortes fuer ein falsch geschriebenes wort und/oder zur automatischen korrektur von flasch geschriebenen woertern.
JPS6359660A (ja) * 1986-08-29 1988-03-15 Brother Ind Ltd 情報処理装置
US5428777A (en) * 1991-11-18 1995-06-27 Taylor Publishing Company Automatic index for yearbooks with spell checking capabilities
US6003023A (en) * 1994-11-04 1999-12-14 International Business Machines Corporation Incremental change processing apparatus for presented objects
EP1325427A2 (en) * 2000-06-21 2003-07-09 Microsoft Corporation System and method for integrating spreadsheets and word processing tables
US20050125217A1 (en) * 2003-10-29 2005-06-09 Gadi Mazor Server-based spell check engine for wireless hand-held devices

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105094564A (zh) * 2015-08-11 2015-11-25 广州视睿电子科技有限公司 基于触摸操作的笔迹编辑方法及系统
CN105786779A (zh) * 2016-03-01 2016-07-20 万达信息股份有限公司 Wps在线插件中实现基于文档模板的多行报告的方法
CN105786779B (zh) * 2016-03-01 2019-03-05 万达信息股份有限公司 Wps在线插件中实现基于文档模板的多行报告的方法
CN107291683A (zh) * 2016-04-11 2017-10-24 珠海金山办公软件有限公司 一种拼写检查方法及装置

Also Published As

Publication number Publication date
CN101131688B (zh) 2012-04-25
US20080052619A1 (en) 2008-02-28
JP2008052740A (ja) 2008-03-06

Similar Documents

Publication Publication Date Title
CN101131688B (zh) 检查文档拼写的方法和系统
Di Gregorio Using Nvivo for your literature review
CN1754166B (zh) 文档集内容空间的导航
US9361464B2 (en) Versatile log system
Basoglu et al. Inline XBRL versus XBRL for SEC reporting
CN109783781A (zh) 基于图像识别的保单录入方法和相关装置
CN115422125B (zh) 一种基于智能算法的电子文档自动归档方法与系统
CN101341483B (zh) 用于搜索和显示法律判例历史的用户接口
US20220284052A1 (en) Extracting and surfacing topic descriptions from regionally separated data stores
KR20220102169A (ko) 교차검증, 사이트 검색 및 포맷 재구성을 이용한 논문 내 참고문헌 적합성 검증 서비스 제공 시스템
Mayer et al. Establishing context of digital objects’ creation, content and usage
JP3676564B2 (ja) データベース装置、データベースシステム、データベース装置の制御方法および記録媒体
Machaca et al. Journal of integrative bioinformatics: Transformers meets neoantigen detection: a systematic literature review
CN115374472A (zh) 一种技术文件的处理方法及装置
Zhang Journal of Chinese film studies: The Broken Human–Object Continuum: The Technological Future and Socialist Contradictions in Rhapsody of the Ming Tombs Reservoir (1958)
Shelton Apeiron: Divine Madness in Plato’s Phaedrus
Horsthemke Medizinische Genetik: The role of epigenetics in rare diseases
Yamashita et al. Journal of mathematical cryptology: On the Black-Box impossibility of multi-designated verifiers signature schemes from ring signature schemes
Noé Apeiron: Demotic Virtues in Plato’s Laws
Rudasingwa et al. Open health: Regional prevalence and spatial modeling of hypertension in South Africa
Davis Zeitschrift für die neutestamentliche Wissenschaft: A Stone that Winnows: Luke 20, 18 as a Creative Quotation of Scripture
Zreik Analyse & Kritik: War and Self-Defense: Some Reflections on the War on Gaza
Müller Zeitschrift für Sprachwissenschaft: Getting the facts right: focus on adverbial verum marking in German
Vogel et al. Zeitschrift für wirtschaftlichen Fabrikbetrieb: Humanzentrierte Implementierung von (teil-) autonomen Drohnen
De Souter Journal of causal inference: Evaluating Boolean relationships in Configurational Comparative Methods

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120425

Termination date: 20120619