示例性实施例的详细描述
本发明涉及对指示用户在用户界面上的动作的内容的自动记录。在详细描述本发明的之前,将讨论可在其中使用本发明的一个示例性环境。
图1示出了可在其上实现本发明的合适的计算系统环境100的示例。计算系统环境100只是合适的计算环境的一个示例,并不旨在对本发明的使用范围或功能提出任何限制。也不应该把计算环境100解释为对示例性操作环境100中示出的任一组件或其组合有任何依赖性或要求。
本发明可用众多其它通用或专用计算系统环境或配置来操作。适合在本发明中使用的公知的计算系统、环境和/或配置的示例包括,但不限于,个人计算机、服务器计算机、手持或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费者电子产品、网络PC、小型机、大型机、包含上述系统或设备中的任一个的分布式计算机环境等。
本发明可在由计算机执行的诸如程序模块等的计算机可执行指令的通用语境中描述。一般而言,程序模块包括例程、程序、对象、组件、数据结构等,它们执行特定任务或实现特定抽象数据类型。本发明也可以在分布式计算环境中实现,其中任务由通过通信网络连接的远程处理设备执行。在分布式计算环境中,程序模块可以位于包括存储器存储设备在内的本地和远程计算机存储介质中。
参考图1,用于实现本发明的一个示例性系统包括计算机110形式的通用计算设备。计算机110的组件可以包括,但不限于,处理单元120、系统存储器130和将包括系统存储器在内的各种系统组件耦合至处理单元120的系统总线121。系统总线121可以是若干类型的总线结构中的任一种,包括存储器总线或存储器控制器、外围总线和使用各种总线体系结构中的任一种的局部总线。作为示例,而非限制,这样的体系结构包括工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、扩展的ISA(EISA)总线、视频电子技术标准协会(VESA)局部总线和外围部件互连(PCI)总线(也被称为Mezzanine总线)。
计算机110通常包括各种计算机可读介质。计算机可读介质可以是能够被计算机110访问的任何可用介质,且包括易失性和非易失性介质、可移动和不可移动介质。作为示例,而非限制,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以任何方法或技术实现的用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括,但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储、磁带盒、磁带、磁盘存储或其它磁性存储设备、或能用于存储所需信息且可以由计算机110访问的任何其它介质。通信介质通常具体化为诸如载波或其它传输机制等已调制数据信号中的计算机可读指令、数据结构、程序模块或其它数据,且包含任何信息传递介质。术语“已调制数据信号”指的是这样一种信号,其一个或多个特征以在信号中编码信息的方式被设定或更改。作为示例,而非限制,通信介质包括有线介质,诸如有线网络或直接线连接,以及无线介质,诸如声学、RF、红外线和其它无线介质。上述中任一个的组合也应包括在计算机可读介质的范围之内。
系统存储器130包括易失性和/或非易失性存储器形式的计算机存储介质,诸如只读存储器(ROM)131和随机存取存储器(RAM)132。基本输入/输出系统133(BIOS)包含有助于诸如启动时在计算机110中元件之间传递信息的基本例程,它通常存储在ROM 131中。RAM 132通常包含处理单元120可以立即访问和/或目前正在操作的数据和/或程序模块。作为示例,而非限制,图1示出了操作系统134、应用程序135、其它程序模块136和程序数据137。
计算机110也可以包括其它可移动/不可移动、易失性/非易失性计算机存储介质。仅作为示例,图1示出了从不可移动、非易失性磁介质中读取或向其写入的硬盘驱动器141,从可移动、非易失性磁盘152中读取或向其写入的磁盘驱动器151,以及从诸如CD ROM或其它光学介质等可移动、非易失性光盘156中读取或向其写入的光盘驱动器155。可以在示例性操作环境下使用的其它可移动/不可移动、易失性/非易失性计算机存储介质包括,但不限于,盒式磁带、闪存卡、数字多功能盘、数字录像带、固态RAM、固态ROM等。硬盘驱动器141通常由不可移动存储器接口,诸如接口140连接至系统总线121,磁盘驱动器151和光盘驱动器155通常由可移动存储器接口,诸如接口150连接至系统总线121。
以上描述和在图1中示出的驱动器及其相关联的计算机存储介质为计算机110提供了对计算机可读指令、数据结构、程序模块和其它数据的存储。例如,在图1中,硬盘驱动器141被示为存储操作系统144、应用程序145、其它程序模块146和程序数据147。注意,这些组件可以与操作系统134、应用程序135、其它程序模块136和程序数据137相同或不同。操作系统144、应用程序145、其它程序模块146和程序数据147在这里被标注了不同的标号是为了说明至少它们是不同的副本。
用户可以通过输入设备,诸如键盘162、麦克风163和诸如鼠标、跟踪球或触摸垫的定点设备161向计算机110输入命令和信息。其它输入设备(未示出)可以包括操纵杆、游戏垫、圆盘式卫星天线、扫描仪等。这些和其它输入设备通常由耦合至系统总线的用户输入接口160连接至处理单元120,但也可以由其它接口或总线结构,诸如并行端口、游戏端口或通用串行总线(USB)连接。监视器191或其它类型的显示设备也经由接口,诸如视频接口190连接至系统总线121。除监视器以外,计算机也可以包括其它外围输出设备,诸如扬声器197和打印机196,它们可以通过输出外围接口195连接。
计算机110可使用至一个或多个远程计算机,诸如远程计算机180的逻辑连接在网络化环境下操作。远程计算机180可以是个人计算机、手持式设备、服务器、路由器、网络PC、对等设备或其它常见网络节点,且通常包括上文相对于计算机110描述的许多或所有元件。图1中所示逻辑连接包括局域网(LAN)171和广域网(WAN)173,但也可以包括其它网络。这样的网络环境在办公室、企业范围计算机网络、内联网和因特网中是常见的。
当在LAN连网环境中使用时,计算机110通过网络接口或适配器170连接至局域网171。当在WAN连网环境中使用时,计算机110通常包括调制解调器172或用于通过诸如因特网等WAN 173建立通信的其它装置。调制解调器172可以是内置或外置的,它可以通过用户输入接口160或其它合适的机制连接至系统总线121。在网络化环境中,相对于计算机110所描述的程序模块或其部分可以存储在远程存储器存储设备中。作为示例,而非限制,图1示出了远程应用程序185驻留在存储器设备181上。可以理解,所示的网络连接是示例性的,且可以使用在计算机之间建立通信链路的其它手段。
图2是示出根据本发明的一个实施例的记录系统200的组件的框图。图2也示出了带有记录器207和自动文本生成器203的系统200。记录器207包括记录组件210、挂钩组件212以及用户界面(UI)自动化组件214。文本生成器203包括文本数据库(或数据存储)220以及文本生成组件230。系统200与用户界面205交互。创作者可配置系统200的组件来自动记录对应于在用户界面205的控件上执行的动作的图像,文本生成器203自动生成描述这些动作的文本235。创作者201也可在编辑器240上编辑自动生成的文本235或从草稿生成文本以获取描述任务(或UI控件动作)的最终文本245。最终文本245也示例性地包括嵌入其中的图像。现在将详细描述图2中的多个组件。
在一个实施例中,用户界面205是具有允许用户采取动作来执行任务的控件的常规图形用户界面。用户界面205示例性地显示在图1中所示的显示设备191上。这种类型的图形用户界面(GUI)是广泛使用的界面机制。
记录组件210在一个实施例中是允许创作者201或另一用户在用户界面205上执行任务并通过捕捉任务中每一步骤的图像来记录任务的应用程序。如将在以下更详细描述的,当创作者201在用户界面205上执行与任务相关联的步骤时,记录组件210记录关于创作者在用户界面205上与什么控件和窗口交互的信息。这种信息被示例性地提供给文本生成器230以自动在诸如帮助文档的文档中生成文本。
记录组件210经由挂钩组件212和用户界面(UI)自动化组件214与用户界面205交互。这些组件可与记录组件210分开,或在某些实施例中,这些组件可与记录组件210集成在一起。
在一个实施例中,挂钩组件212是由计算机使用的操作系统内的模块或组件。例如,当挂钩被设定为鼠标点击时,指示鼠标点击的信息(诸如消息)被转发给挂钩组件212,在那里消费该信息,且当其相关联的图像由记录组件210记录之后,为注册以接收鼠标点击的计算机中的其它组件回放该信息。从而,一般,挂钩组件212用作操作系统和目标应用程序之间的缓冲区。
挂钩组件212可被配置成查找基本上任何输入动作,诸如所接收的信号的类型,例如单击、双击、右击或左击、键盘动作、触敏屏输入等。一旦表示动作的信息由记录组件210记录之后,表示鼠标点击(或所记录的任何动作)的信息就由挂钩组件212向应用程序回放。对此的一个理由是,用户可在记录第一动作之前采取第二动作。第二动作可使用户界面的状态改变,并因此导致对第一动作的不正确记录。通过消费第一鼠标消息并当一旦完成记录之后对其回放,这确保了第一动作将被正确记录。
也应注意,由挂钩组件212执行的功能(即,监听鼠标点击并对其回放)被示例性地在分开的线程上执行。这确保了所有用户界面动作(例如,鼠标点击、键盘动作等)将没有遗漏地被正确记录并回放。此外,挂钩组件212的记录和回放机制可示例性地无视操作系统内隐含的任何超时特征。这可能是必须的,如果操作系统的超时周期过短而无法允许正确的记录动作。
用户界面自动化组件214示例性地是被配置成解释由创作者或用户通过用户界面205执行的整体任务的原子步骤的计算机程序。在一个实施例中,用户界面自动化组件214是使用华盛顿州雷德蒙市的微软公司提供的微软用户界面自动化来实现的GUI自动化模块。该模块提供了一种程序化方式,以访问关于可视用户界面的信息并在程序上与可视用户界面交互。然而,取决于系统设置,用户界面自动化组件214可使用能够程序上导航图形用户界面并检测(和可任选地在程序上导航GUI来执行和运行)用户界面上的命令的任何应用程序来实现。
用户界面自动化组件214因此检测与创作者201(或另一用户)以任务顺序在用户界面205上执行的期望任务相关联的步骤中的每一个。例如,如将在以下更详细描述,当任务需要用户在GUI上点击按钮以显示新菜单或窗口时,用户界面自动化组件214确定哪一控件位于用户界面205上的鼠标光标的位置处及其大小和它的父窗口。记录组件210使用来自挂钩组件212的信息(例如,控件的类型、名字和状态)来记录被用于执行该步骤的控件的名字和属性。该信息由用户界面自动化组件214和挂钩组件212向记录组件210提供,使得记录组件210可记录由创作者用来执行该步骤的按钮或控件的图像。以下将参考图3更详细描述对图像的获取。
文本生成组件230是被配置成生成描述在记录过程期间被运行或执行的动作的自然语言文本的程序或模块。文本生成组件230使用所记录的图像和由记录组件210记录的其它信息来搜索数据库220,并从文本数据库220中选择对应于所记录步骤的正确的模板或条目。
文本数据库220示例性地是可由文本生成器230搜索的数据库或其它信息存储系统。文本数据库220包含与在用户界面205上可使用的控件相关的信息。这种信息可包括例如,控件的名字、控件的类型、在控件上执行的动作、以及作为自然语言句子的动作的文字描述。
在某些实施例中,以多种语言提供对条目的文字描述。当以多种语言提供文字描述时,每一条目配备语言标识符,以允许正确的语言被选择。
然而,取决于系统需求,可在文本数据库220中提供其它信息。在一个实施例中,文本数据库220中的某些条目含有与由顺序执行的多个控件例示的两个或多个动作相关的信息。当由文本数据库220中的单个条目表示多个控件上的多个动作时,条目的文本包含作为单个句子的在两个控件上执行的动作的自然语言描述。通过将两个命令的描述组合成单个句子,改进了最终文本文档的可读性。
在一个实施例中,文本数据库220以可扩展标记语言(XML)编写。每一条目的数据可作为一连串子条目被存储,其中条目的每一子条目指的是标识任务所需的单独的信息片段。然而,可使用其它格式来存储数据。
在一个实施例中,文本生成组件230当在文本数据库220中搜索条目时查看所记录的动作中的两个或多个。这样做是为了提供更流畅的文本文档。例如,良好的程式性文档一般将多于一个的步骤组成单个句子,以增强可读性。如果文本生成组件230标识了文本数据库220中与所记录的信息相匹配的两个或多个条目时,则文本生成组件230可使用任何已知方法来确定要选择数据库中的哪个条目,诸如通过基于对每一条目记分并选择具有最高分的条目来去除条目的歧义。
根据一个实施例,基于用户界面上所启动的控件的类型和所执行的动作,文本生成组件230在文本数据库220中搜索匹配所执行的控件类型和动作的条目。一旦在文本数据库220中标识了匹配之后,文本生成组件230从文本数据库220中获取对动作的相关联的自然语言描述,并将其作为句子指令而放置于所生成的文本文档235中。在替换实施例中,文本生成组件220也可基于由UI自动化模块214提供的信息生成文本文档的可执行版本。
当从文本数据库235中选择文字描述时,文本生成组件也可察看控件的状态。这当控件是复选框或者是可展开或折叠的树时是重要的。在这种情况下,仅在框上点击可能不适于描述该动作,因为无论期望的结果如何,控件上的动作都是相同的。因此,在这些情况中,控件的新状态将影响所选择的文本。例如,如果控件是复选框,且它要被取消选定,则所匹配的文本将基于控件的新状态加上控件的名字。
文本编辑器240是被配置成对自动生成的文本235进行更正、改变或添加信息或文本的编辑器。取决于由文本生成器230生成的结果文本,以及创作者执行的动作,可能有必要编辑文本以进一步增强其可理解性。从而,文本编辑器240接收所生成的文本235,并允许创作者201编辑所生成的文本。
例如,由于语法上的必要性或因为所记录的步骤之一要求一用户动作而系统在记录该步骤时没有要求对用户动作的描述,就需要文本编辑。在这样的情况中(当需要用户输入时),根据一个实施例,在执行将被记录的动作的同时,文本生成器235仅在文本中提供空格,以便创作者提供关于用户在此步骤中应做的动作的指令/描述。
例如,假定正由用户执行并由记录组件记录的任务是改变铺在计算机屏幕上的背景。这要求用户为背景选择图案。从而,由文本数据库返回的用于改变背景的所记录的用户动作的文本可以是“请选择[插入动作的描述]”,其中创作者将编辑文本成“请从列表中选择所需的背景”。同样在编辑阶段期间,如果在记录任务之前未提供对整个任务的描述,则创作者201可提供对此的描述。一旦文本被编辑之后,最终文本245从创作工具200中输出,并以允许最终文本当用户期望时可被检取的适当的存储模式来存储。
图3是根据本发明的一个实施例,更详细地示出系统200如何操作的流程图。首先,创作者201启用记录组件210。这由图3中的框400指示。为此,创作者201仅启动诸如图4中所示的控件402的控件。Record(记录)按钮410可由创作者201启动以开始记录。启动Stop(停止)按钮406以停止记录。如将在以下描述,创作者201可在文本编辑期间将对用户动作的描述插入到文本编辑器240中。为此,用户启动按钮408。类似地,如以下描述的,创作者201可编辑自动生成的文本。这可通过启动图4中的Text(文本)按钮410来完成。或者,在某些实施例中,可提供附加的按钮来允许用户设置一值。这是为了允许当例如在运行时用户被要求将文本键入编辑框中的情况中生成正确的文本。当然,也可使用其它或不同的控件。
再次参考图3,一旦创作者201启用记录组件210,系统仅等待用户在用户界面205上采取动作。注意到,图2示出了该用户是创作者201,但用户也可以是不同的用户。
一旦用户在用户界面205上采取了动作(诸如,通过在用户界面上操纵控件元素)之后,挂钩组件212接收指示用户动作的消息或其它信号。如上所述,对于挂钩组件212,挂钩组件212消费该消息,并将其置于记录队列中。图3中的框412指示了用户在UI 205上采取动作。
记录组件210然后从UI自动化组件214接收图像标识信息。这由图3中的框414指示。在一个示例性实施例中,UI自动化组件214向记录组件210提供允许记录组件210记录显示屏上的表示或对应于用户在用户界面205处采取的动作的图像的多个信息项。在一个示例性实施例中,这些信息项是用户启动或以其它方式操纵的控件元素在显示屏上的位置、该控件元素的大小、以及包含该控件元素的父窗口。
记录组件210然后获取指示与用户界面205相关联的并对应于或反映由用户采取的动作的屏幕截图的实际图像信息。这由图3中的框416指示。
为了执行该步骤,记录组件210可做许多事以增强系统的操作。例如,记录组件210可确定记录比用户仅操纵的控件元素要多的实际图像信息(或实际屏幕截图)可能是有帮助的。这可能是对的,例如,如果当前在正由用户操纵的显示上存在多于一个类似的控件元素时。假定例如,用户在用户界面上点击了“OK按钮”。然而,此时在显示屏上可能存在多于一个的“OK按钮”。从而,为了去除各个“OK按钮”之中的歧义,记录组件210可获取不仅是由用户操纵的特定“OK按钮”的实际屏幕截图信息,还有围绕该“OK按钮”的所需多个像素的屏幕截图信息。这提供了具有比单单控件本身的图像更多上下文的图像。
类似地,记录组件210也可记录包含控件元素的整个父窗口的屏幕截图。当然,这包含了可用于特别标识用户操纵的控制元件的大量额外上下文。
为了确定附加的上下文是否需要由记录组件210记录,记录组件210可使用各种不同的技术中的任一个进行判断。例如,记录组件210可采用将标识要记录的上下文数量的试探法。这种试探法可基于所操纵的控件元素的大小和形状、所操纵的控件元素的特定功能、控件元素在屏幕上的位置(例如,如果控件元素位于左上角,则记录组件210可在控件元素的右下侧取得较多的像素),或试探法可仅仅反映将围绕控件元素取得的固定数量的像素,而不考虑它位于何处或控件元素执行了何种功能。
记录组件210可使用任何已知技术获取实际屏幕截图信息。例如,在大多数操作系统中,存在公开的应用程序编程接口(API)允许应用程序或其它计算组件获取当前正显示的屏幕截图信息。从而,在一个示例性实施例中,一旦记录组件210了解到它需要的屏幕截图信息的坐标、上下文信息的数量以及可任选地控件元素的父窗口之后,它简单地进行API调用以获取信息。
获取了实际图像信息之后,记录组件210对其记录以供稍后使用。这由图3的框418指示。当然,此时也注意到,记录组件210可记录由UI自动化组件214提供的其它信息。例如,UI自动化组件214示例性地向记录组件210提供控件名、控件类型、在控件上执行的动作、所执行的操纵的类型(诸如鼠标点击、鼠标滚轮旋转、键盘键击、触摸垫输入等)。这些信息均可由记录组件210记录。
根据本发明的一个实施例,文本生成组件230结合文本数据库220自动生成与所捕捉的图像相关联并与用户在用户界面205上采取的动作相关联的文本。在使用这些项的实施例中,记录组件210将所捕捉的实际图像信息发送给文本生成组件230。这由图3中的框420指示。自动生成的文本示例性地提供对应于每一用户对用户界面205的操纵的逐步指令的书面程式以便执行需要对用户界面205的多个操纵的整体任务。
以下参考图5-8描述用于自动生成文本的一个实施例。简要地,为了生成该文本,文本生成组件230可使用任何合适的方法。在一个示例性实施例中,文本生成组件230在文本数据存储220中搜索对应于从记录组件210接收的信息的条目。例如,文本数据存储220示例性地可以是包含多个条目的XML数据库,该多个条目包括由用户在用户界面205上操纵的控件或其它项的类型、动作的类型和对应于该动作的文本。当然,可使用其它数据存储方法来实现数据存储220,且数据存储220也可包含其它或不同的信息。
例如,假定从记录组件210接收的信息指示用户点击了(或以其它方式调用)“OK按钮”。然后,文本生成组件230在文本数据存储220中搜索匹配这种类型的动作的条目。一旦找到匹配,则文本生成组件230从文本数据存储220中的该条目检索描述这种类型的动作的文本。该文本例如可仅叙述“点击OK”。
在任何情况中,文本生成组件230示例性地自动生成描述在用户界面205上采取的并由记录组件210记录的用户动作的文本。这由图3中的框422指示。
所生成的文本由图2中的框235指示。在一个示例性实施例中,由记录组件210记录的图像被自动嵌入在所生成的文本235中,或至少与所生成的文本235相关联,使得它们能够在稍后的处理中彼此结合地被回调和显示。
接着,由记录组件210记录的图像数据和自动生成的文本被提供给编辑器组件240。由记录组件210记录的图像和自动生成的文本示例性地被显示在编辑器240处的显示屏上,使得创作者201可生成对应于这些图像的文本。图像和由生成组件230生成的文本的显示由图3中的框424指示。
创作者然后可修改自动生成的文本或生成新文本。这由图3中的框436指示。最后,根据期望的格式或模式输出或保存最终文本245。最终文本245可任选地包括嵌入其中的所捕捉的图像。这由图3中的框438指示。
为了设置系统200来自动生成文本,创作者通过首先打开类似于图5中所示的窗口来激活记录组件210。这里,创作者可编辑由线450和452指示的屏幕的一部分,以包含诸如正被创建的文档的标题的信息以及关于该任务的任何介绍性的信息。然而,这种信息可在稍后的编辑期间被添加到文本文档。
当系统200开始记录图像时,UI自动化组件214确定用户界面205上的可用用户界面元素。而且记录组件210使用从UI自动化组件214提供的信息在用户界面上提供关于哪个控件当前被标识为正被访问的控件的指示。对控件的高亮由图6中的参考标号454示出。
图7是根据本发明的一个实施例,更详细示出被执行以便为所接收的已记录的步骤生成文本的步骤的流程图。框460示出,与所记录的步骤相关的信息在文本生成组件230处从记录组件210接收。
一旦与所记录的步骤相关的信息由文本生成器组件230接收之后,文本生成器组件230就进而在文本数据库220中搜索匹配所接收的命令的条目。这由框462指示。在一个实施例中,文本数据库220是包含多个条目的XML数据库,其中多个条目包括控件或与之交互的其它项的类型、动作类型、控件的新状态(例如,被选中、取消选中、展开、折叠等)以及动作的相应文本。然而,可使用其它数据存储方法来保存文本。此外,其它信息可被保存在文本数据库220中。以下在表1中提供根据一个实施例的文本数据库的一部分的示例。
表1
<EnglishTemplate actionTypeID=″value″
controlTypeID=″check box″ActionText=″Select″
specialValueID=″checked″>
<Sentence>Select the<tag id=″1″></tag>
checkbox</Sentence></EnglishTemplate>
<EnglishTemplate actionTypeID=″invoke″
controlTypeID=″button″ActionText=″Click″>
<Sentence>Click<tag
id=″1″></tag></Sentence></EnglishTemplate>
<EnglishTemplate actionTypeID=″invoke″
controlTypeID=″list item″ActionText=″Double-click″>
<Sentence>In the<tag id=″2″></tag>list,double-
click<tag id=″1″></tag></Sentence></EnglishTemplate>
<EnglishTemplate actionTypeID=″expand_collapse″
controlTypeID=″tree item″ActionText=″Expand″
specialValuelD=″expanded″>
<Sentence>Click the minus sign next to<tag
id=″1″></tag>to collapse
it</Sentence></EnglishTemplate>
例如,假定从记录组件接收到的命令的信息是:动作类型=″调用″(action type=“invoke”),控件类型=″按钮″(control type=“button”),控件名=″点击OK″(control name=“click OK”),则文本生成组件230在文本数据库220中搜索并找到匹配该信息的条目。然后它从该条目中检索对应于″点击OK″(click OK)的文本。在框464处示出对与所匹配的条目相关联的文本的获取。
在记录所注意的步骤期间,如果创作者通过选择图4中所示的用户界面402上的用户动作(action)按钮408来指定该步骤为用户动作步骤,或者如果文本数据库220中的条目指示该动作是用户动作,则文本生成组件230在一个实施例中可提示创作者向所获取的文本添加对该动作的描述。这在框466处示出。创作者然后可在框468处提供所需文本。然而,创作者可忽视该步骤并在稍后编辑阶段期间添加信息。任何添加的文本在框470处被添加到文本235。
如果不需要任何用户动作,或已经由创作者提供了必要的用户动作信息,则文本生成器230将新获取的文本添加到文本文档。这在框472处示出。
在图8中由参考标号474-486示出了所生成的文本的示例。该文本向用户提供用于所期望的任务的逐步指令。该文本可如参考文本数据库220和文本生成组件230所描述的或根据允许从所接收的输入命令中自动生成文本的任何方法来生成。自动生成的文本以及所捕捉的图像然后可呈现给创作者用于编辑。
图9是示出所捕捉的图像和自动生成的文本两者均可在编辑器240处向创作者201显示的一种方式的屏幕截图。图9包括与本发明相关的两个主要部分。第一部分包括文本显示部分426,第二部分包括图像显示部分428。文本显示部分426显示可任选自动生成的文本235或由创作者201创作的文本。图像显示部分428显示由记录组件210记录的所捕捉的屏幕截图。
在自动生成文本的实施例中,该文本在显示部分426中在235处示出,它可由创作者使用编辑器组件240来编辑(其一个屏幕截图在图9中示出)。因此,创作者可高亮显示部分426上显示的动作或其它项中的每一个。与高亮项相关联的图像在显示部分428中显示。因此,在图9中所示的实施例中,创作者高亮了对应于启动Accessibility Options(可访问性选项)控件的动作编号2,相应的图像在显示部分428中显示。用户然后可按需输入文本或修改文本,以便获得对由用户在用户界面205处执行的步骤的完全描述。在图9中所示的实施例中,用户启动了用户界面205上的Accessibility Option控件430。可见,记录组件210不仅获取了对应于Accessibility Options控件的控制框430,还获取了包含围绕Accessibility Option按钮430的多个像素的更大的上下文框432。上下文框432显示了围绕AccessibilityOptions控件430的额外的上下文,使得它可在屏幕上更容易地被定位。
图9也示出了记录组件210已经获取了包含Accessibility Options控件430的父窗口434。从而,创作者可精确地看见哪个控件由用户在用户界面205上操纵,以及该控件驻留在其父窗口上的何处。这极大地协助了创作者生成或修改描述用户界面上所采取的动作的文本。
可以理解,可按照各种不同方式使用如这里所述的本发明。例如,本发明可用于生成内容(诸如,帮助内容),其中所捕捉的图像嵌入在文本或帮助文本内。对此的一个示例在图10中示出。可见,处理中的每一步不仅包含描述做什么来完成该步骤的文本,还包含指示将在何处执行该步骤的视觉图像。在此实施例中,本发明被用于在文本中生成嵌入的图像,最终文本245与所嵌入的图像一起输出。这由图4的可任选框438指示。
然而,本发明不必用于将图像嵌入到文本中。相反,本发明可仅用于向创作者显示所捕捉的图像,其中创作者正生成对所采取的并对其捕捉图像的步骤的书面描述。例如,创作者可能正生成描述修理病毒或将其从计算机移除的处理的文本。创作者可能不希望在该文本中包括嵌入的图像。在这种情况中,仅显示图像,可任选地,也向创作者显示自动生成的文本,创作者可从草稿中生成文本,或者,在提供了自动生成的文本的实施例中,创作者也可修改自动生成的文本。
在任何情况中,最终文本245将示例性地以最终发布内容的任何模式来创建,或被转换成该模式。这种模式可以是,例如,Microsoft Assistance标记语言(MAML)、HTML或某种其它的XML格式。
图11是用于生成描述用户为在两个不同的系统上(或具有两种不同配置的系统上)执行一任务所采取的步骤的内容(诸如,最终文本245)的系统500的框图。如发明背景中所述的,现有的用于生成内容以描述用户为执行整体任务而采取的步骤的系统遭受如下的事实:执行任何给定任务所必须采取的步骤可能会基于执行任务的计算机的配置而改变。
从而,即使捕捉了指示要执行的步骤的图像,且即使自动或手动生成了描述这些步骤的文本,但基于由计算机运行的特定操作系统或基于计算机系统配置中的任何其它差异,步骤仍可能改变。事实上,如果操作系统的版本号或由计算机运行的其它软件不同,所需步骤甚至也可能不同。当然,配置中的大量其它差异也可使执行给定任务所需的步骤不同。例如,对于机器的不同状态,用户界面可有所不同。作为示例,取决于计算机是位于网络域上还是位于工作组上,连接至远程机器的用户界面步骤的顺序可能有所不同。
从而,为了自动记录执行给定任务所需的步骤,图2中所示的记录系统应记录以该内容旨在供使用的以所有不同配置来配置的机器上的步骤。记录在所有这些不同配置上的所记录的用于执行任务的步骤随后应当被组合成一个描述如何在不同配置下执行该任务的整体内容集。可任选地,最终向用户显示该内容的系统将检测用户系统的配置,并仅显示相关的内容(例如,仅与最终用户相关的那些步骤)。
因此,系统500示出第一计算机502和第二计算机504,它们各自包括诸如图2中所示的记录系统200。计算机502示例性地根据此处指定为配置A的第一配置来配置。另一方面,计算机504根据此处指定为配置B的第二配置来配置。
配置A和B可以是影响执行任何给定任务所需的步骤的任何类型的不同配置,这些步骤将被存储并对此创作内容。从而,作为示例,配置A可以是位于网络域上的计算机,而配置B是位于工作组上的计算机。类似地,配置A可以是运行在第一操作系统上的计算机,而配置B是运行在第二操作系统上的计算机。类似地,配置A可以是操作在操作系统的一个版本上的计算机,而配置B是操作在同一操作系统的不同版本上的计算机。除此之外,按照内容创作者的期望也可使用其它不同的配置。当然,也应注意,计算机502和504实际上可以是不同的计算机或安装在虚拟机上的计算机。
图11中所示的记录系统200可类似于图2中所示的记录系统,且相应地对其标号。然而,如将在以下更详细描述,在仅需要一个自动文本生成部分207的情况下,自动文本生成部分207可被部署在创作计算机506上。
计算机502和504示例性地被连接至创作计算机506。创作计算机506示例性地包括导入器机制508和内容编辑器组件(诸如参考图2描述的编辑器组件240)。
创作计算机506示例性地可以是计算机502或504中的任一个,或者是不同的计算机。类似地,计算机506可运行在与计算机502和504之一相同的操作系统上,或运行在不同的操作系统上。此外,如上所述,编辑器组件240可配备自动文本生成系统207,或它可仅仅是参考图2所述的编辑器组件240。
操作中,计算机502和504上的记录系统200允许用户在与计算机502和504中的每一个相关联的用户界面上执行任务,而记录系统200记录并存储被采取以执行所需任务的用户界面步骤。记录系统200因此如上所述示例性地记录对应于用户所采取的动作的屏幕截图,也可任选地自动生成对应于这些图像的文本。
记录系统200然后示例性地将所记录的步骤格式化成可由导入器组件508接受的格式。例如,计算机502上的记录系统200将示例性地记录用户在计算机502的用户界面上为执行给定任务而进行的一连串步骤,并根据一XML格式将所记录的这些步骤格式化成所记录的片段A(也由标号510指定)。类似地,计算机504上的记录系统200将示例性地记录步骤,并根据一XML格式将它们格式化成所记录的片段B(也由标号512指定)。
所记录的片段510和512然后由计算机502和504提供给导入器组件508。导入器组件508被示为位于计算机506上,但当然可以理解,导入器组件508可以是使功能分布在系统500中所示的各个计算机之中,或与所有这些计算机分离驻留,或安置在除计算机506以外的计算机之一上的组件。在任何情况中,导入器组件508可以是用于接收所记录的片段510和512并将其提供给编辑器组件240以便向用户呈现的任何合适的导入机制。
导入器组件508示例性地在记录计算机506上存储所记录的片段510和512,并以各种不同方式之一将它们导入到编辑器组件240中。例如,这可通过经由共享目录导入片段510和512来完成。类似地,这可通过将所记录的片段510和512存储到磁盘或另一外部存储器设备上来完成,其中该外部存储器设备物理上被运送至计算机506,在那里片段510和512被加载到编辑器组件240。类似地,可远程使用计算机506来操作计算机502和504,然后计算机506可将所记录的片段510和512存储在可由计算机506访问的剪贴板或其它共享的应用程序空间上。这样的共享空间的一个实施例是由华盛顿州雷德蒙市的微软公司提供的WindowsClipboard系统。
在使用共享应用程序空间来提供片段510和512的实施例中,计算机506从共享的应用程序空间中读取片段510和512,并将其导入到编辑器组件240内。例如,在使用Windows Clipboard应用程序空间的实施例中,一种同样由华盛顿州雷德蒙市的微软公司提供的被称为远程桌面(Remote Desktop)的程序允许在远程与本地计算机之间(诸如在计算机502和504与计算机506之间)共享剪贴板空间。
在任何情况中,导入器组件508用于将所记录的片段510和512导入至编辑器组件240内。在计算机502和504上的记录系统200包括自动文本生成系统270的实施例中,所记录的片段510和512将包括自动生成的文本。或者,文本可在编辑器组件240处自动或手动生成。
编辑器组件240向用户显示片段510和512,并因此允许由用户插入适当的条件。例如,图11中所示的最终文本245的实施例示出了:当用户已经插入了条件语句514和516之后,所记录的片段510和所记录的片段512被插入整体文本245中。条件语句514例如是“条件:If配置A,then:”。这指示,如果该计算机以配置A配置,则将向用户显示或自动执行由所记录的片段510指示的步骤。
条件516陈述“条件:If配置B,then:”。这指示,如果该计算机根据配置B配置,则将向用户显示或执行由所记录的片段512所指示的步骤。
当然,也可理解,创作者也可按照任何期望的方式删除或修改文本。这可通过在编辑器组件210上使用常规编辑技术来完成。
表2示出了由来自两个不同配置的记录形成的示例性XML文档。这两个XML片段被记录在其一运行在网络域上另一运行在网络工作组上的计算机上。注意,condition=″Network_connection:domain″属性被标记以处理用于判断运行哪一片段的if-then逻辑。
表2<task>
<title>Add a new user to the computer</title>
<introduction>When you add a user to your computer,you are allowing thatindividual to have access to files and programs on your computer.</introduction>
<commandStep>
<command>control.exe userpasswords</command>
<description>Open User Accounts in Control Panel</description>
</commandStep>
<!-***这部分是位于网络域上的机器上的记录器***--/>
<stepGroup condition=″Network_connection:domain″>
<uiActionsStep><actionRef id=″0″/><actionRef id=″1″/>
<description>On the <ui>Users</ui> tab,click Add</description>
</uiActionsStep>
<uiActionsStep><actionRef id=″2″/>
<description>Follow the instructions in the wizard to add a new
user</description>
</uiActionsStep>
</stepGroup>
<!-***这部分是位于工作组上的机器上的记录器***-/>
<stepGroup condition=″Network_connection:workgroup″>
<uiActionsStep><actionRef id=″3″/>
<description>Click<ui>Create a new account</ui></description>
</uiActionsStep>
<uiActionsStep><actionRef id=″4″/>
<description>Type a name for the new user account</description>
</uiActionsStep>
<uiActionsStep><actionRef id=″5″/>
<description>Click Next</description>
</uiActionsStep>
<uiActionsStep><actionRef id=″6″/>
<description>Click either Computer Administrator or Limited
depending on the type of account you want to assign the new
user</description>
</uiActionsStep>
<uiActionsStep><actionRef id=″7″/>
<description>CIick create</description>
</uiActionsStep>
</stepGroup></task>
因此,可见本发明允许创作者在不同配置下的不同机器上记录所有或部分宏(或执行给定任务的另一连串步骤),然后在一个创作机器上组装所记录的片段以得到最终内容。这允许宏被记录在不同机器上,但主创作步骤可在一个位置处执行。这使得内容的创作相比现有系统而言较不昂贵和复杂,并更高度自动化。
尽管参考特定实施例描述了本发明,但本领域的技术人员将认识到,可对形式和细节进行改变,而不背离本发明的精神和范围。