CN101432733A - 利用来自搜索的所检索数据来增加电子文档的内容 - Google Patents
利用来自搜索的所检索数据来增加电子文档的内容 Download PDFInfo
- Publication number
- CN101432733A CN101432733A CNA2007800152587A CN200780015258A CN101432733A CN 101432733 A CN101432733 A CN 101432733A CN A2007800152587 A CNA2007800152587 A CN A2007800152587A CN 200780015258 A CN200780015258 A CN 200780015258A CN 101432733 A CN101432733 A CN 101432733A
- Authority
- CN
- China
- Prior art keywords
- search
- data
- electronic document
- matched
- search criterion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
描述了利用来自搜索的数据来增加电子文档的内容。数据的增加包括:从电子文档读取搜索标准,其中电子文档的一部分包括搜索标准:检索匹配于搜索标准的数据;以及利用所检索的数据来增加内容。
Description
技术领域
本发明一般地涉及软件,以及更具体地,涉及用于将数据合并至电子文档的方法和系统。
背景技术
当前,将包括电子文档的内容手工输入至电子文档,并且对于将存储在电子文档以外的外部内容进行合并来说,电子文档能力有限。例如,邮件合并是在多种文字处理应用中存在的典型功能,其可以用以创建诸如邮件标签和信件的电子文档。尤其是,邮件合并可用以从在结构化数据源外部存储的单一模板和信息来生成多个文档。为了在邮件合并中添加与结构化数据源相关联的信息,将与和结构化数据源相关联的列和/或行的名称相对应的字段放置到电子文档中。结构化数据源的列和行包括所请求的信息。当执行邮件合并时,文字处理应用主要通过利用来自结构化数据源的相匹配列和/或行的值来替换在电子文档中的列和/或行的名称,从而创建输出文档。
在另一示例中,数据合并是在与可变数据打印相关联的电子文档中存在的另一典型功能。可变数据打印是一种打印类型,其中从在结构化数据源中存储的可变信息以及单一模板的组合来创建电子文档(例如,账单、目录和大量邮件发送)。类似于邮件合并,为了添加与结构化数据源相关联的信息,置于电子文档中的字段由来自结构化数据源的相匹配字段的值来替换。
简单地将值替换到电子文档中限制了将外部内容合并至电子文档。例如,电子文档仅可以将来自一个指定结构化数据源的数据进行合并。此外,在用户手工运行邮件或者数据合并功能之前,不能刷新或者重新加载合并到电子文档之中的信息。由此,在电子文档上显示的所合并信息可能不是最新的。邮件或者数据合并的另一限制在于,电子文档的所替换的值和布局是静态的。换言之,电子文档的内容和布局是固定的。例如,不能将电子文档的已合并信息和呈现定制为个人偏好。
从上文看来,需要进一步改进到电子文档的数据合并。
附图说明
在下文的详细描述和附图中公开了本发明的各种实施方式。
图1A和图1B是根据各种实施方式的可以检索与一个或者多个搜索标准相匹配的数据的示例性的所呈现电子文档的图示。
图2是根据一个实施方式的适用于处理电子文档的示例性计算机系统的简化框图。
图3是根据一个实施方式的用于处理电子文档的示例性系统的简化框图。
图4是根据一个实施方式的用于处理电子文档的示例性方法的高级概览的流程图。
图5是根据一个实施方式的用于检索与搜索标准相匹配数据的示例性方法的流程图。
图6是根据一个实施方式的可以由电子文档处理应用搜索的示例性计算机系统的简化图示。
图7是根据另一实施方式的用于检索与搜索标准相匹配的另一示例性方法的流程图。
图8是根据一个实施方式的使用搜索应用来搜索与搜索标准相匹配的数据的电子文档处理应用的简化图示。
图9是根据一个实施方式的基于可定制检索设置来检索数据的示例性方法的流程图。
图10是根据一个实施方式的用于过滤数据的示例性方法的流程图;以及
图11是根据一个实施方式的用于变换和格式化所检索数据的示例性方法的流程图。
具体实施方式
可以以多种方式来实现本发明的各种实施方式,包括作为系统、处理、装置或计算机可读介质(诸如,计算机可读存储介质或者其中程序指令通过光学或者电子通信链路进行发送的计算机网络)上的一系列程序或者计算机指令。通常,除非在权利要求书中另行提出,否则可以以任何顺序来执行所公开的处理操作。
在下文中随附图一起提供了对一个或者多个示例的详细描述。结合此类示例提供了详细描述,然而其并不局限于任何特定实施方式。仅由权利要求书来限定本发明的范围,并且其中包含多个备选、修改和等效设置。在下文的描述中阐明了多个具体细节,以便提供彻底的理解。出于示例目的而提供这些细节,并且可以在不具备某些或者全部具体细节的情况下根据权利要求书来实现所描述的实施方式。为了清楚起见,没有描述实施方式所涉及技术领域中的已知技术资料以避免不必要地混淆描述。
在此描述的实施方式提供了利用来自搜索的所检索数据来增加电子文档内容的方法和系统。通常,可以使用在电子文档中存储的搜索标准来从外部源(即,电子文档以外的源)检索数据。在下文中将更详细地进行解释,在一个实施方式中,电子文档处理应用可以通过搜索外部源上的数据来检索与搜索标准相匹配的数据。由此,可以利用检索的数据来增加电子文档的内容。
图1A和图1B是根据各种实施方式的可以检索匹配于一个或者多个搜索标准的数据的示例性的所呈现电子文档的图示。图1A的电子文档100包括区域102和104,其配置以显示匹配于一个或者多个搜索标准的数据。应该理解,电子文档100是以可由计算机技术访问的电子格式存在的文档。例如,电子文档100可以是这样一种文件,即其是不可执行文件,并且包括用于由计算机程序使用的数据。示例性电子文档100可以包括可由电子文档处理应用(诸如,文字处理应用、文档查看器、电子邮件应用、呈现应用、电子表应用、图表应用、图形编辑器、图形查看器、企业应用以及其他应用)访问和/或与该电子文档处理应用相关联的单一或者多个文件。由此,电子文档100的内容可以包括文字数字文本、符号、图像、视频、声音、格式化信息以及其他数据。与电子文档100相关联的文件可以为便携性而设计。结果,在一个实施方式中,与电子文档100相关联的单一文件可以封装电子文档的完整描述。在另一个实施方式中,与电子文档100相关联的多个文件可以封装电子文档的描述。
电子文档100可以具有多种文件格式,并且该文件格式可以由电子文档内部的数据来标识和/或由文件名扩展来标识。关联于电子文档100的示例性文件格式包括Adobe便携文档格式(PDF)、微软DOC格式、超文本标记语言(HTML)格式、可扩展标记语言(XML)格式、微软XLS格式、标签图像文件格式(TIFF)、以及可以与电子文档相关联的其他文件格式。
此外,电子文档100或者与电子文档相关联的一个或者多个文件可以配置以存储一个或者多个搜索标准。换言之,搜索标准可以连同电子文档100的其他内容被嵌入,并且由此,内容的一部分可以包括一个或者多个搜索标准。如在下文中更详细解释,搜索标准配置用于输入至电子文档处理应用之中,该电子文档处理应用配置以检索匹配于搜索标准的数据。搜索标准(或者搜索查询)不是链接。而是,搜索标准可以包括可用于搜索的多个文字数字字符以及符号。例如,搜索标准可以包括文本、关键字、查询语言、句子、数字、短语、问题、等式以及其他合适的搜索标准。如在此使用,应该注意,术语“搜索标准”和“搜索查询”可以互换地使用。
如图1A中所示,所呈现的电子文档100包括区域102和104,所述区域配置以显示匹配于一个或者多个搜索标准的数据。搜索标准存储在与电子文档100相关联的一个或者多个文件中,并且当电子文档被打开或者被访问时,可以读取搜索标准。在读取搜索标准之后,如图1B中所示,检索匹配于搜索标准的数据并将其呈现在区域102和104中。应该注意,呈现处理将用于输出的电子文档的内容(例如,视频、音频、文字数字文本以及其他内容)转换至从计算设备向用户呈现内容的输出设备。示例性输出设备包括:扬声器、视频显示器、打印机以及其他输出设备。在图1B示出的示例性呈现的电子文档100中,检索匹配于搜索标准的图像并将其呈现在区域102中。另外,检索匹配于搜索标准的文本并将其呈现在区域104中。电子文档100可以包括各种其他内容。例如,除了图1B的文本和图像以外,当电子文档100被打开时,还可以检索声音并将其在声音扬声器上呈现。
图2是根据一个实施方式的适用于处理电子文档的示例性计算机系统的简化框图。在某些实施方式中,计算机系统200可用以实现计算机程序、逻辑、应用、方法、进程或者其他软件,以便处理电子文档。示例性计算机系统200包括台式计算机、服务器、便携式计算设备、个人数字助理、装置内部的计算引擎、以及其他计算机系统。如图2中所示,计算机系统200包括将子系统与设备进行互联的总线202或者用于传送信息的其他通信机制,其中所述设备诸如处理器204、系统存储器206(例如,随机访问存储器(RAM))、存储设备208(例如,只读存储器(ROM)、磁盘驱动器、光盘驱动器、以及其他存储设备)、通信接口212(例如,调制解调器或者以太网卡)、显示器214(例如,阴极射线管(CRT)或者液晶显示器(LCD))、输入/输出设备216(例如,键盘)以及光标控制器218(例如,鼠标或者轨迹球)。
在某些实施方式中,当执行存储在系统存储器206中的一个或者多个程序指令的一个或者多个序列时,计算机系统200由处理器204执行特定操作。此类程序指令可以从诸如存储设备208的另一计算机可读介质读入系统存储器206。在某些实施方式中,硬布线电路可以代替软件程序指令或者与软件程序指令结合以实现本发明的实施方式。
应该理解,术语“计算机可读介质”是指参与向处理器204提供程序指令用于执行的适合介质。此类介质可以采取多种形式,包括但不限于非易失性介质、易失性介质以及传输介质。非易失性介质可以包括例如光盘或者磁盘,诸如存储设备208。易失性介质可以包括动态存储器,诸如系统存储器206。传输介质包括同轴电缆、铜线、以及光纤,其中包括包含总线202的线缆。传输介质还可以采取声波或者光波的形式,诸如在无线电波和红外数据通信期间所生成的那些。计算机可读介质的常规形式包括例如,磁性介质(例如,软盘、柔性盘、硬盘、磁带以及其他磁性介质)、光介质(例如,压缩盘只读存储器(CD-ROM)以及其他光学介质)、具有图案的物理介质(例如,穿孔卡片、纸带以及其他物理介质)、存储器芯片或者盒式磁带、载波(例如,RAM、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、闪存以及其他存储器芯片或者盒式磁带)、以及计算机可以进行读取的任何其他介质。
在某些实施方式中,可以由单一计算机系统200来实现用以实现实施方式的程序指令序列的执行。在其他实施方式中,由通信链路220(例如,局域网(LAN)、公共交换电话网络(PSTN)、无线网络以及其他通信链路)耦合的两个或者更多计算机系统(诸如,计算机系统200)可以执行程序指令序列,以便彼此协作地实现实施方式。另外,计算机系统200可以通过通信链路220和通信接口212来传输和接收消息、数据和指令,包括程序(即,应用代码)。在已接收和/或存储在存储设备208或者其他非易失性存储设备中用于以后执行时,所接收的程序指令可以由处理器204执行。
图3是根据一个实施方式的用于处理电子文档的示例性系统的简化框图。如图3中所示,电子文档处理应用308可以驻留在计算机系统200上。在图3的实施方式中,电子文档处理应用308包括数据检索模块302、过滤模块304以及变换和格式化模块306。应该理解,在其他实施方式中,电子文档处理应用308可以包括比图3中所示更少或者更多的模块。例如,在另一实施方式中,电子文档处理应用308包括数据检索模块302以及变换和格式化模块306,但不包括过滤模块304。
数据检索模块302配置以从电子文档(或者与电子文档相关联的一个或者多个文件)读取搜索标准,并且检索匹配于搜索标准的数据。如在下文中详细解释,在一个实施方式中,数据检索模块302可以通过搜索并且获取匹配于检索标准的数据来检索数据。在另一实施方式中,数据检索模块302可以通过将搜索标准传输至搜索应用来检索数据,该搜索应用配置以搜索匹配于检索标准的数据。
在数据检索模块302检索到匹配于搜索标准的数据之后,过滤模块304可以基于可以在电子文档中存储的一个或者多个过滤标准来过滤数据。在过滤模块304过滤数据之后,在一个实施方式中,变换和格式化模块306将匹配于搜索标准的数据进行变换和/或格式化以用于输出。
图4是根据本发明一个实施方式的用于处理电子文档的示例性方法的高级概览的流程图。在电子文档中可以存储一个或者多个搜索标准,并且如图4中所示,在操作402中,将搜索标准从电子文档中读出。换言之,一个或者多个搜索标准可以存储在与电子文档相关联的一个或者多个文件中,并且操作402从与电子文档相关联的一个或者多个文件中提取或者读取搜索标准。如在此所使用,应该注意在从电子文档中读取或者提取信息的上下文中,术语“读取”和“提取”可以互换使用。
在读取或者提取搜索标准之后,在操作404中检索匹配于搜索标准的数据。如在下文中更详细地解释,在一个实施方式中,电子文档处理应用可以搜索并且获取匹配于搜索标准的数据。在另一个实施方式中,电子文档处理应用可以将搜索标准传输至搜索应用,该搜索应用配置以搜索匹配于搜索标准的数据。
在搜索应用找到数据之后,电子文档处理应用从搜索应用接收数据,并且在操作406中,利用所检索的数据来增加电子文档的内容。内容增加可以包括将所检索数据添加至电子文档的原始内容。由此,呈现用于输出的电子文档内容可以包括原始内容和所检索数据。内容增加还可以包括利用所检索数据来更新或者替换一部分电子文档原始内容。
数据检索
图5是根据一个实施方式的用于检索匹配于搜索标准的数据的示例性方法的流程图。在图5示出的实施方式中,在电子文档处理应用从电子文档读取搜索标准之后,在操作502中,电子文档处理应用可以搜索匹配于搜索标准的数据。如在下文中更详细地解释,文档处理应用可以在主管文档处理应用的计算机系统以及与文档处理应用通信的其他计算机系统上搜索数据。在找到匹配于搜索标准的数据之后,在操作504中获取数据。
图6是根据本发明一个实施方式的可以通过电子文档处理应用来进行搜索的示例性计算机系统的简化图。如图6中所示,计算机系统200正在主管电子文档处理应用308,并且电子文档处理应用可以与关联于计算机系统200的计算机可读介质612进行通信或者对其进行访问。结果,电子文档处理应用308可以搜索匹配于搜索标准的数据,所述搜索标准存储在与计算机系统200相关联的计算机可读介质612(例如,磁盘、光盘、存储器以及其他计算机可读介质)上。另外,电子文档处理应用308可以与计算机网络进行通信,该计算机网络可以包括局域网(LAN)604以及因特网602,并且该电子文档处理应用308可以与直接链接至计算机系统200的计算机系统606进行通信。由此,电子文档处理应用308可以搜索匹配于搜索标准的存储在与计算机系统606相关联的计算机可读介质之上的数据,该计算机系统606直接与计算机系统200进行通信以及与关联于LAN 604和因特网602的计算机系统进行通信。
电子文档处理应用308可以从在计算机可读介质(诸如,计算机可读介质612)上存储的数据结构或者数据集合搜索数据。可以搜索的示例性数据集合包括数据库、音频文件、视频文件以及与电子文档相关联的文件(例如,图像文件、电子表、文字处理文档、电子邮件以及其他电子文档)。此外,电子文档处理应用308可以与因特网602通信,并且应该理解,因特网是使用一个或者多个协议(例如,因特网协议(IP))来进行通信的互联计算机网络的集合。在使用超文本传输协议(HTTP)的万维网(WWW)以外,因特网602包括多种其他协议子网。示例性协议子网包括电子邮件(例如,简单邮件传输协议(SMTP)和邮局协议(POP))、因特网中继聊天(IRC)、即时消息传送(IM)、文件传输协议(FTP)、网络新闻讨论组以及其他协议子网。由此,还可以搜索与因特网602相关联的数据集合。在一个示例性实施方式中,电子文档处理应用308可以为匹配于搜索标准的数据搜索因特网的Web页面。在另一示例性实施方式中,电子文档处理应用308可以为匹配于搜索标准的数据在因特网602上搜索即时消息传送服务之间传输的消息。在又一示例性实施方式中,电子文档处理应用308可以为匹配于搜索标准的数据搜索来自Web站(例如,真正简单聚合(RSS)源)的Web源(Web feed)。
电子文档处理应用308可以使用多个已知搜索算法来搜索匹配于搜索标准的数据。字符串搜索算法是一种示例性搜索算法,该算法在字符串内搜索模式。另一示例性搜索算法可以使用对象分段和统计建模来搜索匹配于搜索标准的图像。其他示例性搜索算法包括使用试探法来对搜索空间进行搜索。
仍然参考图6,在一个实施方式中,在找到匹配于搜索标准的数据之后,电子文档处理应用308可以从一个或者多个源(诸如,计算机系统606、与LAN 604、因特网602相关联的计算机系统、以及主管电子文档处理应用的计算机系统200)获取数据。在另一实施方式中,如果在主管电子文档处理应用308的计算机系统200中已经高速缓存了数据,则电子文档处理应用可以从主管电子文档处理应用的计算机系统获取被高速缓存数据的副本,而不是从源重新获取数据。
在一个实施方式中,电子文档处理应用308可以周期性地检索匹配于搜索标准的数据。例如,可以以规则的间隔检索或者刷新数据。在另一实施方式中,当电子文档打开时,电子文档处理应用308可以自动检索数据。在又一实施方式中,当电子文档打开时,电子文档308可以自动检索数据,并且也是周期性的。例如,当电子文档打开时,可以自动检索数据。由此,当电子文档打开时,电子文档处理应用308进行检索,并且利用匹配于搜索标准的最新数据来增加电子文档的内容。在电子文档打开后,可以以规则的间隔更新数据。电子文档处理应用308还可以根据用户请求来检索匹配于搜索标准的数据。在一个示例性实施方式中,电子文档处理应用308可以响应于用户输入来检索匹配于搜索标准的数据。示例性用户输入包括:在图形用户界面的区域上点击(例如,在刷新按钮上点击)、键盘输入以及其他用户输入。
图7是根据另一实施方式的用于检索匹配于搜索标准的数据的另一示例性方法的流程图。除了自己搜索匹配于搜索标准的数据之外,如在操作702中所示,电子文档处理应用可以将搜索标准传输至搜索应用。如在下文中更详细地解释,搜索应用配置以针对匹配于搜索标准的数据进行搜索。在找到匹配于搜索标准的数据之后,在操作704中,电子文档处理应用从搜索应用接收数据。
图8是根据一个实施方式的对搜索应用进行访问以搜索匹配于搜索标准的数据的电子文档处理应用的简化图示。如图8中所示,计算机系统200主管电子文档处理应用308,并且电子文档处理应用与在计算机系统804上驻留的搜索应用802进行通信。电子文档处理应用308向搜索应用802向搜索应用传输搜索标准,并且搜索应用配置以搜索匹配于搜索应用的数据。
搜索应用802可以与计算机网络(可包括LAN 604和因特网602)进行通信,并且与直接链接至计算机系统804的计算机系统606进行通信。结果,搜索应用802可以在计算机网络和计算机系统606上搜索匹配于搜索标准的数据。例如,为了搜索数据库,电子文档处理应用308可以以数据库查询语言(例如,结构化查询语言(SQL))的形式将搜索标准传输至搜索应用802。搜索应用802可以是数据库管理系统,其配置以管理数据库并且对客户端(诸如,电子文档处理应用308)请求的数据运行操作。示例性数据库管理系统包括微软SQL服务器、IBM DB2、Sybase SQL服务器以及其他数据库管理系统。搜索应用802可以在与计算机系统804相关联的计算机可读介质806上存储的数据库中搜索匹配于所述标准的数据。搜索应用802还可以在计算机系统606中和LAN 604上存储的数据库中搜索数据。
在一个实施方式中,电子文档处理应用308可以通过将搜索标准传输至与搜索应用相关联的应用程序接口(API)来访问搜索应用802的功能。应该理解,电子文档处理应用308可以与关联于各种搜索应用(诸如,搜索应用802)的API进行通信,以便访问搜索应用的所述功能性。例如,为了搜索在Web上的Web页面中存储的数据,电子文档处理应用308访问配置用于搜索因特网602的搜索应用802(例如,因特网搜索引擎)。为了访问搜索应用802,电子文档处理应用308可以远程连接至关联于搜索应用的API服务。可以使用简单对象访问协议(SOAP)、HTTP或者其他通信协议来进行通信。API服务提供对搜索应用802的查询访问,由此允许电子文档处理应用308来搜索因特网602上的Web页面,并且接收匹配于来自搜索应用的搜索标准的数据或者通往所述数据的链接。例如,电子文档处理应用308可以以关键字的方式来传输搜索标准,例如,传输至与搜索应用802相关联的API服务。搜索应用802通过已编译的Web页面索引来搜索匹配于搜索标准的数据。此后,搜索应用802传输一个或者多个通往匹配于搜索标准的Web页面的链接。然后,电子文档处理应用308可以通过所接收的链接访问Web页面,并且从Web页面获取数据。
在另一示例中,电子文档处理应用308可以通过访问与商业服务相关联的API来搜索因特网602上的产品信息。例如,为了访问关联于商业Web站上的产品的信息(例如,价格、数量、运输信息、产品图像、客户信息以及其他产品信息),电子文档处理应用308可以通过API来与关联于商业Web站的搜索应用802进行通信。在此,搜索应用802配置以搜索在该商业Web站上列出的出售产品相关联的信息。可以通过SOAP以及其他通信协议来访问搜索应用802和与搜索应用相关联的API。借助通过API来与搜索应用802进行通信,电子文档处理应用308可以从存储在商业Web站上的产品信息搜索数据。
图9是根据一个实施方式的用于基于可定制的检索设置来检索数据的示例性方法的流程图。在电子文档中可以存储多个搜索标准,并且每个搜索标准可以直接用于不同用途。由此,每个搜索标准可以根据用户所提供的检索设置来进行不同的检索。检索设置可以存储在电子文档中,如图9中所示,在操作950中,初始地从电子文档中读取检索设置。
检索设置指定选择一个或者多个搜索标准,并且可以包括如下运算符,诸如比较运算符、数学逻辑运算符、引用运算符、条件以及与选择搜索标准相关联的其他运算符。例如,检索设置可以向电子文档的每个用户分配一部分搜索标准(或者搜索标准的子集)。换言之,一个或者多个搜索标准可以关联于单独的用户。在另一示例中,检索设置可以对日期和时间指定一部分搜索标准。另一示例性检索设置可以将一部分搜索标准与电子文档的位置相关联。
在读取检索设置之后,在操作952中基于检索设置来选择一部分搜索标准,并且在操作954中,检索匹配于所选择搜索标准的数据。结果,通过使用检索设置,用户可以操纵对搜索标准的选择以及对数据的检索。例如,搜索标准的不同部分可以选择用于电子文档的不同用户或者读者。由此,可以基于单独的用户偏好来检索不同数据。另一示例可以包括,根据在何时以及在何处访问电子文档来选择搜索标准的不同部分。例如,在早晨,电子文档处理应用可以检索与新闻相关联的数据,并且在工作时间期间检索与工作相关联的数据。
在检索到数据之后,利用所检索的数据来增加与电子文档相关联的内容。如上所述,增加包括向电子文档的原始内容添加所检索的数据,或者更新一部分原始内容。例如,可以检索匹配于搜索标准的视频并且将其添加至电子文档的内容。在另一示例中,可以利用从外部源检索的文字数字文本来对原始内容中包括的一部分文字数字文本进行更新和替换。
过滤
图10是根据一个实施方式的用于过滤数据的示例性方法的流程图。如上所述,在电子文档中可以存储一个或者多个搜索标准。另外,在一个实施方式中,电子文档中还可以存储一个或者多个过滤标准。如图10中所示,在操作902中,从电子文档中读取搜索标准和过滤标准。过滤标准可以是由电子文档处理应用用来处理数据的一组标准。示例性过滤标准可以包括字段引用、运算符(例如,比较运算符、数学逻辑运算符、引用运算符、条件以及其他运算符)、常数、以及其他过滤标准。在一个实施方式中,电子文档处理应用可以使用过滤标准来减小为用于输出而呈现的数据或者内容。例如电子文档处理应用可以使用过滤标准来缩小最具相关性的所检索数据的范围。在另一示例性实施方式中,电子文档处理应用可以使用过滤标准来通过相关性将数据进行分类。
在读取或者提取搜索标准和过滤标准之后,如上所述,在操作904中检索匹配于搜索标准的数据。其后,在操作906中,针对是否从电子文档中读取一个或者多个过滤标准来做出决定。如果没有从电子文档读出过滤标准或者在电子文档中没有存储过滤标准,则不对匹配于搜索标准的数据进行过滤。另一方面,如果读取了过滤标准,则在操作908中基于该过滤标准来过滤匹配于搜索标准的数据。示例性过滤操作908用于从所检索的文本数据中删除粗俗文字。另一示例性过滤操作908在于包括落入特定价格范围内的产品的产品信息。另外的一个示例性过滤操作908在于,排除除了新闻稿件第一段以外的信息。
数据变换和格式化
图11是根据一个实施方式的用于对已检索数据进行变换和格式化的示例性方法的流程图。如图11中所示,在操作1000中,从电子文档读取一个或者多个搜索标准,并且在操作1001中检索匹配于一个或者多个搜索标准的数据。在一个实施方式中,在检索匹配于搜索标准的数据之后,可以在操作1002中变换已检索的数据。例如,在电子文档处理应用中可以包括光学字符识别(OCR)应用,以便将字符图像翻译成为机器可编辑的文本。电子文档处理应用还可以包括语音识别,以便将数字化的讲话翻译成为机器可编辑的文本。另一示例性变换操作1002在于,将一种语言的文字和句子翻译成为另一种语言。其他示例性变换操作1002包括将数据格式变换为其他数据格式(例如,将图像从图形交换格式(GIF)变换成为联合图像专家组(JPEG)格式)、数据加密和/或数据解密、以及其他变换操作。
在一个实施方式中,在操作1002中变换数据之后,可以在操作1004中将数据进行格式化以便输出。可以基于电子文档中存储的格式化信息来对数据进行格式化。例如,可以根据预定模板来将电子文档格式化。在另一示例中,基于附加至数据的格式化信息来将数据格式化。例如,所检索数据可以是具有嵌入格式化信息(例如,超文本标记、结构化标记、呈现性标记、以及与HTML相关联的其他格式化信息)的HTML格式。其他示例性格式化信息包括字体类型、字体大小、颜色、间距、页面大小以及传达已检索数据和/或电子文档的设计、布局或者样式的其他格式信息。
在一个实施方式中,电子文档的格式化可以适用于与所检索数据相关联的可变格式化。例如,如上所述,根据检索设置可以检索不同的数据,并且数据可以具有不同格式。由此,可以使电子文档支持不同的格式。例如,配置以显示文本的文本框的大小可以调整为容纳所检索的文本量。此外,在另一实施方式中,电子文档的格式化可以是动态的。例如,电子文档的格式可以随着时间、位置、用户偏好和/或其他参数变化。
应该理解,在实现和操作中,可以对图11中示出的上述操作进行变化,而并不局限于所提供的示例。例如,变换操作1002和格式化操作1004是可选的。由此,在一个实施方式中,在操作1001中接收的数据可以在操作1002中进行变换,和/或在操作1004中进行格式化。在另一实施方式中,可以对在操作1001中接收的数据既不进行变换也不进行格式化。
总之,上述实施方式利用来自于搜索的检索的数据对电子文档的内容进行增加。使用搜索标准来搜索数据允许来自多个外部源的数据增加电子文档的内容。结果,利用所检索数据强化了电子文档的原始内容。例如,用户可以在一个电子文档上查看从各种不同源检索的数据。换言之,多个搜索查询的结果可以集成为一个电子文档。另外,定制数据检索和格式化的能力可以允许动态地改变和更新将要在电子文档上显示的数据。
尽管出于清楚理解的目的已经详细地描述了上述示例,但是实施方式并不局限于所提供的细节。存在多种备选方式来实现这些实施方式。所公开的示例是示意性而不是限制性的。
Claims (25)
1.一种方法,包括:
从电子文档读取搜索标准,所述电子文档的一部分包括所述搜索标准;
搜索匹配于所述搜索标准的数据;
获取匹配于所述搜索标准的所述数据;以及
利用匹配于所述搜索标准的所述数据来增加与所述电子文档相关联的内容。
2.根据权利要求1所述的方法,进一步包括:将匹配于所述搜索标准的所述数据进行格式化。
3.根据权利要求1所述的方法,进一步包括:基于过滤标准来对所述数据进行过滤,所述电子文档配置以存储所述过滤标准。
4.根据权利要求1所述的方法,其中周期性地检索匹配于所述搜索标准的所述数据。
5.根据权利要求1所述的方法,其中当所述电子文档打开时,自动检索匹配于所述搜索标准的所述数据。
6.根据权利要求1所述的方法,其中响应于用户输入来检索匹配于所述搜索标准的所述数据。
7.根据权利要求1所述的方法,进一步包括:呈现与所述电子文档相关联的所述内容用于输出。
8.一种计算机程序产品,其包含在计算机可读介质中,并且包括用于执行如下步骤的计算机指令:
从与电子文档相关联的文件提取多个搜索查询,与所述电子文档相关联的所述文件配置以存储所述多个搜索查询;
检索匹配于所述多个搜索查询的多个数据;以及
利用匹配于所述多个搜索查询的所述多个数据来增加与所述电子文档相关联的内容。
9.根据权利要求8所述的计算机程序产品,其中用于检索匹配于所述多个搜索查询的所述多个数据的所述计算机指令包括用于执行如下步骤的计算机指令:
选择所述多个搜索查询的一部分;以及
检索匹配于所述多个搜索查询的一部分的所述多个数据的一部分。
10.根据权利要求9所述的计算机程序产品,其中用于选择所述多个搜索查询的一部分的所述计算机指令基于检索设置。
11.根据权利要求8所述的计算机程序产品,进一步包括如下计算机指令,所述计算机指令用于基于过滤标准来对所述多个数据进行过滤,以便减少为用于输出而呈现的所述多个数据,所述电子文档配置以存储所述过滤标准。
12.根据权利要求8所述的计算机程序产品,其中用于检索匹配于所述多个搜索查询的所述多个数据的所述计算机指令包括用于执行如下步骤的计算机指令:
将所述多个搜索查询传输至与搜索应用相关联的应用程序接口,所述搜索应用配置以搜索匹配于所述多个搜索查询的所述多个数据;以及
从与所述搜索应用相关联的所述应用程序接口接收匹配于所述多个搜索查询的所述多个数据。
13.根据权利要求8所述的计算机程序产品,其中用于检索匹配于所述多个搜索查询的所述多个数据的所述计算机指令包括用于执行如下步骤的计算机指令:
搜索匹配于所述多个搜索查询的所述多个数据;以及
获取匹配于所述多个搜索查询的所述多个数据。
14.根据权利要求8所述的计算机程序产品,进一步包括用于对匹配于所述多个搜索查询的所述多个数据进行变换的计算机指令。
15.根据权利要求8所述的计算机程序产品,其中与所述电子文档相关联的所述文件是单一文件。
16.一种系统,包括:
存储器,配置以存储电子文档处理应用;以及
与所述存储器通信的处理器,所述处理器配置以执行在所述存储器中存储的所述电子文档处理应用,所述电子文档处理应用包括用于执行如下步骤的程序指令:
从电子文档读取搜索标准,所述电子文档配置以存储所述搜索标准,
将所述搜索标准传输至搜索应用,所述搜索应用配置以搜索并获取匹配于所述搜索标准的数据,
从所述搜索应用接收匹配于所述搜索标准的所述数据,以及
利用匹配于所述搜索标准的所述数据来增加与所述电子文档相关联的内容。
17.根据权利要求16所述的系统,其中所述电子文档处理应用进一步包括用于执行以下步骤的程序指令:
从所述电子文档读取过滤标准,所述电子文档配置以存储所述过滤标准;以及
基于所述过滤标准来过滤所述数据,以便减少为用于输出而呈现的所述数据。
18.根据权利要求16所述的系统,其中将所述搜索标准传输至与所述搜索应用相关联的应用程序接口。
19.根据权利要求16所述的系统,其中所述搜索应用配置以在因特网上搜索匹配于所述搜索标准的所述数据。
20.根据权利要求16所述的系统,其中所述搜索应用配置以在数据库上搜索匹配于所述搜索标准的所述数据。
21.根据权利要求16所述的系统,其中所述搜索应用配置以在Web源上搜索匹配于所述搜索标准的所述数据。
22.根据权利要求16所述的系统,其中所述搜索应用配置以在计算机网络上搜索匹配于所述搜索标准的所述数据。
23.一种电子文档,包括配置以输入到电子文档处理应用中的搜索查询,所述电子文档处理应用配置以搜索匹配于所述搜索查询的数据。
24.根据权利要求23所述的电子文档,进一步包括过滤标准。
25.根据权利要求24所述的电子文档,其中所述过滤标准配置以输入到所述电子文档处理应用中,所述电子文档处理应用配置以基于所述过滤标准来减少为用于输出而呈现的所述数据。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/374,270 | 2006-03-13 | ||
US11/374,270 US8135694B2 (en) | 2006-03-13 | 2006-03-13 | Augmenting the contents of an electronic document with data retrieved from a search |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101432733A true CN101432733A (zh) | 2009-05-13 |
Family
ID=38236508
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007800152587A Pending CN101432733A (zh) | 2006-03-13 | 2007-03-07 | 利用来自搜索的所检索数据来增加电子文档的内容 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8135694B2 (zh) |
EP (1) | EP2002360A2 (zh) |
CN (1) | CN101432733A (zh) |
WO (1) | WO2007108944A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113204579A (zh) * | 2021-04-29 | 2021-08-03 | 北京金山数字娱乐科技有限公司 | 内容关联方法、系统、装置、电子设备及存储介质 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050262047A1 (en) * | 2002-12-31 | 2005-11-24 | Ju Wu | Apparatus and method for inserting portions of reports into electronic documents |
US7949937B2 (en) * | 2002-12-31 | 2011-05-24 | Business Objects Software Ltd | Apparatus and method for delivering portions of reports |
US20050262087A1 (en) * | 2003-05-19 | 2005-11-24 | Ju Wu | Apparatus and method for maintaining row set security through a metadata interface |
US8527540B2 (en) * | 2005-05-24 | 2013-09-03 | Business Objects Software Ltd. | Augmenting a report with metadata for export to a non-report document |
US20060271509A1 (en) * | 2005-05-24 | 2006-11-30 | Ju Wu | Apparatus and method for augmenting a report with parameter binding metadata |
US8700646B2 (en) * | 2009-08-12 | 2014-04-15 | Apple Inc. | Reference file for formatted views |
WO2011090036A1 (ja) * | 2010-01-19 | 2011-07-28 | 日本電気株式会社 | 動向情報検索装置、動向情報検索方法および記録媒体 |
US8296130B2 (en) * | 2010-01-29 | 2012-10-23 | Ipar, Llc | Systems and methods for word offensiveness detection and processing using weighted dictionaries and normalization |
US9356574B2 (en) | 2012-11-20 | 2016-05-31 | Karl L. Denninghoff | Search and navigation to specific document content |
JP6757115B2 (ja) * | 2014-09-24 | 2020-09-16 | 株式会社オウケイウェイヴ | 回答検索システム |
US11295124B2 (en) * | 2018-10-08 | 2022-04-05 | Xerox Corporation | Methods and systems for automatically detecting the source of the content of a scanned document |
WO2021197023A1 (zh) * | 2020-04-02 | 2021-10-07 | 北京字节跳动网络技术有限公司 | 多媒体资源筛选方法、装置、电子设备及计算机存储介质 |
US11822561B1 (en) * | 2020-09-08 | 2023-11-21 | Ipcapital Group, Inc | System and method for optimizing evidence of use analyses |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3599643A (en) * | 1969-04-03 | 1971-08-17 | S & S Ind Inc | Brassiere frame |
US4271580A (en) * | 1979-06-18 | 1981-06-09 | Hanes Corporation | Method of forming wire support frame member |
JPS63203812A (ja) * | 1987-02-17 | 1988-08-23 | 新井 理夫 | ヘルメツト |
US5222236A (en) * | 1988-04-29 | 1993-06-22 | Overdrive Systems, Inc. | Multiple integrated document assembly data processing system |
US5652958A (en) * | 1991-10-04 | 1997-08-05 | Farrell-Mestas; Eileen F. | Nursing canopy for use by a nursing mother |
US5694546A (en) * | 1994-05-31 | 1997-12-02 | Reisman; Richard R. | System for automatic unattended electronic information transport between a server and a client by a vendor provided transport software with a manifest list |
US5659676A (en) | 1994-09-20 | 1997-08-19 | International Business Machines Corporation | Systems and methods for creating and refreshing compound documents |
US5469582A (en) * | 1994-11-07 | 1995-11-28 | Livingston; Diane | Breast feeding cover |
US5479662A (en) * | 1994-11-07 | 1996-01-02 | Runco; Teri | Privacy covering for nursing mothers |
US5754840A (en) * | 1996-01-23 | 1998-05-19 | Smartpatents, Inc. | System, method, and computer program product for developing and maintaining documents which includes analyzing a patent application with regards to the specification and claims |
US5893171A (en) * | 1997-05-30 | 1999-04-13 | Ries; Margaret A. | Nursing cover-up |
US5848410A (en) * | 1997-10-08 | 1998-12-08 | Hewlett Packard Company | System and method for selective and continuous index generation |
US5956762A (en) * | 1998-06-04 | 1999-09-28 | Adams; Luana C. | Nursing and/or burping blanket |
US6321228B1 (en) * | 1999-08-31 | 2001-11-20 | Powercast Media, Inc. | Internet search system for retrieving selected results from a previous search |
JP2001256253A (ja) * | 2000-03-13 | 2001-09-21 | Kddi Corp | 文書フィルタリング方法および装置 |
US6895554B2 (en) * | 2000-06-06 | 2005-05-17 | Datatech Software, Inc. | Method of document assembly |
US7310687B2 (en) * | 2001-03-23 | 2007-12-18 | Cisco Technology, Inc. | Methods and systems for managing class-based condensation |
US20050193335A1 (en) * | 2001-06-22 | 2005-09-01 | International Business Machines Corporation | Method and system for personalized content conditioning |
US20050080804A1 (en) * | 2001-10-30 | 2005-04-14 | Bradshaw Robert David | System and method for maintaining componentized content |
US7127473B2 (en) * | 2002-05-17 | 2006-10-24 | Sap Aktiengesellschaft | Methods and systems for providing supplemental contextual content |
US20060218114A1 (en) * | 2005-03-25 | 2006-09-28 | Microsoft Corporation | System and method for location based search |
-
2006
- 2006-03-13 US US11/374,270 patent/US8135694B2/en not_active Expired - Fee Related
-
2007
- 2007-03-07 EP EP07752599A patent/EP2002360A2/en not_active Withdrawn
- 2007-03-07 CN CNA2007800152587A patent/CN101432733A/zh active Pending
- 2007-03-07 WO PCT/US2007/005911 patent/WO2007108944A2/en active Application Filing
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113204579A (zh) * | 2021-04-29 | 2021-08-03 | 北京金山数字娱乐科技有限公司 | 内容关联方法、系统、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US8135694B2 (en) | 2012-03-13 |
WO2007108944A3 (en) | 2007-12-21 |
EP2002360A2 (en) | 2008-12-17 |
WO2007108944A2 (en) | 2007-09-27 |
US20070214112A1 (en) | 2007-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101432733A (zh) | 利用来自搜索的所检索数据来增加电子文档的内容 | |
CN100447779C (zh) | 文档信息处理设备及文档信息处理方法 | |
CN109614504B (zh) | 一种互联网电子书的管理系统及方法 | |
US6883001B2 (en) | Document information search apparatus and method and recording medium storing document information search program therein | |
EP1450267B1 (en) | Methods and systems for language translation | |
US7945600B1 (en) | Techniques for organizing data to support efficient review and analysis | |
CN102959578B (zh) | 取证系统、取证方法及取证程序 | |
CN1193305C (zh) | 具有多数据源能力的数据恢复方法和装置 | |
US8296324B2 (en) | Systems and methods for analyzing, integrating and updating media contact and content data | |
CN102402604A (zh) | 搜索引擎的有效前向排序 | |
WO2001098917A1 (en) | Method and system for linking real world objects to digital objects | |
JP2000222394A (ja) | 文書管理装置及びその文書管理方法並びにその制御プログラムを記録した記録媒体 | |
CN101539904A (zh) | 一种引文自动标引方法 | |
US6694302B2 (en) | System, method and article of manufacture for personal catalog and knowledge management | |
KR20060101803A (ko) | 동적 열람이 가능한 전자 문서의 제작 및 열람 방법 | |
Ming | Access to digital information: some breakthroughs and obstacles | |
JP4469432B2 (ja) | インターネット情報処理装置、インターネット情報処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
KR20040064686A (ko) | 데이터 검색 방법 및 인터넷을 이용한 정보 자료 스크랩방법 | |
Veal Doverton | Techniques of document management: a review of text retrieval and related technologies | |
CN115146030A (zh) | 一种基于知识图谱的公务文书写作方法及系统 | |
Burkert et al. | London Stage Database | |
KR20000065614A (ko) | 인터넷 정보를 자동 분류하는 웹스크랩 방법 | |
US20030237042A1 (en) | Document processing device and document processing method | |
JP6905724B1 (ja) | 情報提供システム及び情報提供方法 | |
Press | Emerging dynabase tools |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20090513 |