CN101031915B - 增强第一文档的方法和系统 - Google Patents
增强第一文档的方法和系统 Download PDFInfo
- Publication number
- CN101031915B CN101031915B CN2005800289044A CN200580028904A CN101031915B CN 101031915 B CN101031915 B CN 101031915B CN 2005800289044 A CN2005800289044 A CN 2005800289044A CN 200580028904 A CN200580028904 A CN 200580028904A CN 101031915 B CN101031915 B CN 101031915B
- Authority
- CN
- China
- Prior art keywords
- document
- user
- information
- text
- personal information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000002708 enhancing effect Effects 0.000 title abstract description 4
- 238000012545 processing Methods 0.000 claims abstract description 12
- 230000001419 dependent effect Effects 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- 230000008878 coupling Effects 0.000 claims description 4
- 238000010168 coupling process Methods 0.000 claims description 4
- 238000005859 coupling reaction Methods 0.000 claims description 4
- 238000007667 floating Methods 0.000 claims description 4
- 230000002123 temporal effect Effects 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims 1
- 230000037431 insertion Effects 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 10
- 230000009471 action Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 230000007246 mechanism Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 229940112879 novolog Drugs 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
- G06F16/94—Hypermedia
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/954—Navigation, e.g. using categorised browsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
- G06F16/9558—Details of hyperlinks; Management of linked annotations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/114—Pagination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/117—Tagging; Marking up; Designating a block; Setting of attributes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/134—Hyperlinking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
Abstract
本公开涉及增强第一文档的方法和系统,所述方法包括:接收与用户相关的个人信息,接收用户请求的第一文档,通过处理第一文档的文本以获得以下中的至少一项来识别特定的文本信息,通过将基于个人信息的一个或多个术语与所识别的特定的文本信息级连,形成搜索查询,基于由搜索引擎利用所述搜索查询执行的搜索,识别附加文档,将对附加文档的引用嵌入到与所识别的特定的文本信息内嵌的第一文档中,以形成修改的第一文档,以及发送修改的第一文档给用户。在有些实现中,附加文档可以例如通过内嵌链接或文本浮框内嵌呈现在正读取的文档中。因此,可以有效地向用户呈现与正读取的原始文档相关的附加信息。
Description
技术领域
在此所描述的系统与方法总体上涉及信息检索,更具体而言,涉及用于浏览信息的技术。
背景技术
万维网(“web”)包含非常大量的信息。Web的一种非常通用的用途是读取文档,例如新闻文章或其它出版物。
当读取特定的文档时,例如新闻文章,已知的是提供对以某种方式与该特定文档相关的其它文档的链接。例如,当用户从新闻搜索引擎或内嵌新闻服务选择新闻文档时,web站点可以提供对与该新闻文档相关的其它新闻文章或广告的链接。一般来说,这种相关的文档是基于正读取文档的内容确定的并作为显示在文档内容之外的附加链接显示。通过提供对相关材料的方便链接,这些附加文档可以增强读者的浏览体验。
期望通过向读者提供对相关信息的自动生成的链接来提供用于增强文档浏览的改进技术。
发明内容
根据一方面,增强第一文档的方法包括:接收与用户相关的个人信息,所述个人信息包括用户的地理位置、由用户在注册帐号时提供的信息或者基于用户的浏览历史的信息中的至少一个;接收用户请求的第一文档;通过处理第一文档的文本以获得以下中的至少一项来识别特定的文本信息:在第一文档中出现次数超过预定次数的术语,第一文档中的命名实体,第一文档中包括的日期,或第一文档中的作者和出版物名;通过将基于个人信息的一个或多个术语与所识别的特定的文本信息级连,形成搜索查询;基于由搜索引擎利用所述搜索查询执行的搜索,识别附加文档;将对附加文档的引用嵌入到与所识别的特定的文本信息内嵌(in-line)的第一文档中,以形成修改的第一文档;以及发送修改的第一文档给用户。
在另一方面,增强第一文档的系统包括:用于接收与用户相关的个人信息的装置,所述个人信息包括用户的地理位置、由用户在注册帐号时提供的信息或者基于用户的浏览历史的信息中的至少一个;用于接收用户请求的第一文档的装置;用于通过处理第一文档的文本以获得以下中的至少一项来识别特定的文本信息的装置:在第一文档中出现次数超过预定次数的术语,第一文档中的命名实体,第一文档中包括的日期,或第一文档中的作者和出版物名;用于通过将基于个人信息的一个或多个术语与所识别的特定的文本信息级连而形成搜索查询的装置;用于基于由搜索引擎利用所述搜索查询执行的搜索而识别附加文档的装置;用于将对附加文档的引用嵌入到与所识别的特定的文本信息内嵌的第一文档中以形成修改的第一文档的装置;以及用于发送修改的第一文档给用户的装置。
在另一方面,增强第一文档的方法包括:接收来自用户的对第一文档的请求;基于以下至少一项来在第一文档中识别文本:所述文本中的术语在第一文档中出现的次数结合所述文本中的术语在第一文档语言中出现的频率、从命名实体列表匹配出的命名实体、第一文档的作者、第一文档的日期、或者第一文档的出版实体;定位与第一文档相关的至少一个第二文档,其中第二文档与第一文档的相关性基于所述文本并基于第一文档要发往的用户的个人信息,所述个人信息包括要发往的用户的地理位置、由要发往的用户在注册账号时提供的信息或者基于要发往的用户的浏览历史的信息;在第一文档中与所述文本内嵌的位置嵌入对第二文档的链接,以获得第一文档的修改版本;以及发送第一文档的修改版本给用户。
在另一方面,增强第一文档的系统包括:用于接收来自用户的对第一文档的请求的装置;用于基于以下至少一项来在第一文档中识别文本的装置:所述文本中的术语在第一文档中出现的次数结合所述文本中的术语在第一文档语言中出现的频率、从命名实体列表匹配出的命名实体、第一文档的作者、第一文档的日期、或者第一文档的出版实体;用于定位与第一文档相关的至少一个第二文档的装置,其中第二文档与第一文档的相关性基于所述文本并基于第一文档要发往的用户的个人信息,所述个人信息包括要发往的用户的地理位置、由要发往的用户在注册账号时提供的信息或者基于要发往的用户的浏览历史的信息;用于在第一文档中与所述文本内嵌的位置嵌入对第二文档的链接以获得第一文档的修改版本的装置;以及用于发送第一文档的修改版本给用户的装置。
在另一方面,增强第一文档的方法包括:接收与用户相关的个人信息,其中个人信息包括用户的地理位置、由用户在注册账号时提供的信息或者基于用户的浏览历史的信息中的至少一个;通过处理第一文档的文本以获得以下中的至少一项来识别特定的文本信息:在第一文档中出现次数超过预定次数的术语,第一文档中的命名实体,第一文档中包括的日期,或第一文档中的作者和出版物名;基于所识别的特定的文本信息和基于所接收的个人信息生成多个不同的搜索查询;通过向一个或多个搜索引擎提交所述多个搜索查询而定位文档组;将在所述文档组中的多个文档中出现的文档确定为相关文档;生成包括第一文档的内容的第二文档,所述第一文档被修改成包括引用所述相关文档的与第一文档内嵌嵌入的链接,所述链接位于所述特定的文本信息附近;以及发送第二文档给用户。
在再一方面,增强第一文档的系统包括:用于接收与用户相关的个人信息的装置,所述个人信息包括用户的地理位置、由用户在注册帐号时提供的信息或者基于用户的浏览历史的信息中的至少一个;用于通过处理第一文档的文本以获得以下中的至少一项来识别特定的文本信息的装置:在第一文档中出现次数超过预定次数的术语,第一文档中的命名实体,第一文档中包括的日期,或第一文档中的作者和出版物名;用于基于所识别的特定的文本信息和基于所接收的个人信息而生成多个不同搜索查询的装置;用于通过向一个或多个搜索引擎提交多个不同搜索查询而定位文档组的装置;用于将在所述文档组中的多个文档中出现的文档确定为相关文档的装置;用于生成包括第一文档的内容的第二文档的装置,所述第一文档被修改成包括引用所述相关文档的与第一文档内嵌嵌入的链接,所述链接位于所述特定的文本信息附近;以及用于发送第二文档给用户的装置。
附图说明
结合进本说明书并构成其一部分的附图说明了本发明的实施方式并与描述一起解释本发明。在附图中,
图1A和1B是说明可以呈现给用户的示例图形界面的图;
图2是其中与本发明原理一致的概念可以实现的网络的示例图;
图3是在图2网络中显示的客户端或服务器的示例图;
图4是说明图2所示文档定位器的概念元件的框图;
图5是说明图4所示搜索组件的示例实现的图;
图6是说明由图2所示文档定位器执行的示例操作的流程图;及
图7是说明在内容提供web站点情境下文档定位器的示例实现的图。
具体实施方式
以下本发明的具体描述参考附图。该具体描述不限制本发明。
概述
如在此所描述的,与例如用户所读取文档的原始文档相关的附加文档是自动定位的。附加文档可以根据其内容和/或根据用户的个人信息定位。附加文档可以与原始文档一起内嵌显示。因此,可以有效地向用户呈现与正读取的原始文档相关的附加信息。
图1A和1B是说明可以呈现给用户的示例图形界面的图。图形界面可以通过正用于浏览web的web浏览器100呈现。图1A和1B中所示的例子文档105关于攀登Mt.Everest的徒步旅行者(BillCross)的进展。
多个附加文档可能与文档105相关。例如,在图1A中,对三个附加文章的链接110、112和114嵌入到文档105中。链接110可以引用关于Mt.Everest的文档,链接112可以引用关于Novolog Peaks和Poles Challenge的文档,而链接114可以引用关于diabetes的文档。链接110、112和114中的每一个都引用以某种方式与原始文档105相关的内容。在这个例子中,链接110、112和114以通知读者带下划线链接的内容的简单摘要文本(例如,“related content:Mt.Everest”)显示。此外,摘要文本是带下划线的,指示该摘要文本与链接关联。假定图1A中文档105的读者位于California的San Jose。关于San J0se徒步旅行装备零售商的广告115可以附加地显示。此外,由链接110、112和114引用的文档可以是特别适于San Jose地区读者的文档。
尽管没有在图1A中示出,但其它链接,例如甚至更直接地定制成读者个人信息的链接,也可以显示。例如,如果读者先前在搜索引擎中输入了搜索查询,例如与照片相关的搜索查询,则其它链接可以是对描述“Everest照片”的文档的链接。
图1B中的文档105与图1A中的完全相同。多个链接120、122和124包括在图1B的文档105中。在这个例子中,链接120、122和124不是示为链接的摘要文本,而是通过简单地修改与文档105中特定词或短语相关的格式或显示来实现。例如,链接120通过给“Mt.Everest”加下划线,由此向读者说明该链接引用关于Mt.Everest的文档向读者显示。另一链接126内嵌插入到文档105中,它包括类似于链接110、112和114的摘要文本。对于这个例子,假定读者来自Seattle而不是San Jose。可以根据这个事实生成的链接126引用关于徒步旅行Mt.Rainer-Seattle附加的一座山峰的文档。
示例网络概述
图2是其中与本发明原理一致的概念可以实现的网络200的示例图。网络200可以包括通过网络240连接到服务器220的多个客户端210。网络240可以包括局域网(LAN)、广域网(WAN)、例如公共交换电话网(PSTN)的电话网络、内联网、因特网或网络的组合。为了简单,两个客户端210和一个服务器220被示出为连接到网络240。实际上,可以有更多客户端和/或服务器。而且,在有些情况下,客户端可以执行服务器的一种或多种功能,而服务器也可以执行客户端的一种或多种功能。
客户端210可以包括例如无线电话、个人计算机、个人数字助理(PDA)、膝上型电脑或其它类型的计算或通信设备的设备、运行在这些设备中一个上的线程或过程和/或可以由这些设备中一个执行的对象。服务器220可以包括以与本发明原理一致的方式处理、搜索和/或维护文档与图像的服务器设备。客户端210与服务器220可以通过有线、无线或光连接连接到网络240。
服务器220可以包括附加文档定位器组件225(在此也简单地称为“文档定位器225”)。文档定位器225可以定位并添加对与输入文档相关的其它文档的引用,例如添加到文档105的引用(图1A和1B)。
作为在此所使用的术语,文档广义地解释为包括任何机器可读和机器可存储作品。文档可以是电子邮件、web日志(博克)、文件、文件的组合、具有对其它文件的嵌入链接的一个或多个文件、新闻组粘贴等。在因特网情境下,常用文档是web页面,例如HTMLweb页面。Web页面常常包括内容,而且可以包括嵌入的信息(例如元信息、超链接等)和/或嵌入的指令(例如Java script等)。在此所讨论的文档通常包括嵌入的图像。在此作为术语使用的“链接”广义地解释为包括从文档到另一文档或同一文档的另一部分的引用/从另一文档或同一文档的另一部分到本文档的任何引用。
示例客户端/服务器体系结构
图3是客户端210或服务器220的示例图。客户端/服务器210/220可以包括总线310、处理器320、主存储器330、只读存储器(ROM)340、存储设备350、输入设备360、输出设备370及通信接口380。总线310可以包括允许在客户端/服务器210/220的组件之间通信的导体。
处理器320可以包括解释并执行指令的传统处理器、微处理器或处理逻辑。主存储器330可以包括随机存取存储器(RAM)或存储信息与由处理器320所执行指令的另一类型的动态存储设备。ROM340可以包括传统ROM设备或存储静态信息与由处理器320使用的指令的另一类型的静态存储设备。存储设备350可以包括磁和/或光记录介质及其对应的驱动器。
输入设备360可以包括允许用户向客户端/服务器210/220输入信息的一种或多种传统机构,例如键盘、鼠标、笔、语音识别和/或生物测量机构等。输出设备370可以包括向用户输出信息的一种或多种传统机构,包括显示器、打印机、扬声器等。通信接口380可以包括使客户端/服务器210/220与其它设备和/或系统通信的任何象收发器那样的机构。例如,通信接口380可以包括通过网络(例如网络240),与其它设备或系统通信的机构。
与本发明的原理一致的服务器220可以实现附加文档定位器225。附加文档定位器225可以存储在计算机可读介质中,例如存储器330中。计算机可读介质可以定义为一个或多个物理或逻辑存储器设备和/或载波。
定义附加文档定位器225的软件指令可以从另一计算机可读介质(例如数据存储设备350),或通过通信接口380从另一设备读到存储器330中。包含在存储器330中的软件指令可以使处理器320执行后述处理。可选地,硬连线电路或其它逻辑可以代替或与软件指令组合使用以实现与本发明一致的处理。因此,与本发明原理一致的实现不限于硬件电路与软件的任何特定的组合。
文档定位器225
图4是说明文档定位器225的概念元件的框图。文档定位器225可以包括描述信息生成器405、搜索组件410及格式化组件415。描述信息生成器405可以生成描述当前文档并基于用户个人信息的描述信息。在一种实现中,描述信息可以包括搜索查询。描述信息生成器405可以基于用户的个人信息和/或当前输入的文档(或与当前文档相关的信息)生成描述信息。
从描述信息生成器405输出的描述信息可以输入到搜索组件410,搜索组件410可以使用该描述信息生成附加文档。对附加文档的链接或其它引用可以由格式化组件415插入到原始文档中。
描述信息生成器405、搜索组件410及格式化组件415分别在下面具体描述。
描述信息生成器405
如所提到的,描述信息生成器405可以生成描述信息,例如搜索查询。描述信息通常可以基于与用户当前在观看(或请求观看)的文档相关的信息及用户的个人信息。与当前文档相关的信息可以包括基于当前文档文本的信息。该文本可以处理成包含例如:(1)出现次数超过某一预定次数的所有术语,(2)可以自动提取的命名实体,(3)文档中的日期,(4)作者和出版物名,和/或关键字或类别提取。
关于上面的(1),出现次数超过某一预定次数的术语可以看做是重要的或者文档中特别描述的术语,而且可以看作是该文档的描述信息。例如,选择成包括在描述信息中的术语个数可以限定为最频繁出现术语的预定个数。在这种概念的可能变体中,术语出现的次数可以联系术语在文档语言中出现的总频率一起考虑。因此,语言中趋于较少出现的术语可以在文档中出现多次的通用术语之前选择。
预定命名实体或其它名词的列表可以由描述信息生成器405存储。例如,位置名、名人名字、众所周知的商品或消费品名及公司名可以由手动(即,由人操作员输入)或自动技术预先产生。如上面所提到的,文档的文本可以与包括在该文档的描述信息中的这些命名实体和匹配进行比较。参考图1A和1B的例子,预定命名实体的列表可能已经包括了例如“Mt.Everest”和“Novolog Peaks and PolesChallenge”的术语,使得这些术语包括在文档105的描述信息中。
文档中的日期(以上的项(3))、文档作者及出版物名(项(4))可以包括在描述信息中。这种信息常常可以通过应用到文档的模式匹配技术自动确定。文档的日期可以用于定位其它同期出版的文档。类似地,出版实体(例如,web站点)和文档作者可以用于定位来自相同或类似出版社的文档或同一作者所写的或文档。文档日期、作者和出版社在新闻报道的情境下特别有用。关于(5),可以分析文档的关键字,例如基于术语频率或通过命名实体提取所提取的关键字。
除了基于文档生成描述信息,描述信息生成器405还可以基于特定于用户的信息(“个人信息”)生成描述信息。个人信息可以包括例如用户的地理位置(例如,先前搜索查询提交的或链接所选的)、用户在注册账号时提供的个人信息、基于用户浏览历史的个人信息、从用户所生成文档或其它个人信息源提取的个人信息。用户的地理位置可以根据用户的IP地址估计。个人信息还可以包括时间信息,例如当前的日期或季节。时间信息可以用于将事件与个人偏好或文档内容关联。例如,如果正浏览的文档关于Edinburgh,且当前月份是七月或八月,则可以显示关于Edinburgh艺术节的相关文档。
在一种实现中,个人信息可以基于由提交到搜索引擎的先前搜索查询构成的用户简档。类列匹配技术可以用于从搜索项目推断用户的兴趣。例如,即使用户实际上从来没有输入搜索项“摄影”,但查询了术语“尼康”、“光圈”和“f制光圈”,这些术语可以用于推断用户对摄影感兴趣。
用于从搜索查询生成类别映射的一种技术基于收集大量的基于用户搜索会话标记的历史用户搜索查询。基本原理是搜索例如“佳能”的搜索项的人很有可能在相同的搜索会话中输入与相同类相关的其它搜索查询,例如“摄影”或“f制光圈”。通过分析许多这种搜索查询会话,可以进行类别推断(例如,如果有人搜索“尼康”,则有可能他们对摄影感兴趣)。
描述信息生成器405可以将描述信息格式化为搜索查询。在一种实现中,搜索查询可以通过级连描述信息(例如,用户的个人信息和与文档相关的描述信息)以获得搜索查询来获得。作为例子,考虑图1A中的文档105。基于对文档和用户个人信息的分析,描述信息生成器405可以生成描述信息“Mt.Everest”、“Novolog Peaks and PolesChallenge”、“diabetes”、“San Jose”与“photography”。这些术语可以组合成单个搜索查询“Mt.Everest Novolog Peaks Poles Challengediabetes San Jose photography”。在其它实现中,可以生成多个搜索查询,每个搜索查询包括来自该文档和用户个人信息的术语子集,其例如搜索查询:“Mt.Everest San Jose”,“hiking San Jose”,“photography Mt.Everest”等等。
本领域普通技术人员将认识到用于从所生成的描述信息形成搜索查询的其它技术也可以使用。例如,附加信息可以用于确定查询中是否包括术语,例如术语在语言中出现的总频率。此外,在确定在查询中是否包括特定名、实体或其它预定义术语时,可以赋予它们附加权重。例如地区名的有些术语可以与例如产品名的其它术语有不同的权重。产品名可以通过将其关联的公司名附加到产品名后自动限定。此外,描述信息可以与如以上所描述的那些的簇或类匹配技术一起使用,以便生成可以用在搜索查询中的其它术语。
搜索组件410
图5是更具体说明搜索组件410的示例实现的图。搜索组件410可以包括搜索引擎505和排队(rank)组件510。
搜索引擎505可以从描述信息生成器405接收描述信息,并且作为响应,定位与该描述信息相关的一个或多个文档。搜索引擎505可以是返回与所输入搜索查询相关的排队文档集合的基于查询的搜索引擎。搜索引擎505可以是例如基于来自大集合的所有文档(例如web上的文档)的搜索引擎的通用搜索引擎或者例如新闻搜索引擎的更专用的搜索引擎。用于实现搜索引擎的技术一般在本领域中是已知的,因此在此将不进一步公开。
排队组件510可以操作成排队和/或修剪由搜索引擎505返回的文档集合。在一种实现中,排队组件510可以基于定义所返回文档集合中每个文档与搜索查询匹配得多好的查询匹配得分来排队所返回的文档集合。与搜索查询“较好”匹配的文档,例如包括搜索查询中多个术语例子的文档,将倾向于比匹配不好的文档有更高的相关性得分。排队组件510还可以基于其它相关性或质量的测量值(例如基于基于链接的文档质量测量值)来排序文档。前N个排序文档(例如,N=3)可以由排队组件510选择呈现给用户。
用于排队或修剪相关文档集合的其它技术也可以由排队组件510使用。例如,可以选择在对应于多个相关搜索查询的多个文档集合中出现的文档,可以选择那些最新近的文档,可以选择那些最受欢迎的文档(例如,基于文档链接被选择的次数)。作为其它例子,来自商业站点的文档可以明确地排除(或包括)。
在有些实现中,可以接收对应于描述信息的多个可能的搜索查询,并可以使用返回“最佳”结果的查询。“最佳”结果可以多种方式测量,例如通过看对应于响应可能的搜索查询从搜索引擎返回的文档的目标排队值。此外,可以使用多种不同的搜索引擎,例如新闻搜索引擎、产品搜索引擎或通用的基于web的搜索引擎。
格式化组件415
格式化组件415可以将由搜索组件410定位的附加文档并到当前文档中(即,用户当前观看的文档)或加到包括当前文档的新文档中。附加文档可以通知用户文档可用的方式与当前文档合并,而不会过度干扰用户对当前文档的读取。
在一种实现中,格式化组件415可以将链接(例如,超链接)插入到与当前文档的文本内嵌的附加文档中。当可能时,对每个附加文档的链接可以插入到当前文档中与附加文档特别相关的部分中。这个概念在图1A和1B中说明,其中对相关内容的链接,例如对关于Mt.Everest的文档的链接,插入到文档105中靠近术语“Mt.Everest”的地方。尽管图1A和1B中的链接示为包括括号中的摘要信息和示为通过修改当前输入文档中词显示来识别的链接,但其它用于图形显示链接的技术也可以使用。
除内嵌超链接以外的技术可以用于将附加文档嵌入到当前文档中。例如,可以使用当用户将光标放到当前文档中的特定单词、图像或其它对象上时显示的“漂浮(float-over)”文本。
文档定位器225的操作
图6是说明文档定位器225所执行的示例操作的流程图。文档定位器225可以响应用户请求文档(例如从web站点或搜索引擎进行的请求)而开始操作。
文档定位器225可以接收或定位用户的个人信息(动作601)。个人信息可以包括以下信息,例如用户的地理位置、用户当注册账号时(或在其它时候)所提供的个人信息、基于用户浏览历史的个人信息或从用户生成的文档提取的个人信息。文档定位器还接收用户正请求的当前输入文档(动作602)。
可以生成与输入文档相关的描述信息(动作603)。如前面所讨论的,描述信息可以由描述信息生成器405生成并可以包括包含与当前输入文档与用户个人信息相关的术语的搜索查询。描述信息可以用于定位附加相关文档(动作604)。如所讨论的,这可以由搜索组件410向搜索引擎提交搜索查询来执行。
附加相关文档中的一个或多个可以嵌入到当前输入文档或者与其关联(动作605)。如图1A和1B所示出的,附加相关文档可以与当前输入文档内嵌嵌入。然后,包括对附加相关文档的链接的当前输入文档的修改版本可以呈现给用户(动作606)。
文档定位器225的示例实现
图7是说明在内容提供web站点情境下实现的附加文档定位器225的示例实现的图,其中web站点例如专用于关于特定嗜好(例如,汽车)的文章的web站点。本领域普通技术人员将理解文档定位器225可以在多种附加联网环境中实现,例如在新闻搜索引擎或更通用的搜索引擎的通用情境下实现。
多个用户705可以通过网络715连接到内容web站点710。用户可以从内容web站点710请求特定的文档。在向用户返回所请求的文档之前,web站点710向文档定位器225发送文档(或识别文档的信息)以及可能的还有发出请求的用户的个人信息。如前面所讨论的,文档定位器225可以向web站点710返回其所请求文档的修改版本,然后,web站点710可以将文档转发到用户。以这种方式,来自web站点710的文档在返回给用户之前可能被自动扩张,以增强其期望性。
对这个例子的许多变体都是可能的。例如,代替文档定位器225向web站点710返回增强的文档,web站点710可以简单地将用户的文档请求重定向到文档定位器225,然后文档定位器225可以向用户返回增强的文档。
结论
在此描述了用于自动定位与原始文档和/或用户个人信息相关的附加文档的技术,其中文档例如由用户正读取的文档。在一种实现中,附加文档是基于用户的个人信息及基于与用户正读取的文档相关的内容定位的。例如通过插入在文档中特别相关于附加文档的位置的链接,附加文档可以与正读取的文档内嵌呈现。因此,可以有效地向用户呈现与正读取的原始文档相关的附加信息。
对本领域普通技术人员而言,很显然如上面所描述的本发明的各方面可以附图中所说明的实现中的软件、固件和硬件的许多不同形式实现。用于实现与本发明一致的各方面的实际软件代码或专用控制硬件不限制本发明。因此,各方面的操作与行为不是参考特定的软件代码描述的-应当理解,本领域普通技术人员将能够基于这里的描述设计实现各方面的软件和控制硬件。
本发明优选实施方式的以上描述提供了说明与描述,但不是穷尽的或者要将本发明限定到所公开的精确形式。按照以上教义,多种修改与变体都是可能的,或者多种修改与变体可以通过本发明的实践获得。例如,尽管上述许多操作是以特定顺序描述的,但许多操作可以同时执行或者以不同顺序执行,以获得相同或等效的结果。
除非明确地描述了,否则在本申请中所使用的所有元件、动作或指令都不应当看作是对本发明关键的或者必需的。而且,如在此所使用的,冠词“一个”是要可能允许一个或多个项目。此外,除非另外明确申明,否则短语“基于”意思是“至少部分地基于”。
Claims (25)
1.一种增强第一文档的方法,包括:
接收与用户相关的个人信息,所述个人信息包括用户的地理位置、由用户在注册帐号时提供的信息或者基于用户的浏览历史的信息中的至少一个;
接收用户请求的第一文档;
通过处理第一文档的文本以获得以下中的至少一项来识别特定的文本信息:
在第一文档中出现次数超过预定次数的术语,
第一文档中的命名实体,
第一文档中包括的日期,或
第一文档中的作者和出版物名;
通过将基于个人信息的一个或多个术语与所识别的特定的文本信息级连,形成搜索查询;
基于由搜索引擎利用所述搜索查询执行的搜索,识别附加文档;
将对附加文档的引用与所识别的特定的文本信息内嵌嵌入到第一文档中,以形成修改的第一文档;以及
发送修改的第一文档给用户。
2.如权利要求1所述的方法,其中对附加文档的引用包括链接。
3.如权利要求2所述的方法,其中链接包括描述所述对附加文档的引用的文本。
4.如权利要求2所述的方法,其中链接包括漂浮文本。
5.如权利要求1所述的方法,其中所述特定的文本信息包含包括第一文档中的在命名实体列表中匹配的命名实体的文本。
6.如权利要求5所述的方法,其中命名实体列表包括位置名或消费品。
7.如权利要求1所述的方法,其中所述特定的文本信息包括在第一文档中出现的次数多于预定次数的文本。
8.如权利要求1所述的方法,其中个人信息包括从由用户生成的文档提取的信息。
9.如权利要求1所述的方法,其中个人信息包括时间信息。
10.一种增强第一文档的系统,包括:
用于接收与用户相关的个人信息的装置,所述个人信息包括用户的地理位置、由用户在注册帐号时提供的信息或者基于用户的浏览历史的信息中的至少一个;
用于接收用户请求的第一文档的装置;
用于通过处理第一文档的文本以获得以下中的至少一项来识别特定的文本信息的装置:
在第一文档中出现次数超过预定次数的术语,
第一文档中的命名实体,
第一文档中包括的日期,或
第一文档中的作者和出版物名;
用于通过将基于个人信息的一个或多个术语与所识别的特定的文本信息级连而形成搜索查询的装置;
用于基于由搜索引擎利用所述搜索查询执行的搜索而识别附加文档的装置;
用于将对附加文档的引用与所识别的特定的文本信息内嵌嵌入到第一文档中以形成修改的第一文档的装置;以及
用于发送修改的第一文档给用户的装置。
11.如权利要求10所述的系统,其中所述特定的文本信息中的多个特定的预定义的术语在搜索查询中被赋予附加权重。
12.一种增强第一文档的方法,包括:
接收来自用户的对第一文档的请求;
基于以下至少一项来在第一文档中识别文本:所述文本中的术语在第一文档中出现的次数结合所述文本中的术语在第一文档语言中出现的频率、从命名实体列表匹配出的命名实体、第一文档的作者、第一文档的日期、或者第一文档的出版实体;
定位与第一文档相关的至少一个第二文档,其中第二文档与第一文档的相关性基于所述文本并基于第一文档要发往的用户的个人信息,所述个人信息包括要发往的用户的地理位置、由要发往的用户在注册账号时提供的信息或者基于要发往的用户的浏览历史的信息;
在第一文档中与所述文本内嵌的位置嵌入对第二文档的链接,以获得第一文档的修改版本;以及
发送第一文档的修改版本给用户。
13.如权利要求12所述的方法,其中命名实体列表包括位置名或消费品。
14.如权利要求12所述的方法,其中个人信息包括从由用户生成的文档提取的信息。
15.如权利要求12所述的方法,其中第二文档作为与第一文档中命名实体关联的超链接嵌入到第一文档中。
16.如权利要求12所述的方法,其中在第一文档中嵌入对第二文档的链接的步骤还包括:
插入包括描述第二文档的文本的超链接。
17.一种增强第一文档的系统,包括:
用于接收来自用户的对第一文档的请求的装置;
用于基于以下至少一项来在第一文档中识别文本的装置:所述文本中的术语在第一文档中出现的次数结合所述文本中的术语在第一文档语言中出现的频率、从命名实体列表匹配出的命名实体、第一文档的作者、第一文档的日期、或者第一文档的出版实体;
用于定位与第一文档相关的至少一个第二文档的装置,其中第二文档与第一文档的相关性基于所述文本并基于第一文档要发往的用户的个人信息,所述个人信息包括要发往的用户的地理位置、由要发往的用户在注册账号时提供的信息或者基于要发往的用户的浏览历史的信息;
用于在第一文档中与所述文本内嵌的位置嵌入对第二文档的链接以获得第一文档的修改版本的装置;以及
用于发送第一文档的修改版本给用户的装置。
18.如权利要求17所述的系统,其中命名实体列表包括位置名或消费品。
19.如权利要求17所述的系统,其中个人信息包括从由用户生成的文档提取的信息。
20.一种增强第一文档的方法,包括:
接收与用户相关的个人信息,其中个人信息包括用户的地理位置、由用户在注册账号时提供的信息或者基于用户的浏览历史的信息中的至少一个;
通过处理第一文档的文本以获得以下中的至少一项来识别特定的文本信息:
在第一文档中出现次数超过预定次数的术语,
第一文档中的命名实体,
第一文档中包括的日期,或
第一文档中的作者和出版物名;
基于所识别的特定的文本信息和基于所接收的个人信息生成多个不同的搜索查询;
通过向一个或多个搜索引擎提交所述多个搜索查询而定位文档组;
将在所述文档组中的多个文档中出现的文档确定为相关文档;
生成包括第一文档的内容的第二文档,所述第一文档被修改成包括引用所述相关文档的与第一文档内嵌嵌入的链接,所述链接位于所述特定的文本信息附近;以及
发送第二文档给用户。
21.如权利要求20所述的方法,还包括:
为链接提供漂浮文本,其中漂浮文本包括描述相关文档的文本。
22.如权利要求20所述的方法,其中所述一个或多个搜索引擎包括新闻搜索引擎、产品搜索引擎或通用的基于web的搜索引擎中的至少一个。
23.一种增强第一文档的系统,包括:
用于接收与用户相关的个人信息的装置,所述个人信息包括用户的地理位置、由用户在注册帐号时提供的信息或者基于用户的浏览历史的信息中的至少一个;
用于通过处理第一文档的文本以获得以下中的至少一项来识别特定的文本信息的装置:
在第一文档中出现次数超过预定次数的术语,
第一文档中的命名实体,
第一文档中包括的日期,或
第一文档中的作者和出版物名;
用于基于所识别的特定的文本信息和基于所接收的个人信息而生成多个不同搜索查询的装置;
用于通过向一个或多个搜索引擎提交多个不同搜索查询而定位文档组的装置;
用于将在所述文档组中的多个文档中出现的文档确定为相关文档的装置;
用于生成包括第一文档的内容的第二文档的装置,所述第一文档被修改成包括引用所述相关文档的与第一文档内嵌嵌入的链接,所述链接位于所述特定的文本信息附近;以及
用于发送第二文档给用户的装置。
24.如权利要求23所述的系统,其中用于定位文档组的装置包括:
用于基于文档的相关性得分、文档被选择的次数、或者文档日期中的至少一个来将所述一个或多个搜索引擎之一返回的结果进行排队的装置。
25.如权利要求23所述的系统,其中所述特定的文本信息中的多个特定的预定义的术语在搜索查询中的至少一个中被赋予附加权重。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/887,443 | 2004-06-30 | ||
US10/887,443 US7698626B2 (en) | 2004-06-30 | 2004-06-30 | Enhanced document browsing with automatically generated links to relevant information |
PCT/US2005/022726 WO2006004657A1 (en) | 2004-06-30 | 2005-06-29 | Enhanced document browsing with automatically generated links based on user information and context |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101031915A CN101031915A (zh) | 2007-09-05 |
CN101031915B true CN101031915B (zh) | 2013-10-23 |
Family
ID=34982222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2005800289044A Expired - Fee Related CN101031915B (zh) | 2004-06-30 | 2005-06-29 | 增强第一文档的方法和系统 |
Country Status (9)
Country | Link |
---|---|
US (3) | US7698626B2 (zh) |
EP (1) | EP1766541A1 (zh) |
JP (2) | JP2008505395A (zh) |
KR (1) | KR100932999B1 (zh) |
CN (1) | CN101031915B (zh) |
AU (1) | AU2005260076B2 (zh) |
BR (1) | BRPI0512802A (zh) |
CA (1) | CA2572588C (zh) |
WO (1) | WO2006004657A1 (zh) |
Families Citing this family (77)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7698626B2 (en) | 2004-06-30 | 2010-04-13 | Google Inc. | Enhanced document browsing with automatically generated links to relevant information |
ATE535778T1 (de) * | 2004-07-23 | 2011-12-15 | Decarta Inc | Automatische priorisierung von kartenobjekten |
US8880521B2 (en) * | 2004-09-15 | 2014-11-04 | 3Degrees Llc | Collections of linked databases |
US8635217B2 (en) | 2004-09-15 | 2014-01-21 | Michael J. Markus | Collections of linked databases |
US8412706B2 (en) | 2004-09-15 | 2013-04-02 | Within3, Inc. | Social network analysis |
US8386453B2 (en) * | 2004-09-30 | 2013-02-26 | Google Inc. | Providing search information relating to a document |
US9195766B2 (en) | 2004-12-14 | 2015-11-24 | Google Inc. | Providing useful information associated with an item in a document |
KR100819846B1 (ko) * | 2005-04-08 | 2008-04-07 | 김동암 | 인터넷 검색결과 정보를 언어고리로 구성하여 제공하는방법 |
US8453044B2 (en) * | 2005-06-29 | 2013-05-28 | Within3, Inc. | Collections of linked databases |
US7979417B1 (en) * | 2005-06-30 | 2011-07-12 | Google Inc. | Embedded communication of link information |
US8862572B2 (en) * | 2006-02-17 | 2014-10-14 | Google Inc. | Sharing user distributed search results |
US8122019B2 (en) | 2006-02-17 | 2012-02-21 | Google Inc. | Sharing user distributed search results |
US7844603B2 (en) * | 2006-02-17 | 2010-11-30 | Google Inc. | Sharing user distributed search results |
US20080250010A1 (en) * | 2007-04-05 | 2008-10-09 | Samsung Electronics Co., Ltd. | Method and system for determining and pre-processing potential user queries related to content in a network |
US20100257160A1 (en) * | 2006-06-07 | 2010-10-07 | Yu Cao | Methods & apparatus for searching with awareness of different types of information |
CN100524307C (zh) * | 2006-06-27 | 2009-08-05 | 国际商业机器公司 | 一种建立文档间关联关系的方法和装置 |
CN100558045C (zh) | 2006-08-07 | 2009-11-04 | 华为技术有限公司 | 一种生成通信用户描述信息的系统及方法 |
US7831472B2 (en) | 2006-08-22 | 2010-11-09 | Yufik Yan M | Methods and system for search engine revenue maximization in internet advertising |
US20100070351A1 (en) * | 2007-04-13 | 2010-03-18 | Dong Kyun Kang | Electronic advertisement method and system using advertisement intermediation site |
US20080270375A1 (en) * | 2007-04-27 | 2008-10-30 | France Telecom | Local news search engine |
KR101395518B1 (ko) * | 2007-09-03 | 2014-05-14 | 엘지전자 주식회사 | 정보 검색 시스템 |
US8131731B2 (en) | 2007-12-27 | 2012-03-06 | Microsoft Corporation | Relevancy sorting of user's browser history |
US8694887B2 (en) * | 2008-03-26 | 2014-04-08 | Yahoo! Inc. | Dynamic contextual shortcuts |
KR101020138B1 (ko) * | 2008-03-28 | 2011-03-08 | 주식회사 씽크풀 | 컨텐츠 자동 생성 방법 및 그 장치 |
US7987195B1 (en) * | 2008-04-08 | 2011-07-26 | Google Inc. | Dynamic determination of location-identifying search phrases |
US9239884B2 (en) | 2008-05-22 | 2016-01-19 | Alcatel Lucent | Electronic document processing with automatic generation of links to cited references |
JP4859893B2 (ja) * | 2008-08-12 | 2012-01-25 | ヤフー株式会社 | 広告配信装置、広告配信方法、及び広告配信制御プログラム |
JP5173721B2 (ja) * | 2008-10-01 | 2013-04-03 | キヤノン株式会社 | 文書処理システム及びその制御方法、プログラム、記憶媒体 |
US8429106B2 (en) * | 2008-12-12 | 2013-04-23 | Atigeo Llc | Providing recommendations using information determined for domains of interest |
JP2010191940A (ja) * | 2009-01-23 | 2010-09-02 | Kenwood Corp | 情報処理装置および情報処理方法、並びにプログラム |
US20100211960A1 (en) * | 2009-02-17 | 2010-08-19 | Google Inc. | Characterizing User Information |
US8392443B1 (en) * | 2009-03-17 | 2013-03-05 | Google Inc. | Refining search queries |
US8209607B2 (en) * | 2009-04-14 | 2012-06-26 | Freedom Scientific, Inc. | Document navigation method |
JP5306078B2 (ja) * | 2009-06-30 | 2013-10-02 | キヤノン株式会社 | 情報処理装置、情報処理方法、およびプログラム |
US8612435B2 (en) * | 2009-07-16 | 2013-12-17 | Yahoo! Inc. | Activity based users' interests modeling for determining content relevance |
US20110219290A1 (en) * | 2010-03-05 | 2011-09-08 | Skiff, Llc | System For And Method Of Providing Enhanced Content Navigation On A Reader Device |
US8434134B2 (en) | 2010-05-26 | 2013-04-30 | Google Inc. | Providing an electronic document collection |
KR20120001336A (ko) * | 2010-06-29 | 2012-01-04 | 삼성전자주식회사 | 컨텐트 변환 방법 및 그 장치 |
CN102314450B (zh) | 2010-06-30 | 2014-11-26 | 国际商业机器公司 | 用于增强网页浏览的方法和设备 |
US10089404B2 (en) | 2010-09-08 | 2018-10-02 | Evernote Corporation | Site memory processing |
KR20130065710A (ko) * | 2010-09-08 | 2013-06-19 | 에버노트 코포레이션 | 사이트 메모리 프로세싱 및 클리핑 제어 |
JP5735778B2 (ja) * | 2010-10-15 | 2015-06-17 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
TW201217995A (en) | 2010-10-29 | 2012-05-01 | Ibm | Mechanism for facilitating navigation of a webpage on computer device |
US9626651B2 (en) | 2011-02-04 | 2017-04-18 | International Business Machines Corporation | Automated social network introductions for e-meetings |
US20120246561A1 (en) * | 2011-03-22 | 2012-09-27 | Toby Doig | Systems and methods for extended content harvesting for contextualizing |
US9122666B2 (en) * | 2011-07-07 | 2015-09-01 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for creating an annotation from a document |
US8856640B1 (en) | 2012-01-20 | 2014-10-07 | Google Inc. | Method and apparatus for applying revision specific electronic signatures to an electronically stored document |
US9870554B1 (en) | 2012-10-23 | 2018-01-16 | Google Inc. | Managing documents based on a user's calendar |
US9529916B1 (en) | 2012-10-30 | 2016-12-27 | Google Inc. | Managing documents based on access context |
US11308037B2 (en) | 2012-10-30 | 2022-04-19 | Google Llc | Automatic collaboration |
US9384285B1 (en) | 2012-12-18 | 2016-07-05 | Google Inc. | Methods for identifying related documents |
US9495341B1 (en) | 2012-12-18 | 2016-11-15 | Google Inc. | Fact correction and completion during document drafting |
US20140181633A1 (en) * | 2012-12-20 | 2014-06-26 | Stanley Mo | Method and apparatus for metadata directed dynamic and personal data curation |
CA2907583A1 (en) * | 2013-03-18 | 2014-09-25 | Cloudmask | Systems and methods for intercepting, processing, and protecting user data through web application pattern detection |
US10678869B2 (en) * | 2013-05-31 | 2020-06-09 | Verizon Media Inc. | Systems and methods for selective distribution of online content |
KR102186555B1 (ko) * | 2013-07-12 | 2020-12-04 | 삼성전자주식회사 | 전자장치 및 전자장치의 정보 처리방법 |
US9514113B1 (en) | 2013-07-29 | 2016-12-06 | Google Inc. | Methods for automatic footnote generation |
US9842113B1 (en) | 2013-08-27 | 2017-12-12 | Google Inc. | Context-based file selection |
US9973462B1 (en) | 2013-10-21 | 2018-05-15 | Google Llc | Methods for generating message notifications |
US9529791B1 (en) | 2013-12-12 | 2016-12-27 | Google Inc. | Template and content aware document and template editing |
US20150220647A1 (en) * | 2014-02-01 | 2015-08-06 | Santosh Kumar Gangwani | Interactive GUI for clustered search results |
WO2015125209A1 (ja) * | 2014-02-18 | 2015-08-27 | 株式会社日立製作所 | 情報構造化システム及び情報構造化方法 |
US10146774B2 (en) * | 2014-04-10 | 2018-12-04 | Ca, Inc. | Content augmentation based on a content collection's membership |
US10990620B2 (en) * | 2014-07-14 | 2021-04-27 | Verizon Media Inc. | Aiding composition of themed articles about popular and novel topics and offering users a navigable experience of associated content |
US9703763B1 (en) | 2014-08-14 | 2017-07-11 | Google Inc. | Automatic document citations by utilizing copied content for candidate sources |
CN104933020A (zh) * | 2015-07-17 | 2015-09-23 | 北京奇虎科技有限公司 | 基于模板生成目标文档的方法及装置 |
JP5985722B1 (ja) * | 2015-08-18 | 2016-09-06 | エヌ・ティ・ティ レゾナント株式会社 | 情報処理システム、情報処理方法、およびプログラム |
CN106789856A (zh) * | 2015-11-25 | 2017-05-31 | 阿里巴巴集团控股有限公司 | 一种信息编码方法、解码方法及装置 |
CN106951422B (zh) * | 2016-01-07 | 2021-05-28 | 腾讯科技(深圳)有限公司 | 网页训练的方法和装置、搜索意图识别的方法和装置 |
US10552495B2 (en) * | 2016-08-09 | 2020-02-04 | Afilias Limited | Linked network presence documents associated with a unique member of a membership-based organization |
US10169314B2 (en) * | 2016-09-21 | 2019-01-01 | Joseph DiTomaso | System and method for modifying web content |
US10664531B2 (en) | 2017-01-13 | 2020-05-26 | Samsung Electronics Co., Ltd. | Peer-based user evaluation from multiple data sources |
US10755047B2 (en) * | 2017-03-28 | 2020-08-25 | Microsoft Technology Licensing, Llc | Automatic application of reviewer feedback in data files |
EP3857431A1 (en) * | 2018-10-30 | 2021-08-04 | Google LLC | Automatic hyperlinking of documents |
US11263588B2 (en) * | 2018-12-20 | 2022-03-01 | Microsoft Technology Licensing, Llc | Intelligent document management in computing systems |
US11341205B1 (en) * | 2020-05-20 | 2022-05-24 | Pager Technologies, Inc. | Generating interactive screenshot based on a static screenshot |
US11620441B1 (en) | 2022-02-28 | 2023-04-04 | Clearbrief, Inc. | System, method, and computer program product for inserting citations into a textual document |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6122647A (en) * | 1998-05-19 | 2000-09-19 | Perspecta, Inc. | Dynamic generation of contextual links in hypertext documents |
CN1320873A (zh) * | 2001-04-09 | 2001-11-07 | 王纤巧 | 动态搜索引擎 |
GB2368167A (en) * | 2000-10-17 | 2002-04-24 | Radka Radana Dvorak | Knowledge management software system |
CN1459064A (zh) * | 2000-09-14 | 2003-11-26 | 快速检索及传递公司 | 用于在数据网络中搜索和分析信息的方法 |
CN1471020A (zh) * | 2003-06-24 | 2004-01-28 | 南京大学 | 一种自适应的因特网目录网页推荐方法 |
Family Cites Families (53)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0962658A (ja) | 1995-08-21 | 1997-03-07 | Hitachi Inf Syst Ltd | 文書間リンク処理システム |
US5796952A (en) * | 1997-03-21 | 1998-08-18 | Dot Com Development, Inc. | Method and apparatus for tracking client interaction with a network resource and creating client profiles and resource database |
US6134532A (en) * | 1997-11-14 | 2000-10-17 | Aptex Software, Inc. | System and method for optimal adaptive matching of users to most relevant entity and information in real-time |
FI981355A (fi) * | 1998-06-11 | 1999-12-12 | Nokia Mobile Phones Ltd | Elektroninen tiedoston noutomenetelmä ja -järjestelmä |
US6006225A (en) * | 1998-06-15 | 1999-12-21 | Amazon.Com | Refining search queries by the suggestion of correlated terms from prior searches |
US6256633B1 (en) * | 1998-06-25 | 2001-07-03 | U.S. Philips Corporation | Context-based and user-profile driven information retrieval |
JP4010058B2 (ja) | 1998-08-06 | 2007-11-21 | 富士ゼロックス株式会社 | 文書関連付け装置、文書閲覧装置、文書関連付けプログラムを記録したコンピュータ読み取り可能な記録媒体及び文書閲覧プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6513031B1 (en) * | 1998-12-23 | 2003-01-28 | Microsoft Corporation | System for improving search area selection |
US7003719B1 (en) * | 1999-01-25 | 2006-02-21 | West Publishing Company, Dba West Group | System, method, and software for inserting hyperlinks into documents |
US6892238B2 (en) * | 1999-01-27 | 2005-05-10 | International Business Machines Corporation | Aggregating and analyzing information about content requested in an e-commerce web environment to determine conversion rates |
US7072888B1 (en) * | 1999-06-16 | 2006-07-04 | Triogo, Inc. | Process for improving search engine efficiency using feedback |
US7089194B1 (en) * | 1999-06-17 | 2006-08-08 | International Business Machines Corporation | Method and apparatus for providing reduced cost online service and adaptive targeting of advertisements |
US7028072B1 (en) * | 1999-07-16 | 2006-04-11 | Unicast Communications Corporation | Method and apparatus for dynamically constructing customized advertisements |
US7158986B1 (en) * | 1999-07-27 | 2007-01-02 | Mailfrontier, Inc. A Wholly Owned Subsidiary Of Sonicwall, Inc. | Method and system providing user with personalized recommendations by electronic-mail based upon the determined interests of the user pertain to the theme and concepts of the categorized document |
US6405192B1 (en) * | 1999-07-30 | 2002-06-11 | International Business Machines Corporation | Navigation assistant-method and apparatus for providing user configured complementary information for data browsing in a viewer context |
US7213198B1 (en) * | 1999-08-12 | 2007-05-01 | Google Inc. | Link based clustering of hyperlinked documents |
US20020002563A1 (en) * | 1999-08-23 | 2002-01-03 | Mary M. Bendik | Document management systems and methods |
JP3411246B2 (ja) | 1999-10-20 | 2003-05-26 | 株式会社ジャストシステム | クエリ出力装置、文献検索システム、クエリ出力方法、文献検索方法、並びに、記録媒体 |
US7305380B1 (en) * | 1999-12-15 | 2007-12-04 | Google Inc. | Systems and methods for performing in-context searching |
JP2001282830A (ja) | 2000-03-28 | 2001-10-12 | Sony Corp | 情報処理装置および方法、情報処理システム、並びにプログラム格納媒体 |
JP3444592B2 (ja) | 2000-03-30 | 2003-09-08 | 株式会社ジャストシステム | 文書検索装置、クエリ出力装置、文書検索方法、クエリ出力方法、並びに、記録媒体 |
US6563514B1 (en) * | 2000-04-13 | 2003-05-13 | Extensio Software, Inc. | System and method for providing contextual and dynamic information retrieval |
US6581072B1 (en) * | 2000-05-18 | 2003-06-17 | Rakesh Mathur | Techniques for identifying and accessing information of interest to a user in a network environment without compromising the user's privacy |
US6636848B1 (en) * | 2000-05-31 | 2003-10-21 | International Business Machines Corporation | Information search using knowledge agents |
US6574624B1 (en) * | 2000-08-18 | 2003-06-03 | International Business Machines Corporation | Automatic topic identification and switch for natural language search of textual document collections |
JP2002132782A (ja) | 2000-10-27 | 2002-05-10 | Toshiba Corp | マルチメディアデータ管理システム |
US20050060162A1 (en) * | 2000-11-10 | 2005-03-17 | Farhad Mohit | Systems and methods for automatic identification and hyperlinking of words or other data items and for information retrieval using hyperlinked words or data items |
JP2002157270A (ja) | 2000-11-17 | 2002-05-31 | Mitsubishi Space Software Kk | 興味記事配信システム及び興味記事配信方法 |
WO2002052441A1 (en) | 2000-12-22 | 2002-07-04 | Koninklijke Philips Electronics N.V. | Meta data category and a method of building an information portal |
KR20020060417A (ko) | 2001-01-11 | 2002-07-18 | 전종훈 | 사용자별 검색 이력 정보를 이용한 문서 검색 시스템 및문서 검색 방법 |
JP2002236699A (ja) | 2001-02-09 | 2002-08-23 | Asahi Kasei Corp | 情報検索システム及び管理用サーバ並びに制御用プログラム |
US6850934B2 (en) * | 2001-03-26 | 2005-02-01 | International Business Machines Corporation | Adaptive search engine query |
JP2002373175A (ja) * | 2001-06-14 | 2002-12-26 | Nec Corp | サービス検索方法及びシステム |
US20020198859A1 (en) * | 2001-06-22 | 2002-12-26 | International Business Machines Corporation | Method and system for providing web links |
JP2003157259A (ja) * | 2001-09-05 | 2003-05-30 | Fuji Xerox Co Ltd | 情報検索システム |
JP2003271669A (ja) | 2002-03-15 | 2003-09-26 | Fujitsu Ltd | 話題抽出装置 |
US7716161B2 (en) * | 2002-09-24 | 2010-05-11 | Google, Inc, | Methods and apparatus for serving relevant advertisements |
KR20030079095A (ko) | 2002-04-01 | 2003-10-10 | (주)메타웨이브 | 개인 및 그룹별 웹페이지 방문이력정보를 이용한검색시스템 및 그 방법 |
US7127473B2 (en) * | 2002-05-17 | 2006-10-24 | Sap Aktiengesellschaft | Methods and systems for providing supplemental contextual content |
US7441010B2 (en) * | 2002-06-06 | 2008-10-21 | International Business Machines Corporation | Method and system for determining the availability of in-line resources within requested web pages |
JP2004070376A (ja) | 2002-06-10 | 2004-03-04 | Fuji Xerox Co Ltd | 文書表示装置および方法 |
JP2004021358A (ja) * | 2002-06-13 | 2004-01-22 | Matsushita Electric Ind Co Ltd | 情報提供装置、情報提供方法および情報提供システム |
JP2004021598A (ja) * | 2002-06-17 | 2004-01-22 | Information Services International Dentsu Ltd | 購買情報管理システム |
US7836010B2 (en) * | 2003-07-30 | 2010-11-16 | Northwestern University | Method and system for assessing relevant properties of work contexts for use by information services |
US20050222989A1 (en) * | 2003-09-30 | 2005-10-06 | Taher Haveliwala | Results based personalization of advertisements in a search engine |
US20050165615A1 (en) * | 2003-12-31 | 2005-07-28 | Nelson Minar | Embedding advertisements in syndicated content |
US20070282797A1 (en) * | 2004-03-31 | 2007-12-06 | Niniane Wang | Systems and methods for refreshing a content display |
US7664734B2 (en) * | 2004-03-31 | 2010-02-16 | Google Inc. | Systems and methods for generating multiple implicit search queries |
US20070276801A1 (en) * | 2004-03-31 | 2007-11-29 | Lawrence Stephen R | Systems and methods for constructing and using a user profile |
US20050262428A1 (en) * | 2004-05-21 | 2005-11-24 | Little Chad M | System and method for contextual correlation of web document content |
US9626437B2 (en) * | 2004-06-10 | 2017-04-18 | International Business Machines Corporation | Search scheduling and delivery tool for scheduling a search using a search framework profile |
US8005716B1 (en) * | 2004-06-30 | 2011-08-23 | Google Inc. | Methods and systems for establishing a keyword utilizing path navigation information |
US7698626B2 (en) | 2004-06-30 | 2010-04-13 | Google Inc. | Enhanced document browsing with automatically generated links to relevant information |
-
2004
- 2004-06-30 US US10/887,443 patent/US7698626B2/en active Active
-
2005
- 2005-06-29 EP EP05763902A patent/EP1766541A1/en not_active Withdrawn
- 2005-06-29 CA CA2572588A patent/CA2572588C/en not_active Expired - Fee Related
- 2005-06-29 CN CN2005800289044A patent/CN101031915B/zh not_active Expired - Fee Related
- 2005-06-29 BR BRPI0512802-1A patent/BRPI0512802A/pt not_active IP Right Cessation
- 2005-06-29 AU AU2005260076A patent/AU2005260076B2/en not_active Ceased
- 2005-06-29 JP JP2007519332A patent/JP2008505395A/ja active Pending
- 2005-06-29 KR KR1020077001173A patent/KR100932999B1/ko active IP Right Grant
- 2005-06-29 WO PCT/US2005/022726 patent/WO2006004657A1/en active Application Filing
-
2010
- 2010-02-23 US US12/710,480 patent/US8386914B2/en active Active
- 2010-10-15 JP JP2010232644A patent/JP2011034583A/ja active Pending
-
2013
- 2013-02-21 US US13/773,399 patent/US9697205B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6122647A (en) * | 1998-05-19 | 2000-09-19 | Perspecta, Inc. | Dynamic generation of contextual links in hypertext documents |
CN1459064A (zh) * | 2000-09-14 | 2003-11-26 | 快速检索及传递公司 | 用于在数据网络中搜索和分析信息的方法 |
GB2368167A (en) * | 2000-10-17 | 2002-04-24 | Radka Radana Dvorak | Knowledge management software system |
CN1320873A (zh) * | 2001-04-09 | 2001-11-07 | 王纤巧 | 动态搜索引擎 |
CN1471020A (zh) * | 2003-06-24 | 2004-01-28 | 南京大学 | 一种自适应的因特网目录网页推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CA2572588A1 (en) | 2006-01-12 |
BRPI0512802A (pt) | 2008-04-08 |
KR20070043974A (ko) | 2007-04-26 |
US20130173576A1 (en) | 2013-07-04 |
US9697205B2 (en) | 2017-07-04 |
JP2011034583A (ja) | 2011-02-17 |
AU2005260076B2 (en) | 2009-03-19 |
JP2008505395A (ja) | 2008-02-21 |
US20100153422A1 (en) | 2010-06-17 |
KR100932999B1 (ko) | 2009-12-21 |
EP1766541A1 (en) | 2007-03-28 |
US8386914B2 (en) | 2013-02-26 |
CN101031915A (zh) | 2007-09-05 |
WO2006004657A1 (en) | 2006-01-12 |
CA2572588C (en) | 2013-04-23 |
AU2005260076A1 (en) | 2006-01-12 |
US7698626B2 (en) | 2010-04-13 |
US20060005113A1 (en) | 2006-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101031915B (zh) | 增强第一文档的方法和系统 | |
CN102246167B (zh) | 提供搜索结果 | |
CN101416186B (zh) | 增强的搜索结果 | |
CN102207971B (zh) | 用于提供搜索结果的系统和方法 | |
JP5526269B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
US8762318B2 (en) | Supplementing a trained model using incremental data in making item recommendations | |
JP5281405B2 (ja) | 表示のための高品質レビューの選択 | |
US8260786B2 (en) | Method and apparatus for categorizing and presenting documents of a distributed database | |
US20060287920A1 (en) | Method and system for contextual advertisement delivery | |
US20060129463A1 (en) | Method and system for automatic product searching, and use thereof | |
CN101568921A (zh) | 数字内容的动态定价模型 | |
US20040172389A1 (en) | System and method for automated tracking and analysis of document usage | |
KR20030091751A (ko) | 분배 데이터베이스의 문서 분류 및 제시용 방법 및 장치 | |
JP2008507041A (ja) | 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ | |
CN101568938A (zh) | 数字媒体对象的链接翻新 | |
KR20050049750A (ko) | 온라인 광고 시스템 및 방법 | |
JP2011039853A (ja) | 銘柄推奨システム及び銘柄推奨プログラム | |
US20050182677A1 (en) | Method and/or system for providing web-based content | |
KR20130033693A (ko) | 컨셉 키워드 확장 데이터 셋을 이용한 검색방법, 장치 및 컴퓨터로 판독 가능한 기록매체 | |
JP2008097614A (ja) | サードパーティーサービス提供方法及びサードパーティーサービス提供装置 | |
CN108229990B (zh) | 一种广告标题生成方法、装置和设备 | |
JP7145215B2 (ja) | ブラウザ管理システム、ブラウザ管理方法、ブラウザ管理プログラム、およびクライアントプログラム | |
KR20130033694A (ko) | 컨셉 키워드 확장 데이터 셋 생성방법, 장치 및 컴퓨터로 판독 가능한 기록매체 | |
CN111831885A (zh) | 一种互联网信息检索系统与方法 | |
CN115298660A (zh) | 基于人工智能的资讯配图方法、设备、介质及程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20131023 Termination date: 20150629 |
|
EXPY | Termination of patent right or utility model |