CN105264486B - 用于智能研究平台的手机可访问系统和过程 - Google Patents
用于智能研究平台的手机可访问系统和过程 Download PDFInfo
- Publication number
- CN105264486B CN105264486B CN201380066585.0A CN201380066585A CN105264486B CN 105264486 B CN105264486 B CN 105264486B CN 201380066585 A CN201380066585 A CN 201380066585A CN 105264486 B CN105264486 B CN 105264486B
- Authority
- CN
- China
- Prior art keywords
- image
- identifier
- data
- portable computing
- unique alphanumeric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/432—Query formulation
- G06F16/434—Query formulation using image data, e.g. images, photos, pictures taken by a user
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Library & Information Science (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本披露的示例性实施例涉及实现写作作品中的引文的基于图像的检索。可以响应于从便携式计算装置接收的请求以程序方式比较从写作作品的一部分获得的图像上提取的唯一字母数字标识符和在权威数据库中的所存储的多个标识符。可以响应于该唯一字母数字标识符和与该权威数据库中存储的参考文献相关联的该多个所存储的标识符中的至少一个标识符的令人满意的比较从该权威数据库检索引文数据,并且该引文数据可以被提供给该便携式计算装置以便输出在该便携式计算装置的显示器上。
Description
本申请要求2012年12月18日提交的美国临时专利申请序列第61/738,725号和2013年3月15日提交的美国临时专利申请序列第61/789,663号的优先权,这些披露通过引用以其全文结合于此。
版权通知
该专利申请的一些部分包括受到版权保护限制的材料。版权所有者不反对任何人对该专利文档本身或该专利申请所进行的复制,因为它出现在美国专利和商标办公室的文件中,但无论何时都会保留所有版权。
技术领域
本披露的示例性实施例涉及可以结合文献目录数据库和参考文献搜索管理软件使用的智能研究平台,例如那些包括研究和创作能力软件的平台,并且更具体地涉及手机可访问的工作流系统和过程以提高对可通过智能研究平台访问的引文和/或其他权威数据库的数据和信息的访问和可用性。
背景
移动技术极大地改变着人们访问和使用数据和信息的方式以及他们对与这种移动模式相关的技术能力的期望。数据和信息的用户要求“始终在线”、便携、可连接并且以平台无关的方式较快地和无缝地访问数据和信息。随着基础设施上的改进以努力保持更新,智能手机、平板电脑、小型笔记本和其他便携式装置的激增同时推动并回应了这种要求。用户期望就是她将能够通过便携式计算装置影响先前台式电脑的单一领域的功能和特征。
除了改变获得数据和信息的方式以外,移动技术也同时推动并回应了可获取的信息的类型和种类的需求。例如,在学术和科学研究以及写作作品领域中,访问和使用大量和种类繁多的数据和内容以及其他信息的需求很大,它们包含在文献的写作作品中,例如书籍、论文、法律意见书、期刊文章、杂志或其他期刊、手稿、以及由社团、行业和专业组织所提交、递送和出版的例如会议和交易出版物方面的论文。这种学术和科学研究的用户访问和使用这类数据和信息的一种方式是通过“文献引文”。
“文献引文”是一种记录研究、支持材料和组织研究领域的复杂过程和规范。为了促进学术写作作品中所发布信息的大范围传播以便更高效和更有效地推动研究实体,科学家中的学者们使用文献引文来承认其他人、甚至他们自己的前期工作,他们写作作品中提出的进展就是基于这些前期工作。“文献目录”可以指特定于作者、出版商或给定主题的写作作品的完整或选择性列表或汇编,或者它可以指作者在准备具体写作作品时所依赖的或考虑到的写作作品(例如论文、文章、书籍或其他信息对象)的列表或汇编。
包括在任何特定作品或作品正文中的“引文”或“引用参考文献”在本文用于宽泛地指代所引用的参考文献、书目或其他参考文献数据,它们共同形成了文内参考文献、附注、尾注以及文献目录,并且用于确认作者所依赖的或考虑的信息来源以及给读者证实内容和方向精确度的一种方法以便进一步研究。引文简要地将所引用的写作作品描述并标识为信息来源或权威参考。引文和文献目录遵循特定的格式习惯以提高解释信息的一致性。每个引文通常包括以下信息:完整的标题、作者姓名、出版数据,出版数据包括出版商标识、卷、版本和其他数据、以及出版的日期和地点。
引文还常常包括被称为数字对象标识符(“DOI”)的唯一字母数字标识符。DOI系统由国际DOI基金会创立并被采纳为国际标准ISO 26324。DOI是用于唯一标识电子文档(包括前文提到的文献的学术写作作品)的字符串。包括学术写作作品或其他文档的URL或其他位置的元数据与DOI相关联并进行存储。尽管元数据和URL或其他位置可以改变,但DOI对文档而言是唯一的且永久的。因此DOI为访问和检索文档提供了更加一致的中间稳定链接。
前文提及的学术写作作品可以通过综合参考文献管理系统获得,例如汤森路透(Thomson Reuters)的知识网(Web of Knowledge)研究平台。这类研究平台提供了研究和创作能力软件的综合的或可集成的系统,以用于结合相关数据库来访问大范围的学术数据中间内容。例如,Thomson Reuters的可商购的科学网(Web of)解决方案通过从商业的、专属的数据库以及公用的引文数据库(例如CrossRef和FubMed)访问的文献和引文内容以及信息来提供引文研究和分析。这些参考文献管理系统可以进一步地整合创作工具和解决方案,例如Thomson Reuters出版解决方案,它包括EndNote和Reference它们是可商购的解决方案,用于创建、书写、出版和管理文献、论文、出版物以及其他学术文档。
鉴于不断增长的“始终在线”、便携、连接性和以平台无关的方式较快地和无缝地访问数据和信息的要求,需要改进的手机可访问的系统和过程以便为用户提供对所引用的参考文献和/或通过智能研究平台可访问的其他权威数据库的学术和科学研究获取。
概述
本文披露了移动工作流系统和过程以提供对引文的数据信息和/或可通过智能研究平台访问的其他权威数据库的增强访问及其可用性。本披露的示例性实施例可用于实现权威数据库的引文数据的基于图像的检索。基于图像的检索可以包括将写作作品中包括的文本的图像转换为机器可读格式以帮助从该图像中提取唯一字母数字标识符,该唯一字母数字标识符可用于从权威数据库中检索引文数据。
根据本披露的实施例,披露了一种实现写作作品中引文的基于图像的检索的方法。该方法包括计算机系统响应于从便携式计算装置接收的请求以程序方式比较从写作作品的一部分获得的图像上提取的唯一字母数字标识符和在权威数据库中存储的多个标识符。该便携式计算装置具有显示器、至少一个处理器、电池以及图像捕获装置。该方法还包括执行代码以便响应于该唯一字母数字标识符和与该权威数据库中存储的参考文献相关联的该多个所存储的标识符中至少一个标识符的令人满意的比较从该权威数据库检索引文数据,并且从该计算机系统向该便携式计算装置提供该引文数据以便输出在该便携式计算装置的该显示器上。
根据本披露的实施例,披露了一种用于实现写作作品中的引文的基于图像的检索的系统。该计算机系统包括一个或多个计算装置。该一个或多个计算装置具有至少一个处理装置和至少一个非瞬态计算机可读介质,该非瞬态计算机可读介质存储由该至少一个处理装置执行的指令。该至少一个处理装置执行指令使得该处理装置响应于从便携式计算装置接收的请求以程序方式比较从写作作品的一部分获得的图像上提取的唯一字母数字标识符和在权威数据库中的所存储的多个标识符。该便携式计算装置具有显示器、至少一个处理器、电池以及图像捕获装置。该至少一个处理装置执行指令进一步使得该处理装置响应于该唯一字母数字标识符和与该权威数据库中存储的参考文献相关联的该多个所存储的标识符中的至少一个标识符的令人满意的比较从该权威数据库检索引文数据,并且从该计算机系统向该便携式计算装置提供该引文数据以便输出在该便携式计算装置的该显示器上。
根据本披露的实施例,披露了一种用于实现从权威数据库基于图像检索写作作品中的引文的便携式计算装置。该便携式计算装置包括非瞬态计算机可读介质、图像捕获单元、处理装置和电池。该非瞬态计算机可读介质存储可执行指令以帮助从权威数据库基于图像检索写作作品中的引文。该图像捕获单元被配置为用于采集包括在该写作作品中的文本的图像。该电池被配置为用于为该非瞬态计算机可读介质、该图像捕获单元和该处理装置供应电力。该处理装置操作性地耦合到该图像捕获单元和该非瞬态计算机可读介质并且被编程用于执行可执行指令以便与该图像采集单元进行交互来接收该写作作品中包括的该文本的该图像,基于对该图像执行的字符识别过程从该图像提取唯一字母数字标识符以便将该图像中的该文本转换为机器可读的格式,并响应于该唯一字母数字标识符和该权威数据库中的所存储的标识符的比较来接收该权威数据库中存储的该引文数据。该便携式计算装置可以是移动电话或平板计算装置。
根据本披露的实施例,该唯一字母数字标识符可以在执行字符识别过程时提取,该字符识别过程包括光学字符识别(OCR)过程、智能字符识别(ICR)过程、和/或智能单词识别(IWR)过程。从该图像中提取该唯一字母数字标识符可以由该便携式计算装置、该计算机系统和/或第二计算机系统实现的字符识别过程来进行,该第二计算机系统可以与该计算机系统相分离或整合在一起。可以解析从该图像提取的多个字母数字字符以获得该唯一字母数字标识符。在一些实施例中,该唯一字母数字标识符可以是数字对象标识符。
根据本披露的实施例,该写作作品可以是学术参考文献出版物并且该图像可以包括该学术参考出版物的文本。该唯一字母数字标识符可以包括从该图像中包括的该文本提取的多个字母数字字符,并且可用于以引文数据库的形式从权威数据库检索引文数据。引文数据可以包括标题、作者和/或出版年信息。引文数据可以由该便携式计算装置存储在参考文献管理系统中。该参考文献管理系统可以与该计算机系统集成在一起并且可以包括基于web的用户接口。
根据本披露的实施例,如果该唯一字母数字标识符未与该权威数据库中的该多个所存储的标识符进行令人满意的比较,可以由该计算机系统接收来自该便携式计算装置的进一步请求,该进一步请求包括经修改的搜索条件。可以基于经修改的搜索条件搜索该权威数据库。
根据本披露的实施例,可以实现授权过程以确定该便携式计算装置的用户是否是授权用户和/或该便携式计算装置的用户的授权等级。可以基于该用户的第一授权等级从该计算机系统提供该引文数据的第一子集,并且可以基于该用户的第二授权等级从该计算机系统提供该引文数据的第二子集。该第一和第二授权等级可以是基于订阅服务等级的,并且可以基于订阅状态对该用户进行认证。如果便携式计算装置的用户被授权,优化该引文数据以显示在该便携式计算装置上。
可以设想实施例的任何组合和变换。其他目的和特征将从以下结合附图的详细描述中变得明显。然而应当理解的是,附图是仅作为例证而设计的,并不作为本披露的限制定义。
附图简要说明
在与附图一起阅读时,本披露的示例性实施例将从以下详细描述中得到理解。在附图中,贯穿本发明的非限定的且非详尽的实施例的各个视图,类似的参考号指代类似的部件,并且在附图中:
图1是根据本披露的示例性实施例描绘示例性参考文献管理环境的框图。
图2是根据本披露的实施例的便携式计算装置的框图,该装置可用来与参考文献管理系统进行交互。
图3是根据本披露的示例性实施例的示例性计算装置的框图,该装置可用于实现参考文献管理系统或其部分。
图4至图9根据本披露的示例性实施例描绘了呈现硬件和软件组件和服务的配置以实现参考文献管理环境的示意图。
图10根据本披露的示例性实施例描绘了综合参考文献管理系统的在线信息检索和分析组件的示例性实施例。
图11根据本披露的示例性实施例展示了可利用的文献的写作作品的非详尽示例。
图12根据本披露的示例性实施例展示了在便携式计算装置上渲染的示例性图像采集接口。
图13和图14根据本披露的示例性实施例展示了可以在便携式计算装置的显示器上渲染的示例性图形用户接口。
图15根据本披露的示例性实施例描绘了可以在便携式计算装置的显示器上渲染以检索并存储引文参考数据的示例性图形用户接口。
图16是根据本披露的示例性实施例展示了可以实现的示例性基于图像的参考文献检索过程的流程图。
图17是根据本披露的示例性实施例展示了可以实现的示例性基于图像的参考文献检索过程的流程图。
具体实施方式
本披露的示例性实施例涉及响应于从包括唯一字母数字标识符的写作作品的一部分捕获的图像基于图像检索引文数据,这种检索可用于从权威数据库检索一个或多个参考文献。本披露的示例实施例提供了一种高效方法来检索引文数据,以便为提供用户需求的“始终在线的”、便携式的、较快且无缝的访问引文数据的接口。
图1是根据本披露的示例性实施例描绘示例性参考文献管理环境10的框图,以便基于写作作品104中包括的唯一字母数字标识符102的所捕获的图像来帮助搜索、标识和/或检索文献目录信息和/或一个或多个参考文献的一个或多个全文版本(基于图像的参考文献检索)。环境10的示例性实施例可以包括参考文献管理系统100,该参考文献管理系统可以利用硬件、软件和/或其组合形式来实现。作为一个示例,在一些实施例中,可以对一个或多个计算装置进行编程和/或配置以实现系统100或其一些部分的示例性实施例。系统100可以包括:与图像捕获引擎120进行通信的用户接口110,该引擎控制图像捕获装置122;识别引擎130;启发引擎140;提取引擎150;通信地耦合到一个或多个权威数据库162的参考文献管理器160;个人参考文献图书馆170;全文数据库180;以及事务/订户引擎190。
唯一字母数字标识符102可以是一串字母数字字符(例如,文本和数字)。在示例性实施例中,唯一字母数字标识符102可以是例如数字对象标识符(“DOI”)、国际标准书号(ISBN)、Pubmed标识符/Pubmed中央标识符、CAS登记号、和/或可用于检索作品内的参考文献引用的任何其他适合的唯一字母数字标识符。ISBN是分配给书籍的唯一商业书籍标识符并且是基于9个数字标准书号(SBN)码。Pubmed标识符/Pubmed中央标识符是用于美国国家医学图书馆的Pubmed数据库的文档标识模式。CAS登记号是用于美国化学学会的商业化学摘要数据库的化学摘要标识号。术语“字母数字”在本文用于泛指由来自一种或多种原住语或字母表(例如拉丁语、汉语、日语等)的字母/字符、来自一种或多种原住语(例如阿拉伯语)的数字/数位形成的唯一标识符,和/或字母/字符和数字/数位的组合。
写作作品104可以是结合唯一字母数字标识符的任何文献写作作品,该唯一字母数字标识符可用于标识和/或检索对该文献写作作品的引用和/或其中的引用。例如,写作作品104可以是文章(例如学术文章、行业文章、期刊文章)、书籍、期刊、论文、学位论文、申请书、专利申请、专利等。唯一字母数字标识符102可以嵌入在写作作品104上或中并且可以由写作作品104的内容环绕或结合到其中,这样使得唯一字母数字标识符102的图像捕获还可以包括写作作品104的其他内容,这样使得唯一字母数字标识符可能需要区分于其他内容并从其他内容中独立提取。
可以对用户接口110编程和/或配置以提供一个或多个图形用户接口(GUI)112,用户可以通过该图形用户接口与系统100进行交互。显示给用户的GUI 112可以包括:数据输入区以便从用户接收信息;用户可选元素或区域,用户可以选择该用户可选元素或区域以使得系统100执行一项或多项操作、功能和/或过程;和/或可以包括数据输出以向用户显示信息。在示例性实施例中,用户接口可以由用户使用以接口连接引擎120、130、140和150、以及参考文献管理器160、个人参考文献图书馆170、全文数据库180和事务引擎190。
可以对图像捕获引擎120进行编程和/或配置以控制图像捕获装置122(例如数字静态照相机)以响应于通过用户接口110接收的用户输入捕获写作作品104的一部分的图像,该图像包括唯一字母数字标识符102。图像捕获装置所捕获的图像可以提供给用户接口110,用户接口可以将图像显示给用户和/或将图像作为输入提供给识别引擎130。在一些实施例中,图像可以自动地提供给识别引擎130和/或可以响应于通过用户接口110从用户接收的输入而提供给识别引擎130。在一些实施例中,图像捕获引擎120可以直接向识别引擎140提供图像。
识别引擎130可以从图像捕获引擎120和/或用户接口110接收图像捕获装置122所捕获的图像。在示例性实施例中,可以对识别引擎130进行编程和/或配置以便将所捕获的图像转换为机器编码的数据或文本元素。识别引擎130可以利用光学字符识别(OCR)过程、智能字符识别(ICR)过程、和/或智能单词识别(IWR)过程从所捕获的图像中标识并提取数据或文本元素。
数据/文本元素可以提供给启发引擎140,可以对启发引擎进行编程和/或配置来执行一个或多个过程,以便标识所提取的数据/文本元素所形成的唯一字母数字标识符102。例如,可以对启发引擎140进行编程和/或配置来识别与一种或多种唯一字母数字标识符相关联的模式和/或签名,以便标识从所捕获的图像中提取的数据/文本元素中的至少一些所形成的唯一字母数字标识符。作为一个示例,启发引擎140可以针对具有一些元素(对应于一种或多种指定类型的唯一字母数字标识符中的一些元素)的多组数据/文本元素来搜索数据/文本元素,和/或可以标识每个所标识的群组中的元素是否包括在该群组内的以指定顺序或位置存在的指定类型的数据/文本元素。作为另一个示例,可以对启发引擎140进行编程和/或配置,以便基于从所捕获的图像所提取的数据/文本元素中所发现的模式以特定的顺序来搜索多个权威数据库。在一些实施例中,可以对启发引擎140进行编程和/或配置,以便基于从所捕获的图像所提取的数据/文本元素中所发现的模式来限制特定权威数据库内对特定字段子集的搜索。
可以对提取引擎150进行编程和/或配置以便从数据/文本元素中提取唯一字母数字标识符。例如,启发引擎140可以基于启发引擎140执行的过程为提取引擎150提供唯一字母数据标识符102,并且提取引擎150可以向用户接口110提供唯一字母数字标识符,用户接口可以向用户显示该唯一字母数字标识符和/或可以为参考文献管理系统160提供唯一字母数据标识符102。在一些实施例中,提取引擎150可以从识别引擎130直接接收数据/文本元素,并且可以对提取引擎进行编程和/或配置以标识并从数据/文本元素中提取唯一字母数字标识符102。
在示例性实施例中,可以对提取引擎150进行编程和/或配置来执行用来解析所提取的文本/数据元素的代码或脚本,以便确定唯一字母数字标识符是否存在于所捕获的图像中。例如,提取引擎150可以确定是否存在对应于一种或多种预定义类型的字母数字标识符的任何字母数字标识符。如果存在,提取引擎可以为用户接口110提供该唯一字母数字标识符,该用户接口可以向参考文献管理器160提供唯一字母数字标识符以帮助检索与该唯一字母数字标识符相关联的文献目录信息和/或帮助检索与该唯一字母数字标识符相关联的参考文献的全文版本。在一些实施例中,提取引擎150可以向参考文献管理器160直接提供唯一字母数字标识符。如果未检测到唯一字母数字标识符,提取引擎150通知用户接口未检测到唯一字母数字标识符或者获得唯一字母数字标识符的过程由于其他原因失败。在一些实施例中,可以对提取引擎150进行编程和/或配置来与参考文献管理器进行交互,以便如果未检测到与预定义类型的唯一字母数字标识符的精确匹配则提示可能的唯一字母数字标识符。
当接收到唯一字母数字标识符102,参考文献管理器160可以为所存储的标识符搜索权威数据库中的一个或多个,这些所存储的标识符对应于唯一字母数字标识符102。例如,参考文献管理器160可以搜索权威数据库中的一个或多个所存储的唯一字母数字标识符或类似标识符的实例。在一些实施例中,参考文献管理器160可以包括搜索条件,搜索条件包括唯一字母数字标识符以及其他参数,以便不但帮助检索对应于唯一字母数字标识符和所存储的标识符之间的精确匹配的参考文献,而且帮助检索具有类似于唯一字母数字标识符的所存储的标识符的其他参考文献。利用这种方法,参考文献管理器160可以返回具有所存储的标识符的参考文献,该所存储的标识符精确地匹配从写作作品104捕获的唯一字母数字标识符102,可以返回具有类似于唯一字母数字标识符102的所存储的标识符的一个或多个参考文献,或者可以都返回,它们可以提供给用户接口110以显示给用户。如果参考文献管理器160基于搜索不返回任何参考文献,参考文献管理器160可以指示用户接口未发现结果,并且可以对用户接口110进行编程和/或配置以从用户请求进一步的搜索信息,例如作者信息、标题信息、出版商信息、出版日期、和/或可以由参考文献管理器160使用的任何其他适合信息,以便查询权威数据库162以供参考。
权威数据库162可以包括专有和/或公共数据库,在该数据库中唯一字母数字标识符被分配给包括文献目录信息和/或完整写作作品的数据结构,该数据结构可用于一致地、唯一地且明确地标识文献目录信息和/或完整写作作品。写作作品的文献目录信息和全文版本在本文可以统一地或独立地称为引文数据。权威数据库可以包括对其他数据结构的交叉引用和/或逻辑联系,这些数据结构例如基于原创作者、标题、出版商、摘要、出版年等包括相关的或类似的写作作品。权威数据库的一些示例包括例如Web of Science、Web ofKnowledge、Cortellis、生物学文摘(Biological Abstracts)、和/或Thomson Reuters提供的汤森路透创新(Thomson Reuters Innovation)以及国家生物技术信息中心(NationalCenter for Biotechnology Information,NCBI)的PubMed、AMJUR、Crossref.org、ITHAKA的JSTOR、和/或BioOne。
参考文献管理器160基于对权威数据库162中的一个或多个的查询返回一个或多个参考文献后,用户可以通过用户接口110在个人参考文献图书馆170中存储这些参考文献中的一个或多个以备后用和/或可以从全文数据库180检索参考文献的全文版本。个人参考文献图书馆170可以在用户账户中包括由用户所存储的一个或多个参考文献。全文数据库180可以通过用户接口从用户接收请求以检索参考文献管理器160所执行的查询所返回的写作作品的完整版本。在一些实施例中,参考文献管理器160可以自动地在个人参考文献图书馆中存储查询所返回的参考文献和/或可以自动地查询全文数据库180以检索并返回参考文献的全文版本至用户。
在一些实施例中,费用可能与访问参考文献管理器160、个人数据图书馆170、和/或全文数据库180相关联。在这些实施例中,用户接口110可以与事务引擎190相交互。可以对事务引擎190进行编程和/或配置以帮助付费,从而允许访问参考文献管理器160、个人数据图书馆、和/或全文数据库180。例如,用户可以通过用户接口110接口连接系统100,但在使得用户可以访问参考文献管理器和/或全文数据库之前,可以要求用户通过事务引擎开户。在一些实施例中,全文数据库180还可以是权威数据库。
图2是便携式计算装置200的框图,该装置可用来实现参考文献管理系统100的实施例和/或与其进行交互。便携式计算装置200可以是智能电话、平板电脑、小型笔记本电脑、膝上型计算机、个人数字助理(PDA)和/或任何其他适合的便携式计算装置,该便携式计算装置包括图像捕获装置或可以操作性地连接至该图像捕获装置,并且可以进行编程和/或配置以实现参考文献管理系统100和/或与其进行交互。便携式计算装置200可以包括处理装置204(例如数字信号处理(DSP)或微处理器)、非瞬态计算机可读介质形式的存储器/存储装置206、图像捕获单元208、显示单元210、电池212和射频收发器214。便携式计算装置200的一些实施例通常还可以包括其他常见组件,例如传感器216、用户身份模块(SIM)卡218、音频组件220和222、以及电源管理电路224。
存储装置206可以包括任何适合的、非瞬态计算机可读存储介质,例如只读存储器(ROM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、哈希存储器等。在示例性实施例中,操作系统226和应用228可以体现为计算机可读/可执行程序代码,这些代码存储在非瞬态计算机可读存储器206上并利用任何适合的、高级或低级计算语言和/或平台来实现,例如像Java、C、C++、C#、汇编代码、机器可读语言等等。在一些实施例中,应用228可以包括被配置为用于与图像捕获单元相交互的图像应用、web浏览器应用、专门编码为与参考文献管理系统100的实施例接口连接的移动应用、引擎130、140和/或150。尽管将存储器描绘为单个组件,但本领域技术人员将认识到存储器可以由多个组件形成并且可以使用独立的非易失性和易失性存储器装置。
处理装置204可以包括任何适合的架构的任何适合的单核或多核微处理器,该架构能够实现和/或帮助便携式计算装置200的操作。例如,为了执行图像捕获操作,传输所捕获的图像(例如,通过RF收发器214)、传输/接收所捕获的图像中包括的唯一字母数字标识符(例如通过RF收发器214)、显示包括用户接口110的GUI 112的数据信息、所捕获的图像、唯一字母数字标识符、文献目录信息、参考文献的全文版本等等。可以对处理装置204进行编程和/或配置以执行操作系统226和应用228(例如,图像应用和引擎130、140和150)来实现一个或多个过程以便执行操作。处理装置204可以从存储装置206检索信息/数据并将信息数据存储到存储装置。例如,处理装置可以检索和/或存储所捕获的图像、包括在所捕获的图像中的唯一字母数字标识符、文献目录信息、参考文献的全文版本和/或可由便携式计算装置和/或用户使用的任何其他适合的信息/数据。
可以将RF收发器214配置为用于通过天线215传送和/或接收无线传输。例如,可以将RF收发器214配置为用于直接或间接地向一个或多个服务器传送数据/信息,例如图像捕获单元所捕获的一个或多个图像和/或包括在所捕获的图像中的唯一字母数字标识符,和/或配置为用于直接或间接地从一个或多个服务器接收数据/信息,例如唯一字母数字标识符、对应于唯一字母数字标识符的文献目录信息和/或对应于唯一字母数字标识符的参考文献的全文版本。可以将RF收发器214配置为用于以指定的频率和/或根据指定的顺序和/或分组排列传送和/或接收信息。
显示单元210可以为用户渲染用户接口,例如图形用户接口,并且在一些实施例中可以提供允许用户与GUI相交互的机制。例如,用户可以通过显示单元210与便携式计算装置200交互,显示单元可以实现为液晶触摸屏(或触觉)显示器、发光二极管触摸屏显示器、和/或任何其他适合的显示器,这些显示器可以显示可根据示例性实施例提供的一个或多个用户接口(例如GUI 112)。
电源212可以实现为电池或电容性元件,它们被配置为用于存储电荷并为便携式计算装置供电。在示例性实施例中,电源212可以是可充电电源,例如被配置为用于通过连接至外部电源的连线进行充电的电池或一个或多个电容性元件。
在一些实施例中,便携式计算装置可以通过图像捕获引擎120的执行和/或应用228之一的执行来实现OCR或其他字符/单词识别过程。在这些实施例中,图像捕获单元208可以包括预处理字符识别和数据元素提取单元以作为图像捕获引擎120的一部分,图像捕获引擎与存储在便携式计算装置的主存储器中的应用228之一协同工作以便将所捕获的图像转换为机器编码数据或文本并解析所提取的文本/数据元素。在一些实施例中,便携式计算装置200可以包括图像表征单元230,图像表征单元由处理装置204使用以确定其图像正在捕获的文档的“纹理”(例如论文类型)。响应于这种确定,处理装置204可以为图像捕获分配适当的成像算法以改进图像识别过程并最小化或减少图像识别过程中的潜在误差和/或错误。
图3是示例性计算装置300的框图,该计算装置可用于实现参考文献管理系统100或其一些部分的实施例。在本发明中,将计算装置300配置为服务器,可以对该服务器进行编程和/或配置以执行参考文献管理系统100的操作和/或功能中的一项或多项并帮助与便携式计算装置的通信,例如便携式计算装置200的实施例。计算装置300包括一个或多个非瞬态计算机可读介质来存储一个或多个计算机可执行指令或软件以实现示例性实施例。非瞬态计算机可读介质可以包括但不限于一种或多种硬件存储器、非瞬态有形介质(例如一个或多个磁性存储盘、一个或多个光盘、一个或多个闪存驱动器)等。例如,包括在计算装置300中的存储器306可以存储计算机可读和计算机可执行指令或软件,以实现系统100或其多个部分的实施例。计算装置300还包括可配置和/或可编程的处理器302和相关联的核304,并且可选地包括一个或多个附加可配置和/可编程的处理器302'以及相关联的核304'(例如,在计算机系统具有多个处理器/核的情况下),以便执行存储在存储器306中的计算机可读和计算机可执行指令或软件以及其他程序以控制系统硬件。处理器302和处理器302'可以各自是单个核处理器或多核(304和304')处理器。
在计算装置300中可以采用虚拟化,这样使得可以动态地共享计算装置中的基础设施和资源。可以提供虚拟机314来处理运行在多个处理器上的进程,这样使得该进程仿佛是只使用一个计算资源而不是多个计算资源。多个虚拟机也可以与一个处理器一起使用。
存储器306可以包括计算机系统存储器或随机存取存储器,例如DRAM、SRAM、EDORAM等。存储器306还可以包括任何类型的存储器或其多种组合。
计算装置300还包括一个或多个存储装置324,例如硬盘、CD-ROM、大容量存储闪存驱动器、或其他计算机可读介质,以便存储数据和处理装置302可执行的计算机可读指令和/或软件以实现本文描述的系统100的示例性实施例。
计算装置300可以包括网络接口312,该网络接口被配置为通过一个或多个网络装置322与一个或多个网络接口连接,例如局域网(LAN)、广域网(WAN)或互联网,其方式是通过各种连接方式,包括但不限于标准电话线、LAN或WAN链路(例如,802.11、T1、T3、56kb、X.25)、宽带连接(例如ISDN、帧中继、ATM)、无线连接(包括通过蜂窝基站)、控域网(CAN)、或以上方式中任何或全部的某种组合形式。网络接口312可以包括内置网络适配器、网络接口卡、PCMCIA网卡、卡总线网络适配器、无线网络适配器、USB网络适配器、调制解调器或适合于将计算装置300接口连接至能够进行通信并执行本文所描述操作的任何类型网络的任何其他装置。尽管将图3中描绘的计算装置300实现为服务器,但计算装置300的示例性实施例可以是任何计算机系统,例如工作站、桌上计算机或其他形式的计算或电信装置,该计算或电信装置能够通过无线通信或有线通信与其他装置进行通信并且具有足够的处理器功率和存储器容量以执行本文描述的操作。
计算装置300可以运行任何服务器应用316,例如服务应用的多个版本中的任何一种,包括任何基于Unix的服务器应用、基于Linux的服务器应用、任何专有服务器应用、或能够在计算装置300上运行并执行本文所描述操作的任何其他服务器应用。可以在计算装置上运行的服务器应用的示例包括阿帕奇(Apache)服务器应用。
图4是呈现软件组件/服务的系统配置以在客户端-服务器环境400中实现系统100的示例性实施例的示意图。如图4所示,环境400包括通过通信网络450操作地耦合到(便携式计算装置)客户端420至422的服务器410,通信网络可以是任何网络,信息可以通过该网络在通信地耦合到网络的装置之间进行传输。例如,通信网络450可以是互联网、内联网、虚拟专有网络(VPN)、广域网(WAN)、局域网(LAN)等等。服务器410的实施例可以采用类似于图3的计算装置300的方式来实现,并且客户端420至422可以采用类似于图2的便携式计算装置200的方式来实现。
在示例性实施例中,系统100可以由服务器410来实现。服务器410可以实现为托管系统100的用户接口的web服务器,该服务器可以由客户端420至422访问以便在客户端420至422的显示器上显示用户接口的GUI,GUI可用于帮助文献目录信息的基于图像的检索和/或与包括在客户端420至422所捕获的图像中的唯一字母数字标识符相关联的参考文献的全文版本。
如图4所示,客户端420至422可以各自包括客户端侧应用423,该应用被编程和/或配置为用于与服务器410进行交互以访问和执行环境100。在一些实施例中,客户端420至422中的一个或多个所实现的客户端侧应用423可以是能够导航至托管系统100的GUI的一个或多个网页的web浏览器。在一些实施例中,由客户端420至422中的一个或多个客户端实现的客户端侧应用423可以是特定于系统100的应用,该应用安装在客户端420至422上以允许与系统100的交互由服务器410来执行。
在示例性操作中,客户端420至422可以由用户操作以捕获写作作品的多个部分的图像,这些图像包括与写作作品相关联的唯一字母数字标识符或写作作品内所引用的参考文献。例如,用户可以通过客户端420至422访问系统以便在客户端420至422的显示器上显示GUI,GUI提供了接口以捕获图像。捕获图像之后,客户端420至422可以通过通信网络450将图像传送至服务器410(或者无线或者通过有线)。服务器正在执行的系统可以将所捕获的图像转换为机器编码的数据或文本元素,可以对数据或文本元素进行解析以检测包括在所捕获的图像中的唯一字母数字标识符。在一些实施例中,启发法可用于执行数据/文本元素的分析以帮助检测唯一字母数字标识符。如果检测到唯一字母数字标识符,系统100可以指令服务器410通过GUI向用户显示该唯一字母数字标识符以进行确认。
系统100可以包括一个或多个权威数据库和/或全文数据库(例如数据库430)和/或与其进行接口连接,以便响应于用户的确认和/或自动地(例如,无需用户的确认)检索文献目录信息和/或与唯一字母数字标识符相关联的参考文献的全文版本。一旦系统100检索到文献目录信息和/或全文,可以通过服务器410经由在客户端装置420至422中显示的GUI使该文献目录信息和/或全文对用户可用。用户可以控制客户端420至422以浏览文献目录信息和/或全文,保存文献目录信息和/或全文至系统维护的用户个人参考文献图书馆。在一些实施例中,系统默认为用户提供文献目录信息并且用户必须单独地请求参考文献的全文版本。
图5是呈现软件组件/服务的系统配置以便在客户端-服务器环境500中实现系统100的示例性分布式环境的示意图。如图5所示,环境500包括经由通信网络450操作地耦合到客户端420至422的服务器510至512。服务器510至512的实施例可以采用类似于图3的计算装置300的方式来实现。
在示例性实施例中,系统100可以分布在服务器510至512上。例如,服务器510可以实现用户接口110,服务器511可以实现识别引擎130、启发引擎140和提取引擎150,而服务器512可以实现参考文献管理器160、权威数据库162的至少一些、个人参考文献图书馆170、全文数据库180和事务/订户引擎190。在本实施例中,服务器510至512中的一个或多个可以实现为web服务器。例如,服务器510可以实现为托管系统100的用户接口110的web服务器,该web服务器可以由客户端420至422访问以便在客户端420至422的显示器上显示用户接口的GUI,GUI可用于帮助文献目录信息和/或与唯一字母数字标识符(包括在客户端420至422所捕获的图像中)相关联的参考文献的全文版本的基于图像的检索。
图5所示的分布式系统100的示例性操作类似于图4所示系统的操作,除了不同的服务器执行系统的不同功能或操作。例如,用户可以通过服务器510访问系统,以便在客户端420至422的显示器上显示GUI,该GUI提供用于捕获图像的接口。捕获图像之后,客户端420至422可以通过通信网络450将图像传送至服务器510(或者无线地或者通过有线),并且可以对服务器510进行编程和/或配置以便将所捕获的图像传送至服务器411进行处理。在一些实施例中,可以对客户端侧应用423进行编程和/或配置以便将所捕获的图像传送至服务器511,无需首先将所捕获的图像传送至服务器510。服务器411可以执行引擎130、140和150以便将所捕获的图像转换为机器编码数据或文本元素,可以对机器编码数据或文本元素进行解析以检测所捕获的图像中包括的唯一字母数字标识符,唯一字母数字标识符可以提交至服务器412执行的参考文献管理器160。如果已经检测到唯一字母数字标识符,参考文献管理器可以指令服务器410通过GUI向用户显示该唯一字母数字标识符以进行确认。
参考文献管理器160可以接口连接一个或多个权威数据库和/或全文数据库来响应于用户的确认和/或自动(例如,无需用户的确认)检索文献目录信息和/或与唯一字母数字标识符相关联的参考文献的全文版本。一旦参考文献管理器160检索到文献目录信息和/或全文,可以通过服务器410经由在客户端装置420至422中显示的GUI使文献目录信息和/或全文对用户可用。用户可以控制客户端420至422以浏览文献目录信息和/或全文,保存文献目录信息和/或全文至服务器512维护的用户个人参考文献图书馆。在一些实施例中,参考文献管理器160默认为用户提供文献目录信息并且用户必须单独地请求服务器412上的全文数据库180所维护的参考文献的全文版本。
图6是呈现软件组件/服务的系统配置以便在客户端-服务器环境600中实现系统100的示例性分布式实施例的示意图,在该环境中至少一个客户端实现系统100的至少一部分。如图6所示,环境600包括服务器510至511和612,这些服务器经由通信网络450操作性地耦合到客户端420至421和客户端622。服务器612的实施例可以采用类似于图3的计算装置300的方式来实现,并且客户端622的实施例可以采用类似于图2的便携式计算装置200的方式来实现。
在示例性实施例中,系统100可以分布在以上图5所描述的服务器510至511和612上,除了权威数据库162、个人参考文献图书馆170、全文数据库180和事务服务器(例如,位于服务器613上)并未驻留在服务器612上,而是操作性地连接至服务器612。如图6所示,客户端622可以各自包括客户端侧应用623,该客户端侧应用被编程和/配置为特定于系统100(例如系统100的移动应用),该系统包括用户接口110、识别引擎130、启发引擎140和提取引擎150。可以对客户端622进行编程和/或配置以便与服务器510进行交互,并且客户端622和服务器612可以共同形成系统100的实施例,同时客户端420至421如同图5中描述的那样进行操作。
在示例性操作中,客户端622可以由用户操作以捕获文献写作作品的一部分的图像,该图像包括与文献写作作品相关联的至少一个唯一字母数字标识符或该文献写作作品内引用的参考文献。例如,客户端622可以执行用户接口110以便在客户端622的显示器上显示GUI,该GUI提供接口以捕获图像。捕获图像之后,客户端622可以执行引擎130、140和150以便通过将所捕获的图像转换为机器编码数据或文本元素并解析数据/文本元素来检测所捕获的图像中的唯一字母数字标识符。用户接口可以由客户端622执行以通过GUI向用户显示唯一字母数字标识符来进行确认。
检测到唯一字母数字标识符之后,客户端622可以通过通信网络450将该唯一字母数字标识符传送至服务器612(或者无线或者通过有线),并且可以对服务器612进行编程和/或配置以便通过执行参考文献管理器160处理该唯一字母数字标识符。参考文献管理器160可以接口连接一个或多个权威数据库162和/或全文数据库190以便检索文献目录信息和/或与唯一字母数字标识符相关联的参考文献的全文版本。一旦参考文献管理器160检索到文献目录信息和/或全文,可以通过用户接口110经由在客户端装置622中显示的GUI使文献目录信息和/或全文对用户可用。用户可以控制客户端622以浏览文献目录信息和/或全文,保存文献目录信息和/或全文至用户的个人参考文献图书馆170。在一些实施例中,参考文献管理器160默认为用户提供文献目录信息并且用户必须单独地请求全文数据库180所维护的参考文献的全文版本。
图7至15总体上涉及根据本披露的示例性实施例针对Web of Knowledge研究平台实现参考文献管理环境的非限制性示例。尽管图7至15描述了本披露的示例性实施例的非限制性示例,但本领域技术人员将认识到可以将本披露的示例性实施例实现为形成任何参考文献管理环境和/或可以将其结合到任何参考文献管理环境中,在该环境中标识写作作品的唯一字母数字标识符或对写作作品的引用与写作作品相关联或附加于写作作品。
图7是呈现软件组件/服务的系统配置以实现参考文献管理环境700的示例性实施例的示意图。便携式计算装置210可以通过通信网络450与参考文献管理系统710进行通信。便携式计算装置210可以是智能电话、平板电脑、小型笔记本电脑、膝上型计算机、个人数字助理(PDA)和/或任何其他适合的便携式计算装置,便携式计算装置包括图像捕获装置(例如图像捕获装置122)或可以操作性地连接至该图像捕获装置,并且可以进行编程和/或配置以实现通过通信网络与参考文献管理系统710进行通信。可以对便携式计算装置210和参考文献管理系统710的一个或多个服务器进行编程和/或配置以便利用一个或多个传输层和编码方法进行通信,例如可扩展标记语言-远程过程调用(XML-RPC)实现方法、安全套接层(SSL)上的XML远程过程调用(XRPC)实现方法、在超文本传输协议(HTTP)上的XML通信实现方法、简单对象访问协议(SOAP)实现方法等。
如图7所示,系统710可以包括认证模块712,该认证模块可以接收对写作作品的文献目录信息和/或全文版本的请求并可以确定是否授权了便携式计算装置与环境700进行交互(例如,基于输入到便携式计算装置中的用户名和/或密码)。在允许访问系统710之前,认证过程可应用于用户。认证可以要求利用系统710的组件进行注册,例如该环境的参考文献管理组件(例如,Thomson Reuters的Web)。在一些实施例中,在用户已经被认证或授权之后,用户可以将特定于系统710的客户端侧应用下载到便携式计算装置,该应用可由用户使用以获得与包括在所捕获的图像中的唯一字母数字标识符相关联的参考文献的文献目录信息和/或全文版本。在一些实施例中,可以不要求用户下载并利用特定于系统710的客户端侧应用,相反的是可以利用便携式计算装置210上的web浏览器应用。在一些实施例中,在接收到包括所捕获的图像的请求之前,可以实现认证过程。
在示例性实施例中,可以配置认证模块712执行授权过程以确定便携式计算装置的用户是否是经授权的用户和/或确定便携式计算装置的用户的授权等级。例如,在一些实施例中,可以基于与用户相关联的订阅状态对用户进行授权和/或认证(例如用户是否是订阅者以及用户的账号是否是最近的)。用户账号可以具有不同的订阅级别,订阅级别确定哪些权威数据库对用户可用和/或权威数据库中的哪些引文数据对用户可用。也就是说,对不同的订阅等级,可以有不同的用户授权等级(例如,第一授权等级可以与第一订阅服务等级相关联,而第二授权等级可以与第二订阅服务等级相关联)。可以为具有第一授权等级的用户提供参考文献管理系统的引文数据的第一子集,而为具有第二授权等级的用户提供参考文献管理系统的引文数据的第二子集。在一些实施例中,如果便携式计算装置的用户被授权,可以优化引文数据以便显示在便携式计算装置上。
请求可以包括在论文或其他适合的材料上形成的有形写作作品的一部分的图像。图像可以包括对应于便携式计算装置210的用户想要通过环境700进行检索的有形写作作品704中的已引用作品的唯一字母数字标识符702。一旦确定请求被授权,认证模块712可以接口连接字母数字字符识别模块714,该模块可以包括识别引擎、启发引擎以及提取引擎(图1)的实施例。字母数字字符识别模块714可以将便携式计算装置210所捕获的和从其接收的图像转换为机器编码数据或文本,可以对该数据或文本进行解析以提取图像中所捕获的并提供给Web of Knowledge参考文献管理器模块716的唯一字母数字标识符,该模块可以接口连接一个或多个权威数据库718、节流模块714、和电子商务(电商)模块716。
参考文献管理器模块716可以构建一个或多个查询以便基于从图像提取的唯一字母数字标识符来搜索权威数据库。在示例性实施例中,权威数据库718中的一个或多个可以是系统710内部的专有数据库720和/或权威数据库718中的一个或多个可以是系统710外部的公共和/或专有数据库722,但系统710可以访问它们。权威数据库718中的一个或多个可以基于唯一字母数字标识符返回一个或多个结果,并且该一个或多个结果可以从系统710传送至便携式计算装置210。
可以对节流模块714进行编程和/或配置来管理对环境700的进入流量以便提供机制来控制通信拥塞,其方式是基于环境700所提供的数据流量服务来优化环境的性能,例如通过停止和/或禁用环境所执行的一个或多个操作、功能或任务。在当前访问网站的匿名用户数量超过指定阈值时,模块714的拥塞控制节流可以自动启用。在当前访问网站的认证用户数量超过指定阈值时,拥塞控制节流可以自动启用。
可以对电商模块716进行编程和/或配置来实现事务引擎(图1)的实施例,以便帮助系统710和便携式计算装置210之间的金融业务。例如,系统710可以要求环境700中的用户订阅访问系统710,可以对系统710所接收的每条搜索请求进行收费,和/或如果用户希望访问对应于请求中所包括的唯一字母数字标识符的写作作品的全文版本,可以收费。
与图7相关的模块和/或数据库可以各自实现为系统710中的服务器。在一些实施例中,模块和/或数据库中的一个或多个可以合并或整合到服务器中,这样使得服务器实现多于一个的模块。
尽管本实施例的系统710执行字符识别过程,但本领域技术人员将认识到字符识别过程可以由便携式计算装置210和/或由位于系统710外部的服务来实现。在这些实施例中,用户所提供的请求可以包括所提取的来自图像的唯一字母数字标识符和/或机器编码数据或文本。
图8是呈现了硬件和软件组件和服务的系统配置的示意图,以实现参考文献管理环境800的示例性实施例,该系统可以包括综合参考文献管理系统802,例如ThomsonReuters的Web of Knowledge研究平台。在本实施例中,便携式计算装置210可以通过通信网络250与环境800进行通信。系统802可以包括服务器群804,服务器群包括为参考文献管理系统802执行代码的服务器806。在一个实施例中,可以对服务器群804进行编程和/或配置以便在允许便携式计算装置210的用户访问参考文献管理系统802之前实现认证过程。
认证过程可以要求利用系统的组件进行注册,例如参考文献管理软件组件(例如,Thomson Reuters的Web)。认证过程可以包括由便携式计算装置发送给服务器群804的认证请求。如果与认证服务器808一起操作的服务器群804确定用户被授权访问参考文献管理系统802,服务器群804就可以返回移动会话标识符(MSID)以创建便携式计算装置210和环境800之间的会话。在会话过程中,可以在便携式计算装置210和服务器群804之间的通信中使用MSID,以确保便携式计算装置210可以访问系统802。MSID可以由守护进程应用810维护和/或控制,守护进程应用在参考文献管理器812的示例性实施例的背景下在服务器群804上执行并且与服务器群804执行的参考文献管理器系统812相交互。
一旦用户已经被授权或认证,用户可以通过便携式计算装置210与系统802进行交互,以便基于写作作品的至少一部分的图像检索文献目录信息和/或有形写作作品中所引用的一个或多个参考文献的全文版本,该图像由本文描述的便携式计算装置的图像捕获装置捕获。响应于搜索请求由系统802返回的参考文献的文献目录信息和/或参考文献的全文版本可以存储在便携式计算装置210中,或者远程地从便携式计算装置210存储在综合参考文献管理系统810(例如Web)的组件814中以便后续检索、发电子邮件和/或打印。
在一些实施例中,商业权限管理应用816可以由服务器群804执行。应用816可由参考文献管理系统810使用,以便例如基于与写作作品相关联的权限管理数据确保写作作品的版权得到系统802的用户的保护和/或尊重。
图9是呈现硬件和软件组件和服务的系统配置的示意图,以实现参考文献管理环境900的示例性实施例,该系统可以是综合参考文献管理系统,例如Thomson Reuters的Webof Knowledge研究平台。环境900可以采用大致类似于图8的环境800的形式来实现,除了字符识别过程可以在服务器群804之外的服务器902上实现并且可以在系统802内部或外部实现。
图10描绘了具有客户端-服务器架构的综合参考文献管理系统(例如ThomsonReuters的Web of)的在线信息检索和分析组件的示例性实施例,客户端-服务器架构包括一组数据库1002或数据存储单元和服务器系统1004,服务器系统可由便携式计算装置210访问。数据库1002可以包括一组主数据库1006、一组辅助数据库1008以及一组元数据数据库1010,它们表示用户(例如研究者、学者、学生和其他专业人员)所依赖的资源。主数据库1006可以使专属的、基于订阅的、或位于服务提供商内部的数据库,例如ThomsonReuters的Web of和Web of 数据库、Cortellus、以及ThomsonReuters的新型数据库。辅助数据库1008可以是外部的或公共的数据库,该数据库代表了一组用户感兴趣的进一步的资源并且可以将权限补充给主数据库1006所提供的资源。在一个实施例中,辅助数据库1008可以包括例如PubMed数据库、AMJUR数据库和Crossref.org数据库。元数据数据库1010可以包括例如引用关系、摘要、链接、分类数据和与写作作品相关联的其他源数据。如本文描述,本披露的示例性实施例可以包括包含写作作品的数据库,写作作品的内容涉及法律、研究、金融、科学和/或卫生保健信息,还包括具有任何其他内容的任何其他写作作品,这些内容包括可用于标识和检索写作作品中所引用的参考文献或标识和检索写作作品本身的唯一字母数字标识符。
数据库1002可以是一个或多个电子、磁性或光数据存储装置,包括或以其他方式与对应的索引(未示出)相关联。这些索引的每一个包括与相应的文档地址、标识符和其他常规信息相关联的术语和短语。数据库1002通过无线或有线通信网络(例如局域网、广域网、私有网、虚拟私有网)耦合或可耦合至本文描述的服务器。
服务器系统1004总体上代表提供数据的一个或多个服务器,提供数据的形式为网页或具有相关联的小程序、ActiveX控制、远程调用对象、或用于各种“厚度”的服务客户端的其他相关软件和数据结构的其他标记语言形式。更具体地,在一个实施例中,服务器系统1004可以包括处理器模块1020、存储器模块1022、订户数据库1024、主搜索模块1026、元数据搜索模块1028和用户接口模块1030。处理器模块1020可以包括一个或多个本地或分布式处理器、控制器或虚拟机。在一个实施例中,处理器模块1020可以采取本领域技术人员已知的任何方便或令人期望的形式。可以是一个或多个电、磁性或光数据存储装置的存储器模块1022可以存储订户数据库1024、主搜索模块1026、辅助搜索模块1028和引文推荐模块1030。
订户数据库1024包括订户相关的数据以便控制、监管和管理数据库1002的即付即用或基于订阅的访问。订户数据库1024可以包括一个或多个用户偏好(或者更一般地)用户数据结构。在一个实施例中,用户数据结构的一个或多个方面涉及各种搜索和接口选项的用户定制。为此目的,本披露的一些实施例可以包括用户简介信息,例如传记信息、机构协会(例如大学、公司、社团等)、实习或学习或研究领域(例如哮喘、过敏症)、和以往的出版物。用户数据可用于认证用户证书并允许访问基于订户的资源或工作空间。为了无缝地在多个平台和/或服务或资源之间访问,可以使用综合的证书审核服务,例如ThomsonReuters的OnePass解决方案。
主搜索模块1026可以包括一个或多个搜索引擎和相关的用户接口组件,以便针对于数据库1002中的一个或多个接收和处理数据。在一些实施例中,与搜索模块1026相关联的一个或多个搜索引擎提供布尔运算法、词频-逆文档频率法(tf-idf)和/或自然语言分析能力。第二搜索模块1028还可以包括一个或多个搜索引擎以便针对于数据库1002中的一个或多个处理数据。
在一些实施例中,服务器系统1004可以包括引文推荐模块1030以便基于用户通过便携式计算装置210接收的请求向该用户推荐引文。例如,用户可以捕获包括唯一字母数字标识符的图像,该图像可以由服务器使用以搜索数据库1002中的一个或多个。响应于搜索,服务器系统1004可以返回一组参考文献,该组参考文献可以是用户感兴趣的,可以与同唯一字母数字标识符相关联的参考文献有关,可以在唯一字母数字标识符相关联的参考文献中引用等等。
在一些实施例中,服务器系统1004可以包括信息集成工具(IIT)框架模块1040(或者软件框架或平台)。IIT框架模块可以包括机器可读和/或可执行指令集,以用于全部或部分定义软件和具有其一个或多个部分的相关用户接口,这些用户接口与一个或多个文档处理(或文档写作或编辑)应用相整合或协作,例如word处理应用、电子邮件应用、演示应用以及电子表格应用。在一些实施例中,这些应用可以托管在一个或多个访问装置上,例如便携式计算装置210。
图11根据本披露的示例性实施例展示了可利用的文献的写作作品1100的非详尽示例。图中针对写作作品1100之一以DOI的形式展示了示例性唯一字母数字标识符1102。如图11所示,唯一字母数字标识符1102可以包括在写作作品的文本中。写作作品1100的文本可以环绕唯一字母数字标识符1102,从而使得仅仅捕获图像中的唯一字母数字标识符1102以便与本披露的示例性实施例一起使用是不可能的或者不切实际的。如本文描述,本披露的示例性实施例可以利用启发处理对在所捕获的图像上执行的字符识别过程得到的机器编码数据或文本进行处理,并区分唯一字母数字标识符和周围文本。
图12根据本披露的示例性实施例展示了在便携式计算装置1200上渲染的示例性图像捕获接口1202。期望电子地访问综合参考文献管理系统的学术写作作品的便携式计算装置1200的用户可以将便携式计算装置的图像采集装置保持在引文的上方,包括唯一字母数字标识符1206,并通过选择控件1204拍摄照片来捕获包括唯一字母数字标识符1206的图像。根据本披露的示例性实施例,可以利用字符识别过程将所捕获的图像转换为机器编码数据或文本,例如光学字符识别(OCR)软件、智能字符识别(ICR)软件、智能单词识别(IWR)软件等实现的字符识别过程。
字符识别软件可以包括支持脚本,支持脚本用于解析所提取的文本/数据元素以确定是否存在唯一字母数字标识符。如果存在,可以将该唯一字母数字标识符、与该唯一字母数字标识符相关的文献目录信息和/或与该唯一字母数字标识符相关的参考文献的全文版本返回给用户。否则,指示未发现唯一字母数字标识符或获得唯一字母数字标识符的过程因其他原因失败。可替代地或另外,本披露的示例性实施例可以传达未发现精确匹配的信息并且可以通过便携式计算装置向用户提出可能的替代方法。
图13和图14展示了示例性图形用户接口1300和1400,它们分别可以在便携式计算装置1350(例如智能电话、平板电脑)的显示器上进行渲染并且可以与本发明的示例性实施例结合使用。GUI 1300和1400提供搜索接口,该搜索接口允许便携式计算装置1350的用户接口连接本文描述的参考文献管理系统的示例性实施例。例如,参考图13,接口1300允许便携式计算装置1350的用户通过指定引文数据(例如标题1302、作者1304、出版年1306和/或任何其他适合的引文数据)来搜索权威数据库中的至少一个。例如,参考图14,还可以对接口1400进行编程和/或配置以允许用户指定或选择搜索哪个权威数据库1402。尽管图13展示了通过标题、作者和出版年进行搜索,但将要理解的是可以包括本领域技术人员已知的其他引文数据(例如,出版商标识、卷、版本等)。如图13所示,在选择手动搜索按钮1310时,接口1300可以显示给用户,并且在选择扫描按钮1312时,用户可以导航到图12的接口1202。
在示例性实施例中,可以执行本文描述的参考文献管理系统和/或客户端侧应用以便响应于参考文献管理系统的确定在便携式计算装置1350的显示器上渲染接口1300和/或1400,即所捕获的图像中不包括可用于帮助搜索该一个或多个权威数据库的唯一字母数字标识符,和/或所捕获的图像中检测到的唯一字母数字标识符不匹配或与文献目录信息和/或权威数据库中存储的全文写作作品无关。在一些实施例中,可以提供接口1300和/或1400以允许用户通过输入搜索条件来执行权威数据库的手动搜索,例如作者信息、出版商信息、标题信息、出版年信息、唯一字母数字标识符等等。
在一些实施例中,可以执行本文描述的参考文献管理系统和/或客户端侧应用以便在便携式计算装置1350的显示器上渲染接口1300和/或1400,并且可以基于所捕获的图像中包括的唯一字母数字标识符为用户填入数据项/搜索字段中的至少一个或多个,以允许便携式计算装置的用户基于例如标题、作者、出版年和/或任何其他适合的引文数据提交更宽泛的搜索。
图15描绘了示例性图形用户接口1500,该接口可以在便携式计算装置1350(例如,智能电话、平板电脑)的显示器上渲染并且可以在用户的个人参考文献图书馆1504上结合本披露的示例性实施例使用来检索和存储文献目录信息和/或写作作品的全文版本(统称为参考文献数据1502)。例如,在示例性实施例中,接口1500可以允许便携式计算装置1350的用户与EndNote Web○进行交互,以便在便携式计算装置1350中和/或远离便携式计算装置1350存储包括元数据的引文数据用于后续检索、发电子邮件和/或打印。在示例性实施例中,用户通过例如便携式计算装置基于唯一字母数字标识符(包括在物理/有形的写作作品中)的所捕获的图像所提交的搜索请求可以存储在用户的个人图书馆1504中以备后用。
图16是根据本披露的示例性实施例展示了可以实现的示例性基于图像的参考文献检索过程1600的流程图。首先,在步骤1602,可以利用用户的便携式计算装置捕获包括唯一字母数字标识符的写作作品的一部分的图像。在步骤1604,可以在该图像上实现字符识别过程以提取唯一字母数字标识符。一旦获得了唯一字母数字标识符,在步骤1606通过便携式计算装置将该标识符发送至综合参考文献管理系统(例如,Thomson Reuters的Web ofKnowledge研究平台。)。
在步骤1608,参考文献管理系统执行代码以自动地比较所接收的标识符和在至少一个权威数据库(例如,Thomson Reuters的Web of Knowledge研究平台和Web of Science数据库和/或公共引文数据库)中存储的标识符。如果存在令人满意的比较(步骤1610),在步骤1612针对与从该图像中提取的唯一字母数字标识符相关联的写作作品来检索包括元数据的引文数据。(如上所提及,本领域技术人员将认识到的是,“令人满意的比较”不仅涵盖所提取的唯一字母数字标识符和所存储的标识符的精确比较,而且涵盖更差一点的比较,这里允许某些程度或百分比的误差。这种情况中,参考文献管理系统可以传达未发现精确匹配的信息并且可以提出可能的替代方法。)
如果不存在令人满意的比较(步骤1610),可以在步骤1614执行参考文献管理系统以指令用户接口在用户的便携式计算装置的显示器上渲染GUI,该GUI指示不存在令人满意的比较并且可以对搜索条件(例如包括唯一字母数字标识符)进行修改/编辑并重新提交以进行另一次比较。在一些实施例中,包括元数据的引文数据可以脱机存储;例如存储在综合参考文献管理系统(例如Web)的组件上以备后续检索、发电子邮件和/或打印。
图17是根据本披露的示例性实施例展示了可以实现的示例性基于图像的参考文献检索处理1700的流程图。在步骤1702,用户的便携式计算装置可以下载并安装移动应用(例如,特定于参考文献管理系统的客户端侧应用)。应用下载之后,用户可以利用参考文献管理系统创建账户。这些步骤对本领域技术人员而言是已知的并且不再进行详细讨论。在一些实施例中,参考文献管理系统和便携式计算装置之间的通信是利用安全套接层上的XML远程过程调用(XRPC over SSL)来执行的,并且授权响应和请求利用便携式计算装置的移动站ID(MSID)来使用开放授权(OAuth)协议。在一个实施例中,参考文献管理系统(例如Thomson Reuters的Web of Knowledge研究平台)的认证和注册子系统(未示出)和用户权限管理和认证系统(例如Valve Corporation的STEAM解决方案)对便携式计算装置进行注册和认证。
移动应用安装和认证完毕后,在步骤1704用户可以利用便携式计算装置捕获包括唯一字母数字标识符的图像。在步骤1706,所捕获的图像可以转发给执行字符识别过程的系统组件,以便将所捕获的图像转换为机器编码的数据或文本,并且在步骤1708从机器编码的数据或文本中提取唯一字母数字标识符。
在步骤1710,所提取的唯一字母数字标识符与一个或多个权威数据库中存储的数据和信息进行比较。如果所提取的标识符与一个或多个权威数据库中存储的数据和信息进行令人满意的比较(步骤1712),在步骤1714从权威数据库中检索相关的引文数据并在步骤1716与相关的元数据一同提供给便携式计算装置以进行显示。否则,在步骤1718可以给用户发送错误消息和/或可以提示用户修改搜索条件。系统所提供的数据和信息可以脱机存储以备用户后续使用和检索。在一个实施例中,在Thomson Reuters的EndNote发布解决方案的参考文献图书馆组件中提供或者定制并存储数据和信息。
该系统的各种特征可以用硬件、软件、固件或其组合来实现。例如,该系统的某些特征可以用在可编程计算机上执行的一个或多个计算机程序来实现。
每个程序可以用高级过程或面向对象的编程语言来实现,以与计算机系统或其他机器通信。
此外,每个这种计算机程序可以存储在非瞬态存储介质上,例如可由处理装置读取或执行的只读存储器(ROM)上,以用于配置和操作计算机来执行上述功能。
已经给出了本文披露的主题的具体实施例的上述描述,目的是展示和描述,并不用于限制本文提出的主题的范围。可以充分构想的是,从上述描述和附图中,其他各种实施例、修改和应用对本领域技术人员将变得明显。因此,这些其他实施例、修改和应用用于落在以下所附权利要求书的范围之内。而且,本领域技术人员将认识到的是,本文已经描述的实施例、修改和应用是在具体环境的情况下给出的,并且本文提出的主题不限于此,但可以在任何数量的其他方式、环境和目的下有益地使用。因此,以下给出的权利要求应当在本文披露的新颖特征和技术的充分广度和精神的角度下进行解释。
Claims (20)
1.一种实现写作作品中的引文的基于图像的检索的方法,该方法包括:
响应于从便携式计算装置接收的请求,计算机系统以程序方式比较从写作作品的一部分获得的图像上提取的唯一字母数字标识符和在多个权威数据库中的所存储的多个标识符,该便携式计算装置具有显示器、至少一个处理器、电池以及图像捕获装置,该图像由该图像捕获装置捕获;
基于从该唯一字母数字标识符中所发现的模式以特定的顺序来搜索该多个权威数据库;
响应于该唯一字母数字标识符和与该多个权威数据库中存储的引用参考文献相关联的所存储的该多个标识符中的至少一个标识符的一次令人满意的比较,执行代码以便从该多个权威数据库检索该写作作品中的该引文的包含目录信息和/或全文版本的引文数据;以及
从该计算机系统向该便携式计算装置提供该包含目录信息和/或全文版本的引文数据以便输出在该便携式计算装置的该显示器上。
2.如权利要求1所述的方法,进一步包括在执行字符识别过程时提取该唯一字母数字标识符,该字符识别过程包括光学字符识别过程即OCR过程、智能字符识别过程即ICR过程、或智能单词识别过程即TWR过程中的至少一种。
3.如权利要求1所述的方法,其中,该唯一字母数字标识符是数字对象标识符。
4.如权利要求3所述的方法,其中,写作作品是一种学术参考出版物,该图像包括该学术参考出版物的文本,该唯一字母数字标识符包括从该图像中包括的该文本中提取的多个字母数字字符。
5.如权利要求1所述的方法,进一步包括:
在该便携式计算装置执行字符识别过程时,提取该唯一字母数字标识符;以及
解析从该图像提取的多个字母数字字符以获得该唯一字母数字标识符。
6.如权利要求1所述的方法,进一步包括:
在该计算机系统执行字符识别过程时,提取该唯一字母数字标识符;以及
解析从该图像提取的多个字母数字字符以获得该唯一字母数字标识符。
7.如权利要求1所述的方法,进一步包括:
在第二计算机系统执行字符识别过程时,提取该唯一字母数字标识符;以及
解析从该图像提取的多个字母数字字符以获得该唯一字母数字标识符。
8.如权利要求1所述的方法,进一步包括:
如果该唯一字母数字标识符未与该多个权威数据库中的所存储的该多个标识符进行令人满意的比较,则在该计算机系统上接收来自该便携式计算装置的进一步请求,该进一步请求包括经修改的搜索条件;以及
基于该经修改的搜索条件搜索该多个权威数据库。
9.如权利要求1所述的方法,进一步包括:
应用授权过程以便确定该便携式计算装置的用户的授权等级;以及,
基于该用户的第一授权等级提供来自该计算机系统的该引文数据的第一子集并且基于该用户的第二授权等级提供该引文数据的第二子集。
10.如权利要求9所述的方法,其中,该第一授权等级和该第二授权等级是基于订阅服务等级的。
11.如权利要求1所述的方法,进一步包括:
应用授权过程以便确定该便携式计算装置的用户是否是经授权的用户;以及,
如果便携式计算装置的用户被授权,优化该引文数据以显示在该便携式计算装置上。
12.如权利要求9或11所述的方法,其中,基于订阅状态对该用户进行认证。
13.如权利要求1所述的方法,其中,该引文数据包括标题、作者和出版年中的至少一项。
14.如权利要求1所述的方法,进一步包括从该便携式计算装置接收该引文数据以存储在参考文献管理系统中。
15.如权利要求14所述的方法,其中,该参考文献管理系统与该计算机系统相集成。
16.如权利要求14所述的方法,其中,该参考文献管理系统包括基于web的用户接口。
17.一种用于实现写作作品中的引文的基于图像的检索的计算机系统,该计算机系统包括:
一个或多个计算装置,该一个或多个计算装置包括至少一个处理装置和至少一个非瞬态计算机可读介质,该非瞬态计算机可读介质存储由该至少一个处理装置执行的指令,以便:
响应于从便携式计算装置接收的请求,以程序方式比较从写作作品的一部分获得的图像上提取的唯一字母数字标识符和在多个权威数据库中的所存储的多个标识符,该便携式计算装置具有显示器、至少一个处理器、电池以及图像捕获装置,该图像由该图像捕获装置捕获;
基于从该唯一字母数字标识符中所发现的模式以特定的顺序来搜索该多个权威数据库;
响应于该唯一字母数字标识符和与该多个权威数据库中存储的参考文献相关联的所存储的该多个标识符中的至少一个标识符的一次令人满意的比较,从该多个权威数据库检索该写作作品中的该引文的包含目录信息和/或全文版本的引文数据;以及
从该一个或多个计算装置向该便携式计算装置提供该包含目录信息和/或全文版本的引文数据以便输出在该便携式计算装置的该显示器上。
18.如权利要求17所述的系统,其中,由该至少一个处理装置执行该指令使得该至少一个处理装置:
在该计算机系统执行字符识别过程时,提取该唯一字母数字标识符;以及
解析从该图像提取的多个字母数字字符以获得该唯一字母数字标识符。
19.一种用于实现从权威数据库进行写作作品中的引文的基于图像的检索的便携式计算装置,该便携式计算装置包括:
非瞬态计算机可读介质,该介质存储多个可执行指令以帮助从多个权威数据库基于图像检索写作作品中的引文;
图像捕获单元,该图像捕获单元被配置为用于捕获包括在该写作作品中的文本的图像;
处理装置,该处理装置操作性地耦合到该图像捕获单元和该非瞬态计算机可读介质,该处理装置被编程为用于执行该多个可执行指令以便:
与该图像捕获单元交互以接收包括在该写作作品中的该文本的该图像;
基于对该图像执行的用以将该图像中的该文本转换为一种机器可读格式的字符识别过程,从该图像提取唯一字母数字标识符;
将包括该唯一字母数字标识符的请求输出至参考文献管理系统,以便从该多个权威数据库检索该写作作品中的该引文的包含目录信息和/或全文版本的引文数据;
基于从该唯一字母数字标识符中所发现的模式以特定的顺序来搜索该多个权威数据库;以及
响应于该唯一字母数字标识符和该多个权威数据库中的所存储的标识符的一次令人满意的比较,接收在该多个权威数据库中存储的该包含目录信息和/或全文版本的引文数据;
电池,该电池被配置为用于为该非瞬态计算机可读介质、该图像捕获单元和该处理装置供应电力。
20.如权利要求19所述的便携式计算装置,其中,该便携式计算装置包括移动电话或平板计算装置中的至少一个。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261738725P | 2012-12-18 | 2012-12-18 | |
US61/738,725 | 2012-12-18 | ||
US201361789663P | 2013-03-15 | 2013-03-15 | |
US61/789,663 | 2013-03-15 | ||
PCT/US2013/076115 WO2014100172A1 (en) | 2012-12-18 | 2013-12-18 | Mobile-enabled systems and processes for intelligent research platform |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105264486A CN105264486A (zh) | 2016-01-20 |
CN105264486B true CN105264486B (zh) | 2018-10-12 |
Family
ID=50932166
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380066585.0A Expired - Fee Related CN105264486B (zh) | 2012-12-18 | 2013-12-18 | 用于智能研究平台的手机可访问系统和过程 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9690807B2 (zh) |
EP (1) | EP2936301B1 (zh) |
JP (1) | JP6415449B2 (zh) |
CN (1) | CN105264486B (zh) |
ES (1) | ES2805343T3 (zh) |
WO (1) | WO2014100172A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10095797B2 (en) * | 2014-10-03 | 2018-10-09 | Salesforce.Com, Inc. | Suggesting actions for evaluating user performance in an enterprise social network |
US9965519B2 (en) * | 2015-11-25 | 2018-05-08 | Passport Health Communications, Inc. | Document linkage and forwarding |
US10984055B2 (en) | 2016-07-26 | 2021-04-20 | Microsoft Technology Licensing, Llc | Research application and service |
EP3399436A1 (en) * | 2017-05-04 | 2018-11-07 | Koninklijke Philips N.V. | A transmitting device, a receiving device and methods of operating the devices |
US10650072B2 (en) * | 2017-10-30 | 2020-05-12 | Facebook, Inc. | System and method for determination of a digital destination based on a multi-part identifier |
CN111868766A (zh) * | 2018-02-21 | 2020-10-30 | 埃科莱布美国股份有限公司 | 泵化学品相容性管理系统 |
CN109344325B (zh) * | 2018-09-04 | 2022-06-24 | 广州视源电子科技股份有限公司 | 基于智能会议平板的信息的推荐方法和装置 |
CN109359249B (zh) * | 2018-09-29 | 2020-07-10 | 清华大学 | 基于学者科研成果挖掘的学者精准定位方法及装置 |
CN110489570A (zh) * | 2019-08-06 | 2019-11-22 | 北京如优教育科技有限公司 | 候选全网参考文献实时更新平台和系统 |
CN111144445B (zh) * | 2019-12-06 | 2024-02-20 | 中交水运规划设计院有限公司 | 印刷书刊书写格式的检错方法及系统、电子设备 |
US11899696B2 (en) * | 2020-10-06 | 2024-02-13 | SafeGraph, Inc. | Systems and methods for generating multi-part place identifiers |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8332401B2 (en) * | 2004-10-01 | 2012-12-11 | Ricoh Co., Ltd | Method and system for position-based image matching in a mixed media environment |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5304786A (en) * | 1990-01-05 | 1994-04-19 | Symbol Technologies, Inc. | High density two-dimensional bar code symbol |
US5974202A (en) * | 1990-01-05 | 1999-10-26 | Symbol Technologies, Inc. | Apparatus and method for processing a machine readable document with embedded machine instructions |
US6522770B1 (en) * | 1999-05-19 | 2003-02-18 | Digimarc Corporation | Management of documents and other objects using optical devices |
US5664109A (en) * | 1995-06-07 | 1997-09-02 | E-Systems, Inc. | Method for extracting pre-defined data items from medical service records generated by health care providers |
US7562392B1 (en) * | 1999-05-19 | 2009-07-14 | Digimarc Corporation | Methods of interacting with audio and ambient music |
US5692073A (en) * | 1996-05-03 | 1997-11-25 | Xerox Corporation | Formless forms and paper web using a reference-based mark extraction technique |
JP3711636B2 (ja) * | 1996-06-18 | 2005-11-02 | 富士ゼロックス株式会社 | 情報検索装置および方法 |
US6205428B1 (en) * | 1997-11-20 | 2001-03-20 | At&T Corp. | Confusion set-base method and apparatus for pruning a predetermined arrangement of indexed identifiers |
US6289342B1 (en) * | 1998-01-05 | 2001-09-11 | Nec Research Institute, Inc. | Autonomous citation indexing and literature browsing using citation context |
US6360951B1 (en) * | 1999-12-16 | 2002-03-26 | Xerox Corporation | Hand-held scanning system for heuristically organizing scanned information |
US20010053252A1 (en) * | 2000-06-13 | 2001-12-20 | Stuart Creque | Method of knowledge management and information retrieval utilizing natural characteristics of published documents as an index method to a digital content store |
US7680324B2 (en) | 2000-11-06 | 2010-03-16 | Evryx Technologies, Inc. | Use of image-derived information as search criteria for internet and other search engines |
AU2002249992A1 (en) * | 2001-01-25 | 2002-08-06 | David Sidman | Apparatus, method and system for multiple resolution affecting information access |
JP2003330961A (ja) * | 2002-05-13 | 2003-11-21 | Nippon Telegr & Teleph Corp <Ntt> | トークン型コンテンツ提供システム及びトークン型コンテンツ提供方法 |
US8676780B2 (en) * | 2002-06-10 | 2014-03-18 | Jason Rollins | System and method for citation processing, presentation and transport and for validating references |
US8201085B2 (en) * | 2007-06-21 | 2012-06-12 | Thomson Reuters Global Resources | Method and system for validating references |
US7703002B2 (en) * | 2003-03-31 | 2010-04-20 | Ricoh Company, Ltd. | Method and apparatus for composing multimedia documents |
US7305435B2 (en) * | 2003-08-25 | 2007-12-04 | Nokia Corporation | Internet access via smartphone camera |
US20050149538A1 (en) * | 2003-11-20 | 2005-07-07 | Sadanand Singh | Systems and methods for creating and publishing relational data bases |
JP4352940B2 (ja) * | 2004-03-04 | 2009-10-28 | 富士ゼロックス株式会社 | 画像検索装置およびプログラム |
US20080313172A1 (en) * | 2004-12-03 | 2008-12-18 | King Martin T | Determining actions involving captured information and electronic content associated with rendered documents |
JP5102614B2 (ja) * | 2004-04-19 | 2012-12-19 | グーグル インコーポレイテッド | レンダリングされた文書からの視覚的取得データに対する処理技術 |
JP4576211B2 (ja) * | 2004-11-22 | 2010-11-04 | 日立オムロンターミナルソリューションズ株式会社 | 文書情報検索システム |
JP2008530639A (ja) * | 2005-01-11 | 2008-08-07 | コンテントディレクションズ インコーポレイティッド | 統合、情報処理及び自己組付け広告、電子商取引及びオンラインクライアントインターラクションのための装置、方法及びシステム |
JP2007048021A (ja) * | 2005-08-10 | 2007-02-22 | Atsushi Tagata | 出品情報取得プログラムおよび出品プログラム |
US8156128B2 (en) * | 2005-09-14 | 2012-04-10 | Jumptap, Inc. | Contextual mobile content placement on a mobile communication facility |
WO2007076453A1 (en) * | 2005-12-21 | 2007-07-05 | Decernis, Llc | Document validation system and method |
US20070226321A1 (en) * | 2006-03-23 | 2007-09-27 | R R Donnelley & Sons Company | Image based document access and related systems, methods, and devices |
JP4899581B2 (ja) * | 2006-03-29 | 2012-03-21 | コニカミノルタエムジー株式会社 | 情報検索システム、およびプログラム |
JP5078413B2 (ja) * | 2006-04-17 | 2012-11-21 | 株式会社リコー | 画像閲覧システム |
JP2008059081A (ja) * | 2006-08-29 | 2008-03-13 | Sony Corp | 画像処理装置及び画像処理方法、並びにコンピュータ・プログラム |
EP2067102A2 (en) | 2006-09-15 | 2009-06-10 | Exbiblio B.V. | Capture and display of annotations in paper and electronic documents |
US7689613B2 (en) * | 2006-10-23 | 2010-03-30 | Sony Corporation | OCR input to search engine |
JP5003104B2 (ja) * | 2006-11-01 | 2012-08-15 | カシオ計算機株式会社 | アクセス装置及びプログラム |
JP2008131189A (ja) * | 2006-11-17 | 2008-06-05 | Ricoh Co Ltd | ドキュメント管理システム、ドキュメント管理方法及びドキュメント管理プログラム |
US20080151302A1 (en) * | 2006-12-07 | 2008-06-26 | Samsung Electronics Co., Ltd. | Image forming apparatus and method of controlling the same |
JP2009064091A (ja) * | 2007-09-04 | 2009-03-26 | Komiyama Insatsu Kogyo Kk | 電子ジャーナル編集システム及び原稿編集方法 |
US8250469B2 (en) * | 2007-12-03 | 2012-08-21 | Microsoft Corporation | Document layout extraction |
JP2011008372A (ja) * | 2009-06-24 | 2011-01-13 | Fuji Xerox Co Ltd | 情報処理プログラム及び情報処理装置 |
US9081799B2 (en) * | 2009-12-04 | 2015-07-14 | Google Inc. | Using gestalt information to identify locations in printed information |
JP5648893B2 (ja) * | 2010-04-26 | 2015-01-07 | 国立大学法人 岡山大学 | 知的財産情報交換支援システム |
JP2013058150A (ja) * | 2011-09-09 | 2013-03-28 | Ricoh Co Ltd | 情報処理装置およびプログラム |
-
2013
- 2013-12-18 CN CN201380066585.0A patent/CN105264486B/zh not_active Expired - Fee Related
- 2013-12-18 EP EP13865963.6A patent/EP2936301B1/en active Active
- 2013-12-18 WO PCT/US2013/076115 patent/WO2014100172A1/en active Application Filing
- 2013-12-18 ES ES13865963T patent/ES2805343T3/es active Active
- 2013-12-18 JP JP2015549624A patent/JP6415449B2/ja not_active Expired - Fee Related
- 2013-12-18 US US14/132,696 patent/US9690807B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8332401B2 (en) * | 2004-10-01 | 2012-12-11 | Ricoh Co., Ltd | Method and system for position-based image matching in a mixed media environment |
Non-Patent Citations (1)
Title |
---|
Bibliographic Attribute Extraction from Erroneous References Based on a Statistical Model;Atsuhiro Takasu 等;《Digital Libraries》;20030531;第49-60页 * |
Also Published As
Publication number | Publication date |
---|---|
CN105264486A (zh) | 2016-01-20 |
ES2805343T3 (es) | 2021-02-11 |
EP2936301A1 (en) | 2015-10-28 |
US20140172832A1 (en) | 2014-06-19 |
JP2016505970A (ja) | 2016-02-25 |
EP2936301A4 (en) | 2016-07-06 |
JP6415449B2 (ja) | 2018-10-31 |
WO2014100172A1 (en) | 2014-06-26 |
US9690807B2 (en) | 2017-06-27 |
EP2936301B1 (en) | 2020-05-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105264486B (zh) | 用于智能研究平台的手机可访问系统和过程 | |
US10372733B2 (en) | Systems and methods for secure storage of user information in a user profile | |
US20140114672A1 (en) | Cloud based viewing, transfer and storage of medical data | |
CN110869962A (zh) | 基于数据的计算机分析的数据核对 | |
US11240224B2 (en) | Systems, methods and apparatuses for identity access management and web services access | |
US20130041909A1 (en) | Method and system for dynamic identity validation | |
EP2686991A1 (en) | Method and system for dynamic identity validation | |
US20180107689A1 (en) | Image Annotation Over Different Occurrences of Images Using Image Recognition | |
US20160063507A1 (en) | Method, system and program product for product and service registrations | |
CN103929473A (zh) | 使用单一app程序访问包含个性化数据分布式存储的多子系统和公共子系统的方法和系统 | |
JP2009070240A (ja) | 文書管理サーバーから文書データを取得するためのシステムおよび方法 | |
US20240089118A1 (en) | Post-completion action management in online document system | |
US9990477B2 (en) | Dynamic network construction | |
JP2021099839A (ja) | 対話装置、制御装置、対話システム、対話方法、制御方法、およびプログラム | |
US20110179053A1 (en) | System and method for the centralized management of a document ordering and delivery program | |
JP5598923B2 (ja) | 依頼情報処理装置 | |
KR102244622B1 (ko) | 데이터 관리 시스템 및 데이터 관리 방법 | |
CN102193623B (zh) | 信息输入辅助设备和信息输入辅助方法 | |
US20130297345A1 (en) | Electronic Medical Record Hosting System and Method | |
KR101575932B1 (ko) | Sns를 활용한 기술사업화 시스템 및 방법 | |
CN113614677A (zh) | 使用空中标志符号的运动启动的交易系统 | |
KR20170118408A (ko) | Ocr 시스템을 이용한 거래정보 관리 시스템과 이를 이용한 전산 거래정보 관리방법 | |
Ahmadi Golsaz | My place is placeless: Exploring belonging among second generation “Iranians” in Sweden | |
Ko et al. | Design of Corporate Business Card Management System | |
JP6313110B2 (ja) | 伝票処理装置、端末装置、伝票処理方法、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Swiss Swiss Applicant after: Thomsen Reuters global resources Unlimited Company Address before: Swiss Swiss Applicant before: Thomson Reuters Globle Resources |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20181012 Termination date: 20181218 |
|
CF01 | Termination of patent right due to non-payment of annual fee |