CN107077482A - 指定要与检索记录关联的文件的系统和方法 - Google Patents
指定要与检索记录关联的文件的系统和方法 Download PDFInfo
- Publication number
- CN107077482A CN107077482A CN201580050550.7A CN201580050550A CN107077482A CN 107077482 A CN107077482 A CN 107077482A CN 201580050550 A CN201580050550 A CN 201580050550A CN 107077482 A CN107077482 A CN 107077482A
- Authority
- CN
- China
- Prior art keywords
- file
- group
- retrieval
- database
- gopher
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 230000015654 memory Effects 0.000 claims abstract description 64
- 230000004044 response Effects 0.000 claims abstract description 7
- 238000003860 storage Methods 0.000 claims description 8
- 230000009471 action Effects 0.000 claims description 7
- 238000004321 preservation Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 46
- 230000004048 modification Effects 0.000 description 9
- 238000012986 modification Methods 0.000 description 9
- 229910003460 diamond Inorganic materials 0.000 description 8
- 239000010432 diamond Substances 0.000 description 8
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 7
- 238000003763 carbonization Methods 0.000 description 7
- 238000007689 inspection Methods 0.000 description 7
- 229910052710 silicon Inorganic materials 0.000 description 7
- 239000010703 silicon Substances 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 5
- 238000012913 prioritisation Methods 0.000 description 5
- 235000014510 cooky Nutrition 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000007639 printing Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 229910010271 silicon carbide Inorganic materials 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 229910003978 SiClx Inorganic materials 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000000386 athletic effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 238000001027 hydrothermal synthesis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2452—Query translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/248—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3325—Reformulation based on results of preceding query
- G06F16/3326—Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
- G06Q50/184—Intellectual property management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/11—Patent retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Business, Economics & Management (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Technology Law (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
使用检索工具来执行指定与检索会话关联的文件的方法。检索工具响应于从客户端计算机接收的请求打开检索会话。检索工具从客户端计算机接收文件的指示。然后,检索工具使用存储器来在存储器中找到将文件链接到在存储器中找到的其他文件的信息。此时,检索工具将建议发送到客户端计算机以将新发现的文件与检索会话关联。
Description
背景技术
许多企业开始将大量投资导向研发将来会获取重大利润的发明。通常,没有投资类似资源的竞争者耗费相对少的努力就可以抄袭发明。因此,进行投资的企业以专利的形式寻求保护,专利允许企业实施与发明相关的临时性垄断。
在专利申请通过管辖地区的专利局(例如,美国专利商标局)的全面审查过程之前,发明的申请人不获得专利。申请可能由于各种不同原因中的任一种而被驳回,例如,权利要求中描述的发明不具有“新颖性”(也就是说,请求保护的发明已经存在)或者其具有新颖性但是不具有“创造性”(例如,发明没有产生特别的独创性,或者发明没有与之关联的意想不到的优点)。为了以缺乏新颖性或创造性来驳回权利要求,专利审查员必须在称为“审查意见”的通知书中充分论证驳回。审查意见必须包括在其中引用了“现有技术”的检索报告,“现有技术”即缺乏新颖性或创造性所依据的技术文件。现有技术可以是任何国家已颁布的发明、任何管辖地区已公开的申请、非专利文件(例如,技术期刊)、公开展示、网页等。为了起草检索报告,审查员必须进行现有技术检索。为了进行现有技术检索,审查员必须使用检索引擎。可以使用不同的检索引擎。一些检索引擎具有能够标记文件并且进一步导出被标记的文件的附加功能。一种这样的检索引擎是由欧洲专利局提供的检索引擎。(见http://worldwide.espacenet.com上的“我的专利列表(My patents list)”)。
专利审查员不是进行现有技术检索的唯一检索者。尽管申请人通常有机会修改权利要求来克服驳回,例如,描述现有技术中未被公开或甚至是没有暗示的发明的特征,但是如果权利要求在它们被提交时就初始地处于授权状态,则最终的专利潜在地在法律上要更强。即使大多数专利申请在审查过程中至少被驳回一次,但是如果在审查过程中更多地对权利要求进行最小程度的修改,则可预期在专利授权之后的最终专利境遇会更好。
因此,专利律师通常建议其客户进行现有技术检索,以使专利律师能够起草较佳的权利要求。另外,现有技术检索可能发现与客户的发明非常近似以使得随后颁布的专利获得非常小范围的文件。和客户接受到这样的消息一样难以接受,但是更可取的是在投入了巨大投资以尝试获得专利并且将专利推向市场之前获知现有技术的状态。在另一情景中,在现有技术检索中发现发明的“一部分”,这样,客户和律师合作以将努力聚焦于发明的没有被发现的部分。及早并且在提交专利申请之前投入这样的努力也是更好的。
对于没有合适技能和工具的人来说难以执行合适的现有技术检索。熟练的检索者能够发现没有经验的检索者可能从来没有注意到的高度相关的现有技术。由于合适的现有技术检索的重要性,近年来专业服务已经发展起来,其雇佣熟练的检索者并且给他们配备合适的工具,例如,对公开和私有现有技术数据库的访问。能够利用许多算法来帮助检索者,并且持续地开发出改进的算法。
在检索者确定要给申请人提供哪些现有技术之后,检索者必须以容易将申请人的注意力引导到适当区域的方式呈送现有技术。例如,二十页文件的最相关部分可能是在第十六页上的五行文本。用于高效地生成检索记录的各种应用也持续地被开发出来。
除了帮助决定是否提交申请并且如果要提交的话如何准备申请之外,现有技术检索还在其他情况下有用。例如,被控侵权或评估指控的风险的一方希望知道可以被用来无效专利的权利要求的现有技术。在一些有限情况下,对于专利未决的申请,反对专利授权的一方可以向管辖地区的专利局提交客观存在的现有技术,以期专利局会基于提交的材料驳回权利要求。
因此,给现有技术检索者配备使得他/她能够快速地找到对于特定需求来说最相关(实质性)的现有技术的高效工具将是非常有利的。
发明内容
本发明人已经开发了一种发明,其包括各种机制以辅助现有技术检索者提供实质性现有技术。
本发明还可以体现为一种指定与检索记录关联的文件的方法,所述方法包括:提供连接到客户端设备、服务器和数据库的检索工具,其中,所述检索工具包括收集工具和建议工具;响应于从客户端设备接收的请求,通过所述检索工具打开检索会话;
存储与所述检索会话相关的检索记录;从客户端设备接收第一组一个或多个文件的指示,该指示作为用于检索和用于存储在所述收集工具中的基础,所述检索工具使用至少来自所述数据库的信息来找到将收集工具中的文件的至少一个链接到第二组文件中的一个或多个出版物的信息;所述检索工具通过建议工具将所述第二组文件的建议呈送给客户端设备,通过客户端设备选择由建议工具呈送的文件中的一个或多个以实现将第二组的一个或多个文件与所述收集工具关联。
本发明还可以体现为一种用于指定与检索记录关联的文件的检索工具。
本发明还可以进一步体现为保持指令的机器可读介质,所述指令在被执行时激活处理器以执行指定与检索记录关联的文件的方法。
本发明还可以进一步体现为在检索会话过程中加入由用户选择的文件的方法,所述方法包括:提供检索工具,所述检索工具包括:操作成接收至少是文件ID的组的收集装置;存储器,其操作性地连接到处理器并保持指令,所述指令在被执行时激活处理器使用数据库存储所述文件ID,其特征在于,如果所述组的每个唯一文件ID先前没有记录在会话中,则所述组的每个唯一文件ID与来自所述组中的所有其他文件ID一起被记录为所述数据库中的新记录,并且对于被先前记录在会话中的所述组中的每个唯一文件ID,添加来自所述组的所有其他文件ID。所述存储器还保持下述指令:当被执行时,所述指令激活处理器以根据请求使用数据库,从而检索与所述唯一文件ID一起被记录的所述其他文件ID。根据下面的描述,本发明的其他方面将变得明了,其中
在下文中参考附图详细描述本发明的实施方式,附图被简述如下:
附图说明
下面在随附的权利要求中描述发明,权利要求参照包括下列附图的描述进行理解,其中:
图1示意了现有技术检索报告;
图2示意了由官方专利局提供的检索报告;
图3a图解地示意了体现为检索工具的本发明和实施方式在其中操作的系统;
图3b图解地更加详细地示意了图3a的检索工具的输入/输出接口组件以及与输入/输出接口组件一起操作的一些部件;
图3c图解地示意了体现为与报告工具结合的检索工具的本发明;
图3d图解地示意了体现为与检索引擎结合的检索工具的本发明;
图4呈现了流程图,该流程图示出了根据本发明实施方式的指定与检索记录关联的文件的方法的过程流,所述方法可以由图3a的检索工具执行;
图4a呈现了流程图,该流程图示出了图4的过程流,但具有关联指定的文件和重复搜索其他要指定的文件的进一步的步骤;
图5a示意了当实现第一链接过程时检索工具的实施方式与用户和存储器的交互,在所述第一链接过程中,来自第一组的文件与其它会话中的第二组的文件被一起记录;
图5b示意了当实现第二链接过程时检索工具的实施方式与用户和存储器的交互,在所述第二链接过程中,来自第一组的文件与单个其它会话中的第二组的文件被一起记录;
图5c示意了当实现第三链接过程时检索工具的实施方式与用户和存储器的交互,在所述第三链接过程中,来自第一组的文件的元数据与多个文件或一个文件关联,所述多个文件或一个文件和其它会话中第二组的文件被一起记录。
图5d示意了当实现第四链接过程时检索工具的实施方式与用户和存储器的交互,在所述第四链接过程中,在第二组的文件中或在与其它会话中第二组的文件(在示例附图中示意)被一起记录的文件中,找到来自第一组的文件的结构化内容(在示例附图中示意);
图5e示意了当实现第五链接过程时检索工具的实施方式与用户和存储器的交互,在所述第五链接过程中,在来自第一组的文件中找到的内容类似于在第二组的文件中或在与其他会话中第二组的文件一起被记录的文件中找到的内容。
具体实施方式
通过参考本发明实施方式的本具体实施方式,将会更好地理解在上面概述和由权利要求限定的发明。本描述不打算限制权利要求的范围,而是用于提供本发明的示例。
本发明的实施方式找到现有技术检索报告的相关文件,例如图1中的报告12。如示意的,报告12列出多个已公开文件12a、12b、12c……文件12a是已颁布专利,文件12b是网页,而文件12c是技术期刊文章。这些是适于现有技术检索报告的文件的非限制性示例。另一示例文件是面向大众的报纸文章,并且示例的列表继续。本发明实施例产生的现有技术检索记录例如可用于在准备专利申请时确定要关注创新的哪些方面(可专利性研究)和用于确定和/或挑战已颁布的专利权利要求的有效性。
一些专利申请(例如,由世界知识产权组织(WIPO)、欧洲专利局(EPO)和英国的知识产权局公布的那些专利申请)一般包括检索报告,例如图2中示意的示例检索报告14。对于每个列出的文件,检索报告指示文件与那些权利要求相关以及文件的“类别”。类别可例如指示被引用的文件妨碍相应的权利要求满足新颖性或创造性要求。
图3a呈现了包括将本发明体现为检索工具20的、具有输入/输出接口组件18(其在图中在逻辑上被示意为单独的单元)的服务器16的系统。服务器16包括处理器22(例如CoreTM i5或i7处理器)以及硬盘驱动器24(例如250Gb的硬盘驱动器)。具有这样的硬件的示例服务器包括Dell PowerEdge或Hewlett-Packard ProLiant系列。这些示例服务器可使用Windows或Linux来操作。在可选实施方式中,由服务器16执行的功能可以替代地由多个处理器来执行,例如由云计算解决方案提供的服务。在这种情况下,服务器在共同控制下一起工作,并且具有对服务器的访问能力,该访问能力由单个实体或由在服务器阵列中的独立实体控制。
输入/输出接口组件18可以是将服务器链接到互联网的任何合适硬件,作为非限制性示例,包括到调制解调器的有限或无线链路。参考图3b,输入接口28是输入/输出接口组件18的子单元。输入接口28从互联网26,从将在下面更详细地讨论的在服务器16外部维护的数据库30、32,和从使用键盘34和鼠标36或其他等效的光标移动设备的服务器操作员接收信号。输入接口28可包括USB和/或服务器16的以太网插口。图3b还示出,输出接口38是输入/输出接口组件18的另一子单元。输出接口38将信号从服务器16传输到互联网26,到外部数据库30、32,并且到显示器40以使服务器操作员在履行他的/她的职责的过程中查看。输出接口38可包括服务器16的VGA连接器。
努力进行检索的用户使用驻存在客户端计算机(例如分别为客户端44a、44b或44c)上的客户端应用(例如,客户端应用42a、42b或42c)(举例来说,网络浏览器),按照现有技术已知的方式通过互联网26和输入接口28来建立与检索工具20的通信,以便请求检索工具打开会话。客户端44a、44b或44c可为任何合适的已知个人计算机(PC)或工作站,例如IBM兼容机或Macintosh PC、平板计算机、智能电话等。
参考图3c,用户使用诸如www.espacenet.com的检索引擎74来检索诸如INPADOC馆藏的数据库32。在检索的过程中,用户找到检索相关并且他想递送到第三方的文件。为了递送,用户使用报告工具。报告工具72包括检索工具20。检索工具20包括收集工具201和建议工具202。检索工具包括或连接到检索记录被记录在其中的数据库30。报告工具还可以包括附加的数据库或其可以与检索工具共享相同的数据库30。所述附加的数据库可用于存储其他相关数据,例如用户相关数据、检索记录相关数据和文件相关数据。在一些实施方式中,来自附加的数据库的信息(如果可用)也可以被检索工具使用。用户将相关文件从检索引擎导出并且将它们导入报告工具。导出和导入可以由用户手动一个接一个地完成,或者,在分离的系统允许的情况下,可以以更加自动化的方式完成,比如导出到能够被报告工具读取的格式或使用检索引擎和报告工具之间的API经由通信链路导出。
参考图3d,用户使用诸如www.espacenet.com的检索引擎74来检索诸如INPADOC馆藏的数据库32。在检索的过程中,用户找到检索相关并且他想标记的文件。为了标记,用户使用检索工具20。检索工具20包括收集工具201和建议工具202。检索工具包括或连接到检索记录被记录在其中的数据库30。在一些实施方式中,来自数据库32的信息(如果可用)也可以被检索工具使用。
下面通过举例示意检索工具是检索引擎的一部分的实施方式。
第一用户在他的单次检索会话过程中收集(例如,通过标记)第一组文件,检索会话被记录在数据库中。
之后,第二用户收集第一文件,第一文件是第一用户收集的文件中的一个,而后,第二用户应当被建议还将由所述第一用户在所述第一用户的所述记录的检索会话中与第一文件一起收集的其他文件添加到该第二用户的收集。
单次检索会话是在被收集的那组文件上激活的动作之间的会话。
更具体地,单次检索会话是在被收集的所有(或大部分)文件上激活的动作之间的会话。
所述动作是导出、保存、共享、清除、复制和/或打印中的一个。
示例1(其中检索工具结合到Espacenet检索引擎)
1、用户A针对具有内嵌GPS的鞋检索espacenet。
2、他的查询:文本=(gps及鞋类)
3、结果给出17个文件的列表
4、来自结果列表的文件2(US2013043994)、文件3(CN202496481)和文件13(USRE41122)被发现与用户A进行检索的内容相关,并且因此他通过点击灰星(点击之后变红)来收集(即,标记)这些文件。
5、Espacenet在用户计算机上保存cookie。其内容(可以从浏览器取回):US2013043994Al*D-preview-enEP_CN202496481U*D-preview-enEP_USRE41122E1*D-preview-enEP
6、所述Cookie表示建立知识库所需的所有信息。
7、用户A希望针对新的发明——椅子来检索espacenet。在收集新文件之前,用户清除先前的列表。清除动作被收集工具用作检索会话结束并且需要在清除发生之前被记录的指示。
8、用户B针对具有内嵌GPS的鞋检索espacenet。
9、他的查询:文本=(gps及鞋)
10、结果给出71个文件的列表
11、来自结果列表的文件35(CN202496481)被发现与用户A进行检索的内容相关,并且因此他通过点击灰星(点击之后变红)来收集这些文件。
12、应当将US2013043994和USRE41122E1建议给用户B,因为它们与CN202496481在同一个记录的会话中被用户a标记过。
关于上述示例的说明:
a.在espacenet中,存在保存在客户端侧的单个列表(作为浏览器cookie),但是在其他系统中,多个列表被保存并且在服务器上。
b.在不同的会话中,用户B可以为用户A。
c.Espacenet中的用户可以查看被标记文件的列表。他们也可以导出列表、清除列表、打印列表等。
d.如果用户A开始了关于不同发明的新检索,则假设他将对整个列表执行动作,例如导出、打印、清除等。
被导出/打印/保存的列表可在系统中被处理为检索会话,该检索会话对于其他用户的使用是值得保存的,即,作为数据库中具有会话ID和文件ID的行。
e.可以由用户添加元数据(例如,标签)或者可以在检索引擎中找到对于每个文件或对于每次会话的元数据(例如,分类)。还可以使用该元数据来建议文件。
检索工具20通过根据下述方法操作来辅助用户执行检索:
图4示出了流程图46,该流程图46表示根据本发明实施例的指定与检索记录关联的文件的方法的过程流程。所述方法可以由图3a中的检索工具20执行。
所述方法的第一步骤是:响应于从诸如图3a的客户端44a、44b或44c的客户端计算机接收的请求,打开检索会话以(步骤S1)。如上所讨论的,用户操作客户端应用(例如驻留在客户端计算机上的客户端应用42a、42b或42c)来发送打开检索会话的请求。在图3a和图3b的系统中,服务器16经由输入/输出接口组件18的输入接口28从客户端计算机44a、44b或44c接收请求,并且处理器22打开所述检索会话。
在本文中,术语“打开”涵盖下述情景:客户端应用42a、42b或42c引用的检索记录已经存在并且例如存储在实施成保持检索记录48的数据库30中。在本文中,术语“打开”包括从存储检索记录的位置取回所述检索记录。
同样,对于该实施例,在执行步骤S1之前检测记录不预先存在于存储器中的情况下,“打开”是指:响应来自客户端计算机的打开检索会话的请求,创建至少一个用于会话的临时记录。所述记录随后保存在存储器中,例如保存在硬盘驱动器24、数据库30中或保存在另一存储器中。
在本实施例的一些实现中,服务器16包括高速缓冲存储器50和/或索引文件52来提供更有效的检索会话数据的取回。完整的检索会话记录可以积累在数据库30中,而开始阶段的检索会话可以在(更稳固地)存储到数据库30中之前自动存储在高速缓存存储器上,并随后在检索会话结束时从高速缓存存储器50擦除,开始阶段的检索会话可能体现为与示出文件列表(甚至列表还没有或者可能永不会被提供给另一方)的网页上的文件列表相差无几。
尽管以上仅列出几种类型的检索,本发明的实施例可以产生其他类型的检索。例如,在本专利上下文中,也可以进行检索以确定现有技术的状态、确定操作自由度以及检索无效的现有技术(作为非限制性示例)。另一个示例检索是列出在指定时间段(例如上个月)出版的、归属于特定方(例如竞争对手)的申请的定期(例如每月)检索。再一个示例是列出最新授权的专利和/或最新公开的引用特定语句(例如“绿色能源”)的申请的定期检索。在学术场景中,检索工具可以用在研究工具中以检索特定主题的相关文件。在商业场景中,检索工具可以用于市场研究。
如以上所讨论的,在本公开的实施例中,客户端44a、44b或44c通过互联网26与检索工具20通信,但是在可选实施例中,客户端可以通过不同的网络,例如可能维持在机构内的局域网(LAN),与检索工具通信,其中该机构的雇员操作客户端计算机以进行检索会话。在又一其它实施例中,驻留在计算机上的客户端应用可以与驻留在同样的计算机上的检索工具软件(在下文中对其进行了更详细的讨论)交互。因此,根据步骤S1,检索会话的打开实质是响应同一计算机内生成的请求。
本方法的下一步骤是从客户端计算机接收文件的指示,该文件在本公开中也称为“第一文件”(步骤S2)。在图3a和图3b的系统中,服务器16经由输入/输出接口组件18的输入接口28从客户端计算机44a、44b或44c接收指示。用户指示他/她想要在检索中收集的文件。作为非限制性示例,如果该文件为授权专利或专利申请,则用户可以通过将专利号或申请号经由互联网从客户端计算机发送至执行当前描述的过程的服务器来指示该文件。用户可以通过发送唯一的文章标识符,例如数字目标标识符(DOI)或统一资源标识符(URI),来指示科技期刊的文章。标识符的其它例子包括但不限于国际标准图书编号(ISBN)或国际标准记录码(ISRC)。文章标识符可以具有格式化类型,例如现代语言协会(MLA)、美国心理学会(APA)或芝加哥手册风格(Chicago Manual Style)的格式化类型,因此机器能够将其编入索引并进行检索。用户还可以仅用鼠标点击来指示文件。在图3d所示的实施例中,收集工具集成在检索引擎内。从检索引擎的结果列表中选择文件会被作为所述文件的指示而传输至收集工具。
在本实施例中,客户端将单个文件指示为相关,并且所述系统按以下讨论的那样来建议有关的文件以包括在检索会话内。然而,在可选实施例中,多个文件被作为相关文件而指示为第一组文件,并且与所述第一组文件相关的一个或多个文件被建议用于检索会话。
在一些场景中,用户在步骤S1中打开检索会话,该检索会话预先存在并且已经包括用户想要将其作为后续步骤的主题的一个文件。换言之,用户想要检索工具建议与所述第一文件相关的额外的文件,因为随时间流逝更多先前可能未被建议的文件变得可用。因此,在这种情形中,指示第一文件不需要用户输入文件名称、编号或编码,因为他/她可以简单地在由检索工具提供的网页中呈现的条目。(在可选场景中,用户想要类似现有技术的建议。尽管如此,所述第一文件被“指示”)
在检索工具接收文件(或一组文件)的指示之后,检索工具生成唯一的会话ID(步骤S3)并且可选地保存所述会话记录(步骤S4)。所述会话ID将被用作检索会话在数据库内的参考,并且将来被找到的文件将在数据库内与其相关联。
出于技术角度并且为了使讨论简化:
数据库通常包括一个或多个表格。
所述表格包括具有数据的记录(行)。
示例:
列名称 | 列名称 | 列名称 | 列名称 |
值 | 值 | 值 | 值 |
值 | 值 | 值 | 值 |
出于简化的目的,我们可以说基本检索会话被像下面那样记录:
会话ID | 文件ID | 文件ID | 文件ID |
PT0000001 | US1234560 | US1234561 | US1234562 |
PT0000002 | US1234560 | www.google.com | US1234563 |
在上表格中,会话ID是唯一的。替代等价表格可以具有唯一的文件ID:
文件ID | 会话ID | 会话ID | 会话ID |
US1234560 | PT0000001 | PT0000002 | |
US1234561 | PT0000001 | ||
US1234562 | PT0000001 | ||
US1234563 | PT0000002 | ||
www.google.com | PT0000002 |
不管怎么样,需要取回会话的用户设备发送具有会话ID的请求并接收与该会话ID相关联记录的全部文件。
会话记录也可以以无会话ID的方式被记录。
在这种情形中,在会话完成后,不能够取回会话记录,并且会被保存的唯一信息是链接信息。
参阅上述示例:
所述会话可以像这样被记录:
唯一文件ID | 文件ID | 文件ID | 文件ID | 文件ID |
US1234560 | US1234561 | US1234562 | www.google.com | US1234563 |
US1234561 | US1234560 | US1234562 | ||
US1234562 | US1234560 | US1234561 | ||
US1234563 | US1234560 | www.google.com | ||
www.google.com | US1234560 | US1234563 |
这意味着:对于曾经在一个会话中收集的每个文件,存在与之在会话中一起被收集的其它文件的列表。并且每个会话记录不是通过向表格添加一行完成,而是通过向具有唯一的其它文件ID的行添加文件ID完成。
检索工具随后利用数据库或任何其它类型的存储器来找到将所述文件(或一组文件)链接到来自其它会话的一个或多个文件(“第二组”文件)的信息(步骤S5)。用于找到所述信息的存储器可以是体现为检索工具的服务器的硬盘驱动器、高速缓存存储器和/或索引文件,或者该服务器访问的一个或多个数据库。在图3a的服务器16的示例中,存储器可以为硬盘驱动器24、高速缓存存储器50、索引文件52、会话记录数据库30和/或存储文件60的文件数据库32。然而,本发明不限于这些存储器。例如,服务器16可以通过互联网26访问由美国专利商标局(PTO)维护的数据库(示例为数据库54)中的、由世界知识产权局(WIPO)维护的数据库(示例为数据库56)中的和/或可能需要或可能不需要订阅以进行访问的私人维护的数据库(示例为数据库58)中的相关信息。文件彼此链接的示例方式包括:(1)一个专利在其“引用文献”段列出另一个专利;和(2)科技文件在其参考目录中列出另一文件。如以下更详细的讨论的,如果多个检索会话列出同样的两个文件,链接也可以发生。
本实施例的一个或多个存储器在逻辑上可以被称为第一存储器和第二存储器。例如在图3a中硬盘驱动器24内的所述第一存储器与检索工具的处理器连接,并且保持指令,该指令激活处理器以找到链接文件信息。例如在数据库30、32、54、56和58、高速缓存存储器50和/或索引文件52的一个或多个中的第二存储器存储链接信息。所述第二存储器甚至可以体现在硬盘驱动器24内;因此所述硬盘驱动器24可以提供第一和第二存储器二者。
在检索工具找到将第一文件链接到第二文件(或文件组)的信息之后,检索工具向客户端计算机发送建议以将第二组的文件包括在检索收集中(步骤S6)。在图3a和图3b的系统中,服务器16通过输入/输出接口组件18的输出接口38并随后通过互联网26分别向客户端计算机44a、44b或44c的客户端应用42a、42b或42c发送建议。(当然,用户最终决定他/她是否想要进一步收集第二文件。)该实施例的过程随后结束。
流程图46的方法的步骤S1-S6可以由图3a的检索工具20执行。可选地,可以执行所述方法以便第一方执行:检索会话的打开、从客户端计算机的接收、和发送建议,并且独立第二方托管存储器并根据来自第一方的指令执行所述存储器的使用。在这种布置中,第一方可以操作服务器来托管检索工具并“外包”给或依靠独立方来维护数据库以供检索工具访问。
图4a示出流程图47,其表示根据本发明另一实施例的指定与检索记录关联的文件的方法的过程流程。该过程与图4a中所示的过程类似,但是具有额外的迭代步骤(S7-S9)。在步骤S7中,用户将所建议的文件中的至少一个与检索会话关联。在步骤S8中,所述关联的文件被认为是会话的收集的一部分,并因此需要找到额外的文件(第三组)。所述检索工具找到链接组合有第二组中的选定文件的第一组与第三组的信息。所述第三组在步骤S9中被建议。更多迭代可以根据需要以同样的方式执行。
所述检索工具可以执行多个过程中的一个或多个以利用数据库来找到将文件链接到彼此的信息。下文描述那些过程的示例。本发明的范围不限于所提出的示例。
参考图5a描述了用于利用数据库找到链接信息的第一链接过程。在该过程中,来自第一组的文件与其它会话中的第二组的文件被一起记录。
在该示例中,所述存储器是保持用户1和用户2先前进行的检索的检索记录的数据库62。用户1进行了被记录为检索记录64的检索,检索记录64包括文件DOC A、DOC B、DOC C和DOC D,用户2进行了被记录为检索记录66的检索,检索记录66包括文件DOC A、DOC B、DOCE和DOC F。值得注意的是,尽管两个检索记录64、66都存储在单个数据库62中,当多个存储器可访问并且存储检索记录时,该过程也是可操作的。
进行检索会话68的用户3已经关联了文件DOC A并向检索工具20指示70该文件ID。检索工具20检索74、75(或者可选地命令74、75数据库62来检索)存储在数据库62中的记录有文件DOC A的检索记录,并发现76、77用户1进行的检索记录64中记录的和用户2进行的检索记录66中记录的文件DOC A。检索工具20进一步发现76、77两个检索记录64、66都还包括DOC B。换言之,检索工具20找到了将文件DOC A链接到文件DOC B的信息。因此,检索工具20向用户3发送78建议以将DOC B与他的检索记录相关联。
执行第一链接过程的基本原理是:收集相同的文件(第一文件)的多个在先用户已经确定同样的额外的文件也应该被收集。因而,当另一用户向检索工具20指示同样的第一文件时,建议工具201应该建议用户也收集第二(额外的)文件。
在另一场景中,用户生成一个或多个包括同样的一组文件的检索记录同时暗示进行新检索(包括来自该组文件的一个或多个文件)的同一用户会对标记来自相同组的更多文件感兴趣。所述第一链接过程可以相应地建议文件。同样地,该过程可以被实施成使得:对于进行新检索的用户,基于用户他/她自身记录的之前的检索记录的建议接受更高的优先级。
该过程的变型在本发明的范围内。例如,检索工具20可以在其仅找到一个包括有第一文件的在先检索记录时建议第二文件。另一示例变型是检索工具可以要求找到不止一个共同的文件来建议包括在会话内。
第一链接过程的步骤可以包括在以下描述中:在存储器(例如数据库62中)中检索包括用户(例如用户2)指示的至少一个文件(例如文件DOC A、文件DOC B和文件DOC C)的至少一个检索记录;在所述存储器内找到包括这种文件的至少一个检索记录(例如检索记录64和/或检索记录66);找到也包括在所述存储器内找到的所述检索检录内的至少一个文件(例如文件DOC B);以及向进行检索的用户建议他/她指示新找到的文件。检索记录为其它检索会话的记录。
用于使用存储器来找到链接信息的第二链接过程参考图5b进行描述。在该过程中,来自第一组的文件与单个其它会话中的第二组的文件被一起记录。
在该示例中,所述存储器是保持用户1先前记录的检索记录94的数据库62。用户不必知道会话被记录并且不必意欲指示检索工具应当开始、停止或保存其会话。检索记录94包括文件DOC A、DOC B、DOC C和DOC D。
进行检索会话96的用户2选择文件DOC A、DOC B和DOC C并向检索工具20的收集工具201指示98这些文件。用户不必知道会话开始并且不必意欲指示检索工具应该开始或保存其会话。检索工具20检索100(或者可选地命令100数据库62来检索)存储在数据库62中的也包括文件DOC A、DOC B和DOC C的检索记录,并发现102用户1记录的检索记录94包括文件DOC A、DOC B和DOC C。检索工具20进一步发现102检索记录94还包括文件DOC D。换言之,检索工具20发现了将文件DOC A、DOC B、DOC C链接到文件DOC D的信息。因此,检索工具72还向用户2发送选择文件DOC D的建议。
该过程的变型在本发明的范围内。例如,在检索工具建议用于包括在检索记录中的额外的文件之前,检索工具可以要求发现更少或更多的共同文件。
第二链接过程的步骤可以包含在以下描述中:在存储器(例如数据库62)中检索包括用户(例如,用户2)指示的至少一个文件(例如文件DOC A、文件DOC B和文件DOC C)的至少一个检索记录;在所述存储器内找到包括指示的文件中的至少一个的单个检索记录(例如检索记录94);找到也包括在所述存储器内找到的检索记录内的至少一个文件(例如文件DOC D);以及向进行检索的用户建议他/她包括新发现的文件。
参考图5c描述了用于利用存储器来找到链接信息的第三链接过程。在该过程中,来自所述第一组的文件的元数据与多个文件或一个文件关联,所述多个文件或一个文件和其它会话内的第二组的文件被一起记录;元数据的示例可以是:分类、日期、名称、被引用的文件、引用文件、标签、类别等。
在该示例中,所述元数据是提供与文件内容有关的描述信息的标签。这里,所述存储器(数据库62)保持包括文件DOC A的检索记录132,用户1将标签TAG W、TAG X和TAG Y赋予文件DOC A。
进行检索会话134的用户2已经标记了文件DOC B并随后向检索工具20指示136所述文件。所述文件DOC B具有标签TAG X、TAGY和TAG Z,并且这些标签也被指示给136检索工具20。DOC B可以预先按照用户2的指示而带有标签,或者DOC B可以通过使用收集工具201或通过外部系统而带有标签,外部系统可以自动地生成或计算标签。检索工具20、检索引擎74或报表工具72的不同用户可能赋予文件DOC B标签。
检索工具20在数据库62中检索138(或可选地命令138数据库62来检索)与元数据关联的检索记录或者包括与检索会话134中用户2标记的文件DOC B的元数据相同的元数据的至少一些关联的文件的检索记录,以及检索工具20找到140包括文件DOC A的检索记录。换言之,检索工具20找到将文件DOC A链接到文件DOC B的信息。相应地,检索工具20向用户发送也标记DOC A的建议。(检索会话可能也具有关联的元数据,并且因此,如果检索工具20找到与用户2的检索会话134的元数据相同或者与用户2在检索会话134中标记的文件DOC B的元数据相同的元数据中的至少一些关联的检索记录,则建议工具202会向用户2发送也标记包括在该检索会话中的文件的建议。)
第三链接过程的步骤的可以包括在以下描述中:利用用户(例如用户2)指示的、具有关联的元数据(例如标签TAG X、TAG Y和TAG Z)的至少一个文件(例如文件DOC B),在存储器(例如数据库62)内检索至少一个检索会话,所述至少一个检索会话包括具有第一组的文件所具有的相同的关联元数据中的至少一些;和在所述存储器内找到至少一个这种检索记录(例如检索记录132);以及向进行检索会话(例如检索会话134)的用户建议他/她还指示新发现的文件。
在一些实现方式中,甚至不带标签的或带有错误标签的文件也被建议,如果它们包括在其它文件带有相关标签的检索会话内。检索记录132内的文件DOC C具有标签V,该标签V不是用户2进行的检索会话134中的标签。然而,因为其也在具有相关标签的检索记录132中,该实现方式也会向用户2建议将文件C包括在检索会话134中。
参考图5d描述了用于利用存储器来找到链接信息的第四链接过程。在该过程中,在第二组的文件中或在与其它会话中第二组的文件被一起记录的文件中,找到来自第一组的文件的结构化内容;结构化内容的示例可以为:类别、日期、发明人、申请人、被引用的文件等。结构化内容可以例如通过OCR或语法分析(parsing)工具从数据库或文件自身提取。
在该示例中,存储器(数据库62)保持包括分类在类别S、T、U和V中的文件DOC E的检索记录156。
进行检索会话158的用户已经指示文件DOC F、DOC G和DOC H。文件DOC F分类在类别S、T和U内,文件DOC G分类在类别T、U和V内,以及文件DOC H分类在类别S、T、U和V内。这些文件由用户指示给160检索工具20的收集工具201。
检索工具20观察到包括在检索会话158内的三个文件都被分类在类别T和U内,并且进一步观察到每个文件也被分类在类别S和/或V中。检索工具20在数据库62中检索162(或可选地命令162数据库62来检索)被分类的检索记录或包括被分类在分类T和U二者中且还被分类在分类S和V的至少一个中的文件的检索记录。相应地,检索工具20找到164检索记录156,检索记录156包括文件DOC E。换言之,检索工具20找到将文件DOC E链接到文件DOCF、DOC G和DOC H的信息。因此,检索工具20向用户发送166再包括文件DOC E的建议。
前述示例的变型在本发明的范围内。例如,检索工具20可以使用包括在检索会话158内的更少或更多文件的类别来作为其在数据库62内的检索的基础。同样地,检索工具20可以使用包括在检索会话158内的文件的更少或更多的共同分类来作为其在数据库62内的检索的基础。
第四链接过程的步骤可以包括在以下描述中:利用用户(例如图12中的用户)指示的至少一个文件(例如文件DOC F、DOC G和DOC H),所述文件包含结构化数据,在存储器中检索至少一个检索记录,该至少一个检索记录包括包含相同的结构化数据中的至少一个的至少一个文件;在所述存储器内找到至少一个这种检索记录(例如检索记录156),该检索记录包括这种文件(例如DOC E);以及向进行检索会话的用户建议他/她包括新找到的文件。
在一些实现方式中,如果文件被包括在其它文件以被建议的方式分类的检索会话中,检索工具20可以被配置为建议包括未分类或错误分类的文件,。例如,检索记录156包括分类在类别R中的文件DOC J。尽管检索会话158中没有文件被分类在类别R中,该实现方式可以配置为建议文件DOC J,因为其与文件DOC E在相同的检索记录中,而文件DOC E具有与检索会话158中的文件共同的分类。
参考图5e描述了利用存储器来找到链接信息的第五链接过程。在该过程中,在来自第一组的文件中找到的内容类似于在第二组的文件中或在与其他会话中第二组的文件一起被记录的文件中找到的内容。
在这种示例中,存储器(数据库62)保持检索记录168。检索记录168包括文件DOC I168,该DOC I包括文本字符“压力传感器...金刚石压电电阻器...”和“..碳化硅..”。检索记录168还包括文件DOC L,文件L包括一些其它文本。
进行检索会话170的用户收集文件DOC J和文件DOC K。文件DOC I讨论通过在碳化硅隔膜上附着金刚石压电电阻器来建立压力传感器。在文件DOC J内,一段讨论通过在碳化硅隔膜上附着金刚石压电电阻器来建立力矩传感器。更具体地,文件DOC J包括语句“...碳化硅隔膜上的金刚石压电电阻器..”但不一定包括语句“...压力传感器...”。文件公开物K讨论压力传感器,但是不一定通过在碳化硅隔膜上附着金刚石压电电阻器。用户向检索工具20的收集工具201指示文件DOC J和DOC K。
检索工具20观察到文件DOC J包括语句“...碳化硅隔膜上的金刚石压电电阻器..”以及观察到文件DOC K包括语句“...压力传感器...”。因此,检索工具20决定在数据库62中检索174(或可选地命令174数据库62来检索)包含文本字符“金刚石压电电阻器”、“碳化硅”和“压力传感器”的文件。检索工具20找到176文件DOC I。换言之,检索工具20找到将文件DOC I链接到文件DOC J和DOC K的信息。所以,检索工具20的建议工具201向用户发送178也包括文件DOC I的建议。
前述示例的变型在本发明的范围内。例如,检索工具20可以基于更少或更多的文本字符和/或其在文本内的频率来检索存储器。同样地,检索工具20可以利用包括在检索会话170内的一个或多个文件的共同文本字符来作为其在数据库62内检索的基础。
第五链接的过程的步骤可以包括在以下描述中:从用户(例如图13中的用户)指示的至少一个文件(例如文件DOC J)中识别一个或多个的文本语句(例如“碳化硅隔膜上的金刚石压电电阻”);在存储器(例如数据库62)中检索具有至少一个相同语句的至少一个其他文件;在所述存储器中找到至少一个这种文件(例如文件DOC I);以及向进行检索会话(例如检索会话170)的用户建议他/她收集新找到的文件。
在一些实施方式中,如果文件包括在其它文件内容以被建议的方式包含文本的检索会话内,则检索工具20可以配置为建议包括不包含类似文本字符的文件。例如,检索记录168包括文件DOC L,文件DOC L包含一些其他文本,所述其他文本不是检索会话170内指示的文件的文本的一部分。尽管检索会话170中没有文件包含与DOC L的文本语句相类似的文本语句,但一种实现方式可以被配置成建议文件DOC L,因为其与文件DOC I位于同一个检索记录中,而文件DOC I具有与检索会话170中的文件共有的内容。
前述讨论提出可以被独立执行以利用存储器来找到将第一组内的文件链接到第二组内的文件的信息。然而,在可选实施例中,可以执行多种算法,每种算法均检索将第一组的文件链接到第二组的文件的信息。在这种情景中,包括文件的多个建议被发送至客户端计算机,并且这些建议可以根据哪种算法提供单个建议而被划分优先级。
在本发明的一些实施例中,根据一种或多种优先级方案来提出所建议的第二组的文件。例如,参考上文中关于文件的第一链接过程的讨论并且参考图5a,如果用户已经包括文件DOC A,则数据库中存在既包括文件DOC A又包括文件DOC B的检索记录导致检索工具建议文件DOC B。然而,实施文件第一链接过程的检索工具可以决定至少一个其它文件DOCC应当被建议,因此关于用户更可能对哪个文件感兴趣来划分建议的优先级。这种优先级划分的示例如下讨论:
所述建议可以根据包括有建议的文件的检索记录的数量来划分优先级。例如,包括存储在数据库内的五个不同的旧检索记录内的文件比仅包括在两个检索记录内的文件具有更高的优先级。所述建议可以根据包括第二组文件的用户和包括第一组文件的用户来划分优先级。
可以根据将第二组的文件包括在检索记录中的用户以及包括第一组的文件的用户来划分建议的优先级。示例用户可以为检索工具用户、搜索引擎用户、报告工具用户等。优先级可以依据诸如用户配置文件的用户数据。例如,由专利审查员完成的检索会话会得到比由私人发明人完成的检索会话更高的分数。例如,参考图5a,如果用户1与用户3(用户3已经包括文件DOC A)在相同的机构工作,并且另一文件DOC C与文件DOC A一起由用户1包括在过去的检索记录内,所述过去的检索记录存储在数据库中,那么如果第三个用户(用户2)不是相同机构的成员,DOC C具有比由用户2包括在存储在数据库中的检索记录内不同的文件DOC E更高的优先级。
所述建议可以根据文件在检索记录或会话内排列的顺序来划分优先级。
所述建议可以根据建议的文件与第一组的文件的内容之间的相似度来划分优先级。
所述建议可以根据与第二组的文件关联的元数据和第一组的元数据关联的文件来划分优先级。一个示例是第一组内用标签W、X和Y标记的文件、第二组内用标签W和X标记的一个文件、以及第二组内用标签W标记的另一个文件。所述第二组内的第一文件具有更高的优先级,因为其具有更多与所述第一组内的文件共用的标签。
所述建议可以根据所建议文件的文本与第一组内的文件的文本的相似度来划分优先级。比较文件文本的方法是本领域众所周知的。一个示例是第一组内的文件具有文本“具有其上有金刚石压电电阻的碳化硅隔膜的压力传感器”,第二组内一个文件具有文本“具有碳化硅隔膜的压力传感器”以及第二组内另一文件具有文本“压力传感器”。所述第二组内的第一文件具有更高的优先级,因为其文本与第一组内文件的文本更相似。
所述建议可以根据第一组排列的顺序来划分优先级。例如,如果第一组包括列在第一位的文件A、列在第二位的文件B和列在第三位的文件C,并且两个待建议的来自第二组的文件D、E被找到具有将第一组的文件A链接到第二组的文件D的信息以及具有将第一组的文件B链接到第二组的文件E的信息,具有到第一组的文件A的链接的文件D比文件E具有更高的优先级,因为发现其与被认定为对于创建第一组的用户而言更重要的文件相关。
本发明可以进一步体现为保持指令的机器可读介质。所述指令在被执行时激活处理器来执行指定与检索会话有关的文件的方法。根据第一和第二存储器(以上讨论的)的逻辑指定,本实施例的机器可读介质提供第一存储器。
作为非限制性示例,机器可读介质可以体现为图3a的服务器16的硬盘驱动器24,处理器可以体现为图3a的服务器16的处理器22,并且指定与检索会话关联的文件的方法可以是按图4的流程图46表示的方法。可选地,本实施例的机器可读介质可以是与服务器操作性通信的外部硬盘驱动器,或者机器可读介质是任何类型的非易失性存储器中的一种,非易失性存储器例如快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、电可擦除只读存储器(E2ROM),或者等同的非临时性存储介质。机器可读介质可以由独立方维护以在请求后将指令(体现为软件代码)分配给其他方。
以上讨论的实施例的另外的变型在本发明的范围内。例如,本发明不必体现为集中托管的网站上的工具。相反,本发明可以体现为安装在个人计算机上与网页可访问的服务器上的有关软件通信的本地软件。可选地,本发明可以体现为由第三方计算机程序通过应用程序接口(API)使用的网页服务。本发明还可以体现为当安装在用户的智能手机上时与所述服务器通信的智能手机应用。本发明可以进一步体现为例如安装在网页浏览器上与所述服务器通信的软件扩展。进一步地,本发明可以体现为第三方安装在应用上的代码片段,并且该代码片段与所述服务器通信。
本发明可以体现为与报告工具、引用管理软件、摘要软件、信息披露申明(IDS)生成软件和检索引擎一同工作。
引用管理软件是学者和作者用来记录并利用文献引文(参考文件)的软件。这种软件的示例包括(基于个人计算机的程序)、RefWorks(线上研究管理、写作和协同工具)、Zotero(管理文献数据和相关研究材料扩展的开源管理软件浏览器扩展)以及Aigaion(也是管理文献数据和相关研究材料的开源管理软件)。文件夹可以被指定为进行报告,并因此本发明可以体现为建议额外的文件添加至文件夹。所建议的额外的文件与已经在文件夹内的文件相关。
摘要软件的示例包括IPfolio(http://www.ipfolio.com)和ProLaw(http://www.elite.com/prolaw)。
IDS生成软件(准备IDS的软件)的示例是“IDS生成器”(从http://www.maxval.com/patent-tools-ids-generator.html可用)。
示例性的检索引擎例如包括那些具有能够标记文件的附加功能并且可以进一步输出被标记的文件的引擎。一种这样的检索引擎是由欧洲专利局(EPO)提供的引擎(参见http://worldwide.espacenet.com上的"My patents list")。指定的列表内的标记文件是待收集的文件,并且检索引擎可建议额外的文件以添加至列表中,所建议的额外的文件与已经标记的文件相关。
在本发明的一些实施例中,用户接收文件信息(例如专利号和授权日)作为包括在检索会话中的文件的建议,但是本发明不因此被限制。例如,实施例可以提供额外的信息,例如标题、摘要、相关文本、发明人或作者名字、图像等等。实施例也可以提供额外的信息,例如所建议的文件被建议的原因、向用户指示所建议文件的重要性的相关分数等等。可以以预先指定的、具有标准字段的格式来提供所述信息。
在本发明一些实施例中,如果用户决定收集文件,例如所建议的文件,诸如专利号和授权日的文件信息被包括在检索记录内。
在本发明的一些其它实施例中,如果用户决定收集文件,例如所建议的文件,从数据库中取回的额外的信息被包括在检索记录内。例如,实施例可以提供额外的信息,例如标题、摘要、相关文本、发明人或作者名字、图像等等。可以以预先指定的、具有标准字段的格式来提供所述信息。
在本发明的一些实施例中,用户能够过滤所建议的文件或者从中导出所建议的文件的文件。换言之,用户可以指定第一组内的文件在它们用作建议额外的文件的基础之前必须满足的标准,和/或用户可以指定文件在它们被建议为额外的文件之前必须满足的标准。用于第二组的这种过滤的非限制性示例如下:
用户指定他仅需要来自满足下述条件的检索记录的建议:去年创建的、由特定用户组创建的、根据特定数据源创建的,等等。
用户指定他仅需要满足下述条件的文件的建议:特定日期之前出版的、包含特定词语的、分类在特定类别中,等等。
用于第一组的这种过滤的非限制性示例包括:
用户指定他需要仅基于(即,仅相关于)会话的前三(3)个收集的文件的建议。
用户指定他需要仅基于(即仅相关于)在指定时间段内被添加至检索会话的新文件的建议。
因此已经描述了本发明的典型实施例,显而易见,本领域技术人员可以容易地实现各种改变、变型和改进。例如,本发明不限于以上链接算法。例如,可以被建议的文件可以包括向前引用(引用已经在检索记录内的文件的更新的文件)和向后引用(被已经在检索记录内的文件引用的较旧文件)。本发明不限于使用链接算法。不用链接算法实施本发明的示例是存储至少一个索引文件的存储器,或其内文件ID被彼此链接或相对于彼此分级且所述检索工具基于这些链接建议文件的数据库。所公开的本发明的变型、修改和改进,尽管在上文中未专门描述,但是其意欲且暗示处于本发明的精神和范围内。因此,上述讨论仅是示例性的;本发明仅由以下权利要求及其等价物限制和定义。
Claims (19)
1.一种指定与检索记录关联的文件的方法,所述方法包括:
提供连接到客户端设备(44a,44b,44c)、服务器(16)和数据库的检索工具(20),其中,所述检索工具(20)包括收集工具(201)和建议工具(202),
响应于从客户端设备(44a,44b,44c)接收的请求,通过所述检索工具(20)打开检索会话;
存储与所述检索会话相关的检索记录,
从客户端设备(44a,44b,44c)接收第一组一个或多个文件的指示,该指示作为用于检索和用于存储在所述收集工具(201)中的基础,
所述检索工具(20)使用至少来自所述数据库的信息来找到将收集工具(201)中的文件中的至少一个链接到第二组文件中的一个或多个文件的信息;
所述检索工具(20)通过建议工具(202)将所述第二组文件的建议呈送给客户端设备(44a,44b,44c),
通过客户端设备(44a,44b,44c)选择由建议工具(202)呈送的文件中的一个或多个以实现将第二组的一个或多个文件与所述收集工具(201)关联。
2.根据权利要求1所述的方法,其中,所述检索工具(20)还生成将被存储在所述数据库中的搜索会话的唯一会话ID,该唯一会话ID将与所述收集工具(201)的文件关联,其中,第二组的文件中的任一个与其他会话ID关联。
3.根据权利要求1或2所述的指定与检索记录关联的文件的方法,其中,在将建议呈送给客户端设备(44a,44b,44c)以将第二组的文件与检索报告关联之后,根据来自客户端设备的请求,将在第二组中建议的一个或多个文件与检索记录关联,
使服务器(16)基于所述第一组文件和第二组文件当中的新的关联的文件来重复检索,
并且使建议工具(202)呈送新建议;
所述重复还基于所述其他会话ID的信息。
4.根据权利要求2或3所述的指定与检索记录关联的文件的方法,其中,打开检索会话包括从客户端设备(44a,44b,44c)接收所述唯一会话ID而不是生成所述唯一会话ID,并且
从数据库取回与所述会话ID关联的一组一个或多个文件的指示;取回的组为第一组的一部分。
5.根据权利要求1所述的方法,其中,所述检索工具(20)还操作成接收、存储和/或恢复下列中的至少一项:
用户相关数据、检索相关数据和文件相关数据。
6.根据权利要求1所述的方法,其中,所述检索工具(20)结合到检索引擎中。
7.根据权利要求1所述的方法,其中,所述检索工具(20)用于创建、编辑和/或递送检索结果。
8.根据权利要求1所述的方法,其中,从客户端设备(44a,44b,44c)接收第一组的指示由从响应于检索查询而呈送给用户的一个或多个文件中标记出一个或多个文件的用户完成。
9.根据权利要求1所述的方法,其中,所述检索会话是在所述选择的文件组中的大多数文件上激活的动作之间的会话。
10.根据权利要求9所述的方法,其中,所述动作是导出、保存、共享、清除和/或打印中的一个。
11.根据权利要求1所述的方法,其中,所述使用至少来自所述数据库的信息包括:
在数据库中检索是第一组的至少一个文件的一个或多个文件ID;
在数据库中找到包括第一组的至少一个文件的一个或多个其他会话记录;以及
找到还包括在一个或多个其他会话记录中的第二组的至少一个文件,所述一个或多个其他会话记录是在数据库中找到的包括第一组的至少一个文件的会话记录。
12.根据权利要求1所述的方法,
其中,第一组的至少一个文件具有关联的元数据;并且
其中,所述使用至少来自所述数据库的信息包括:
在数据库中检索一个或多个其他会话记录,所述一个或多个其他会话记录包括具有第一组的文件所具有的相同的关联的元数据中的至少一些的至少一个文件;以及
在数据库中找到所述一个或多个其他会话记录,包括在所述一个或多个其他会话记录中的文件来自第二组。
13.根据权利要求12所述的方法,
其中,所述元数据从不同的存储器取回。
14.根据权利要求1所述的方法,其中,所述使用至少来自所述数据库的信息包括:
从第一组的至少一个文件内容识别一个或多个文本词组;
在数据库中检索一个或多个其他会话记录,所述一个或多个其他会话记录包括具有相同词组的至少一个文件内容的至少一个文件;以及
在数据库中找到所述一个或多个其他会话记录,包括在所述一个或多个其他会话记录中的文件来自第二组。
15.根据权利要求14所述的方法,
其中,所述内容从不同的存储器取回。
16.根据权利要求1所述的方法,其中,第一方托管收集工具,并且独立的第二方托管服务器和数据库。
17.根据权利要求1所述的方法,其中,第一方操作收集工具,并且独立的第二方托管数据库中的一个或多个并且根据来自第一方的指令执行使用数据库。
18.根据权利要求1所述的方法,
其中,使用至少来自数据库的信息包括执行多个算法,每个算法均检索信息,并且
其中,将用于包括文件的多个建议发送到客户端计算机,所述建议根据哪种算法提供了单独的建议而被分优先级。
19.根据权利要求1所述的方法,其中,第二组的被建议的文件根据下列中的至少一项而被分优先级:
包括第二组的文件的其他会话记录的数量;
包括第二组的文件与第一组的文件的其他会话记录的数量;
与将第二组的文件包括在一个或多个其他会话记录中的一个或多个用户有关的信息,以及与将第一组的文件包括在会话记录中的用户有关的信息;
与将第二组的文件包括在一个或多个其他会话记录中的一个或多个用户有关的信息,以及与将第一组的文件包括在相同的其他会话记录中的一个或多个用户有关的信息;
第二组的文件在一个或多个其他会话记录中被划分的类型,以及第一组的文件在相同的其他会话记录中被划分的类型;
在一个或多个其他会话记录中第二组的文件被指示为与之相关的检索特征,以及在相同的其他会话记录中第一组的文件被指示为与之相关的检索特征;
在其中第二组的文件被添加到一个或多个其他会话记录的检索会话,以及在其中第一组的文件被包括到相同的其他会话记录的检索会话;
第二组的文件被包括在一个或多个其他会话记录中的序号,以及第一组的文件也被包括在相同的其他会话记录中的序号;
与第二组的文件关联的元数据,以及第一组的元数据关联的文件;
第二组的文件的文本与第一组的文件的文本的相似度;
第二组的文件的类别,和第一组的文件的类别;以及
文件在第一组中被列出的顺序。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE1451100-0 | 2014-09-18 | ||
SE1451100A SE1451100A1 (sv) | 2014-09-17 | 2014-09-18 | A system and method of designating documents to associate with a search record |
PCT/IB2015/057167 WO2016042514A2 (en) | 2014-09-18 | 2015-09-17 | A system and method of designating documents to associate with a search record |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107077482A true CN107077482A (zh) | 2017-08-18 |
Family
ID=55533969
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580050550.7A Pending CN107077482A (zh) | 2014-09-18 | 2015-09-17 | 指定要与检索记录关联的文件的系统和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10614105B2 (zh) |
EP (1) | EP3195155A4 (zh) |
CN (1) | CN107077482A (zh) |
SE (1) | SE1451100A1 (zh) |
WO (1) | WO2016042514A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110941711A (zh) * | 2018-09-25 | 2020-03-31 | 深圳市蓝灯鱼智能科技有限公司 | 电子检索报告获取方法和装置、存储介质及电子装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6105021A (en) * | 1997-11-21 | 2000-08-15 | International Business Machines Corporation | Thorough search of document database containing compressed and noncompressed documents |
US20020052894A1 (en) * | 2000-08-18 | 2002-05-02 | Francois Bourdoncle | Searching tool and process for unified search using categories and keywords |
US20030046307A1 (en) * | 1997-06-02 | 2003-03-06 | Rivette Kevin G. | Using hyperbolic trees to visualize data generated by patent-centric and group-oriented data processing |
CN1666192A (zh) * | 2002-09-03 | 2005-09-07 | 富士通株式会社 | 检索处理系统、其检索服务器、客户端、检索处理方法、程序及记录介质 |
US7103714B1 (en) * | 2001-08-04 | 2006-09-05 | Oracle International Corp. | System and method for serving one set of cached data for differing data requests |
CN101454776A (zh) * | 2005-10-04 | 2009-06-10 | 汤姆森环球资源公司 | 用于识别相关法律文件的系统、方法、和软件 |
US7752326B2 (en) * | 2001-08-20 | 2010-07-06 | Masterobjects, Inc. | System and method for utilizing asynchronous client server communication objects |
CN103620605A (zh) * | 2011-06-29 | 2014-03-05 | 微软公司 | 将搜索历史组织成合集 |
US20140189519A1 (en) * | 2012-12-31 | 2014-07-03 | W.W. Grainger, Inc. | Systems and methods for providing website browsing history to repeat users of a website |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9552420B2 (en) * | 2005-10-04 | 2017-01-24 | Thomson Reuters Global Resources | Feature engineering and user behavior analysis |
US9262489B2 (en) * | 2013-07-22 | 2016-02-16 | Cisco Technology, Inc. | Repository-based enterprise search with user customizations |
-
2014
- 2014-09-18 SE SE1451100A patent/SE1451100A1/sv not_active Application Discontinuation
-
2015
- 2015-09-17 CN CN201580050550.7A patent/CN107077482A/zh active Pending
- 2015-09-17 WO PCT/IB2015/057167 patent/WO2016042514A2/en active Application Filing
- 2015-09-17 EP EP15842673.4A patent/EP3195155A4/en not_active Withdrawn
- 2015-09-17 US US15/512,565 patent/US10614105B2/en active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030046307A1 (en) * | 1997-06-02 | 2003-03-06 | Rivette Kevin G. | Using hyperbolic trees to visualize data generated by patent-centric and group-oriented data processing |
US6105021A (en) * | 1997-11-21 | 2000-08-15 | International Business Machines Corporation | Thorough search of document database containing compressed and noncompressed documents |
US20020052894A1 (en) * | 2000-08-18 | 2002-05-02 | Francois Bourdoncle | Searching tool and process for unified search using categories and keywords |
US7103714B1 (en) * | 2001-08-04 | 2006-09-05 | Oracle International Corp. | System and method for serving one set of cached data for differing data requests |
US7752326B2 (en) * | 2001-08-20 | 2010-07-06 | Masterobjects, Inc. | System and method for utilizing asynchronous client server communication objects |
CN1666192A (zh) * | 2002-09-03 | 2005-09-07 | 富士通株式会社 | 检索处理系统、其检索服务器、客户端、检索处理方法、程序及记录介质 |
CN100418088C (zh) * | 2002-09-03 | 2008-09-10 | 富士通株式会社 | 检索处理系统及方法 |
CN101454776A (zh) * | 2005-10-04 | 2009-06-10 | 汤姆森环球资源公司 | 用于识别相关法律文件的系统、方法、和软件 |
CN103620605A (zh) * | 2011-06-29 | 2014-03-05 | 微软公司 | 将搜索历史组织成合集 |
US20140189519A1 (en) * | 2012-12-31 | 2014-07-03 | W.W. Grainger, Inc. | Systems and methods for providing website browsing history to repeat users of a website |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110941711A (zh) * | 2018-09-25 | 2020-03-31 | 深圳市蓝灯鱼智能科技有限公司 | 电子检索报告获取方法和装置、存储介质及电子装置 |
Also Published As
Publication number | Publication date |
---|---|
SE1451100A1 (sv) | 2016-03-18 |
EP3195155A2 (en) | 2017-07-26 |
EP3195155A4 (en) | 2018-08-22 |
US20180143985A1 (en) | 2018-05-24 |
WO2016042514A3 (en) | 2017-05-18 |
WO2016042514A2 (en) | 2016-03-24 |
US10614105B2 (en) | 2020-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Peters | Managing and coding references for systematic reviews and scoping reviews in EndNote | |
US10089287B2 (en) | Redaction with classification and archiving for format independence | |
Gries et al. | Symbiota–A virtual platform for creating voucher-based biodiversity information communities | |
US8769708B2 (en) | Privileged document identification and classification system | |
US20060282468A1 (en) | System for utilizing audible, visual and textual data with alternative combinable multimedia forms of presenting information for real-time interactive use by multiple users in different remote environments | |
US20120191703A1 (en) | Efficient genealogy registry system | |
US20110020777A1 (en) | Jury research system | |
US20050256863A1 (en) | Context management system | |
Bazeley | From mixed data sources to multimethods and integrative mixed methods | |
Lawton et al. | eDiscovery in digital forensic investigations | |
US6883008B2 (en) | System for utilizing audible, visual and textual data with alternative combinable multimedia forms of presenting information for real-time interactive use by multiple users in different remote environments | |
CN107077482A (zh) | 指定要与检索记录关联的文件的系统和方法 | |
Patrick Baggett et al. | Populating the wilderness: crowdsourcing database of the smokies | |
Myntti et al. | Use existing data first: Reconcile metadata before creating new controlled vocabularies | |
Brown | Searching for an Answer: Defensible E-Discovery Search Techniques in the Absence of Judicial Voice | |
Senderov et al. | Online direct import of specimen records into manuscripts and automatic creation of data papers from biological databases | |
US20120246152A1 (en) | Jury research system | |
Mita et al. | CONTENTdm to Digital Commons: considerations and workflows | |
Ramachandran et al. | Climate data initiative: A geocuration effort to support climate resilience | |
US20160019231A1 (en) | Reporting tool and method therefor | |
Randtke | Automated metadata creation: Possibilities and pitfalls | |
US20180300303A1 (en) | System and Method for Collecting and Automatically Populating Forms between a Client and a Legal Professional | |
Machovec | Shared print archiving—Analysis tools | |
Monnik et al. | Forensic identification of students outsourcing assignment projects from freelancer. com | |
US20140019375A1 (en) | Computing system and computer-implemented method for facilitating the choice of an academic offering |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170818 |
|
WD01 | Invention patent application deemed withdrawn after publication |