CN102282555A - 索引和搜索动态地变化的搜索语料库 - Google Patents

索引和搜索动态地变化的搜索语料库 Download PDF

Info

Publication number
CN102282555A
CN102282555A CN2009801548576A CN200980154857A CN102282555A CN 102282555 A CN102282555 A CN 102282555A CN 2009801548576 A CN2009801548576 A CN 2009801548576A CN 200980154857 A CN200980154857 A CN 200980154857A CN 102282555 A CN102282555 A CN 102282555A
Authority
CN
China
Prior art keywords
document
user
search
instruction
uploaded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801548576A
Other languages
English (en)
Other versions
CN102282555B (zh
Inventor
K·托帕坦
Z·王
R·R·米特拉
M·M·马利诺夫斯基
W·张
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102282555A publication Critical patent/CN102282555A/zh
Application granted granted Critical
Publication of CN102282555B publication Critical patent/CN102282555B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)
  • Document Processing Apparatus (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

提供了用于索引和搜索动态地变化的搜索语料库的工具和技术。这些工具可接收将文档通过网络上传到在线文档储存库的请求,并且呈现用户界面以方便上传。用户界面可包括响应于用户激活来授予至少一个其他用户对包含在文档内的内容的搜索的许可的设备。通过用户界面,这些工具可从用户接收与授予许可相关的选择,并且文档与合并用户选择的共享参数相关联。最后,工具可接收要被上传的文档的标识。

Description

索引和搜索动态地变化的搜索语料库
背景技术
各种搜索引擎当前可用于在各种数据存储上执行关键字搜索。然而,这些搜索引擎一般将用户看作匿名实体,并且通常返回相同结果而不考虑哪些特定用户正在执行给定查询。
发明内容
提供了用于索引和搜索动态地变化的搜索语料库的工具和技术。这些工具可接收将文档通过网络上传到在线文档储存库的请求,并且呈现用户界面以方便上传。用户界面可包括响应于用户激活来授予至少一个其他用户搜索包含在文档内的内容的许可的设备。通过用户界面,这些工具可从用户接收与授予许可相关的选择,并且文档与合并用户选择的共享参数相关联。最后,工具可接收要被上传的文档的标识。
应当理解,上述主题可被实现为计算机控制的装置、计算机进程、计算系统或诸如计算机可读介质的制品。通过阅读以下具体实施方式并审阅相关联的附图,这些及各种其他特征将变得显而易见。
提供本发明内容以便以简化形式介绍将在以下的具体实施方式中进一步描述的一些概念。本发明内容并不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在将本发明内容用来限制所要求保护的主题的范围。此外,所要求保护的主题不限于解决在本公开的任何部分中提及的任何或所有缺点的各实现。
附图说明
图1是示出了适用于实现与索引和搜索动态地变化的搜索语料库相关的工具和技术的系统或操作环境的组合方框和流程图。
图2是示出了可与文档相关联的共享许可的示例的方框图。
图3是示出了结合索引和搜索动态地变化的搜索语料库,以及用户可通过它指定图2所示的共享许可的用户界面,由用户设备来执行的过程流程的组合方框和流程图。
图4是示出了与索引和搜索动态地变化的搜索语料库相关的过程流程的流程图,如动态索引和搜索系统所执行。
图5是示出了从用户设备通过网络到文档和索引存储元件的文档流的组合方框和流程图。
图6是提供了与文档和索引存储元件相关的其他细节,并示出了与不同的用户相关联的不同的搜索语料库的方框图。
图7是提供了与文档和索引存储元件相关的其他细节,并示出了与特定文档相关联的不同的动态网络和文件夹的方框图。
图8是示出了用户设备提供的搜索界面和工具,以及示出了用户可通过它为给定搜索定义搜索范围参数的示例UI的方框图。
图9是示出了用户设备和动态索引和搜索系统可通过它结合搜索动态地变化的搜索语料库来协作的过程流程的流程图。
图10是示出了用于随时间执行的各种示例搜索和上传的搜索语料库的动态性质的时间线图。
具体实施方式
以下详细描述提供了用于索引和搜索动态地变化的搜索语料库的技术。尽管此处描述的主题呈现了结合计算机系统上的操作系统和应用程序来执行的程序模块的一般上下文,但是本领域技术人员将认识到,其他实现可以结合其他类型的程序模块来执行。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、组件、数据结构和其他类型的结构。此外,本领域技术人员将理解,可以利用其他计算机系统配置来实施此处描述的主题,这些计算机系统配置包括手持式设备、多处理器系统、基于微处理器的或可编程消费电子产品、小型计算机、大型计算机等。
以下详细描述参考了构成详细描述的一部分并且作为说明示出各特定示例实现的附图。现在参考附图,其中全部若干附图中相同标号表示相同元件,本说明书讨论了用于索引和搜索动态地变化的搜索语料库的各种工具和技术。
图1示出了在100处概括表示的适用于实现索引和搜索动态地变化的搜索语料库的系统或操作环境。更详细地转向图1,任意数目的用户102a,102b和102c(共同地,用户102)可与相应的用户设备104a,104b和104c(共同地,用户设备104)交互。图1分别在106a,106b和106c(共同地,交互106)处表示这些交互。一般而言,结合索引和搜索动态地变化的搜索语料库,这些交互106可表示用户向设备104发出的命令,对这些命令的响应等。
结合交互106,用户设备104可通过一个或多个网络108与一个或多个动态索引和搜索系统110通信。更具体地,用户102通过用户设备104动作,可将各个文档112a-112c(共同地,已上传文档112)上传到索引和搜索系统110提供的在线文档存储111。之后,索引过程可检索这些已上传文档112和索引它们以便后续搜索。一旦索引已上传文档112,用户可执行针对这些已上传文档112的搜索。系统110可提供由任意数目的用户设备104可访问的在线文档储存库。
更具体地转向网络108,这些网络108可表示一个或多个通信网络。例如,网络108可表示局域网(LAN),广域网(WAN),和/或个人区域网(例如,蓝牙型网络),这些网络中的任何一个可单独地或组合地操作以方便索引和搜索动态地变化的搜索语料库。如图1所示的网络108还表示与实现这些网络相关联的任何硬件(例如,适配器、接口、电缆等)、软件,或固件,并且还可表示这些网络可用于操作的任何协议。
更具体地转向索引和搜索系统110,如图1所示的这些系统110可表示任意数目的这些系统。索引和搜索系统110可结合索引和搜索动态地变化的搜索语料库与任意数目的用户设备104协作。例如,索引和搜索系统110和用户设备104可以适于不同的实现的客户-服务器关系,对等关系或任何其他合适的关系来协作。
更详细地转向系统110,这些系统可包括可具有被选为适于各特定实现的特定类型或架构的一个或多个处理器114。处理器114可耦合到被选为与处理器114兼容的一个或多个总线系统116。
系统110还可包括耦合到总线系统116的计算机可读存储介质118的一个或多个实例。总线系统116可使处理器114将代码和/或数据读取到计算机可读存储介质118或从计算机可读存储介质118读取代码和/或数据。介质118可表示使用任何合适的技术来实现的存储元件形式的装置,这些技术包括但并不限于,半导体、磁性材料、光学等。介质118可包括存储器组件,无论其被归类为RAM、ROM、闪存、还是其他类型,并且还可表示硬盘驱动器。
存储介质118可包括指令的一个或多个模块,这些指令在被加载到处理器114中并被执行时,使得系统110执行与动态地索引和搜索改变搜索语料库相关的各种技术。如在本说明书全文中所述的,指令的这些模块还可使用在本说明书全文中所详述的组件,流程和数据结构来提供系统110可用于提供索引和搜索动态地变化的搜索语料库的各种工具或技术。例如,存储介质118可包括实现动态索引和搜索工具120的一个或多个软件模块。这些索引和搜索工具120一般地表示被编程或配置成执行此处分配给系统110的各种功能的软件。
存储介质118还可包含用于存储已上传文档112的在线文档存储元件111的一个或多个示例。存储介质还可包括索引存储元件122。后续附图进一步详细说明了存储元件111和122。然而,总的来说,如图1所示的文档存储元件111一般地表示表示各种文档、许可级别、共享规范等的数据结构的存储位置。索引存储元件122概括表示方便搜索上传文档112的索引的存储位置。
图2示出了在200处一般地表示的用户设备(例如,图1中的104,并且带入图2)的组件。图2还示出了结合索引和搜索动态地变化的搜索语料库可与文档相关联的共享许可的示例。
更详细地转向用户设备104,这些设备可包括可具有被选为适于特定实现的特定类型或架构的一个或多个处理器202。用户设备104中的处理器202可以或可以不具有与索引和搜索系统110中的处理器114相同的类型或架构。处理器202可耦合到被选为与处理器202兼容的一个或多个总线系统204。用户设备104中的总线系统204可以或可以不具有与被选为用于索引和搜索系统110的总线系统116相同的类型和架构。
用户设备104还可包括耦合到总线系统204的计算机可读存储介质206的一个或多个实例。总线系统204可使处理器202将代码和/或数据读取到计算机可读存储介质206或从计算机可读存储介质206读取代码和/或数据。介质206可表示使用任何合适的技术来实现的存储元件形式的装置,这些技术包括但并不限于,半导体、磁性材料、光学等。介质206可包括存储器组件,无论其被归类为RAM、ROM、闪存、还是其他类型,并且还可表示硬盘驱动器。
存储介质206可包括指令的一个或多个模块,这些指令在被加载到处理器202中并被执行时,使得用户设备104执行与索引和搜索动态地变化的搜索语料库相关的各种技术。如在本说明书全文中所述的,指令的这些模块还可提供各种工具或技术,通过它用户设备104可使用在本说明书全文中所详述的组件,流程和数据结构来索引和搜索动态地变化的搜索语料库。例如,存储介质206可包括实现文档上传工具208的一个或多个软件模块。一般而言,等待的文档上传工具表示用于使用户设备104能够通过网络(例如,图1中的108)上传任意数目的文档210用于在合适的索引和搜索系统(例如,也在图1中的110)上进行索引和存储的软件。
已上传文档210可与在212处一般地表示的共享许可相关联。可使用呈现给用户102的合适的用户界面来填充共享许可212。图3示出了这些用户界面的示例,并且在结束图2的描述之后将在以下讨论。
更具体地转向共享许可212,图2示出了当上传文档210时用户可指定的共享和/或搜索许可的若干示例。例如,如在214处一般地表示的,上传用户可指定给定文档210不被任何其他用户共享或可由其搜索。以此方式,上传用户可将他的或她的至少一些上传文档210维持为隐私。
如在216处表示的,上传用户可标识被授予许可在已上传文档内访问、编辑、和/或搜索的一个或多个其他个体用户。更具体地,在框216中授予的访问许可可表示授予特定被标识或被枚举的个人的许可,如与授予其中个体个人是成员的组或其他集体结构的许可相区别。
如在218处表示的,上传用户可标识一个或多个组或其他集体结构,进而使用这些组或其他结构并且编制(caning)任意数目的组成或成员。由此,除上传用户之外的给定用户可通过框216中显式标识或枚举来接收访问许可,或通过在框218中接收访问的组中的成员资格来继承访问许可。
如在框220中表示的,上传用户可标识其成员是要接收已上传文档的共享和/或搜索许可的域。更具体地转向“域”的概念,在企业上下文(例如,名为ABC有限公司的假想公司)中,域的成员可包括其电子邮件地址(例如,john.smithabc.com)或用户登录指示与企业的从属关系的那些用户。在一些情况下,上传用户可选择来与域相关联的一些用户子集共享已上传文档。例如,上传用户可指定将已上传文档限制为“emp”abc.com的共享许可,使得电子邮件地址以“emp”开始的所有用户可访问上传文档。以此方式,上传用户可使这个域的一些或所有成员在已上传文档内共享和/或搜索。
如在框222处表示的,上传用户还可指示已上传文档是免费可用的,供索引和搜索系统110的任何用户搜索和/或共享。以此方式,上传用户可使已上传文档对于这些其他用户中的任何用户“公共”可用。
图3示出了在300处概括表示的由用户设备结合索引和搜索动态地变化的搜索语料库来执行的过程流程。图3还示出了(在302处一般地表示)用户界面(UI),通过它上传用户可指定对图2中所示的一个的共享和/或搜索许可。
更具体地转向图3,过程流程300可被理解为进一步详细描述文档上传工具208执行的过程。然而,本说明书的各实现可用其他组件执行过程流程300的至少部分而不背离本说明书的范围和精神。
框304表示从给定上传用户(例如,图1中的102)接收上传一个或多个文档的请求。图2在210处提供了这些文档的示例。
框306表示响应于在框304中接收到的请求将合适的用户界面(UI)提供给上传用户。例如,框306可包括呈现UI 302。更具体地转向UI 302,它可包括用于选择要上传的文件的文档选择设备308。例如,文档选择设备308可使用户在与已上传文档相关联的路径和名称中直接使用密钥,或可允许用户浏览并选择目录结构内的已上传文档。
UI 302可包括设备310,响应于用户输入或激活来指示已上传文档对上传用户是保持为私密。在不同的可能实现中,设备310可在用户正在上传文档时呈现给上传用户,或可在用户上传文档之后呈现给上传用户。例如,一旦已上传文档存储在索引和搜索系统110上,通过激活设备310,上传用户可指定已上传文档不与任何其他用户共享或可由其搜索。
UI 302可包括设备312,响应于用户输入或激活来指示已上传文档可与索引和搜索系统110上的一个或多个特定枚举或标识的其他用户共享。例如,上传用户可检查或以其他方式激活设备312,并且可随后将特定标识被授权访问已上传文档的其他用户的信息输入到字段314中。输入到字段314中的信息可包括电子邮件地址,索引和搜索系统110发出的唯一用户标识符,或其他合适、的标识信息。在一些情形中,上传用户可选择字段314并且将字符输入到那个字段中。当用户将字符输入到字段314中时,文档上传工具208可过滤和更新其标识符与所输入的字符匹配的其他用户的列表。
UI 302可包括设备316,响应于用户输入或激活来指示一个或多个其他用户组可在已上传文档内共享和/或搜索。例如,上传用户可检查或以其他方式激活设备316,并且可随后将标识可访问已上传文档的一个或多个其他用户组的信息输入到字段318中。类似于字段314的以上描述,字段318可响应于已输入到这个字段中的字符,使得字段318呈现与所输入的字符匹配的预定义组的已过滤列表。
设备320响应于用户输入或激活来指示已上传文档可与一个或多个给定域相关联的用户共享或可由其搜索。例如,上传用户可检查或以其他方式激活设备302,并且可将信息输入到字段322中并标识已上传文档要与其共享的域。与如上字段314和318相比,字段322还可基于输入到字段322中的任何字符来提供用于呈现不可辨认的域的过滤功能。
设备324响应于用户输入或激活来指示已上传文档要与具有对索引和搜索系统110的合法访问的任何用户共享或可由其搜索。以此方式,上传用户可通过激活设备324使给定已上传文档对于索引和搜索系统110公共可访问和可搜索。
图3将设备310-324共同表示为共享或搜索偏好326,如上传用户针对给定上传文档所表达。值得注意的是针对给定已上传文档,可适于在不同的上下文中激活一个或多个偏好326。例如,如果激活设备310来维护给定已上传文档为私密的,可停用其余设备312-324(例如,变灰或不响应于用户选择)。同样,如果激活设备324来公共共享给定已上传文档而没有限制,可停用设备310-322。
关于设备312-322,取决于用户希望如何管理给定已上传文档,用户可激活这些设备中的一个或多个。例如,用户可希望与两个不同的特定命名的用户共享已上传文档,并且可通过激活设备312和标识字段314中的命名用户来这样做。除这两个特定命名的用户之外,用户可通过激活设备316并标识字段318中的所需组来与一个或多个用户组共享已上传文档。在字段314中标识的两个特定命名的用户可以是或可以不是字段318中标识的组的成员。类似地,通过激活设备320并填充字段322,可与与特定域相关联的用户共享已上传文档。一般而言,用户可一起或分开激活或停用适于特定已上传文档的设备312,316和320。
返回到过程流程300,框328表示接收共享/搜索参数326,如由用户通过UI 302提供的各种工具所选择和所输入。进而,框330表示将文档上传到索引和搜索系统110。已上传文档可与共享/搜索引用326相关联,使得索引和搜索系统110可索引已上传文档,适于稍后搜索。
图4示出了在400处一般地表示的与索引和搜索动态地变化的搜索语料库相关的过程流程,如动态索引和搜索系统100所执行。更具体地,过程流程400可被理解为进一步详细描述图1所示的动态索引和搜索工具120。然而,虽然过程流程400结合动态索引和搜索系统110来描述,但本说明书的各实现可用其他组件执行这些过程流程400的至少部分而不背离本说明书的范围和精神。
更具体地转向过程流程400,框402表示接收给定已上传文档。例如,继续上述图讨论的情形,框402可表示接收图2所示的文档210。另外,框402可包括通过一个或多个中间网络(例如,图1中的108)接收已上传文档。
框404表示提取为上传文档指定的任何适用共享/搜索偏好。共享/搜索偏好的示例在图3中的326处示出,如可使用UI设备310-326来定义。
框406表示索引已上传文档,适于支持后续搜索。例如,框406可包括处理已上传文档的内容并构建已上传文档的搜索索引。搜索索引可包括在已上传文档内找到的关键词,并且可指示在已上传文档内这些词出现在哪里。因此,如果给定传入搜索请求这些关键词的出现,搜索索引可有效地返回如在已上传文档内所找到的这些关键词的任何位置,并且还可返回文档本身。
另外,框406可包括填充与已上传文档相关联的拥有者记录,如在框408处所一般地表示。如此处所使用的,文档的“拥有者”指的是将文档上传到索引和搜索系统110的用户。一般而言,已上传文档的拥有者指定与那个已上传文档相关联的共享/搜索偏好326。
框406还可包括分析如在框404中所提取的共享/搜索偏好,来确定已上传文档是否要被除文档拥有者之外的用户共享或可由其搜索。图4在判定框410处一般地表示这个分析。例如,框410可包括参考共享/搜索偏好326或已上传文档来确定当上传文档时拥有者是否激活设备310。
从判定框410,如果已上传文档不被除拥有者之外的任何用户共享或可由其搜索,过程流程400可取“否”分支412以返回到框406(在414处一般地表示)。然而,返回到判定框410,如果已上传文档要被除拥有者之外的至少一个用户共享或可由其搜索,过程流程400可取“是”分支416到框418。框418表示填充由索引和搜索系统110内部维护的记录以指示哪些其他用户可搜索已上传文档。另外,其他过程流程可进一步填充这些记录以指示哪些其他用户可查看或编辑已上传文档。之后,过程流程400可经由框414返回到框416。
在完成框406之后,过程流程400可前进到框420,其表示响应于与已上传文档相关联的共享/搜索偏好来更新一个或多个搜索语料库。例如,如在422处表示的,如果拥有者提供新的已上传文档,与该拥有者相关联的搜索语料库可包括至少这个新的已上传文档。另外,如果该拥有者已经标识了至少一个其他用户可访问该已上传文档,还可更新其他用户的搜索语料库以包括至少该已上传文档。
在其他情形中,从拥有者的角度,一个或多个其他用户可许可拥有者访问由那些其他用户上传的文档。因此,在那些其他用户显式地或隐式地许可拥有者访问这些文档的情况下,框424表示更新拥有者的搜索语料库以合并或包括由其他用户上传的文档。
显式授予拥有者的许可的示例可包括其中其他用户将拥有者特定标识为可访问由那些其他用户上传的文档的情形。隐式授予拥有者许可的示例可包括其中拥有者是由其他用户指定的组的成员的情形,如在框426处所一般地表示。在这些情形中,拥有者可通过这些其他用户指定的组中的成员资格来继承访问权限。
作为隐式授予许可的另一示例,框428表示拥有者通过与域相关联来接收给定已上传文档的共享或搜索权限。例如,其他用户可上传给定文档,并且可指定域的所有成员可访问上传文档。另外,在那个文档的拥有者使文档公共可用的情况下,框430表示拥有者接收给已定上传文档的共享或搜索权限。
图5示出了在500处一般地表示的其中用户设备通过网络将文档上传到在线文档和索引存储元件的组件和文档流程。更具体地转向图5,这个图带入在101a,104b和104c处的用户设备的示例。图5还带入在108处的代表性网络,在210a和210c处的代表性上传文档,以及在122处的代表性在线文档存储元件。
在图5所示的示例情形中,用户设备104a通过网络108上传文档210a。已上传文档210a可与对应的许可集相关联,在212a处带入。许可212a可标识上传文档的拥有者,并且还可以指示哪些其他用户(如果有的话)被许可在已上传文档内共享或搜索。如图所示,许可212a指示(如图1所示的)用户102a拥有已上传文档210a,并且用户102a只允许用户102b共享或搜索这个已上传文档。
在图5所示的其他示例中,示出用户设备104c来上传文档210c,这个文档与对应许可212c相关联。如图所示,许可212c指示(如图1所示的)用户102c拥有上传文档210c,并且用户102c只允许用户102a共享或搜索这个已上传文档。
当已上传文档210a和210c到达索引和搜索系统110时,这个系统110可将已上传文档210处理到在线文档和索引存储元件122中。如图5所示,存储元件122可包括分别对应于已上传文档210a和210c的表示502a和502c(共同地,文档表示502)。
转向文档表示502a,存储元件122可使表示504a和506a与其相关联。更具体地,表示504a可指示已上传文档210a的拥有者是用户102a,而表示506a可指示用户102a已授予用户102b共享/搜索上传文档210a的许可。
类似地,转向文档表示502c,存储元件122可使表示504c和506c与其相关联。表示504c可指示已上传文档210c的拥有者是用户102c,而表示506c可指示用户102c许可用户102a共享/搜索已上传文档210c。
现在转向图6,这个图示出了在600处一般地表示的与在线文档和索引存储元件122相关的其他细节。另外,图6示出了与不同的用户相关联的不同的搜索语料库。
更具体地转向图6,当新的已上传文档到达索引和搜索系统110时,当已上传文档被移除、删除,或修改时,或当现有已上传文档的共享许可随时间变化时,系统110可更新在线文档和索引存储元件122。更具体地,当任何上述事件随时间发生时,存储元件122可动态地定义、维护,和更新与不同的用户相关联的搜索语料库的表示。
图6在602a处共同表示为多个不同的用户维护的搜索语料库。更具体地转向索引存储元件122,这些元件122可包括不同的文档(例如,210a和210c)的表示。在所示的示例中,表示604a对应于文档210,并且表示604c对应于文档210c,为了清楚起见,用户102a-102c从图6中略去。
进而,文档表示604a-604c(共同地,文档表示604)可指示哪些用户拥有并且可共享或搜索文档。在所示的示例中,文档表示604a与所有权记录606a相关联,其指示用户102a拥有已上传文档210a。然而,在本说明书的各实现中,给定用户可拥有任意数目的已上传文档。
另外,文档表示604a与搜索记录608a相关联,其指示文档210a的拥有者许可至少用户102b在文档210a内共享或搜索。回想这个示例的上述描述,用户102a上传文档210a,以及允许用户102c访问已上传文档210a的许可信息。然而,在本说明书的各实现中,给定用户可具有访问多个已上传文档的许可。另外,在这些实现中,许可的示例可延伸超过图6所示的搜索或共享许可。
转向文档表示604c,在图6所示的示例中,所有权记录606c可指示用户102c上传并拥有文档210c。另外,搜索记录608c可指示用户102c已经与至少用户102a共享文档210c,许可至少用户102a搜索文档210c。
图7示出了在700处一般地表示的与存储元件122相关的其他细节。更具体地,图7示出了与特定已上传文档210相关联的不同的动态网络和文件夹。
更具体地转向图7,作为对不同的上传文档所维护的动态网络在702处共同表示。在图7所示的快照中,索引存储元件122定义和维护与用户102a相关联的动态网络702a,与用户102b相关联的动态网络702b,以及与用户102c相关联的动态网络702c。
一般而言,这些动态网络702可指示,针对给定用户,其中允许那些用户不管是通过拥有那些文档还是通过共享那些文档的拥有者授予的许可来搜索的那些文档。如本文别处所述的,这些动态网络是“动态的”,意指在添加或删除新文档时或在这些文档的拥有者更改那些文档的许可设置时,它们的范围可随时间变化。
转向对应于用户102a的动态网络702a,这个动态网络702a可指示用户102a已经访问并且被许可搜索至少文档210a(通过所有权)和文档210c(通过拥有用户102c授予的许可)。由此,在图7所示的快照中,与文档210a相关联的动态网络702a包括用户102a和102b。此外,其中用户102a可搜索的文档的动态搜索语料库704a包括文档。
同样,转向对应于用户102b的动态网络702b,这个动态网络702b可指示用户102b不拥有任何文档。然而,在图7所示的示例中,用户102a已经授予用户102b在文档210a内搜索的许可。因此,在图7所示的快照中,与用户102b相关联的动态网络702b可包括用户102a。此外,与用户102b相关联的动态搜索语料库704b可包括文档210a。
最后,与用户102c相关联的动态网络702c可指示用户102c拥有文档210c。因此,在图7所示的快照中,与用户102c相关联的动态网络702c可包括用户102c和用户102a。此外,与用户102c相关联的动态搜索语料库704c可包括文档210c。
如上所述的,与用户102a相关联的搜索语料库704a可指示用户102a可在(用户102a拥有的)文档210a内和在(用户102c授予的许可)文档210c内搜索。然而,如以下进一步详细描述的,对于给定搜索,用户102a可以或不可以跨他的或她的整个许可搜索语料库搜索。由此,搜索语料库704a指示其中用户102a在任何给定时间许可搜索的文档的最大范围。
如本说明书全文中所述的,当文档210添加到文档存储111和索引存储122或从其中删除时,搜索语料库704a的程度和范围可随时间动态地变化。另外,这些文档210的拥有者可调整或修改他们的文档210的许可集。任何上述事件,以及可能其他事件可对不同的用户102的搜索语料库704产生一种类型的连锁反应。
类似地,在图7所示的示例快照中,用户102b未上传任何文档。然而,搜索语料库704b指示用户102b已经被授予访问文档210a的许可,应当是用户102b为给定搜索如此选择。另外,取决于由用户102b或其他用户102采取的动作,搜索语料库704b还可动态地变化。
对为用户102c维护的动态搜索语料库704c应用类似的考虑。在图7所示的快照中,搜索语料库704c指示用户120c可(通过所有权)在文档210c内搜索。然而,搜索语料库704c可指示用户102c未被授予访问任何其他已上传文档的许可。
上述附图1-7描述了与从用户设备上传文档并将这些已上传文档处理到文档和索引存储元件122中相关的各种技术。从图8开始,本说明书开始讨论与搜索如被处理到文档和索引存储元件122中的这些已上传文档相关的技术。
图8示出了在800处一般地表示的如用户设备所提供的搜索界面和工具,以及示例UI,用户可通过它为给定搜索定义搜索范围参数。为易于说明,图8在104处带入代表性用户设备,可包含在206处为了方便起见带入的代表性计算机可读存储介质。如图8所示,存储介质206可包括提供搜索界面和相关工具802的软件模块。
更具体地转向搜索界面和工具802,响应于启动搜索已上传文档的用户请求,这些工具802可提供UI 804。如图8所示,UI 804可包括字段806,用户可将一个或多个关键字或其他术语输入其中以在已上传文档中定位。
UI 804可包括设备808,响应于用户输入或激活以指示给定用户希望只在他或她已经上传的文档中搜索关键字。换句话说,如果激活设备808,在索引和搜索系统110上执行的搜索将只包括给定用户拥有的那些文档。
UI 804还可包括设备810,响应于用户输入或激活以指示给定用户希望只在由授权给定用户访问那些已上传文档的其他用户所上传的文档中搜索关键字。换句话说,如果激活设备810,在索引和搜索系统110上执行的搜索将只包括给定用户不拥有的,但用户被授权访问的文档。
设备812响应于用户输入或激活以指示给定用户希望在除给定用户被授权访问的文档之外的他或她已经上传和拥有的文档中搜索关键字。换句话说,通过激活设备812产生的搜索结果可等价于通过检查设备808和810两者将会产生的结果集。
最后,设备814响应于用户输入或激活以指示给定用户希望在对于所有用户是“公共”可用的已上传文档中搜索关键字。换句话说,激活设备814导致搜索其许可被设为“公共的”的所有文档,,而不考虑谁拥有文档或谁已经被授予访问文档。
值得注意的是,可选择适于不同的给定搜索以定义那些搜索的范围的设备808-814。在这个上下文中,术语“范围”指的是针对其执行给定搜索的已上传文档的语料库。总体上,设备808-814可被表征为用于定义搜索范围的选择设备。这个已定义的搜索范围可被表达为搜索范围参数816。可单独地或组合地激活这些范围选择设备以定义不同的给定搜索的所需范围。例如,通过激活(例如,检查)设备808和814,给定用户可运行针对给定用户拥有的那些文档和针对其他用户公共可用的那些文档的搜索。作为另一个示例,通过激活设备812和814,给定用户运行针对给定用户(不管是通过直接所有权或通过另一个拥有者授予的许可)可访问的那些文档的搜索。
在UI 804的一些实现中,这个UI可包括如在808处一般地表示的排名工具。总的来说,取决于其中定位搜索结果的已上传文档的类型,这些排名工具818可使用户指定搜索结果如何相对于彼此排名。例如,假设给定用户上传他或她自己的文档,并且之后执行给定搜索,用户可希望出现在他或她自己的文档中的搜索结果在搜索结果中第一个出现,之后是在非拥有的已上传文档中出现的任何其他命中。
更具体地转向排名工具818,对应于相对于彼此的那些已激活的设备,这些排名工具可与任何激活的或选择的设备808-814协作以对搜索结果排名。例如,排名工具820a和820b(共同地,排名工具820)可与UI设备808相关联,并且排名工具822a和822b(共同地,排名工具822)可与UI设备810相关联。类似地,排名工具824a和824b(共同地,排名工具824)可与UI设备812相关联,并且排名工具826a和826b(共同地,排名工具826)可与UI设备814相关联。
在操作中,假设给定用户激活或选择UI设备808,使得在给定用户自己的文档内出现的命中在搜索结果中出现,排名工具820可允许给定用户指定在搜索结果中这些命中相对于在其他类型的已上传文档中出现的命中呈现在哪里。例如,给定用户可激活排名工具820a以提高搜索结果中的这些命中的相对排名,并且可激活排名工具820b以降低这些命中的相对排名。用户可在适当时重复激活排名工具820,直到达到所需排名。
在各示例实现中,排名工具820a-826a可以是“向上”箭头,而820b-826b可以是“向下”箭头。在一些情形中,排名工具820-826可以是“变灰”或停用,直到激活对应的UI设备808-814。另外,UI 804可响应于排名工具820-826的操纵来调节其中设备808-814呈现的次序。换句话说,其中设备808-814在UI 804中出现的次序可反映用户通过排名工具818指定的搜索结果的排名。
图9示出了在900处一般地表示的用户设备104和动态索引和搜索系统110可用于结合搜索动态地变化的搜索语料库来协作的过程流程。如上述附图所示,用户设备104和搜索系统110可通过一个或多个合适的网络108通信。
首先转向用户设备104,过程流程900可从框902开始,其表示从用户(如提供给用户设备104)接收搜索命令或请求,。进而,响应于在框902中接收到的搜索命令,框904表示将合适的UI呈现给用户。图8提供了在804处一般地表示的这一UI的示例。
框906表示接收一个或多个关键词或其他搜索术语(如输入到在框904中呈现的UI中的)。例如,这个UI可包括诸如在图8中的806处所示的用户可将所需关键字输入到其中的字段。
框908表示接收如用户所提供的搜索范围的选择。例如,在框904中呈现的UI可包括诸如在图8中的808-814处所示的那些设备的设备。以此方式,用户可指示他或她是否希望搜索:只有他或她自己的已上传文档;授权用户访问那些文档或已经上传这些文档并使它们公共可用的其他用户上传的文档;或上述情形的任何组合。
框908还可包括接收适于搜索结果的指定排名。例如,框908可包括从排名工具818接收输入,如图8所示并以上所讨论。
在一些实现情形中,过程流程800可包括框910,其表示存储搜索术语,范围定义,和用于稍后检索的模板中的排名规范。例如,在给定用户重复执行相同搜索的情况下,可更有效地从模板检索搜索参数,而非使用户对于每个重复搜索重新输入相同参数。
框912表示将搜索请求从用户设备104通过网络102发送给动态索引和搜索系统110。图9表示在914处的如从用户设备104所传送的搜索请求。一般而言,搜索请求914可包括用户提交请求的标识,关键词或其他搜索术语,搜索范围的指示,以及在一些情况下,偏好或排名结果的指示。
现在参考动态索引和搜索系统110,框916表示接收搜索请求914。进而,系统110可从搜索请求914中提取用户标识(即,用户ID),如框981所表示。另外,系统110可从搜索请求914中提取搜索范围参数,如框920所表示。框922表示提取在搜索请求914中指定的关键词或其他搜索术语。
基于如在框918和920中提取的用户ID和搜索范围,框924表示过滤已上传到索引和搜索系统110的文档。为了加快这个过滤过程,框924可包括引用与不同的用户或用户ID相关联的搜索语料库。例如,简要地回头参考图6,系统110可包括在线文档和索引存储122。进而,存储元件122可使相应搜索语料库602与不同的用户相关联。
返回到图9,在搜索时,当这些用户中的一个提交搜索请求时,框924可包括为适当用户定位搜索语料库。进而,框926表示在包含在那个用户的适当搜索语料库内的文档内搜索指定关键词。另外,在搜索请求指定排名偏好的情况下,框928可包括对任何搜索结果排名。
框930表示返回在响应于搜索请求914的已上传文档内定位的任何搜索结果。图9在932处一般地表示这些搜索结果。
在用户设备104处,框934表示接收搜索结果932。进而,用户设备104可格式化和呈现搜索结果。在搜索请求914指定排名偏好的情况下,用户设备104可在显示搜索结果932时合并这些排名偏好。
图10提供了在1000处一般地表示的示出随时间的搜索语料库的动态性质的时间线。图10还示出了这个动态性质如何影响随时间执行的示例搜索结果。
更具体地转向图10,图10示出了沿着时间轴1002在任意时刻顺序地出现的一系列事件。如在1004处一般地表示的,给定用户A上传给定文档A。这个文档A可包含示例文本“ABC”,并且用户A可与另一用户B共享文档A。
响应于在1004处表示的上传,动态索引和搜索系统110可更新与用户A相关联的搜索语料库以包括文档A。另外,系统110还可更新与用户B相关联的搜索语料库以包括文档A。
如在1006处一般地表示的,用户B可在他的或她的搜索语料库内查询包含文本“ABC”的任何文档。由于上传1004,用户B的搜索语料库现在包含文档A,其进而包含搜索文本“ABC”的命中。因此,如在1008处一般地表示的,系统110将至少文档A返回给用户B。
如在1010处表示的,另一用户C上传另一文档C,其也包含示例文本“ABC”。另外,这个用户C公共共享这个文档C。响应于这个上传1010,系统110将更新用户A,B和C相应的语料库以包括新的已上传文档C。
如在1012处表示的,如果用户B在包含示例文本“ABC”的他的或她的搜索语料库内重复文档的上述查询,这个查询现在将返回文档A和C,如在1014处所一般地表示。不同的用户的搜索语料库的动态性质由这个示例示出,其中相同用户执行的相同搜索在不同的时间返回不同的结果。
为了进一步示出动态网络和搜索语料库的灵活性,为了与用户B执行的处理形成对比所示,图10还描述了与其他代表性用户D相关联的处理。例如,如在1016处所示的,用户D可查询包括“ABC”的所有文档。一段时间之后,如在1018处所示的,响应于在1016处表示的查询,系统可将文档集返回给用户D。
如在1020处一般地表示的,相同用户D可重复对包含“ABC”的所有文档的查询,在1020处执行的查询与在1016处执行的查询相同。响应于在1020处表示的查询,系统可将相同文档集返回给用户D,如在1022处所一般地表示。更具体地,在1022处返回给用户D的文档集可与在1018处返回给那个用户的文档相同。相反,用户B在不同的时间执行相同查询时接收不同的文档集,如在1008和1014处所表示。然而,与用户B和D相关联的网络可以是不同的,导致这些不同的用户在不同的时间执行相同查询时接收不同的结果。任何示例所示,用户B接收在不同的时间执行的相同查询的不同的结果,而用户D接收在不同的时间执行的相同查询的相同结果。
上述描述提供了用于索引和搜索动态地变化搜索语料库的技术。虽然本说明书合并了计算机结构特征,方法动作和计算机可读介质专用的语言,所附权利要求书的范围不必限于此处描述的特定特征,动作或介质。相反,本说明书提供了说明性的而非限制各实现。此外,这些实现可修改和改变本说明书的各个方面,而不背离在以下权利要求书中所述的本说明书的真实精神和范围。

Claims (15)

1.一种包括其上存储有计算机可执行指令(208)的至少一个计算机可读存储介质(206)的装置(104),当所述计算机可执行指令加载到处理器(202)中并执行时,使得所述处理器:
接收(304)将至少一个文档(210)通过网络(108)上传到在线文档储存库(111)的请求;
结合所述上传来呈现(306)用户界面(130),其中所述用户界面包括至少一个装置(310-324),响应于用户激活来授予至少一个其他用户对包含在所述文档内的内容进行搜索的许可;
通过所述用户界面从所述用户接收(328)与授予所述许可相关的至少一个选择;
使所述文档与合并所述用户选择的共享参数(326)相关联;以及
接收要被上传的所述文档的至少一个标识(210A)。
2.如权利要求1所述的装置,其特征在于,还包括根据所述选择上传所述所标识的文档的指令。
3.如权利要求1所述的装置,其特征在于,呈现用户界面的所述指令包括呈现包括至少一个其他装置的用户界面的指令,所述至少一个其他装置响应于用户激活使所述用户避免与任何其他用户共享所述文档。
4.如权利要求1所述的装置,其特征在于,呈现用户界面的所述指令包括呈现包括至少一个其他装置的用户界面的指令,所述至少一个其他装置响应于用户激活使所述用户标识被授予搜索所述文档内的内容的许可的至少一个用户组。
5.如权利要求1所述的装置,其特征在于,呈现用户界面的所述指令包括呈现包括至少一个其他装置的用户界面的指令,所述至少一个其他装置响应于用户激活使所述用户标识被授予搜索所述文档内的内容的许可的至少一个用户域。
6.如权利要求1所述的装置,其特征在于,呈现用户界面的所述指令包括呈现包括至少一个其他装置的用户界面的指令,所述至少一个其他装置响应于用户激活使所述用户指定所述文档能够被所述在线文档储存库的任何其他用户搜索。
7.一种包括其上存储有计算机可执行指令(120)的至少一个计算机可读存储介质(118)的装置(110),其特征在于,当所述计算机可执行指令加载到处理器(114)中并执行时,使得所述处理器:
接收(402)上传到在线文档存储库(111)的至少一个文档(210);
标识(408)所述文档的拥有者(606a);
提取(404)为所上传的文档指定的共享许可,其中所述共享许可指示所上传的文档是否被包括在与除所述拥有者之外的至少一个用户相关联的动态搜索语料库(704a)中;以及
索引(406)所上传文档的内容,至少供所述文档的所述拥有者和其搜索语料库包括所上传的文档的任何其他用户搜索。
8.如权利要求7所述的装置,其特征在于,还包括接收对与所上传的文档相关联的所述共享文档的至少一个更新的指令,并且还包括响应于所述更新来更新至少一个其他用户的所述至少一个动态搜索语料库的指令。
9.如权利要求8所述的装置,其特征在于,接收更新的所述指令包括接收将所述文档添加到与至少所述其他用户相关联的动态搜索语料库的更新的指令。
10.如权利要求8所述的装置,其特征在于,接收更新的所述指令包括接收从与至少所述其他用户相关联的动态搜索语料库中移除所述文档的更新的指令。
11.如权利要求7所述的装置,其特征在于,还包括接收上传到所述在线文档储存库的至少第二文档的指令,并且还包括重复为了释放所上传的第二文档的所述标识、提取和索引。
12.如权利要求7所述的装置,其特征在于,还包括提取对所上传的文档指定的编辑许可的指令,所述编辑许可指示是否许可除所述文档的所述拥有者之外的至少一个用户编辑所上传的文档。
13.如权利要求7所述的装置,其特征在于,还包括定义与所述在线文档储存库的至少一个其他用户相关联的动态搜索语料库的指令,所述搜索库表示在其中许可所述其他用户搜索的文档的范围。
14.如权利要求13所述的装置,其特征在于,还包括为所述其他用户更新所述搜索语料库以包括由所述其他用户拥有的至少一个其他文档的指令。
15.如权利要求13所述的装置,其特征在于,还包括响应于包括所述共享许可中的至少所述其他用户的所上传的文档的拥有者,来更新所述其他用户的所述搜索语料库,以包括至少所上传的文档的指令。
CN200980154857.6A 2009-01-15 2009-12-04 索引和搜索动态地变化的搜索语料库 Active CN102282555B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/353,987 US8589392B2 (en) 2009-01-15 2009-01-15 Indexing and searching dynamically changing search corpora
US12/353,987 2009-01-15
PCT/US2009/066890 WO2010082984A2 (en) 2009-01-15 2009-12-04 Indexing and searching dynamically changing search corpora

Publications (2)

Publication Number Publication Date
CN102282555A true CN102282555A (zh) 2011-12-14
CN102282555B CN102282555B (zh) 2014-12-10

Family

ID=42337765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980154857.6A Active CN102282555B (zh) 2009-01-15 2009-12-04 索引和搜索动态地变化的搜索语料库

Country Status (11)

Country Link
US (2) US8589392B2 (zh)
EP (1) EP2377057A4 (zh)
JP (1) JP2012515394A (zh)
KR (1) KR101597858B1 (zh)
CN (1) CN102282555B (zh)
CA (1) CA2746645C (zh)
MX (1) MX2011007387A (zh)
RU (1) RU2542936C2 (zh)
SG (1) SG171918A1 (zh)
WO (1) WO2010082984A2 (zh)
ZA (1) ZA201103796B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104246764A (zh) * 2012-02-24 2014-12-24 森普利维蒂公司 利用非均匀散列函数在非均匀访问存储器中放置记录的方法和装置
CN105378763A (zh) * 2013-05-09 2016-03-02 微软技术许可有限责任公司 推断实体属性值
CN107710201A (zh) * 2015-06-23 2018-02-16 微软技术许可有限责任公司 存储数据和从位向量搜索索引取回数据
CN109284350A (zh) * 2018-11-16 2019-01-29 天津字节跳动科技有限公司 检索内容的更新方法、装置、存储介质及电子设备
CN111582815A (zh) * 2020-04-15 2020-08-25 岭东核电有限公司 一种核电站的工程管理方法、装置、终端设备及存储介质
US11030201B2 (en) 2015-06-23 2021-06-08 Microsoft Technology Licensing, Llc Preliminary ranker for scoring matching documents
US11281639B2 (en) 2015-06-23 2022-03-22 Microsoft Technology Licensing, Llc Match fix-up to remove matching documents
US11392568B2 (en) 2015-06-23 2022-07-19 Microsoft Technology Licensing, Llc Reducing matching documents for a search query

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10229191B2 (en) * 2009-09-09 2019-03-12 Varonis Systems Ltd. Enterprise level data management
US9904685B2 (en) 2009-09-09 2018-02-27 Varonis Systems, Inc. Enterprise level data management
CN108920502B (zh) * 2010-05-27 2021-11-23 瓦欧尼斯系统有限公司 数据分类
US10296596B2 (en) 2010-05-27 2019-05-21 Varonis Systems, Inc. Data tagging
US20130066908A1 (en) * 2011-07-04 2013-03-14 Research In Motion Limited System and method for sharing mobile device content
US9195773B2 (en) * 2011-07-06 2015-11-24 Microsoft Technology Licensing, Llc Structure-based adaptive document caching
US9009220B2 (en) * 2011-10-14 2015-04-14 Mimecast North America Inc. Analyzing stored electronic communications
CN102821136A (zh) * 2012-07-04 2012-12-12 北京小米科技有限责任公司 一种防止违规文件多次上传的方法及装置
US9703815B2 (en) 2012-12-17 2017-07-11 Salesforce.Com, Inc. Third party files in an on-demand database service
US11163898B2 (en) * 2013-09-11 2021-11-02 Mimecast Services Ltd. Sharing artifacts in permission-protected archives
US9965549B2 (en) * 2013-10-09 2018-05-08 Foxwordy Inc. Excerpted content
US9836530B2 (en) * 2013-12-16 2017-12-05 Entit Software Llc Determining preferred communication explanations using record-relevancy tiers
US9852224B2 (en) * 2014-07-03 2017-12-26 Google Llc Promoting preferred content in a search query
RU2580516C2 (ru) * 2014-08-19 2016-04-10 Общество С Ограниченной Ответственностью "Яндекс" Способ формирования персонализированной модели ранжирования, способ формирования модели ранжирования, электронное устройство и сервер
US10242112B2 (en) 2015-07-15 2019-03-26 Google Llc Search result filters from resource content
US10795642B2 (en) 2016-09-21 2020-10-06 International Business Machines Corporation Preserving temporal relevance in a response to a query
US10877730B2 (en) 2016-09-21 2020-12-29 International Business Machines Corporation Preserving temporal relevance of content within a corpus
US20190102841A1 (en) * 2017-10-04 2019-04-04 Servicenow, Inc. Mapping engine configurations with task managed workflows and grid user interfaces
US11552966B2 (en) * 2020-09-25 2023-01-10 International Business Machines Corporation Generating and mutually maturing a knowledge corpus
US11995135B2 (en) 2021-02-18 2024-05-28 Glean Technologies, Inc. Permissions-aware search with user suggested results
US11593409B2 (en) 2021-02-19 2023-02-28 Glean Technologies, Inc. Permissions-aware search with intelligent activity tracking and scoring across group hierarchies
US11790104B2 (en) 2021-02-18 2023-10-17 Glean Technologies, Inc. Permissions-aware search with document verification
US11797612B2 (en) 2021-09-29 2023-10-24 Glean Technologies, Inc. Identification of permissions-aware enterprise-specific term substitutions

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7133846B1 (en) * 1995-02-13 2006-11-07 Intertrust Technologies Corp. Digital certificate support system, methods and techniques for secure electronic commerce transaction and rights management
US5752242A (en) * 1996-04-18 1998-05-12 Electronic Data Systems Corporation System and method for automated retrieval of information
AUPP252298A0 (en) 1998-03-24 1998-04-23 80-20 Software Pty Limited Document management software
EP1308854A4 (en) * 2000-07-07 2010-01-13 Sharp Kk INFORMATION PROVISION DEVICE
CN1668104A (zh) 2000-10-11 2005-09-14 联合视频制品公司 提供数据存储到点播媒体传递系统中服务器上的系统和方法
JP3632643B2 (ja) 2000-10-25 2005-03-23 松下電器産業株式会社 構造化文書管理装置
JP2002202987A (ja) * 2000-11-02 2002-07-19 At System:Kk データ管理方法
US20020108115A1 (en) * 2000-12-11 2002-08-08 The Associated Press News and other information delivery system and method
US20080091761A1 (en) 2002-08-06 2008-04-17 Stt Webos, Inc. Method and apparatus for information exchange over a web based environment
US20050004873A1 (en) 2003-02-03 2005-01-06 Robin Pou Distribution and rights management of digital content
US7321886B2 (en) * 2003-07-29 2008-01-22 Accenture Global Services Gmbh Rapid knowledge transfer among workers
US20050091316A1 (en) 2003-10-03 2005-04-28 Oscar Ponce System and method for creating and selectively sharing data elements in a peer-to-peer network
WO2005103867A1 (en) 2004-04-22 2005-11-03 Denis Fompeyrine Multi-terminal control interface to manage information within user groups connected to each other in peer-to-peer networks
CN1707496A (zh) * 2004-06-11 2005-12-14 丁力 基于活动的知识管理方法及系统
US9081872B2 (en) 2004-06-25 2015-07-14 Apple Inc. Methods and systems for managing permissions data and/or indexes
US7593924B2 (en) * 2004-09-20 2009-09-22 Microsoft Corporation Method, system, and apparatus for receiving and responding to knowledge interchange queries
US20070011155A1 (en) * 2004-09-29 2007-01-11 Sarkar Pte. Ltd. System for communication and collaboration
US20060117247A1 (en) * 2004-11-30 2006-06-01 Fite William R Web based data collaboration tool
US7594258B2 (en) * 2005-06-27 2009-09-22 Yahoo! Inc. Access control systems and methods using visibility tokens with automatic propagation
US20080005064A1 (en) 2005-06-28 2008-01-03 Yahoo! Inc. Apparatus and method for content annotation and conditional annotation retrieval in a search context
US7568005B2 (en) * 2005-09-01 2009-07-28 Microsoft Corporation Enhanced application behavior in the presence of application sharing
US7779347B2 (en) * 2005-09-02 2010-08-17 Fourteen40, Inc. Systems and methods for collaboratively annotating electronic documents
US8688673B2 (en) * 2005-09-27 2014-04-01 Sarkar Pte Ltd System for communication and collaboration
US20070208743A1 (en) 2006-02-14 2007-09-06 Narayan Sainaney System and Method For Searching Rights Enabled Documents
KR100807264B1 (ko) 2006-04-29 2008-02-28 강찬구 온라인 컨텐츠 마켓플레이스 시스템 및 운영방법
US20080104408A1 (en) 2006-10-25 2008-05-01 Darcy Mayer Notary document processing and storage system and methods
US20080103875A1 (en) * 2006-10-31 2008-05-01 Michael Kokernak Methods and systems for an interactive data finder
US7797295B2 (en) 2007-01-04 2010-09-14 Yahoo! Inc. User content feeds from user storage devices to a public search engine
US20080183680A1 (en) 2007-01-31 2008-07-31 Laurent Meynier Documents searching on peer-to-peer computer systems
US7996392B2 (en) * 2007-06-27 2011-08-09 Oracle International Corporation Changing ranking algorithms based on customer settings
US20090144657A1 (en) * 2007-11-30 2009-06-04 Verizon Laboratories Inc. Method and system of sharing images captured by a mobile communication device

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104246764B (zh) * 2012-02-24 2017-09-15 慧与发展有限责任合伙企业 利用非均匀散列函数在非均匀访问存储器中放置记录的方法和装置
CN104246764A (zh) * 2012-02-24 2014-12-24 森普利维蒂公司 利用非均匀散列函数在非均匀访问存储器中放置记录的方法和装置
US10394854B2 (en) 2013-05-09 2019-08-27 Microsoft Technology Licensing, Llc Inferring entity attribute values
CN105378763A (zh) * 2013-05-09 2016-03-02 微软技术许可有限责任公司 推断实体属性值
CN105378763B (zh) * 2013-05-09 2018-04-13 微软技术许可有限责任公司 推断实体属性值
CN107710201A (zh) * 2015-06-23 2018-02-16 微软技术许可有限责任公司 存储数据和从位向量搜索索引取回数据
CN107710201B (zh) * 2015-06-23 2021-05-25 微软技术许可有限责任公司 存储数据和从位向量搜索索引取回数据
US11030201B2 (en) 2015-06-23 2021-06-08 Microsoft Technology Licensing, Llc Preliminary ranker for scoring matching documents
US11281639B2 (en) 2015-06-23 2022-03-22 Microsoft Technology Licensing, Llc Match fix-up to remove matching documents
US11392568B2 (en) 2015-06-23 2022-07-19 Microsoft Technology Licensing, Llc Reducing matching documents for a search query
CN109284350A (zh) * 2018-11-16 2019-01-29 天津字节跳动科技有限公司 检索内容的更新方法、装置、存储介质及电子设备
CN109284350B (zh) * 2018-11-16 2020-11-13 天津字节跳动科技有限公司 检索内容的更新方法、装置、存储介质及电子设备
CN111582815A (zh) * 2020-04-15 2020-08-25 岭东核电有限公司 一种核电站的工程管理方法、装置、终端设备及存储介质

Also Published As

Publication number Publication date
RU2011129313A (ru) 2013-01-20
US9098556B2 (en) 2015-08-04
US20140059045A1 (en) 2014-02-27
EP2377057A4 (en) 2013-06-12
CN102282555B (zh) 2014-12-10
US20100185650A1 (en) 2010-07-22
WO2010082984A2 (en) 2010-07-22
KR101597858B1 (ko) 2016-02-25
SG171918A1 (en) 2011-07-28
CA2746645C (en) 2016-09-13
WO2010082984A3 (en) 2010-09-10
JP2012515394A (ja) 2012-07-05
US8589392B2 (en) 2013-11-19
MX2011007387A (es) 2011-07-28
EP2377057A2 (en) 2011-10-19
CA2746645A1 (en) 2010-07-22
KR20110120865A (ko) 2011-11-04
ZA201103796B (en) 2012-08-29
RU2542936C2 (ru) 2015-02-27

Similar Documents

Publication Publication Date Title
CN102282555B (zh) 索引和搜索动态地变化的搜索语料库
CN100430951C (zh) 向用户/组授予访问控制列表所有权的访问控制系统和方法
US8620948B2 (en) System and method for crowdsourced template based search
CN101238461B (zh) 能够访问开放网络内容的付费访问法律研究系统
US20080082568A1 (en) System and method for managing and utilizing information
CN101151631A (zh) 用于将判例法、案情摘要和诉讼文书集成到律师事务所工作流中的系统、方法、软件
CN103500198A (zh) 通过合并用户输入信息来进行搜索的方法和系统
CN103150320B (zh) 用于电子发布内容的系统和方法
WO2009031824A2 (en) File management system and computer readable record medium for the same
US20100145927A1 (en) Method and system for enhancing the relevance and usefulness of search results, such as those of web searches, through the application of user's judgment
EP2472461A1 (en) Configurable catalog builder system
Rai et al. Comparative features of integrated library management software systems available in Delhi
JP2013016176A (ja) 複数のコンテンツサイトで記事コンテンツの検索を行う方法及び装置
Sonawane Library discovery system: an integrated approach to resource discovery
EP1415251A2 (en) System for utilizing audible, visual and textual data with alternative combinable multimedia forms of presenting information for real-time interactive use by multiple users in different remote environments
Krabbe et al. Patent searching using free search tools
Morales et al. Research on proposals and trends in the architectures of semantic search engines: A systematic literature review
Ma et al. An attempt of data exchange between the institutional repository and the information environment for the management of scientific research—ARP
JP2004355546A (ja) 特許検索システム
Pohlmann Text data mining on current newspaper articles from the United States with ProQuest TDM Studio
Lamont Knowledge management at your service: New solutions and sources for librarians
Kalimoldayev et al. Digital Twin of the Zoological Collection of the Republic of Kazakhstan
Udroiu et al. Virtual library–e-content management solution for public institutions
Prieto Chavana Automated fact-checking for supporting sub-editing
Bakalov et al. Personalized semantic assistance for the curation of biochemical literature

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150505

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150505

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.