CN102508845B - 对概念分层结构进行导航和搜索的界面 - Google Patents

对概念分层结构进行导航和搜索的界面 Download PDF

Info

Publication number
CN102508845B
CN102508845B CN201110288904.5A CN201110288904A CN102508845B CN 102508845 B CN102508845 B CN 102508845B CN 201110288904 A CN201110288904 A CN 201110288904A CN 102508845 B CN102508845 B CN 102508845B
Authority
CN
China
Prior art keywords
concept
interface
documents
corpus
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110288904.5A
Other languages
English (en)
Other versions
CN102508845A (zh
Inventor
K·穆克吉
N·加吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN102508845A publication Critical patent/CN102508845A/zh
Application granted granted Critical
Publication of CN102508845B publication Critical patent/CN102508845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Library & Information Science (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及对概念分层结构进行导航和搜索的界面。方法包括在计算设备接收概念分层结构。概念分层结构标识与文档语料库相关联的概念。生成基于概念分层结构的界面。界面可操作用于对概念分层结构进行导航、搜索和修改。方法包括将界面发送到显示设备用于显示。

Description

对概念分层结构进行导航和搜索的界面
技术领域
本发明涉及界面,尤其是对概念分层结构进行导航和搜索的界面。
背景技术
以文档为中心的信息模型常用于商业企业。在以文档为中心的信息模型中,消息被存储于文档中。数百万的文档可被存储于商业企业的员工可访问的文档储存库中,每个文档的长度通常有数页。在以文档为中心的信息模型中使用的搜索体验涉及用户,该用户提供搜索查询、浏览由搜索引擎返回的文档并且细化该搜索查询,希望从搜索引擎接收更相关的搜索结果。由于可用文档的长度和数量,在文档储存库内搜索相关信息并导航至特定的兴趣点可能是困难且费时的。
发明内容
公开了用于导航和搜索概念分层结构的包括界面的系统、方法和计算机可读介质。尽管以文档为中心的信息模型受到欢迎,但用户可能直观地按照概念及概念之间的关系来处理信息。这样,允许对文档语料库进行概念导航和搜索的界面相比以文档为中心的用户界面而言可以提供更直观、愉快和高效的体验。给定包括从文档语料库中挖掘的概念的概念分层结构,可以生成用于该概念分层结构的用户界面。该界面可允许对概念分层结构进行导航、搜索和修改,包括在搜索概念分层结构之前对该概念分层结构进行导航和修改的能力。当进行搜索时,界面可提供文档搜索结果以及概念搜索结果(例如,与搜索查询语义上相关的概念列表)。在任何时候,可为用户选择在界面显示的概念,以查看文档语料库中与所选概念语义上相关的底层的文档或文档的部分。在特定的场景中,概念分层结构可以是自组织的概念分层结构。例如,每次将新文档添加到文档语料库中时,概念分层结构可确定是否重新组织其自身。
提供本发明内容以便以简化形式介绍在以下详细描述中进一步描述的一些概念。本发明内容并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。
附图说明
图1是示出生成界面以对从文档语料库导出的概念分层结构进行导航和搜索的系统的特定的实施例的图示;
图2是示出图1的文档语料库的特定的实施例的图示;
图3是示出图1的界面的特定的实施例的图示;
图4是示出图1的界面的另一个特定的实施例的图示;
图5是示出生成界面以对概念分层结构进行导航和搜索的方法的特定的实施例的流程图;
图6是示出生成界面以对概念分层结构进行导航和搜索的方法的另一个特定的实施例的流程图;
图7是包括界面以对概念分层结构进行导航和搜索的文件管理器应用程序的特定的实施例的屏幕截图;
图8是图7的文件管理器应用程序的另一个特定的实施例的屏幕截图;以及
图9是包括可用于支持如图1-8中所示的计算机实现的方法、计算机程序产品以及系统组件的各实施例的计算设备的计算环境的框图。
具体实施方式
计算设备可接收由挖掘文档语料库的文档的概念生成的概念分层结构。计算设备可生成表示概念分层结构的界面,并可将该界面发送到显示设备用于显示。该界面可允许用户对概念分层结构进行导航、搜索和修改。该界面还可允许对概念进行选择,以查看文档语料库中与所选概念相关的底层的文档。概念分层结构可以是自组织的概念分层结构,响应于向文档语料库中添加新文档或对文档语料库中现有文档的修改,自动地更新其自身。
在特定的实施例中,系统包括处理器、可由处理器执行的概念分层结构模块,和可由处理器执行的界面模块。概念分层结构模块可被执行以确定与文档语料库相对应的概念分层结构,并且响应于检测到向文档语料库添加新文档或者对文档语料库中的现有文档进行修改来更新概念分层结构。界面模块可被执行以基于概念分层结构来生成界面,并且将该界面发送到显示设备用于显示。界面模块还被可执行以在界面处接收用户输入。界面模块还可被执行以更新界面,从而反映基于用户输入对概念分层结构执行导航、搜索或修改操作的结果。
在另一个特定的实施例中,方法包括在计算设备接收概念分层结构,其中概念分层结构标识与文档语料库相关联的概念。方法还包括基于概念分层结构生成界面,其中界面可操作用于对概念分层结构进行导航和搜索。方法还包括经由界面接收搜索查询。方法包括通过基于搜索查询对文档语料库进行搜索来标识文档搜索结果,并且通过在概念分层结构中搜索与搜索查询语义上相关的一个或多个概念来标识概念搜索结果。方法还包括在界面上显示文档搜索结果和概念搜索结果。文档搜索结果经由界面可供选择,以查看与文档搜索结果相关联的文档语料库中的一个或多个文档。经由界面可选择概念搜索结果以查看与由概念搜索结果所标识的所选概念相关联的文档语料库中的一个或多个文档。
在另一特定的实施例中,计算机可读存储介质包括指令,该指令由计算机执行时使计算机接收计算设备处的概念分层结构。概念分层结构标识与文档语料库相关联的概念。指令还使计算机基于该概念分层结构生成界面。该界面可操作用于对概念分层结构进行导航、搜索和修改。指令还使计算机将界面发送到显示设备用于显示。指令可被实现为存储在计算机可读存储介质中的计算机软件应用程序。
图1是示出生成界面152以对概念分层结构130进行导航和搜索的系统100的特定的实施例的图示。系统100包括概念分层结构模块110、文档语料库120,和界面模块140。
概念分层结构模块110可包括概念挖掘逻辑112和自组织逻辑114。概念挖掘逻辑112可被配置为确定与文档语料库120相对应的概念分层结构(例如,概念分层结构130)。例如,概念挖掘逻辑112可处理文档语料库120的文档(例如,说明性文档122)以生成概念分层结构130。应当注意,尽管文档语料库120的文档122在图1中被示为系统100的部分,但文档语料库120的一个或多个文档还可位于经由网络可访问的其他计算设备或系统上。这样,文档语料库120可包括本地文档、远程文档、或其任意组合。概念分层结构130中的每个概念可包括一个或多个术语,该一个或多个术语被包括在文档语料库120中的文档122的至少一个中。概念分层结构130可被存储在系统100的随机访问存储器(RAM)或基于磁盘的存储器中。
在特定的实施例中,概念分层结构130可以是自组织的概念分层结构。例如,自组织逻辑114可用于实现关于概念分层结构130的自组织特征。在特定的实施例中,自组织逻辑114能够检测出已向文档语料库120添加了文档,确定文档语料库120的现有文档是否已被修改,以及确定响应于该添加或修改对概念分层结构130是否进行更新。自组织逻辑114还可按需自动地更新概念分层结构130。
例如,当向文档语料库120添加新文档时,自动地更新概念分层结构130可包括向概念分层结构130添加概念、从概念分层结构130移除概念、重新组织概念分层结构130、或其任意组合。向概念分层结构130添加的概念可包括来自新文档的新概念,或者根据新文档已在文档语料库中变得流行足以保证其被包括在概念分层结构130中的概念。从概念分层结构130移除的概念可包括根据新文档已在文档语料库中变得稀少足以保证其从概念分层结构130中移除的概念。在特定的实施例中,概念分层结构130被表示为包括由多个链接所连接的多个节点的图,其中每个节点对应于概念,并且一对节点之间的每个链接表示与该对节点相对应的概念之间的加权语义关系。
重新组织概念分层结构130可包括建立新链接、移除现有链接、更新现有链接的权重、或其任意组合。参考图3-4进一步描述和示出概念分层结构。应当理解,尽管与由链接连接的节点相对应的概念可在语义上相关,但概念在词汇上可能不相关(例如,可能不是相同或同义的术语)。这样,概念分层结构130可允许对在以文档为中心的信息模型中经由词法搜索可能无法发现的语义关系的发现。
界面模块140可接收概念分层结构130,并且可基于概念分层结构130生成界面152。界面模块140还可将界面152发送到显示设备150用于显示。在特定的实施例中,界面152被集成到文件管理器应用程序(例如,对单个计算设备上的数据在概念上进行导航和搜索)、协作门户(例如,对多个计算设备之间共享的数据在概念上进行导航和搜索)、或在系统100执行的数据库应用程序(对数据库在概念上进行导航和搜索)。界面模块140可包括导航逻辑142、搜索逻辑144和修改逻辑146。在特定的实施例中,界面模块140被配置为在界面152接收输入(例如,来自说明性用户160的用户输入)。
导航逻辑142可在概念分层结构130上执行导航操作,并且可以更新界面152以反映导航操作的结果。取决于从用户160接收的用户输入,导航操作可包括放大概念分层结构130的部分、从概念分层结构130的部分缩小、在概念分层结构130上平移(例如,左、右、上或下)、或其任意组合。导航操作还可包括遍历概念分层结构130中的两个节点之间的链接、“展开”概念分层结构130的特定节点以显示链接到该特定节点的之前隐藏的节点、“折叠”概念分层结构的特定节点以隐藏链接到该特定节点的之前显示的节点、或其任意组合。
搜索逻辑144可在概念分层结构130上执行搜索操作,并且可以更新界面152以反映搜索操作的结果。例如,用户160可输入搜索查询,并且搜索逻辑144可执行对概念分层结构130的搜索以标识概念分层结构130中与该搜索查询在语义上相关的一个或多个概念。搜索逻辑144可更新界面152以显示所标识的概念。在特定的实施例中,搜索逻辑144还基于搜索查询对文档语料库120的文档122进行搜索。例如,搜索逻辑144可标识与搜索查询在词汇上相关的特定文档或文档的部分。搜索逻辑144可更新界面152以显示除了与搜索查询在语义上相关的概念搜索结果以外的与搜索查询在词汇上相关的文档搜索结果。
修改逻辑146可基于在界面152接收的输入来修改概念分层结构130。例如,修改概念分层结构130可包括重新组织概念分层结构130、重新命名概念分层结构130的特定概念、或其任意组合。
在操作中,概念分层结构模块110可挖掘文档语料库120以生成概念分层结构130。概念分层结构130可包括,在文档语料库120的文档122中被确定为相对流行的概念。概念分层结构130中的每个概念可包括一个或多个术语,该术语一个或多个被包括在文档语料库120中的文档122的至少一个中。在特定的实施例中,确定概念的相对流行度包括对文档语料库120应用基于熵的概念挖掘算法。当向文档语料库120添加新文档时,概念分层结构模块110可自动地更新概念分层结构130。界面模块140可基于概念分层结构130生成界面152,并且可将界面152发送到显示设备150用于显示。界面模块140可在界面152(例如,从用户160)接收输入,并且可基于所接收的输入在概念分层结构130上执行一个或多个操作。例如,界面模块140可基于所接收的输入对概念分层结构130进行导航、搜索或修改。界面模块140还可更新界面152以反映执行导航、搜索或修改的结果。
在特定的操作示例中,用户160可在经由界面152搜索概念分层结构130之前经由界面152对概念分层结构130进行导航和修改。例如,用户160最初可查看与概念“A”相关的概念列表,以及与概念“A”相关联的文档语料库120的文档。用户160随后可从概念“A”导航至概念“B”(例如,通过使用诸如鼠标的系统100的输入设备来选择界面152上的概念“B”)。用户160接下来可查看与概念“B”相关的概念列表,以及与概念“B”相关联的文档语料库120的文档。用户160还可经由界面152修改概念分层结构130(例如,通过将“B”重新命名为“E”)。可更新界面152以反映该修改(例如,通过显示“E”而非“B”)。修改后的概念分层结构可由用户160经由界面152进一步导航、进一步修改或搜索。
应当理解,图1的系统100可允许对文档语料库中的消息进行以概念为中心(而非以文档为中心)的导航和搜索。应当理解,图1的系统100既可提供以文档为中心的搜索结果,也可提供以概念为中心的搜索结果,从而提高了返回搜索查询的相关搜索结果的可能性。图1的系统100因此可允许对文档语料库的直观且高效的导航和搜索。
图2是示出文档语料库200的特定的实施例的图示。在所示实施例中,文档语料库200是图1的文档语料库120。
文档语料库可包括计算机文件202。例如,计算机文件202可包括文档、电子表格、演示、和包括可由概念挖掘逻辑(例如,图1的概念挖掘逻辑112)处理的文本的其他文件。文档语料库200还可包括网页204。例如,网页204可以与由拥有文档语料库200的企业所管理的一个或多个网站相关联。
文档语料库还包括电子邮件206和其他通信。例如,电子邮件可包括由商业企业的员工收发的电子邮件消息的存档。在特定的实施例中,文档语料库包括数据库元素208,诸如数据库表和脚本。
应当注意,可自动地或手动地将文档添加至文档语料库以及从文档语料库中移除。例如,商业企业的监视器可自动地将新创建的文档添加至文档语料库200,并且可自动地将已删除的文档从文档语料库200中移除。或者,商业企业的用户可手动地添加文档并从文档语料库200移除文档以控制对概念挖掘逻辑(例如,图1的概念挖掘逻辑110)可用的文档的数量和内容。对文档语料库200的文档的修改可类似地被监视。
图3示出表示概念分层结构的界面300的特定的实施例。在所示实施例中,界面300是图1的界面152。
在图3所示的特定的实施例中,概念分层结构被表示为包括由多个链接(例如,说明性链接312、313、314和315)所连接的多个节点(例如,说明性节点310、320、330、340和350)的图。每个节点可表示特定的概念,并且两个节点之间的每个链接可表示与这两个节点相对应的两个概念之间的语义关系。在特定的实施例中,界面300可“聚焦”在一个或多个节点上。例如,在图3所示的特定实施例中,节点310(及对应的概念“SQL服务器”)可以是界面300的“焦点”,因为可显示节点310而非节点320、330、340和350的引出链接。在特定的实施例中,界面300标识被挖掘以生成界面300的文档语料库的底层文档390。
在特定的实施例中,概念分层结构的链接还指示两个概念之间的语义关系的相对权重。例如,概念“SQL服务器”(节点310)和“查询”(节点320)可具有由链接312所指示的语义关系权重0.20。概念“SQL服务器”(节点310)和“部署”(节点330)可具有由链接313所指示的语义关系权重0.19。概念“SQL服务器”(节点310)和“XML”(节点340)可具有由链接314所指示的语义关系权重0.23。概念“SQL服务器”(节点310)和“SQL”(节点350)可具有由链接315所指示的语义关系权重0.65。在特定的实施例中,权重越大,概念越在语义上相关。应当理解,通过显示指示概念之间相关程度的权重,界面300可提供对可导航和可搜索的文档语料库的信息表示。例如,相比组织上是“平面的”并且显示搜索结果而不显示度量或距离概念的搜索引擎,界面300可提供更富信息性的搜索体验。
在特定的实施例中,界面300可显示权重,该权重适于基于用户反馈、对文档语料库中文档后续处理、或其任意组合。例如,用户可提供指示界面300的特定链接超出权重或权重不足的反馈。底层系统(例如,图1的系统100)可响应于这样的反馈,实时或接近实时地改写特定链接的权重,并且界面300可显示改写后的权重。作为另一个示例,系统可随着文档被添加至文档语料库、从文档语料库中移除文档,以及更新文档语料库中的文档,而动态地更新权重。应当理解,界面300这样通过提供协作过滤能力和自适应度量空间可增强信息搜索和浏览体验,从而将搜索和浏览体验从“被动的”调查活动转变为“主动的”决策制定工具。
界面300还可指示所显示的概念的相对流行度。在特定的实施例中,每个节点的尺寸可指示与该节点相对应的概念的相对流行度,其中更为流行的概念被显示为比表示不太流行的概念的节点更大的节点。例如,(在节点310显示的)概念“SQL服务器”可能比(在节点330、340和350显示的)概念“查询”、“部署”和“SQL”更为流行。(在节点340显示的)概念“XML”可能不如(在节点330、340和350显示的)概念“查询”、“部署”和“SQL”流行。作为替换或除此之外,每个节点的尺寸可指示在对应于节点的概念下的多个分层结构级别。例如,(在节点310显示的)概念“SQL服务器”下可能具有比(在节点340显示的)概念“XML”更多的分层结构级别。
图4是示出基于导航操作更新图3的界面300的特定的实施例的图示。例如,用户可(例如,通过选择节点320的概念“查询”)从节点310导航至节点320,从而使节点320成为界面300的新焦点。
如图4所示,节点320可具有指示概念“查询”与(由节点350、460、470和480表示的)概念“SQL”、“索引”、“属性”和“过滤器”之间的语义关系权重的引出链接425、426、427和428。应当理解,基于导航操作更新界面300还可显示比在导航操作之前更多或更少的节点和链接。此外,界面上的节点可包括比在导航操作之前更多或更少的链接。例如,由于概念“SQL”在语义上与概念“SQL服务器”以及概念“查询”二者相关,因此界面300保持节点350和节点310之间的原始链接315,并且还显示节点320和节点350之间的链接425。
图5是示出生成界面以对概念分层结构进行导航和搜索的方法500的特定的实施例的流程图。在所示实施例中,可由图1的系统100中执行方法500。
方法500包括502,在计算设备接收概念分层结构。概念分层结构标识与文档语料库相关联的概念。例如,在图1中,界面模块140可接收概念分层结构130,其中概念分层结构130标识与文档语料库120的文档122相关联的概念。
方法500还包括在504基于概念分层结构生成界面。界面可操作用于对概念分层结构进行导航、搜索和修改。例如,在图1中,界面模块140可生成界面152。方法500还包括在506将界面发送到显示设备用于显示。例如,在图1中,将界面152发送到显示设备150用于显示。
方法500可包括在508接收对概念分层结构的特定概念的选择,在510显示与特定概念相关联的文档语料库中一个或多个文档的部分,并且在512标识与特定概念在语义上相关的一个或多个其他概念。例如,在图1中,用户160可经由界面152选择概念分层结构130的概念,并且界面模块140可显示相关联的文档以及与所选概念在语义上相关的概念。在所示实施例中,如参考图7-8所描述和示出的,由界面显示文档和语义上相关的概念。
或者,方法500可包括在514接收界面的输入,并且在516基于输入修改概念分层结构。修改概念分层结构可包括重新组织概念分层结构、重新命名概念分层结构的一个或多个概念、或其任意组合。例如,在图1中,用户160可提供使界面模块140对概念分层结构130的部分进行重新组织和/或重新命名的输入。
图6是示出生成界面以对概念分层结构进行导航和搜索的方法600的另一个特定的实施例的流程图。在所示实施例中,可由图1的系统100中执行方法600。
方法600包括602,在计算设备接收概念分层结构。概念分层结构标识与文档语料库相关联的概念。例如,在图1中,界面模块140可接收概念分层结构130,其中概念分层结构130标识与文档语料库120的文档122相关联的概念。
方法600还包括在604基于概念分层结构生成界面。界面可操作用于在接收搜索查询之前对概念分层结构进行导航。例如,在图1中,界面模块140可生成界面152。界面152可用于在搜索概念分层结构130之前对概念分层结构130进行导航和修改。方法600还包括在606将界面发送到显示设备用于显示。例如,在图1中,将界面152发送到显示设备150用于显示。
方法600包括在608接收搜索查询。例如,在图1中,用户160可在界面152输入搜索查询。方法还包括在610通过基于搜索查询搜索文档语料库来标识界面上的文档搜索结果。文档搜索结果可供选择以查看与文档搜索结果相关联的文档语料库中的一个或多个文档。例如,在图1中,搜索逻辑114可基于搜索查询来搜索文档122,并且可以更新界面152以标识文档搜索结果。
方法600还包括在612通过搜索概念分层结构以查找与搜索查询在语义上相关的一个或多个概念,来标识界面上的概念搜索结果。概念搜索结果可供选择以对概念分层结构进行导航,并且查看与概念搜索结果相关联的文档语料库中的一个或多个文档。例如,在图1中,搜索逻辑114可搜索概念分层结构130以查找与搜索查询在语义上相关的概念,并且可以更新界面152以标识概念搜索结果。
图7是包括对概念分层结构进行导航和搜索的界面700的文件管理器应用程序的特定的实施例的屏幕截图。在所示实施例中,文件管理器应用程序界面700是图1的界面152。
在图7所示的特定实施例中,文件管理器应用程序界面700包括三个区域:概念浏览器710、文件夹查看器720和文件查看器730。概念浏览器710可显示基于文件夹查看器720中的文件夹的内容而生成的概念分层结构中的一个或多个概念。例如,如图7所示,概念浏览器710可包括概念“source code”711,指示文件夹查看器720的文件夹中源代码文件和/或短语“source code”的存在。
文件夹查看器720可操作用于接收对文件夹的选择,并且使文件查看器730显示包含在所选文件夹中的文件。例如,如图7所示,文件夹查看器720可接收对文件夹“My Files(我的文件)”722的选择,并且使文件查看器730显示包含在文件夹“My Files”722中的文件,包括文件“computer1.txt”、“computer2.txt”、“computer3.txt”、“music1.txt”、“music2.txt”、“music3.txt”、“sport1.txt”和“sport2.txt”。
图8是图7的文件管理器应用程序界面700的另一个特定的实施例的屏幕截图。例如,文件管理器应用程序界面700可响应于对概念浏览器710底层的概念分层结构的导航来更新概念浏览器710、文件夹查看器720和文件查看器730中的一个或多个。
在图8所示的特定的实施例中,文件管理器应用程序界面700的用户已经展开了(例如,响应于用户选择)概念“source code”711。展开概念“sourcecode”711可包括显示与概念“source code”711在语义上相关的概念分层结构的概念。例如,最近显示的概念可包括概念“source(源)”812、“sofware(软件)”813、“code(代码)”814和“process(进程)”815。
在图8所示的特定的实施例中,文件管理器应用程序界面700的用户还已经选择了概念“sofware”813。响应于对概念“sofware”813的选择,文件管理器应用程序界面700可标识与概念“sofware”813相关联的文件。例如,文件管理器应用程序700可标识出在文件夹“My Files”722中,文件“computer2.txt”832和“computer3.txt”834可能与概念“sofware”813相关联。可在文件查看器730选择所标识的文件“computer2.txt”832和“computer3.txt”834以查看与概念“sofware”813在语义上相关的文件“computer2.txt”832和“computer3.txt”834的部分。应当注意,位于除文件夹“My Files”722以外的文件夹中的其他文件也可能与概念“sofware”813相关联,但由于文件夹查看器720中仅文件夹“My Files”722被选中而未示出。
图9示出了包括可用于支持根据本公开的计算机实现的方法、计算机程序产品以及系统组件的各实施例的计算设备910的计算环境900的框图。例如,计算设备910或其组件可包括、实现以下各项或由以下各项所包含:图1的概念分层结构模块110、图1的文档语料库120、图1的界面模块140、图2的文档语料库200、或其部分。
计算设备910包括至少一个处理器920和系统存储器930。取决于计算设备的配置和类型,系统存储器930可以是易失性的(诸如随机存取存储器,即“RAM”)、非易失性的(诸如只读存储器,即“ROM”、闪存以及即使在未提供电源时也保持已存储数据的类似存储器设备)或两者的某种组合,或某些其它存储器。系统存储器930通常包括操作系统932、一个或多个应用程序平台934、一个或多个应用程序,和程序数据938。例如,系统存储器930可包括概念分层结构模块936和界面模块937。在所示实施例中,概念分层结构模块936是图1的概念分层结构模块110,而界面模块937是图1的界面模块140。
计算设备910还可具有附加特征或功能。例如,计算设备910还可包括可移动和/或不可移动附加数据存储设备,诸如磁盘、光盘、磁带和标准大小的存储卡或闪存卡。在图9中通过可移动存储940和不可移动存储950示出这样的附加存储。计算机存储介质可包括以用于存储诸如计算机可读指令、数据结构、程序组件或其它数据等信息的任何技术实现的易失性和/或非易失性存储以及可移动和/或不可移动介质。系统存储器930,可移动存储940和不可移动存储950都是计算机存储介质的示例。计算机存储介质包括,但不限于,RAM、ROM、电可擦除可编程只读存储器(EEPROM)、闪存或其它存储器技术、紧致盘(CD)、数字多功能盘(DVD)或其它光存储、磁带盒、磁带、磁盘存储或其它磁性存储设备、或可用于存储信息且可以由计算设备910访问的任何其它介质。任何这种计算机存储介质都可以是计算设备910的一部分。
计算设备910还可具有诸如键盘、鼠标、笔、语音输入设备、触摸输入设备等通过一个或多个输入界面连接的输入设备960。诸如显示器、扬声器、打印机等输出设备970也可被包括并通过一个或多个输出界面连接。例如,输出设备970可包括图1的显示设备150。计算设备910还包含允许该计算设备910通过有线或无线网络与其它计算设备990进行通信的一个或多个通信连接980。例如,计算设备910可与文档语料库992通信。在所示实施例中,文档语料库992是图1的文档语料库120或图2的文档语料库200。计算设备910还可与一个或多个关系数据库或关系数据库的部分进行通信,包括文档语料库992中包含的数据库元素。
可以理解,并非所有图9所示或以其他方式在先前的附图中描述的组件或设备都必须支持此处所描述的实施例。例如,可移动存储940可以是可任选的。
对此处描述的实施例的说明旨在提供对各种实施例的结构的大致理解。这些说明并非旨在用作对使用此处描述的结构或方法的装置和系统的所有元件和特征的完整描述。许多其他实施例对本领域的技术人员在审阅本公开之后是显而易见的。可从本公开中使用和导出其他实施例,以使可作出结构和逻辑替换和改变而不背离本公开的范围。因此,本公开和各附图被认为是说明性的而非限制性的。
本领域技术人员还可理解,结合本文所公开的各种说明性逻辑框、配置、模块、和过程步骤或指令可被实现为电子硬件或计算机软件。各种说明性组件、框、配置、模块或步骤已经大致按照其功能来描述。这种功能被实现为硬件或软件取决于在总体系统上所施加的具体应用和设计限制。技术人员可针对每种具体应用以不同方式来实现所描述的功能集,但这种设计决策不应被解释为致使脱离本公开的范围。
结合此处公开的各实施例所描述的方法的各个步骤可直接用硬件、由处理器执行的软件模块、或两者的组合来实现。软件模块可驻留在诸如随机存取存储器(RAM)、闪存、只读存储器(ROM)、寄存器、硬盘、可移动盘、CD-ROM、或本领域内已知的任何其他形式的存储介质等计算机可读介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取/写入信息。在替换方案中,存储介质可集成到处理器或处理器并且存储介质可作为分立组件驻留在计算设备或计算机系统中。
尽管已在此示出和描述了具体实施例,但应当理解,可为所示的具体实施例替换被设计成实现相同或相似目的的任何后续安排。本公开旨在覆盖各种实施例的任何和所有后续改变和变体。
应当理解,摘要将不用于解释或限制权利要求书的范围或含义。另外,在前面的详细描述中,可出于将本公开连成一个整体的目的而将各种特征组合在一起或描述在单个实施例中。本公开将不被解释为反映所要求保护的实施例要求比每个权利要求中明确陈述的更多特征的意图。相反,如以下权利要求反映的,发明性主题可涉及少于所公开的实施例的的任何一个的所有特征。
提供前面对各实施方式的描述是为了使本领域技术人员能制作或使用各实施方式。对这些实施例的各种修改对于本领域的技术人员将是显而易见的,并且此处定义的普适原理可被应用于其他实施例而不会脱离本公开的范围。因而,本公开不是旨在限于此处示出的各种实施例,而是按照与如由所附权利要求书定义的原理和新颖特征相一致的尽可能最宽范围。

Claims (9)

1.一种生成界面以对概念分层结构进行导航和搜索的系统,包括:
用于确定与文档语料库相对应的概念分层结构并响应于检测到新文档被添加至所述文档语料库而自动地更新所述概念分层结构的装置,其中通过监视器将新创建的文档自动添加到所述文档语料库并且将已删除的文档自动地从所述文档语料库移除;以及
用于基于所述概念分层结构生成界面的装置,其中所述界面将所述概念分层结构表示为包括由多个链接所连接的多个节点的图,其中所述多个节点中的特定节点对应于特定概念,并且其中一对节点之间的特定链接表示与该对节点相对应的概念之间的语义关系,其中与由所述多个链接中的至少一个链接所连接的节点相对应的概念在语义上相关但在词汇上不相关,并且其中所述界面基于其上接收到的用户输入而更新以:
反映在所述概念分层结构(130)上执行导航操作的结果;
反映在所述概念分层结构(130)上执行搜索操作的结果;以及
反映在所述概念分层结构(130)上执行修改操作的结果。
2.如权利要求1所述的系统,其特征在于,所述文档语料库包括计算机文件、网页、电子邮件、数据库元素、或其任意组合。
3.如权利要求1所述的系统,其特征在于,所述界面指示表示所述概念分层结构的概念之间相关程度的至少一个权重,并且其中所述界面模块还能够基于所述用户输入、所述文档语料库的变化,或其任意组合来更新所述至少一个权重。
4.如权利要求1所述的系统,其特征在于,所述界面被集成到文件管理器应用程序,所述文件管理器应用程序能够操作用于:
接收对特定概念的选择;
接收对特定目录的选择;以及
标识与所述特定概念在语义上相关的所述特定目录中的一个或多个文档。
5.如权利要求1所述的系统,其特征在于,所述界面被集成到协作门户或数据库应用程序中。
6.一种用于生成界面以对概念分层结构进行导航和搜索的方法,包括:
在计算设备(910)接收概念分层结构(130)(602),其中所述概念分层结构(130)标识与文档语料库(200)相关联的概念,其中通过监视器将新创建的文档自动添加到所述文档语料库并且将已删除的文档自动地从所述文档语料库移除;
基于所述概念分层结构生成界面(604),其中所述界面将所述概念分层结构表示为包括由多个链接所连接的多个节点的图,其中所述多个节点中的特定节点对应于特定概念,并且其中一对节点之间的特定链接表示与该对节点相对应的概念之间的语义关系,其中与由所述链接中的至少一个链接所连接的节点相对应的概念在语义上相关但在词汇上不相关,并且其中所述界面能够操作用于对所述概念分层结构(130)进行导航和搜索;
经由所述界面接收搜索查询(608);
通过基于所述搜索查询对所述文档语料库(200)进行搜索来标识文档搜索结果(610);
通过在所述概念分层结构中搜索与所述搜索查询在语义上相关的一个或多个概念来标识概念搜索结果(612);以及
在所述界面上显示所述文档搜索结果和所述概念搜索结果,
其中所述文档搜索结果能够经由所述界面选择,以查看与所述文档搜索结果相关联的所述文档语料库(200)的一个或多个文档,以及
其中所述概念搜索结果能够经由所述界面选择,以对所述概念分层结构(130)进行导航,并且查看与所述概念搜索结果相关联的所述文档语料库(200)的一个或多个文档。
7.如权利要求6所述的方法,其特征在于,所述界面能够操作用于在接收所述搜索查询之前对所述概念分层结构进行导航。
8.如权利要求6所述的方法,其特征在于,还包括,响应于检测到添加新文档到所述文档语料库,自动地确定是否重新组织所述概念分层结构。
9.如权利要求6所述的方法,其特征在于,该对节点之间的所述特定链接与权重相关联,所述权重指示与该对节点相对应的所述概念之间的相关程度。
CN201110288904.5A 2010-09-14 2011-09-13 对概念分层结构进行导航和搜索的界面 Active CN102508845B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/881,192 US8775426B2 (en) 2010-09-14 2010-09-14 Interface to navigate and search a concept hierarchy
US12/881,192 2010-09-14

Publications (2)

Publication Number Publication Date
CN102508845A CN102508845A (zh) 2012-06-20
CN102508845B true CN102508845B (zh) 2015-07-22

Family

ID=45807684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110288904.5A Active CN102508845B (zh) 2010-09-14 2011-09-13 对概念分层结构进行导航和搜索的界面

Country Status (2)

Country Link
US (2) US8775426B2 (zh)
CN (1) CN102508845B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9092523B2 (en) 2005-02-28 2015-07-28 Search Engine Technologies, Llc Methods of and systems for searching by incorporating user-entered information
US10956475B2 (en) 2010-04-06 2021-03-23 Imagescan, Inc. Visual presentation of search results
US9058093B2 (en) * 2011-02-01 2015-06-16 9224-5489 Quebec Inc. Active element
US11763212B2 (en) 2011-03-14 2023-09-19 Amgine Technologies (Us), Inc. Artificially intelligent computing engine for travel itinerary resolutions
US9659099B2 (en) * 2011-03-14 2017-05-23 Amgine Technologies (Us), Inc. Translation of user requests into itinerary solutions
US11010432B2 (en) 2011-10-24 2021-05-18 Imagescan, Inc. Apparatus and method for displaying multiple display panels with a progressive relationship using cognitive pattern recognition
US9348846B2 (en) 2012-07-02 2016-05-24 Google Inc. User-navigable resource representations
US9424304B2 (en) 2012-12-20 2016-08-23 LogicBlox, Inc. Maintenance of active database queries
US9665570B2 (en) * 2013-10-11 2017-05-30 International Business Machines Corporation Computer-based analysis of virtual discussions for products and services
US11068550B2 (en) * 2014-02-28 2021-07-20 Microsoft Technology Licensing, Llc Search and navigation via navigational queries across information sources
US9424298B2 (en) * 2014-10-07 2016-08-23 International Business Machines Corporation Preserving conceptual distance within unstructured documents
WO2016132558A1 (ja) * 2015-02-20 2016-08-25 株式会社Ubic 情報処理装置及び方法並びにプログラム
US9727560B2 (en) 2015-02-25 2017-08-08 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
US11941552B2 (en) 2015-06-25 2024-03-26 Amgine Technologies (Us), Inc. Travel booking platform with multiattribute portfolio evaluation
EP3156918A1 (en) * 2015-10-11 2017-04-19 Imagescan, Inc. Visual presentation of search results
US9959504B2 (en) 2015-12-02 2018-05-01 International Business Machines Corporation Significance of relationships discovered in a corpus
US10698938B2 (en) 2016-03-18 2020-06-30 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
US10592502B2 (en) 2016-10-25 2020-03-17 International Business Machines Corporation Natural language processing review and override based on confidence analysis
US11726972B2 (en) 2018-03-29 2023-08-15 Micro Focus Llc Directed data indexing based on conceptual relevance
US11030248B2 (en) * 2018-04-18 2021-06-08 Palantir Technologies Inc. Resource dependency system and graphical user interface
CN109753638A (zh) * 2018-12-19 2019-05-14 深圳晶泰科技有限公司 多层级文档管理系统及其管理方法
US11645295B2 (en) 2019-03-26 2023-05-09 Imagescan, Inc. Pattern search box
US11775898B1 (en) 2019-10-04 2023-10-03 Palantir Technologies Inc. Resource grouping for resource dependency system and graphical user interface

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1669029A (zh) * 2002-05-17 2005-09-14 威乐提公司 自文件集合中自动搜寻概念层次结构的方法及系统
CN1716244A (zh) * 2003-12-29 2006-01-04 西安迪戈科技有限责任公司 智能搜索、智能文件系统和自动智能助手的方法
US7890533B2 (en) * 2006-05-17 2011-02-15 Noblis, Inc. Method and system for information extraction and modeling

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8051104B2 (en) * 1999-09-22 2011-11-01 Google Inc. Editing a network of interconnected concepts
US20050108200A1 (en) * 2001-07-04 2005-05-19 Frank Meik Category based, extensible and interactive system for document retrieval
US20030115191A1 (en) * 2001-12-17 2003-06-19 Max Copperman Efficient and cost-effective content provider for customer relationship management (CRM) or other applications
US6946715B2 (en) * 2003-02-19 2005-09-20 Micron Technology, Inc. CMOS image sensor and method of fabrication
US7320000B2 (en) * 2002-12-04 2008-01-15 International Business Machines Corporation Method and apparatus for populating a predefined concept hierarchy or other hierarchical set of classified data items by minimizing system entrophy
US7949964B2 (en) * 2003-05-29 2011-05-24 Computer Associates Think, Inc. System and method for visualization of node-link structures
US7730012B2 (en) * 2004-06-25 2010-06-01 Apple Inc. Methods and systems for managing data
US7496593B2 (en) * 2004-09-03 2009-02-24 Biowisdom Limited Creating a multi-relational ontology having a predetermined structure
US20060167930A1 (en) 2004-10-08 2006-07-27 George Witwer Self-organized concept search and data storage method
US20070226204A1 (en) * 2004-12-23 2007-09-27 David Feldman Content-based user interface for document management
US7555472B2 (en) * 2005-09-02 2009-06-30 The Board Of Trustees Of The University Of Illinois Identifying conceptual gaps in a knowledge base
EP1952280B8 (en) 2005-10-11 2016-11-30 Ureveal, Inc. System, method&computer program product for concept based searching&analysis
WO2007084616A2 (en) * 2006-01-18 2007-07-26 Ilial, Inc. System and method for context-based knowledge search, tagging, collaboration, management and advertisement
WO2008055034A2 (en) * 2006-10-30 2008-05-08 Noblis, Inc. Method and system for personal information extraction and modeling with fully generalized extraction contexts
US7555478B2 (en) 2006-12-05 2009-06-30 Yahoo! Inc. Search results presented as visually illustrative concepts
US20100153368A1 (en) 2008-12-15 2010-06-17 Raytheon Company Determining Query Referents for Concept Types in Conceptual Graphs
US8412659B2 (en) * 2009-05-11 2013-04-02 General Electric Company Semi-automated and inter-active system and method for analyzing patent landscapes
US8751218B2 (en) * 2010-02-09 2014-06-10 Siemens Aktiengesellschaft Indexing content at semantic level
US20110314034A1 (en) * 2010-06-17 2011-12-22 Intuit Inc. Concept-based data processing

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1669029A (zh) * 2002-05-17 2005-09-14 威乐提公司 自文件集合中自动搜寻概念层次结构的方法及系统
CN1716244A (zh) * 2003-12-29 2006-01-04 西安迪戈科技有限责任公司 智能搜索、智能文件系统和自动智能助手的方法
US7890533B2 (en) * 2006-05-17 2011-02-15 Noblis, Inc. Method and system for information extraction and modeling

Also Published As

Publication number Publication date
CN102508845A (zh) 2012-06-20
US20120066210A1 (en) 2012-03-15
US8775426B2 (en) 2014-07-08
US20140317103A1 (en) 2014-10-23

Similar Documents

Publication Publication Date Title
CN102508845B (zh) 对概念分层结构进行导航和搜索的界面
CN100587658C (zh) 可搜索控制模板功能的基于任务的界面
CN102520841B (zh) 收集用户接口
CN101373431B (zh) 增强型小组件合成平台
CN100435143C (zh) 带有嵌套表格的无模式数据映射系统和方法
CN1713179B (zh) 在对象模型中的影响分析
US20140279903A1 (en) Version control system using commit manifest database tables
JP2006209743A (ja) ドキュメントセントリックソフトウェアアプリケーションに対するタスク指向ユーザインターフェースモデル
CN104428734A (zh) 输入法编辑器应用平台
CN101535934A (zh) 提供用于查看和编辑元数据的定制用户界面的方法和系统
CN102902529A (zh) 变换的上下文知晓数据源管理
CN102279869A (zh) 对实体间的关系进行导航
CN103853808A (zh) 产生搜索结果的方法和系统
CN103597469A (zh) 集成开发环境中的实况浏览器工具
JPWO2006098031A1 (ja) キーワード管理装置
CN109597976A (zh) 一种文档编辑方法及装置
CN101308505A (zh) 提供对远程资源数据的访问的方法和数据处理系统
CN103262106A (zh) 管理来自结构化和非结构化数据源的内容
WO2020068211A1 (en) Personalization of content suggestions for document creation
CN104252521A (zh) 使用预定项目模板的Web内容管理的方法和系统
CN102270220A (zh) 跨多个源标识主导概念
CN1855096A (zh) 带有基础可扩展框架的面向任务的界面
GB2569858A (en) Constructing content based on multi-sentence compression of source content
CN101960453B (zh) 用于联合和可发现性的位置描述
CN114371845A (zh) 表单生成方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150720

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150720

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.