CN102902705B - 定位数据中的歧义 - Google Patents

定位数据中的歧义 Download PDF

Info

Publication number
CN102902705B
CN102902705B CN201210260005.9A CN201210260005A CN102902705B CN 102902705 B CN102902705 B CN 102902705B CN 201210260005 A CN201210260005 A CN 201210260005A CN 102902705 B CN102902705 B CN 102902705B
Authority
CN
China
Prior art keywords
perspective
value
species
data
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210260005.9A
Other languages
English (en)
Other versions
CN102902705A (zh
Inventor
J·D·惠兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Boeing Co
Original Assignee
Boeing Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Boeing Co filed Critical Boeing Co
Publication of CN102902705A publication Critical patent/CN102902705A/zh
Application granted granted Critical
Publication of CN102902705B publication Critical patent/CN102902705B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2365Ensuring data consistency and integrity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24564Applying rules; Deductive queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/909Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Computer Security & Cryptography (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种包括相联存储器、输入模块、查询模块以及显示模块的系统。所述输入模块被配置为接收相联存储器的第一透视内的值。所述查询模块被配置为使用所述值执行所述相联存储器的打开查询,在所述相联存储器的插入透视和第二透视中的至少一个中执行所述打开查询。所述插入透视和第二透视中的至少一个相对于所述第一透视具有所述值的同样多或更多的种类联系。所述显示模块被配置为显示所述查询的结果并且显示由所述打开查询产生的一列一个或更多个潜在歧义。

Description

定位数据中的歧义
技术领域
本公开一般涉及相联存储器管理,并且特别涉及寻找存储在相联存储器中的数据中存在的歧义(ambiguity),以便降低信息混淆(obfuscation),这能够改进决策。
背景技术
在分析数据时,歧义数据可能引起分析中的混乱、延迟和可能的错误。如本文所用,“歧义数据”可以是与两个或更多个不同种类相关联的数据集。该“数据集”可以是值(value),其可以是数字、字母数字字符串、符号或本文其他处描述的值。“种类”是由用户或数据处理系统安排的数据的分组。
例如,数字“123-456-7890”可能是电话号码,或许是零件编号,或许能够与一些其它种类相关联。在该情况下,数字“123-456-7890”是“数据集”或值。该数据集与电话号码和零件编号两者相关联。电话号码为第一种类,而零件编号为第二种类。在一些情况下,用户仅通过观察该数字不能了解该数字属于哪一种类。或者,在更广泛的意义上,不论第二种类是否存在,用户都可能不能够辨别该数据在第一位置是否有歧义。因此,可能不需要比较以便寻找歧义数据的存在。
在以下情况下可能出现歧义的多样性,即相同的数字序列与许多不同种类相关联,或者搜索引擎可能忽略特殊字符如123-456-7890中的两个连字符,因此产生更大数量的歧义。此外,用户可观察属于多个种类的数据集,因此增加数据分析的复杂性。然而,用户可能甚至不知道数据集中存在歧义数据,这可能问题更大。
如上所述,在一些情况下,如果不识别这些歧义,就可能引起数据分析中的错误。例如,当合计大量数据时,歧义数据可能提供误导统计或错误计数。另外,在搜索大数据集时,当用户试图获取有用信息时,歧义数据可能使结果集不清晰,并且引起失败。例如,如果用户向搜索引擎输入零件编号,用户可能在返回结果中看到满足该数字形式但是用户不感兴趣的门牌号、电话号码以及许多其他种类。因此,可能有利的是用户理解一个或更多个数据源中是否存在歧义的可能性,以便避免数据混淆问题,并因此提高决策。
发明内容
本公开的实施例提供一种包括相联存储器的系统,该相联存储器包含多个数据和所述多种数据之间的多个联系。所述多个数据被收集在关联组中。所述相联存储器被配置为基于所述多个数据之间的至少一种关系而被查询,所述至少一种关系选自除所述多个数据之间的直接相关之外还包括直接和间接关系的群组。该系统也包括输入模块,其被配置为接收所述相联存储器的第一透视(perspective)内的值,其中所述第一透视包括所述多个数据内的数据组的第一背景选择。该系统也包括查询模块,其被配置为使用所述值执行所述相联存储器的打开查询。所述查询模块被进一步配置为在所述相联存储器的插入透视和第二透视中的至少一个中执行所述打开查询。所述插入透视包括被配置为被反馈到所述相联存储器中的透视类型。所述第二透视包括所述数据组的第二背景选择。所述插入透视和所述第二透视中的至少一个相对于所述第一透视具有所述值的同样多或更多的种类联系。该系统也包括显示模块,其被配置为显示所述查询的结果。所述显示模块被进一步配置为显示由所述打开查询产生的一列一个或更多个潜在歧义。
另一个有利实施例提供一种计算机执行方法。该计算机执行方法包括接收相联存储器的第一透视内的值。所述第一透视包括多个数据中的数据组的第一背景选择。所述相联存储器包括多个数据和所述多种数据之间的多个联系。所述多个数据被收集在关联组中。所述相联存储器被配置为除基于所述多个数据之间的直接相关外还基于所述多个数据之间的间接关系而被查询。该计算机执行方法也包括使用所述值执行所述相联存储器的打开查询,其中在所述相联存储器的插入透视和第二透视中的至少一个中执行所述打开查询。所述插入透视包括被配置为被反馈到所述相联存储器中的透视类型。所述第二透视包括所述数据组的第二背景选择。所述插入透视和所述第二透视中的至少一个相对于所述第一透视具有针对所述值的同样多或更多的种类联系。该计算机执行方法也包括显示所述查询的结果,其包括显示由所述打开查询产生的一列一个或更多个潜在歧义。
另一个有利实施例提供一种存储计算机可读代码的非瞬态计算机可读存储介质。该计算机可读代码包括用于接收相联存储器的第一透视内的值的计算机可读代码。所述第一透视包括多个数据中的数据组的第一背景选择。所述相联存储器包括多个数据和所述多种数据之间的多个联系。所述多个数据被收集在关联组中。所述相联存储器被配置为除基于所述多个数据之间的直接相关外还基于所述多个数据之间的间接关系而被查询。该计算机可读代码也包括用于使用所述值执行所述相联存储器的打开查询的计算机可读代码。所述打开查询在所述相联存储器的插入透视和第二透视中的至少一个中执行。所述插入透视包括被配置为被反馈到所述相联存储器中的透视类型。所述第二透视包括所述数据组的第二背景选择。所述插入透视和所述第二透视中的至少一个相对于所述第一透视具有针对所述值的同样多或更多的种类联系。该计算机可读代码也包括用于显示所述查询的结果的计算机可读代码,其包括显示由所述打开查询产生的一列一个或更多个潜在歧义。
这些特征、功能和优点能够在本公开的各个实施例中独立实现,或者可结合其他实施例,其中能够参考以下描述和附图看出进一步的细节。
附图说明
在随附的权利要求中阐述了有利实施例的据信为新颖特征的特性。然而,当结合附图阅读时,参考本公开的有利实施例的以下详细描述,将最好地理解有利实施例和优选使用模式、进一步目标及其优点,其中:
图1是一种根据有利实施例用于寻找相联存储器中的数据歧义的系统的方框图;
图2是示出根据有利实施例用于寻找相联存储器中的数据歧义的系统的更多细节的方框图;
图3是示出一种根据有利实施例用于寻找相联存储器中的数据歧义的方法的流程图;
图4是示出一种根据有利实施例在使用中暴露相联存储器中的数据歧义的示例性软件系统的绘图;
图5是示出一种根据有利实施例用于寻找相联存储器中的数据歧义的方法的流程图;
图6是示出一种根据有利实施例的数据域和透视图之间的关系的绘图;
图7是一种根据有利实施例的搜索相联存储器的结果的示例性透视图;
图8是示出一种根据有利实施例显示相联存储器搜索结果的透视图的进程的流程图;
图9是示出根据有利实施例作为相联存储器中的数据的查询结果的结果资源累积的绘图;
图10是示出根据有利实施例作为相联存储器中的数据查询的结果的结果资源累积的表格;
图11是示出根据有利实施例用于快速决策的相联存储器的插入透视的绘图;
图12是示出根据有利实施例的相联存储器的插入透视的用法的绘图;
图13是示出根据有利实施例的相联存储器中的错误的表格;
图14是示出一种根据有利实施例动态更新相联存储器的进程的流程图;
图15是示出根据有利实施例源于查询相联存储器的结果以揭示不明显关系的结果的工作表视图的绘图;
图16示出一种根据有利实施例的数据处理系统。
具体实施方式
有利实施例认识并且考虑到歧义数据的出现可能引起错误。因此,有利实施例向用户提供一种机构,用以针对一个或更多个数据库快速识别、评价和解决歧义数据。这些有利实施例具有许多其他应用。
例如,有利实施例可利用透视或视图(包括插入透视)来寻找有效关系,如关于图1至图16 所示。有利实施例可被用于揭示相联存储器内的歧义,如关于图1至图5所示。有利实施例可被用于呈现相联存储器内的结果或其他数据的透视图,如关于图6至图8所示。有利实施例可被用于寻找和显示资源累积,如关于图9至图10所示。有利实施例可描述用于快速决策的相联存储器的插入透视,如关于图11至图12所示。有利实施例可被用于快速有效地解决相联存储器内的错误,如关于图13至图14所示。有利实施例可被用于显示源自查询相联存储器的结果以揭示不明显关系的结果的工作表视图,如关于图15所示。
如本文所用,术语“相联存储器”指代多个数据和该多个数据之间的多个联系。该数据和联系可被存储在非瞬态计算机可读存储介质中。该多个数据可被收集在关联组中。该相联存储器可被配置为除基于所述多个数据之间的直接相关外还基于所述多个数据之间的间接关系而被查询。该相联存储器也可被配置为基于直接关系以及直接关系与间接关系的组合而被查询。因此,有利实施例提供一种相联存储器,其包括多个数据和该多个数据之间的多个联系。该多个数据被收集在关联组中。该相联存储器被配置为基于该多个数据之间的至少一种关系而被查询,所述至少一种关系选自除多个数据之间的直接相关之外还包括直接和间接关系的群组。相联存储器也可采用软件的形式。因此,相联存储器也可被视为一种进程,其中通过该进程基于关系而非直接相关将信息收集到关联组中以便获得新见识。
如本文所用,术语“实体”指代具有明显单独的存在的物体,但该存在不需要是物质存在。因此,可将抽象和法律概念视为实体。如本文所用,不假定实体是有生命的。
如本文所用,“透视(perspective)”可以是“观察点(point of view)”。关于相联存储器,透视可以是用户域的特殊方面的背景选择。如本文所用,“插入透视”是可被反馈到相联存储器中的一种透视类型,并且从其他透视可将该透视作为可能的资源来观察该透视。
如本文所用,“域(domain)”可以是即将用于分析的主题。
本文使用的术语“歧义(ambiguous)”可以指代具有几种可能意义或解释的值或术语。
首先关注寻找和/或解决相联存储器内的歧义数据。有利实施例提供了使用相联存储器技术通过分析数据来定位歧义,其中通过记忆特定域的预定透视中关联的实体来分析数据。有利实施例可对结果进行分类,从而用户能够快速确定其寻找的信息是否包含歧义。
如上所述,相联存储器可以基于对关系、联系和频率的查询的结果。当所强调的数据包含歧义信息时,相联存储器的这种性质可能是有问题的。该问题在大型域中可能很棘手。在任何情况下,相联存储器技术在区分歧义数据时都具有难以忍受的时间。
如上所示,歧义数据可能增加精确确定一个歧义值是否与另一值相关的难度。在该情况下,产生的联系可能常常不正确。继而,错误的联系可能引起不正确或混乱的结果,并且可能增加以期望精确水平执行期望分析的难度。
当前,确定相联存储器中的数据是否有歧义需要由用户的怀疑发起的手动调查。手动调查可能极其费时和乏味。手动揭示大数据集中是否存在歧义可能是困难的。例如,揭示歧义数据可能要求对主题的深入理解,以真正确定特定数据是否有歧义。在另一示例中,可能仅在该数据所处的背景中揭示歧义。评价背景可能需要额外时间,可能需要主题专门技术,并且可能受另外的错误影响。此外,可能存在歧义数据,但是用户可能未意识到可能存在歧义数据,这可能引起次优决策。另外,歧义在不同背景中可能呈现不同的形式。此外,当实际上出现错误时,数据构成中的错误可能被误认为歧义。
有利实施例认识到这些和其他问题。有利实施例可被用于自动地暴露数据中的歧义的可能性,特别是当使用包含该数据的相联存储器时。有利实施例可被用于解决该数据中的歧义。有利实施例也认识到相联存储器的其他性质,并且提供关于相联存储器的用途的另外改进。因此,有利实施例也提供相联存储器的透视图。该透视图允许以促进快速决策的方式组织相联实体。
有利实施例也提供相联存储器的插入透视以用于快速决策。插入透视产生将新的未组织数据插入相联存储器中的能力,以使得能够快速决策。插入透视也可允许用户使用一种用于插入数据的正确解释的机制,否则该数据可能被视为有歧义。另一有利实施例可通过允许用户关注在其积累方面具有最大重要性的实体来提供相联存储器的资源累积,以便快速决策。
另一有利实施例提供使用相联存储器以促进基于决策的工作流程。在该有利实施例中,提供一种将新的未组织数据插入已知相联实体中的能力以提高其关联性,这允许其他用户补充(leverage)该改进的相联存储器。该能力也可允许用户使用一种插入数据的正确解释的机制,否则该数据可能被视为有歧义。
另一有利实施例提供相联存储器的工作表视图。该工作表视图提供一种用于揭示源于搜索结果驱动的分析的不明显关系的相联实体的组织。
另一有利实施例提供在智能分析和行动过程发展中使用相联存储器技术。该有利实施例提供补充相联存储器技术,以快速评价大量的自由文本数据,获得相当多的知识,并且以使分析师能够高效研发有效运行方案的方式展示该知识。
本文也描述了其他有利实施例。因此,有利实施例不限于上述有利实施例。
图1是一种根据有利实施例用于寻找相联存储器中的数据歧义的系统的方框图。图1所示的系统100可使用一个或更多个数据处理系统来实施,其可能在分布式环境或网络环境中,并且可能通过称为“云”的一组远程管理数据处理系统来实施。实施系统100的一个或更多个数据处理系统中的每一个都可以是关于图16所描述的数据处理系统1600或其变体。系统100的特征在于包括一个或更多个模块。这些模块中的每一个都可以是单独的单片架构或单片架构的一部分。系统100可采用硬件、软件或其组合的形式。
系统100可包括相联存储器102。相联存储器102可包括多个数据104以及该多个数据之间的多个联系106。多个数据104可被收集到关联组108中。相联存储器102可被配置为除了基于多个数据104之间的直接相关112之外还基于多个数据104之间的间接关系110而被查询。
系统100还可包括输入模块114。输入模块114可被配置为接收相联存储器102的第一透视118中的值116。第一透视118可包括多个数据104中的数据组的第一背景选择120。
系统100也可包括查询模块122。查询模块122可被配置为使用值116执行相联存储器102的打开查询。可使用打开查询语言搜索123来执行打开查询。查询模块122可进一步被配置为在相联存储器102的插入透视124和第二透视126中的至少一个中执行打开查询。插入透视124可以是被配置被反馈到相联存储器102中的透视类型128。第二透视126可以是数据组的第二背景选择130。可以存在更多或更少的透视。插入透视124和第二透视126中的至少一个可以相对于第一透视118具有针对值116的同样多或更多的种类联系132。
系统100也可包括显示模块134。显示模块134可被配置为显示查询的结果136。显示模块134可进一步被配置为显示由查询模块122的打开查询产生的一列一个或更多个潜在歧义138。在有利实施例中,该列一个或更多个潜在歧义138中的一个或更多个潜在歧义可以包括值116的多个匹配属性140。
图1所示的有利实施例无意对可实施不同有利实施例的方式暗示物理或结构性限制。可以使用附加和/或替换所示组件的其他组件。在一些有利实施例中,一些组件可能是不必要的。同时,展示这些块是为了图示说明一些功能性组件。当在不同的有利实施例中实施时,这些块中的一个或更多个可以被组合和/或分成不同的块。
图2是示出一种根据有利实施例用于寻找相联存储器中的数据中是否存在歧义的系统的更多细节的方框图。系统200可示出图1的系统100的一个或更多组件的更多细节。例如,图2的显示模块202可以是图1中的显示模块134。在另一示例中,图2中的查询的结果204可以是图1中的查询的结果136。存在关于图1和图2中使用的类似术语的其他示例。图1和图2中使用的这种类似术语可具有类似的功能和类似的性质。
系统200可使用一个或更多个数据处理系统来实施,其可能在分布式环境或网络环境中,并且可能通过称为“云”的一组远程管理数据处理系统来实施。实施系统200的一个或更多个数据处理系统中的每一个都可以是关于图16所描述的数据处理系统1600或其变体。系统200的特征在于包括一个或更多个模块。这些模块中的每一个都可以是单独的单片架构或单片架构的一部分。系统200可采用硬件、软件或其组合的形式。
在有利实施例中,值206可以是第一数字208。一列一个或更多个潜在歧义210可以包括多个匹配属性212。多个匹配属性212可以包括第一属性214。第一属性214可以与值206匹配。多个匹配属性212也可以包括第二属性216。第二属性也可以与值206匹配。第一属性214可以是与第一数字208相关联的第一种类218。第二属性216可以是与第一数字208相关联的第二种类220。在有利实施例中,当就用户或计算机程序所知通过仅检查第一数字208不能确定222第一数字208应属于第一种类218或第二种类220时,可能存在歧义。
在一些情况下,可以不作出确定222,因为初始种类名称223不匹配或不同于第一种类218。在该情况下,数据中可能存在或出现歧义。换句话说,如果输入到透视中的初始种类名称与该透视的种类不同或与之不匹配,就存在或可能出现歧义数据。例如,如果初始种类名称是“零件”,但是第一种类是“电话号码”,则存在或可能出现歧义数据。
在有利实施例中,值206不需要局限于数字。例如,值206可以是字母数字字符集224和特殊字符集226中的至少一种。特殊字符集226中的特殊字符可包括标点符号、符号、图片和选自使用非字母字符的语言的字符中的至少一种。选自非字母字符的语言的字符的示例可以是中文字符、日本汉字字符,并且还可包括本质上为字母但不必须是字母数字的语言,包括北印度语、梵语、朝鲜语、包括平假名和片假名的日语假名、俄语字符、阿拉伯语字符或来自类似阿拉伯语的语言的字符,以及在其他书写语言中使用的任何非英语字母或非阿拉伯数字。
在有利实施例中,显示模块202可进一步被配置为显示第一种类218的第一种类名称228以及第二种类220的第二种类名称230。在另一有利实施例中,显示模块202可进一步被配置为提供与第一种类218相关联的第一链接232和与第二种类220相关联的第二链接234。第一链接232可指向与第一种类218相关联的第一信息236。第二链接234可指向与第二种类220相关联的第二信息238。
图2所示的有利实施例无意对可实施不同有利实施例的方式暗示物理或结构性限制。可以使用附加和/或替换所示组件的其他组件。在一些有利实施例中,一些组件可能是不必要的。同时,展示这些块是为了图示说明一些功能性组件。当在不同的有利实施例中实施时,这些块中的一个或更多个可以被组合和/或分成不同的块。
图3是示出一种根据有利实施例用于寻找相联存储器中的数据歧义的方法的流程图。图3所示的进程300可以在模块、系统或数据处理系统如图1的系统100、图2的系统200或图16的数据处理系统1600中实施。关于图3所描述的进程300可以以存储计算机可读代码的非瞬态计算机可读存储介质的形式实施,该计算机可读代码在被处理器实施时可执行关于图3所描述的方法。虽然图3的操作被描述为由“系统”实施,但是进程300不限于由图1和图2的系统实施,而是也可以由可能在分布式环境或网络环境中的一个或更多个真实或虚拟数据处理系统实施。进程300可以使用硬件、软件或其组合来实施。
在有利实施例中,进程300开始于系统接收相联存储器的第一透视内的值(操作302)。在有利实施例中,第一透视可以是多个数据中的数据组的第一背景选择。相联存储器可以是多个数据和多个数据之间的多个联系。多个数据可被收集到关联组中。相联存储器被配置为除基于多个数据之间的直接相关外还基于多个数据之间的间接关系而被查询。
返回进程300,然后系统可以使用该值执行相联存储器的打开查询(操作304)。在有利实施例中,打开查询可以在相联存储器的插入透视和第二透视中的至少一个中实施。该插入透视可以是被配置为被反馈到相联存储器中的透视类型。该第二透视可以是数据组的第二背景选择。插入透视和第二透视中的至少一个可以比第一透视具有针对所述值的更多的种类联系。
返回进程300,然后系统可以显示查询的结果,包括显示由打开查询产生的一列一个或更多个潜在歧义(操作306)。该一个或更多个潜在歧义可以包括所述值的多个匹配属性。
进程300可与上述操作不同,并且在任何给定的操作内都可以存在另外的细节。例如,所述值可以是第一数字,并且所述多个匹配属性可以是与该值匹配的第一属性以及与该值匹配的第二属性。第一属性可以是与第一数字相关联的第一种类。第二属性可以是与第一数字相关联的第二种类。在有利实施例中,就用户或计算机程序所知,仅通过检查第一数字不能做出第一数字应属于第一种类或第二种类的确定。在一些情况下,可能不做出该确定,因为该值或数据与初始查询的初始种类类型不匹配,其可以是图1的第一透视118中的条目(entry)。
在另一有利实施例中,该值可以包括字母数字字符集和特殊字符集中的至少一种。特殊字符可以包括标点符号、符号、图片以及从使用非字母字符的语言中选择的字符中的至少一种。
在有利实施例中,显示还可以包括显示第一种类的第一种类名称和第二种类的第二种类名称。在有利实施例中,显示可以包括提供与第一种类相关联的第一链接以及与第二种类相关联的第二链接。第一链接可指向与第一种类相关联的第一信息,并且第二链接可指向与第二种类相关联的第二信息。在另一有利实施例中,执行打开查询可以包括使用打开属性查询语言搜索来执行打开查询。
图3所示的有利实施例无意对可实施不同有利实施例的方式暗示物理或结构性限制。可以使用附加和/或替换所示组件的其他组件。在一些有利实施例中,一些组件可能是不必要的。同时,展示这些块是为了图示说明一些功能性组件。当在不同的有利实施例中实施时,这些块中的一个或更多个可以被组合和/或分成不同的块。
图4是示出一种根据有利实施例在使用中暴露相联存储器中的数据歧义的示例性软件系统的绘图。图400仅是示例性的,因为有利实施例可以采用多种不同形式,并且可以以许多不同方式显示。因此,图400并不限制所要求保护的发明。图400可被显示为关于图1至图3所描述的方法和技术的结果。可以通过使用数据处理系统1600或通过一个或更多个其他数据处理系统来显示图400。如本文所用,有利实施例将“系统”描述为执行一个或更多个操作。该“系统”可以是一个或更多个数据处理系统,其可能在分布式环境或网络环境中运行。
图400示出许多透视,包括零件编号透视402、透视404、插入透视406和透视408。如之前所定义,“透视”可以是“观察点”。每个相联存储器都可以具有一个或更多个透视。图400可以图示说明具有四个透视即透视402、透视404、插入透视406和透视408的相联存储器409。透视402可以是零件编号透视。可以存在更多或更少的透视,并且可以存在具有许多相对于图4所示的值或布置不同的值或布置的不同类型的透视。每种相联存储器都可以具有能够插入实体的透视。例如,“问题”透视或“意见”透视可以是将问题或意见数据插入相联存储器的手段。因此,针对相联存储器409,透视可以是用户域的特定方面的背景选择。如上所述,“插入透视”是可被反馈到相联存储器409中的透视类型。
在特别的有利实施例中,不局限于所要求保护的发明,透视402可以是特定零件编号,诸如值410。虽然图4中示出了值410,但是值410可以采用任何值的形式,并且可以是字母数字字符串或任何其他符号,诸如上文关于图1所描述的那些符号。此外,值410可以与不同的种类而非零件相关联,并且可与多种种类或其他相应透视如透视404、插入透视406和/或透视408相关联。
在有利实施例中,用户或计算机程序可以在透视402中输入值410。在该特别的有利实施例中,不局限于本公开或权利要求,值410可以是零件编号。在该有利实施例中,用户可以通过在透视402中输入值410来预选与值410的数值相关联的种类。在该特别的有利实施例中,用户可能未意识到他或她调查的数据可能有歧义。用户可能希望获得对值410的更好理解。在其他有利实施例中,用户可能使用该信息来解决由值410可能与相联存储器409内的其他种类相关联的可能性产生的歧义。
在接收了值410后,系统可以使用插入透视406,如工作表414的所需信息412所示。另一个工作表示例可以在图15中看到。然后,系统可在所需信息412中执行相联存储器409的查询。在一个有利实施例中,该查询可以使用属性查询语言来执行,并且可以使用打开查询来执行。
因此,为了识别歧义数据,系统可以在插入透视406中执行对期望值如所需信息412的查找。只要能够找到实体,不论结果种类是什么,查找就可以起作用。因此,在特别的非限制有利实施例中,最可靠的方法可能是使用插入透视406作为结果种类,因为插入透视406对所有其他透视都可起到催化剂的作用。以此方式,有可能识别该域内的所有歧义数据。
然后,系统可返回所需信息412的所有实例,如工作表414中的表格416所示。在有利实施例中,所需信息412可以是值410。表格416中的这些实例可以是将所需信息412的值(也可以是零件编号)与相联存储器409中存在的所需信息412的其他实例匹配的结果。返回的值可以被用于识别关于所需信息412的透视402的歧义。
歧义数据可以以结果集的多个匹配属性的形式显示,其中结果的种类类型不匹配初始查询的透视类型。例如,如图4的匹配属性栏418所示,结果的一种种类类型可以是“零件编号”,其与通过在透视402中输入值410而建立的初始查询的种类类型匹配。然而,如图4的匹配属性栏418所示,结果的另一种种类类型可以是“电话”。种类类型“电话”不与种类类型“零件编号”匹配;因此,存在结果集的多种匹配属性,其中结果的种类类型不与初始查询的透视类型匹配。因此,值“1234567”可代表相联存储器409中的歧义数据。
例如,在该特别的有利实施例中,在表格416中,匹配属性栏418可以示出与值410相关联的种类以及值410自身的数值,其中种类和数值由冒号分开。每个结果的匹配属性的种类值都可帮助用户识别歧义数据。因此,通过观察相应的值,用户可以确定该数据是否是相关的和/或有歧义的。例如,在该值可能涉及两种不同种类的意义上来说,现在用户可了解在透视402中输入的值410可能代表歧义数据。在该示例中,该值涉及零件编号(第一种类)以及电话号码(第二种类)。因此,电话号码在零件之间显示的事实意味着值410是有歧义的。
在该特别的有利实施例中,电话号码420可以被视为歧义数据,因为值410 的数值也与电话号码420的数值匹配。换句话说,数值“1234567”同时匹配两个种类,即值410和电话号码420,因此数值“1234567”可能有歧义。结果,如果用户不知道该歧义,则使用该数值执行关于相联存储器409的一些其他搜索或操作可能产生错误或不期望的结果。使用有利实施例,用户或被编程而使用有利实施例的计算机程序现在可以了解值410的数值相对于电话号码420的数值可能是有歧义的。用户或计算机程序现在可以采用适当的行动以解决该歧义,或者在执行关于相联存储器409的一些其他行动时考虑该歧义数据。
该系统可以具有另外的功能性。例如,该系统可以被配置为显示歧义数据的来源。如图4所示,可以在“{插入}ID”栏422中显示任何给定匹配属性或种类和相应数值的来源。特别地,例如,来源ID 424可以指示源文件的位置或其他查找值,其中数值“1234567”与种类或属性“电话”相关联。同样地,用户或计算机程序可以使用“{插入}ID”栏422中的其他条目来查找相应来源,其中相应的匹配属性和数值被参考。
在有利实施例中,“{插入}ID”栏422中的条目可以具有对参考来源的链接、超链接或其他指示符。因此,在有利实施例中,用户可以选择歧义数据的来源,以便了解歧义数据的原始背景。例如,用户或计算机程序可以例如通过在来源ID424上“点击”而使用链接,以便显示在其中数值“1234567”与电话号码相关联的来源材料。因此,用户可以确定所涉及的歧义并且可以采用其他行动以解决或适当处理歧义数据。
可任选地,该系统可以被配置为显示更进一步的信息。例如,该系统可以显示分数栏426。分数栏426中的条目可以向用户或计算机程序指示输入值与该值被输入到的透视的估计相关性。因此,例如,根据输入到透视402的值410,可将相关性分数分配给特别的匹配属性或种类。
该系统可以被配置为显示更进一步的信息。因此,有利实施例不限于图4所示的图。
换句话说,关于图4使用的系统可以在期望值上执行打开属性查询语言搜索,其中该值的透视作为该值的结果种类。然后,该系统可以显示来自其结果集的匹配属性的种类值。该系统可以使用种类值来示出关于搜索值的歧义。如果匹配属性的最终种类值不与搜索值的种类匹配,则该数据就是有歧义的。该系统也可以允许用户了解与值410相关联的一些或所有种类。在确定数据为何有歧义以及是否应对歧义数据进行修正或采用其他适当行动时,该能力可能是有帮助的。
有利实施例具有几个优点。例如,有利实施例可以不要求对主题的深入了解以确定数据是否有歧义。相反,该系统可确定这一事实并且提供或显示简单的分类结果,其允许理解如何将数据解释为有歧义。
在另一示例中,有利实施例可以不要求用户揭示数据后面的背景以发现数据中的歧义。相反,该系统可以通过在预定透视内使用相联存储器查找来执行这一任务。该查找可以自动考虑不同的形式和不同的背景,并且可以向用户提供正确结果。
在另一示例中,有利实施例可以帮助识别和改正数据中的错误,否则其可能被误认为歧义。例如,用户可以更新被识别为有歧义的隐含数据,以便该数据不再有歧义。
在另一示例中,有利实施例可以允许用户做出快速广博的决策,同时降低引入由给定域内的任何歧义引起的数据混淆的忧虑。有利实施例可以通过允许用户不仅定位可能的歧义而且也改正或解决歧义数据的方式来组织数据。有利实施例精简和总结潜在的歧义数据,以便用户可以仅观察一个屏幕而非多页数据。
有利实施例可以避免通常在搜索歧义时引起的混乱。相反,有利实施例可以提供仅关注当前问题的结果。有利实施例可以减少大量数据以简化种类和数值。当用户已被分派搜索大数据集的任务时,该特征可以节省大量时间。
有利实施例可以允许用户快速揭示其结果集内的歧义数据。有利实施例提供所揭示结果内的搜索值。
有利实施例也可以针对用户选择的预定透视解决歧义数据。有利实施例可以仅显示被认为对用户请求至关重要的结果。有利实施例也提供快速机构以获得用于做出快速决策的信息。有利实施例不需要是特定域的。有利实施例可以是独立便携式平台。
有利实施例可以通过借助于歧义数据的发现和后续消除的更完整数据分析来提高可靠性。有利实施例可以通过系统的柔性布置来提高便携性。有利实施例可以通过从用户的透视组织的数据来提供更大的信息可访问性。有利实施例可以提供对资源的更好利用,因为可以同时完成多个相联存储器任务。有利实施例可以通过更大功效来提高性能,诸如通过仅显示必需的数据或仅显示特殊类型的数据、数据种类或一些其他组织原则。有利实施例也可以具有其他优点。
图5是示出一种根据有利实施例用于寻找相联存储器中的数据歧义的方法的流程图。进程500可以是图3的进程300的替换选项。图5所示的进程500可以在模块、系统或数据处理系统如图1的系统100、图2的系统200或图16的数据处理系统1600中实施。关于图5所述的进程500可以以存储计算机可读代码的非瞬态计算机可读存储介质的形式实施,该计算机可读代码在被处理器实施时可以执行关于图5所描述的方法。虽然图5的操作被描述为由“系统”实施,但是进程500不限于被图1和图2的系统实施,而是可以由可能在分布式环境或网络环境中的一个或更多个真实或虚拟数据处理系统实施。进程500可以使用硬件、软件或其组合来实施。
在有利实施例中,进程500开始于系统促使用户仅获得关于某些数据的相关信息(操作502)。为了实现该目标,用户可能期望或需要在涉及该数据的搜索结果内定位一些或所有歧义。
然后,系统可以接收关于该数据的信息(操作504)。系统可以从用户或者可能从其他计算机程序接收该信息。例如,用户可以为零件编号输入一个值,以便识别与该值相关联的歧义。
然后,系统可以使用多种分析能力来产生涉及用户请求的大范围的实体分析结果(操作506)。然后,系统可以处理输入数据并且可以显示一列歧义数据(操作508)。系统可以通过显示值502的匹配属性的种类和数值来清晰地识别每个实体。如图4所示,系统可以考虑跨越多个歧义种类的匹配属性值。
然后,系统可以促使用户决定是否进一步调查数据的歧义性质(操作510)。如果决定进一步调查,则用户或计算机程序可以检查歧义数据的来源以确定数据有歧义的程度如何或者为何有歧义(操作512)。结果,用户或计算机程序可以确定当前的歧义。
随后或者响应于在操作510中不进一步调查数据的歧义性质的确定,用户或计算机程序可以做出关于如何处理歧义数据的有效决策(操作514)。之后该进程可以终止。用户或计算机程序因此能够关注完成当前任务所需的相关知识。
图5所示的有利实施例无意对可实施不同有利实施例的方式暗示物理或结构性限制。可以使用附加和/或替换所示组件的其他组件。在一些有利实施例中,一些组件可能是不必要的。同时,展示这些块是为了图示说明一些功能性组件。当在不同的有利实施例中实施时,这些块中的一个或更多个可以被组合和/或分成不同的块。
图6是示出根据有利实施例的数据域和透视图之间的关系的绘图。图6的图可以使用相联存储器600来实施,相联存储器600可以是图1的相联存储器102。透视是关于图1和图4所描述的透视。
域602可以包含相联存储器600内的各种全异数据604。图6示出如何将全异数据604组织到透视图606中。例如,在所有的全异数据604中,某些数据元素可以被组织到透视图606中。透视图606可以是图7的透视图700。例如,如引导线620所示,可将数据元素608、610、612、614和616组织到透视图606中。
有利实施例可以使用与传统用户界面耦合的相联存储器技术,以能够通过记忆与特定域的预定透视相关联的实体来从结果驱动的分析作出快速决策。有利实施例可以以帮助用户发现该透视内的关系和联系的高效方式组织该结果,以便作出快速决策。
现在关注使相联存储器查询结果的改进呈现合乎期望的问题。当面对作出快速决策时,分析师可能期望在大数据集之间快速揭示特定信息。该特定信息优选可以通过以下方式来呈现,即消除对过量考虑的细节不必要花费的时间,同时允许分析师仅关注精确决策确实需要或期望的数据元素。
由于可以使用相联存储器揭示极大量的结果,使用相联存储器技术来关注分析可能是困难的。相联存储器技术可以与大量数据一起工作,并且因此当尝试操纵给定域的结果集,尤其是必须作出快速决策时为用户带来问题。相联存储器技术可以将其结果基于关系、联系和频率,这在尝试在大型域内寻找具体问题的快速回答时可能混淆。
因此,使用相联存储器技术给出的结果可能以用户认为过量的数据遮蔽用户的调查。例如,当搜索特殊零件时,用户可能收到来自操作者、模型、服务要求、维护数据和消费者消息的过多数据。这些分心事物可能导致用户忽略要解决的原始任务或问题。能够保持关注当前问题可能是非常困难的,尤其是当相联存储器技术提供具有无数导航可能性的如此多数据时。相联存储器的这些方面可能阻止快速决策。
然而,相联存储器技术可以囊括多种分析能力以帮助用户。多种分析能力可以包括收集属性、联系以及数据间的相似性。每种能力都可以采用单独结果集的形式,其可能使得用户难以比较结果集之间的值。一些结果可能跨越不同种类,并且可能导致用户远离其最初的问题集。另外,揭示这些结果中的许多结果可能花费大量时间和精力,因为该结果可能包括任务的组合。结果,相联存储器技术可能被视为关于快速决策的不良工具,尤其是在处理大型数据集时,其中用户可能在相联存储器产生的结果中迷失和迷惑。
这些问题的两种可能方案可以包括使用网络搜索工具和使用复杂智能工具。关于搜索被请求信息的网络搜索工具,该搜索类型可以返回对包含高于被请求信息的文件的参考。然而,这可能引起许多假阳性和假阴性结果,并且可能不以有用形式显示信息。进而,复杂智能工具可能要求专家分析该结果,其中时间线可能变化。
在任一情况下,解决上述这些类型的问题都包括冗长的手动进程。用户可能不得不寻找经过数据的路径,而又不忽略初始要求。在一些情况下,该进程可能要求使用另外的软件。例如,用户可以使用外部工具或应用程序并且将结果拷贝到其中。在任何情况下,使用网络搜索工具或复杂智能工具可能都无用。
另一种操纵结果的方式是简化结果。简化能够包括使用户的域变窄,直到该域基本上与用户选择的透视相同。随后,用户也能够加宽其透视,直到该透视等于该域。这些程序中的任一个都可以导致用户修改其搜索,而大多数用户都不愿意进行修改。
图7是示出根据有利实施例的相联存储器的搜索结果的示例性透视图。图7的有利实施例可以代表被显示作为该搜索的结果的屏幕截图。透视图700可以是根据关于图1至图6描述的技术进行的搜索或查询的结果。透视图700可以是图6的相联存储器600。透视图700不需要限于显示使用相联存储器执行的查询或搜索的结果,而是也可用于显示使用网络搜索引擎和/或复杂智能工具执行的查询或搜索的结果。有利实施例可能允许用户关注关键信息,以便进行快速精明的决策。透视701可以是透视,如图4中的透视402。如图所示,透视701可以是如图所示的零件透视,但是可以是任何透视,并且不限于图7中所示的有利实施例。
透视图700可以被逻辑划分为不同节段(section),被直线或任何其他方便的节段指示系统分离。每个节段显示特定信息。这些节段可以被布置为帮助用户更快地寻找相关信息。图7所示的节段仅为示例性的,并且可以被改变。例如,图7所示的节段不需要是如图所示的彼此堆叠的节段,而是能够以不同模式布置,并且可由不同形状、颜色或其他区别特征限制。
在图7所示的有利实施例中,示出彼此堆叠的七个节段。然而,如上所述,该布置能够变化。
在有利实施例中,节段702可以显示初始实体种类以及所搜索的值。在非限制性示例中,节段702可以显示实体种类以及其值。在该有利实施例中,实体种类可以是“零件编号”,并且该值可以是“12345678”。用户可以提供该值,以便获得对当前主题的更好理解。用户可以预选实体种类或与该值相关联的透视。只要用户保持在该透视内,所有的结果都将采用该种类的形式。
在有利实施例中,节段704可以显示在节段702中搜索的值的属性云值。属性云值可以是与该搜索值相关联的广泛种类或值。属性云值可以通过提供在涉及在节段702中搜索的值的搜索期间积累的一系列重要词汇而提供快速总结。
在有利实施例中,节段706可以显示节段702中的搜索值的关联实体值。这些实体值可以是与节段702中的搜索值相关联的额外实体。这些实体值可以类似于上述属性,除了其可承载比实体更大的权重,因为其种类类型可以由用户定义。另外,如果用户将这些实体类型认定为透视,则它们也可以被定义为透视。用户也可搜索这些值中的一些或全部。
在有利实施例中,节段708可以显示与节段702中的搜索值相关联的关键字值。该值可类似于部分704中的上述属性,除了这些值可承载比关键字更大但比实体更小的权重。节段704中的这些值可能已经由用户识别为是相关的而非识别为透视。在一些有利实施例中,用户不能搜索这些值。
在有利实施例中,节段710可以显示与节段702中的搜索值相关联的一个或更多个实体种类的一个或更多个值。节段710中的这些值可以是与搜索值相关联的实体,并且可以共享相同的种类值。节段710中的值可以类似于节段704中的上述属性,除了节段710中的值可载有比实体和/或透视更大的权重。在有利实施例中,用户也可搜索这些值。
在有利实施例中,节段712可以显示片断(snippet)。片断可以是关于节段702中的搜索值的内容的文本或图形部分。因此,节段712可以向用户提供属于搜索值的资源的片断。优选地,节段712可以显示潜在源数据的简要片段(fragment),仅向用户显示数据的最初来源。然而,节段712可以显示额外的潜在数据,甚至是全部的潜在数据。在一些情况下,节段712是可扩展或可缩小的,以显示更多或更少的潜在数据。
在有利实施例中,节段714可以显示类似于节段702中所示的搜索值的其他实体值。因此,节段714中显示的值可以与搜索值共享相同的属性。该特征使用户能够快速定位正如搜索值那样的值。系统可以通过相似性或通过一些其他组织方案(可能将与节段702中的搜索值最相似的项放置在节段714的顶部)来分类和排序节段714中的这些值。
节段714可以显示共同实体所共享的匹配属性。然而,节段714可以显示额外数据以帮助引导用户作出更好的精明决策。例如,在有利实施例中,系统可以显示零件的价格,以便用户能够在相似实体之间选择最便宜的替换物。
总体来说,在一些情况下,当搜索大量数据时,尤其是使用相联存储器学习代理技术时,对结果进行分类可能是重要的。从该技术搜集的结果可能非常难以管理和导航。有利实施例可以关注用户透视,以帮助用户或查询计算机程序获得相联存储器技术的最大产出。有利实施例可以将数据组织成适当慎重考虑后产生的界面,该界面可以提供用户期望回顾的最有用数据。有利实施例可以显示更多或更少的数据。
有利实施例也可以从对终端用户最有价值的透视获取实体分析。有利实施例可以组织数据,从而用户能够研究结果集,而不偏离初始查询。有利实施例可以在对终端用户最有价值的透视中执行多个实体分析任务并且一次显示所有结果。有利实施例可以保持结果位于搜索值的初始种类中。该特征可以允许用户在所返回的信息之间快速导航。
因此,有利实施例向用户提供能够一次获得全部信息的概要的快速机制。有利实施例可以以直观方式仅显示关键字和重要词汇。有利实施例可以首先放置最有用的数据,允许用户在通读所有材料之前获得知识。当面对大量数据时,有利实施例可以提供很大的优点。
因为有利实施例可显示通常使用的语法,所以用户能够细读数据,而不需要完全理解该数据。有利实施例可以显示名词、动词、形容词和副词,或者可能显示图片、符号、视频或音频。以此方式,有利实施例可以允许用户快速领会被搜索信息背后的一般概念。
网络搜索引擎不具有这些能力。网络搜索引擎返回的结果通常包括文档或必须分析的大部分文本。为了获得作出精确决策所需的结果类型,分析师将不得不花费大量时间阅读和理解材料。该进程对于快速决策来说可能不是非常有效的。另外,网络搜索引擎具有有限的搜索能力。网络搜索引擎可以执行类似静态的搜索,但不能产生如从相联存储器技术中建立的富实体联系中发现的结果。
同样地,复杂智能工具不具有有利实施例的能力。源于这些工具类型的结果可能需要大量的分析和时间,因为返回了太多的数据。复杂智能工具通常也要求能够使用该工具的主题专家。
因此,基于网络的搜索和复杂智能工具都可能涉及复制使用有利实施例产生的结果的多个手动步骤。手动步骤或分析常常是麻烦的、分散注意力的、耗时的并且容易出错。手动分析可能充满进一步远离用户的初始要求导航的可能性,并且进入与原始用户目的不同的方向。
另外,有利实施例可以避免可能由典型实体分析查询引起的混乱。因此,有利实施例可以提供在用户预选的单个透视内的结果。该特征可能导致结果仅关注当前问题。结果,有利实施例可以将大量数据减少到简单的词汇和搜索项。当搜索大型数据集时,该特征可以节约大量时间。
有利实施例可以提供快速机构以获得用于作出快速决策的关键和重要信息。有利实施例可以执行多个实体分析任务并且在显示屏上的一个位置显示所有的结果。有利实施例可以提供易于导航的适当慎重考虑的界面。
有利实施例不需要是针对特定域的。有利实施例可以独立于平台并且是便携的。有利实施例可以是灵活的,就在于有利实施例可以允许用户添加和去除透视以及逻辑单元。
因此,有利实施例可以允许用户作出快速精明的决策,而不需要分析不期望的数据量。有利实施例可以组织数据以首先提供最重要的信息。这一信息可以被浓缩和总结,以便该信息仅要求用户读几个词而非多个页。
有利实施例也可以是用于训练个体的工具。有利实施例可以允许受训者仅关注执行其个别任务所需的关键信息。有利实施例可以将不期望的数据量归纳为易于理解的词,因此缩短训练所需要花费的时间。
与其他基于实体的搜索工具不同,有利实施例提供高度灵活性。有利实施例可以适合于利用实体分析的任何域。一旦选择了域,用户就可选择任何透视以在该域内探索。用户可以添加和去除透视和逻辑单元。该特征也允许有利实施例快速布置。
图8是示出根据有利实施例的显示相联存储器搜索结果的透视图的进程的流程图。图8所示的进程800可以在模块、系统或数据处理系统如图1的系统100、图2的系统200或图16的数据处理系统1600中实施。关于图8所述的进程800可以以存储计算机可读代码的非瞬态计算机可读存储介质的形式实施,该计算机可读代码在被处理器实施时可以执行关于图8所描述的方法。虽然图8的操作被描述为由“系统”实施,但是进程800不限于被图1和图2的系统实施,而是也可以由可能在分布式环境或网络环境中的一个或更多真实或虚拟数据处理系统来实施。可以使用硬件、软件或其组合来实施进程800。
进程800可以开始于接收用户输入(操作802)。从用户处接收的输入可以处于预选透视内。在有利实施例中,可能已经向用户分配了获得预选透视内的大型信息域内的特定知识的任务。用户可以输入特定信息请求以便获得对当前主题的更好理解。例如,可能已经向用户分配了获得关于零件编号的知识的任务,其中“零件编号”为预选透视。因此,作为接收用户输入的一部分,用户可以输入零件编号。
然后,相联存储器可以对用户输入执行多个分析,以产生大范围的实体分析结果(操作804)。然后,系统可以接收实体分析结果并将其公式化以便显示(操作806)。作为公式化实体分析结果的一部分,系统可以组织上述实体分析结果,以帮助用户快速和精确地作出决策。
然后,系统可以返回所组织的数据以便显示给用户(操作808)。在有利实施例中,用户或另一个计算机程序可以使用该结果,以通过仅回顾所显示的数据而作出精确和快速的决策(操作810)。
图8所示的有利实施例无意对可实施不同有利实施例的方式暗示物理或结构性限制。可以使用附加和/或替换所示组件的其他组件。在一些有利实施例中,一些组件可能是不必要的。同时,展示这些块是为了图示说明一些功能性组件。当在不同的有利实施例中实施时,这些块中的一个或更多个可以被组合和/或分成不同的块。
图9是示出根据有利实施例作为对相联存储器中的数据查询的结果的结果资源累积的绘图。绘图900中所示的资源累积可以使用关于图1至图3所述的相联存储器和方法及装置以及图16的数据处理系统1600来实施。绘图900示出一种用于以允许用户作出关于哪个数据与用户任务最相关并且可能没有歧义的快速决策的方式来积累资源信息和数据的机制。
与图6一样,图9的绘图900所示的资源累积可以使用相联存储器902来实施,该相联存储器可以是图1的相联存储器102。域904可包含相联存储器902中的各种全异数据906。图9示出图6的全异数据604可以如何通过资源累积来组织,如表格908所示。表格908可以是图10中的表格1000的示例。例如,在所有的全异数据906之间,某些数据元素可以被组织到表格908中。例如,数据元素910、912、914、916和918可以被组织到表格908中,如引导线920所示。
表格908示出通过发现的实例总数和发现该数据所在的来源而组织的数据。发现的实例越多,数据就越可能与用户有关。因此,用户的时间可以被更有效地用于搜索哪些可能是最相关信息。同样地,用户可以集中搜索具有关于受欢迎数据的最大点击量的一个或更多个资源。另一方面,用户将不需要花费不期望的时间量来搜索低计数或低返回数的信息。用户当然可以通过其他方式使用表格908中的信息。
因此,有利实施例可以使用与传统用户界面耦合的相联存储器技术,以能够通过分析资源累积而作出快速决策,其中通过记忆特定域的预定透视中关联的实体来分析资源积累。有利实施例可以组织该结果,从而用户能够关注具有最大信息累积的实体,以便作出关于该透视的快速决策。
例如,假设供应商向分析师提供前起落架所需的一系列零件。分析师可以依靠他或她的经验或域知识来确定首先定位哪个零件。如果该分析师不熟悉给定的零件,分析师将可能不管该零件的重要性而推迟对其处理。分析师也可以按顺序或随机处理该列。
有利实施例可以避免可能由典型实体分析查询引起的混乱。过量信息引起的混乱可能打击用户,并且使得难以评价当前信息。有利实施例可以通过提供在用户预选的单个透视内的结果而解决该事件。因此,有利实施例可以促使这些结果仅关注当前问题。有利实施例可以将大量数据简化为简单累积和计数。当被分配了探索大型数据集的任务时,该结果可以节约大量时间。
因此,有利实施例可以允许用户快速揭示其结果集内的最有价值数据。如图9中所示,有利实施例可以通过联系的累积或计数而确定值。
有利实施例具有几种优点。例如,有利实施例可以解决由用户选择的预定透视内的问题。有利实施例可以仅显示对用户的请求至关重要的资源累积。有利实施例可以提供获得用于作出快速决策的关键和重要的信息的快速机制。有利实施例可能不是针对特定域的。有利实施例可以是独立于平台的和便携的。有利实施例可以是灵活的,就在于有利实施例可以允许用户选择单个或多个搜索项以及添加和去除数据源。有利实施例可以提高数据分析速度,由此节省时间和金钱。
作为示例,假设飞机的机翼底部需要被保养。分析师将收集机翼中的一系列零件。然后,分析师将使用有利实施例来基于其联系而确定最重要的零件,并且首先关注这些零件,因为这些零件已被预先确定为是最重要的。该程序将节省分析师的时间,因为这些零件中的许多零件将难以定位。通过对零件进行预先排序,就能够降低用于保养飞机机翼所用的时间。
图10是示出根据有利实施例作为相联存储器中的数据查询的结果的结果资源累积的表格。表格1000可以是图9中的表格908的示例。例如,表格1000可以是图9的表格908。
栏1002可以代表期望值或一系列期望值。例如,栏1002可以代表用户感兴趣的零件或一系列零件。栏1002可以是预选透视1001中的初始实体种类。栏1002中的值可以由计算机程序或者可以由用户提供。可以提供栏1002中的值以便获得对当前主题的更好理解。栏1002中的值可以是单个实体或一系列实体。用户可以预选与这些值相关联的种类。只要用户保持在指派的透视内,则所有的累积结果都将采用该种类的形式。
栏1004、1006、1008和1010代表域内的数据的资源值。因此,栏1004、1006、1008和1010中的值可以识别域内的所有资源或数据来源。每个值可以代表包含在该域内指定的栏1002中的数据的计数的单独来源。通常,这些来源可以被划分成由用户定义的逻辑单元。本质上说,这些来源可以包含创建相联存储器的重要数据。
进而,栏1004、1006、1008和1010内的单元可以指示栏1002中给定值出现在相应数据来源中的实例的总数。因此,例如,栏1004中的第二单元具有值“11”。该值的意思是栏1002的第一单元中所示的零件“XYZ”的11个实例出现在栏1004的第一单元中所示的“来源1”中。
因此,栏1004、1006、1008和1010的单元中所示的值可以识别每个数据来源内的联系的累积资源或计数。如栏1002中所示,通过经累积计数指出其用途,该值指示“兴趣”。如栏1004的单元1014所示,有利实施例可以将这些结果分类以将最大值置于顶部。
换句话说,单元1014中的值可以识别相联存储器内的所有数据来源之间的总资源累积。单元1014中的值可以代表期望值中的“总兴趣”。单元1014中具有大数目的总资源计数的值可以指示在栏1002中存在与该值的许多联系,并且因此可以推断该值是重要的。类似地,单元1014中具有小数目的总资源计数的值可以指示在栏1002中存在与该值的较少联系,并且因此可以推断该值较不重要或不重要。
表格1000中所示的各种值仅是示例性的。可视需要改变表格1000的值、数目、种类或其他方面。
有利实施例可以对单个实体以及多个实体列表起作用。在任一情况下,分析师都可以快速确定返回信息的兴趣或重要性。分析师也可以确定继续追踪什么样的额外信息。
另外,有利实施例可以显示每个资源的计数,其中在相应来源内出现较少的计数或不出现计数。在一些情况下,该特征趋向于指示较小的值或重要性。
因此,有利实施例可以使用区分优先次序的技术,该技术可以被应用于任何数据集而不需要首先深入分析该数据。有利实施例不要求用户依赖于先前的经验或过去的知识来区分其数据集中的信息的优先次序。有利实施例可以执行该任务。
有利实施例也可以基于所感知的重要性向用户提供被分类的一系列优先权。该被分类的一系列优先权可以从数据内的联系搜集到。通过提供累积或计数,当存在有限或过量数据时,有利实施例可以避免确定项目的重要性的困难。
现在注意使用中的有利实施例的示例。首先,可以向用户分配获得大型域中的知识的任务。然后,用户可以输入特定信息请求以便获得对当前主题的更好理解。例如,可以向用户分配获得关于一系列受损零件编号的知识的任务。
然后,用户可以使用相联存储器技术来合并多种分析能力,以产生涉及用户请求的大范围实体分析结果。然后,有利实施例可以被用于处理输入数据并且为用户产生累积资源的计数。如图10所示,有利实施例可以通过值或“兴趣”来组织或分类这些累积。最后,有利实施例可将被分类的累积数据返回给用户,从而用户可以将其兴趣关注于具有最大值的信息。可替换地,如果没有值包含高计数,则用户能够快速看到该数据可以是有限值。最后,通过对可能具有最有价值信息的信息进行详细回顾,可以作出快速决策。
图11是示出根据有利实施例用于作出快速决策的相联存储器的插入透视的绘图。绘图1100中所示的透视插入可以使用关于图1至图3所述的相联存储器和方法及装置以及图16的数据处理系统1600来实施。绘图1100示出用于以允许用户作出快速决策的方式将插入透视包含在相联存储器中的机制。
有利实施例可以使用结合法,以在特别(ad-hoc)基础上将未构造的信息插入相联存储器技术中。该特征使得能够通过记忆特定域的预定插入透视中的相联实体而基于结果驱动分析做出快速决策。有利实施例可以以帮助用户揭示关系和联系的有效方式组织结果,以便及时作出关于新获得信息的决策。因此,有利实施例可以提供理解从分析观点新引入的数据的动态方式。有利实施例可以使用用户界面应用程序,其可以允许用户更快速且有效地与相联存储器技术相互作用。
在有利实施例中,用户可以通过插入透视1104将新信息插入系统中。每个相联存储器都具有起催化剂作用的插入透视类型,并为所有的其他透视提供反馈机制。插入透视1104可以利用该事实,以能够插入域1106的相联存储器中。然后,可以通过使用插入透视1104的相联存储器1102来操作数据,而结果被从用户的透视1108的观点组织。
图12是示出根据有利实施例的相联存储器的插入透视的用法的绘图。图集1200可以使用系统如关于图1至图3所示的系统以及图16的数据处理系统1600来实施。图集1200可以被用于例证图11的插入透视1104的用法。相联存储器1202可以是本文别处所描述的相联存储器,包括但不限于图1的相联存储器102。
在有利实施例中,绘图1204可以是将被插入相联存储器1202中的数据,诸如事故报告、电子邮件、新闻文章或涉及当前域的任何材料。绘图1204可以显示或表现先前不在系统中的新知识或信息。例如,该信息可以是最近的文章、电子邮件或一些事故报告类型。在任何情况下,绘图1204中显示的信息都是新的,并且应该被插入到相联存储器1202中以便获得对主题的更好理解。
绘图1206示出用于将来自绘图1204的信息插入到相联存储器1202中的示例性程序。在有利实施例中,用户可以通过图形用户界面将新信息插入系统中。用户可以复制或者以其他方式将来自绘图1204的文本信息输入到所提供的空间中。有利实施例可以使用单一插入透视类型来添加数据,诸如插入透视1208。每个相联存储器1202可以具有一种插入透视类型1208,其可以起催化剂的作用并且为所有的其他透视提供反馈机制。
然后,插入透视1208中的信息被处理。新插入的信息可以被处理并且与系统中的当前信息同步。新插入信息变成相联存储器的一部分。
在这点上,如绘图1210中所示,可以从用户的透视角度组织或再组织信息。因此,可能在透视图中组织的最终数据可以帮助用户理解最初展示的信息。可以将结果分解为可快速解释的易于理解的词汇和术语。有利实施例可以以许多不同的方式分割该结果。
在有利实施例中,可以用具有插入标识的插入实体类型来分割这些结果。该被插入的信息可以被自动赋予一个值以便识别该信息。该值可以与系统内的其他插入实体类型一致。
也可以使用被插入信息的属性云值来分割这些结果。可能处于透视图中的这些值可以是与被插入信息相关联的属性。这些值可以通过供给在插入期间累积的一系列重要词汇而提供快速总结。
也可以使用可能处于透视图中的被插入信息的关联实体值来分割这些结果。这些值可以是与被插入信息相关联的实体。这些值可能类似于上述属性,除了这些值可以载有比实体更大的权重。视需要或期望,用户可以搜索这些值的全部或部分。
也可以使用可能处于透视图中的被插入信息的关联关键词值来分割这些结果。这些值可以是与被插入信息相关联的关键词。这些值可能类似于上述属性,除了其可以载有比关键词更大但小于实体的权重。
也可以使用可能处于透视图中的被插入信息的实体种类的关联值来分割这些结果。这些值可以是与被插入信息相关联的实体,并且可以共享相同的种类值。这些值可以类似于上述属性,除了其可能载有比实体更大的权重。用户也可以搜索这些值。
也可以使用可能处于透视图中的底层源数据的示出片断来分割这些结果。该特征可以向用户提供属于被插入信息的资源快照。在该情况下,所显示的是属性、实体和关键词的来源的位置。在有利实施例中,可以仅示出数据的摘要片段。
也可以由可能处于透视图中的其他实体值如被插入信息来分割这些结果。这些值可以共享与被插入信息相同的属性。该特征可以给予用户快速定位如插入的值那样的值的能力。有利实施例可以通过相似性对这些值归类和排序,将最相似的置于顶部。
现在关注使用中的另一有利实施例。首先,向用户展示新的未构造信息。该新的未构造信息可以采用许多形式。例如,新的未构造信息可以是事故报告。
然后,可以向用户分配调查最近发现的新信息的任务。例如,可以向用户分配检查关于飞行中的现象的最近发布的事故报告的任务。
然后,用户将信息插入系统。例如,用户可以将事故报告输入相联存储器中以便获得对事故的更好理解。为了完成该任务,用户可以使用如绘图1206中所示的图形用户界面将事故报告复制和粘贴到系统中。
作为代替,用户可以促使相联存储器1202使用多种分析能力来产生涉及用户请求的大范围实体分析结果。通常,相联存储器1202可以通过预定义通道来处理引入的数据。在有利实施例中,因为信息的动态性质,用户可以绕过正常的数据流进程。
然后,有利实施例可以动态地处理输入数据,并且向用户用公式表达其结果。如绘图1210中所示,有利实施例可以组织这些结果以能够作出快速决策。
然后,有利实施例可以返回从用户的透视角度组织的关联信息。然后,可以通过关注于对完成当前任务有用的必需或最期望的知识来作出快速、高效和正确的决策。
有利实施例可以借助于相联存储器技术来解决关于分析新获得的数据的问题。特别地,有利实施例可以向用户提供调查涵盖广度和深度的新的未构造数据的能力,以便作出快速和正确的决策。
例如,随机工程师可以获得描述在该随机工程师保养的飞机上之前夜间发生的飞行中现象事故的报告。随机工程师可能想要检查该报告,以试图理解发生了什么以及如何适当响应该现象。该随机工程师可能想要比较该事故和任何以前的相关现象,以确定是否存在对当前现象的通用解决方案。然而,使用相联存储器以快速方式精确研究该信息是非常困难的。
在以上所用的示例,该随机工程师可以采用以下行动。首先,随机工程师可以阅读报告。然后,随机工程师将定位该报告中的关键词,以最好地查询数据库或相联存储器,从而寻找历史数据。然后,随机工程师可以比较历史数据的关联性以形成决策。
然而,这些步骤存在许多缺点。首先,整个进程可能耗时并且不专门朝快速决策发展。第二,该进程可能倾向于错误,并且一定程度上依赖于读者的知识。第三,任何失误或错误的比较都将引导用户作出不正确或不完整的决策。
另外,当与相联存储器技术合作时,所建立的协议可能是首先收集数据,然后分析数据。在引入新数据的情况下,新数据必须首先被载入系统然后被处理以便使用。该事实使得分析师难以从不遵循正常自动数据流的报告获得直接结果。
有利实施例认识到这些和其他问题,并且令人满意地将其解决。关于图12所描述的有利实施例可以允许用户作出快速精明的决策,而不需要加入大量新引入数据。通过使用插入透视以输入数据,并且然后根据用户的透视来组织该数据,就可实现这些目标。
更具体地,有利实施例可以以首先提供最重要信息的方式组织新数据。该信息可以被浓缩和汇总,以便用户可以读几个词而非多个页。有利实施例也可以提供通常在大多数相联存储器插入技术中不能见到的透明度。作为代替,有利实施例可以清楚地识别插入的是什么、该插入物的状态以及从其分析推测的结果。
有利实施例的另一优点在于使用单个透视来插入数据。有利实施例可以以相同的方式插入所有数据,无论其性质如何。该特征可以起到相联存储器的单输入点的作用,因此降低对多个位置的错误或不完全插入。
图13是示出根据有利实施例的相联存储器中的错误的示例的表格。关于图13所描述的有利实施例可以论证一旦将数据引入相联存储器,如何不能改变该数据。
例如,表格1300可以代表存储在相联存储器1302中的数据和关系。然而,相联存储器不需要以图13所示的方式存储表格1300中所示的数据。表格1300或相联存储器1302可以采用非瞬态计算机可读存储介质的形式,诸如图16的永久存储器1608或计算机可读存储介质1624。表格1300或相联存储器1302中的数据可以由处理器如图16的处理器单元1904操作。图13例证了可以使用类似于关于图12所描述的那些程序来解决的表格1300中的错误。然而,一种区别可能在于新信息可以自动与其被添加到的原始实体相关联。
根据列1304和行1306组织表格1300。列1304代表不同的实体,例如仅代表活的有机体。因此,例如,列1308包含关于鲸的词条。
继而,行1306代表关于列1304所代表的实体的不同实体关系。因此,例如,行1310可以涉及在列1304中展示的活实体的分类。
现在关注表格1300中的错误。单元1312对应于列1308和行1310的交集,这意味着单元1312应该包含活有机体“鲸”(列1308)的分类类型(行1310)。单元1312中的数据指示“鲸”为“鱼类”。该词条不正确,因为鲸应该被正确地分类为哺乳动物。一旦发现该错误,用户可能希望更新表格1300和/或相联存储器1302,以便“鲸”的正确分类被正确地展示。
可以使用类似于关于图12所描述的那些程序来修正该类型错误,一种区别可能在于新插入的信息可以自动与其被添加到的原始实体相关联。然而,首先关注为什么这种错误修正对于相联存储器1302来说不是微不足道的。
有利实施例可以解决相联存储器工作流问题。一旦信息如单元1312中的错误数据处于相联存储器1302中,就没办法调整系统中的该信息的外部分析。结果,该错误可能非常难以纠正。
有利实施例可以提供允许用户插入关于错误数据的额外信息的反馈机制。一旦被引入,新信息就立刻改变数据的联系,并且因此提供与用户想要看到的结果更匹配的结果。
例如,考虑图13的单元1312中所示的错误。每当再次检查该顺序时,用户都可能发现该错误。该错误将持续发生,直到用户(通常为管理员)固定全部相联存储器1302。然而,固定全部相联存储器1302可能是非微不足道的耗时的过程。
除了固定全部相联存储器1302之外,用户几乎没有选项。用户可以维持信息不变,但是每个其他用户都可能重新发现该问题。该技术可能不高效使用资源,并且可能非常耗时。
用户可以通过不同的手段如口头或书写就其有意施加到相联存储器1302上的信息进行彼此通信。然而,该技术分割信息,将一部分信息保存在存储器中,另一部分保存在其他地方。当检索该信息时,该技术可能是混乱的。
用户能够依靠例如公众知识、行业标准或常识,以便其他用户能够认识错误的真实性质。例如,鲸不是鱼类而是哺乳动物的事实是公众知识。然而,该技术可以假定每个人都共享相同的公众知识、行业标准或常识。不幸的是,该假定不总是有效的。
所有这些技术都未能精确解决工作流问题。然而,有利实施例可立刻将用户输入合并到系统中,以便每个人都能够立刻调整他或她的知识。用户输入可以采用以下形式,即修正、额外细节、解释、相关工作经验、符号、图片、音频文件或任何其他数据。
新信息也可以被称为添加信息。该添加信息可以与原始实体和为用户阐明的结果动态相关联。可以使用上面关于图12所描述的技术来执行这些程序。
在有利实施例中,系统可以首先提供对添加信息的分析,允许用户比较添加信息和类似于添加信息的其他实体。然后,用户可以返回操纵原始实体,并且观察从添加信息产生的更新联系。随后,用户或计算机程序可以通过关注完成当前任务所需或所期望的知识而作出快速决策。此外,其他用户可以调整添加信息,因为添加信息现在是系统的一部分。添加信息可以被分类,从而首先出现添加信息,由此允许其他用户快速获得添加信息的益处。
现在返回关注图12,虽然现在使用绘图来论证关于图13所描述的错误修正或信息修改。在有利实施例中,用户可以添加新信息,诸如修正图13的单元1312中的错误。如图12的绘图1206所示,用户可以通过图形用户界面添加新信息。特别地,用户可以通过图12的插入透视1208添加新信息。
然后,该系统可以使用单个插入透视类型来添加数据。如上所述,每个相联存储器可以具有一种插入透视类型,其可以起催化剂的作用并且向所有的其他透视提供反馈机制。该插入透视可以使得能够插入。
在有利实施例中,新添加的信息可以由该系统来处理。特别地,该系统可以使新添加的数据与系统中的当前数据同步。因此,新添加的数据可以变成相联存储器的一部分。
然后,该系统提供返回原始实体的链接。以此方式,用户可以返回操纵并且观察从附加信息产生的更新联系。可以在图12的绘图1210中观察该信息。
绘图1210也可以包括插入信息的快照。在另一个有利实施例中,可以首先在绘图1210中显示最近添加的数据。
在有利实施例中,可以从用户透视角度重新组织该新信息。以熟悉方式组织的最终数据可以帮助用户理解新添加的信息。这些结果可以被细分或分类为用户能够快速解释的易于理解的词汇或术语。
因此,有利实施例可使得用户能够向现有实体添加新信息。一旦添加,该信息就变为实体本身,允许用户以和其他信息相同的方式分析该新信息。
然而,一种区别可能在于该新信息可以自动与新信息被添加到的原始实体相关联。该特征可以允许用户返回操纵该新信息,以便了解添加信息已对原始实体造成什么样的影响。用户可以通过更新存储器的数据计划和编程界面来指派附加的预定联系。
因此,有利实施例可以提供适应动态决策的完整工作流。有利实施例可以允许用户插入属于实体的新信息,而不扰乱相联存储器或决策进程的流程。此外,有利实施例可以将用户的输入立刻合并到系统中。一旦引入,新信息就可传遍整个系统,并且可立刻由每个人使用。
图14是示出一种根据有利实施例动态更新相联存储器的进程的流程图。图14中所示的进程1400可以在模块、系统或数据处理系统如图1的系统100、图2的系统200或图16的数据处理系统1600中实施。关于图14所描述的进程1400可以以存储计算机可读代码的非瞬态计算机可读存储介质的形式来实施,该计算机可读代码在被处理器实施时可以执行关于图14所描述的方法。虽然图14的操作被描述为由“系统”实施,但是进程1400不限于由图1和图2的系统实施,而是也可以由可能在分布式环境或网络环境中的一个或更多个真实或虚拟数据处理系统来实施。进程1400可以使用硬件、软件或其组合来实施。
进程1400可以开始于系统促使用户获得大型域内的知识(操作1402)。该操作是可选的。例如,用户可以基于用户自身的主动性决定执行该任务,或者可以由一些其他人将该任务给予该用户。该任务可以采用任何形式。然而,在非限制性示例中,该任务可以采用获得关于涉及汽车类型的报告的信息的形式。
然后,系统可以接收针对数据的用户请求(操作1404)。在有利实施例中,为了获得对当前主题的更好理解,用户可以请求特定的信息。例如,可以向用户分配获得关于汽车报告的知识的任务。因此,系统可接收关于汽车报告的识别数目的用户输入。
然后,系统可以返回关于用户请求的信息(操作1406)。该返回信息可基于对相联存储器的查询,该查询基于用户输入。一旦检查,用户就可以判定返回的信息不足以满足用户用途。结果,为了获得更好的结果,系统可以从用户透视接收额外信息形式的额外用户输入。
然后,用户可以确定是否应将新信息或更新信息添加至返回数据。结果,系统可以接收关于返回数据的新信息或更新信息(操作1408)。该新信息或更新信息可以是修正、进一步分析或额外细节。例如,用户可能期望向获得的结果添加汽车召回分析以便关联性。召回分析可引用与汽车报告相关联的直接信息。
可选地,然后系统可以绕过正常的数据流(操作1410)。系统可以绕过正常的数据流进程,是因为信息的动态性质以及信息与当前实体的直接相关性。
然后,系统可以产生关于用户请求的实体分析结果(操作1412)。在有利实施例中,系统可以特别使用相联存储器的多种分析能力来产生大范围的结果。如果已在操作1410中使用正常的数据流,则系统可能已经通过限制所获得的结果的预定义通道来处理用户请求。
然后,系统可以动态处理新信息或更新信息(操作1414)。在一些情况下,术语“动态处理新信息或更新信息”可能意味着相联存储器使新信息或更新信息与原始实体相关联,并且然后系统可以用公式为用户表达结果。可以根据本文别处(例如但不限于图4、图7、图12、图13和图15)所描述的有利实施例显示用公式表达的结果。
然后,系统可以返回添加信息的分析(操作1416)。然后,用户可以比较新信息或更新信息与其他类似实体。然后,用户可以返回操纵原始实体并且观察由新信息或更新信息产生的更新联系。
可选地,然后系统可以促使用户进入所作的任何决策(操作1418)。从用户可在系统外采取一些行动的意义上来说,该操作可以是可选的。例如,用户可以通过仅关注于与完成当前任务最相关的知识而作出关于该任务的快速决策。
同样可选地,其他用户可以调整新信息或更新信息(操作1420)。其他用户能够调整新信息或更新信息,是因为它现在是相联存储器的一部分。新信息或更新信息可以被分类,以便首先出现新信息或更新信息。以此方式,其他用户可以快速利用新信息或更新信息所提供的优点。
例如,系统可以接收针对数据的新请求(操作1422)。然后,系统可以使用相联存储器处理针对数据的新用户请求(操作1424)。然后,系统可以返回新关联信息(操作1426)。可选地,系统可以促使用户输入决策(操作1428)。然而,该决策可以在系统外部作出。然后,进程可以终止。
图15是根据有利实施例示出源于查询相联存储器的结果的结果的工作表视图。在有利实施例中,工作表1500可以是示出向用户显示的结果的工作表。该结果可以是在相联存储器上执行的查询。工作表1500可以使用相联存储器如图1 的相联存储器102或本文所述的任何其他相联存储器来实施。也可以使用图1的系统100来实施工作表1500。可以使用图16的数据处理系统1600来产生、显示、打印以及以其他方式管理工作表1500。工作表1500可以是相联存储器中的数据的替换视图。在一些有利实施例中,工作表1500可以代表向用户展示的图形用户界面。
申请人首先阐述工作表1500为什么代表超过用于在查询相联存储器时显示搜索结果的当前技术的优点。当搜索解决方案的问题域时,用户倾向于缩小其对当前透视的关注。结果,用户可能未注意到可能存在更广泛的问题和解决方案。
例如,搜索车辆上的特定配线改进的解决方案的工程师可能未注意到关于车辆的全年生产可执行的较大改进,或者可能需要在特定的车辆工厂位置处执行较大改进。作为代替,通过仅关注配线改进的特定情况,在注意到从初始调查起不明显的图案之前,工程师可能多次返回到该问题。在每次返回后,工程师都要花费不必要的时间来尝试在不同车辆上执行相同程序,只是认识到该问题比最初感觉的要大的多。
即使对于广为人知的问题,也可能出现该偶然事件,因为一些人倾向于如此密切地关注当前问题。用户可能多次忽略可能在稍晚的时间才能事后明显的问题。例如,在特定工厂的重复配线改进可以比其他工厂执行得更快。长期调查之后,将该改进追踪到未预料其配线程序的单个电工。因此,事后提高所有工厂的配线改进速度的方法将是向该单个电工的未预料的配线程序学习。然而,程序的变化在其他方面将不明显,而一些其他原因可能归因于工厂设备的成功。
为了寻找和突出开始时不明显但事后可能明显的潜在趋势,有利实施例可以考虑这些事项,并且提供系统的呈现信息的方式。示例性程序可能如下。
首先,可以向用户分配在大型域内获得关于问题的知识的任务。然后,为了获得对当前主题的更好理解,用户可以描述该问题。例如,可以向机修工分配获得关于改进汽车的前部线圈弹簧的知识的任务。机修工可以使用图形用户界面来输入描述该问题的信息。
用户可以使用相联存储器技术来合并多种分析能力,从而产生关于卷簧问题的大范围实体分析结果。然后,有利实施例可以显示结果并且用公式向用户表达该结果。有利实施例可以将结果组织成两类,即实体类型联系和所有的联系。这些联系可以向用户提供帮助其决策的有价值信息。
有利实施例可以返回一系列实体类型结果,其来源包含与问题描述中的术语匹配的属性。例如,如果用户想要定位“前部组件”的零件,则返回的列表将包含具有匹配术语“前部”或“组件”或其两者的那些零件。
有利实施例也可返回一系列所有实体类型结果。这些结果可以向用户提供可能不明显的有价值信息。可以向用户提供用户不知道询问的有价值信息。例如,如果用户想要定位前部组件的零件,返回列可以不仅包含零件,而且也包含其他实体如型号、操作者等。该特征是有价值的,因为该特征迫使用户注意用户的透视角度之外,从而了解是否有更广泛的问题和/或更好的解决方案或方法。结果,用户可以通过仅获得完成当前任务所需的必要数据来作出快速决策。
在有利实施例中,用户可以开始在透视1501中输入问题描述。该描述的一部分或全部都可以在工作表1500的标题中出现,诸如标题1502。可替换地,标题1502可以涉及任何信息,而不必是问题描述。可以存在一个或更多个输入段。例如,在图15所示的有利实施例中,输入段可以是要求输入段1504、可选输入段1506以及排除输入段1508。对于该示例,用户可以选择“线圈”作为要求项,并且选择“弹簧”、“前部”和“轮胎”作为可选项。用户可以对这些段进行试验,以确定搜索项的哪种组合可以产生用户感知的最佳结果。如上所述,可以出现更多或更少的输入段,并且输入到该输入段中的一些、没有或所有信息可以出现在标题1502中。
要求输入段1504也可以被用于输入关于使用打开属性查询语言执行查询的要求信息。“要求信息”是关于用户对给定搜索“要求”什么的理解而确定的,并且不限于这些有利实施例。这些值可以是问题描述中的要求术语。在要求输入段1504中输入的信息可以严格匹配,以便朝着相关结果计数。
可选输入段1506可以被用于输入可选信息。在可选输入段1506中输入的值可以是问题描述中的可选项。术语“可选”是关于用户对给定搜索“可选”什么的理解而确定的,并且不限于这些有利实施例。在可选输入段1506中输入的信息可以不要求严格匹配,以便朝着相关结果计数。相反,如果用户输入多个项,每个项被独立评估。
排除输入段1508可以被用于输入将从查询中排除的信息。因此,在排除输入段1508中输入的值可以代表问题描述中的排除项。术语“排除”是关于用户对给定搜索“排除”什么的理解而确定的,并且不限于这些有利实施例。在排除输入段1508中输入的信息可以排除来自结果列表的答案,其中结果的属性列表包含一个或更多个这些项。
可以出现更多或更少的输入段。例如,为了接收指令以执行相联存储器的查询,可以提供附加输入段。因此,例如,选择或以其他方式启动附加输入段可以被用于开始关联搜索。
在图15所示的示例中,本发明返回的结果可以被划分为两类。第一种类可以是关联报告1510,其对应于预选透视。关联报告可以显示一系列报告,其中每个报告中的属性都匹配原始问题描述。在这点上,用户可以调查每个报告,以确定用户是否获得对当前任务的一些洞察。
第二种类可以是关联信息1512。关联信息1512可以提供用户可能未想搜索的附加信息。进一步调查显示,制造商改进了该产品的9-3型号1514,这是由于其改进的线圈弹簧导致的。调查每个报告后,该事实对用户来说或许将变得明显。然而,第二种类中提供的可见性显示问题描述与9-3型号1514的属性高度相关。
该结论暗示,关于当前任务的真实问题可能在整个9-3型号1514系列中,而非仅在几个报告中。当确定如何改进当前型号时,通过在作出快速精明的决策时向用户提供更好的信息,该知识可以节省用户大量的时间。
另外,关联信息1512可以显示存在于期望实体和相联存储器内的所有其他实体之间的不明显关系。这些关系中的许多关系可以产生正相关,这可能通过唤起对潜在较大问题的注意而令大多数用户惊讶。
因此,有利实施例可以提供系统和统一的方法来识别解决方案,即使对存在于用户的直接透视之外的那些也是如此。有利实施例也可以向用户提供其“未请求”的信息,允许用户得出先前未考虑的结论。有利实施例也可以向用户呈现不明显关系,这进而帮助用户更好地理解整个问题域。
工作表1500可以具有其他优点。例如,有利实施例可以解决用户选择的预定透视内的问题,而是在所有透视中显示结果。有利实施例可以仅显示对用户请求来说重要的关键方面,这由用户选择,并且“关键”和“重要”由用户确定。有利实施例可以提供获得作出快速决策所用的信息的快捷方式。有利实施例可以执行多个实体分析任务,并且在显示屏上的一个位置显示所有结果。有利实施例不需要是针对特定域的。有利实施例可以独立于平台并且是便携的。有利实施例可以是灵活的,体现在有利实施例可以允许用户节约和移除工作表。有利实施例不限于上文所述。
现在参考图16,其根据有利实施例示出数据处理系统。图16中的数据处理系统1600是可以用于实施有利实施例的数据处理系统的示例,诸如图1的系统100或本文公开的任何其他模块或系统或进程。在该说明性示例中,数据处理系统1600包括通信组织1602,其在处理器单元1604、存储器1606、永久存储器1608、通信单元1610、输入/输出(I/O)单元1612以及显示器1614之间提供通信。
处理器单元1604用于执行可被加载到存储器1606中的软件的指令。取决于具体的实施方式,处理器单元1604可以是许多处理器、多处理器核或一些其他类型的处理器。在此使用的“许多”在涉及物件时意味着一个或更多个物件。此外,可以使用许多异类处理器系统来实施处理器单元1604,其中主处理器与二级处理器在单个芯片上出现。作为另一个说明性示例,处理器单元1604可以是对称多处理器系统,其包含多个相同类型的处理器。
存储器1606和永久存储器1608是存储设备1616的示例。存储装置是能够存储信息的任何硬件块,该信息例如但不限于数据、功能形式的程序代码和/或在暂时和/或永久基础上的其他合适的信息。在这些示例中,也可将存储设备1616称为计算机可读存储设备。在这些示例中,存储器1606可以是例如随机读取存储器或任何其他合适的易失性或非易失性存储设备。取决于具体的实施方式,永久存储器1608可以采用各种形式。
例如,永久存储器1608可以包含一个或更多个组件或设备。例如,永久存储器1608可以是硬盘驱动器、闪存、可擦写光盘、可擦写磁带或上述对象的一些组合。永久存储器1608使用的介质也可以是可移除的。例如,可移除的硬盘驱动器可以用于永久存储器1608。
在这些示例中,通信单元1610提供与其他数据处理系统或设备的通信。在这些示例中,通信单元1610为网络接口卡。通信单元1610可以通过使用物理或无线通信链路或其两者来提供通信。
输入/输出单元1612允许用可被连接至数据处理系统1600的其他设备输入和输出数据。例如,输入/输出单元1612可以提供便于用户通过键盘、鼠标和/或一些其他适当的输入设备进行输入的连接。此外,输入/输出单元1612可以向打印机发送输出。显示器1614提供向用户显示信息的机构。
操作系统的指令、应用程序和/或程序可以位于通过通信组织1602与处理器单元1604通信的存储设备1616中。在这些说明性示例中,指令在永久存储器1608上为功能形式。可以将这些指令加载到存储器1606中,以便由处理器单元1604处理。不同实施例的进程可以由处理器单元1604使用计算机可执行指令来执行,所述计算机可执行指令可以位于存储器例如存储器1606中。
这些指令被称为程序代码、计算机可用程序代码或计算机可读程序代码,其可以由处理器单元1604中的处理器读取和执行。不同实施例中的程序代码可以在不同的物理或计算机可读存储介质如存储器1606或永久存储器1608中具体化。
程序代码1618以功能形式位于计算机可读介质1620中,其可以被选择性地移除并且可以被加载或传送至输出处理系统1600以便由处理器单元1604执行。在这些示例中,程序代码1618和计算机可读介质1620形成计算机程序产品1622。在一个示例中,计算机可读介质1620可以是计算机可读存储介质1624或计算机可读信号介质1626。计算机可读存储介质1624可以包括例如光盘或磁盘,其被插入或放置在作为永久存储器1608的一部分的驱动器或其他设备中,以便传送到作为永久存储器1608的一部分的存储设备如硬盘驱动器上。计算机可读存储介质1624也可以采用永久存储器的形式,例如硬盘驱动器、拇指碟或闪存,其被连接至数据处理系统1600。在一些情况下,计算机可读存储介质1624可以不是能够从数据处理系统1600移除的。
可替换地,可以使用计算机可读信号介质1626将程序代码1618传送至数据处理系统1600。计算机可读信号介质1626可以是例如包含程序代码1618的传播数据信号。例如,计算机可读信号介质1626可以是电磁信号、光学信号和/或任何其他适当类型的信号。可以通过通信链路如无线通信链路、光纤光缆、同轴电缆、电线和/或任何其他适当类型的通信链路来发送这些信号。换句话说,在说明性示例中,通信链路和/或连接可以是物理的或无线的。
在一些有利实施例中,可以通过计算机可读信号介质1626从其他设备或数据处理系统经网络将程序代码1618下载至永久存储器1608,以便在数据处理系统1600中使用。例如,可以通过网络将存储在服务器数据处理系统中的计算机可读存储介质中的程序代码从服务器下载至数据处理系统1600。提供程序代码1618的数据处理系统可以是服务器计算机、客户端计算机或者能够存储和发送程序代码1618的一些其他设备。
为数据处理系统1600示出的不同组件并不意味着对可以实施不同实施例的方式提供架构限制。不同的有利实施例可以在包括附加于或替换数据处理系统1600的那些示出组件的组件的数据处理系统中实施。图16中所示的其他组件可以与示出的说明性示例不同。可以使用能够运行程序代码的任何硬件设备或系统来实施不同的实施例。作为一个示例,数据处理系统可以包括与无机组件集成的有机组件,和/或可以完全由排除人类的有机组件组成。例如,存储设备可以由有机半导体组成。
在另一说明性示例中,处理器单元1604可以采用硬件单元的形式,其具有被制造或配置用于特殊用途的电路。该类型的硬件可以执行操作,而不需要将程序代码从存储装置加载到存储器中以被配置为执行操作。
例如,当处理器单元1604采用硬件单元的形式时,处理器单元1604可以是电路系统、专用集成电路(ASIC)、可编程逻辑器件或被配置为执行许多操作的一些其他适当类型的硬件。通过可编程逻辑器件,该设备被配置为执行许多操作。该设备可以随后被重新配置或者被永久配置为执行许多操作。可编程逻辑器件的示例包括例如可编程逻辑阵列、可编程阵列逻辑、现场可编程逻辑阵列、现场可编程门阵列以及其他适当的硬件设备。通过该类型的实施方式,可以省略程序代码1618,因为不同实施例的进程在硬件单元中实施。
在又一个说明性示例中,处理器单元1604可以使用在计算机和硬件单元中发现的处理器组合来实施。处理器单元1604可以具有许多硬件单元和许多处理器,其被配置为运行程序代码1618。通过该描述的示例,可以在许多硬件单元中实施一些进程,而可以在许多处理器中实施其他进程。
作为另一个示例,数据处理系统1600中的存储设备是可以存储数据的任何硬件装置。存储器1606、永久存储器1608以及计算机可读介质1620是有形形式的存储设备的示例。
在另一示例中,总线系统可以被用于实施通信组织1602,并且可以包括一个或更多个总线,例如系统总线或输入/输出总线。当然,总线系统可以使用任何适当类型的体系架构来实施,其提供在附连到总线系统的不同组件和设备之间的数据传送。另外,通信单元可以包括用于发送和接收数据的一个或更多个设备,例如调制解调器或网络适配器。此外,存储器例如可以是存储器1606或高速缓冲存储器,例如可在存在于通信组织1602中的接口和内存控制集线器中发现的存储器。
不同的有利实施例可以采用全部硬件实施方式、全部软件实施方式或者包含硬件或软件元件的实施方式。一些实施例是在软件中实施的,其包括但不限于诸如固件、常驻软件和微代码的形式。
此外,不同的实施例可以采用计算机程序产品的形式,该计算机程序产品可以从提供用于或连接执行指令的计算机或任何装置或系统的程序代码的计算机可用或计算机可读媒体访问。为了本公开的目的,计算机可用或计算机可读介质通常可以是任何有形装置,其可以包含、存储、通信、传播或传送由指令执行系统、装置或设备使用或与其连接的程序。
计算机可用或计算机可读介质可以是例如但不限于电子系统、磁系统、光系统、电磁系统、红外系统或半导体系统或者传播介质。计算机可读介质的非限制性示例包括半导体或固态存储器、磁带、可移除计算机磁碟、随机存取存储器(RAM)、只读存储器(ROM)、硬磁盘以及光盘。光盘可以包括高密度磁盘-只读存储器(ROM)、高密度磁盘-读/写(CD-R/W)以及DVD。
此外,计算机可用或计算机可读介质可以包含或存储计算机可读或可用程序代码,以便当在计算机上执行计算机可读或可用程序代码时,该计算机可读或可用程序代码的执行促使计算机经由通信链路传送另一计算机可读或可用程序代码。该通信链路可以使用例如但不限于物理或无线媒体的媒体。
适用于存储和/或执行计算机可读或计算机可用程序代码的数据处理系统将包括一个或更多个处理器,其直接耦合至存储器元件或通过通信组织如系统总线间接耦合至存储器元件。存储器元件可以包括实际执行程序代码期间使用的局部存储器、大容量存储器以及高速缓冲存储器,其提供对至少一些计算机可读或计算机可用程序代码的暂时存储,以减少执行代码期间可能从大容量存储器检索代码的次数。
输入/输出或I/O设备能够被直接或通过中介I/O控制器耦合至系统。这些设备可以包括例如但不限于键盘、触摸屏显示器以及定点设备。不同的通信适配器也可以被耦合至系统,以通过中介私人或公共网络使得数据处理系统变得耦合至其他数据处理系统或远程打印机或存储设备。非限制性示例为调制解调器,并且网络适配器仅为一些当前可用的通信适配器类型。
因此,有利实施例解决了搜寻大量数据中的关系的问题,从而作出关于具体情况的特定决策。有利实施例利用相联存储器技术来执行此类任务。
有利实施例可利用透视或视图(包括插入透视)来寻找有效关系,如关于图1至图16 所示。有利实施例可被用于发现和/或解决相联存储器内的歧义数据,如关于图1至图5所示。有利实施例可被用于呈现相联存储器内的结果或其他数据的透视图,如关于图6至图8所示。有利实施例可被用于寻找和显示资源累积,如关于图9至图10所示。有利实施例可描述用于快速决策的相联存储器的插入透视,如关于图11至图12所示。有利实施例可被用于快速有效地发现和解决相联存储器内的错误,如关于图13至图14所示。有利实施例可被用于显示源自查询相联存储器的结果的结果的工作表视图,如关于图15所示。有利实施例可以具有很多其他的用法和应用。
为了图解和说明的目的,已经展示了对不同有利实施例的描述,并且其不希望是穷尽的或局限于所公开形式的实施例。本领域技术人员将明白许多修改和变化。此外,不同的有利实施例与其他有利实施例相比可以提供不同的优点。所选择的一个或更多个实施例被选择和描述以便最好地解释实施例的原理、实际应用,并且使得本领域其他技术人员能够理解本公开,因为具有各种修改的各种实施例适合于期望的特殊用途。

Claims (15)

1.一种用于管理相联存储器的系统,其包括:
所述相联存储器,其包括多个数据和所述多个数据之间的多个联系,其中所述多个数据被收集在关联组中,并且其中所述相联存储器被配置为基于所述多个数据之间的至少一种关系而被查询,所述至少一种关系选自除所述多个数据之间的直接相关之外还包括直接和间接关系的群组;
输入模块,其被配置为接收所述相联存储器的第一透视内的值,其中所述第一透视包括所述多个数据内的数据组的第一背景选择;
查询模块,其被配置为使用所述值执行所述相联存储器的打开查询,其中所述查询模块被进一步配置为在所述相联存储器的插入透视和第二透视中的至少一个中执行所述打开查询,其中所述插入透视包括被配置为被反馈到所述相联存储器中的透视类型,其中所述第二透视包括所述数据组的第二背景选择,并且其中所述插入透视和所述第二透视中的所述至少一个相对于所述第一透视具有针对所述值的同样多或更多的种类联系;以及
显示模块,其被配置为显示所述查询的结果,其中所述显示模块被进一步配置为显示由所述打开查询产生的一列一个或更多个潜在歧义,
其中所述第二透视的显示包括:
包括种类和所述值的第一节段,
包括与所述值相关联的属性云值的第二节段,
包括所述值的实体值的第三节段,
包括与所述值相关联的关键词值的第四节段,
包括与所述值相关联的一个或多个种类中的一个或多个种类值的第五节段,
包括与所述值相关联的内容的一个或多个文本或图形部分的第六节段,以及
包括与所述值类似的实体值的第七节段。
2.根据权利要求1所述的系统,其中所述一个或更多个潜在歧义包括所述值的多个匹配属性。
3.根据权利要求2所述的系统,其中所述值包括第一数字,并且其中所述多个匹配属性包括匹配所述值的第一属性和匹配所述值的第二属性,其中所述第一属性包括与所述第一数字相关联的第一种类,其中所述第二属性包括与所述第一数字相关联的第二种类,并且其中就用户或计算机程序所知,仅通过检查所述第一数字不能做出所述第一数字应属于所述第一种类或所述第二种类的确定。
4.根据权利要求2所述的系统,其中所述值包含字母数字字符集和特殊字符集中的至少一个,其中所述特殊字符包括标点符号、符号、图片和选自使用非字母字符的语言的字符中的至少一种。
5.根据权利要求3所述的系统,其中所述显示模块被进一步配置为显示所述第一种类的第一种类名称和所述第二种类的第二种类名称。
6.根据权利要求3所述的系统,其中所述显示模块被进一步配置为提供与所述第一种类相关联的第一链接以及与所述第二种类相关联的第二链接,其中所述第一链接指向与所述第一种类相关联的第一信息,并且其中所述第二链接指向与所述第二种类相关联的第二信息。
7.根据权利要求1所述的系统,其中使用打开属性查询语言搜索来执行所述查询。
8.根据权利要求3所述的系统,其中当执行所述确定时,因为所述第一种类和初始种类名称之间存在差异而产生所述一个或更多个潜在歧义。
9.一种用于管理相联存储器的计算机实施的方法,包括:
接收所述相联存储器的第一透视内的值,其中所述第一透视包括多个数据中的数据组的第一背景选择,其中所述相联存储器包括多个数据和所述多个数据之间的多个联系,其中所述多个数据被收集在关联组中,并且其中所述相联存储器被配置为基于所述多个数据之间的至少一种关系而被查询,所述至少一种关系选自除所述多个数据之间的直接相关之外还包括直接和间接关系的群组;
使用所述值执行所述相联存储器的打开查询,其中在所述相联存储器的插入透视和第二透视中的至少一个中执行所述打开查询,其中所述插入透视包括被配置为被反馈到所述相联存储器中的透视类型,其中所述第二透视包括所述数据组的第二背景选择,并且其中所述插入透视和所述第二透视中的至少一个相对于所述第一透视具有针对所述值的同样多或更多的种类联系;以及
显示所述查询的结果,包括显示由所述打开查询产生的一列一个或更多个潜在歧义,
其中所述第二透视的显示包括:
包括种类和所述值的第一节段,
包括与所述值相关联的属性云值的第二节段,
包括所述值的实体值的第三节段,
包括与所述值相关联的关键词值的第四节段,
包括与所述值相关联的一个或多个种类中的一个或多个种类值的第五节段,
包括与所述值相关联的内容的一个或多个文本或图形部分的第六节段,以及
包括与所述值类似的实体值的第七节段。
10.根据权利要求9所述的计算机实施的方法,其中所述一个或更多个潜在歧义包括所述值的多个匹配属性。
11.根据权利要求10所述的计算机实施的方法,其中所述值包括第一数字,并且其中所述多个匹配属性包括匹配所述值的第一属性和匹配所述值的第二属性,其中所述第一属性包括与所述第一数字相关联的第一种类,其中所述第二属性包括与所述第一数字相关联的第二种类,并且其中就用户或计算机程序所知,仅通过检查所述第一数字不能做出所述第一数字应属于所述第一种类或所述第二种类的确定。
12.根据权利要求10所述的计算机实施的方法,其中所述值包含字母数字字符集和特殊字符集中的至少一个,其中所述特殊字符包括标点符号、符号、图片和选自使用非字母字符的语言的字符中的至少一种。
13.根据权利要求11所述的计算机实施的方法,其中显示还包括显示所述第一种类的第一种类名称和所述第二种类的第二种类名称。
14.根据权利要求11所述的计算机实施的方法,其中显示还包括提供与所述第一种类相关联的第一链接和与所述第二种类相关联的第二链接,其中所述第一链接指向与所述第一种类相关联的第一信息,并且其中所述第二链接指向与所述第二种类相关联的第二信息。
15.根据权利要求9所述的计算机实施的方法,其中执行所述打开查询包括使用打开属性查询语言搜索来执行所述打开查询。
CN201210260005.9A 2011-07-25 2012-07-25 定位数据中的歧义 Active CN102902705B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/190,212 US8521769B2 (en) 2011-07-25 2011-07-25 Locating ambiguities in data
US13/190,212 2011-07-25

Publications (2)

Publication Number Publication Date
CN102902705A CN102902705A (zh) 2013-01-30
CN102902705B true CN102902705B (zh) 2017-07-18

Family

ID=46717712

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210260005.9A Active CN102902705B (zh) 2011-07-25 2012-07-25 定位数据中的歧义

Country Status (5)

Country Link
US (2) US8521769B2 (zh)
EP (1) EP2551782A1 (zh)
JP (1) JP5943756B2 (zh)
CN (1) CN102902705B (zh)
CA (1) CA2779180C (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8285719B1 (en) 2008-08-08 2012-10-09 The Research Foundation Of State University Of New York System and method for probabilistic relational clustering
US8521769B2 (en) 2011-07-25 2013-08-27 The Boeing Company Locating ambiguities in data
US8527695B2 (en) * 2011-07-29 2013-09-03 The Boeing Company System for updating an associative memory
US10467235B2 (en) * 2013-04-11 2019-11-05 The Boeing Company Identifying contextual results within associative memories
DE112017005229T5 (de) 2016-11-11 2019-07-11 Eaton Intelligent Power Limited Magnetventilbaugruppe mit Vorsteuerdrucksteuerung

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1533163A (zh) * 2003-03-24 2004-09-29 电子节目指南数据的自由文本和属性搜索
CN101785002A (zh) * 2007-07-09 2010-07-21 谷歌公司 解释本地搜索查询

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5365430A (en) 1991-06-25 1994-11-15 At&T Bell Laboratories Method for parsing images
AU674189B2 (en) 1993-02-23 1996-12-12 Moore North America, Inc. A method and system for gathering and analyzing customer and purchasing information
JP2001282595A (ja) * 2000-03-31 2001-10-12 Casio Comput Co Ltd サーバ装置、データベース検索方法及び記録媒体
US7376618B1 (en) 2000-06-30 2008-05-20 Fair Isaac Corporation Detecting and measuring risk with predictive models using content mining
US7027974B1 (en) 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
US6925460B2 (en) 2001-03-23 2005-08-02 International Business Machines Corporation Clustering data including those with asymmetric relationships
US7194483B1 (en) 2001-05-07 2007-03-20 Intelligenxia, Inc. Method, system, and computer program product for concept-based multi-dimensional analysis of unstructured information
US6978264B2 (en) * 2002-01-03 2005-12-20 Microsoft Corporation System and method for performing a search and a browse on a query
US20030154071A1 (en) 2002-02-11 2003-08-14 Shreve Gregory M. Process for the document management and computer-assisted translation of documents utilizing document corpora constructed by intelligent agents
US6993288B2 (en) 2002-07-17 2006-01-31 The Boeing Company Managing satellite fixed beam uplink using virtual channel assignments
US20040024760A1 (en) 2002-07-31 2004-02-05 Phonetic Research Ltd. System, method and computer program product for matching textual strings using language-biased normalisation, phonetic representation and correlation functions
US7769628B2 (en) 2003-06-03 2010-08-03 The Boeing Company Systems, methods and computer program products for modeling uncertain future demand, supply and associated profitability of a good
EP1639459A2 (en) * 2003-06-13 2006-03-29 Equifax, Inc. Systems and processes for automated criteria and attribute generation, searching, auditing and reporting of data
US20050278362A1 (en) 2003-08-12 2005-12-15 Maren Alianna J Knowledge discovery system
US7711743B2 (en) * 2003-12-15 2010-05-04 Telecom Consulting Group N.E. Corp. Process and system that dynamically links contents of websites to a directory record to display as a combined return from a search result
US20090204507A1 (en) 2004-02-26 2009-08-13 Change Research Incorporated Method and system for discovering and generating an insight via a network
US8041713B2 (en) 2004-03-31 2011-10-18 Google Inc. Systems and methods for analyzing boilerplate
US20050222929A1 (en) 2004-04-06 2005-10-06 Pricewaterhousecoopers Llp Systems and methods for investigation of financial reporting information
US7617176B2 (en) * 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
US7478090B2 (en) 2005-01-14 2009-01-13 Saffron Technology, Inc. Methods, systems and computer program products for analogy detection among entities using reciprocal similarity measures
US20060224682A1 (en) 2005-04-04 2006-10-05 Inmon Data Systems, Inc. System and method of screening unstructured messages and communications
NO20052215L (no) * 2005-05-06 2006-11-07 Fast Search & Transfer Asa Fremgangsmate til bestemmelse av kontekstuell sammendragsinformasjon over dokumenter
US20070067320A1 (en) 2005-09-20 2007-03-22 International Business Machines Corporation Detecting relationships in unstructured text
US8073860B2 (en) * 2006-03-30 2011-12-06 Veveo, Inc. Method and system for incrementally selecting and providing relevant search engines in response to a user query
US7747605B2 (en) 2006-04-17 2010-06-29 Perry J. Narancic Organizational data analysis and management
US8015162B2 (en) 2006-08-04 2011-09-06 Google Inc. Detecting duplicate and near-duplicate files
US20090300482A1 (en) 2006-08-30 2009-12-03 Compsci Resources, Llc Interactive User Interface for Converting Unstructured Documents
US8326819B2 (en) 2006-11-13 2012-12-04 Exegy Incorporated Method and system for high performance data metatagging and data indexing using coprocessors
US20140188919A1 (en) 2007-01-26 2014-07-03 Google Inc. Duplicate document detection
US8161045B2 (en) 2007-02-01 2012-04-17 The Boeing Company Use of associate memory learning agent technology to identify interchangeable parts in parts catalogs
US20080313143A1 (en) * 2007-06-14 2008-12-18 Boeing Company Apparatus and method for evaluating activities of a hostile force
US8811596B2 (en) 2007-06-25 2014-08-19 The Boeing Company Apparatus including associative memory for evaluating audio communications
US8160981B2 (en) 2007-09-25 2012-04-17 Saffron Technology, Inc. Event-based anticipation systems, methods and computer program products for associative memories wherein times of future events occurring are predicted
WO2009061399A1 (en) 2007-11-05 2009-05-14 Nagaraju Bandaru Method for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US8086592B2 (en) 2007-11-30 2011-12-27 SAP France S.A. Apparatus and method for associating unstructured text with structured data
US20090204610A1 (en) 2008-02-11 2009-08-13 Hellstrom Benjamin J Deep web miner
US8126908B2 (en) 2008-05-07 2012-02-28 Yahoo! Inc. Creation and enrichment of search based taxonomy for finding information from semistructured data
US8214361B1 (en) * 2008-09-30 2012-07-03 Google Inc. Organizing search results in a topic hierarchy
US8266148B2 (en) 2008-10-07 2012-09-11 Aumni Data, Inc. Method and system for business intelligence analytics on unstructured data
US8671096B2 (en) 2008-10-24 2014-03-11 International Business Machines Corporation Methods and apparatus for context-sensitive information retrieval based on interactive user notes
US20100205198A1 (en) * 2009-02-06 2010-08-12 Gilad Mishne Search query disambiguation
US10410146B2 (en) 2009-02-09 2019-09-10 The Boeing Company Associative memory learning agent for analysis of manufacturing non-conformance applications
US9542436B2 (en) 2009-02-09 2017-01-10 The Boeing Company Employing associative memory for enhanced lifecycle management
US9053159B2 (en) 2009-02-09 2015-06-09 The Boeing Company Non-conformance analysis using an associative memory learning agent
US8335754B2 (en) 2009-03-06 2012-12-18 Tagged, Inc. Representing a document using a semantic structure
US8838490B2 (en) 2009-04-07 2014-09-16 The Boeing Company Associate memory learning for analyzing financial transactions
US20100268673A1 (en) 2009-04-16 2010-10-21 The Boeing Company Associate memory learning agent technology for travel optimization and monitoring
US20100306249A1 (en) 2009-05-27 2010-12-02 James Hill Social network systems and methods
EP2325762A1 (en) 2009-10-27 2011-05-25 Exalead Method and system for processing information of a stream of information
US8417709B2 (en) 2010-05-27 2013-04-09 International Business Machines Corporation Automatic refinement of information extraction rules
US9082140B2 (en) 2010-06-09 2015-07-14 Ebay Inc. Systems and methods to extract and utilize textual semantics
US8239349B2 (en) 2010-10-07 2012-08-07 Hewlett-Packard Development Company, L.P. Extracting data
US20120101860A1 (en) 2010-10-25 2012-04-26 Ezzat Ahmed K Providing business intelligence
US8484245B2 (en) 2011-02-08 2013-07-09 Xerox Corporation Large scale unsupervised hierarchical document categorization using ontological guidance
US8239425B1 (en) 2011-02-28 2012-08-07 Battelle Memorial Institute Isolating desired content, metadata, or both from social media
US20120278336A1 (en) 2011-04-29 2012-11-01 Malik Hassan H Representing information from documents
US9501455B2 (en) 2011-06-30 2016-11-22 The Boeing Company Systems and methods for processing data
US8521769B2 (en) 2011-07-25 2013-08-27 The Boeing Company Locating ambiguities in data
US8527695B2 (en) 2011-07-29 2013-09-03 The Boeing Company System for updating an associative memory

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1533163A (zh) * 2003-03-24 2004-09-29 电子节目指南数据的自由文本和属性搜索
CN101785002A (zh) * 2007-07-09 2010-07-21 谷歌公司 解释本地搜索查询

Also Published As

Publication number Publication date
US20140006359A1 (en) 2014-01-02
JP2013033473A (ja) 2013-02-14
CA2779180A1 (en) 2013-01-25
US20130031123A1 (en) 2013-01-31
US8521769B2 (en) 2013-08-27
CN102902705A (zh) 2013-01-30
JP5943756B2 (ja) 2016-07-05
EP2551782A1 (en) 2013-01-30
CA2779180C (en) 2016-08-16
US9805085B2 (en) 2017-10-31

Similar Documents

Publication Publication Date Title
US20210173817A1 (en) Method and system for large scale data curation
US9659071B2 (en) Patent mapping
Görg et al. Combining computational analyses and interactive visualization for document exploration and sensemaking in jigsaw
US8131779B2 (en) System and method for interactive multi-dimensional visual representation of information content and properties
US9697577B2 (en) Patent mapping
JP5025488B2 (ja) ドメイン特定のデータ・エンティティ・マッピング方法及びシステム
WO2021213314A1 (zh) 数据处理方法、装置及计算机可读存储介质
US20060136194A1 (en) Data semanticizer
US20100268703A1 (en) Method of search strategy visualization and interaction
Desimoni et al. Empirical evaluation of linked data visualization tools
CN101566997A (zh) 确定与给定的词集相关的词
CN102902705B (zh) 定位数据中的歧义
AU2013270517B2 (en) Patent mapping
WO2006015110A2 (en) Patent mapping
Aladakatti et al. Exploring natural language processing techniques to extract semantics from unstructured dataset which will aid in effective semantic interlinking
Jaiswal et al. Data Mining Techniques and Knowledge Discovery Database
Yang et al. User story clustering in agile development: a framework and an empirical study
US11977722B2 (en) Interactive patent visualization systems and methods
Campbell et al. An approach for the capture of context-dependent document relationships extracted from Bayesian analysis of users' interactions with information
CN110737749A (zh) 创业计划评价方法、装置、计算机设备及存储介质
Chuang et al. Integrating web query results: holistic schema matching
US20230385311A1 (en) Semantic-Temporal Visualization of Information
Alhindawi Information retrieval-based solution for software requirements classification and mapping
Goyal et al. Empowering Enterprise Architecture: Leveraging NLP for Time Efficiency and Strategic Alignment
Wang et al. AceMap: Knowledge Discovery through Academic Graph

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant