CN109923535B - 作为便携式用户应用对象的洞察对象 - Google Patents

作为便携式用户应用对象的洞察对象 Download PDF

Info

Publication number
CN109923535B
CN109923535B CN201780069380.6A CN201780069380A CN109923535B CN 109923535 B CN109923535 B CN 109923535B CN 201780069380 A CN201780069380 A CN 201780069380A CN 109923535 B CN109923535 B CN 109923535B
Authority
CN
China
Prior art keywords
insight
data
user
processing
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780069380.6A
Other languages
English (en)
Other versions
CN109923535A (zh
Inventor
C·D·埃利斯
D·福捷
L·薛
A·夏尔马
J·P·尼尔森
C·A·奥特罗
S·保加瓦拉
C·W·尼兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Technology Licensing LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Technology Licensing LLC filed Critical Microsoft Technology Licensing LLC
Publication of CN109923535A publication Critical patent/CN109923535A/zh
Application granted granted Critical
Publication of CN109923535B publication Critical patent/CN109923535B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/24Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本文提供了用于数据可视化框架的系统、方法和软件。一种示例性方法包括:识别目标数据集,从该目标数据集确定数据洞察以在用户应用的洞察界面中呈现。该方法包括:至少部分地基于与处理一个或多个过去数据集相关联的使用模态来确定针对目标数据集的数据洞察候选,以及根据至少目标数据集和使用模态来建立数据洞察候选的内容,其中每个数据洞察候选的内容包括由对象元数据描述的至少一个洞察对象,该对象元数据至少指示用于产生该至少一个洞察对象的处理世系。

Description

作为便携式用户应用对象的洞察对象
背景技术
各种用户生产力应用允许数据输入和分析。这些应用可以使用电子表格、演示、文档、消息传送或其它用户活动来提供数据创建、编辑和分析。用户可以在各种分布式或云存储系统上存储与这些生产力应用的使用相关联的数据文件,以使得无论何时适当的网络连接可用就能够访问数据文件。以此方式,可以提供灵活且便携式的用户生产力应用套件。
然而,信息技术行业已不断增加信息量以及信息源的数量。由于纯粹的数据量或可用于管理和呈现数据和相关联的分析结论的选项数量,用户会迅速被数据分析压倒。此外,组织内的用户难以利用同事的数据和分析,以及在小形状因子设备(例如智能电话和平板计算机)与大形状因子设备(例如台式计算机)之间切换时利用数据分析。
发明内容
本文提供了用于数据可视化框架的系统、方法和软件。一种示例性方法包括:识别目标数据集,从该目标数据集确定数据洞察以在用户应用的洞察界面中呈现。该方法包括:至少部分地基于与处理一个或多个过去数据集相关联的使用模态来确定针对目标数据集的数据洞察候选,以及根据至少目标数据集和使用模态来建立数据洞察候选的内容,其中每个数据洞察候选的内容包括由对象元数据描述的至少一个洞察对象,该对象元数据至少指示用于产生该至少一个洞察对象的处理世系(lineage)。
提供本概述以用简化形式引入一些概念,这些概念以下在详细描述中进一步描述。可以理解,本概述并非旨在标识所要求保护的主题内容的关键特征或必要特征,也并非旨在用于限制所要求保护的主题内容的范围。
附图说明
参考以下附图可以更好地理解本公开内容的许多方面。虽然结合这些附图描述了若干实现方式,但本公开内容不限于本文所公开的实现方式。相反,目的是涵盖所有替代方案、修改和等效方案。
图1示出了一个示例中的数据洞察环境。
图2示出了一个示例中的数据洞察环境的操作。
图3示出了一个示例中的数据洞察环境的操作。
图4示出了一个示例中的数据洞察环境的操作。
图5示出了一个示例中的数据洞察环境的操作。
图6示出了一个示例中的数据洞察环境的操作。
图7示出了一个示例中的数据洞察环境。
图8示出了一个示例中的数据洞察环境的操作。
图9示出了一个示例中的操作知识环境。
图10示出了适合于实现本文所公开的任何架构、过程和操作场景的计算系统。
具体实施方式
用户生产力应用使用电子表格、幻灯片、文档、消息传送或其它应用活动来提供用户数据创建、编辑和分析。然而,部分地由于用户数据量以及不同信息源数量的不断增加,用户会快速地被与分析该数据相关的任务压倒。在工作场所环境(例如公司或其它组织)中,用户可能难以利用由其它同事执行的数据和分析。此外,随着便携式和移动设备已变得更加普遍,用户在小形状因子显示器上查看和分析数据会是困难的。
数据分析的这种增长水平增加了提高用户理解能力和使用增加的源和数据量的需求。具体而言,与这些组织内部发生的数据分析相关的组织和部落知识可以提供其他用户可以应用于进一步数据分析的信息。然而,在不需要昂贵且高度手动的操作(例如安排与许多人的会议以交换知识)的情况下,很难使该信息可用于其他用户。
如上文提到的,理解和可视化电子表格或其他环境中的数据可能具有挑战性。此外,数据分析可能经常由用户或在组织内部执行,并且这些数据分析可以应用于新数据集,例如继续进行更新的产品销售数据。理解数据如何变化以及数据集中发生了什么重要变化可能是重要的。这些变化可以用于形成报告、仪表板、或概要电子表格以及各种洞察对象。这些对象和其他洞察输出可以定期进行更新,并且响应于用户数据的变化和添加(例如在每天、每周或每月基础上)。随着数据集变得更加广泛并且并入更多数据源,分析可能会更加困难,并且这些洞察输出可能对用户有利。可以生成针对数据样式、使用模态、以及用户或组织所使用的特定数据“语言”定制的自动洞察。如下面将讨论的,洞察服务和活动信号服务可以采用来自过去文档、数据分析和应用遥测的信号来学习用于呈现洞察对象的用户或组织偏好。
本文的示例可以利用各种数据源和组织知识来提高用户在各种数据可视化环境中分析和消化数据的能力。例如,通过处理与用户通常如何执行数据分析以及用户在传送分析中使用哪些偏好相关的活动信号,本文的实现方式可以推断更高级别的知识并建立跨文档和跨组织的改善和效率。通过使这些推断可用于许多不同的用户(潜在地以知识图的形式),本文的示例可以使这些知识可用于用户。优点很多,例如从现有分析中启动新分析,通过优先化来加速迭代分析过程,帮助用户避免陷阱,以及改善/协调用户之间的通信。
此外,可以在各种数据可视化环境中利用该知识,以在数据分析阶段期间为用户创建洞察对象。洞察对象可以是分析对象的扩展,包括图表、数据透视表、表格、图形等等。洞察对象可以包括表示洞察的更多内容,例如为用户生成的指示数据的关键要点的概要措辞、段落、图形、图表、数据透视表、数据表或图片。洞察对象还可以包括与其相关联的丰富的处理世系数据集,其包括数据处理步骤、变换或用于形成洞察对象和概要措辞的其他过程的活动记录。通过将处理世系与洞察对象包括在一起,可以增强跨各种形状因子和设备的可移植性。
现在转到用于数据可视化和洞察对象生成的第一示例性系统,给出了图1。图1示出了数据可视化环境100。环境100包括用户平台110、洞察平台120、以及洞察源130。环境100的每个元素可以通过一个或多个通信链路进行通信,这些通信链路可以包括物理和逻辑网络链路等等。
用户平台110向应用111提供用户界面112。应用111可以包括用户生产力应用以供最终用户在数据创建、分析和呈现中使用。例如,应用111可以包括电子表格、文字处理器、数据库、或演示应用。用户平台110还包括洞察模块114。洞察模块114可以与洞察平台120对接以及在应用111内提供洞察服务。用户界面112可以包括图形用户界面、控制台界面、web界面、文本界面等等。
洞察平台120提供洞察服务,例如洞察服务121。洞察服务121包括洞察呈现器122和洞察生成器123。洞察服务121可以处理一个或多个数据集以建立数据洞察对象(其被称为洞察对象),该数据洞察对象可以包括图形可视化部分、数据描述或结论/概要、对象元数据、以及底层数据集。洞察对象可以包括用于呈现给用户的对象洞察部分和对象元数据部分,该对象元数据部分至少指示用于产生该数据洞察对象的处理世系。
洞察对象包括典型分析对象的扩展,例如图表、图形、表格、数据透视表、数据描述、以及其他数据或文档呈现元素。洞察对象141可以包括表示洞察对象的其他内容,例如向用户提供另外信息的措辞或概要声明,例如数据洞察分析的关键要点、以及其他数据描述。此外,洞察对象可以具有洞察元数据142,该洞察元数据142指示用于产生洞察对象的处理世系。该洞察元数据提供了对在产生洞察中使用的过程、分析和其他功能的便携和灵活的指示。可以根据需要应用处理世系以产生数据洞察对象以供例如当建立新的或经改变的数据集时由洞察界面呈现。经改变的或新的数据可以具有所应用的相同处理世系,以建立反映数据集内容中的变化或添加的洞察对象。
洞察源130可以包括各种本地和分布式数据存储元件,这些数据存储元件包含用户数据、导出的用户知识和活动信号以及其他信息。在图1中,数据储存库131包括各种数据存储元件,其可以包括分布式或云数据存储服务和元件、数据存储设备、数据存储接口、以及可以存储用户平台110的用户数据或与其他用户、平台和组织实体相关联的用户数据的其他数据源。
在操作中,用户平台110或应用111的用户可以指示期望进行数据分析的数据集或目标数据集。该数据分析可以包括传统的数据分析,例如数学函数、数据的静态绘图、数据透视表中的转轴、或其他分析。然而,在本文的示例中,执行增强形式的数据分析,即洞察分析。在用户应用级别,包括一个或多个洞察模块,以便不仅向用户呈现洞察分析选项,而且还与执行洞察分析以及其它功能的洞察平台120对接。在指定一个或多个目标数据集时,用户可以采用洞察服务121来处理目标数据集并生成一个或多个候选洞察、洞察对象以及相关联的洞察元数据。在图1中,使用由应用111提供的目标数据集143来示出该过程然而,应该理解,可以从其他数据源提供目标数据集,包括应用内数据源、数据文档、数据存储元件、分布式数据存储系统或其他数据源,例如数据储存库131。
还可以由应用111或用户平台110的其他元件提供用户上下文144。用户上下文144可以指示与用户平台110、用户界面112、或用户身份以及其他信息有关的各种属性。例如,用户上下文144可以指示用户当前在用户平台110上与之对接的应用类型或名称。用户上下文144可以指示用户当前正在用户平台110上或在应用111内经由用户界面112或洞察模块114执行的活动或动作。在其他示例中,用户上下文144可以指示用户平台110或正在其上提供或执行用户平台110的用户设备或设备的属性,例如指示移动设备类型、桌面或非移动设备类型、或其他属性-例如下面针对图3中的移动特性340所指示的那些属性。
洞察服务121至少根据目标数据集和部分地从过去使用模态导出的数据分析偏好来建立数据洞察候选的内容,其中每个数据洞察候选的内容包括由对象元数据描述的至少一个数据洞察对象,该对象元数据指示用于生成该至少一个数据洞察对象的处理世系。至少基于接收对在洞察界面中呈现的数据洞察候选的列表中的第一数据洞察候选的用户选择,洞察服务121产生第一数据洞察候选以包括在用户应用的用户界面中,例如包括在电子表格应用的电子表格画布中。当至少一个数据洞察对象从识别目标数据集的用户应用嵌入到与另一用户应用相关联的文档中时,对象元数据被配置为伴随该至少一个数据洞察对象。
为了确定包括数据洞察对象和其他洞察信息的数据洞察候选,采用各种洞察源。这些洞察源可以用于建立从过去用户活动、应用使用模态、关于数据分析的组织传统、个性化数据处理技术或其他活动信号导出的数据分析偏好。例如,知识服务132可以基于过去的应用使用或过去的数据分析以及其他因素来形成用户或组织知识的储存库。可以采用知识图形或图形分析来识别可以在相关联的洞察分析中采用的关键过程或数据分析技术。可以建立知识储存库以存储这些数据分析偏好和组织知识,以供采用本文所讨论的洞察服务的用户稍后使用。在一些示例中,数据储存库131可以包括知识储存库。数据分析偏好推导的进一步讨论见图8。
现在转向洞察服务的示例性使用,给出了图2。图2示出了一个示例中的数据可视化环境的操作200。图2包括应用于洞察过程210和211的来自图1的用户平台110。应该理解,除了图1的那些元件之外,还可以采用其他用户平台和洞察平台。
在图2中,在过程210中呈现电子表格应用。该电子表格应用可以包括由用户界面112呈现的各种用户界面元素,例如窗口对话框、可以从其输入和操纵数据的用户画布、以及各种菜单、图标、控制元素和状态信息元素。此外,洞察模块114提供增强的用户界面元素,即包括候选洞察对象221-223的洞察对话框220。可以响应于用户选择洞察触发图标或输入洞察分析命令而生成这些洞察对象。尽管图2示出了已经生成的这些洞察对象,但是应该理解,可能需要各种时间延迟来处理相关联的目标数据集以建立洞察对象。此外,后台服务可以监视用户数据或目标数据集,并且可以建立用于呈现给用户的预先计算洞察。
通常,用户将具有输入到由应用111呈现的电子表格中的数据集。该数据可以包括一个或多个结构化数据表以及非结构化数据,并且可以由用户输入或从其他数据源导入到电子表格中。用户可能想要对该目标数据执行数据分析,并且可以在由用户界面112呈现的各种数据分析选项之中进行选择。然而,由用户界面112和相关联的应用111呈现的用于数据分析的典型选项可能仅包括静态图形或可能仅包含用户已手动输入的内容。该手动内容可以包括图形标题、图形轴、图形缩放、颜色、或其他图形和文本内容或格式。
洞察模块114与图1的洞察平台120对接,以向应用111的用户提供增强的数据分析和可视化特征。洞察平台120提供洞察输出140以供洞察模块114使用。洞察模块114可以提供对数据和数据分析的进一步个性化,以及其他增强。可以生成针对数据样式、使用模态、以及用户或组织所使用的特定数据“语言”定制的洞察。
在图2中,过程260示出了可能在洞察服务121中发生的示例性洞察生成操作。在操作261中,部分地基于针对洞察服务建立的洞察“知识”来选择要执行的分析过程。该洞察知识可以基于通过处理在数据文件、数据存储位置、消息传送信息或其他数据源中找到的过去使用活动、活动信号或使用模态来导出的数据分析偏好。一旦建立了对分析过程的选择,则可以在操作262中使用所选择的分析过程来分析当前相关的用户数据,例如目标数据集。可以根据各种公式、等式、函数等等来处理目标数据集,以确定目标数据集的模式、异常值、多数/少数、分段或其他属性,这些属性可以用于可视化数据或呈现与目标数据集相关的结论。许多不同的分析过程可以在用户触发洞察呈现过程之前并行地执行,例如在预测后台处理技术中。在操作263中,洞察结果由用户应用111内的洞察模块114确定并呈现给用户。洞察结果可以根据与用户的相关性、基于洞察知识、基于洞察结果置信度或根据其他评分或统计相关性选择来排序。在操作261中可以采用知识储存库,例如图8的知识储存库823。
洞察结果可以包括洞察对象和相关联的洞察对象元数据。在图2的示例中,洞察对话框220向用户呈现若干洞察对象221-223。这些可以用图形列表格式、分页格式或其他显示格式来呈现,这可以包括经由滚动用户界面操作或分页用户界面操作可获得的进一步的洞察对象。用户可以选择期望的洞察对象(例如图形对象221和措辞225)以插入到电子表格或其他文档中。一旦被插入,则可以向用户呈现进一步的选项,例如对话元素224,在操作265中可以从该对话元素224中选择进一步的洞察。每个洞察对象可以具有自动确定的对象类型、图形类型、数据范围、概要措辞、支持措辞、标题、轴、缩放因子、或颜色选择、或其他特征。可以使用本文所讨论的洞察知识来确定这些特征,例如基于从使用模态或活动信号导出的数据分析偏好。
可以基于与用户或目标数据集的相关性评分或相关性级别来建立每个洞察对象的排序或排名。可以使用上述洞察知识来确定相关性级别,以使得与用户相关的关键洞察根据相关联的评分排名高于其他洞察。洞察知识应用数据分析偏好项来确定什么数据分析活动和洞察对象或可视化对用户或组织可能是重要的。该洞察知识是从各种数据源合成的,并在生成洞察对象时使用。其他排名过程可以包括:例如基于由用户或与用户相关联的组织执行的数据分析的历史来确定洞察对象对用户或数据集的影响的大小或幅度。例如,用户可能对某些数据洞察比其他数据洞察更感兴趣,并且这些洞察中的所选择洞察可以在列表中呈现为比其他洞察更高。对过去数据分析活动的机器学习、所采用的过去的洞察、和与用户过去的选择相比较的过去的排名、以及其他活动可以用在排名级别或排名评分过程中。
操作211中的进一步洞察265可以包括用户选择的洞察的进一步选项或者允许二次操纵的进一步选项,例如图2中的对话框230中所呈现的。操作211提供当需要超过第一级数据分析时(例如“对洞察的洞察”或元洞察)允许用户实现进一步分析的机制和工具。这些可以包括用户可以询问关于当前呈现给用户的洞察对象的各种问题,例如问题231和240-243,以及其他问题,包括“发生了什么”、“为什么会发生这种情况”、“预测是什么”、“如果......”、“下一步是什么”、“计划是什么”、“讲述该故事”等等。此外,用户可以选择目标问题,例如问题231,并且具有提供给用户的进一步细节。
例如,问题231“该洞察意味着什么?”可以发起用于生成洞察的各种细节,例如对用于生成洞察的公式232、基本原理233和数据源234的描述。公式可以包括用于处理目标数据集以生成最终洞察对象或其中间步骤的数学或分析函数。基本原理可以包括关于洞察为何与用户相关或为用户选择的简要描述,以及为什么建立洞察对象的各种公式、图形类型、数据范围或其他属性的原因。例如,从过去的数据分析导出的数据分析偏好可以指示对于前一季度的销售活动条形图类型是优选的,并且随后基本原理可以指示关于为什么洞察对象221包括这些相关联的特征的简要描述。数据源可以指示来自相关联的目标数据集或许多数据集的数据范围(即,列、行、单元格)。
可以对所选择的洞察221执行预测性洞察,其可以包括基于当前数据集和洞察对象或洞察结论来确定预报或预测。用户可以查询预报问题,例如以与改变数据点、数据集的部分、图形属性、时间属性或其他改变相关的“如果”问题的形式。此外,可以建立迭代和反馈生成的预报,其中用户可以选择要满足的数据结论或数据集的目标,并检查将需要什么数据改变来达到所选择的目标,例如销售目标或制造目标。这些“如果”场景也可以基于洞察知识自动生成,例如当从过去的数据分析导出数据分析偏好或洞察知识中的循环指示符指示某些分析是优选的或合适的时候。此外,洞察对象可以充当“模型”,用户可以使用该模型来更改参数、输入和属性,以查看输出如何受到影响以及预测是如何改变的。
在这些示例中,图2中的操作210和211中的洞察对象被认为是“第一类对象”。第一类对象可以包括具有与之相关联的处理世系和/或分析概要的动态对象。处理世系包括形成与洞察对象一起传播的丰富洞察元数据集的相关联的定义、描述、分析世系和跨应用属性。处理世系还可以包括对数据变换、分析、相对项、分析结论、数据维度或度量、或与相关联的元数据中的洞察对象一起传播的其他属性的指示。第一类对象可以提供对其他文档的增强导出,例如演示文档或白皮书文档。与第一类对象相关联的元数据维持数据集之间的推断链以及用于确定关联的洞察对象的数据分析。例如,推断链可以包括中间处理步骤、决策树、公式、推理、数据源、以及洞察对象的生成和建立背后的其他基本原理或历史的存储。元数据可以包括在一个或多个数据结构或数据文件中,这些数据结构或数据文件伴随洞察对象或者洞察对象本身被包括在其中。
洞察对象的推断链可以包括可以在建立洞察对象的过程期间使用洞察服务自动生成的表、意见、概要和底层数据集。例如,对象元数据可以捕获并存储被用于制定输出洞察对象的中间步骤和中间结果。可以基于在目标数据集的处理期间由洞察服务采用的实际步骤来建立处理“流程”。这些推断链可以用于为洞察对象构建图形和文本故事,以使得可以为洞察对象自动生成演示或白皮书,该演示或白皮书详细说明了由洞察服务执行的洞察对象创建过程。
洞察对象可以包括动态洞察概要、措辞或数据结论。可以建立这些洞察概要作为洞察对象,该洞察对象解释另一洞察对象的关键要点或关键结果。例如,操作211包括与图形221相关的洞察概要225,并且指示“模型2.0的销售在Q3增长26%,超过模型1.0”。此概要是动态的,并且绑定到与洞察对象相关联的元数据,以使得当洞察对象的数据值或数据点改变时,则概要可以作为响应地进行相应改变。概要225和图形221可以包括在具有公共对象元数据的公共洞察对象中,或者可以替代地被处理为单独的洞察对象,每个洞察对象具有相关联的对象元数据。概要可以包括标题、图形轴标签、或者对洞察对象的其他文本描述。概要还可以包括预测或预期声明,例如预定时间范围内的数据预测,或动态的并随洞察对象而变化的其它声明。
此外,当底层数据集中的数据改变时,洞察对象的动态特性可能会响应于数据改变而产生完全不同类型的洞察对象。相关联的概要或预测也可以响应于数据变化和洞察对象变化而自动流动。可以向用户提供关于洞察对象的其他信息,例如关于为什么选择特定洞察对象、为什么包括特定概要、或者提供对洞察对象的进一步洞察的其他上下文信息的指示。还可以向用户指示对使用模态或活动信号的指示,其指示驱动选择输出洞察对象和相关联概要或结论的推理或步骤。
对数据集的改变(例如经更新的数据、改善的预测、或新数据)可以提示对已生成的洞察对象的自动改变。例如,响应于识别与至少目标数据集相关的用户动作,洞察服务121可以处理用户动作、洞察对象元数据和目标数据集以产生至少一个不同的洞察对象以供由洞察界面呈现。用户动作可以指示对目标数据集的改变或对另一洞察对象而不是当前洞察对象的选择。洞察服务121还可以响应于文本地概括该至少一个不同数据洞察对象的变化来确定新数据分析结论措辞。洞察服务121可以至少基于针对目标数据集中的数据模式分析目标数据集并且选择数据分析结论措辞以将数据模式体现给用户来确定每个数据洞察候选的数据分析结论措辞。此外,洞察界面可以呈现每个数据洞察候选的相关性基本原理,其至少基于目标数据集和使用模态来指示在洞察界面中呈现的数据洞察候选的列表中包括数据洞察候选的解释。
因此,这些洞察对象相对于数据本身是动态的,并且可以自动检测数据集中的变化并触发洞察对象中的变化,而不仅仅是更新图形表示中的数据值。例如,过去数据的叠加可以利用新的或经改变的数据来可视化。由于数据的变化,可以建立针对洞察对象类型或推断链内的途径的不同选择,以使得将不同的结论/措辞传递给用户。可以在关于旧/现有数据的变化中突出显示异常值。此外,可以基于对数据集的变化来生成全新的报告或洞察对象。因此,代替基于可能仅根据数据变化来更新图形数据点的静态数据的传统图形,动态洞察对象可以在底层数据改变时更改整个推断链和对象类型选择。
第一类对象(诸如本文所讨论的洞察对象)还提供增强的可移植性和跨平台使用。例如,用户可以在移动设备(例如智能电话或平板设备)上建立洞察对象,并且随后希望在非移动设备上(例如台式计算机、膝上型计算机)或经由在这些非移动设备之一上呈现的web界面使用该洞察对象,反之亦然。此外,用户可能希望在小格式屏幕可用的时间期间呈现可理解的界面。电子表格以及其他文档在具有小屏幕形状因子的移动设备(例如智能电话和平板计算设备)上可能难以阅读并且几乎不可能理解。有利地,通过提供电子表格的自动目录表以及数据表的自动洞察视图的组合,可以使移动设备上的电子表格的主要用户界面可视化、可理解且高度交互-即使在这些洞察和可视化在原始电子表格中不存在的情况下。这些洞察帮助用户理解他们的电子表格和数据,尽管有小形状因子屏幕。
举使用洞察对象的数据洞察移动性的第一示例,给出了图3。图3示出了一个示例中的数据洞察环境300的操作。在操作310中,用户界面313在移动计算设备301上呈现为电子表格的移动界面,例如在具有触摸屏用户界面的智能电话或平板设备上。用户界面313呈现具有大量数据字段的电子表格应用,这些数据字段难以在如针对设备301所示出的小形状因子屏幕上有效地查看和分析。用户界面313还包括洞察界面311,该洞察界面311可以由用户选择以触发对电子表格中所包括的数据集的处理。该处理包括例如通过例如洞察服务121的洞察发生器123和洞察呈现器122进行的洞察处理。洞察服务121可以包括类似于图2的操作261、262、263的操作,尽管变化是可能的。在洞察过程完成之后,可以将洞察指示为可用于在元素312中查看或呈现给用户。
如在操作320中所见,洞察视图321经由移动设备(为清楚起见而省略)呈现给用户。该洞察视图包括几个可由用户滚动、滑动或分页的候选洞察对象。例如,洞察对象322包括具有相关联的标签和与销售数字相关的概要标题的条形图。洞察对象323包括条形图,其具有关于与年龄组相关的数据集的不同方面的进一步数据分析。呈现第三洞察对象,但是部分在屏幕外,并且可以由用户使用触摸屏操纵来滚动或分页。
用户可以选择这些洞察对象中的一个洞察对象(例如对象322)以供进一步查看和分析。洞察对象322在操作330中呈现在洞察对象的聚焦视图中。还可以呈现进一步的洞察或“对洞察的洞察”,例如在部分332中指示的。这些进一步的洞察可以包括用户经由其他分析工具来选择和进一步研究数据集的预定问题。这些洞察对象可以用于使用户更容易消化移动设备上的信息。
除了目标数据集和洞察知识元素之外,还可以根据各种用户上下文信息和导出的数据分析偏好来选择呈现给用户的移动洞察对象。这些在图3中被指示移动特性340和偏好341。不同设备(例如智能电话、平板计算机以及其他移动计算设备)可以具有不同的屏幕尺寸和分辨率以及不同的通信和处理能力。由于设备的小性质因子特性(例如智能电话设备中的5英寸左右、以及平板设备形状因子中的8或10英寸等等),屏幕尺寸通常较小。通常,台式或膝上型计算设备将具有较大的屏幕和分辨率,这使得更容易呈现电子表格或其他数据呈现格式以供用户查看和分析。通信能力可以基于位置、无线覆盖区域、通信协议和信号强度、当前带宽或其他因素而变化。移动设备中所采用的处理器通常具有比非移动设备更低性能变化,并且针对典型情况下的功耗与性能进行了优化。因此,当形成用于移动设备的各种洞察对象时,洞察生成器123和洞察呈现器122可以考虑移动特性340。
在一个示例中,响应于移动设备上的用户选择指示该一个或多个候选洞察对象中的洞察对象,洞察服务可以将所选择的洞察对象与目标数据集进行关联,以便随后在另一计算设备(例如非移动设备)上使用。所选择的洞察对象可以包括关联的图形可视化部分和用于产生相关联的图形可视化部分的相关联处理世系。洞察呈现器122可以通过至少在移动设备上提供分页或列表视图来在洞察界面中将该一个或多个洞察对象呈现给移动设备上的数据分析应用,其中用户可以滑过该一个或多个洞察对象中的每个洞察对象并通过点击移动计算设备的触摸屏部分来从候选中选择洞察对象。
分布式计算和存储系统(例如“云”计算和云存储系统)可以用于洞察服务和洞察数据存储和处理。通过使用云系统来处理大量信息以增强用户/客户端能力,洞察服务121可以减少在移动设备中部署的这种复杂性,并且向移动设备递送更高级别的信息,但仍然具有生成的适合于当前移动客户端能力的视图。洞察服务121可以考虑用户上下文(例如移动特性340),该用户上下文可以被传输到洞察服务121或者与洞察服务121的用户相关联地存储。考虑因素包括移动设备与非移动设备的不同属性,包括屏幕尺寸、分辨率、屏幕数量、性质因子、电池使用、处理能力、通信链路能力/带宽、移动能力、和视频输出能力、以及其他属性,包括其组合。
一个另外的示例性操作包括用户识别用于分析的数据集,例如通过在电子邮件中作为附件或经由分布式文件共享和存储服务来接收数据文件。该文件可能包括目标数据集,可以打开该目标数据集以供移动设备的用户查看。然而,可以针对移动设备以不同的方式来处理洞察对象的处理和呈现,以使得本文所讨论的洞察过程可以处理大量数据并创建适应于适当客户端设备能力的交互模型。可以采用适合于移动客户端有效地消耗和理解该大量数据的交互模型和模式。
洞察服务121可以发起对设备外存储的数据集的洞察处理,例如在云中或在分布式存储或消息传送系统中。洞察呈现器122可以向移动设备或平台呈现一个或多个移动适当的洞察视图350,其包括基于目标数据集、知识/数据分析偏好和移动特性的洞察对象。以此方式,可以建立适合于移动设备的交互模式(例如更适合于移动设备的菜单或用户界面元素、概要的模态、针对设备属性定制的数据/洞察探索)以便用户与所呈现的洞察可视化对接。例如,代替下拉菜单或带驱动的洞察菜单或属性,可以采用更适合于移动触摸屏的洞察操作,例如手指/手写笔滚动、页面翻动或其他移动用户交互。
此外,洞察服务121可能不会将与洞察对象相关联的整个数据或元数据传输到移动设备,以避免在无线或带宽受限的接口上进行大量传输。洞察呈现器122可以在洞察服务121中远程地呈现洞察对象,并且传输静态图像呈现图或“可点击”呈现图,这些呈现图可以由用户探索或利用以在移动设备上创建进一步的洞察。该选择性呈现可以具有呈现图谱,以使得洞察对象的所选择部分可以驻留在分布式存储服务中,而只有洞察对象的一部分(例如图形图像)可以被传输到移动设备。洞察呈现器122可以智能地选择要在本地或远程呈现什么元素、为了更简单或更复杂的呈现省略什么元素、以及部分地基于移动设备特性的其他特征。当用户选择特定的洞察对象时,则可以将另外的数据传输到移动设备,或者可以从移动设备远程地执行进一步的洞察以便稍后作为完全呈现的对象进行传输。在另外的示例中,仅将各种数据洞察候选的概要或标题传输到移动设备,并且仅响应于用户交互才呈现用于传输到移动设备的洞察对象。
虽然可以将包括洞察对象或洞察候选的精简或仅图像呈现的各种视图350传输到移动设备,但洞察服务121与视图350相关联地维持洞察对象元数据。因此,视图可能仅包括洞察对象的精简呈现版本,而不包括任何动态内容、交互式内容、或相关联的元数据。相反,由洞察服务121远离移动设备地维持指示至少处理世系的元数据。可以阻止洞察对象元数据传输到移动设备以节省无线带宽。然而,洞察对象元数据可以存储在远离移动设备的分布式或远程存储系统中以供以后使用。例如,元数据可以用于与桌面设备或非移动设备上的相关联洞察对象交互。即使移动设备可能仅呈现表示洞察对象的精简呈现或静态图像,而洞察对象远离移动设备存储,但洞察对象仍维持丰富的“第一类”处理世系。可以将对移动设备上的数据或目标数据集的更改传送给洞察服务121,并且作为响应,洞察服务121可以使用由元数据指示的处理世系来更改或创建与数据的更改相对应的洞察对象。可以将另外的静态图像或相关联的呈现图/视图传送到移动设备,并且可以防止在移动设备上发生对元数据和处理世系的处理。
图4示出了一个示例中的数据洞察环境400的操作。图4示出了这些洞察对象和相关联元数据在移动和非移动设备之间的可移植性。例如,移动设备401可以包括基于触摸屏的智能电话,其具有在小于7英寸对角线范围内的小形状因子屏幕,而台式计算机402包括具有在7或更大英寸对角线范围内的一个或多个大形状因子显示器的个人计算机。屏幕的尺寸可以变化,并且移动和非移动指定可以替代地基于操作系统类型或操作系统用户界面呈现模式。例如,手表、智能电话或平板计算设备可以被认为是小形状因子设备,而及上线、笔记本或台式计算设备可以被认为是大形状因子设备。
如上面所讨论的,可以在创建各种洞察对象时考虑用户上下文信息,例如移动特性340,以及导出的数据分析偏好341。当用户在移动设备上选择一个或多个洞察对象时,可以存储这些洞察对象(以及相关联的对象元数据)以供稍后在非移动设备上使用和操纵。可以向洞察服务121指示移动洞察选择342,该洞察服务121传送一个或多个所选择的洞察对象。移动洞察选择342可以指示可以稍后指示在非移动设备上使用的“固定”或移动选择的洞察。
一旦用户采用非移动或较大形式因子设备,就可以将所选择的洞察对象与相关联的元数据一起呈现给用户。洞察对象的“第一类”对象性质允许处理世系跟随洞察对象,并且可以包括处理历史、推断链、以及洞察对象的与洞察对象一起传播的其他属性。可以在非移动设备上从最初植根于移动设备接口的活动执行进一步的数据操纵、洞察处理和投影活动。有利地,用户可以使用洞察对象和相关联的元数据无缝地从移动设备移动到另一设备。部分地由于非移动设备的可用的可能较大的可用屏幕空间和处理能力,可能在非移动设备上或者在比移动设备上更大的形状因子上可获得更详细的视图和分析。
例如,在操作410中可以向用户呈现洞察对象420。这些洞察对象421-423可能源自于在移动设备401的使用期间。当用户迁移到使用非移动设备(例如台式计算机402)时,这些洞察自动呈现在洞察对话框420中,例如针对移动设备洞察421和422所指示的。可以在操作中执行进一步的洞察和数据分析,例如针对新洞察443所示出的。
在操作420中,用户可以使用先前生成、来自先前的移动洞察活动、或者来自另外分析的各种洞察中的关键字或其他搜索项来搜索441。搜索结果442可以包括分析443、洞察444、投影445和另外数据源446、以及其它结果。此外,可以使用元素447来指示和列出先前在移动设备或移动界面上生成和/或选择的洞察。
图5示出了一个示例中的数据洞察环境500的操作。图5考虑了与用户在各种数据源中搜索数据集以包括在洞察分析操作中相关的操作,以及基于这些数据集的示例性投影。在操作510中,用户可以输入一个或多个搜索项以在各种数据存储系统(例如,消息传送系统、分布式数据存储系统、本地存储系统等等)中发现数据集源。洞察对话框511指示搜索框512,其具有由用户输入的示例搜索项“销售Q3”。可以在搜索框下方的对话框511中返回结果,并且可以从如先前所指示的各种数据源获得。结果可以指示原始/未处理的数据集,或者可以包括先前为当前用户或当前用户具有可见性的其他用户确定的洞察对象。
用户可以具有数据集、数据对象、数据可视化、或数据文件或其他数据源中所包含的其他数据相关项,并且用户可以在这些项之中进行搜索。还可以在其中搜索洞察对象,并且搜索结果可以返回与用户输入的关键字相关的各种洞察对象。例如,当前用户或其他用户可能已经为Q3销售结果建立了洞察分析,如由洞察对象513所指示的。用户可以选择该洞察以进行进一步分析,并且可以将该洞察对象或相关联数据集插入到电子表格的用户界面部分或用户画布部分中。如果选择了数据集(例如在操作520中),则工作表的相关联字段可以包括插入后的数据。如果选择了洞察对象以供插入,则洞察对象可以与任何相关联的元数据一起包含在工作表中,该元数据指示该洞察对象的处理世系信息。
在操作520中,已将数据集521插入到相关联的工作表中,并且可以包括数据集的数据值、标题和其他信息。用户可以选择与数据集相关联的一系列单元格或数据字段以对其执行洞察处理。选择522指示对所插入的数据集的字段子集的这种选择。用户可以选择洞察发起元素523以指示相关联的洞察平台或洞察服务以对所选择的数据执行洞察处理。操作530指示可能由用户选择洞察发起元素523产生的一个可能的洞察对话框531。洞察对话框531指示用于对在选择522中选择的数据进行洞察处理的各种选项。尽管可以呈现另外的选项,但是在该示例中,呈现预测选项532和一般洞察处理选项533以供用户选择。
在操作530中,用户选择“预测是什么”532并且在操作540中将预测的洞察对象呈现给用户。预测的洞察对象549可以采用与洞察对象或最初选择的数据(例如,522)相关联的数据,以确定一个或多个预计或预测。洞察知识信息可以用于预测,例如循环信息、季节性信息、或者针对数据集并且通过过去洞察分析或其他数据集来确定的其他趋势。预测549包括关于“小部件1”和“小部件2”的概要声明548,该概要声明548基于现有销售数据和考虑过去数据中的循环趋势的预计销售数据。该预计可以由洞察服务自动生成,而无需用户指定循环指示符或季节性信息,因为在本文所讨论的知识生成过程期间可以由洞察生成器收集该信息。可以至少基于从与用户应用的一个或多个用户相关联的分布式用户数据存储服务、分布式网络消息传送服务、或分布式应用数据存储服务导出的循环活动指示符来确定目标数据集的趋势或季节性,例如本文所讨论的用于操作知识确定或使用模态确定。
还可以建立另外的洞察547。另外的洞察分析(例如在操作540中指示的)可以包括在对话框541中指示的进一步预计分析或其他洞察选项。这些示例性操作包括洞察542-546。
除了在电子表格应用或数据集原生的其他应用和洞察对象分析中起作用之外,还可以采用另外的应用。这些另外的应用可以用于进一步的数据分析,也可用于讲述有关数据和相关联分析的故事或叙述。图6示出了使用图5中所示的元素的操作610,并且可以由洞察服务121的各部分提供。图6中的用户可以使用指示“讲述该故事”的动作546来选择洞察导出过程620。
可以采用各种其他链接或相关联的应用640-642来显示洞察对象和相关联的推断链631。推断链631可以包括洞察元数据632,该洞察元数据632可以指示用于形成相关联的洞察对象的处理世系。例如,可能希望演示应用641以显示由洞察服务121用于建立洞察对象或洞察概要/结论的数据处理世系。演示幻灯片可以由洞察导出过程620基于在洞察推断链631中指示的处理世系来生成。数据处理、分析和计算的中间步骤可以包括在演示的各个幻灯片中并且被生成为讲述底层数据、预测、洞察或其他信息的故事。还可以包括诸如概要信息、标题、标签等措辞。
洞察导出过程620将与洞察对象549相关联的元数据维持为链接到该洞察对象,因此洞察对象保持动态并响应于数据变化或洞察分析变化。此外,为洞察对象建立的处理世系指示了由洞察服务121用于生成所选择的洞察对象的计算、决策、对象选择、数据分析、或其他活动的流程。处理世系包括洞察对象和相关联元数据的各种“故事”信息,并通过中间步骤、公式、推理和其他分析选择来指示数据集处理的历史。可以指示驱动特定洞察分析的数据集、洞察知识、导出的数据分析偏好、使用模态或活动信号,或者可以驱动处理世系内容。该示例中的导出过程建立了由洞察服务121在生成洞察对象时使用的过程的呈现、白皮书或其他长形式描述,所有这些都以用户友好的格式呈现以供查看。
图7示出了一个示例中的数据可视化环境700,并且呈现了一个示例性数据可视化环境的详细示例性系统视图。数据可视化环境700的元素可以用于实现本文所讨论的任何洞察服务、客户端设备、以及知识生成和存储服务。
环境700包括推断服务710、元数据服务711、用户信号服务712、数据服务713、遥测分析服务714、洞察服务715、前端服务716、客户端720、云数据服务760、数据源761以及应用762。通信链路730-745包括一个或多个逻辑或物理通信链路以用于在图7中的相关联元件之中承载数据和其他业务。例如,链路730-745可以包括存储器映射链路、网络链路、无线链路、有线链路、应用编程接口(API)或其他链接,包括其组合。在一些示例中,每个链路可以包括一个以上的通信路径或多个链路。
在图7中,采用用户信号服务712以基于存储在云数据服务760中的数据来确定用户的应用信号和服务信号。这些云数据服务可以包括电子邮件/消息传送系统、组织数据存储服务、云/分布式存储系统、社交媒体系统、或其他数据源。用户信号服务712包括可以从各种数据源提取活动信号的一个或多个“爬行器”。这些活动信号可以指示可以在稍后生成洞察对象时采用的个人知识、组织知识或全局知识。用户信号服务712可以通过链路741从云数据服务700获取各种用户信号、通过链路743从客户端720获取各种客户端活动/反馈、通过链路724从前端服务716获取各种前端洞察活动作为输入。用户信号服务712可以通过链路740将从各种爬行器确定的用户遥测输出到遥测分析服务714,以进一步从用户遥测提取/确定来活动信号。用户遥测和活动信号可以作为用户信息通过链路730和731提供给推断服务710。用户遥测可以包括针对用户所采用的应用监视、并且从云数据服务760中抓取的数据中确定的动作或使用模式。活动信号可以包括优选的数据呈现对象、方法或分析,以及在云数据服务760中爬行的文件或数据内和由其指示的其他活动。
推断服务710可以采用包括由元素712确定的活动信号和由元素714确定的应用遥测的用户信息来推断各种级别的“知识”或数据分析偏好,这些“知识”或数据分析偏好包括用户、租户/客户、组织/域/公司之中、全局地跨整个应用、针对特定会话或其它区别的数据层级和优选洞察分析过程。这些推断可以包括通过先前数据分析和当前数据分析与用户活动和用户数据有关的推断。在一个示例中,元数据服务711可以将通过链路723接收的用户/数据推断编目和组织成数据字典,以用于索引数据并通过用户信息来分析公共数据查询、变换和其他推断。随后可以通过链路733/734将包括数据分析偏好的用户和数据推断提供给洞察服务715,以确定当前目标数据集的洞察对象和元数据。
一旦用户指示用于分析的当前数据集或目标数据集,则洞察服务715可以采用这些数据分析偏好以通过根据数据分析偏好生成洞察对象来建立洞察对象/元数据。生成的许多洞察对象之中的排名可以由洞察服务715处理。可以生成洞察对象的可视化的预览以用于递送到前端服务716。此外,可以通过链路737向前端服务716提供洞察对象、建议、推荐以及相关联的元数据。当前数据集或目标数据集可以由数据服务713识别并通过链路735传输到洞察服务715。目标数据可以包括上传的数据、用户输入的数据、云存储数据、数据模型、或来自各种数据源761。数据源761可以包括各种用户数据存储元件,包括本地、分布式、公司、组织或公共数据源等等。洞察服务715可以存储经处理的数据、洞察对象和洞察对象元数据,以供稍后使用和通过链接736在数据服务713中引用。
前端服务716提供用户界面活动和应用界面活动。这些活动可以用作反馈信号,以供用户信号服务712进一步细化和考虑。前端服务716响应于在应用内呈现的用户界面内接收的用户体验(UX)活动和更新而提供动作。前端服务716可以基于当前采用的最终用户设备的形状因子来提供各种便携式接口。例如,可以为大形状因子设备(包括台式计算机和膝上型计算机)确定创作用户界面717。可以为小形状因子设备(包括移动设备、智能电话和平板计算设备)确定移动用户界面718。可以通过链路744发送各种视图以供客户端720呈现。
客户端720可以包括一个或多个最终用户设备,其可以包括桌面客户端721、移动客户端722或基于web的客户端723、以及其他客户端。这些客户端可以由客户端主机724执行以呈现一个或多个应用762。可以通过用户界面元素和洞察元素745向用户提供文档改变(包括数据输入/改变)或洞察可视化。
当用户经由应用和相关联的用户界面或洞察界面进行交互时,采用反馈机制来进一步改进和丰富洞察生成体验,以及进一步确定活动信号或应用遥测以用于稍后的洞察对象生成。
图8示出了一个示例中的数据可视化环境的操作800。与图8中的操作相关地讨论环境700的元件。然而,应该理解,可以采用其他元件、环境和系统。在图8中,环境700提供对数据源的智能发现(810)。该智能发现可以包括对现有用户数据、组织数据、应用数据、或其他数据(例如在云数据服务760或数据源761中找到的)的发现。可以处理用户活动信号和用户遥测以确定可以从中导出数据分析偏好的使用模态,以及洞察可以基于的其他信息。可以通过在应用中手动输入数据或从用户数据源发现用于洞察分析的新用户数据。
可以基于洞察处理来推荐(811)洞察对象(例如图表、图形或其他对象),该洞察处理考虑从活动信号和使用模态导出的数据分析偏好,以及识别用于分析的目标数据集。随后可以进一步使用这些服务支持的推荐来确定用于小形状因子设备的移动洞察(812),确定用于伴随应用的洞察对象或用于维持/保留元数据和推断链(814)的导出洞察对象,以及用户可以从中执行进一步的数据分析和预测的应用内洞察建议(813)。
本文的各种示例采用操作“知识”,其包括从活动信号、使用模态、过去数据分析活动、或从中可以为目标数据集导出或推断洞察的其他信息导出或推断的数据分析偏好。从应用使用活动中推断数据分析偏好可以基于一个或多个用户或组织内的活动信号或使用模态的频率排名。为了说明一个示例性知识生成架构,给出了图9。图9示出了可以用于操作知识发现和生成的示例中的操作知识环境900,以用于本文的各种洞察处理示例。
使用图9的元件的示例性过程可以包括:(1)部分地基于过去/现有数据集分析、应用遥测、活动信号、组织偏好、或与先前数据集分析相关的其他信息来确定操作知识;(2)将该操作知识从数据字典或知识储存库应用于新识别的目标数据集,以自动生成多个相关的洞察对象、洞察结论或洞察元数据。
在图9中,使用为用户、应用、服务、组织和其他用户信号源确定的各种用户活动信号来确定知识图940。组织信号951包括与组织通常如何使用数据有关的度量和数据、经常优选或采用什么数据洞察对象、以及过去对组织的各种用户和成员执行了什么分析。用户信号可以使用信号服务950来导出。服务950包括各种爬行器和遥测确定系统,这些爬行器和遥测确定系统从各种数据源(包括文件、电子邮件、消息、社交媒体和其他来源)中提取与使用模态和应用使用有关的相关活动或信息。
例如,各种爬行器服务可以抓取使用活动源930,以从各种数据储存库931中查找文件、元数据、先前分析、先前数据集、用户通信、用户偏好或其他信息。数据储存库931可以包括本地或远程数据源,其可以是分布式或基于云的数据存储服务和系统、电子邮件或消息传送系统、以及其他数据系统。这些爬行器处理来自基于云或本地存储以及电子邮件系统的多个数据源、文档/文件,以识别用户和组织的属性、特性、数据分析选择。这被处理以确定活动信号或使用模态,这些活动信号或使用模态随后用于基于对过去数据分析所采用的用户活动和用户偏好的推断来导出数据分析偏好或“知识”以应用于未来数据分析。可以对由模块910-912收集的信息执行特征提取,以确定“根”动作或活动信号,并概括活动信号以用于知识图形过程。在一些示例中,可以执行个人/用户信息的移除或剥离以增强隐私或使来自实际数据、数据集或用户/组织身份的活动信号匿名化。
组织分析器910、数据分析器911和元数据分析器912提供了提取和确定可以由知识服务921的知识生成器922采用的相关用户活动、先前分析、使用模态和用户活动信号。由包括知识生成器922和知识储存库923的活动信号平台来提供知识服务921。
在另一操作示例中,数据储存库931和其他使用活动源930可以被识别为与一个或多个用户的应用使用活动相关的数据源。知识服务921采用知识生成器922的元素来确定与应用使用活动中的一个或多个用户的至少数据分析相关的各种活动信号。包括由用户活动信号服务950和组织信号951提供的信息的活动信号可以使用模块910、911和912中的相关联模块来确定,模块910、911和912分析、抓取和以其他方式处理数据、文件、活动日志、遥测、电子邮件、社交媒体数据或其他信号和信息,以确定用户和与这些用户相关联的组织的应用使用活动。例如,数据分析器911可以处理数据集、数据文件以及各种数据源和数据文件的内容,以确定供知识生成器922使用的活动信号。类似地,元数据分析器912可以处理与数据源相关的元数据和其他上下文信息,以提供与活动信号相关的进一步信息以供知识生成器922使用。组织分析器910可以处理组织的各种活动信息,例如组织策略和相关数据、组织简档、安全属性、使用权信息以及其他信息。
知识服务921的知识生成器922应用活动信号以从活动信号之中推断数据分析偏好。知识图940是基于从各种数据源确定的活动信号的一个示例知识图输出。知识服务921提供数据分析偏好的部分以供数据洞察服务使用,该数据洞察服务至少基于数据分析偏好中的一些来建立可视化和描述目标数据集的数据洞察对象。知识储存库923可以存储数据分析偏好以供稍后在洞察处理中使用。知识储存库923可以根据一个或多个范围分类(包括用户范围、组织范围和应用范围中的至少一个)来存储数据分析偏好。
知识服务921确定为洞察处理提供的数据分析偏好和知识。知识生成器可以分析各种活动、操作、偏好或其他用户/组织信息,以确定由活动中枢指示的一个或多个关键活动。知识图940可以用于映射或绘制用户/组织信息,以识别活动节点的集群或分析类型的集群以及其他信息。例如,活动中枢941-941可以表示许多活动节点1-14中的连结,该连结表示由用户或组织内的用户执行的活动操作。活动中枢941-941可以通过连接分数来识别,该连接分数指示知识图940的节点之间的边或连接的阈值数量。活动信号之间的频率排名也可以用于确定用户或组织通常使用或通常采用的活动,并且知识图940可以经由连接属性或连接性分数来指示该频率排名。
知识图940可以是动态变化的实体,该实体利用来自数据储存库941和相关联的爬虫之中的新使用活动信息以及来自洞察服务或洞察平台提供的正在进行的用户活动来增强。知识生成器922在图9中使用知识绘图过程来确定用户/组织活动或动作的图形表示940内的关键活动和动作中枢。关键中枢根据相关性或知识置信水平被分配置信度水平或进行排名,并且可以随时间变化。置信度水平可以转化为稍后由新目标数据集的洞察服务从知识储存库形成的洞察对象的排名。中枢排名还可以考虑新近度/时间考虑因素、数据共享重要性、人员/用户数据数量或分享的分析、分析使用的量、分析或洞察对象访问的量、或文档/报告中的优势、以及其它因素。
知识图940识别与用户或组织相关的操作知识。该操作知识可以存储在包括一个或多个存储设备的知识储存库923中。可以采用各种图形分析服务或程序来确定操作知识,例如Graph或其他软件。知识储存库923可以包括以活动信号或使用模态的形式记录操作知识的数据字典。随后由洞察服务引用或搜索知识储存库923,以确定相关联的洞察对象、洞察概要/结论、洞察预计、和洞察对象元数据,以及与洞察相关的其他信息。
诸如由知识储存库923提供的数据字典允许用户以“语言”或根据更接近地映射到用户通常如何利用或讨论相关联数据集的习惯来分析数据。知识储存库923可以将用户可能用来描述与所描述的项目相关联的数据的项映射到实际数据。通过利用表示先前或过去用户分析的图表、表格、数据透视表和公式,以及作为共享这些分析的上下文的电子表格、报告、仪表板、演示、电子邮件和文档,知识生成器922可以获得有关用户如何将数据映射到实际使用的强信号。知识推断还可以包括由用户为创建文档或分析数据而采取的动作,包括基于文件属性、文档类型、文档内容以及其他文档或文件属性和内容的“谁、什么、何地、何时”推断。可以采用机器智能和各种图形分析工具以通过观察从活动信号中提取的用户活动或模态来生成数据字典。
将数据分析偏好960作为来自知识服务921的输出提供给洞察平台,例如洞察平台120。可以采用对活动、数据集或其他信息的指示来从洞察平台120查询961知识服务921以检索数据分析偏好960,该数据分析偏好960与当前用户活动或当前洞察处理活动相关或者可以应用于当前用户活动或当前洞察处理活动。例如,响应于由洞察服务进行的查询,可以提供一个或多个“知识结果”。知识服务921可以至少基于使用知识图940识别的用于表示活动信号的至少一部分的活动节点的连接级别来从活动信号之中推断数据分析偏好。如在知识图940中可以看到的,两个活动中枢941-942可以指示活动信号的两个连结,其可以用于推断呈现、分析或描述数据集的优选方式。知识服务921可以至少基于由知识图940确定的在数据分析偏好中的一些和与查询961(如由数据洞察服务发出的)包括在一起的数据之间的图形关系来选择数据分析偏好中的一些以提供给请求数据洞察服务。与查询961包括在一起的数据可以指示一个或多个用户的当前数据分析活动、以及其他信息,包括用户身份、组织身份、应用身份、数据集信息或其他信息。
在特定示例中,在用户使用应用(例如电子表格应用)期间,用户可能希望接收加载到电子表格应用中的数据集的一个或多个数据洞察。相关联的洞察服务(例如洞察服务121)可以在查询961中向知识储存库923提供输入。这些输入可以包括在知识查询961中,并且包括用户信息、用户身份、数据集、数据源、应用身份和信息、以及用户活动信息。基于该信息,知识服务921可以选择指示与查询相关的数据分析偏好960的一个或多个知识结果。数据分析偏好可以包括图形或对象类型、字段聚合偏好、列/行/标题命名偏好、格式化偏好、其他数据分析偏好。数据分析偏好可以包括计算或数据处理偏好以及数据可视化或描述偏好。
知识储存库923可以根据一个或多个范围属性或类别来存储数据分析偏好。例如,可以在每用户、每组织、每租户、每应用、或全局/一般基础上存储数据分析偏好。知识查询961可以指示与当前洞察处理相关联的与用户、组织、租户、应用或其他范围相关的属性,并且查询中提供的该范围可以由知识储存库932用于返回与该范围相对应的适当数据分析偏好以及相关联的安全权限(如果有的话)。还可以执行从由知识生成器922确定的根数据分析偏好到相关联子类别和范围的存储扇出,以确保每个受影响的范围与相关联的推断数据分析偏好相关。知识储存库923可以以表格格式或图形格式以及其他数据存储格式来存储数据分析偏好。
活动信号从使用活动源930以及其他源中确定,并且可以指示用户如何执行分析以及用户用来传送分析的语言或传统。可以基于这些活动信号和语言/传统来确定对数据分析偏好和操作知识的推断,并且这些推断可以用于洞察生成中。洞察生成可以跨越整个应用或平台跨越各种用户、客户、组织或全局。有利地,用户对各种数据集执行更有效的数据分析,并且可以通过从用于过去数据分析的现有传统或部落知识启动数据分析来执行分析。可以加速用于处理大型和复杂数据集的数据分析、合成和可视化过程,并使其与用户更相关。可以实现对用于数据分析的处理资源的更有效使用,并且还可以确定针对特定设备形状因子的分析。
现在转到图10,给出了计算系统1001。计算系统1001表示其中可以实现本文所公开的各种操作架构、场景和过程的任何系统或系统集合。例如,计算系统1001可以用于实现图1的用户平台110或洞察平台120或图8的平台820中的任何一个。计算系统1001的示例包括但不限于服务器计算机、云计算系统、分布式计算系统、软件定义的网络系统、计算机、台式计算机、混合计算机、机架服务器、web服务器、云计算平台、和数据中心设备、以及任何其他类型的物理或虚拟服务器机器、和其他计算系统和设备、以及其任何变型或组合。当计算系统1001的部分在用户设备上实现时,示例性设备包括智能电话、膝上型计算机、平板计算机、台式计算机、游戏系统、娱乐系统等等。
计算系统1001可以实现为单个装置、系统或设备,或者可以以分布式方式实现为多个装置、系统或设备。计算系统1001包括但不限于处理系统1002、存储系统1003、软件1005、通信接口系统1007以及用户接口系统1008。处理系统1002与存储系统1003、通信接口系统1007和用户接口系统1008操作地耦合。
处理系统1002从存储系统1003加载并执行软件1005。软件1005包括洞察环境1006和/或信号环境1009,其表示针对前述附图所讨论的过程。当由处理系统1002执行以增强数据洞察可视化和活动知识推断时,软件1005指导处理系统1002如本文所描述地至少针对前述实现方式中讨论的各种过程、操作场景和环境来进行操作。计算系统1001可以可选地包括为简洁起见未讨论的另外设备、特征或功能。
仍然参考图10,处理系统1002可以包括从存储系统1003检索并执行软件1005的微处理器和处理电路。处理系统1002可以在单个处理设备内实现,但也可以跨协作执行程序指令的多个处理设备或子系统分布。处理系统1002的示例包括通用中央处理单元、专用处理器和逻辑器件、以及任何其他类型的处理设备、其组合或变型。
存储系统1003可以包括可由处理系统1002读取并且能够存储软件1005的任何计算机可读存储介质。存储系统1003可以包括以用于存储信息(例如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。存储介质的各示例包括随机存取存储器、只读存储器、磁盘、电阻存储器、光盘、闪存、虚拟存储器和非虚拟存储器、盒式磁带、磁带、磁盘存储或其他磁存储设备、或任何其他合适的存储介质。在任何情况下,计算机可读存储介质都不是传播的信号。
除了计算机可读存储介质之外,在一些实现方式中,存储系统1003还可以包括计算机可读通信介质,通过该计算机可读通信介质可以在内部或在外部传送至少一些软件1005。存储系统1003可以实现为单个存储设备,但也可以跨相对于彼此共置或分布的多个存储设备或子系统实现。存储系统1003可以包括能够与处理系统1002或可能的其他系统进行通信的另外元件,例如控制器。
软件1005可以在程序指令中实现,并且除了其它功能之外,在由处理系统1002执行时还可以指导处理系统1002以如针对本文所示出的各种操作方案、序列和过程所描述的进行操作。例如,软件1005可以包括用于实现本文所讨论的数据集处理环境和平台的程序指令。
具体而言,程序指令可以包括协作或以其他方式交互以执行本文所描述的各种过程和操作场景的各种组件或模块。各种组件或模块可以体现在经编译或经解释的指令中,或者体现在指令的一些其他变型或组合中。可以以同步或异步方式、串行或并行、在单线程环境或多线程中、或根据任何其他合适的执行范例、变型或其组合来执行各种组件或模块。除了或包括洞察环境1006或信号环境1009之外,软件1005还可以包括另外的过程、程序或组件,诸如操作系统软件或其他应用软件。软件1005还可以包括可由处理系统1002执行的固件或某种其他形式的机器可读处理指令。
通常,软件1005在被加载到处理系统1002中并且被执行时可以将(计算系统1001所代表的)合适装置、系统或设备整体从通用计算系统转换成被定制为促进增强的数据洞察可视化和活动知识推断的专用计算系统。实际上,存储系统1003上的编码软件1005可以变换存储系统1003的物理结构。物理结构的特定变换可以取决于本说明书的不同实现方式中的各种因素。这些因素的示例可以包括但不限于用于实现存储系统1003的存储介质的技术以及计算机存储介质是被表征为主存储还是二级存储、以及其他因素。
例如,如果计算机可读存储介质被实现为基于半导体的存储器,则软件1005可以在程序指令被编码在其中时变换半导体存储器的物理状态,例如通过变换构成半导体存储器的晶体管、电容器或其他分立电路元件的状态。针对磁性或光学介质可以发生类似的变换。在不脱离本说明书的范围的情况下,物理介质的其他变换是可能的,其中提供前述示例仅仅是为了便于本讨论。
洞察环境1006或信号环境1009均包括一个或多个软件元件,例如OS1021/1031和应用1022/1032。这些元素可以描述计算系统1001的各个部分,其中用户、数据集源、遥测元件、机器学习环境或其他元件与这些部分交互。例如,OS 1021/1031可以提供执行应用1022/1032的软件平台,并允许针对洞察和可视化来处理数据集,处理来自各种源的数据文件以形成活动知识和使用模态,并建立洞察对象的移动设备可移植性,以及其他功能。
在一个示例中,洞察处理器1023包括数据集处理程序1024和可视化生成器1025。数据集处理程序1024标识与用户新输入以及先前由用户存储的用户数据相关联的数据集。数据集处理程序1024可以处理数据集以识别与数据集相关联的洞察和洞察对象。可视化生成器1025为目标数据集生成数据洞察对象,这些数据洞察对象包括图形可视化部分、数据描述、用于呈现给用户的对象洞察部分、以及指示至少用于产生该数据洞察对象的处理世系的对象元数据部分。洞察处理器1032可以提供数据洞察对象以供由洞察界面例如通过接口系统1007或接口系统1008呈现给用户应用。可视化生成器1025至少基于与处理一个或多个过去数据集相关联的使用模态来确定针对目标数据集的数据洞察候选,并根据目标数据集和使用模态建立数据洞察候选的内容。可视化生成器1025还可以将所选择的数据洞察对象和世系元数据与目标数据集进行关联,以供稍后在替代计算设备(例如移动设备或非移动设备)上使用。
在另一示例中,活动信号处理器1033包括使用处理器1034和知识生成器1035。使用处理器1034将数据存储服务识别为与一个或多个用户的应用使用活动相关的使用数据的源,并提取使用数据的指示至少该一个或多个用户的应用使用活动的部分。知识生成器1035将应用使用活动应用于知识图形服务,该知识图形服务被配置为:从应用使用活动中确定一个或多个用户的活动信号,并将从活动信号导出的数据分析偏好存储在知识储存库中。知识生成器1035与洞察服务(例如洞察处理器1023)对接,以产生数据洞察对象,其中每个数据洞察对象包括用于呈现给用户的对象洞察部分和指示至少用于产生该数据洞察对象的处理世系的对象元数据部分。
通信接口系统1007可以包括允许通过通信网络(未示出)与其他计算系统(未示出)进行通信的通信连接和设备。一起允许系统间通信的连接和设备的示例可以包括网络接口卡、天线、功率放大器、RF电路、收发机以及其他通信电路。连接和设备可以通过通信介质进行通信,以便与其他计算系统或系统网络(例如金属、玻璃、空气、或任何其他合适的通信介质)交换通信。通信接口系统1007的物理或逻辑元件可以从遥测源接收数据集,在一个或多个分布式数据存储元件之间传输数据集和控制信息,并与用户对接以接收数据选择并提供可视化数据集,以及其他特征。
用户接口系统1008是可选的,并且可以包括用于接收来自用户的输入的键盘、鼠标、语音输入设备、触摸输入设备。用户接口系统1008中也可以包括诸如显示器、扬声器、web接口、终端接口之类的输出设备,以及其他类型的输出设备。用户接口系统1008可以通过网络接口(例如通信接口系统1007)提供输出和接收输入。在网络示例中,用户接口系统1008可以通过耦合在一个或多个网络接口上的显示系统或计算系统来打包显示或图形数据以供远程显示。用户接口系统1008的物理或逻辑元素可以从用户或其他运营商接收数据集或洞察选择信息,并向用户或其他运营商提供经处理的数据集、洞察对象、活动知识或其他信息。用户接口系统1008还可以包括可由处理系统1002执行的相关联用户接口软件,以支持上面讨论的各种用户输入和输出设备。用户接口软件和用户接口设备可以单独地或彼此结合以及与其他硬件和软件元件结合地支持图形用户接口、自然用户接口、或任何其他类型的用户接口。
计算系统1001与其他计算系统(未示出)之间的通信可以在一个或多个通信网络上并且根据各种通信协议、协议的组合或其变型来发生。示例包括内联网、互联网、因特网、局域网、广域网、无线网络、有线网络、虚拟网络、软件定义网络、数据中心总线、计算背板、或任何其他类型的网络、网络的组合或其变型。前述通信网络和协议是众所周知的,并且在此不需要详细讨论。然而,可以使用的一些通信协议包括但不限于互联网协议(IP、IPv4、IPv6等等)、传输控制协议(TCP)和用户数据报协议(UDP)、以及任何其他合适的通信协议、变型或其组合。
从前述公开内容可以理解某些发明方面,其中以下是各种示例。
示例1:一种用于向用户应用提供数据可视化框架的方法,该方法包括:识别目标数据集,从该目标数据集确定一个或多个数据洞察以在用户应用的洞察界面中呈现;至少基于与处理一个或多个过去数据集相关联的使用模态来确定针对目标数据集的数据洞察候选;以及根据至少目标数据集和使用模态来建立数据洞察候选的内容,其中,数据洞察候选中的每个数据洞察候选的内容包括由对象元数据描述的至少一个洞察对象,该对象元数据至少指示用于产生该至少一个洞察对象的处理世系。
示例2:根据示例1所述的方法,还包括:至少基于接收在洞察界面中呈现的数据洞察候选的列表之中对第一数据洞察候选的用户选择,产生第一数据洞察候选以包括在用户应用的用户界面中。
示例3:根据示例1-2所述的方法,还包括:以根据基于使用模态的至少相关性确定的经排序顺序来呈现数据洞察候选。
示例4:根据示例1-3所述的方法,其中,内容还包括数据分析结论措辞,该数据分析结论措辞文本地概括该至少一个数据洞察对象;并且该方法还包括:至少基于针对目标数据集中的数据模式分析目标数据集来确定数据洞察候选中的每个数据洞察候选的数据分析结论措辞,并且选择数据分析结论措辞以将数据模式体现给用户。
示例5:根据示例1-4所述的方法,其中,指示处理世系的对象元数据包括以下各项中的至少一项:用于生成该至少一个洞察对象的公式、用于将该至少一个洞察对象包括在相关联的数据洞察候选中的基本原理、以及在将目标数据集处理成该至少一个洞察对象时使用的中间步骤。
示例6:根据示例1-5所述的方法,其中,对象元数据被配置为:当该至少一个洞察对象被嵌入到与识别目标数据集的用户应用不同的另一用户应用相关联的文档中时伴随该至少一个洞察对象。
示例7:根据示例1-6所述的方法,还包括:基于选择第一数据洞察候选的推断链表示的用户指示,至少基于目标数据集和与第一数据洞察候选相关联的对象元数据来产生包括一个或多个图形、图表或表格的推断链表示;其中,推断链表示包括对在将目标数据集处理成第一数据洞察候选的洞察对象时使用的一个或多个中间步骤的可视化。
示例8:根据示例1-7所述的方法,其中,使用模态包括对过去应用使用模式的指示,该过去应用使用模式是从过去数据分析、组织分析偏好、用户数据文件、以及用户应用遥测记录中的一个或多个中导出的。
示例9:一种数据可视化框架,包括:一个或多个计算机可读存储介质;与该一个或多个计算机可读存储介质操作地耦合的处理系统;以及包括存储在该一个或多个计算机可读存储介质上的程序指令的数据洞察服务。基于被处理系统读取和执行,程序指令指示该处理系统进行至少以下操作:识别目标数据集,从该目标数据集确定一个或多个数据可视化以在用户应用的洞察界面中呈现;至少基于与处理一个或多个过去数据集相关联的使用模态来确定针对目标数据集的数据洞察候选;以及根据至少目标数据集和使用模态来建立数据洞察候选的内容,其中,数据洞察候选中的每个数据洞察候选的内容包括由对象元数据描述的至少一个洞察对象,该对象元数据指示用于产生该至少一个洞察对象的至少处理世系。
示例10:根据示例9所述的数据可视化框架,包括基于被处理系统执行而指示该处理系统进行至少以下操作的另外程序指令:至少基于接收在洞察界面中呈现的数据洞察候选的列表之中对第一数据洞察候选的用户选择,产生第一数据洞察候选以包括在用户应用的用户界面中。
示例11:根据示例9-10所述的数据可视化框架,包括基于被处理系统执行而指示该处理系统进行至少以下操作的另外程序指令:在根据基于使用模态的至少相关性来确定的经排序顺序中呈现数据洞察候选。
示例12:根据示例9-11所述的数据可视化框架,其中,内容还包括数据分析结论措辞,该数据分析结论措辞文本地概括该至少一个数据洞察对象;并且包括基于被处理系统执行而指示该处理系统进行至少以下操作的另外程序指令:至少基于针对目标数据集中的数据模式分析目标数据集来确定每个数据洞察候选的数据分析结论措辞;以及选择该数据分析结论措辞以将数据模式体现给用户。
示例13:根据示例9-12所述的数据可视化框架,其中,指示处理世系的对象元数据包括以下各项中的至少一项:用于生成该至少一个洞察对象的公式、用于将该至少一个洞察对象包括在相关联的数据洞察候选中的基本原理、以及在将对象数据集处理成该至少一个洞察对象时使用的中间步骤。
示例14:根据示例9-13所述的数据可视化框架,其中,对象元数据被配置为:当该至少一个洞察对象被嵌入到与识别目标数据集的用户应用不同的另一用户应用相关联的文档中时伴随该至少一个洞察对象。
示例15:根据示例9-14所述的数据可视化框架,包括基于被处理系统执行而指示该处理系统进行至少以下操作的另外程序指令:基于选择第一数据洞察候选的推断链表示的用户指示,至少基于目标数据集和与第一数据洞察候选相关联的对象元数据来产生包括一个或多个图形、图表或表格的推断链表示;其中,推断链表示包括对在将目标数据集处理成第一数据洞察候选的洞察对象时使用的中间步骤的可视化。
示例16:根据示例9-15所述的数据可视化框架,其中,使用模态包括对过去应用使用模式的指示,该过去应用使用模式是从过去数据分析、组织分析偏好、用户数据文件、以及用户应用遥测记录中的一个或多个中导出的。
示例17:一种对用户应用平台进行操作的方法,包括:呈现电子表格应用的包括工作簿部分的用户界面,用户从该工作簿部分识别用于数据洞察服务的目标数据集;将目标数据集提供给数据洞察服务,并且作为响应,接收针对目标数据集的至少一部分的一个或多个候选数据洞察,该一个或多个候选数据洞察是至少基于部分地以用户的过去使用模态为基础建立的数据分析偏好来确定的;以及呈现电子表格应用的洞察用户界面,该洞察用户界面列出候选数据洞察。响应于用户识别所选择的候选数据洞察,该方法包括:将所选择的候选数据洞察插入到工作簿部分中并将所选择的候选数据洞察与表示用于产生所选择的候选数据洞察的处理世系的元数据进行关联。
示例18:根据示例17所述的方法,还包括:以根据从数据分析偏好确定的至少相关性的经排序顺序来呈现数据洞察候选。
示例19:根据示例17-18所述的方法,其中,元数据包括以下各项中的至少一项:用于生成至少一个洞察对象的公式、在所选择的候选数据洞察中呈现的结论的基本原理、以及在将目标数据集处理成所选择的候选数据洞察时使用的中间步骤。
示例20:根据示例17-19所述的方法,还包括:基于选择所选择的候选数据洞察的推断链表示的用户指示,至少基于目标数据集和与所选择的候选数据洞察相关联的元数据来产生包括一个或多个图形、图表或表格的推断链表示;其中,推断链表示包括对在将目标数据集处理成所选择的候选数据洞察的洞察对象时使用的中间步骤的可视化。
附图中提供的功能框图、操作方案和序列、以及流程图表示用于执行本公开内容的新颖方面的示例性系统、环境和方法。虽然为了简化说明的目的,本文所包括的方法可以具有功能图、操作场景或序列、或流程图的形式,并且可以被描述为一系列动作,但要理解并意识到,各方法不受动作顺序的限制,因为根据方法的一些动作可以以不同的顺序发生和/或与本文所示出和描述的其他动作同时发生。例如,本领域技术人员将理解并意识到,方法可以替代地表示为例如状态图中的一系列相互关的状态或事件。此外,对于新颖性实现方式可能并不需要方法中所示出的所有动作。
本文所包括的描述和附图描绘了特定实现方式以教导本领域技术人员如何制作和使用最佳选项。出于教导发明原理的目的,已经简化或省略了一些常规方面。本领域技术人员将意识到落入本公开内容的范围内的这些实现方式的变型。本领域技术人员还将意识到,上述特征可以以各种方式组合以形成多个实现方式。因此,本发明不限于上述特定实现方式,而是仅由权利要求及其等效方案限制。

Claims (15)

1.一种用于向用户应用提供数据可视化框架的方法,所述方法包括:
识别目标数据集,从所述目标数据集确定一个或多个数据洞察以在所述用户应用的洞察界面中呈现;
至少基于与处理一个或多个过去数据集相关联的使用模态来确定针对所述目标数据集的数据洞察候选;以及
根据至少所述目标数据集和所述使用模态来建立所述数据洞察候选的内容,其中,所述数据洞察候选中的每个数据洞察候选的内容包括由对象元数据描述的至少一个洞察对象,所述对象元数据至少指示用于产生所述至少一个洞察对象的可显示处理世系,其中,所述可显示处理世系包括用于将所述目标数据集处理成所述至少一个洞察对象的中间步骤;
显示所述至少一个洞察对象以及用于生成所述至少一个洞察对象的所述可显示处理世系;
显示与所显示的洞察对象相关的多个可选择的目标问题;
接收对所述目标问题之一的选择;以及
显示详细说明响应于所述选择而选取所显示的洞察对象的原因的基本原理。
2.根据权利要求1所述的方法,还包括:
至少基于接收在所述洞察界面中呈现的所述数据洞察候选的列表之中对第一数据洞察候选的用户选择,产生所述第一数据洞察候选以包括在所述用户应用的用户界面中;以及
以根据基于所述使用模态的至少相关性确定的经排序顺序来呈现所述数据洞察候选。
3.根据权利要求1所述的方法,其中,所述内容还包括数据分析结论措辞,所述数据分析结论措辞文本地概括所述至少一个数据洞察对象;并且所述方法还包括:
至少基于针对所述目标数据集中的数据模式分析所述目标数据集来确定所述数据洞察候选中的每个数据洞察候选的数据分析结论措辞,并且选择所述数据分析结论措辞以将所述数据模式体现给所述用户。
4.根据权利要求1所述的方法,其中,指示所述处理世系的所述对象元数据包括用于生成所述至少一个洞察对象的公式;并且
其中,所述对象元数据被配置为:当所述至少一个洞察对象嵌入到与识别所述目标数据集的所述用户应用不同的另一用户应用相关联的文档中时伴随所述至少一个洞察对象。
5.根据权利要求1所述的方法,还包括:
基于选择第一数据洞察候选的推断链表示的用户指示,至少基于所述目标数据集和与所述第一数据洞察候选相关联的所述对象元数据来产生包括一个或多个图形、图表或表格的所述推断链表示;
其中,所述推断链表示包括对在将所述目标数据集处理成所述第一数据洞察候选的洞察对象时使用的一个或多个中间步骤的可视化。
6.根据权利要求1所述的方法,其中,所述使用模态包括对过去应用使用模式的指示,所述过去应用使用模式是从过去数据分析、组织分析偏好、用户数据文件、以及用户应用遥测记录中的一个或多个中导出的。
7.一种数据可视化框架,包括:
一个或多个计算机可读存储介质;
与所述一个或多个计算机可读存储介质操作地耦合的处理系统;以及
包括存储在所述一个或多个计算机可读存储介质上的程序指令的数据洞察服务,所述程序指令基于被所述处理系统读取和执行而指导所述处理系统进行至少以下操作:
识别目标数据集,从所述目标数据集确定一个或多个数据可视化以在用户应用的洞察界面中呈现;
至少基于与处理一个或多个过去数据集相关联的使用模态来确定针对所述目标数据集的数据洞察候选;以及
根据至少所述目标数据集和所述使用模态来建立所述数据洞察候选的内容,其中,所述数据洞察候选中的每个数据洞察候选的内容包括由对象元数据描述的至少一个洞察对象,所述对象元数据至少指示用于产生所述至少一个洞察对象的可显示处理世系,其中,所述可显示处理世系包括用于将所述目标数据集处理成所述至少一个洞察对象的中间步骤;
显示所述至少一个洞察对象以及用于生成所述至少一个洞察对象的所述可显示处理世系;
显示与所显示的洞察对象相关的多个可选择的目标问题;
接收对所述目标问题之一的选择;以及
显示详细说明响应于所述选择而选取所显示的洞察对象的原因的基本原理。
8.根据权利要求7所述的数据可视化框架,包括基于被所述处理系统执行而指导所述处理系统进行至少以下操作的另外程序指令:
至少基于接收在所述洞察界面中呈现的所述数据洞察候选的列表之中对第一数据洞察候选的用户选择,产生所述第一数据洞察候选以包括在所述用户应用的用户界面中;以及
以根据基于所述使用模态的至少相关性确定的经排序顺序来呈现所述数据洞察候选。
9.根据权利要求7所述的数据可视化框架,其中,所述内容还包括数据分析结论措辞,所述数据分析结论措辞文本地概括所述至少一个洞察对象;并且包括基于被所述处理系统执行而指导所述处理系统进行至少以下操作的另外程序指令:
至少基于针对所述目标数据集中的数据模式分析所述目标数据集来确定所述数据洞察候选中的每个数据洞察候选的数据分析结论措辞;以及
选择所述数据分析结论措辞以将所述数据模式体现给所述用户。
10.根据权利要求7所述的数据可视化框架,其中,指示所述处理世系的所述对象元数据包括用于生成所述至少一个洞察对象的公式;并且其中,所述对象元数据被配置为:当所述至少一个洞察对象被嵌入到与识别所述目标数据集的所述用户应用不同的另一用户应用相关联的文档中时伴随所述至少一个洞察对象。
11.根据权利要求7所述的数据可视化框架,包括基于被所述处理系统执行而指导所述处理系统进行至少以下操作的另外程序指令:
基于选择第一数据洞察候选的推断链表示的用户指示,至少基于所述目标数据集和与所述第一数据洞察候选相关联的所述对象元数据来产生包括一个或多个图形、图表或表格的所述推断链表示;
其中,所述推断链表示包括对在将所述目标数据集处理成所述第一数据洞察候选的洞察对象时使用的中间步骤的可视化。
12.根据权利要求7所述的数据可视化框架,其中,所述使用模态包括对过去应用使用模式的指示,所述过去应用使用模式是从过去数据分析、组织分析偏好、用户数据文件、以及用户应用遥测记录中的一个或多个中导出的。
13.一种对用户应用平台进行操作的方法,包括:
呈现电子表格应用的包括工作簿部分的用户界面,用户从所述工作簿部分识别用于数据洞察服务的目标数据集;
将所述目标数据集提供给所述数据洞察服务,并且作为响应,接收针对所述目标数据集的至少一部分的一个或多个候选数据洞察,所述一个或多个候选数据洞察是至少基于部分地以所述用户的过去使用模态为基础建立的数据分析偏好来确定的;
呈现所述电子表格应用的洞察用户界面,所述洞察用户界面以根据从所述数据分析偏好确定的至少相关性的经排序顺序来列出所述候选数据洞察;以及
响应于所述用户识别所选择的候选数据洞察,将所选择的候选数据洞察插入到所述工作簿部分中并将所选择的候选数据洞察与表示用于产生所选择的候选数据洞察的可显示处理世系的元数据进行关联,其中,所述可显示处理世系包括用于将所述目标数据集处理成所选择的候选数据洞察的中间步骤;
呈现所述候选数据洞察以及用于生成所述候选数据洞察的所述可显示处理世系;
呈现与所述候选数据洞察相关的多个可选择的目标问题;
接收对所述目标问题之一的选择;以及
呈现显示详细说明响应于所述选择而选取所述候选数据洞察的原因的基本原理。
14.根据权利要求13所述的方法,其中,所述元数据包括用于生成所述至少一个洞察对象的公式。
15.根据权利要求13所述的方法,还包括:
基于选择所选择的候选数据洞察的推断链表示的用户指示,至少基于所述目标数据集和与所选择的候选数据洞察相关联的元数据来产生包括一个或多个图形、图表或表格的所述推断链表示;
其中,所述推断链表示包括对在将所述目标数据集处理成所选择的候选数据洞察的洞察对象时使用的中间步骤的可视化。
CN201780069380.6A 2016-11-08 2017-11-02 作为便携式用户应用对象的洞察对象 Active CN109923535B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662418991P 2016-11-08 2016-11-08
US62/418,991 2016-11-08
US15/487,066 2017-04-13
US15/487,066 US10620790B2 (en) 2016-11-08 2017-04-13 Insight objects as portable user application objects
PCT/US2017/059637 WO2018089242A1 (en) 2016-11-08 2017-11-02 Insight objects as portable user application objects

Publications (2)

Publication Number Publication Date
CN109923535A CN109923535A (zh) 2019-06-21
CN109923535B true CN109923535B (zh) 2023-07-18

Family

ID=62064454

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780069380.6A Active CN109923535B (zh) 2016-11-08 2017-11-02 作为便携式用户应用对象的洞察对象

Country Status (4)

Country Link
US (1) US10620790B2 (zh)
EP (1) EP3539020A1 (zh)
CN (1) CN109923535B (zh)
WO (1) WO2018089242A1 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11188845B2 (en) 2017-09-29 2021-11-30 Oracle International Corporation System and method for data visualization using machine learning and automatic insight of segments associated with a set of data
US11182538B2 (en) 2018-08-01 2021-11-23 Microsoft Technology Licensing, Llc Conversational user interface logic for cross-application ingestion and restructuring of content
US11113447B2 (en) 2018-08-01 2021-09-07 Microsoft Technology Licensing, Llc Cross-application ingestion and restructuring of slide presentation content
US11295073B2 (en) * 2018-08-01 2022-04-05 Microsoft Technology Licensing, Llc Cross-application ingestion and restructuring of spreadsheet content
US11681760B2 (en) 2018-08-01 2023-06-20 Microsoft Technology Licensing, Llc Cross-application ingestion and restructuring of content
USD900857S1 (en) * 2018-11-21 2020-11-03 Yokogawa Electric Corporation Display screen or portion thereof with graphical user interface
CN114637560A (zh) * 2020-12-16 2022-06-17 伊姆西Ip控股有限责任公司 设备管理方法、电子设备和计算机程序产品
EP4298491A1 (en) * 2021-02-26 2024-01-03 Finicast, Inc. Apparatus and method for forming pivot tables from pivot frames
US11900133B2 (en) * 2021-12-01 2024-02-13 Microsoft Technology Licensing, Llc Discovery and suggestions for unstructured tables in spreadsheets
US11829705B1 (en) * 2022-09-21 2023-11-28 Adobe Inc. Facilitating generation and presentation of advanced insights

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750847A (zh) * 2015-04-10 2015-07-01 河海大学 一种基于动态平行坐标的关联规则可视化系统及方法
CN105474231A (zh) * 2013-08-02 2016-04-06 微软技术许可有限责任公司 对数据的自动识别和洞察

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6236994B1 (en) * 1997-10-21 2001-05-22 Xerox Corporation Method and apparatus for the integration of information and knowledge
US20020199156A1 (en) * 2001-05-23 2002-12-26 Fuel Tech, Inc. Hardware-adaptable data visualization tool for use in complex data analysis and engineering design
US7519589B2 (en) * 2003-02-04 2009-04-14 Cataphora, Inc. Method and apparatus for sociological data analysis
CA2499513A1 (en) * 2002-09-20 2004-04-01 Board Of Regents, University Of Texas System Computer program products, systems and methods for information discovery and relational analysis
US20050026173A1 (en) * 2003-02-27 2005-02-03 Methexis Genomics, N.V. Genetic diagnosis using multiple sequence variant analysis combined with mass spectrometry
US7725300B2 (en) * 2004-04-16 2010-05-25 Fortelligent, Inc. Target profiling in predictive modeling
US8170841B2 (en) * 2004-04-16 2012-05-01 Knowledgebase Marketing, Inc. Predictive model validation
US20070118399A1 (en) * 2005-11-22 2007-05-24 Avinash Gopal B System and method for integrated learning and understanding of healthcare informatics
US9021416B2 (en) * 2007-05-16 2015-04-28 Accenture Global Service Limited Recommended application evaluation system
US20110126128A1 (en) * 2009-09-28 2011-05-26 Future Insight Maps, Inc. Future insight maps and associated tools
US20110084967A1 (en) * 2009-10-09 2011-04-14 International Business Machines Corporation Visualization of Datasets
US8135667B2 (en) * 2009-12-31 2012-03-13 Teradata Us, Inc. System, method, and computer-readable medium that facilitate in-database analytics with supervised data discretization
US8839133B2 (en) * 2010-12-02 2014-09-16 Microsoft Corporation Data visualizations including interactive time line representations
US9024952B2 (en) * 2010-12-17 2015-05-05 Microsoft Technology Licensing, Inc. Discovering and configuring representations of data via an insight taxonomy
US20120218254A1 (en) 2011-02-28 2012-08-30 Microsoft Corporation Data visualization design and view systems and methods
US9058409B2 (en) * 2011-10-25 2015-06-16 International Business Machines Corporation Contextual data visualization
US8990686B2 (en) 2011-11-02 2015-03-24 Microsoft Technology Licensing, Llc Visual navigation of documents by object
US9461876B2 (en) * 2012-08-29 2016-10-04 Loci System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction
US9824127B2 (en) 2012-10-22 2017-11-21 Workday, Inc. Systems and methods for interest-driven data visualization systems utilized in interest-driven business intelligence systems
WO2014121272A2 (en) * 2013-02-04 2014-08-07 Quake Stephen R Measurement and comparison of immune diversity by high-throughput sequencing
US20140244837A1 (en) * 2013-02-26 2014-08-28 Adience SER LTD Determining a user's identity from an interaction with an identifiable service
US9213472B2 (en) 2013-03-12 2015-12-15 Sap Se User interface for providing supplemental information
US9128994B2 (en) * 2013-03-14 2015-09-08 Microsoft Technology Licensing, Llc Visually representing queries of multi-source data
AU2014100876A4 (en) 2013-08-06 2014-09-04 New Bis Safe Luxco S.À R.L Methods, apparatus and systems for data visualisation and related applications
US10089407B2 (en) * 2013-09-20 2018-10-02 Salesforce.Com, Inc. Systems, methods, and apparatuses for implementing analytics on demand functionality
US10572473B2 (en) 2013-10-09 2020-02-25 International Business Machines Corporation Optimized data visualization according to natural language query
WO2015060893A1 (en) * 2013-10-22 2015-04-30 Platfora, Inc. Systems and methods for interest-driven data visualization systems utilizing visualization image data and trellised visualizations
WO2015103698A1 (en) 2014-01-11 2015-07-16 Vantage Analytics Inc. System, method and/or computer readable media for data ingestion, cleansing, transformation, visualization, insight generation, recommendation engine-driven actions, advertising deployment and optimization
US20150278214A1 (en) 2014-04-01 2015-10-01 Tableau Software, Inc. Systems and Methods for Ranking Data Visualizations Using Different Data Fields
US9286290B2 (en) 2014-04-25 2016-03-15 International Business Machines Corporation Producing insight information from tables using natural language processing
US10606855B2 (en) 2014-07-10 2020-03-31 Oracle International Corporation Embedding analytics within transaction search
US9830370B2 (en) 2014-09-18 2017-11-28 Business Objects Software Ltd. Visualization suggestion application programming interface
US10007708B2 (en) * 2014-10-31 2018-06-26 Business Objects Software Ltd. System and method of providing visualization suggestions
US20170185917A1 (en) * 2015-12-29 2017-06-29 Cognitive Scale, Inc. Method for Monitoring Interactions to Build a Cognitive Profile
US10713575B2 (en) * 2015-12-29 2020-07-14 Cognitive Scale, Inc. Cognitive insight interaction monitor

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105474231A (zh) * 2013-08-02 2016-04-06 微软技术许可有限责任公司 对数据的自动识别和洞察
CN104750847A (zh) * 2015-04-10 2015-07-01 河海大学 一种基于动态平行坐标的关联规则可视化系统及方法

Also Published As

Publication number Publication date
EP3539020A1 (en) 2019-09-18
CN109923535A (zh) 2019-06-21
US10620790B2 (en) 2020-04-14
WO2018089242A1 (en) 2018-05-17
US20180129373A1 (en) 2018-05-10

Similar Documents

Publication Publication Date Title
CN109923568B (zh) 用于数据分析的移动数据洞察平台
CN109923535B (zh) 作为便携式用户应用对象的洞察对象
US20180129372A1 (en) Dynamic insight objects for user application data
US10984333B2 (en) Application usage signal inference and repository
US9852648B2 (en) Extraction of knowledge points and relations from learning materials
Dadzie et al. Visualisation of linked data–reprise
US20220004705A1 (en) Personalization of content suggestions for document creation
US11966873B2 (en) Data distillery for signal detection
Soylu et al. Mashups by orchestration and widget‐based personal environments: key challenges, solution strategies, and an application
US10671415B2 (en) Contextual insight generation and surfacing on behalf of a user
US10860656B2 (en) Modular data insight handling for user application data
US11681760B2 (en) Cross-application ingestion and restructuring of content
US11182748B1 (en) Augmented data insight generation and provision
US10209869B2 (en) Persistent application interface management
US11898890B2 (en) User interfaces for displaying discretized elements of logical flow systems
US11323526B2 (en) Analysis and visualization of session paths
Chundury et al. Contextual in situ help for visual data interfaces
US20180107744A1 (en) Exploratory search
US20130265326A1 (en) Discovering a reporting model from an existing reporting environment
US20230027897A1 (en) Rapid development of user intent and analytic specification in complex data spaces
Gudenkauf et al. A Concept and a Multitenant Web Application for Interactive Software Architecture Analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant