CN108431793A - 使用词汇表生成流分析应用 - Google Patents

使用词汇表生成流分析应用 Download PDF

Info

Publication number
CN108431793A
CN108431793A CN201680068770.7A CN201680068770A CN108431793A CN 108431793 A CN108431793 A CN 108431793A CN 201680068770 A CN201680068770 A CN 201680068770A CN 108431793 A CN108431793 A CN 108431793A
Authority
CN
China
Prior art keywords
model
solution
computer
processor
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680068770.7A
Other languages
English (en)
Other versions
CN108431793B (zh
Inventor
A·普亚西克
E·彻尼斯
D·舒斯特曼
Y·尤勒维奇
L·戈雷里克
A·兰加纳坦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN108431793A publication Critical patent/CN108431793A/zh
Application granted granted Critical
Publication of CN108431793B publication Critical patent/CN108431793B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

计算机实现的方法包括经由处理器以半结构化格式(602)接收主题要求。该方法包括经由处理器基于预定义的分类(604)来对主题要求进行分类。该方法包括经由处理器基于语法(606)从主题要求中提取实体列表。该方法包括基于词汇表和提取的实体(608)的列表生成解决方案。该方法包括经由处理器基于解决方案(610)生成流分析应用。

Description

使用词汇表生成流分析应用
技术领域
本技术涉及流应用的生成。更具体地说,这些技术涉及使用词汇表生成流分析应用。
发明内容
根据这里描述的实施例,系统可以包括处理器,以半结构化格式接收主题要求。处理器还可以基于预定义的分类来进一步对主题要求进行分类。处理器还可以基于语法从主题要求中提取实体列表。处理器还可以进一步基于词汇表生成解决方案。生成解决方案的处理器可以基于分类和提取的实体进一步检测模型库中的适当的训练数据集。处理器还可以基于训练数据集生成模型。处理器还可以基于解决方案进一步生成流分析应用。流分析应用可以包含模型。
根据这里描述的另一个实施例,方法可以包括经由处理器以半结构化格式接收主题要求。该方法可以进一步包括经由处理器基于预定义的分类对主题要求进行分类。该方法还可以进一步包括经由处理器基于语法从主题要求中提取实体列表。该方法还可以包括经由处理器基于词汇表和提取的实体列表生成解决方案。该方法还可以包括经由处理器基于解决方案生成流分析应用。
根据这里描述的另一实施例,用于生成流分析应用的计算机程序产品可以包括具有程序代码的计算机可读存储介质。计算机可读存储介质不是瞬态信号本身。程序代码可由处理器执行以使处理器以半结构化格式接收主题要求。程序代码还可以使处理器基于预定义的分类对主题要求进行分类。程序代码还可以使处理器基于语法从主题要求中提取实体列表。程序代码还可以使处理器基于分类和提取的实体在模型库中检测适当的训练数据集。程序代码也可以使处理器根据训练数据集生成模型。程序代码还可以使处理器进一步生成包括挖掘组件的流分析应用。
附图说明
现在将仅以举例的方式并参考以下附图来描述本发明的实施例:
图1是使用词汇表生成流应用的示例系统的框图;
图2是用于可以针对HTTP业务中检测到的异常提出警报的流应用的实体提取的示例过程的框图;
图3是用于可以检测地震震中的流应用的实体提取的示例过程的框图;
图4是用于生成可以针对HTTP业务中的检测到的异常提出警报的流应用的示例映射的框图;
图5是用于生成可以检测地震震中的流应用的示例映射的框图;
图6是可以基于词汇表生成流应用的示例方法的过程流程图;
图7是可以生成包括模型的解决方案的示例方法的过程流程图;
图8是可以使用词汇表生成流应用的示例计算设备的框图;
图9是根据在此描述的实施例的示例云计算环境;
图10是根据在此描述的实施例的示例抽象模型层;和
图11是可以使用词汇表生成流应用的示例性有形非暂时性计算机可读介质。
具体实施方式
流计算平台是高性能平台,除了执行对异构数据类型的复杂分析之外,还可以以每天高达PB(拍字节-petabytes)的速率连续分析海量数据。例如,异构数据类型可以包括文本、图像、音频、语音、VoIP、视频、网络流量、电子邮件、GPS数据、金融交易数据、卫星数据和传感器数据以及其他类型的数据。流计算平台上的开发过程利用高级编程技能、知识和对平台深入的理解。然而,可能是流应用的主要利益相关者的主题专家没有流应用开发技能,而是可能具有较深层的主题领域专业知识。因此,流计算平台在项目生命周期中可能至少包含两个角色。主题专家可以定义功能性和非功能性的应用需求,并且可以通过仿真复杂的测试用例来负责应用验收测试。例如,功能应用需求可以定义系统及其组件的功能,例如接收一组特定的输入或输出。非功能性应用需求可以指定可以用来判断系统操作的标准,例如性能比率。流应用开发人员可能会接受培训以了解主题约束,并在与应用利益相关者进行持续紧密的沟通过程中将其转换为流应用.另外,这两个角色可能使用不同的词汇表,主题专家可能不知道流应用开发细节。此外,处理大量数据可能包括在设计和开发流应用时考虑到其他因素。
根据本公开的实施例,系统可以基于词汇表生成流分析应用。例如,可以从存储库中选择分析模型,或者可以使用半结构化语言基于主题约束来生成分析模型。例如,系统可以以半结构化语言接收主题约束,并且使用预定义词汇表自动且实时地生成流应用。此外,这些技术还包括基于模拟的流分析应用测试和调优方法。该方法使主题专家能够快速生成、测试和调优流分析应用,而无需手动编码和深层特定的流平台知识。此外,该方法对具体的流平台实现是不可知的。因此,本公开的实施例允许任何流平台被自动且实时地用于生成流分析应用。
在一些情况下,本文描述的技术可以在云计算环境中实现。如以下至少参考图7-9更详细讨论的,配置成生成流应用的计算设备可以在云计算环境中实现。应该理解的是,尽管本公开可以包括关于云计算的描述,但是本文所引用的教导的实现不限于云计算环境。相反,本发明的实施例能够结合现在已知或以后开发的任何其他类型的计算环境来实现。
云计算是一种服务交付模式,用于对共享的可配置计算资源池进行方便、按需的网络访问。可配置计算资源是能够以最小的管理成本或与服务提供者进行最少的交互就能快速部署和释放的资源,例如可以是网络、网络带宽、服务器、处理、内存、存储、应用、虚拟机和服务。这种云模式可以包括至少五个特征、至少三个服务模型和至少四个部署模型。
特征包括:
按需自助式服务:云的消费者在无需与服务提供者进行人为交互的情况下能够单方面自动地按需部署诸如服务器时间和网络存储等的计算能力。
广泛的网络接入:计算能力可以通过标准机制在网络上获取,这种标准机制促进了通过不同种类的瘦客户机平台或厚客户机平台(例如移动电话、膝上型电脑、个人数字助理PDA)对云的使用。
资源池:提供者的计算资源被归入资源池并通过多租户(multi-tenant)模式服务于多重消费者,其中按需将不同的实体资源和虚拟资源动态地分配和再分配。一般情况下,消费者不能控制或甚至并不知晓所提供的资源的确切位置,但可以在较高抽象程度上指定位置(例如国家、州或数据中心),因此具有位置无关性。
迅速弹性:能够迅速、有弹性地(有时是自动地)部署计算能力,以实现快速扩展,并且能迅速释放来快速缩小。在消费者看来,用于部署的可用计算能力往往显得是无限的,并能在任意时候都能获取任意数量的计算能力。
可测量的服务:云系统通过利用适于服务类型(例如存储、处理、带宽和活跃用户帐号)的某种抽象程度的计量能力,自动地控制和优化资源效用。可以监测、控制和报告资源使用情况,为服务提供者和消费者双方提供透明度。
服务模型如下:
软件即服务(SaaS):向消费者提供的能力是使用提供者在云基础架构上运行的应用。可以通过诸如网络浏览器的瘦客户机接口(例如基于网络的电子邮件)从各种客户机设备访问应用。除了有限的特定于用户的应用配置设置外,消费者既不管理也不控制包括网络、服务器、操作系统、存储、乃至单个应用能力等的底层云基础架构。
平台即服务(PaaS):向消费者提供的能力是在云基础架构上部署消费者创建或获得的应用,这些应用利用提供者支持的程序设计语言和工具创建。消费者既不管理也不控制包括网络、服务器、操作系统或存储的底层云基础架构,但对其部署的应用具有控制权,对应用托管环境配置可能也具有控制权。
基础架构即服务(IaaS):向消费者提供的能力是消费者能够在其中部署并运行包括操作系统和应用的任意软件的处理、存储、网络和其他基础计算资源。消费者既不管理也不控制底层的云基础架构,但是对操作系统、存储和其部署的应用具有控制权,对选择的网络组件(例如主机防火墙)可能具有有限的控制权。
部署模型如下:
私有云:云基础架构单独为某个组织运行。云基础架构可以由该组织或第三方管理并且可以存在于该组织内部或外部。
共同体云:云基础架构被若干组织共享并支持有共同利害关系(例如任务使命、安全要求、政策和合规考虑)的特定共同体。共同体云可以由共同体内的多个组织或第三方管理并且可以存在于该共同体内部或外部。
公共云:云基础架构向公众或大型产业群提供并由出售云服务的组织拥有。
混合云:云基础架构由两个或更多部署模型的云(私有云、共同体云或公共云)组成,这些云依然是独特的实体,但是通过使数据和应用能够移植的标准化技术或私有技术(例如用于云之间的负载平衡的云突发流量分担技术)绑定在一起。
云计算环境是面向服务的,特点集中在无状态性、低耦合性、模块性和语意的互操作性。云计算的核心是包含互连节点网络的基础架构。
现在参考图1,示例性计算设备可以生成流应用。计算设备100可以例如是服务器、台式计算机、膝上型计算机、平板电脑或智能手机。在一些示例中,计算设备100可以是云计算节点。计算设备100可以在由计算机系统执行的诸如程序模块的计算机系统可执行指令的一般上下文中描述。通常,程序模块可以包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、逻辑、数据结构等等。计算设备100可以在分布式云计算环境中实施,其中任务由通过通信网络链接的远程处理设备执行。在分布式云计算环境中,程序模块可以位于包括存储器存储设备的本地和远程计算机系统存储介质中。
现在参考图1,框图示出了使用词汇表生成流应用的示例系统。示例处理流程通常由附图标记100表示,并且可以使用下面图8的计算设备800来实现。图1包括显示的用户界面102,其接收来自如箭头104所示的主题专家(SME)的输入。如本文所提及的主题专家可包括任何合适的自动化计算机应用或用户。输入可以以半结构化格式描述流应用的预期行为。例如,格式可以类似于Gherkin格式。预期行为可以包括功能行为,可用于应用执行的期望的硬件和软件资源以及诸如安全性、可伸缩性等的非功能性方面。例如,半结构化格式可以显示为:
场景1:网络流量异常流应用
给定:从窃听服务器收集到的200Mb/秒的实时企业网络流量
何时:在HTTP流量中检测到异常
然后:发出警报
场景2:地震预警流应用
给定:应该以100个事件/秒的速率采集来自采用mseed格式的地震仪的传感器数据
何时:来自单站的峰值已经被检测到
然后:应用算法进行地震震中检测,用震中坐标进行报警
在图1的示例中,分类模块106可以接收如箭头108所示的主题输入。分类模块106可以基于如箭头111所示的存储110的预定分类来对主题输入进行分类。存储110可以是任何合适的数据库或任何其他数据存储系统。在一些示例中,分类可以是通过半结构化主题要求的预定义分类来自动分类的过程。分类模块106可以使用监督式学习来进行引导。例如,监督学习可以包括从训练数据生成分析模型的过程。分析模型生成过程可能具有离线性质。例如,分类模块106可以首先基于具有有限大小的训练集来生成模型。然后,生成的模型可以部署到运行时环境。在一些示例中,分类模块106可以使用预定义的训练数据来创建用于文本分类的初始引导模型。分类模块106然后可以通过反馈的实时学习来改进模型。另外,分类模块106可以使用实时学习来提高性能和质量结果。分类模块106还可以采用复杂的自然语言处理和机器学习技术。例如,分类模块106可以将上面的场景1分类为“网络分析应用”。
仍然参考图1,提取器模块112可以接收如箭头114所示的分类。提取器模块112可以基于分类110从分类模块106生成的分类中提取实体的列表。系统100还可以包括词汇表作者可能已经预定义的词汇表113。例如,初始实体提取阶段可以基于分类标准110,如箭头115所示。例如,词汇表可以由词汇作者预定义,如箭头116所示。在一些示例中,预定义词汇表113可以包括特定公司或组织在处理特定主题时使用的语言。提取器模块112可以使用分类110来连接图中的相关术语和概念以创建可以映射到解决方案组件的实体。在一些示例中,分类110和/或词汇表113也可以由系统学习组件针对给定主题类别来调整。提取器模块112可以利用分类110中定义的实体关系来提取附加实体。提取器模块112的输出可以包含丰富的实体列表。例如,所提取的实体可以与在下面更详细讨论的图2和图3的示例的提取实体200和300类似。在一些示例中,提取器模块112可以检测到分类110中的信息不足以获得成功的提取。提取器模块112可以向用户界面102发送缺失信息的通知,如箭头118所示。在一些示例中,SME可以通过用户界面102提供缺少的信息。
系统100还包括解决方案生成器模块119,其可以如箭头120所示从提取器模块112接收实体列表。系统100还包括模型/训练数据仓库121,其包括模型和/或训练数据用于产生一个或多个解决方案,如箭头123所示。这里的解决方案是指可以使用的候选应用。例如,基于来自提取器模块112的富集实体和来自分类模块106的类别,可以从模型库121中提取适当的模型。解决方案生成器119可以通过使用知识数据库122将富集实体迭代地映射到模型来生成解决方案,如箭头124所示。例如,知识数据库122可以包括流库(StreamLibraries)和开源知识库,其持有全世界的任何开发团队利用各自的元数据创建和上传的解决方案和解决方案组件。知识数据库122可以是动态的。例如,新的工具包或解决方案一旦添加到知识数据库122,就可以立即可用于流应用。在一些示例中,可以将公开的工具包或解决方案自动添加到知识数据库122以用于生成流应用。在一些示例中,知识数据库122可以包括开源资源。例如,来自开源社区的解决方案可以被自动添加到知识数据库122中。解决方案生成器模块119可以管理这些知识库。在一些示例中,解决方案生成器模块119可以使用映射来迭代地缩小搜索范围,并返回匹配给定需求的一组解决方案,如箭头126所示。例如,如下面针对解决方案浏览器130所讨论的,解决方案生成器模块119可以基于可能的解决方案与需求有多接近来对其进行评分,并且可以返回具有较高得分的一组解决方案。如对图4和图5的示例映射400和500更详细描述的,解决方案生成器119可以将实体映射到一个或多个流解决方案组件。在一些示例中,解决方案生成器模块119可以使用词汇表113,如箭头127所示。词汇表113可以包括多个应用概念图。例如,概念图可以包含具有类别间连接和属性的概念实时挖掘应用结构。概念图使解决方案生成器119有效。另外,当解决方案生成器119创建由客户批准的流应用时,解决方案生成器119可以将反馈发送到词汇表,如箭头127所示。反馈可以包含新的属性和组件间连接。在一些示例中,搜索可以伴随用户反馈。例如,用户反馈可以包括对映射结果的评分。例如,用户可以给出最好的解决方案的最高分数。在一些示例中,即使在用户反馈之后,当特定实体模式不能被映射到任何可用解决方案时,解决方案生成器模块119可以创建任务需求以开发新的充分操作并通知SME。以上关于场景1和2的映射将结合图4和图5在以下分别进行描述。
仍然参考图1,在一些示例中,提升模块128可以基于来自其他专家的输入来指导解决方案组件选择。例如,提升模块128可以将高度加权的索引添加到其他专家可能想要提升的解决方案组件,由此引导解决方案生成器模块119给予它们更高的分数。
系统100进一步包括解决方案资源管理器模块130。例如,解决方案资源管理器模块130可以是可用于管理从解决方案生成器模块119接收的解决方案134的用户界面,如箭头132所示。例如,每个解决方案134可以包括可以用于生成包括分析模型的流分析应用的分析模型。解决方案资源管理器模块130也可以用于探索解决方案图和由箭头136所示的相关信息。解决方案资源管理器模块130还可以用于调用解决方案模拟器138、如箭头142所示的解决方案编辑器140,以及如箭头146所示的参数管理器144。
解决方案模拟器138可以执行具有默认或用户定义的输入值的解决方案并测试结果。例如,如箭头149所示,解决方案模拟器138可以在测试输入管理器148处接收上传的“黄金”测试结果。例如,“黄金”测试结果可以包括预期的测试结果。解决方案模拟器138还可以生成具有匹配度量的比较统计。可以通过结果浏览器150为用户显示匹配度量。在一些示例中,如果结果满足预定义的要求,则可以将解决方案部署到如下所述的生产环境中。如果结果不符合用户的期望,则可以改进解决方案或者可以在用户界面102处重新定义需求,如箭头151所示。在一些示例中,参数管理器144可以用于通过配置参数微调流分析应用,如箭头146所示。例如,如果流分析应用运行特定算法,则参数管理器144可以实现算法的调整以获得最佳性能和结果。在一些示例中,解决方案编辑器140可以用来编辑箭头142所示的解决方案。例如,解决方案可以在有或没有外部开发者的帮助下编辑。因此,这些技术使主题专家能够在没有外部开发人员的帮助下编辑解决方案。例如,可以向主题专家提供一系列可供选择的解决方案使用。在一些示例中,主题专家可以创建如箭头154所示的开发新的解决方案组件的任务需求。例如,可以将任务需求发送到任务生成模块152,如箭头154所示。开发人员然后可以按照如下所述建立操作。
仍然参照图1,配置用户界面156可以使得SME能够基于结果分析来调整流应用。例如,结果分析可能已经由结果浏览器150生成并且被发送到配置用户界面156,如箭头158所示。在一些示例中,调整可以是功能性的。例如,调整可以包括添加新类型的数据注入器的请求。数据注入器可以包括用于从网卡捕获实时流量的实时馈送器,用于从文件读取数据的文件馈送器,或者用于从数据库读取数据的数据库馈送器,以及其他类型的数据注入器。在一些示例中,调整可以是非功能性的。例如,调整可以包括支持更高数据量和/或速度的请求。配置用户界面156还可以被用来发出用于部署的解决方案160,如箭头162所示。在一些示例中,所部署的解决方案也可以被发送到知识数据库122,如箭头164所示。例如,解决方案资源管理器130可以将所部署的解决方案包括在解决方案列表134中以用于流应用生成。
如上所述,在解决方案生成器模块119未能将需求实体映射到知识数据库122中的现有解决方案的情况下,任务生成器模块152可以自动地为解决方案资源管理器130生成新的开发任务。在一些示例中,解决方案编辑器140还可以在基于模拟的测试期间使用任务生成器模块152更新自动生成的解决方案。例如,SME可以使用解决方案编辑器142手动更新自动生成的解决方案,如箭头154所示。在一些示例中,解决方案生成器119可以使得任务生成器152生成如箭头166所示的新的开发任务。例如,解决方案生成器模块119可以检测到一个或多个操作不存在。任务生成器模块152可以使操作生成器168生成对缺少的操作的描述。例如,可以描述缺少的操作所需的输入和输出。如箭头170所示,操作生成器168可以通过将新的操作发送到解决方案生成器119来向系统通知新的操作。解决方案生成器模块119然后可以使用生成的操作生成附加的延迟解决方案172,如箭头174所示。在一些示例中,可以在模拟解决方案134之前存在等待时间176。例如,如果解决方案映射器未能找到用于客户特定输入格式解析的适当注入器(馈送器),则可能有等待时间176。在一些示例中,开发者可以查看由任务生成器152提供的缺失的操作符的描述,并且开发新的操作,如箭头178所示。新操作可以被添加到知识数据库122,如箭头180所示。
应当理解,图1的框图并不意味着系统100将包括图1中所示的所有组件。而是,系统100可以包括更少的或附加的组件(未在图中示出)(例如,额外的客户端设备、额外的资源服务器等)。
图2是可以针对HTTP业务中的检测到的异常提出警报的流应用的实体提取的示例过程的框图。该示例过程通常由附图标记200表示,并且可以使用图8的计算设备800来实现。图2包括半结构化需求定义202,需求分类标签204和提取的实体208。提取的实体208包括网络实体212、业务实体214、速率实体216、告警实体218、异常检测实体220和外部系统实体222。
在示例过程200中,半结构化需求定义202包括值为“从窃听服务器收集的具有200Mb/秒速率的实时企业网络流量”的“给定”需求。半结构化需求定义202进一步包括具有值“在HTTP流量中检测到异常”的“何时”要求。半结构化要求定义202还包括具有“发出警报”值的“然后”要求。如箭头所示206,半结构化需求定义202可以由计算设备分类以产生具有值“网络分析应用”的需求分类标签204。例如,计算设备可以基于所提供的半结构化需求定义202使用分类来确定需求的值分类标签204。半结构化需求定义202可能已经由SME提供。
如箭头210所示,计算设备可以基于需求分类标签204和词汇表(未示出)从半结构化需求定义202中提取提取的实体208。每个提取的实体可以有属性和值。在图2的示例性映射200中,网络实体212具有值为“live”的属性。业务实体214具有值为“HTTP”的属性。速率实体216具有包含值100Mb/秒。告警实体218具有值为“仅被感染”的属性。异常检测实体220具有值为“HTTP”的属性。外部系统实体222具有值为“SIEM”的属性,其指示“安全信息和事件管理”系统。然后,如以下参照图4详细描述的,可以将每个提取的实体映射到一个或多个解决方案组件。
应当理解的是,图2的框图并不意味着过程200将包括图2中所示的所有组件。相反,过程200可以包括未在图2中示出的更少的或附加的组件(例如,额外提取的实体、值等)。
图3是可以检测地震震中的流应用的实体提取的示例过程的框图。例如,流应用可以实时检测到震中,并提供有关潜在危险位置的预警。该示例过程通常由附图标记300来表示,并且可以使用图8的计算设备800来实现。图3包括半结构需求定义302、需求分类标签304以及提取实体308。提取的实体308包括传感器数据实体312、峰值实体314、早期预警实体316和震中实体318。
在示例性过程300中,半结构化需求定义302包括具有值为“应该以100个事件/秒的速率采集来自采用mseed格式的地震仪的传感器数据”的“给定”要求。半结构化需求定义302进一步包括具有值为“来自单站的峰值已经被检测到”的“何时”要求。半结构化需求定义302还包括具有值为“应用算法进行地震震中检测,用震中坐标进行报警”的“然后”要求。如箭头306所示,半结构化需求定义302可以由计算设备分类以产生具有“地震早期预警应用”值的需求分类标签304。例如,计算设备可以使用分类来基于提供的半结构化需求302来确定需求分类标签304的值。半结构化需求定义302可能已经由SME提供。
如箭头310所示,计算设备可以基于需求分类标签304和词汇表(未示出)从半结构化需求定义302中提取提取的实体308。每个提取的实体可以有属性和值。在图3的示例映射300中,传感器数据实体312包括“mseed格式”的值。峰值实体314包括“阈值”的值。早期预警实体316实体和震中318实体不具有任何属性值。然后可以将每个提取的实体映射到一个或多个解决方案组件,如以下参照图5详细描述。
要理解的是,图3的框图并非旨在指示过程300将包括图3中所示的所有组件。相反,过程300可以包括未在图3中示出的更少或附加组件(例如,额外提取的实体、值等)。
图4是用于生成可以针对HTTP流量中的检测到的异常提出警报的流应用的示例映射的框图。该示例映射通常由参考数字400表示,并且可以使用图8的计算设备800来实现。图4包括解决方案组件,其包括摄取组件402、过滤器和富集组件404、提取组件406、挖掘组件408以及接收(sink)和可视化组件410。示例映射400还包括在以上图2中提取的提取的网络实体212、业务实体214、速率实体216、异常检测实体220、告警实体218和外部系统实体222。示出的实体通过箭头414-428映射到组件。
摄取组件402可以捕获来自网卡的数据并且使用并行处理来有效地对其进行解析。在一些示例中,每个框可以表示可以在单独的CPU上运行的功能单元。因此,这些技术能够生成分布式计算应用。例如,解决方案组件402-410中的每一个中的框的列指示要执行的并行处理以满足映射到如箭头414所示的每个组件的100Mb/秒速率216要求。捕获单元430可以捕获数据并将数据发送到分类单元432。检测器单元434可以从捕获的数据中检测HTTP通信量。例如,可以使用多个检测器单元434来实现捕获的数据处理的100Mb/秒的速率。输出单元436可以从检测器单元434收集数据,并将检测到的HTTP流量输出到过滤器和富集组件404。
过滤器和富集组件404、提取组件406和挖掘组件408可以执行异常检测。例如,过滤器和富集组件404可以包括接收器单元438,该接收器单元438可以将接收到的HTTP流量发送到过滤器单元440。过滤器单元440可以将过滤的数据发送到富集单元442。富集单元442可以丰富数据的速度为100MB/秒。输出单元444可以将丰富的数据发送到提取组件406。
提取组件可以包括接收器单元446和能够以100Mb/秒的速率提取数据的多个提取单元448。提取组件406还可以包括输出单元450,该输出单元450可以将提取信息发送到挖掘组件408。
挖掘组件408包括接收器单元452和能够以100Mb/秒的速率对信息进行分类的多个挖掘单元454。挖掘组件408还包括输出单元456,其可以将挖掘的信息发送到接收(sink)和可视化组件410。例如,挖掘组件可以对应于分析模型。分析模型可能已从模型存储库中检索。在一些示例中,可以基于训练数据集生成分析模型。
接收(sink)和可视化组件410包括可以接收挖掘的信息的一对接收单元458和460。接收器单元460可以将采集的信息发送到能够以100Mb/秒的速率操作的可视化单元462。如果所挖掘的信息检测为被感染,则接收(sink)和可视化组件410可以引起警报发起。
如图所示,多个功能组件402-410被映射到多个需求212、214、216、218和222。应当理解,图4的框图并非旨在指示示例映射400将包括图4中所示的所有组件。相反,示例映射400可以包括图4中未示出的更少或附加组件(例如,额外提取的实体或解决方案组件、单元等)。
图5是用于生成可以检测地震的震中的流应用的示例映射的框图。该示例映射通常由参考数字500表示,并且可以使用图8的计算设备800来实现。图5包括解决方案组件,其包括摄取组件502,峰值检测器组件504,过滤器和富集组件506以及细化和过滤组件508。示例性映射500还包括在上面的图3中提取的传感器数据实体312、峰值实体314、早起预警实体316和震中实体318。示出的实体经由箭头512、518、532、542被映射到组件。
馈送器510可以将传感器数据传送到峰值检测器504组件。峰值检测器组件可以包括多个峰值检测单元516和检测到的峰值输出522。自动定位器组件520可以包括准备和过滤组件526以及关联和成核组件528。例如,准备和过滤组件526可准备和过滤检测到的峰值输出522,并将过滤后的输出发送到关联和成核组件528,如箭头530所示。关联和成核组件然后可产生潜在地震的早期预警。自动定位器组件520可以进一步包括原点细化组件534,以从箭头536所指示的关联和成核组件528接收原始信息,并且对原始信息执行细化。自动定位组件520还可以包括原点过滤组件538,其可以从原始精化组件534接收如箭头540所指示的精炼起点信息并确定地震的震中。
因此,四个提供的需求312、314、316、318可以被映射到与用于流应用的所需功能相关联的解决方案组件。
应该理解的是,图5的框图并非旨在指示示例性映射500将包括图5中所示的所有组件。而是,示例性映射500可以包括图5中未示出更少或更多的组件(例如,额外提取的实体、解决方案组件、单元等)。
图6是可以基于词汇表生成流应用的示例方法的过程流程图。方法600可以用任何合适的计算设备(例如图8的计算设备800)来实现,并且参照图1的系统100进行描述。例如,下面描述的方法可以由图1的系统100实现。
在框602处,系统以半结构化格式接收主题要求。例如,主题要求可以包括以人类可读语言的多个主题约束。如上所述,约束条件可以包括工作流应用的主题要求。
在框604处,系统基于预定义的分类来对主题要求进行分类。例如,分类可以包括有组织的分类结构。系统可以通过检测每个主题要求或与分类法中的主题要求相关联的关键词来归类主题要求,并返回相关的分类。
在框606处,系统基于语法提取实体列表。例如,实体可以各自包括如以上图2和图3所描述的属性和值。
在框608处,系统基于词汇表生成解决方案。例如,可以根据下面图7中描述的技术生成解决方案。在一些示例中,系统可以基于元数据比较对解决方案进行评分并返回具有较高分数的一组解决方案。
在框610处,系统基于解决方案生成流分析应用。例如,挖掘组件可以是包括在流分析应用中的多个组件中的一个。在一些示例中,可以实时生成流分析应用。在一些示例中,系统可以从主题专家接收反馈并且基于反馈来更新流分析应用。例如,反馈可以包括额外的或删除的操作、参数、解决方案组件等。因此,该系统使得能够实时生成可以修改的流分析应用。在一些示例中,系统可以执行流分析应用。流分析应用可以接收流分析信息并生成实时输出。例如,输出可以是地震的预警、震中位置、指示检测到的异常的警报以及其他类型的输出。在一些示例中,系统可以接收来自主题专家的反馈,并且基于反馈来更新词汇表中的流分析应用概念图。流分析应用也可以相应更新。
图6的处理流程图并非旨在指示方法600的操作将以任何特定顺序执行,或者所有情况都包括方法600的所有操作。
图7是可以生成包括模型的解决方案的示例方法的过程流程图。方法700可以用任何合适的计算设备(例如图8的计算设备800)来实现,并且参照图1的系统100进行描述。例如,下面描述的方法可以通过图1的解决方案生成器119实现。
在框702处,解决方案生成器接收提取的实体。例如,提取的实体可以包括一个或多个具有如以上图2和3所述的值的属性。
在框704处,解决方案生成器确定模型库中是否存在适当的模型。例如,可以使用与模型库中的每个模型相关联的元数据来检测适当的模型。在一些示例中,元数据可以包括诸如何时可以应用模型,模型可以覆盖哪些用例以及其他信息等的信息。元数据可被用作关键数据以将模型与一个或多个提取的实体相匹配。例如,解决方案生成器可以通过将实体列表映射到解决方案组件并将映射的解决方案组件与模型库中现有模型中的解决方案组件进行比较来确定是否存在适当的模型。如果系统检测到模型库中存在适当的模型,则方法可以在框706处继续。如果系统检测到模型库中不存在适当的模型,则该方法可以在框708继续。
在框706处,解决方案生成器从模型库取得模型。例如,模型库可以包括从过去的方法实例生成的模型。在一些示例中,模型库可以包括开源模型。
在框708处,解决方案生成器基于分类和提取实体来在模型库中检测适当的训练数据集。例如,模型库中的每个训练集都可能具有与模型相似的关联元数据。元数据可用于将训练集与一个或多个提取的实体进行匹配。例如,解决方案生成器可以通过将训练数据元数据与提取的实体列表进行比较来检测适当的训练数据集。
在框710处,解决方案生成器基于训练数据集生成模型。系统可以将实体列表映射到一个或多个解决方案组件。例如,以上图4的挖掘组件可对应于由解决方案产生器产生的分析模型。在一些示例中,算法可以已经被选择并且用新的训练数据“刷新”。例如,新的训练数据可能更适合特定的使用情况。在一些示例中,算法可以采取决策树的形式。在一些示例中,算法可能不被选择。在这种情况下,解产生器可以训练多种监督算法,然后比较训练的算法的性能。
框712处,解决方案生成器通过将提取的实体映射到词汇表中的概念图和属性来生成流应用分析组件。例如,流应用分析组件可以包括如在上面的图4的示例中的摄取、过滤、提取、挖掘和/或接收(sink)和可视化组件以及其他组件。
在框714,解决方案生成器生成包括模型的解。例如,解决方案可以包括对应于模型的挖掘组件。在一些示例中,可以模拟和修改解决方案。例如,解决方案可以使用解决方案编辑器进行优化。在一些示例中,解决方案生成器可以通过将实体列表映射到一个或多个解决方案组件来生成解决方案。
图7的处理流程图并非旨在指示方法700的操作将以任何特定顺序执行,或者所有情况都包括方法700的所有操作。例如,如果在方框704处检测到适当的模型,则可以不执行方框708和710。另外,方法700可以包括任何适当数量的附加操作。
图8是可以生成流分析应用的示例计算设备的框图。计算设备800可以是例如服务器、台式计算机、膝上型计算机、平板电脑或智能手机。在一些示例中,计算设备800可以是云计算节点。计算设备800可以在由计算机系统执行的诸如程序模块的计算机系统可执行指令的一般上下文中描述。通常,程序模块可以包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、逻辑、数据结构等等。计算设备800可以在分布式云计算环境中实施,其中任务由通过通信网络链接的远程处理设备执行。在分布式云计算环境中,程序模块可以位于包括存储器存储设备的本地和远程计算机系统存储介质中。
计算设备800可以包括用于执行存储的指令的处理器802,存储设备804以在操作期间为所述指令的操作提供临时存储空间。处理器可以是单核处理器、多核处理器、计算集群或任何数量的其他配置。存储器804可以包括随机存取存储器(RAM)、只读存储器、闪存或任何其他合适的存储器系统。
处理器802可以通过系统互连806(例如,PCI-Express等)连接到适于将计算设备800连接到一个或多个输入/输出(I/O)设备810的输入/输出(I/O)设备接口。I/O设备810可以包括例如键盘和定点设备,其中定点设备可以包括触摸板或触摸屏等等。I/O设备810可以是计算设备800的内置组件,或者可以是外部连接到计算设备800的设备。
处理器802还可以通过系统互连806链接到适于将计算设备800连接到显示设备814的显示器接口812。显示设备814可以包括显示屏幕,该显示屏幕是计算设备800的内置组件。显示设备814还可以包括外部连接到计算设备800的计算机监视器、电视机或投影仪等。另外,网络接口控制器(NIC)816可以适于通过系统互连806连接计算设备800到网络818。在一些实施例中,NIC 816可以使用任何合适的接口或协议(诸如互联网小型计算机系统接口等)来传输数据。网络818可以是蜂窝网络、无线电网络、广域网(WAN)、局域网(LAN)或因特网等等。外部计算设备820可以通过网络818连接到计算设备800。在一些示例中,外部计算设备820可以是外部网络服务器。在一些示例中,外部计算设备820可以是云计算节点。
处理器802还可以通过系统互连806链接到存储设备822,存储设备822可以包括硬盘驱动器、光盘驱动器、USB闪存驱动器、驱动器阵列或其任何组合。在一些示例中,存储设备可以包括分类器模块824,提取器模块826和建模器模块828。分类器模块824可以以半结构化格式接收主题要求。例如,主题要求可以包括人类可读语言的多个约束。分类器模块824可以基于预定义的分类来对主题要求进行分类。例如,预定义的分类可以包括由一个或多个词组成的一个或多个预定义的分类。提取器模块826可以基于语法提取实体的列表。例如,每个实体可以包含一个属性和一个值。建模器模块828可以确定模型库中是否存在用于实体列表的适当模型。在一些示例中,如果存在适当的模型,则建模器模块828可以从模型库中检索适当的模型。例如,建模器模块828可以使用适当的模型来生成挖掘组件。在一些示例中,建模器模块828可以基于分类和提取的实体在模型库中找到适当的训练数据集。例如,建模器模块828可以响应于未在模型库中检测到任何适当的模型而搜索适当的训练数据集。建模器模块828还可以包括用于基于训练数据集来生成模型的代码。例如,训练数据集可以包括代表良性和可疑网络流量的流量。建模器模块828还可以基于模型生成挖掘组件。例如,挖掘组件可以用于流分析。建模器模块828然后可以生成包括挖掘组件的流分析应用。在一些示例中,当计算设备执行流分析应用时,流分析应用可以接收流分析信息并生成实时输出。例如,输出可以是地震的预警、震中位置、指示检测到的异常的警报以及其他类型的输出。
应该理解的是,图8的框图并非旨在指示计算设备800将包括图8中所示的所有组件。相反,计算设备800可以包括更少或更多的图8中未示出的组件(例如,额外的存储器组件、嵌入式控制器、模块、额外的网络接口等)。此外,分类器模块824,提取器模块826和建模器模块828的任何功能可以部分地或完全地以硬件和/或在处理器802中实现。例如,可以用应用专用集成电路在嵌入式控制器中实现的逻辑或者在处理器802中实现的逻辑等等实现功能。在一些实施例中,分类器模块824,提取器模块826和建模器模块828的功能可以用逻辑来实现,其中如本文所提及的,逻辑可以包括任何合适的硬件(例如,处理器等)、软件(例如,应用等),固件、或硬件、软件和固件的任何适当的组合。
现在参考图9,其中显示了示例性的云计算环境900。如图所示,云计算环境900包括云计算消费者使用的本地计算设备可以与其相通信的一个或者多个云计算节点902,本地计算设备例如可以是个人数字助理(PDA)或移动电话904A,台式电脑904B、笔记本电脑904C和/或汽车计算机系统904N。云计算节点902之间可以相互通信。可以在包括但不限于如上所述的私有云、共同体云、公共云或混合云或者它们的组合的一个或者多个网络中将云计算节点902进行物理或虚拟分组(图中未显示)。这样,云的消费者无需在本地计算设备上维护资源就能请求云计算环境900提供的基础架构即服务(IaaS)、平台即服务(PaaS)和/或软件即服务(SaaS)。应当理解,图9显示的各类计算设备904A-N仅仅是示意性的,云计算节点902以及云计算环境900可以与任意类型网络上和/或网络可寻址连接的任意类型的计算设备(例如使用网络浏览器)通信。
现在参考图10,其中显示了云计算环境900(图9)提供的一组功能抽象层。首先应当理解,图10所示的组件、层以及功能都仅仅是示意性的,本发明的实施例不限于此。如图10所示,提供下列层和对应功能:
硬件和软件层1000包括硬件和软件组件。硬件组件的例子包括:主机,一个例子是系统;基于RISC(精简指令集计算机)体系结构的服务器,一个例子是系统、系统、系统;存储设备;网络和网络组件。软件组件的例子包括:网络应用服务器软件,一个例子是应用服务器软件;以及数据库软件,一个例子是数据库软件(IBM,zSeries,pSeries,xSeries,BladeCenter,WebSphere,DB2是国际商业机器(IBM)在全球很多国家和地区的注册商标)。
虚拟层1002提供一个抽象层,该层可以提供下列虚拟实体的例子:虚拟服务器、虚拟存储、虚拟网络(包括虚拟私有网络)、虚拟应用和操作系统,以及虚拟客户端。在一个示例中,管理层1004可以提供下述功能:资源供应功能:提供用于在云计算环境中执行任务的计算资源和其它资源的动态获取;计量和定价功能:在云计算环境内对资源的使用进行成本跟踪,并为此提供帐单和发票。在一个例子中,该资源可以包括应用软件许可。安全功能:为云的消费者和任务提供身份认证,为数据和其它资源提供保护。用户门户功能:为消费者和系统管理员提供对云计算环境的访问。服务水平管理功能:提供云计算资源的分配和管理,以满足必需的服务水平。服务水平协议(SLA)计划和履行功能:为根据SLA预测的对云计算资源未来需求提供预先安排和供应。
工作负载层1006提供云计算环境可能实现的功能的示例。在该层中,可提供的工作负载或功能的示例包括:地图绘制与导航;软件开发及生命周期管理;虚拟教室的教学提供;数据分析处理;交易处理;以及流应用生成。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路配置数据或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
现在参考图11,描绘了可以使用词汇表生成流应用的示例性有形非暂时性计算机可读介质1100的框图。处理器1102可以通过计算机互连1104来访问有形的非暂时性计算机可读介质1100。此外,有形的非暂时性计算机可读介质1100可以包括指示处理器1102执行上面图6的方法600的操作。
如图11所示,本文所讨论的各种软件组件可以被存储在有形的、非暂时性的计算机可读介质1100上。例如,分类器模块1106包括用于以半结构化格式接收主题要求的代码。分类器模块1106还包括用于基于预定义的分类来分类主题要求的代码。提取器模块1108包括用于基于词汇表从主题要求中提取实体列表的代码。建模器模块1110包括用于基于分类和提取的实体来检测模型库中的适当训练数据集的代码。建模器模块1110还包括用于基于训练数据集来生成模型的代码。建模器模块1110还包括用于基于模型生成流分析应用的代码。例如,建模器1110可以包括用于从模型库中提取模型并且基于该模型生成流分析应用的代码。建模器模块1110还可以包括用于生成包括挖掘组件的流分析应用的代码。在一些示例中,模型库中可能已经存在适当的模型。建模器模块1110可以包括用于检测模型库中的现有模型的代码。建模器模块1110然后可以基于模型库中的现有模型来生成流分析应用。
在一些示例中,建模器模块1110可以包括用于将实体列表映射到解决方案组件的代码,并将映射的解决方案组件与模型库中现有模型中的解决方案组件进行比较。在一些示例中,建模器模块1110可以包括用于检测操作不存在并将任务生成请求发送到用户界面的代码。在一些示例中,建模器模块1110可以从主题专家接收反馈并基于反馈修改流分析应用。应当理解,取决于具体应用,图11中未示出的任何数量的附加软件组件可以被包括在有形的非瞬态计算机可读介质1100内。
附图中的流程图和框图图示了根据本发明的各种实施例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。就此而言,流程图或框图中的每个框可以表示包括用于实现指定的逻辑功能的一个或多个可执行指令的指令的模块、段或部分。在一些替代实施方式中,方框中提到的功能可以不按照附图中指出的顺序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者框有时可以以相反的顺序执行。还将注意到,框图和/或流程图的每个框以及框图和/或流程图中的框的组合可以由执行指定的功能或动作的基于专用硬件的系统执行专用硬件和计算机指令的组合。应当理解,取决于具体的应用,图11中未示出的任何数量的附加软件组件可以被包括在有形非暂时性计算机可读介质1100内。
已经出于说明的目的给出了对本发明的各种实施例的描述,但是并不是意图穷尽或者限于所公开的实施例。在不脱离所描述的实施例的范围和精神的情况下,对于本领域的普通技术人员来说,许多修改和变化将是显而易见的。选择在此使用的术语是为了最好地解释实施例的原理,相对于在市场中找到的技术的实际应用或技术改进,或者使本领域的普通技术人员能够理解本文公开的实施例。
本发明实施例的环境可以包括以任何期望的方式布置的任何数量的计算机或其他处理系统(例如,客户端或终端用户系统、服务器系统等)和数据库或其他储存库,其中本发明实施例可以应用于任何期望类型的计算环境(例如,云计算、客户端-服务器、网络计算、大型机、独立系统等)。由本发明实施例采用的计算机或其他处理系统可以由任何数量的任何个人或其他类型的计算机或处理系统(例如,台式计算机、膝上型计算机、PDA、移动设备等)来实现,并且可以包括任何商业可用的操作系统以及市售和定制软件(例如,浏览器软件、通信软件、服务器软件、分类器模块、提取器模块、建模器模块等)的任何组合。这些系统可以包括任何类型的用于输入和/或查看信息的监视器和输入设备(例如,键盘、鼠标、语音识别等)。
应该理解的是,本发明实施例的软件(例如,分类器选择模块、提取器模块、建模器模块等)可以以任何期望的计算机语言来实现,并且可以由本领域普通技术人员基于包含在说明书中的功能描述的计算机技术以及附图中示出的流程图开发。此外,此处对执行各种功能的软件的任何引用通常是指在软件控制下执行那些功能的计算机系统或处理器。本发明实施例的计算机系统可以替代地由任何类型的硬件和/或其他处理电路来实现。
计算机或其他处理系统的各种功能可以在任何数量的软件和/或硬件模块或单元、处理或计算机系统和/或电路中以任何方式分布,其中计算机或处理系统可以被布置并且通过任何合适的通信介质(例如,LAN、WAN、内联网、因特网、硬连线、调制解调器连接、无线等)进行通信。例如,本发明实施例的功能可以以各种最终用户/客户机和服务器系统和/或任何其他中间处理设备之间的任何方式进行分配。上面描述的以及在流程图中示出的软件和/或算法可以以实现这里描述的功能的任何方式进行修改。另外,流程图或描述中的功能可以以完成期望的操作的任何顺序执行。
本发明实施例的软件(例如,分类器模块、提取器模块、建模器模块等)可以在非暂时性计算机可用介质(例如,磁性或光学介质、磁光介质,软盘、CD-ROM、DVD、存储设备等),用于与通过网络或其他通信介质连接的独立系统或系统一起使用的固定或便携式程序产品装置或设备。
通信网络可以由任意数量的任何类型的通信网络(例如,LAN、WAN、因特网、内联网、VPN等)来实现。本发明实施例的计算机或其他处理系统可以包括任何传统或其他通信设备,以通过任何常规或其他协议通过网络进行通信。计算机或其他处理系统可以利用任何类型的连接(例如,有线、无线等)来访问网络。本地通信媒体可以由任何合适的通信媒体(例如,局域网(LAN)、硬连线、无线链接、内联网等)来实现。
该系统可以采用任何数量的任何常规或其他数据库、数据存储或存储结构(例如,文件、数据库、数据结构、数据或其他储存库等)来存储信息(例如,分类数据、词汇表数据、知识数据库数据、模型/训练数据、默认/用户定义的输入等)。数据库系统可以通过任何数量的任何数量的传统或其他数据库、数据存储或存储结构(例如,文件、数据库、数据结构、数据或其他存储库等)来实现以存储信息(例如,分类数据、词汇表数据,知识数据库数据、模型/训练数据、默认/用户定义的输入等)。数据库系统可以被包括在服务器和/或客户端系统内或者与其耦合。数据库系统和/或存储结构可以远离计算机或其他处理系统或位于计算机或其他处理系统的本地,并且可以存储任何期望的数据(例如分类数据、词汇表数据、知识数据库数据、模型/训练数据、默认/定义的输入等)。
本发明的实施例可以采用任何数量的任何类型的用户界面(例如,图形用户界面(GUI)、命令行、提示等)来获得或提供信息(例如,分类数据、词汇表数据、知识数据库数据、模型/训练数据、默认/用户定义的输入等),其中接口可以包括以任何方式排列的任何信息。界面可以包括设置在任何位置处的任意数量的任何类型的输入或致动机构(例如,按钮、图标、字段、框、链接等)以输入/显示信息并且经由任何合适的输入设备(例如,鼠标、键盘等)启动期望的动作。界面屏幕可以包括以任何方式在屏幕之间导航的任何合适的致动器(例如,链接、标签等)。
本发明实施例不限于上述的具体任务或算法,而是可以用于通过分析每个参与者的偏好、限制和能力来确定参与者之间的任何活动的选项。
这里使用的术语仅用于描述特定实施例的目的,而不意图限制本发明。如本文所使用的,除非上下文另外明确指出,否则单数形式“一”、“一个”和“该”也旨在包括复数形式。将进一步理解,当在本说明书中使用时,术语“包括”、“具有”所陈述的特征、整体、步骤、操作、元件和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元件、组件和/或其组合的存在或增加。
权利要求中的所有装置或步骤加功能元件的对应结构、材料、动作和等同物旨在包括用于结合具体要求保护的其他要求保护的元件执行功能的任何结构、材料或动作。已经出于说明和描述的目的呈现了本发明的描述,但是并不意图是穷举的或者以所公开的形式限制于本发明。在不脱离本发明的范围和精神的情况下,许多修改和变化对于本领域的普通技术人员将是显而易见的。选择和描述实施例是为了最好地解释本发明的原理和实际应用,并且使得本领域的其他普通技术人员能够理解本发明的具有适合于预期的特定用途的各种修改的各种实施例。
已经出于说明的目的给出了对本发明的各种实施例的描述,但并不意图是穷尽的或者限于所公开的实施例。在不脱离所描述的实施例的范围和精神的情况下,对于本领域的普通技术人员来说,许多修改和变化将是显而易见的。选择在此使用的术语是为了最好地解释实施例的原理,实际应用或技术改进而不是在市场上找到的技术,或者使本领域的普通技术人员能够理解本文公开的实施例。
本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括其上具有用于使处理器执行本发明的各方面的计算机可读程序指令的计算机可读存储介质(或多个介质)。
计算机可读存储介质可以是能够保留和存储供指令执行设备使用的指令的有形设备。计算机可读存储介质可以是例如但不限于电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或前述的任何合适的组合。计算机可读存储介质的更具体示例的非穷尽列表包括以下:便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)、记忆棒、软盘、机械地编码的装置,例如其上记录有指令的凹槽中的穿孔卡片或凸起结构,以及前述的任何合适的组合。这里使用的计算机可读存储介质不被解释为暂时信号本身,诸如无线电波或其他自由传播的电磁波,通过波导或其他传输介质传播的电磁波(例如,穿过光纤电缆)或通过导线传输的电信号。
这里描述的计算机可读程序指令可以从计算机可读存储介质下载到相应的计算/处理设备,或者经由网络例如互联网、局域网、广域网区域网络和/或无线网络。网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或网络接口从网络接收计算机可读程序指令,并将计算机可读程序指令转发用于存储在相应计算/处理设备内的计算机可读存储介质中。
用于执行本发明的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据或源代码或以一种或多种程序设计语言(包括面向对象的程序设计语言,诸如Smalltalk,C++等)以及诸如“C”程序设计语言或类似程序设计语言的常规程序化程序设计语言的任何组合来编写的目标代码。计算机可读程序指令可以完全在用户计算机上,部分在用户计算机上,作为独立软件包,部分在用户计算机上,部分在远程计算机上,或者完全在远程计算机或服务器上执行。在后一种情况下,远程计算机可以通过包括局域网(LAN)或广域网(WAN)的任何类型的网络连接到用户的计算机,或者可以连接到外部计算机(用于例如,通过互联网使用互联网服务提供商)。在一些实施例中,包括例如可编程逻辑电路,现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以个性化电子电路,以执行本发明的各个方面。
在此参考根据本发明实施例的方法,装置(系统)和计算机程序产品的流程图和/或框图来描述本发明的各方面。将会理解,流程图和/或框图中的每个框以及流程图和/或框图中的框的组合可以通过计算机可读程序指令来实现。
可以将这些计算机可读程序指令提供给通用计算机,专用计算机或其他可编程数据处理装置的处理器以产生机器,使得经由计算机的处理器或其他处理器执行的指令可编程数据处理装置创建用于实现在流程图和/或框图的一个或多个框中指定的功能/动作的装置。这些计算机可读程序指令还可以被存储在计算机可读存储介质中,该计算机可读存储介质可以指导计算机、可编程数据处理装置和/或其他设备以特定方式运行,使得其中存储有指令的计算机可读存储介质包括制造物品,其包括实现在流程图和/或框图的一个或多个方框中指定的功能/动作的方面的指令。
计算机可读程序指令还可以被加载到计算机,其他可编程数据处理装置或其他设备上,以使得在计算机、其他可编程装置或其他设备上执行一系列操作步骤以生成计算机实现的过程,使得在计算机、其他可编程装置或其他设备上执行的指令实现在流程图和/或框图的一个或多个框中指定的功能/动作。
附图中的流程图和框图示出了根据本发明的各种实施例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。就此而言,流程图或框图中的每个框可以表示包括用于实现指定的逻辑功能的一个或多个可执行指令的指令的模块、段或部分。在一些替代实施方式中,方框中提到的功能可以不按照附图中指出的顺序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者框有时可以以相反的顺序执行。还将注意到,框图和/或流程图的每个框以及框图和/或流程图中的框的组合可以由执行指定的功能或动作的基于专用硬件的系统执行专用硬件和计算机指令的组合。

Claims (21)

1.一种系统,包括:
处理器,被配置为:
以半结构化的格式接收主题要求;
基于预定义的分类来分类所述主题要求;
基于语法从所述主题要求中提取实体列表;
基于词汇表生成解决方案,其中为了生成所述解决方案,处理器还被配置为:
基于分类和提取的实体在模型库中检测适当的训练数据集,以及
基于所述训练数据集生成模型;和
基于所述解决方案生成流分析应用,其中,所述流分析应用包括所述模型。
2.根据权利要求1所述的系统,其中为了生成所述解决方案,所述处理器还被配置为通过将所提取的实体映射到所述词汇表中的概念图和属性来生成流分析应用组件。
3.根据权利要求1所述的系统,其中所述主题要求包括人类可读语言的多个约束。
4.根据权利要求1所述的系统,其中所述词汇表包括组织的预定词汇表。
5.如权利要求1所述的系统,其中所述训练数据集包括分类的训练数据。
6.根据权利要求1所述的系统,其中所述预定义分类包括包含单词的预定义类别。
7.如权利要求6所述的系统,所述处理器还被配置为确定在模型库中是否存在适当的模型,并且如果存在适当的模型则从所述模型库提取适当的模型,所述适当的模型将被包括在所述流分析应用中。
8.一种计算机实现的方法,包括:
经由处理器以半结构化格式接收所述主题要求;
经由处理器基于预定义的分类来分类所述主题要求;
经由处理器基于语法从所述主题要求中提取实体列表;
经由处理器基于词汇表和所提取的实体的列表来生成解决方案;和
经由处理器基于所述解决方案生成流分析应用。
9.根据权利要求8所述的计算机实现的方法,其中基于所述词汇表和所提取的实体来生成所述解决方案还包括:
经由处理器确定模型库中是否存在适当的模型;
如果检测到适当的模型,则经由处理器从模型库取得该适当的模型;
如果在模型库中未检测到适当的模型,则经由处理器基于分类和所提取的实体在模型库中检测适当的训练数据集;
经由处理器基于所述训练数据集产生模型;和
经由处理器通过将提取的实体映射到词汇表中的概念图和属性来生成流分析应用组件。
10.如权利要求8所述的计算机实现的方法,还包括基于元数据比较对解决方案进行评分并返回具有较高分数的一组解决方案。
11.如权利要求8所述的计算机实现的方法,其中生成解决方案包括将实体列表映射到解决方案组件。
12.根据权利要求9所述的计算机实现的方法,其中确定是否存在适当的模型包括将所述实体列表映射到解决方案组件,并将映射的解决方案组件与模型库中的现有模型中的解决方案组件进行比较。
13.根据权利要求9所述的计算机实现的方法,其中检测适当的训练数据集包括将训练数据元数据与所提取的实体列表进行比较。
14.如权利要求8所述的计算机实现的方法,还包括接收来自主题专家的反馈,并且基于反馈更新词汇表中的流分析应用概念图。
15.一种用于生成流分析应用的计算机程序产品,所述计算机程序产品包括:
计算机可读存储介质,其具有包含于其中的程序代码,所述程序代码可由处理器执行以使所述处理器:
以半结构化的格式接收主题要求;
基于预定义的分类来分类所述主题要求;
基于语法从所述主题要求中提取实体列表;
基于分类和提取的实体在模型库中检测适当的训练数据集;
基于所述训练数据集生成模型;和
生成包括挖掘组件的流分析应用。
16.如权利要求15所述的计算机程序产品,还包括可由所述处理器执行的程序代码,以:
检测模型库中的现有模型;和
基于模型库中现有的模型生成流分析应用。
17.根据权利要求15所述的计算机程序产品,还包括由所述处理器可执行的程序代码,以将所述实体列表映射到解决方案组件,并将映射的解决方案组件与模型库中的现有模型中的解决方案组件进行比较。
18.根据权利要求15所述的计算机程序产品,还包括处理器可执行的程序代码,用于检测操作不存在并将任务生成请求发送到用户界面。
19.根据权利要求15所述的计算机程序产品,进一步包含可由所述处理器执行以从主题专家接收反馈且基于反馈修改所述流分析应用的程序代码。
20.根据权利要求16所述的计算机程序产品,还包括可由所述处理器执行的程序代码,以从模型库中提取现有模型并且基于模型生成挖掘组件。
21.一种包括程序代码装置的计算机程序,所述程序代码装置适于当所述程序在计算机上运行时执行根据权利要求8至14中任一项所述的方法。
CN201680068770.7A 2015-12-09 2016-12-06 使用词汇表生成流分析应用 Active CN108431793B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/963,597 2015-12-09
US14/963,597 US9542655B1 (en) 2015-12-09 2015-12-09 Generating streaming analytics applications using a glossary
PCT/IB2016/057377 WO2017098403A1 (en) 2015-12-09 2016-12-06 Generating streaming analytics applications using glossary

Publications (2)

Publication Number Publication Date
CN108431793A true CN108431793A (zh) 2018-08-21
CN108431793B CN108431793B (zh) 2022-02-01

Family

ID=57706024

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680068770.7A Active CN108431793B (zh) 2015-12-09 2016-12-06 使用词汇表生成流分析应用

Country Status (5)

Country Link
US (2) US9542655B1 (zh)
JP (1) JP6875394B2 (zh)
CN (1) CN108431793B (zh)
GB (1) GB2560860B (zh)
WO (1) WO2017098403A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967123A (zh) * 2020-06-30 2020-11-20 中汽数据有限公司 一种仿真测试中仿真测试用例的生成方法
CN117707831A (zh) * 2024-02-05 2024-03-15 云账户技术(天津)有限公司 一种前端接口错误的报警方法和装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10031747B2 (en) * 2015-12-15 2018-07-24 Impetus Technologies, Inc. System and method for registration of a custom component in a distributed computing pipeline
US10659481B2 (en) * 2016-06-29 2020-05-19 Paypal, Inc. Network operation application monitoring
US10984438B2 (en) * 2017-07-28 2021-04-20 Ingram Micro Inc. Technologies for automatically validating the functionality of offers in a cloud service brokerage system
US11200100B2 (en) 2019-12-16 2021-12-14 Vmware, Inc. Alert notification on streaming textual data
US11475222B2 (en) 2020-02-21 2022-10-18 International Business Machines Corporation Automatically extending a domain taxonomy to the level of granularity present in glossaries in documents
US11531708B2 (en) 2020-06-09 2022-12-20 International Business Machines Corporation System and method for question answering with derived glossary clusters

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6807535B2 (en) * 2000-03-08 2004-10-19 Lnk Corporation Intelligent tutoring system
CN101039369A (zh) * 2006-03-14 2007-09-19 株式会社理光 电子邮件编辑设备、图像形成装置以及电子邮件编辑方法
US20110029587A1 (en) * 2008-03-31 2011-02-03 Fujii John M Updating Retrieval Codes In Response To File Transfers

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002057916A2 (en) 2001-01-19 2002-07-25 Russell William Teubner An improved system, method and apparatus to allow communication between cics and non-cics software applications
US20030233631A1 (en) 2002-06-13 2003-12-18 Ambrose Curry Web services development method
US8244958B2 (en) 2005-05-09 2012-08-14 Sandisk Il Ltd. Method and system for facilitating fast wake-up of a flash memory system
US20070261041A1 (en) 2005-08-23 2007-11-08 Lisa Amini Method and system for dynamic application composition in streaming systems
WO2007086059A2 (en) 2006-01-25 2007-08-02 Equivio Ltd. Determining near duplicate 'noisy' data objects
US20070204020A1 (en) 2006-02-24 2007-08-30 International Business Machines Corporation System and method of stream processing workflow composition using automatic planning
US20070245298A1 (en) 2006-04-18 2007-10-18 International Business Machines Corporation Apparatus and data structure for automatic workflow composition
US7860815B1 (en) 2006-07-12 2010-12-28 Venkateswara Prasad Tangirala Computer knowledge representation format, system, methods, and applications
US20080091690A1 (en) 2006-10-13 2008-04-17 International Business Machines Corporation Deriving a Data Model From a Hierarchy Of Related Terms, And Deriving a Hierarchy Of Related Terms From a Data Model
US8098248B2 (en) 2007-04-02 2012-01-17 International Business Machines Corporation Method for semantic modeling of stream processing components to enable automatic application composition
US7882485B2 (en) 2007-04-02 2011-02-01 International Business Machines Corporation Method for modeling components of an information processing application using semantic graph transformations
US7899861B2 (en) 2007-04-02 2011-03-01 International Business Machines Corporation Method for declarative semantic expression of user intent to enable goal-driven stream processing
US8863102B2 (en) 2007-04-02 2014-10-14 International Business Machines Corporation Method and system for assembling information processing applications based on declarative semantic specifications
US8370812B2 (en) 2007-04-02 2013-02-05 International Business Machines Corporation Method and system for automatically assembling processing graphs in information processing systems
US8307372B2 (en) 2007-04-02 2012-11-06 International Business Machines Corporation Method for declarative semantic expression of user intent to enable goal-driven information processing
US8271870B2 (en) 2007-11-27 2012-09-18 Accenture Global Services Limited Document analysis, commenting, and reporting system
US8412516B2 (en) 2007-11-27 2013-04-02 Accenture Global Services Limited Document analysis, commenting, and reporting system
US8266519B2 (en) 2007-11-27 2012-09-11 Accenture Global Services Limited Document analysis, commenting, and reporting system
US9503354B2 (en) 2008-01-17 2016-11-22 Aerohive Networks, Inc. Virtualization of networking services
US8898624B2 (en) 2008-05-05 2014-11-25 International Business Machines Corporation Method and apparatus for simplified assembly of parametric information processing applications
US20100036691A1 (en) 2008-08-06 2010-02-11 International Business Machines Corporation Phase driven modeling services
FR2938676B1 (fr) * 2008-11-18 2011-01-21 Eads Europ Aeronautic Defence Procede de reconnaissance de motifs sequentiels pour procede de traitement des messages de pannes
US8677313B2 (en) 2009-11-30 2014-03-18 Accenture Global Services Limited Functional design creation tool
EP2362333A1 (en) 2010-02-19 2011-08-31 Accenture Global Services Limited System for requirement identification and analysis based on capability model structure
US8566731B2 (en) 2010-07-06 2013-10-22 Accenture Global Services Limited Requirement statement manipulation system
US9773081B2 (en) 2010-07-07 2017-09-26 International Business Machines Corporation Analytic model lifecycle maintenance and invalidation policies
US20130138421A1 (en) 2011-11-28 2013-05-30 Micromass Uk Limited Automatic Human Language Translation
US9002842B2 (en) 2012-08-08 2015-04-07 Equivio Ltd. System and method for computerized batching of huge populations of electronic documents
US9047356B2 (en) 2012-09-05 2015-06-02 Google Inc. Synchronizing multiple reading positions in electronic books
US8447801B1 (en) 2012-11-01 2013-05-21 LavaRipples, LLC Content sharing with limited cloud storage

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6807535B2 (en) * 2000-03-08 2004-10-19 Lnk Corporation Intelligent tutoring system
CN101039369A (zh) * 2006-03-14 2007-09-19 株式会社理光 电子邮件编辑设备、图像形成装置以及电子邮件编辑方法
US20110029587A1 (en) * 2008-03-31 2011-02-03 Fujii John M Updating Retrieval Codes In Response To File Transfers

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
DAVID W AHA等: ""The Omnipresence of Case Based Reasoning in Science and Application"", 《KNOWLEDGE-BASED SYSTEMS》 *
E.K. BURKE等: ""Structured cases in case-based reasoning—re-using and adapting cases for time-tabling problems"", 《KNOWLEDGE-BASED SYSTEMS 13》 *
JIANPING ZHANG等: ""Intelligent Selection of Instances for Prediction Functions in Lazy Learning Algorithms"", 《ARTIFICIAL INTELLIGENCE REVIEW》 *
RODRIGO G. C. ROCHA等: ""A case-based reasoning system to support the global software development"", 《18TH INTERNATIONAL CONFERENCE ON KNOWLEDGE-BASED AND INTELLIGENT INFORMATION & ENGINEERING SYSTEMS - KES2014》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111967123A (zh) * 2020-06-30 2020-11-20 中汽数据有限公司 一种仿真测试中仿真测试用例的生成方法
CN111967123B (zh) * 2020-06-30 2023-10-27 中汽数据有限公司 一种仿真测试中仿真测试用例的生成方法
CN117707831A (zh) * 2024-02-05 2024-03-15 云账户技术(天津)有限公司 一种前端接口错误的报警方法和装置
CN117707831B (zh) * 2024-02-05 2024-04-09 云账户技术(天津)有限公司 一种前端接口错误的报警方法和装置

Also Published As

Publication number Publication date
CN108431793B (zh) 2022-02-01
US20170169359A1 (en) 2017-06-15
GB201811031D0 (en) 2018-08-22
US9542655B1 (en) 2017-01-10
GB2560860A (en) 2018-09-26
US10832164B2 (en) 2020-11-10
WO2017098403A1 (en) 2017-06-15
JP6875394B2 (ja) 2021-05-26
JP2019510282A (ja) 2019-04-11
GB2560860B (en) 2021-09-22

Similar Documents

Publication Publication Date Title
CN108431793A (zh) 使用词汇表生成流分析应用
CN108140007A (zh) 跨部署位置安全地部署应用程序
CN108073760A (zh) 用于获取分析模型编写知识的方法及系统
EP4137961A1 (en) Method and apparatus for executing automatic machine learning process, and device
US20200241852A1 (en) Intelligent Assistant for Automating Recommendations for Analytics Programs
WO2017117230A1 (en) Method and apparatus for facilitating on-demand building of predictive models
Lin et al. Development of a synthetic data set generator for building and testing information discovery systems
KR20150143473A (ko) 재계산 사용자 인터페이스 내의 신호 캡처 컨트롤
CN103810233A (zh) 内容管理
CN112396108A (zh) 业务数据评估方法、装置、设备及计算机可读存储介质
CN104252345B (zh) 在云环境中管理复杂对象的方法及系统
CN112199086A (zh) 自动编程控制系统、方法、装置、电子设备及存储介质
KR101665861B1 (ko) IoT 환경에서의 데이터 처리 시스템 및 방법
CN109101519A (zh) 信息采集系统和异构信息融合系统
CN103810232A (zh) 内容管理
CN108829879A (zh) 一种充电桩数据监控方法
CN110457505A (zh) 基于图数据库进行关系挖掘的方法和装置
CN105989261A (zh) 用于保护电子设备的方法和计算机系统
Liermann Overview machine learning and deep learning frameworks
CN109588054A (zh) 使用分布式模拟引擎对具有大型复杂数据集的系统的精确且详细的建模
CN106599241A (zh) 一种gis软件中针对大数据的可视化管理方法
WO2023147131A1 (en) Auto adapting deep learning models on edge devices for audio and video
Wirsch Analysis of a top-down bottom-up data analysis framework and software architecture design
CN110162521A (zh) 一种支付系统交易数据处理方法及系统
Vashisth et al. Hype cycle for data science and machine learning, 2019

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant