CN103136417A - 用于建模分析的基于互联网的托管系统和计算机可读介质 - Google Patents

用于建模分析的基于互联网的托管系统和计算机可读介质 Download PDF

Info

Publication number
CN103136417A
CN103136417A CN2012105099423A CN201210509942A CN103136417A CN 103136417 A CN103136417 A CN 103136417A CN 2012105099423 A CN2012105099423 A CN 2012105099423A CN 201210509942 A CN201210509942 A CN 201210509942A CN 103136417 A CN103136417 A CN 103136417A
Authority
CN
China
Prior art keywords
data set
receives
modeling
internet
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012105099423A
Other languages
English (en)
Other versions
CN103136417B (zh
Inventor
孟召兵
金祖胜
陈友明
宁平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LIFTCHART LLC
Original Assignee
LIFTCHART LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LIFTCHART LLC filed Critical LIFTCHART LLC
Publication of CN103136417A publication Critical patent/CN103136417A/zh
Application granted granted Critical
Publication of CN103136417B publication Critical patent/CN103136417B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Abstract

一个基于互联网的系统和包括代码的计算机可读的介质,用于确定与接收到的数据集相关的多个建模分析,其中至少有一个接收到的数据集是通过互联网接收的,接收多个建模分析任务的说明,通过互联网收集建模分析任务的说明,基于确定的多个建模分析任务和接收到的建模分析任务的说明在接收到的数据集上执行建模分析并通过互联网递送建模分析结果。

Description

用于建模分析的基于互联网的托管系统和计算机可读介质
技术领域
本方法和系统大体上涉及统计建模,更具体地涉及用于建模分析的基于互联网的托管系统和计算机可读介质。
背景技术
目前,建模分析需要用户已经购买的建模分析软件。此外,目前的建模分析软件需要专家级的知识,才能够从分析中提取有用的信息。这两个条件,专家级的互动以及资本密集型的软件,成了公司在建模分析方面的重大障碍。
因此,需要一种用于建模分析的基于互联网的托管系统和计算机可读介质。更具体地,需要一个基于互联网递送的、提供简化的用户交互的、根据请求进行回归建模的预测建模服务。该服务可递送到互联网浏览器、移动设备、数据集成服务(例如消息代理)或文件传输服务。
此外,需要一个允许从可用互联网的任何地方远程访问预测建模的系统和计算机可读介质。该系统允许可通过互联网上的订阅服务提供的建模服务的递送,并且允许可以通过每一个模型需求定价提供的建模服务的递送。系统和计算机可读介质可用一个数据集根据来自互联网的请求来建立多个模型,并且可用一个模型根据来自互联网的请求评价多个数据集。
设想的是,本系统通过由用户指定的授权访问可以根据需求共享模型数据和结果。该系统允许在用户配置中定制建模预设置、建模递送方法、建模数据和结果的共享。这个基于互联网递送的用于建模的预测建模服务为多个客户保持适当的访问控制,其中一个客户不能查看另一个客户的数据或结果。
发明内容
将描述一个基于互联网的计算机程序的例子,其存储于计算机可读介质并由处理器执行操作。所述计算机程序包含计算机可读的程序代码,此程序代码确定与接收到的数据集有关的多个建模分析任务,其中接收到的数据集是通过互联网接收到的。此程序代码包含下列指令:用于接收多个建模分析任务说明,通过互联网收集这些建模分析任务的说明,根据之前确定的多个建模分析任务和接收到的说明对接收到的数据集执行建模分析,以及通过互联网递送建模分析的结果。
该程序可进一步具有用于收集接收到的数据集的目标变量名称(designation)、收集建模分析任务的预测模型类型名称、以及收集接收到的数据集的数据集格式的代码。对接收到的数据集的预测建模可基于已经确定的多种建模分析任务、数据集的格式、收集到的目标变量名称、以及预测建模类型名称。该代码还可包括用于通过互联网递送预测模型、评价预测模型,并通过互联网递送评价结果的指令。该收集到的项目可以通过互联网收集。
此外,该程序可含有存储接收到的数据集的代码,其用于将多种预测模型应用至接收到的数据集。该代码可含有用于通过互联网收集应用于预测模型的一组建模预设置(例如递送方法预设置、数据共享预设置和结果共享预设置)中的至少一个的指令。
此外,可以想到的是,该程序可含有用于把收到的数据集分为一个训练数据集和一个验证数据集、训练预测模型以优化预测模型同训练数据集的匹配、并且利用验证数据集来验证该预测模型的代码。
此外,该代码可含有用于存储预测模型的结果记录和结果文件、收到的数据集的记录、目标变量名称以及数据集的格式的指令。
该代码还可含有用于读取如下内容的指令,所述内容包括预测模型的结果记录和预测模型的结果文件。当程序已经完成建模分析后,所述代码可具有用于确认建模完成的指令。该程序还可含有用于从接收到的数据集提取头信息的代码,其中数据集格式包含统计系统文件格式。通用的统计系统的文件格式可包括CSV文件格式、SAS文件格式、SPSS文件格式、S-Plus文件格式、Stata(DTA)文件格式、Systat(SYS)文件格式、EpiInfo(REC)文件格式、Minitab(Minitab便携工作表)文件格式以及XML格式等。
变量的加权允许一些变量对结果有更大的影响。该代码可含有用于通过互联网收集接收到的数据集的至少一个加权变量的名称、接收到的数据集的包括变量的名称、和接收到的数据集的排除变量的名称的指令。
该代码可含有用于分割分析的指令,例如确定接收到的数据集的分割类型,其中分割类型选自由监督分割和非监督分割组成的组中。此外,该代码可含有基于监督分割收集接收到的数据集的目标变量名称(通过互联网收集)、确定多个分割任务、对收到的数据集基于多种分割任务、目标变量名称以及分割类型来执行监督分割分析的指令。对接收到的数据集的非监督分割分析可以基于确定的多个分割任务和分割类型。在这两种情况下,该代码含有用于通过互联网递送监督分割分析和非监督分割分析的结果的指令。
此外,该代码还可含有用于概要(profiling)分析的指令,例如通过互联网收集接收到的数据集的概要总体类别变量名称,确定多个概要任务,基于已经确定的多个概要任务和概要总体类别变量名称执行接收到的数据集的概要分析,并通过互联网递送概要分析的结果。
此外,该代码还可含有用于方差分析的指令,例如通过互联网收集接收到的数据集的方差分析变量名称,确定多个方差分析任务,基于方差分析变量名称和多个方差分析任务对接收到的数据集执行方差分析测试,并通过互联网递送方差分析测试的结果。
在一个实施例中,系统包括一个内存,该内存用来存储通过互联网接收到的数据集和应用到接收到的数据集的模型说明。该系统具有一个或多个处理器,其共同地用来确定与接收到的数据集相关的多个统计建模任务,根据已经确定的多个统计建模任务和模型说明对该接收到的数据集进行建模,以所述模型对附加的接收到的数据集进行评价,并通过互联网递送建模和评价结果。
在示例系统中,内存也可存储应用于多个接收到的数据集的至少一个模型和接收到的数据集,以将多个模型应用至接收到的数据集。该内存也可存储一组应用于模型的建模预设置的至少一个、用于建模和评价结果的递送的递送方法预设置、接收到的数据集的数据共享预设置、以及建模和评价结果的结果共享预设置。
在示例系统中,模型可包括最佳化接收到的数据集的匹配的多个模型。该模型说明可进一步包括接收到的数据集的接收到的数据集格式、接收到的数据集的目标变量名称、接收到的数据集的至少一个加权变量名称、接收到的数据集的包括变量名称和接收到的数据集的排除变量名称。内存可用于存储收到的数据集的数据集记录,并且一个或多个处理器可用于从接收到的数据集提取头信息。处理器可用于确认建模的完成,接受建模结果的请求,递送建模的结果记录并递送建模的结果文件。
在另一个实施例中,系统可包括一个内存,该内存用来存储通过互联网接收到的数据集和应用到接收到的数据集的模型说明。该模型说明至少包括接收到的数据集的接收到的数据集格式、接收到的数据集的目标变量名称和至少一个接收到的数据集的加权变量名称。该系统还可包含接收到的数据集的包括变量名称和接收到的数据集的排除变量名称。
该系统可进一步包含一个或多个处理器,其共同用于把收到的数据集分成一个训练数据集和一个验证数据集,并用多个统计建模任务训练多个模型以优化训练数据集的匹配。该训练基于模型说明。该系统验证多个训练过的模型同验证数据集的匹配,评价多个验证过的模型,并通过互联网递送多个验证过的模型的评价结果。
互联网通信接口可包括互联网浏览器、移动设备、数据集成服务和文件传输服务中的至少一个。互联网通信网络可包括有线、无线和光通信的至少一个。
附图说明
图1描绘了第一个用于建模分析的基于互联网的托管系统;
图2是第一个用于建模分析系统的基于互联网的托管系统的流程图;
图3是软件流程框图;
图4是软件流程框图的预测建模部分;
图5是软件流程框图的用户预设置部分;
图6是软件流程框图的用于未来应用的存储部分;
图7是软件流程框图的训练和验证部分;
图8是软件流程框图的预测模型存储部分;
图9是软件流程框图的建模完成和数据读取部分;
图10是软件流程框图的分割分析部分;
图11是软件流程框图的格式选择部分;
图12是软件流程框图的信息存储和头信息提取部分;
图13是软件流程框图的概要分析部分;
图14是软件流程框图的方差分析(ANOVA)部分;
图15是软件流程框图的变量名称部分;
图16描绘了用于建模分析的第二个基于互联网的托管系统;
图17描绘了该系统的用于未来应用的存储部分;
图18描绘了该系统的用户预设置部分;
图19描绘了该系统的模型说明部分;
图20描绘了该系统的信息存储和头信息提取部分;
图21描绘了该系统的建模分析完成和数据接收部分;
图22描绘了第三个用于建模分析的基于互联网的托管系统;以及
图23描绘了该系统的互联网通信接口和连接。
具体实施方式
图1显示一个示例系统图100。用户通过计算机110的互联网浏览器访问该系统。该服务可以递送至互联网浏览器、移动设备、数据集成服务(例如消息中介)或文件传输服务等等。计算机110通过互联网120连接到系统的防火墙130。通信协议可以是传输控制协议(TCP)、互联网协议(IP)、全球移动通信系统(GSM)等等。防火墙130联网到网络服务器140,其依次联网到数据库服务器150和文件系统160。数据库服务器150和文件系统160联网到分析建模服务器170。通信结合可以包括有线、无线、光以及它们的混合等等。
图2显示该系统的一个示例操作200。操作200显示用户210、网络服务器220、数据库服务器230、文件系统240和分析建模服务器250的交互。网络服务器220在网络服务器220接收到来自用户210的一个数据集252。数据集由用户编辑并提供,并可以作为例如电子表格或数据库文件等传送。网络服务器220也可接收来自用户的模型说明262。
模型说明包括目标变量、预测属性、建模模式等。该数据集有一个存储在数据库服务器230的相关记录254。从网络服务器220收到的数据集256存储在文件系统240上。通过分析建模服务器250从数据集中提取头信息258。
用户210从网络服务器220收到一个属性260的显示。从网络服务器220收到模型说明并将其存储264在数据库服务器230。当从网络服务器220收到模型说明时,其触发建模过程266。
通过分析建模服务器250从数据库服务器230读取模型说明268。通过分析建模服务器250从文件系统240读取数据文件270。建模过程被执行272。从分析建模服务器250把结果记录存储274在数据库服务器230。从分析建模服务器250把结果文件存储276在文件系统240。
建模过程后,用户210从分析建模服务器250收到确认278。网络服务器220收到来自用户210的结果请求280。网络服务器220从数据库服务器230读取结果记录282,从文件系统240读取结果文件284。通过网络服务器220将结果显示286给用户210。
图3中描述一个基于互联网的、存储于计算机可读介质和并由处理器执行的计算机程序的实施例。该程序包括确定310与通过互联网收到的数据集关联的多个建模分析任务,接收320多个建模分析任务的说明并通过互联网收集330一组建模预设置的代码。此外,该程序包括依据确定的多个建模分析任务以及收到的建模分析任务的说明在接收到的数据集上进行340建模分析,并通过互联网递送350建模分析结果的代码。
如图4所示,计算机可读介质还可以包括用于收集410接收到的数据集的目标变量名称的指令,收集420建模分析任务的预测建模类型名称的指令,和收集430接收到的数据集的数据集格式的指令。该程序还可包括用于依据确定的多个建模分析任务、数据集格式、收集到的目标变量名称和预测建模类型名称执行440接收到的数据集的预测建模并导致预测模型的指令。该计算机可读介质还可包括通过互联网递送450预测模型、评价460接收的数据集和通过互联网递送470模型评价结果的指令。收集到的项目可通过互联网收集。
用户预设置也可以如图5的500所示的收集。用户预设置收集可包括通过互联网收集510可由用户设定的一组建模预设置520、用于预测模型的递送的递送方法预设置530、接收到的数据集的数据共享预设置540和预测模型的结果共享预设置550中的至少一个。
参考图6,代码可包含存储610预测模型以便应用至多个接收到的数据集,和存储620接收到的数据集以便将多个预测模型应用至接收到的数据集。
训练集是接收数据的子集,用于发现潜在预测关系。验证集也是接收数据的子集,用于确定该预测模型的匹配度。图7描绘了软件流程框图的训练和验证部分,包含指令700,用于将接收到的数据集分成710一个训练数据集和一个验证数据集,训练720预测模型以优化预测模型对训练数据集匹配,并利用验证数据集验证730预测模型。
图8描绘了与预测模型的结果相关的代码的预测模型部分的存储800。在本实施例中,计算机可读介质可包含用于存储810接收到的数据集的预测模型的结果记录并存储820接收到的数据集的预测模型的结果文件的指令。
在已经完成了接收到的数据集的预测建模后,计算机可读介质可包含用于将建模完成的确认发送910给用户的指令,读取920预测模型的结果记录的指令,和如图9中所示读取930预测模型的结果文件。
分割分析是对接收到的数据集的指定部分分组的任务,使得在同一组的对象相对在其他组的那些彼此之间更加类似。接收到的数据集的分割也可以如图10中描述的来执行1000。确定1010接收到的数据集的分割类型。分割类型可以是多个类型中的一个,包括监督分割和非监督分割。对于监督分割,可通过互联网1020收集目标变量名称。确定1030多个分割任务,并执行1040监督或非监督分割分析。如果在接收到的数据集执行监督分割分析1050,它是依据多个分割任务、目标变量名称和分割类型。如果在接收到的数据集执行1060非监督分割分析,它将依据多个确定的分割任务和分割类型。然后监督分割分析和/或非监督分割分析的结果通过互联网递送1070。
如图11中所示,用户提供的数据集格式可包含1100统计系统文件格式,例如CSV格式1110、SAS文件格式1120、SPSS文件格式1130、S-Plus文件格式1140、Stata文件格式1150、Systat文件格式1160、EpiInfo文件格式1170、Minitab文件格式1180和XML格式1190等等。
如图12中所示,各种类型的信息可以从接收到的数据集中加以收集和存储。通过互联网收集接收到的数据集的数据集格式1206和目标变量名称1207。代码也可确认1208用户收到的任务指令,例如说明、数据集格式和目标变量名称的确收。关于建模分析任务的状态通知也可以发送1209给用户。可以存储接收到的数据集的接收数据集记录1210,目标变量名称1220和数据集格式1230,并且可提取1240头信息。
总体概要是对接收到的数据的分析,使它的结构、内容和关系明晰。概要分析将允许用户深入了解多个可比较的总体领域。概要分析将通过在多个选定的尺寸的指定总体比较和对比属性。
如图13中的1300所示,代码可包含可以进行分析的接收到的数据集的概要数据。这种分析可以包括通过互联网收集1310接收到的数据集的概要总体类别变量名称,确定1320多个概要任务,根据所确定的多个概要任务和概要总体类别变量名称对接收到的数据集执行1330概要分析,并通过互联网递送1340概要分析的结果。
方差分析是一种同时在两个或更多的平均值之间进行比较的统计方法。这种统计方法产生的值可进行测试,以确定变量之间是否存在显著关系。如图14中一个实例中所示,方差分析(ANOVA)信息也可以从所接收到的数据集确定1400。可通过互联网收集1410接收到的数据集的方差分析变量名称,确定1420与方差分析相关的多个任务,然后基于方差分析变量名称和多个方差分析任务执行方差分析测试的实际进行1430。可通过互联网递送1440方差分析测试的结果。
如图15中所示,也可通过互联网收集1510接收到的数据集的各种类型的变量名称。变量名称类型可包括加权变量1520、包括变量1530和排除变量1540。
图16示出了一个用于实施建模分析的优选系统1600。该系统将包括一个内存1610,该内存用来存储通过互联网收到的接收到的数据集1620以及用于接收到的数据集的模型说明1630和建模类型1632。该系统将包括一个或多个处理器1640,其共同用于确定与接收到的数据集关联的多个统计建模任务1650,根据确定的多个统计建模任务、建模说明和模型预设置为接收到的数据集建模1660,对附加的接收到的数据集进行评价1670,并通过互联网递送1680建模和评价结果。
关于图17,系统还可包括一个内存,其构造成存储1710至少一个应用至多个接收到的数据集的模型1720以及将多个模型应用至接收到的数据集的接受的数据集1730。该模型可包括多个模型以便优化多个模型对接收到的数据集1740的匹配。
如图18中所示,该系统可进一步包括一个内存,其构造成存储1810应用至模型的一组模型预设置1820的至少一个,用于递送建模和评价结果的递送方法预设置1830,接收到的数据集的数据分享预设置1840和建模和评分结果的结果分享预设置1850等等。
图19示出了模型说明191可进一步包括接收到的数据集格式1920,一个目标变量名称1930和至少一个1940加权变量名称1950,包括变量名称1960以及排除变量名称1970。
如图20中所示,内存可用于进一步存储接收到的数据集记录2010,并且一个或多个处理器可用于从接收到的数据集提取头信息2020。
该处理器可另外被用来2110确认建模的完成2120。至于建模结果,该系统可用来接收对结果的请求2130,递送结果记录2140并递送结果文件2150。
图22示出了另一个实施建模分析的系统实施例2200。该系统包括两个主系统,内存2210和一个或多个处理器2230。该系统包括内存,其用来存储2210通过互联网收到的数据集2212和被应用到接收到的数据集的模型说明2214。模型说明包括至少以下与接收到的数据集有关的信息:接收到的数据集格式2216,目标变量名称2218,建模类型2219,和加权变量名称2222、包括变量名称2224以及排除变量名称2226中的至少一个。
系统2200还包括一个或多个处理器,其共同地用于2230将接收到的数据集分割2232成为训练数据集和验证数据集,用多个统计建模任务训练多个模型2234以最佳化训练数据集的多个模型匹配,其中训练根据模型说明进行。此外,该系统还将用训练的多个模型与验证数据集的匹配验证多个训练模型2236。该系统然后对多个验证过的模型评价2238,并通过互联网递送2240多个验证过的模型的评价结果。
图23示出了互联网通信接口和网络。互联网通信接口2310包括互联网浏览器2320、移动设备2330、数据集成服务2340和文件传输服务2350的至少一个。互联网通信网络2360包括有线2370、无线2380和光通信2390的至少一个。建模过程2392完成的确认可包括电子邮件2394和SMS消息2396的至少一个。

Claims (26)

1.一个储存在计算机可读介质上并用处理器来执行的基于互联网的计算机程序,此计算机程序包括计算机可读的程序代码,所述代码用于:
确定与至少一个接收到的数据集相关的多个建模分析任务,其中所述至少一个接收到的数据集通过互联网接收;
接收所述多个建模分析任务的说明;
通过互联网来收集所述建模分析任务的说明;
部分根据所述的确定的多个建模分析任务以及所述建模分析任务的所述接收到的说明在所述的至少一个接收的数据集上执行建模分析;并
通过互联网递送所述建模分析的结果。
2.根据权利要求1 所述的计算机程序,其特征在于,其进一步包括:
收集所述至少一个接收到的数据集的目标变量名称;
收集所述建模分析任务的预测建模类型名称;
收集所述至少一个接收到的数据集的数据集格式;
在所述的至少一个接收到的数据集上进行预测建模,其部分基于所述多个确定的建模分析任务、所述数据集格式、 所述收集的目标变量名称、所述预测建模类型名称、导致一个预测模型的预测建模;
通过互联网递送所述预测模型;
根据所述至少一个接收到的数据集评价预测模型;并
通过互联网递送所述预测模型评价结果。
3.根据权利要求2 所述的计算机程序,其特征在于,其进一步包括存储应用于多个接收到的数据集的所述预测模型。
4.根据权利要求2 所述的计算机程序,其特征在于,其进一步包括存储所述至少一个收到的数据集,以应用多个预测模型至所述接收到的数据集。
5.根据权利要求2所述的计算机程序,其特征在于,所述预测建模包括回归建模分析。
6.根据权利要求2 所述的计算机程序,其特征在于,所述预测建模包括多个预测模型,其优化所述预测模型在所述至少一个接收到的数据集上的多个匹配。
7.根据权利要求2 所述的计算机程序,其特征在于,其进一步包含收集以下中的至少一个:
一组应用于所述预测模型的建模预设置;
用于所述预测建模递送的递送方式预设置;
所述至少一个接收到的数据集的数据共享预设置;以及
所述预测模型的结果共享预设置。
8.根据权利要求2 所述的计算机程序,其特征在于,其进一步包含:
将所述至少一个接收到的数据集分成训练数据集和验证数据集;
训练所述预测模型以优化所述预测模型在所述训练数据集上的匹配;以及
利用所述验证数据集验证所述预测模型。
9.根据权利要求2 所述的计算机程序,其特征在于,其进一步包括:
存储所述至少一个接收到的数据集的所述预测模型的结果记录;以及
存储所述至少一个接收到的数据集的预测模型的结果文件。
10.根据权利要求2 所述的计算机程序,其特征在于,其进一步包括:
确认所述建模的完成;
读取所述至少一个接收到的数据集的所述预测模型评价结果的所述结果记录;以及
读取所述至少一个接收到的数据集的所述预测模型评价结果的结果文件。
11.根据权利要求1 所述的计算机程序,其特征在于,其进一步包括:
确定所述至少一个接收到的数据集的分割类型,其中所述分割类型是从监督分割和非监督分割组成的组中选出的;
收集基于所述监督分割的所述至少一个接收到的数据集的目标变量名称;
确定多个分割任务;
执行以下步骤中的至少一个:
部分基于所述多个分割任务、所述目标变量名称和所述分割类型的所述至少一个接收到的数据集的监督分割分析;以及
部分基于所述确定的多个分割任务和所述分割类型的所述至少一个接收到的数据集的非监督分割分析;以及
通过互联网递送至少一个所述监督分割分析和所述非监督分割分析的结果。
12.根据权利要求1 所述的计算机程序,其特征在于,其进一步包括:
收集所述至少一个接收到数据集的数据集格式,其中所述数据集格式是统计系统的文件格式。
13.根据权利要求1 所述的计算机程序,其特征在于,其进一步包括:
收集所述至少一个接收到的数据集的数据集格式;
收集所述至少一个接收到的数据集的目标变量名称;
确认所述接收到的说明、所述数据集格式和所述目标变量名称;
发出所述建模分析任务的状态通知;
存储所述至少一个接收到的数据集的接收到的数据集记录;
存储所述至少一个接收到的数据集的所述目标变量名称;
存储所述至少一个接收到的数据集的所述数据集格式;以及
从所述至少一个接收到的数据集提取头信息。
14.根据权利要求1 所述的计算机程序,其特征在于,其进一步包括:
收集所述至少一个接收到的数据集的至少一个概要总体类别变量名称;
确定多个概要任务;
部分基于所述确定的多个概要任务和所述至少一个概要总体类别变量名称进行所述至少一个接收到的数据集的概要分析;以及
通过互联网递送所述概要分析的结果。
15.根据权利要求1 所述的计算机程序,其特征在于,其进一步包括:
收集所述至少一个接收到的数据集的至少一个方差分析变量名称;
确定多个方差分析任务;
部分基于所述至少一个方差分析变量名称和所述多个方差分析任务进行至少一个接收到的数据集的方差分析测试;以及
通过互联网递送所述方差分析测试的结果。
16.根据权利要求1所述的计算机程序,其特征在于,其进一步包括收集以下中的至少一个:
所述至少一个接收到的数据集的加权变量名称;
所述至少一个接收到的数据集的包括变量名称;以及
所述至少一个接收到的数据集的排除变量名称。
17.一个系统,包括:
一个内存,该内存用于储存:接收到的数据集,其中至少一个接收到的数据集是通过互联网接收的;应用于所述至少一个接收到的数据集的模型说明;
一个或多个处理器,该处理器共同地用于:确定与所述至少一个接收到的数据集相关的多个统计建模任务;部分基于所述确定的多个统计建模任务和所述建模说明对所述至少一个接收到的数据集建模;用所述模型评价所述至少一个接收到的数据集,产生一个评价数据集;以及通过互联网递送所述评价数据集。
18.根据权利要求17所述的系统,其特征在于,所述内存用于进一步储存以下中的至少一个:
所述应用于多个接收到的数据集的模型;以及
所述至少一个接收到的数据集,用于将多个模型应用至所述接收到的数据集。
19.根据权利要求17所述的系统,其特征在于,所述模型包括优化多个模型与所述至少一个接收到的数据集的匹配的多个模型。
20.根据权利要求17所述的系统,其特征在于,所述内存进一步用于储存以下中的至少一个:
应用于所述模型的一组建模预设置;
用于所述建模和评价结果的递送的递送方法预设置;
所述至少一个接收到的数据集的数据共享预设置;以及
所述建模和评价结果的结果共享预设置。
21.根据权利要求17所述的系统,其特征在于,所述模型说明进一步包括:
所述至少一个接收到的数据集的接收到的数据集格式;
所述至少一个接收到的数据集的目标变量名称;和至少一个:
所述至少一个接收到的数据集的加权变量名称;
所述至少一个接收到的数据集的包括变量名称;以及
所述至少一个接收到的数据集的排除变量名称。
22.根据权利要求17所述的系统,其特征在于:
所述内存进一步用于储存所述至少一个接收到的数据集的接收到的数据集记录;并且
所述一个或多个处理器进一步用于从所述至少一个接收到的数据集中提取头信息。
23.根据权利要求17所述的系统,其特征在于,所述一个或多个处理器可进一步用于:
确认所述建模的完成;
接收所述建模的结果请求;
递送所述建模的结果记录;以及
递送所述建模的结果文件。
24.一个系统,包括:
一个内存,该内存用于储存:
接收到的数据集,其中至少一个接收到的数据集是通过互联网接收的;
应用至所述至少一个接收到的数据集的模型说明,其中所述模型说明至少包括:
所述至少一个接收到的数据集的接收到的数据集格式;
所述至少一个接收到的数据集的目标变量名称;和至少一个:
所述至少一个接收到的数据集的加权变量名称;
所述至少一个接收到的数据集的包括变量名称;以及
所述至少一个接收到的数据集的排除变量名称;
一个或多个处理器,其共同地用于:
将所述至少一个接收到的数据集分成训练数据集和验证数据集;
使用多个统计建模任务训练多个模型以优化多个模型与所述训练数据集的匹配,其中所述训练部分基于所述模型说明;
在所述验证数据集上验证多个所述训练模型的匹配;
评价所述多个验证模型;以及
通过互联网递送所述多个验证模型评价结果。
25.根据权利要求24 所述的系统,其特征在于,互联网通信接口包含互联网浏览器、移动设备、数据集成服务和文件传输服务的至少一个。
26.根据权利要求24所述的系统,其特征在于,互联网通信网络包含有线、无线和光通信的至少一个。
CN201210509942.3A 2010-12-04 2012-12-03 一种基于互联网的自动建模分析方法及系统 Expired - Fee Related CN103136417B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US41981710P 2010-12-04 2010-12-04
US13/308,745 US8977720B2 (en) 2010-12-04 2011-12-01 Internet based hosted system and computer readable medium for modeling analysis
US13/308,745 2011-12-01

Publications (2)

Publication Number Publication Date
CN103136417A true CN103136417A (zh) 2013-06-05
CN103136417B CN103136417B (zh) 2016-03-16

Family

ID=46318122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210509942.3A Expired - Fee Related CN103136417B (zh) 2010-12-04 2012-12-03 一种基于互联网的自动建模分析方法及系统

Country Status (2)

Country Link
US (1) US8977720B2 (zh)
CN (1) CN103136417B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8762299B1 (en) 2011-06-27 2014-06-24 Google Inc. Customized predictive analytical model training
US8489632B1 (en) * 2011-06-28 2013-07-16 Google Inc. Predictive model training management
US9501540B2 (en) 2011-11-04 2016-11-22 BigML, Inc. Interactive visualization of big data sets and models including textual data
US9576246B2 (en) * 2012-10-05 2017-02-21 BigML, Inc. Predictive modeling and data analysis in a secure shared system
US11699116B2 (en) * 2018-04-16 2023-07-11 Interset Software Inc. System and method for custom security predictive methods

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069234B1 (en) * 1999-12-22 2006-06-27 Accenture Llp Initiating an agreement in an e-commerce environment
US20070053513A1 (en) * 1999-10-05 2007-03-08 Hoffberg Steven M Intelligent electronic appliance system and method
CN101110089A (zh) * 2007-09-04 2008-01-23 华为技术有限公司 一种数据挖掘和建模的方法及系统
CN101620691A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 电信业自动化数据挖掘平台
CN102089759A (zh) * 2008-07-09 2011-06-08 凯森公司 生成用于输入分析模型的分析数据集的方法
CN102236836A (zh) * 2010-09-27 2011-11-09 上海邦蓝决策信息科技有限公司 网络互动合作式建模

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7167844B1 (en) 1999-12-22 2007-01-23 Accenture Llp Electronic menu document creator in a virtual financial environment
US7610233B1 (en) 1999-12-22 2009-10-27 Accenture, Llp System, method and article of manufacture for initiation of bidding in a virtual trade financial environment
US6629081B1 (en) 1999-12-22 2003-09-30 Accenture Llp Account settlement and financing in an e-commerce environment
US6728674B1 (en) * 2000-07-31 2004-04-27 Intel Corporation Method and system for training of a classifier
US7451065B2 (en) * 2002-03-11 2008-11-11 International Business Machines Corporation Method for constructing segmentation-based predictive models
US7707059B2 (en) * 2002-11-22 2010-04-27 Accenture Global Services Gmbh Adaptive marketing using insight driven customer interaction
EP2021955A1 (en) * 2006-05-24 2009-02-11 Icom Limited Content engine
US7729940B2 (en) 2008-04-14 2010-06-01 Tra, Inc. Analyzing return on investment of advertising campaigns by matching multiple data sources
US8000993B2 (en) 2008-04-14 2011-08-16 Tra, Inc. Using consumer purchase behavior for television targeting
AU2009270759B2 (en) * 2008-07-17 2015-10-01 Luminex Corporation Methods, storage mediums, and systems for configuring classification regions within a classification matrix of an analysis system and for classifying particles of an assay
US8473431B1 (en) * 2010-05-14 2013-06-25 Google Inc. Predictive analytic modeling platform
US8438122B1 (en) * 2010-05-14 2013-05-07 Google Inc. Predictive analytic modeling platform
US8370279B1 (en) * 2011-09-29 2013-02-05 Google Inc. Normalization of predictive model scores

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070053513A1 (en) * 1999-10-05 2007-03-08 Hoffberg Steven M Intelligent electronic appliance system and method
US7069234B1 (en) * 1999-12-22 2006-06-27 Accenture Llp Initiating an agreement in an e-commerce environment
CN101110089A (zh) * 2007-09-04 2008-01-23 华为技术有限公司 一种数据挖掘和建模的方法及系统
CN101620691A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 电信业自动化数据挖掘平台
CN102089759A (zh) * 2008-07-09 2011-06-08 凯森公司 生成用于输入分析模型的分析数据集的方法
CN102236836A (zh) * 2010-09-27 2011-11-09 上海邦蓝决策信息科技有限公司 网络互动合作式建模

Also Published As

Publication number Publication date
US8977720B2 (en) 2015-03-10
CN103136417B (zh) 2016-03-16
US20120166156A1 (en) 2012-06-28

Similar Documents

Publication Publication Date Title
CN100334584C (zh) 信息处理设备、信息处理方法和程序
KR20190008163A (ko) 블록체인을 활용한 사용자 개인정보 활용 파악을 위한 방법 및 시스템
CN103136417A (zh) 用于建模分析的基于互联网的托管系统和计算机可读介质
Perera et al. Twitter analytics: Architecture, tools and analysis
CN102307210A (zh) 一种数据下载系统及其数据管理和下载方法
CN105827706A (zh) 消息推送装置及方法
KR20180082504A (ko) 애플리케이션 정보 위험 관리를 위한 방법 및 장치
CN114580658A (zh) 基于区块链的联邦学习激励方法、装置、设备和介质
CN111813788A (zh) 信息的查询方法和装置、信息的同步方法和装置
CN111401844A (zh) 基于物联网的数据共享协同办公方法及数据共享平台
CN103581317B (zh) 一种网络资源共享的方法
CN105187477A (zh) 应用之间的数据通信的设备和方法
CN111932200A (zh) 远程招投标评审系统
CN107809363A (zh) 一种网络信息传播控制方法和装置
KR101077467B1 (ko) 사용자 활동 지수를 기반으로 한 컨텐츠 정보 서비스 시스템 및 방법
KR101639108B1 (ko) 요금 시스템을 위한 자동 트래픽 생성부
CN110009320B (zh) 资源转换方法、装置、系统、存储介质和计算机设备
CN103299336A (zh) 信息处理系统、信息处理方法以及存储介质
CN105184559A (zh) 一种支付系统及方法
KR20190110189A (ko) 어플리케이션을 기반으로 하는 드론 대여 관리 장치 및 그 방법
CN114912856B (zh) 一种基于区块链的飞行模拟器维护方法
CN116955148A (zh) 业务系统测试方法、装置、设备、存储介质及产品
CN113626170B (zh) 通信工程任务全生命周期的控制方法及装置
CN112651820A (zh) 一种案件信息处理方法、装置、服务器及存储介质
US20110264763A1 (en) Method for retrieving object from device management client and associated device management system

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160316