CN103136417B - 一种基于互联网的自动建模分析方法及系统 - Google Patents

一种基于互联网的自动建模分析方法及系统 Download PDF

Info

Publication number
CN103136417B
CN103136417B CN201210509942.3A CN201210509942A CN103136417B CN 103136417 B CN103136417 B CN 103136417B CN 201210509942 A CN201210509942 A CN 201210509942A CN 103136417 B CN103136417 B CN 103136417B
Authority
CN
China
Prior art keywords
data set
modeling
set received
internet
received
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210509942.3A
Other languages
English (en)
Other versions
CN103136417A (zh
Inventor
孟召兵
金祖胜
陈友明
宁平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LIFTCHART LLC
Original Assignee
LIFTCHART LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LIFTCHART LLC filed Critical LIFTCHART LLC
Publication of CN103136417A publication Critical patent/CN103136417A/zh
Application granted granted Critical
Publication of CN103136417B publication Critical patent/CN103136417B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Transfer Between Computers (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一个基于互联网的系统和包括代码的计算机可读的介质,用于确定与接收到的数据集相关的多个建模分析,其中至少有一个接收到的数据集是通过互联网接收的,接收多个建模分析任务的说明,通过互联网收集建模分析任务的说明,基于确定的多个建模分析任务和接收到的建模分析任务的说明在接收到的数据集上执行建模分析并通过互联网递送建模分析结果。

Description

一种基于互联网的自动建模分析方法及系统
技术领域
本方法和系统大体上涉及统计建模,更具体地涉及用于建模分析的基于互联网的自动建模分析方法及系统。
背景技术
目前,建模分析需要用户已经购买的建模分析软件。此外,目前的建模分析软件需要专家级的知识,才能够从分析中提取有用的信息。这两个条件,专家级的互动以及资本密集型的软件,成了公司在建模分析方面的重大障碍。
因此,需要一种用于建模分析的基于互联网的托管系统和计算机可读介质。更具体地,需要一个基于互联网递送的、提供简化的用户交互的、根据请求进行回归建模的预测建模服务。该服务可递送到互联网浏览器、移动设备、数据集成服务(例如消息代理)或文件传输服务。
此外,需要一个允许从可用互联网的任何地方远程访问预测建模的系统和计算机可读介质。该系统允许可通过互联网上的订阅服务提供的建模服务的递送,并且允许可以通过每一个模型需求定价提供的建模服务的递送。系统和计算机可读介质可用一个数据集根据来自互联网的请求来建立多个模型,并且可用一个模型根据来自互联网的请求评价多个数据集。
设想的是,本系统通过由用户指定的授权访问可以根据需求共享模型数据和结果。该系统允许在用户配置中定制建模预设置、建模递送方法、建模数据和结果的共享。这个基于互联网递送的用于建模的预测建模服务为多个客户保持适当的访问控制,其中一个客户不能查看另一个客户的数据或结果。
发明内容
将描述一种基于互联网的自动建模分析方法,其存储于内存并由处理器执行操作。该方法确定与接收到的数据集有关的多个建模分析任务,其中接收到的数据集是通过互联网接收到的。该方法包括:用于接收多个建模分析任务说明,通过互联网收集这些建模分析任务的说明,根据之前确定的多个建模分析任务和接收到的说明对接收到的数据集执行建模分析,以及通过互联网递送建模分析的结果;具有用于收集接收到的数据集的目标变量名称(designation)、收集建模分析任务的预测模型类型名称、以及收集接收到的数据集的数据集格式的代码。对接收到的数据集的预测建模可基于已经确定的多种建模分析任务、数据集的格式、收集到的目标变量名称、以及预测建模类型名称;用于通过互联网递送预测模型、评价预测模型,并通过互联网递送评价结果的指令。该收集到的项目可以通过互联网收集。
此外,该方法含有存储接收到的数据集的代码,其用于将多种预测模型应用至接收到的数据集。该方法可含有用于通过互联网收集应用于预测模型的一组建模预设置(例如递送方法预设置、数据共享预设置和结果共享预设置)中的至少一个的指令。
此外,可以想到的是,该方法可含有用于把收到的数据集分为一个训练数据集和一个验证数据集、训练预测模型以优化预测模型同训练数据集的匹配、并且利用验证数据集来验证该预测模型的代码。
此外,该方法可含有用于存储预测模型的结果记录和结果文件、收到的数据集的记录、目标变量名称以及数据集的格式的指令。
该方法还可含有用于读取如下内容的指令,所述内容包括预测模型的结果记录和预测模型的结果文件。当完成建模分析后,可具有用于确认建模完成的指令。该方法还可含有用于从接收到的数据集提取头信息的步骤,其中数据集格式包含统计系统文件格式。通用的统计系统的文件格式可包括CSV文件格式、SAS文件格式、SPSS文件格式、S-Plus文件格式、Stata(DTA)文件格式、Systat(SYS)文件格式、EpiInfo(REC)文件格式、Minitab(Minitab便携工作表)文件格式以及XML格式等。
变量的加权允许一些变量对结果有更大的影响。该方法可含有用于通过互联网收集接收到的数据集的至少一个加权变量的名称、接收到的数据集的包括变量的名称、和接收到的数据集的排除变量的名称的指令。
该方法可含有用于分割分析的指令,例如确定接收到的数据集的分割类型,其中分割类型选自由监督分割和非监督分割组成的组中。此外,该方法可含有基于监督分割收集接收到的数据集的目标变量名称(通过互联网收集)、确定多个分割任务、对收到的数据集基于多种分割任务、目标变量名称以及分割类型来执行监督分割分析的指令。对接收到的数据集的非监督分割分析可以基于确定的多个分割任务和分割类型。在这两种情况下,该方法含有用于通过互联网递送监督分割分析和非监督分割分析的结果的指令。
此外,该方法还可含有用于概要(profiling)分析的指令,例如通过互联网收集接收到的数据集的概要总体类别变量名称,确定多个概要任务,基于已经确定的多个概要任务和概要总体类别变量名称执行接收到的数据集的概要分析,并通过互联网递送概要分析的结果。
此外,该方法还可含有用于方差分析的指令,例如通过互联网收集接收到的数据集的方差分析变量名称,确定多个方差分析任务,基于方差分析变量名称和多个方差分析任务对接收到的数据集执行方差分析测试,并通过互联网递送方差分析测试的结果。
一种基于互联网的自动建模分析系统包括一个内存,该内存用来存储通过互联网接收到的数据集和应用到接收到的数据集的模型说明。该系统具有一个或多个处理器,其共同地用来确定与接收到的数据集相关的多个统计建模任务,根据已经确定的多个统计建模任务和模型说明对该接收到的数据集进行建模,以所述模型对附加的接收到的数据集进行评价,并通过互联网递送建模和评价结果;该内存用来存储通过互联网接收到的数据集和应用到接收到的数据集的模型说明。该模型说明至少包括接收到的数据集的接收到的数据集格式、接收到的数据集的目标变量名称和至少一个接收到的数据集的加权变量名称。该系统还可包含接收到的数据集的包括变量名称和接收到的数据集的排除变量名称。
在示例系统中,内存也可存储应用于多个接收到的数据集的至少一个模型和接收到的数据集,以将多个模型应用至接收到的数据集。该内存也可存储一组应用于模型的建模预设置的至少一个、用于建模和评价结果的递送方法预设置、接收到的数据集的数据共享预设置、以及建模和评价结果的结果共享预设置。
在示例系统中,模型可包括最佳化接收到的数据集的匹配的多个模型。该模型说明可进一步包括接收到的数据集的接收到的数据集格式、接收到的数据集的目标变量名称、接收到的数据集的至少一个加权变量名称、接收到的数据集的包括变量名称和接收到的数据集的排除变量名称。内存可用于存储收到的数据集的数据集记录,并且一个或多个处理器可用于从接收到的数据集提取头信息。处理器可用于确认建模的完成,接受建模结果的请求,递送建模的结果记录并递送建模的结果文件。
在另一个实施例中,系统可包括一个内存,
该系统可进一步包含一个或多个处理器,其共同用于把收到的数据集分成一个训练数据集和一个验证数据集,并用多个统计建模任务训练多个模型以优化训练数据集的匹配。该训练基于模型说明。该系统验证多个训练过的模型同验证数据集的匹配,评价多个验证过的模型,并通过互联网递送多个验证过的模型的评价结果。
互联网通信接口可包括互联网浏览器、移动设备、数据集成服务和文件传输服务中的至少一个。互联网通信网络可包括有线、无线和光通信的至少一个。
附图说明
图1描绘了第一个用于建模分析的基于互联网的托管系统;
图2是第一个用于建模分析系统的基于互联网的托管系统的流程图;图3是软件流程框图;
图4是软件流程框图的预测建模部分;
图5是软件流程框图的用户预设置部分;
图6是软件流程框图的用于未来应用的存储部分;
图7是软件流程框图的训练和验证部分;
图8是软件流程框图的预测模型存储部分;
图9是软件流程框图的建模完成和数据读取部分;
图10是软件流程框图的分割分析部分;
图11是软件流程框图的格式选择部分;
图12是软件流程框图的信息存储和头信息提取部分;
图13是软件流程框图的概要分析部分;
图14是软件流程框图的方差分析(ANOVA)部分;
图15是软件流程框图的变量名称部分;
图16描绘了用于建模分析的第二个基于互联网的托管系统;
图17描绘了该系统的用于未来应用的存储部分;
图18描绘了该系统的用户预设置部分;
图19描绘了该系统的模型说明部分;
图20描绘了该系统的信息存储和头信息提取部分;
图21描绘了该系统的建模分析完成和数据接收部分;
图22描绘了第三个用于建模分析的基于互联网的托管系统;以及
图23描绘了该系统的互联网通信接口和连接。
具体实施方式
图1显示一个示例系统图100。用户通过计算机110的互联网浏览器访问该系统。该服务可以递送至互联网浏览器、移动设备、数据集成服务(例如消息中介)或文件传输服务等等。计算机110通过互联网120连接到系统的防火墙130。通信协议可以是传输控制协议(TCP)、互联网协议(IP)、全球移动通信系统(GSM)等等。防火墙130联网到网络服务器140,其依次联网到数据库服务器150和文件系统160。数据库服务器150和文件系统160联网到分析建模服务器170。通信结合可以包括有线、无线、光以及它们的混合等等。
图2显示该系统的一个示例操作200。操作200显示用户210、网络服务器220、数据库服务器230、文件系统240和分析建模服务器250的交互。网络服务器220在网络服务器220接收到来自用户210的一个数据集252。数据集由用户编辑并提供,并可以作为例如电子表格或数据库文件等传送。网络服务器220也可接收来自用户的模型说明262。
模型说明包括目标变量、预测属性、建模模式等。该数据集有一个存储在数据库服务器230的相关记录254。从网络服务器220收到的数据集256存储在文件系统240上。通过分析建模服务器250从数据集中提取头信息258。
用户210从网络服务器220收到一个属性260的显示。从网络服务器220收到模型说明并将其存储264在数据库服务器230。当从网络服务器220收到模型说明时,其触发建模过程266。
通过分析建模服务器250从数据库服务器230读取模型说明268。通过分析建模服务器250从文件系统240读取数据文件270。建模过程被执行272。从分析建模服务器250把结果记录存储274在数据库服务器230。从分析建模服务器250把结果文件存储276在文件系统240。
建模过程后,用户210从分析建模服务器250收到确认278。网络服务器220收到来自用户210的结果请求280。网络服务器220从数据库服务器230读取结果记录282,从文件系统240读取结果文件284。通过网络服务器220将结果显示286给用户210。
图3中描述一个基于互联网的、存储于计算机可读介质和并由处理器执行的计算机程序的实施例。该程序包括确定310与通过互联网收到的数据集关联的多个建模分析任务,接收320多个建模分析任务的说明并通过互联网收集330一组建模预设置的代码。此外,该程序包括依据确定的多个建模分析任务以及收到的建模分析任务的说明在接收到的数据集上进行340建模分析,并通过互联网递送350建模分析结果的代码。
如图4所示,计算机可读介质还可以包括用于收集410接收到的数据集的目标变量名称的指令,收集420建模分析任务的预测建模类型名称的指令,和收集430接收到的数据集的数据集格式的指令。该程序还可包括用于依据确定的多个建模分析任务、数据集格式、收集到的目标变量名称和预测建模类型名称执行440接收到的数据集的预测建模并导致预测模型的指令。该计算机可读介质还可包括通过互联网递送450预测模型、评价460接收的数据集和通过互联网递送470模型评价结果的指令。收集到的项目可通过互联网收集。
用户预设置也可以如图5的500所示的收集。用户预设置收集可包括通过互联网收集510可由用户设定的一组建模预设置520、用于预测模型的递送的递送方法预设置530、接收到的数据集的数据共享预设置540和预测模型的结果共享预设置550中的至少一个。
参考图6,代码可包含存储610预测模型以便应用至多个接收到的数据集,和存储620接收到的数据集以便将多个预测模型应用至接收到的数据集。
训练集是接收数据的子集,用于发现潜在预测关系。验证集也是接收数据的子集,用于确定该预测模型的匹配度。图7描绘了软件流程框图的训练和验证部分,包含指令700,用于将接收到的数据集分成710一个训练数据集和一个验证数据集,训练720预测模型以优化预测模型对训练数据集匹配,并利用验证数据集验证730预测模型。
图8描绘了与预测模型的结果相关的代码的预测模型部分的存储800。在本实施例中,计算机可读介质可包含用于存储810接收到的数据集的预测模型的结果记录并存储820接收到的数据集的预测模型的结果文件的指令。
在已经完成了接收到的数据集的预测建模后,计算机可读介质可包含用于将建模完成的确认发送910给用户的指令,读取920预测模型的结果记录的指令,和如图9中所示读取930预测模型的结果文件。
分割分析是对接收到的数据集的指定部分分组的任务,使得在同一组的对象相对在其他组的那些彼此之间更加类似。接收到的数据集的分割也可以如图10中描述的来执行1000。确定1010接收到的数据集的分割类型。分割类型可以是多个类型中的一个,包括监督分割和非监督分割。对于监督分割,可通过互联网1020收集目标变量名称。确定1030多个分割任务,并执行1040监督或非监督分割分析。如果在接收到的数据集执行监督分割分析1050,它是依据多个分割任务、目标变量名称和分割类型。如果在接收到的数据集执行1060非监督分割分析,它将依据多个确定的分割任务和分割类型。然后监督分割分析和/或非监督分割分析的结果通过互联网递送1070。
如图11中所示,用户提供的数据集格式可包含1100统计系统文件格式,例如CSV格式1110、SAS文件格式1120、SPSS文件格式1130、S-Plus文件格式1140、Stata文件格式1150、Systat文件格式1160、EpiInfo文件格式1170、Minitab文件格式1180和XML格式1190等等。
如图12中所示,各种类型的信息可以从接收到的数据集中加以收集和存储。通过互联网收集接收到的数据集的数据集格式1206和目标变量名称1207。代码也可确认1208用户收到的任务指令,例如说明、数据集格式和目标变量名称的确收。关于建模分析任务的状态通知也可以发送1209给用户。可以存储接收到的数据集的接收数据集记录1210,目标变量名称1220和数据集格式1230,并且可提取1240头信息。
总体概要是对接收到的数据的分析,使它的结构、内容和关系明晰。概要分析将允许用户深入了解多个可比较的总体领域。概要分析将通过在多个选定的尺寸的指定总体比较和对比属性。
如图13中的1300所示,代码可包含可以进行分析的接收到的数据集的概要数据。这种分析可以包括通过互联网收集1310接收到的数据集的概要总体类别变量名称,确定1320多个概要任务,根据所确定的多个概要任务和概要总体类别变量名称对接收到的数据集执行1330概要分析,并通过互联网递送1340概要分析的结果。
方差分析是一种同时在两个或更多的平均值之间进行比较的统计方法。这种统计方法产生的值可进行测试,以确定变量之间是否存在显著关系。如图14中一个实例中所示,方差分析(ANOVA)信息也可以从所接收到的数据集确定1400。可通过互联网收集1410接收到的数据集的方差分析变量名称,确定1420与方差分析相关的多个任务,然后基于方差分析变量名称和多个方差分析任务执行方差分析测试的实际进行1430。可通过互联网递送1440方差分析测试的结果。
如图15中所示,也可通过互联网收集1510接收到的数据集的各种类型的变量名称。变量名称类型可包括加权变量1520、包括变量1530和排除变量1540。
图16示出了一个用于实施建模分析的优选系统1600。该系统将包括一个内存1610,该内存用来存储通过互联网收到的接收到的数据集1620以及用于接收到的数据集的模型说明1630和建模类型1632。该系统将包括一个或多个处理器1640,其共同用于确定与接收到的数据集关联的多个统计建模任务1650,根据确定的多个统计建模任务、建模说明和模型预设置为接收到的数据集建模1660,对附加的接收到的数据集进行评价1670,并通过互联网递送1680建模和评价结果。
关于图17,系统还可包括一个内存,其构造成存储1710至少一个应用至多个接收到的数据集的模型1720以及将多个模型应用至接收到的数据集的接受的数据集1730。该模型可包括多个模型以便优化多个模型对接收到的数据集1740的匹配。
如图18中所示,该系统可进一步包括一个内存,其构造成存储1810应用至模型的一组模型预设置1820的至少一个,用于递送建模和评价结果的递送方法预设置1830,接收到的数据集的数据分享预设置1840和建模和评分结果的结果分享预设置1850等等。
图19示出了模型说明191可进一步包括接收到的数据集格式1920,一个目标变量名称1930和至少一个1940加权变量名称1950,包括变量名称1960以及排除变量名称1970。
如图20中所示,内存可用于进一步存储接收到的数据集记录2010,并且一个或多个处理器可用于从接收到的数据集提取头信息2020。
该处理器可另外被用来2110确认建模的完成2120。至于建模结果,该系统可用来接收对结果的请求2130,递送结果记录2140并递送结果文件2150。
图22示出了另一个实施建模分析的系统实施例2200。该系统包括两个主系统,内存2210和一个或多个处理器2230。该系统包括内存,其用来存储2210通过互联网收到的数据集2212和被应用到接收到的数据集的模型说明2214。模型说明包括至少以下与接收到的数据集有关的信息:接收到的数据集格式2216,目标变量名称2218,建模类型2219,和加权变量名称2222、包括变量名称2224以及排除变量名称2226中的至少一个。
系统2200还包括一个或多个处理器,其共同地用于2230将接收到的数据集分割2232成为训练数据集和验证数据集,用多个统计建模任务训练多个模型2234以最佳化训练数据集的多个模型匹配,其中训练根据模型说明进行。此外,该系统还将用训练的多个模型与验证数据集的匹配验证多个训练模型2236。该系统然后对多个验证过的模型评价2238,并通过互联网递送2240多个验证过的模型的评价结果。
图23示出了互联网通信接口和网络。互联网通信接口2310包括互联网浏览器2320、移动设备2330、数据集成服务2340和文件传输服务2350的至少一个。互联网通信网络2360包括有线2370、无线2380和光通信2390的至少一个。建模过程2392完成的确认可包括电子邮件2394和SMS消息2396的至少一个。

Claims (23)

1.一种基于互联网的自动建模分析方法,包括以下步骤:
确定与至少一个接收到的数据集相关的多个建模分析任务,其中所述至少一个接收到的数据集通过互联网接收;
接收所述多个建模分析任务的说明;
通过互联网来收集所述建模分析任务的说明;
部分根据所述的确定的多个建模分析任务以及所述建模分析任务的所述接收到的说明在所述的至少一个接收的数据集上执行建模分析;并
通过互联网递送所述建模分析的结果;
收集所述至少一个接收到的数据集的目标变量名称;
收集所述建模分析任务的预测建模类型名称;
收集所述至少一个接收到的数据集的数据集格式;
所述至少一个接收到的数据集的加权变量名称;
所述至少一个接收到的数据集的包括变量名称;以及
所述至少一个接收到的数据集的排除变量名称;
在所述的至少一个接收到的数据集上进行预测建模,其部分基于所述多个确定的建模分析任务、所述数据集格式、所述收集的目标变量名称、所述预测建模类型名称、导致一个预测模型的预测建模;
通过互联网递送所述预测模型;
根据所述至少一个接收到的数据集评价预测模型;并
通过互联网递送所述预测模型评价结果。
2.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包括存储应用于多个接收到的数据集的所述预测模型。
3.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包括存储所述至少一个收到的数据集,以应用多个预测模型至所述接收到的数据集。
4.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,所述预测建模包括回归建模分析。
5.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,所述预测建模包括多个预测模型,其优化所述预测模型在所述至少一个接收到的数据集上的多个匹配。
6.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包含收集以下中的至少一个:
一组应用于所述预测模型的建模预设置;
用于所述预测建模递送的递送方式预设置;
所述至少一个接收到的数据集的数据共享预设置;以及
所述预测模型的结果共享预设置。
7.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包含:
将所述至少一个接收到的数据集分成训练数据集和验证数据集;
训练所述预测模型以优化所述预测模型在所述训练数据集上的匹配;以及
利用所述验证数据集验证所述预测模型。
8.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包括:
存储所述至少一个接收到的数据集的所述预测模型的结果记录;以及
存储所述至少一个接收到的数据集的预测模型的结果文件。
9.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包括:
确认所述建模的完成;
读取所述至少一个接收到的数据集的所述预测模型评价结果的所述结果记录;以及
读取所述至少一个接收到的数据集的所述预测模型评价结果的结果文件。
10.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包括:
确定所述至少一个接收到的数据集的分割类型,其中所述分割类型是从监督分割和非监督分割组成的组中选出的;
收集基于所述监督分割的所述至少一个接收到的数据集的目标变量名称;
确定多个分割任务;
执行以下步骤中的至少一个:
部分基于所述多个分割任务、所述目标变量名称和所述分割类型的所述至少一个接收到的数据集的监督分割分析;以及
部分基于所述确定的多个分割任务和所述分割类型的所述至少一个接收到的数据集的非监督分割分析;以及
通过互联网递送至少一个所述监督分割分析和所述非监督分割分析的结果。
11.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包括:
收集所述至少一个接收到数据集的数据集格式,其中所述数据集格式是统计系统的文件格式。
12.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包括:
收集所述至少一个接收到的数据集的数据集格式;
收集所述至少一个接收到的数据集的目标变量名称;
确认所述接收到的说明、所述数据集格式和所述目标变量名称;
发出所述建模分析任务的状态通知;
存储所述至少一个接收到的数据集的接收到的数据集记录;
存储所述至少一个接收到的数据集的所述目标变量名称;
存储所述至少一个接收到的数据集的所述数据集格式;以及
从所述至少一个接收到的数据集提取头信息。
13.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包括:
收集所述至少一个接收到的数据集的至少一个概要总体类别变量名称;
确定多个概要任务;
部分基于所述确定的多个概要任务和所述至少一个概要总体类别变量名称进行所述至少一个接收到的数据集的概要分析;以及
通过互联网递送所述概要分析的结果。
14.根据权利要求1所述的基于互联网的自动建模分析方法,其特征在于,其进一步包括:
收集所述至少一个接收到的数据集的至少一个方差分析变量名称;
确定多个方差分析任务;
部分基于所述至少一个方差分析变量名称和所述多个方差分析任务进行至少一个接收到的数据集的方差分析测试;以及
通过互联网递送所述方差分析测试的结果。
15.一种基于互联网的自动建模分析系统,其特征在于,所述系统包括:
一个内存模块,该内存模块用于储存:接收到的数据集,其中至少一个接收到的数据集是通过互联网接收的;应用于所述至少一个接收到的数据集的模型说明;其中所述模型说明至少包括:
所述至少一个接收到的数据集的接收到的数据集格式;
所述至少一个接收到的数据集的目标变量名称;和至少一个:
所述至少一个接收到的数据集的加权变量名称;
所述至少一个接收到的数据集的包括变量名称;以及
所述至少一个接收到的数据集的排除变量名称;
一个或多个处理器模块,该处理器模块共同地用于:确定与所述至少一个接收到的数据集相关的多个统计建模任务;部分基于所述确定的多个统计建模任务和所述建模说明对所述至少一个接收到的数据集建模;用所述模型评价所述至少一个接收到的数据集,产生一个评价数据集;以及通过互联网递送所述评价数据集;
将所述至少一个接收到的数据集分成训练数据集和验证数据集;
使用多个统计建模任务训练多个模型以优化多个模型与所述训练数据集的匹配,其中所述训练部分基于所述模型说明;
在所述验证数据集上验证多个所述训练模型的匹配;
评价所述多个验证模型;以及
通过互联网递送所述多个验证模型评价结果。
16.根据权利要求15所述的系统,其特征在于,所述内存模块用于进一步储存以下中的至少一个:
所述应用于多个接收到的数据集的模型;以及
所述至少一个接收到的数据集,用于将多个模型应用至所述接收到的数据集。
17.根据权利要求15所述的系统,其特征在于,所述模型包括优化多个模型与所述至少一个接收到的数据集的匹配的多个模型。
18.根据权利要求15所述的系统,其特征在于,所述内存模块进一步用于储存以下中的至少一个:
应用于所述模型的一组建模预设置;
用于所述建模和评价结果的递送的递送方法预设置;
所述至少一个接收到的数据集的数据共享预设置;以及
所述建模和评价结果的结果共享预设置。
19.根据权利要求15所述的系统,其特征在于,所述模型说明进一步包括:
所述至少一个接收到的数据集的接收到的数据集格式;
所述至少一个接收到的数据集的目标变量名称;和至少一个:
所述至少一个接收到的数据集的加权变量名称;
所述至少一个接收到的数据集的包括变量名称;以及
所述至少一个接收到的数据集的排除变量名称。
20.根据权利要求15所述的系统,其特征在于:
所述内存模块进一步用于储存所述至少一个接收到的数据集的接收到的数据集记录;并且
所述一个或多个处理器模块进一步用于从所述至少一个接收到的数据集中提取头信息。
21.根据权利要求15所述的系统,其特征在于,所述一个或多个处理器模块可进一步用于:
确认所述建模的完成;
接收所述建模的结果请求;
递送所述建模的结果记录;以及
递送所述建模的结果文件。
22.根据权利要求15所述的系统,其特征在于,互联网通信接口包含互联网浏览器、移动设备、数据集成服务和文件传输服务的至少一个。
23.根据权利要求15所述的系统,其特征在于,互联网通信网络包含有线、无线和光通信的至少一个。
CN201210509942.3A 2010-12-04 2012-12-03 一种基于互联网的自动建模分析方法及系统 Expired - Fee Related CN103136417B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US41981710P 2010-12-04 2010-12-04
US13/308,745 US8977720B2 (en) 2010-12-04 2011-12-01 Internet based hosted system and computer readable medium for modeling analysis
US13/308,745 2011-12-01

Publications (2)

Publication Number Publication Date
CN103136417A CN103136417A (zh) 2013-06-05
CN103136417B true CN103136417B (zh) 2016-03-16

Family

ID=46318122

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210509942.3A Expired - Fee Related CN103136417B (zh) 2010-12-04 2012-12-03 一种基于互联网的自动建模分析方法及系统

Country Status (2)

Country Link
US (1) US8977720B2 (zh)
CN (1) CN103136417B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8762299B1 (en) 2011-06-27 2014-06-24 Google Inc. Customized predictive analytical model training
US8489632B1 (en) * 2011-06-28 2013-07-16 Google Inc. Predictive model training management
US9501540B2 (en) 2011-11-04 2016-11-22 BigML, Inc. Interactive visualization of big data sets and models including textual data
US9576246B2 (en) * 2012-10-05 2017-02-21 BigML, Inc. Predictive modeling and data analysis in a secure shared system
CA3040367A1 (en) * 2018-04-16 2019-10-16 Interset Software, Inc. System and method for custom security predictive models

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069234B1 (en) * 1999-12-22 2006-06-27 Accenture Llp Initiating an agreement in an e-commerce environment
CN101110089A (zh) * 2007-09-04 2008-01-23 华为技术有限公司 一种数据挖掘和建模的方法及系统
CN101620691A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 电信业自动化数据挖掘平台
CN102089759A (zh) * 2008-07-09 2011-06-08 凯森公司 生成用于输入分析模型的分析数据集的方法
CN102236836A (zh) * 2010-09-27 2011-11-09 上海邦蓝决策信息科技有限公司 网络互动合作式建模

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US7610233B1 (en) 1999-12-22 2009-10-27 Accenture, Llp System, method and article of manufacture for initiation of bidding in a virtual trade financial environment
US7167844B1 (en) 1999-12-22 2007-01-23 Accenture Llp Electronic menu document creator in a virtual financial environment
US6629081B1 (en) 1999-12-22 2003-09-30 Accenture Llp Account settlement and financing in an e-commerce environment
US6728674B1 (en) * 2000-07-31 2004-04-27 Intel Corporation Method and system for training of a classifier
US7451065B2 (en) * 2002-03-11 2008-11-11 International Business Machines Corporation Method for constructing segmentation-based predictive models
US7707059B2 (en) * 2002-11-22 2010-04-27 Accenture Global Services Gmbh Adaptive marketing using insight driven customer interaction
US20100030713A1 (en) * 2006-05-24 2010-02-04 Icom Limited Content engine
US8000993B2 (en) 2008-04-14 2011-08-16 Tra, Inc. Using consumer purchase behavior for television targeting
US7729940B2 (en) 2008-04-14 2010-06-01 Tra, Inc. Analyzing return on investment of advertising campaigns by matching multiple data sources
EP2324435B1 (en) * 2008-07-17 2018-01-24 Luminex Corporation Methods, storage mediums, and systems for configuring classification regions within a classification matrix of an analysis system and for classifying particles of an assay
US8438122B1 (en) * 2010-05-14 2013-05-07 Google Inc. Predictive analytic modeling platform
US8473431B1 (en) * 2010-05-14 2013-06-25 Google Inc. Predictive analytic modeling platform
US8370279B1 (en) * 2011-09-29 2013-02-05 Google Inc. Normalization of predictive model scores

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069234B1 (en) * 1999-12-22 2006-06-27 Accenture Llp Initiating an agreement in an e-commerce environment
CN101110089A (zh) * 2007-09-04 2008-01-23 华为技术有限公司 一种数据挖掘和建模的方法及系统
CN101620691A (zh) * 2008-06-30 2010-01-06 上海全成通信技术有限公司 电信业自动化数据挖掘平台
CN102089759A (zh) * 2008-07-09 2011-06-08 凯森公司 生成用于输入分析模型的分析数据集的方法
CN102236836A (zh) * 2010-09-27 2011-11-09 上海邦蓝决策信息科技有限公司 网络互动合作式建模

Also Published As

Publication number Publication date
US8977720B2 (en) 2015-03-10
US20120166156A1 (en) 2012-06-28
CN103136417A (zh) 2013-06-05

Similar Documents

Publication Publication Date Title
KR102028810B1 (ko) 온라인 메신저 챗봇을 이용한 보험 상품 설계 및 가입을 위한 원스톱 서비스 방법, 그리고 이를 수행하는 시스템
CN103136417B (zh) 一种基于互联网的自动建模分析方法及系统
JP6186086B2 (ja) 団地のインテリジェント推奨方法、推奨装置、記憶媒体及び機器
KR101980286B1 (ko) 애플리케이션별 자원 사용량 정보의 제공 기법
CN102855539B (zh) 通信处理装置和方法、信息管理装置和方法
CN111507543B (zh) 用于预测实体间业务关系的模型训练方法及装置
CN106686599B (zh) 一种用于应用信息的风险管理的方法与设备
CN108363811A (zh) 设备识别方法及装置、电子设备、存储介质
WO2022252363A1 (zh) 数据处理方法、计算机设备以及可读存储介质
KR101601896B1 (ko) 스마트폰 최적화 애플리케이션을 활용하여 스마트폰 사용내역을 수집하고, 사용자에게 알맞은 애플리케이션을 추천하고, 리워드 기반의 리서치 서비스를 제공하는 서비스 시스템 및 방법
CN100334584C (zh) 信息处理设备、信息处理方法和程序
CN108875757B (zh) 一种信息审核方法、服务器及系统
CN111125512A (zh) 业务推荐处理方法、装置及系统
CN101600151B (zh) 无线电波传播特性预测辅助系统和方法
CN111815169B (zh) 业务审批参数配置方法及装置
CN111340558A (zh) 基于联邦学习的线上信息处理方法、装置、设备及介质
CN111539774A (zh) 无形资产的价值评估方法、系统、终端设备及存储介质
CN105721629A (zh) 用户标识匹配方法和装置
CN114580658A (zh) 基于区块链的联邦学习激励方法、装置、设备和介质
CN111932200A (zh) 远程招投标评审系统
CN103299336A (zh) 信息处理系统、信息处理方法以及存储介质
KR20180122111A (ko) 공연 및 행사기획 대행 온오프라인 서비스 제공방법
CN116955148A (zh) 业务系统测试方法、装置、设备、存储介质及产品
CN113014671B (zh) 应用于大数据分析的云业务资源共享方法及资源共享平台
CN109992614B (zh) 数据获取方法、装置和服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160316