CN113961556A - 用于信息处理的方法、装置、设备和存储介质 - Google Patents

用于信息处理的方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN113961556A
CN113961556A CN202010706472.4A CN202010706472A CN113961556A CN 113961556 A CN113961556 A CN 113961556A CN 202010706472 A CN202010706472 A CN 202010706472A CN 113961556 A CN113961556 A CN 113961556A
Authority
CN
China
Prior art keywords
factors
causal relationship
causal
observation samples
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010706472.4A
Other languages
English (en)
Inventor
潘征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to CN202010706472.4A priority Critical patent/CN113961556A/zh
Priority to JP2021118324A priority patent/JP7173234B2/ja
Priority to US17/380,684 priority patent/US20220027770A1/en
Publication of CN113961556A publication Critical patent/CN113961556A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2132Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on discrimination criteria, e.g. discriminant analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2178Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Computational Mathematics (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)

Abstract

本公开涉及用于信息处理的方法、装置、设备和存储介质。具体地,提出了一种信息处理方法。在该方法中,接收与应用系统的多个因素相关联的多个观察样本,多个观察样本中的观察样本包括多个因素的一组观察值。获取多个观察样本的至少一个属性。基于至少一个属性来确定至少一个处理过程,至少一个处理过程中的处理过程用于处理多个观察样本以获得多个因素之间的因果关系。进一步,提供了用于信息处理的装置、设备和存储介质。可以基于将要被处理的输入数据,自动确定基于哪种算法来处理输入数据。以此方式,一方面可以降低对于人力劳动的依赖,另一方面还可以提高数据处理过程的性能和准确性。

Description

用于信息处理的方法、装置、设备和存储介质
技术领域
本公开内容的各实现方式涉及机器学习领域,更具体地,涉及用于基于机器学习技术来执行信息处理的方法、装置、设备和计算机存储介质。
背景技术
机器学习技术已经被广泛应用于多种领域,以便寻找多个因素之间的因果关系。例如,在机械制造领域,零件的毛坯要经过加工阶段,从而生成满足预定形状要求的产品。将会理解,在加工阶段可以涉及不同的控制参数。控制参数将会直接或者间接地决定最终产品的误差。又例如,电力传输系统可以涉及大量传输参数。这些控制参数可能会直接或者间接地决定传输导致的电能损失。
因果关系是其他后期处理和分析的基础,如何基于输入数据确定更为可信的因果关系,这在一定程度上将影响后续操作的准确性。因此,期望可以选择适合的处理过程来用于处理输入数据,进而确定输入数据中的多个因素之间的因果关系。
发明内容
本公开的示例性实现方式提供了用于信息处理的技术方案。
根据本公开的第一方面,提出了一种信息处理方法。在该方法中,接收与应用系统的多个因素相关联的多个观察样本,多个观察样本中的观察样本包括多个因素的一组观察值。获取多个观察样本的至少一个属性。基于至少一个属性来确定至少一个处理过程,至少一个处理过程中的处理过程用于处理多个观察样本以获得多个因素之间的因果关系。
根据本公开的第二方面,提出了一种信息处理设备。该设备包括处理器,并且处理器被配置为接收与应用系统的多个因素相关联的多个观察样本,多个观察样本中的观察样本包括多个因素的一组观察值;获取多个观察样本的至少一个属性;以及基于至少一个属性来确定至少一个处理过程,至少一个处理过程中的处理过程用于处理多个观察样本以获得多个因素之间的因果关系。
根据本公开的第三方面,提出了一种电子设备,包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令当由至少一个处理单元执行时,使得设备执行根据第一方面所描述的方法。
在本公开的第四方面,提供了一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行根据第一方面所描述的方法。
根据本公开的第五方面,提出了一种信息处理方法。在该方法中,接收与应用系统的多个因素相关联的多个观察样本,所述多个观察样本中的观察样本包括所述多个因素的一组观察值。分别利用多个处理过程来处理所述多个观察样本,以确定所述多个因素之间的多个因果关系,所述多个因果关系中的因果关系是基于所述多个处理过程中的处理过程来获得的。
根据本公开的第六方面,提出了一种信息处理设备。该设备包括处理器,并且处理器被配置为接收与应用系统的多个因素相关联的多个观察样本,所述多个观察样本中的观察样本包括所述多个因素的一组观察值;分别利用多个处理过程来处理所述多个观察样本,以确定所述多个因素之间的多个因果关系,所述多个因果关系中的因果关系是基于所述多个处理过程中的处理过程来获得的。
根据本公开的第七方面,提出了一种电子设备,包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令当由至少一个处理单元执行时,使得设备执行根据第五方面所描述的方法。
在本公开的第八方面,提供了一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,计算机可读程序指令用于执行根据第五方面所描述的方法。
提供发明内容部分是为了以简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。发明内容部分无意标识本公开的关键特征或必要特征,也无意限制本公开的范围。
附图说明
结合附图并参考以下详细说明,本发明各实现方式的特征、优点及其他方面将变得更加明显,在此以示例性而非限制性的方式示出了本发明的若干实现方式。在附图中:
图1A示意性示出了其中可以使用根据本公开的示例性实现方式的一个应用系统的框图;
图1B示意性示出了其中可以使用根据本公开的示例性实现方式的另一应用系统的框图;
图2A示意性示出了其中可以实现根据本公开的示例性实现方式的一个计算环境的框图;
图2B示意性示出了其中可以实现根据本公开的示例性实现方式的另一计算环境的框图;
图3示意性示出了根据本公开内容的一个实现方式的信息处理的过程的框图;
图4示意性示出了根据本公开内容的一个实现方式的用于信息处理的方法的流程图;
图5示意性示出了根据本公开内容的一个实现方式的处理过程库的框图;
图6示意性示出了根据本公开内容的一个实现方式的多个观察样本的特征的数据结构的框图;
图7示意性示出了根据本公开内容的一个实现方式的用于信息处理的用户界面的框图;
图8A、8B和8C分别示意性示出了根据本公开内容的一个实现方式的用于显示因果关系的用户界面的框图;
图9示意性示出了根据本公开内容的一个实现方式的用于信息处理的装置的框图;以及
图10示意性示出了根据本公开内容的一个实现方式的用于信息处理的设备的框图。
具体实施方式
下面将参照附图更详细地描述本公开的优选示例性实现方式。虽然附图中显示了本公开的优选示例性实现方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的示例性实现方式所限制。相反,提供这些示例性实现方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
在本文中使用的术语“包括”及其变形表示开放性包括,即“包括但不限于”。除非特别申明,术语“或”表示“和/或”。术语“基于”表示“至少部分地基于”。术语“一个示例示例性实现方式”和“一个示例性实现方式”表示“至少一个示例示例性实现方式”。术语“另一示例性实现方式”表示“至少一个另外的示例性实现方式”。术语“第一”、“第二”等等可以指代不同的或相同的对象。下文还可能包括其他明确的和隐含的定义。
在一些示例中,值、过程或装置被称为“最佳”、“最低”、“最高”、“最小”、“最大”等。应当理解,这样的描述旨在指示可以在很多使用的功能替代方案中进行选择,并且这样的选择不需要比其他选择更好、更小、更高或以其他方式优选。
为了方便描述起见,首先参见图1A和图1B介绍可以使用根据本公开的示例性实现方式的应用系统。图1A示意性示出了其中可以实现根据本公开的示例性实现方式的应用系统的框图100A。图1A示出了机械制造过程,假设期望将零件110A加工为具有预定义尺寸的产品130A,零件110A需要经历加工阶段120A。每个零件的加工过程可以涉及不同的控制参数,例如,工具速度、工具朝向、零件尺寸、光滑度和加工时间。期望确定这些加工参数与最终的产品130A的误差之间的因果关系。
图1B示意性示出了其中可以实现根据本公开的示例性实现方式的另一应用系统的框图100B。图1B示意性示出了电力传输过程,输入电压110B可以经过传输阶段120B,以便在目的地处获得输出电压130B。为了减少电力传输期间的损失,可以采用超高压电路传输方式,此时传输阶段120B可以涉及不同传输参数。期望确定这些传输参数与传输期间的电能损失之间的因果关系。
将会理解,上文仅示意性示出了在机械制造领域和电力传输领域中的示例。还可以在其他的多种领域中应用根据本公开的示例性实现方式。在诸如市场研究、制造、医疗保健、零售等很多领域中,期望发现事情发生的原因和方式并且找到使得期望的事情能够发生的策略。例如,在市场研究领域,人们想知道哪些因素会影响电信运营商的客户满意度以及如何提高客户满意度。在产品制造领域,人们想知道哪些因素会影响产品产量以及如何提高产品产量。在零售领域,人们想知道哪些因素会影响产品销量以及如何提高产品销量。在软件开发领域,人们想知道哪些因素会影响软件故障率以及如何降低软件故障率。因此,期望提供一种因果分析系统,并且期望该系统能够发现多个因素之间的因果关系,进而基于该因果关系来推荐影响多个因素中的目标因素的策略。
目前已经提出了确定多个因素之间的因果关系的多种处理过程(即,算法)。将会理解,每个处理过程都有自身的优势和劣势,例如,使用处理过程A来处理如图1A所示的机械制造环境中采集到的数据,可以确定准确的因果关系。然而,如果使用该处理过程A来处理如图1B所示的电力传输环境中采集到的数据,则不能确定准确的因果关系。在已有的技术方案中,需要技术人员基于自身经验手工选择用于处理输入数据的处理过程。如果选择了不适合的处理过程,可能会导致较长的处理时间和/或不准确的因果关系。此时,不得不重新选择新的处理过程,并利用该新的处理过程来重新处理输入数据。这将导致极大的人力和计算资源的开销。
为了解决上述问题和/或一个或多个其他潜在问题,本公开的示例性实现方式提出了一种用于信息处理的技术方案。在该解决方案中,可以基于将要被处理的输入数据,自动确定基于哪种算法来处理该输入数据。以此方式,一方面可以降低对于人力劳动的依赖,另一方面还可以提高未来数据处理过程的性能和准确性。
如本文中使用的首先介绍在本公开中使用的术语,术语“因素”也被称为“数据”。术语“观察样本”是指能够直接观察的多个因素的一组观察值,并且能够直接观察的因素也称为“可观察因素”或“可观察数据”。术语“目标因素”是指人们期望影响的因素。例如,在上文的机械制造领域中,可观察因素可以包括各个控制参数,并且目标因素可以包括最终产品的误差。在上文的电力传输环境中,可观察因素可以包括各个传输参数,并且目标因素可以包括最终的电能损失。
又例如,在市场研究领域,可观察因素可以包括与客户属性有关的因素(诸如客户级别、客户电话号码等)、与客户行为有关的因素(诸如每月消耗的流量、免费流量的比率、每月消耗的流量的总费用等)、与客户反馈有关的因素(例如,投诉次数、客户满意度)、以及与策略有关的因素(例如,针对特定事件的提醒次数等)。顾客满意度可以被认为是目标因素。作为另一示例,在软件开发领域,可观察因素可以包括用于软件开发的人力资源量、用于软件开发的持续时间、函数数目、代码行数目、用于软件开发的编程语言、软件故障率等。例如,软件故障率可以被认为是目标因素。观察样本可以包括可观察因素的一组观察值。
可以以计算机软件应用的方式来实现根据本公开的示例性实现方式。图2A示意性示出了其中可以实现根据本公开的示例性实现方式的一个计算环境的框图200。如图2A所示,环境200可以包括用户210、处理服务器220和数据收集设备230。处理服务器220可以包括用户接口模块221、处理引擎222和数据库223。应当理解,仅出于说明的目的示出了环境200和/或处理服务器220的结构,而不暗示对本公开的范围的任何限制。本公开的实现方式也可以应用于具有不同结构的不同环境和/或具有不同组件的不同处理服务器。
根据本公开的示例性实现方式,数据收集设备230可以被配置为自动收集多个因素的观察样本。每个观察样本可以包括多个因素的一组观察值。根据本公开的示例性实现方式,数据收集设备230可以包括用于收集观察样本的一个或多个传感器。备选地,根据本公开的示例性实现方式,数据收集设备230可以包括用于分别收集不同类型的因素的观察值的一个或多个收集单元。
根据本公开的示例性实现方式,数据收集设备230可以将所收集的观察样本传输到处理服务器220以用于后续存储、处理和/或分析。例如,由数据收集设备230收集的观察样本可以经由用户输入接口模块221被传输到处理服务器220。然后,观察样本可以从用户输入接口模块221被传输到处理引擎222以用于后续存储、处理和/或分析。例如,处理引擎222可以选择用于处理观察样本的处理过程。进一步,处理引擎222可以运行选择的处理过程,以便发现多个因素之间的因果关系,和/或基于观察样本执行分析。备选地,根据本公开的示例性实现方式,可以省略数据收集设备230。例如,观察样本可以由用户210输入到服务器220。
根据本公开的示例性实现方式,用户210可以与处理系统220通信。例如,用户210可以经由用户输入接口模块221向处理服务器220输入观察样本和/或所需的其他信息。用户输入可以从用户输入接口模块221被传输到处理引擎222。根据本公开的示例性实现方式,响应于接收到用户输入,处理引擎222可以为输入数据选择相应的处理过程,并且可以经由用户接口模块221向用户210呈现一个或多个反馈。处理引擎222可以将所接收的各种数据存储到数据库223中以供后续使用。进一步,处理引擎222可以运行选择的处理过程,以便确定输入数据中的多个因素之间的因果关系。
图2B示意性示出了其中可以实现根据本公开的示例性实现方式的另一计算环境的框图205。如图2B所示,环境205可以包括用户210、数据收集设备230(其与图2A所示的数据收集设备230相同或相似)、用户设备240和处理服务器260。例如,用户设备240可以经由网络250(诸如互联网)与处理服务器260通信。应当理解,仅出于说明的目的示出了环境205、用户设备240和/或处理服务器220的结构,而不暗示对本公开的范围的任何限制。本公开的实现方式也可以应用于不同的环境、不同的用户设备和/或不同的处理服务器。
如本文中使用的,术语“用户设备”可以指代具有无线或有线通信能力的任何设备。用户设备的示例包括但不限于用户设备(UE)、个人计算机、台式机、移动电话、蜂窝电话、智能电话、个人数字助理(PDA)、便携式计算机、图像捕获设备(诸如数码相机)、游戏设备、音乐存储和播放设备、或者启用无线或有线互联网访问和浏览的互联网设备。
如图2B所示,例如,用户设备240可以包括用户接口模块221(其与如图2A所示的用户接口模块221相同或相似)和本地数据库241。根据本公开的示例性实现方式,用户设备240可以经由用户接口模块221从数据收集设备230接收观察样本,和/或经由用户接口模块221从用户210接收用户输入。用户设备240可以将所接收的数据存储在本地数据库241处以供后续使用。用户设备240还可以经由网络250将所接收的数据传输到处理服务器260以用于后续处理和/或分析。
如图2B所示,例如,处理服务器260可以包括处理引擎222(其与如图2A所示的处理引擎222相同或相似)和数据库261。根据本公开的示例性实现方式,响应于接收到多个因素的观察样本,处理引擎222为输入数据选择相应的处理过程,并且可以经由用户接口模块221向用户210呈现一个或多个反馈。处理引擎222可以将所接收的各种数据存储到数据库261中以供后续使用。进一步,处理引擎222可以运行选择的处理过程,以便确定输入数据中的多个因素之间的因果关系。
在上文中已经参见图2A和图2B描述了用于执行根据本公开的示例性实现方式的计算环境,在下文中,将参见图3描述信息处理过程的概要。图3示意性示出了根据本公开内容的一个实现方式的信息处理的过程的框图300。如图3所示,应用系统可以涉及多个因素310。假设多个因素的数量表示为n,则多个因素可以表示为x1,x2,x3,x4,…,xn。可以获取与多个因素210相关联的多个观察样本320。在此,多个观察样本中的每个观察样本包括多个维度。如图2所示,一个观察样本可以表示为(X11,X12,X13,X14,…,X1n)。观察样本中的每个维度可以对应于多个因素中的一个因素,也即每个观察样本可以包括多个因素的一组观察值。例如,第1个维度中的数据X11为因素x1的观察值,第2个维度中的数据X12为因素x2的观察值,等等。
获取多个观察样本320的至少一个属性330,在此属性可以涉及多个因素之间的关系(如,线性关系、非线性关系)、多个因素的维度,等等。可以基于多个观察样本的至少一个属性,从处理过程库340中选择用于处理多个观察样本的至少一个处理过程350。将会理解,在此并不限制至少一个处理过程350中包括的处理过程的数量。而是,至少一个处理过程350可以包括单一处理过程,也可以包括多个处理过程。
将会理解,在不同的应用系统中,获得的多个观察样本可以具有不同的属性。利用本公开的示例性实现方式,基于多个观察样本的属性330,即可选择相应的处理过程。以此方式,可以在无需人工劳动的情况下,自动地确定与观察样本的属性最为匹配的处理过程。可以降低人工处理的开销,并且避免由于人工失误造成的选择的处理过程不适合于处理接收到的观察样本的情况。
在下文中,将参见图4详细描述根据本公开的示例性实现方式的更多细节,该图4示意性示出了根据本公开内容的一个实现方式的用于信息处理的方法400的流程图。在框410处,接收与应用系统的多个因素相关联的多个观察样本,在此多个观察样本中的观察样本包括多个因素的一组观察值。
在下文中,将分别参见图1A和图1B所示的应用系统来描述多个因素210和多个观察样本220的更多细节。在如图1A所示的用于机械制造的应用系统中,多个因素210可以包括多个控制参数。例如,因素x1至x5可以分别表示在加工阶段的工具速度、工具朝向、零件尺寸、光滑度和加工时间,以及因素x6表示产品的误差。此时,每个观察样本可以包括与上述因素相对应的多个数据。下文表1示意性示出了多个观察样本的示例。
表1多个观察样本的示例
Figure BDA0002594979990000101
假设接收到的多个观察样本220的数量为m,表1中的每行表示一个观察样本。在第一行示出了一个零件的加工过程相关的观察样本。即,前5个维度中的数据X11、X12、X13、X14和X15分别对应于工具速度、工具朝向、零件尺寸、光滑度和加工时间,并且最后一个维度中的数据X16对应于最终产品的误差。类似地,第m行示出了第m个零件的加工阶段相关的观察样本。将会理解,上文表1仅示意性示出了观察样本的示例性数据结构,根据本公开的示例性实现方式,可以存在更多的因素。例如,加工阶段可以进一步涉及粗加工阶段和精加工阶段的更多控制参数,等等。根据本公开的示例性实现方式,可以存在更少的因素。
将会理解,上文表1仅示意性示出了在如图1A所示应用系统中的示例性数据结构。在其他应用系统中,观察样本可以包括更多、更少或者不同的维度。例如,在图1B所示的电力传输系统中,因素x1至x5可以分别表示传输阶段的多个传输参数,并且因素x6可以表示电能损失。将会理解,尽管上文仅示意性示出了与6个因素相关联的观察样本,根据本公开的示例性实现方式,观察样本可以涉及更多或者更少的因素。
根据本公开的示例性实现方式,可以从分别部署在应用系统中的多个传感器接收给定观察样本所包括的多个维度的数据。例如,对于表1中的第一个观察样本而言,可以从部署在机械制造系统中的工具处的测量传感器收集数据X11至X16,等等。利用本公开的示例性实现方式,可以在无需部署额外传感器的情况下,从应用系统中的已有传感器收集观察样本。以此方式,可以提高应用系统中的传感器的重用性能。
在框420处,获取多个观察样本的至少一个属性。将会理解,在此的属性可以包括多方面的内容。根据本公开的示例性实现方式,属性可以包括多个因素的关系类型。关系类型是指各个因素之间的关联关系的类型。例如,零件的抛光时间越长,则光滑度越高,两者可以存在呈线性关系。又例如,工具速度可以影响零件尺寸,然而两者之间不具有线性依赖关联关系。关系类型可以包括线性关系以及非线性关系中的至少任一项。利用本公开的示例性实现方式,通过区分各个因素之间的关联关系,可以有助于选择更加适合于该关系类型的处理过程,进而提高后续处理的准确性。
根据本公开的示例性实现方式,属性可以包括多个因素的维度。在此的维度是指多个因素的数量,例如,在上文表1的示例中,维度为6。将会理解,目前已经提出了大量的处理过程,这些过程可以分别适合于处理不同的输入数据。例如,某些处理过程更适合于处理高维数据(例如,维度大于或等于100的观察样本);某些处理过程更适合于处理低维数据(例如,维度小于100的观察样本)。利用本公开的示例性实现方式,通过区分高维观察样本和低维观察样本,可以有助于选择更加适合于该观察样本的维度的处理过程,进而提高后续处理的准确性。
根据本公开的示例性实现方式,属性可以包括多个因素的数据类型。在此的数据类型是指各个因素涉及的类型,包括:连续数据类型、离散数据类型、和混合数据类型中的至少任一项。在表1的示例中,工具速度、工具朝向、零件尺寸、光滑度、加工时间以及误差都采用实数表示,因而多个因素的数据类型为连续数据类型。在图1B所示的示例中,假设因素x1至x5分别表示传输设备中的多个按钮的“开”/“关”状态,并且因素x6表示输出电压是否正常,则此时的多个因素属于离散数据类型。当多个因素既包括连续数据类型又包括离散数据类型时(例如,因素x6表示电能损失),则多个因素属于混合数据类型。
目前已经提出了用于处理不同类型的输入数据的大量的处理过程。利用本公开的示例性实现方式,通过区分输入数据涉及的数据类型,可以有助于选择更加适合于该数据类型的处理过程,进而提高后续处理的准确性。
根据本公开的示例性实现方式,属性可以包括多个观察样本的数量。例如,在上文表1的示例中,每行表示一个观察样本,因而观察样本的数量为m。将会理解,当观察样本数量不同时,所对应的处理方式也会有所不同。根据本公开的示例性实现方式,可以按照观察样本的数量与观察样本的维度的比较,来划分输入数据。如果观察样本的数量低于观察样本的维度,则输入数据具有小样本数量;否则输入数据具有大样本数量。利用本公开的示例性实现方式,通过区分大样本数量和小样本数量,可以有助于选择更加适合于该样本数量的处理过程,进而提高后续处理的准确性。
在框430处,基于至少一个属性来确定至少一个处理过程。在此,可以运行至少一个处理过程中的一个处理过程以便处理多个观察样本,从而获得多个因素之间的一个因果关系。将会理解,由于目前已经提出了大量的处理过程,基于给定的一个或多个属性可能会找到多个处理过程。此时,可以分别执行多个处理过程,以便从每个处理过程得到一个因果关系。根据本公开的示例性实现方式,用户可以从多个因果关系中选择最为符合自身要求的因果关系。
在下文中,将参见图5描述处理过程库的内容。图5示意性示出了根据本公开内容的一个实现方式的处理过程库340的框图500。处理过程库340可以包括大量处理过程510。根据本公开的示例性实现方式,可以基于属性来分类处理过程510,以便在处理过程库340中查找与属性相匹配的处理过程。例如,可以为每个处理过程设置一个或多个标签。标签可以包括以下中的至少任一项:线性、非线性、高维、低维、连续数据类型、离散数据类型、混合数据类型、大样本数量、以及小样本数量。可以基于标签来从处理过程库340中查找与特征相匹配的处理过程。
根据本公开的示例性实现方式,在已经确定多个观察样本的属性之后,可以基于属性来确定相应的特征。图6示意性示出了根据本公开内容的一个实现方式的多个观察样本的特征的数据结构的框图600。如图6所示,特征610可以包括多个字段:关系类型620、维度622、数据类型624、以及样本数量626。关系类型620可以表示多个因素之间的关系类型,可以使用0来表示线性关系,并且使用1来表示非线性关系。维度622可以表示多个因素的维度,可以使用0来表示高维数据,并且使用1来表示低维数据。
数据类型624可以表示多个因素涉及的数据类型,可以使用0来表示连续数据类型,使用1来表示离散数据类型,并且使用2来表示混合数据类型。样本数量626可以表示输入数据中包括的观察样本的数量,可以使用0来表示小样本数量,并且使用1来表示大样本数量。假设输入数据涉及线性、低维、连续数据类型、大样本数量,则该输入数据的特征可以表示为(0,1,0,0)。
将会理解,图6仅仅示意性示出了用于生成特征的一种方式。根据本公开的示例性实现方式,可以基于其他方式来确定特征。例如,可以交换图6中的各个字段的顺序,备选地和/或附加地,可以使用其他数值来表示各个字段的具体含义。
在已经确定了输入数据的特征的情况下,可以从处理过程库340中选择与特征相匹配的至少一个处理过程。根据本公开的示例性实现方式,为了便于查找,可以将输入数据的特征作为关键字,为各个处理过程编制索引520。基于该索引520,即可确定与某个特征相对应的一个或多个处理过程。利用本公开的示例性实现方式,可以便于提高在处理过程库340中搜索的速度,进而提高数据处理效率。
上文描述了在无需人工干预的情况下自动选择适合于处理输入数据的至少一个处理过程。根据本公开的示例性实现方式,用户只需要指定待处理的输入数据,即可自动获得用于处理该输入数据的处理过程。图7示意性示出了根据本公开内容的一个实现方式的用于信息处理的用户界面的框图700。如图7所示,用户可以经由框710来指定待处理的输入数据。
根据本公开的示例性实现方式,可以允许用户交互。以此方式,可以接收用户的偏好进而提供更为友好的人机交互方式。具体地,用户可以经由框712来指定待处理数据所属于的领域。根据本公开的示例性实现方式,可以接收应用系统所属于的领域。此时,可以基于之前确定的至少一个属性和接收的领域,确定用于处理多个观察样本的至少一个处理过程。将会理解,在长期的研发过程中,技术专家可能已经积累关于处理不同领域的输入数据的丰富经验。例如,可以为处理某个领域的输入数据而开发了专用处理过程。此时,可以进一步基于领域来选择更为适合的处理过程。根据本公开的示例性实现方式,如图6所示的特征610可以包括另一维度“领域”,以用于在处理过程库340中迅速找到相匹配的处理过程。
上文已经描述了如何确定至少一个处理过程。根据本公开的示例性实现方式,可以执行找到的至少一个处理过程。具体地,可以在多个观察样本上分别运行至少一个处理过程中的每个处理过程。可以基于每个处理过程来提供一个因果关系,因而至少一个处理过程可以提供至少一个因果关系。
根据本公开的示例性实现方式,在运行每个处理过程期间,可以允许用户指定用于评价因果关系的一组评价指标。例如,用户可以经由如图7所示的框714来输入一组评价指标。评价指标可以包括多方面的内容,例如可以包括但不限于RMSEA、RMR、TLI、AIC、BIC,等等。RMSEA是指近似误差均方根,该指标的取值越接近于0则表示因果关系的拟合程度越高。RMR表示均方根残差,TLI表示Tucker-Lewis指数,AIC表示赤池信息准则,以及BIC表示贝叶斯信息准则。这些指标都是用于评价因果关系的拟合程度的常用标准。将会理解,上文仅示意性示出了可以用作评价指标的示例,根据本公开的示例性实现方式,还可以选择其他评价指标。
根据本公开的示例性实现方式,可以基于接收的一组评价指标来确定用于设置处理过程的控制参数。继而,可以基于控制参数来设置处理过程,并且在多个观察样本上运行该处理过程。可以逐步获得因果关系,具体地,可以在多个轮次中迭代地执行上述过程。根据本公开的示例性实现方式,可以基于一组评价指标调整控制参数,以获得调整的控制参数。在一个示例中,用户可以调整以下中的至少任一项:nlambda、qlimit、Lambda_min,等等。
将会理解,上述参数是用于调整处理过程的控制参数,本领域技术人员可以查阅相应处理过程的规范来确定具体含义,将不再赘述。假设期望基于RMSEA来评价因果关系,增大nlambda的取值(例如,nlambda=50)可以获得更好的RMSEA。根据本公开的示例性实现方式,用户可以在不断迭代的过程中确定是否继续增加nlambda。假设用户期望基于运行效率作为评价指标,则可以减小qlimit(例如,qlimit=500),以此方式,可以获得更高的运行效率。
根据本公开的示例性实现方式,可以基于调整后的参数,迭代地更新因果关系。在更新因果关系的过程中,可以向用户显示在每次迭代过程中找到的因果关系。根据本公开的示例性实现方式,可以以多种方式呈现找到的因果关系。例如,可以在有向无环图(DAG)中呈现因果关系。
在下文中,将参见图8A至图8C描述有关在有向无环图中呈现因果关系的示例。图8A示意性示出了根据本公开内容的一个实现方式的用于显示因果关系的用户界面的框图800A。如图8A左侧所示,节点810至860分别表示上文表1中描述的多个因素x1至x6,图中的边表示两个因素之间的具有因果关系。例如,节点810和830之间存在边,表示因素x1是因素x3的直接原因。图8A右侧的提示信息870示出了在当前迭代的相关信息:目前示出的因果关系是第一次迭代获得的结果,评价指标RMSEA=0.1,并且已经获得的因果关系的数量为3(即,DAG图中的边的数目)。
将会理解,图8A仅仅示出了表示因果关系一个示例。根据本公开的示例性实现方式,尽管图8A未示出,可以进一步显示因果关系的权重,权重越大则表示因果关系的强度越大。根据本公开的示例性实现方式,可以在矩阵中呈现找到的因果关系。此时矩阵的多个维度分别表示多个因素,以及矩阵的元素表示多个因素中的对应于元素的两个因素之间的因果关系的权重。可以基于如下矩阵M来呈现因果关系,并且该矩阵M与图8A所示的DAG图表示相同的因果关系。
Figure BDA0002594979990000161
在矩阵M中,数值“0”表示两个因素之间不存在因果关系,非零数值表示两个因素之间存在因果关系,并且数值的大小表示因果关系的强弱。例如,w13表示因素x1和因素x3之间的权重,w34表示因素x3和因素x4之间的权重,等等。利用本公开的示例性实现方式,通过在DAG图中或者在矩阵中呈现找到的因果关系,可以便于用户了解应用系统中包括的多个因素之间的因果关系,进而基于找到的因果关系来调整应用系统的运行。
根据本公开的示例性实现方式,用户可以指定迭代终止的条件,例如可以经由图7所示的框716来指定终止条件。可以指定当获得的因果关系的数量大于指定阈值时停止迭代,例如,可以指定在获得6个(或者其他数量)的因果关系时停止迭代。备选地和/或附加地,可以指定当某个评价指标满足指定阈值时停止迭代,例如,可以指定当RMSEA≤0.05(或者其他数值)时停止迭代,等等。
根据本公开的示例性实现方式,可以指定多个终止条件,并且可以指定多个终止条件之间的关系。例如,可以指定当满足全部终止条件时停止迭代,或者可以指定满足任一终止条件时停止迭代。可以接收停止标准,在迭代过程中如果更新的因果关系满足停止标准,则停止迭代并且提供更新的因果关系。
假设用户指定当因果关系数量≥6时停止迭代,此时,在第一次迭代之后因果关系的数量为3,应当继续执行第二次迭代。图8B示意性示出了根据本公开内容的一个实现方式的用于显示因果关系的用户界面的框图800B。在图8B中,第二次迭代之后,在节点820和节点830之间增加了一个边,并且在节点840和节点860之间增加了一个边。提示信息872示出了第二次迭代的相关信息:RMSEA=0.07并且因果关系的数量为5。将会理解,在此输出的提示信息872是基于图8B所示的更新的因果关系来确定的。在此,更新的因果关系的各项指标都有所改善:RMSEA从0.1降低至0.07,并且发现的因果关系的数量从3增加至5。由于因果关系的数量仍然没有满足停止标准,继续进行第三次迭代。
图8C示意性示出了根据本公开内容的一个实现方式的用于显示因果关系的用户界面的框图800C。在图8C中,第三次迭代之后,在节点840和节点850之间增加了一个边。提示信息874示出了第三次迭代的相关信息:RMSEA=0.05并且因果关系的数量为6。由于因果关系的数量满足停止标准,停止迭代。
上文参见图8A至图8C描述了基于停止标准来停止迭代的示例。根据本公开的示例性实现方式,用户可以基于显示的因果关系和相关信息来确定是否执行后续的迭代。假设用户认为图8B所示的因果关系已经符合要求,则可以立即停止迭代。
根据本公开的示例性实现方式,用户可以手工调整获得的因果关系。通常而言,随着对多个因素的长期观察,关于两个因素之间是否存在因果关系,可能已经积累了一定的经验。可以将两个因素之间的因果关系的约束称为专家知识。在已经获得因果关系之后,可以利用专家知识来验证获得的因果关系是否符合已知的经验。
假设专家知识表示因素x3和因素x5之间不存在因果关系,则用户可以手工删除图8C中的节点830和850之间的边。继而,可以基于用户的删除操作来调整因果关系。由于专家知识反映人们所积累的专业经验,基于专家知识来辅助确定因果关系,一方面可以降低确定过程的计算量,另一方面还可以使得获得的因果关系更加符合历史经验。
根据本公开的示例性实现方式,可以基于获取的因果关系来调整应用系统的运行。根据本公开的示例性实现方式,还可以基于因果关系排除应用系统的故障。具体地,对于图1A所示机械制造系统而言,已经基于上文描述的方法确定了各个控制参数与产品误差之间的因果关系。可以基于找到的因果关系来优先调整对于产品误差影响最大的控制参数。
根据本公开的示例性实现方式,可以基于因果关系来提高应用系统的性能。具体地,可以通过调整、监测等方式来影响所述应用系统因果关系中的原因节点、来提升所述应用系统的性能。此外,也可以通过满足预定条件自动输出所述分析结果(因果关系)的方式来推动所述应用系统的改进或性能提升。示例性地,对于图1B所示电力传输系统而言,假设已经基于上文描述的方法确定了各个传输参数与电能损失之间的因果关系,则可以基于找到的因果关系来优先调整对于电能损失影响最大的传输参数。以此方式,可以提高电力传输系统的性能。
将会理解,尽管在上文中以机械制造系统和电力传输系统作为应用系统的具体示例描述了如何为来自各个应用系统的输入数据选择处理过程、以及基于选择的处理过程来确定因果关系。可以将上文描述的方法应用于其他的应用系统。例如,可以采集市场研究数据,并且在如图7所示的界面中经由框710来输入待处理的数据。利用本公开的示例性实现方式,可以自动地为待处理数据选择适合的处理过程。进一步,在基于选择的处理过程确定待处理数据的过程中,可以允许用户输入用于评价因果关系的评价指标。以此方式,可以朝向更加符合评价指标的方向来迭代地确定因果关系。
上文已经参见2至图8C描述了用于信息处理的方法的细节。在下文中,将参见图9描述用于信息处理的装置中的各个模块。图9示意性示出了根据本公开内容的一个实现方式的用于信息处理的装置900的框图。该装置900包括:
根据本公开的示例性实现方式,提供了一种信息处理装置。该装置包括:接收模块,配置用于接收与应用系统的多个因素相关联的多个观察样本,多个观察样本中的观察样本包括多个因素的一组观察值;获取模块,配置用于获取多个观察样本的至少一个属性;以及确定模块,配置用于基于至少一个属性来确定至少一个处理过程,至少一个处理过程中的处理过程用于处理多个观察样本以获得多个因素之间的因果关系。
根据本公开的示例性实现方式,获取模块被配置用于获取以下中的至少任一项:多个因素的关系类型;多个因素的维度;多个因素的数据类型;以及多个观察样本的数量。
根据本公开的示例性实现方式,关系类型包括线性关系以及非线性关系中的至少任一项;维度包括高维度和低维度中的至少任一项;数据类型包括连续数据类型、离散数据类型、和混合数据类型中的至少任一项;以及数量包括大样本数量和小样本数量中的至少任一项。
根据本公开的示例性实现方式,确定模块包括选择模块,配置用于从处理过程库中选择与至少一个属性相匹配的至少一个处理过程。
根据本公开的示例性实现方式,选择模块包括:生成模块,配置用于基于至少一个属性生成多个观察样本的特征;以及查找模块,配置用于基于特征来在处理过程库中查找至少一个处理过程。
根据本公开的示例性实现方式,确定模块包括:领域接收模块,配置用于接收用于指定应用系统所属于的领域的指令;以及确定模块进一步配置用于基于至少一个属性和领域,确定用于处理多个观察样本的至少一个处理过程。
根据本公开的示例性实现方式,至少一个处理过程包括多个处理过程,以及该装置进一步包括提供模块,配置用于分别利用多个处理过程处理多个观察样本,以提供多个因素之间的多个因果关系,多个因果关系中的因果关系是分别利用多个处理过程中的处理过程处理多个观察样本来提供的。
根据本公开的示例性实现方式,提供模块包括:评价指标接收模块,配置用于针对多个处理过程中的处理过程,接收指定用于评价因果关系的一组评价指标的指令;设置模块,配置用于基于一组评价指标确定用于设置处理过程的控制参数;因果关系确定模块,配置用于基于控制参数和多个观察样本,确定因果关系。
根据本公开的示例性实现方式,因果关系确定模块包括:调整模块,配置用于基于一组评价指标调整控制参数;以及更新模块,配置用于基于调整的控制参数,更新因果关系。
根据本公开的示例性实现方式,更新模块包括:停止标准接收模块,配置用于接收用于停止迭代的停止标准的指令;以及停止模块,配置用于响应于更新的因果关系满足停止标准,停止迭代以提供更新的因果关系。
根据本公开的示例性实现方式,更新模块进一步包括:输出模块,配置用于输出更新的因果关系;反馈接收模块,配置用于接收针对更新的因果关系的反馈的指令;以及因果关系调整模块,配置用于基于反馈来调整因果关系。
根据本公开的示例性实现方式,输出模块,配置用于进一步包括:信息输出模块,配置用于输出与一组评价指标相关联的信息,信息是基于更新的因果关系来确定的。
根据本公开的示例性实现方式,输出模块包括以下中的至少任一项:图呈现模块,配置用于在有向无环图中呈现因果关系,有向无环图中的多个节点分别表示多个因素,以及因果关系中的边表示多个因素中的两个因素之间的因果关系;以及矩阵呈现模块,配置用于在矩阵中呈现因果关系,矩阵的多个维度分别表示多个因素,以及矩阵的元素表示多个因素中的对应于元素的两个因素之间的因果关系的权重。
根据本公开的示例性实现方式,多个因素表示应用系统的多个设备控制参数。
根据本公开的示例性实现方式,观察样本包括的一组观察值是分别从部署在应用系统中的一个或多个传感器采集的;以及该装置进一步包括:因果关系提供模块,配置用于向应用系统提供因果关系。
在上文中已经描述了基于确定的至少一个处理过程来处理输入数据的多个示例性实现方式。根据本公开的示例性实现方式,可以直接运行多个处理过程并获得多个因果关系。以此方式,可以向用户提供多个因果关系,以便用于用户选择。
具体地,可以接收与应用系统的多个因素相关联的多个观察样本。在此的多个观察样本中的观察样本包括多个因素的一组观察值。继而,可以分别利用多个处理过程来处理多个观察样本,以确定多个因素之间的多个因果关系。具体地,可以在多个观察样本上运行每个处理过程,以便获得多个因果关系。将会理解,在此的多个处理过程可以是处理过程库中包括的全部处理过程,也可以是其中的一部分处理过程。
根据本公开的示例性实现方式,可以基于多个观察样本的至少一个属性,从处理过程库中选择多个处理过程。具体地,至少一个属性包括获取以下中的至少任一项:多个因素的关系类型;多个因素的维度;多个因素的数据类型;以及多个观察样本的数量。
根据本公开的另一示例性实现方式,可以根据多个观察样本的至少一个属性,来从获得的多个因果关系中确定多个因素之间的最终因果关系。所述确定包括:从获得的多个因果关系中选择至少一个因果关系作为多个因素之间的最终因果关系,或者从获得的多个因果关系中选择并基于所述至少一个属性调整至少一个因果关系,以作为表示多个因素之间的最终因果关系,其中所述选择和调整的顺序可以互换。
根据本公开的示例性实现方式,可以允许用户交互。例如,可以接收用于指定应用系统所属于的领域的指令。此时,可以基于指定的领域来从处理过程库中选择相应的多个处理过程。
根据本公开的示例性实现方式,可以允许用户控制运行多个处理过程。具体地,可以接收用于运行多个处理过程的运行参数的指令。在此,运行参数可以包括以下中的至少任一项:用于评价多个因果关系的评价指标、多个因果关系应当满足的标准、以及针对多个因果关系的反馈。继而,可以基于多个运行参数来控制多个处理过程的运行。例如,可以基于评价指标来确定和/或更新多个处理过程的控制参数,可以基于用户指定的标准来确定是否停止迭代过程,可以基于用户的反馈来调整因果关系的结构,等等。
根据本公开的另一示例性实现方式,可以根据所述运行参数来从获得的多个因果关系中确定多个因素之间的最终因果关系。所述确定包括:从获得的多个因果关系中选择至少一个因果关系作为多个因素之间的最终因果关系,或者从获得的多个因果关系中选择并基于所述运行参数调整至少一个因果关系,以作为多个因素之间的最终因果关系,其中所述选择和调整的顺序可以互换。
将会理解,上文仅仅示意性示出了在运行多个处理过程之后接收来自用户的输入的示例。在上述示例中各个步骤的具体细节与在上文中参见图3至图8C所描述的方法是类似的,因而不再赘述。
根据本公开的示例性实现方式,提供了一种信息处理装置。该装置包括:接收模块,配置用于接收与应用系统的多个因素相关联的多个观察样本,多个观察样本中的观察样本包括多个因素的一组观察值;以及确定模块,配置用于分别利用多个处理过程来处理多个观察样本,以确定多个因素之间的多个因果关系,多个因果关系中的因果关系是基于多个处理过程中的处理过程来获得的。
根据本公开的示例性实现方式,多个处理过程是基于多个观察样本的至少一个属性来获得的,至少一个属性包括获取以下中的至少任一项:多个因素的关系类型;多个因素的维度;多个因素的数据类型;以及多个观察样本的数量。
根据本公开的示例性实现方式,该装置进一步包括:操作指令接收模块,配置用于接收或获取一操作指令,操作指令指示应用系统所属领域的信息;以及其中多个处理过程是基于操作指令来确定的。
根据本公开的示例性实现方式,该装置进一步包括:运行参数接收模块,配置用于接收用于运行多个处理过程的运行参数的指令,运行参数包括以下中的至少任一项:用于评价多个因果关系的评价指标、多个因果关系应当满足的标准、以及针对多个因果关系的反馈;以及该装置进一步包括:控制模块,配置用于基于运行参数来控制多个处理过程。
根据本公开的示例性实现方式,该确定模块进一步配置用于:基于运行参数,重新确定多个因素之间的因果关系。
图10示意性示出了根据本公开内容的一个实现方式的用于信息处理的设备的框图。如图所示,设备1000包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的计算机程序指令或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序指令,来执行各种适当的动作和处理。在RAM 1003中,还可存储设备1000操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
设备1000中的多个部件连接至I/O接口1005,包括:输入单元1006,例如键盘、鼠标等;输出单元1007,例如各种类型的显示器、扬声器等;存储单元1008,例如磁盘、光盘等;以及通信单元1009,例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
上文所描述的各个过程和处理,例如方法400,可由处理单元1001执行。例如,在一些示例性实现方式中,方法400可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1008。在一些示例性实现方式中,计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序被加载到RAM 1003并由CPU 1001执行时,可以执行上文描述的方法400的一个或多个动作。
根据本公开的示例性实现方式,提供了一种信息处理设备。该设备包括处理器,所述处理器被配置为执行上文描述的方法。
根据本公开的示例性实现方式,提供了一种电子设备,包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令当由至少一个处理单元执行时,使得该设备执行如上文描述的方法。
根据本公开的示例性实现方式,提供了一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,所述计算机可读程序指令用于执行如上文描述的方法。
本公开可以是方法、装置、系统和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于执行本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是、但不限于电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些示例性实现方式中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开示例性实现方式的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理单元,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理单元执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个示例性实现方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
已经描述了本公开的各实施方式,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施方式。在不偏离所说明的各实施方式的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施方式的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施方式。

Claims (38)

1.一种信息处理方法,包括:
接收与应用系统的多个因素相关联的多个观察样本,所述多个观察样本中的观察样本包括所述多个因素的一组观察值;
获取所述多个观察样本的至少一个属性;以及
基于所述至少一个属性来确定至少一个处理过程,所述至少一个处理过程中的处理过程用于处理所述多个观察样本以获得所述多个因素之间的因果关系。
2.根据权利要求1所述的方法,其中获取所述多个观察样本的所述至少一个属性包括获取以下中的至少任一项:
所述多个因素的关系类型;
所述多个因素的维度;
所述多个因素的数据类型;以及
所述多个观察样本的数量。
3.根据权利要求2所述的方法,其中:
所述关系类型包括线性关系以及非线性关系中的至少任一项;
所述维度包括高维度和低维度中的至少任一项;
所述数据类型包括连续数据类型、离散数据类型、和混合数据类型中的至少任一项;以及
所述数量包括大样本数量和小样本数量中的至少任一项。
4.根据权利要求1所述的方法,其中确定所述至少一个处理过程包括:从处理过程库中选择与所述至少一个属性相匹配的所述至少一个处理过程。
5.根据权利要求4所述的方法,其中选择所述至少一个处理过程包括:
基于所述至少一个属性生成所述多个观察样本的特征;以及
基于所述特征来在所述处理过程库中查找所述至少一个处理过程。
6.根据权利要求1所述的方法,其中确定所述至少一个处理过程进一步包括:
接收用于指定所述应用系统所属于的领域的指令;以及
基于所述至少一个属性和所述领域,确定用于处理所述多个观察样本的所述至少一个处理过程。
7.根据权利要求1所述的方法,其中所述至少一个处理过程包括多个处理过程,以及所述方法进一步包括:分别利用所述多个处理过程处理所述多个观察样本,以提供所述多个因素之间的多个因果关系,所述多个因果关系中的因果关系是分别利用所述多个处理过程中的处理过程处理所述多个观察样本来提供的。
8.根据权利要求7所述的方法,其中提供所述多个因果关系包括:针对多个处理过程中的处理过程,
接收指定用于评价因果关系的一组评价指标的指令;
基于所述一组评价指标确定用于设置所述处理过程的控制参数;
基于所述控制参数和所述多个观察样本,确定所述因果关系。
9.根据权利要求8所述的方法,其中确定所述因果关系包括:
基于所述一组评价指标调整所述控制参数;以及
基于调整的所述控制参数,更新所述因果关系。
10.根据权利要求9所述的方法,其中更新所述因果关系包括:
接收用于停止迭代的停止标准的指令;以及
响应于更新的所述因果关系满足所述停止标准,停止迭代以提供更新的所述因果关系。
11.根据权利要求9所述的方法,其中更新所述因果关系进一步包括:
输出更新的所述因果关系;
接收针对更新的所述因果关系的反馈的指令;以及
基于所述反馈来调整所述因果关系。
12.根据权利要求11所述的方法,其中输出更新的所述因果关系进一步包括:输出与所述一组评价指标相关联的信息,所述信息是基于所述更新的因果关系来确定的。
13.根据权利要求11所述的方法,其中输出更新的所述因果关系包括以下中的至少任一项:
在有向无环图中呈现所述因果关系,所述有向无环图中的多个节点分别表示所述多个因素,以及所述因果关系中的边表示所述多个因素中的两个因素之间的因果关系;以及
在矩阵中呈现所述因果关系,所述矩阵的多个维度分别表示所述多个因素,以及所述矩阵的元素表示所述多个因素中的对应于所述元素的两个因素之间的因果关系的权重。
14.根据权利要求1所述的方法,其中所述多个因素表示所述应用系统的多个设备控制参数。
15.根据权利要求8所述的方法,其中所述观察样本包括的所述一组观察值是分别从部署在所述应用系统中的一个或多个传感器采集的;以及所述方法进一步包括:向所述应用系统提供所述因果关系。
16.一种信息处理设备,包括处理器,所述处理器被配置为:
接收与应用系统的多个因素相关联的多个观察样本,所述多个观察样本中的观察样本包括所述多个因素的一组观察值;
获取所述多个观察样本的至少一个属性;以及
基于所述至少一个属性来确定至少一个处理过程,所述至少一个处理过程中的处理过程用于处理所述多个观察样本以获得所述多个因素之间的因果关系。
17.根据权利要求16所述的设备,其中获取所述多个观察样本的所述至少一个属性包括获取以下中的至少任一项:
所述多个因素的关系类型;
所述多个因素的维度;
所述多个因素的数据类型;以及
所述多个观察样本的数量。
18.根据权利要求17所述的设备,其中:
所述关系类型包括线性关系以及非线性关系中的至少任一项;
所述维度包括高维度和低维度中的至少任一项;
所述数据类型包括连续数据类型、离散数据类型、和混合数据类型中的至少任一项;以及
所述数量包括大样本数量和小样本数量中的至少任一项。
19.根据权利要求16所述的设备,其中确定所述至少一个处理过程包括:从处理过程库中选择与所述至少一个属性相匹配的所述至少一个处理过程。
20.根据权利要求19所述的设备,其中选择所述至少一个处理过程包括:
基于所述至少一个属性生成所述多个观察样本的特征;以及
基于所述特征来在所述处理过程库中查找所述至少一个处理过程。
21.根据权利要求15所述的设备,其中确定所述至少一个处理过程进一步包括:
接收用于指定所述应用系统所属于的领域的指令;以及
基于所述至少一个属性和所述领域,确定用于处理所述多个观察样本的所述至少一个处理过程。
22.根据权利要求16所述的设备,其中所述至少一个处理过程包括多个处理过程,以及所述设备进一步包括:分别利用所述多个处理过程处理所述多个观察样本,以提供所述多个因素之间的多个因果关系,所述多个因果关系中的因果关系是分别利用所述多个处理过程中的处理过程处理所述多个观察样本来提供的。
23.根据权利要求22所述的设备,其中提供所述多个因果关系包括:针对多个处理过程中的处理过程,
接收指定用于评价因果关系的一组评价指标的指令;
基于所述一组评价指标确定用于设置所述处理过程的控制参数;
基于所述控制参数和所述多个观察样本,确定所述因果关系。
24.根据权利要求23所述的设备,其中确定所述因果关系包括:
基于所述一组评价指标调整所述控制参数;以及
基于调整的所述控制参数,更新所述因果关系。
25.根据权利要求24所述的设备,其中更新所述因果关系包括:
接收用于停止迭代的停止标准的指令;以及
响应于更新的所述因果关系满足所述停止标准,停止迭代以提供更新的所述因果关系。
26.根据权利要求25所述的设备,其中更新所述因果关系进一步包括:
输出更新的所述因果关系;
接收针对更新的所述因果关系的反馈的指令;以及
基于所述反馈来调整所述因果关系。
27.根据权利要求26所述的设备,其中输出更新的所述因果关系进一步包括:输出与所述一组评价指标相关联的信息,所述信息是基于所述更新的因果关系来确定的。
28.根据权利要求26所述的设备,其中输出更新的所述因果关系包括以下中的至少任一项:
在有向无环图中呈现所述因果关系,所述有向无环图中的多个节点分别表示所述多个因素,以及所述因果关系中的边表示所述多个因素中的两个因素之间的因果关系;以及
在矩阵中呈现所述因果关系,所述矩阵的多个维度分别表示所述多个因素,以及所述矩阵的元素表示所述多个因素中的对应于所述元素的两个因素之间的因果关系的权重。
29.根据权利要求16所述的设备,其中所述多个因素表示所述应用系统的多个设备控制参数。
30.根据权利要求23所述的设备,其中所述观察样本包括的所述一组观察值是分别从部署在所述应用系统中的一个或多个传感器采集的;以及所述设备进一步包括:向所述应用系统提供所述因果关系。
31.一种电子设备,包括:
至少一个处理单元;
至少一个存储器,所述至少一个存储器被耦合到所述至少一个处理单元并且存储用于由所述至少一个处理单元执行的指令,所述指令当由所述至少一个处理单元执行时,使得所述设备执行根据权利要求1-15中的任一项所述的方法。
32.一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,所述计算机可读程序指令用于执行根据权利要求1-15中任一项所述的方法。
33.一种信息处理方法,包括:
接收与应用系统的多个因素相关联的多个观察样本,所述多个观察样本中的观察样本包括所述多个因素的一组观察值;
分别利用多个处理过程来处理所述多个观察样本,以确定所述多个因素之间的多个因果关系,所述多个因果关系中的因果关系是基于所述多个处理过程中的处理过程来获得的。
34.根据权利要求33所述的方法,其中所述多个处理过程是基于所述多个观察样本的至少一个属性来获得的,所述至少一个属性包括获取以下中的至少任一项:
所述多个因素的关系类型;
所述多个因素的维度;
所述多个因素的数据类型;以及
所述多个观察样本的数量。
35.根据权利要求33所述的方法,进一步包括:接收或获取一操作指令,所述操作指令指示所述应用系统所属领域的信息;以及其中所述多个处理过程是基于所述操作指令来确定的。
36.根据权利要求33所述的方法,进一步包括:
接收用于运行所述多个处理过程的运行参数的指令,所述运行参数包括以下中的至少任一项:用于评价所述多个因果关系的评价指标、所述多个因果关系应当满足的标准、以及针对所述多个因果关系的反馈;以及
基于所述运行参数来控制所述多个处理过程。
37.根据权利要求36所述的方法,进一步包括:
基于所述运行参数,重新确定所述多个因素之间的因果关系。
38.一种信息处理设备,包括处理器,所述处理器被配置为:
接收与应用系统的多个因素相关联的多个观察样本,所述多个观察样本中的观察样本包括所述多个因素的一组观察值;
分别利用多个处理过程来处理所述多个观察样本,以确定所述多个因素之间的多种因果关系,所述多种因果关系中的因果关系是基于所述多个处理过程中的处理过程来获得的。
CN202010706472.4A 2020-07-21 2020-07-21 用于信息处理的方法、装置、设备和存储介质 Pending CN113961556A (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202010706472.4A CN113961556A (zh) 2020-07-21 2020-07-21 用于信息处理的方法、装置、设备和存储介质
JP2021118324A JP7173234B2 (ja) 2020-07-21 2021-07-16 情報処理に用いられる方法、装置、デバイス及び記憶媒体
US17/380,684 US20220027770A1 (en) 2020-07-21 2021-07-20 Method, apparatus, device and storage medium for information processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010706472.4A CN113961556A (zh) 2020-07-21 2020-07-21 用于信息处理的方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN113961556A true CN113961556A (zh) 2022-01-21

Family

ID=79459887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010706472.4A Pending CN113961556A (zh) 2020-07-21 2020-07-21 用于信息处理的方法、装置、设备和存储介质

Country Status (3)

Country Link
US (1) US20220027770A1 (zh)
JP (1) JP7173234B2 (zh)
CN (1) CN113961556A (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114647642A (zh) * 2022-02-25 2022-06-21 北京百度网讯科技有限公司 从数据中发现因果关系的方法与装置
WO2024130569A1 (zh) * 2022-12-21 2024-06-27 上海健康医学院 一种高维小样本时间序列的因果关系网络分析方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8655821B2 (en) * 2009-02-04 2014-02-18 Konstantinos (Constantin) F. Aliferis Local causal and Markov blanket induction method for causal discovery and feature selection from data
US20120185424A1 (en) * 2009-07-01 2012-07-19 Quantum Leap Research, Inc. FlexSCAPE: Data Driven Hypothesis Testing and Generation System
US10614056B2 (en) 2015-03-24 2020-04-07 NetSuite Inc. System and method for automated detection of incorrect data
CN108885628A (zh) 2016-03-28 2018-11-23 三菱电机株式会社 数据分析方法候选决定装置
CN110390396B (zh) 2018-04-16 2024-03-19 日本电气株式会社 用于估计观测变量之间的因果关系的方法、装置和系统
US20190332957A1 (en) * 2018-04-30 2019-10-31 Fujitsu Limited Causality for machine learning systems
WO2020107184A1 (zh) * 2018-11-26 2020-06-04 华为技术有限公司 一种模型选择方法和终端

Also Published As

Publication number Publication date
US20220027770A1 (en) 2022-01-27
JP7173234B2 (ja) 2022-11-16
JP2022028611A (ja) 2022-02-16

Similar Documents

Publication Publication Date Title
US11240121B2 (en) Methods and systems for controlling data backup
US20130024173A1 (en) Computer-Implemented Systems and Methods for Testing Large Scale Automatic Forecast Combinations
US11314553B2 (en) Method, apparatus, and computer program product for determining usage change rate of storage system
JP7294369B2 (ja) 情報処理に用いられる方法、装置、電子機器及びプログラム
JP2016004525A (ja) データ分析システム及びデータ分析方法
US10161269B2 (en) Output efficiency optimization in production systems
JP7173234B2 (ja) 情報処理に用いられる方法、装置、デバイス及び記憶媒体
JP7342942B2 (ja) 方法、デバイス、及びコンピュータプログラム製品
CN109711871B (zh) 一种潜在客户确定方法、装置、服务器及可读存储介质
CN112508723B (zh) 基于自动择优建模的金融风险预测方法、装置和电子设备
EP3383088A1 (en) A computer implemented method, a system and computer programs to quantify the performance of a network
WO2016200408A1 (en) Hybrid classification system
US20230215426A1 (en) Machine learning system for customer utterance intent prediction
JP5555238B2 (ja) ベイジアンネットワーク構造学習のための情報処理装置及びプログラム
JP6203313B2 (ja) 特徴選択装置、特徴選択方法およびプログラム
CN116385059A (zh) 行为数据预测模型的更新方法、装置、设备及存储介质
US20180253696A1 (en) Generating job recommendations using co-viewership signals
CN111125541B (zh) 面向多用户的可持续多云服务组合的获取方法
CN113408632A (zh) 提高图像分类准确性的方法、装置、电子设备及存储介质
CN113469204A (zh) 数据处理方法、装置、设备和计算机存储介质
Van Moffaert et al. Learning sets of Pareto optimal policies
CN115935027B (zh) 目标对象拓扑图的数据处理方法及图分类模型的训练方法
US11875127B2 (en) Query response relevance determination
CN112882998B (zh) 文件存储方法、电子设备和计算机程序产品
US20210304076A1 (en) Method, apparatus, device and storage medium for information processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination