CN111105059B - 属性冲突发现方法、装置和计算机可读存储介质 - Google Patents

属性冲突发现方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN111105059B
CN111105059B CN201811255193.XA CN201811255193A CN111105059B CN 111105059 B CN111105059 B CN 111105059B CN 201811255193 A CN201811255193 A CN 201811255193A CN 111105059 B CN111105059 B CN 111105059B
Authority
CN
China
Prior art keywords
attribute
prediction
probability
sample
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811255193.XA
Other languages
English (en)
Other versions
CN111105059A (zh
Inventor
许金泉
康建峰
范斌
罗程亮
周俊
王楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Original Assignee
Baidu Online Network Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Baidu Online Network Technology Beijing Co Ltd filed Critical Baidu Online Network Technology Beijing Co Ltd
Priority to CN201811255193.XA priority Critical patent/CN111105059B/zh
Publication of CN111105059A publication Critical patent/CN111105059A/zh
Application granted granted Critical
Publication of CN111105059B publication Critical patent/CN111105059B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/29Graphical models, e.g. Bayesian networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提出一种属性冲突发现方法、装置和计算机可读存储介质。该方法包括:利用预测数据统计得到各预测属性的频度;利用各预测属性的频度计算各预测属性的概率和条件概率;利用贝叶斯网络对各预测属性的概率和条件概率进行判定,以确定各预测属性之间是否冲突。本发明实施例通过构建贝叶斯网络,可以批量发现属性冲突、缩短人工评估、节省人力成本、周期短、提升用户体验。

Description

属性冲突发现方法、装置和计算机可读存储介质
技术领域
本发明涉及用户画像技术领域,尤其涉及一种属性冲突发现方法、装置和计算机可读存储介质。
背景技术
用户画像刻画用户的人口属性、兴趣爱好属性和位置属性等。属性之间可能存在相互冲突的情况。大部分属性冲突是不合理的,降低了用户画像的准确率和用户体验。
通过属性冲突的发现,更精准的刻画用户画像。目前发现属性冲突的方案包括:
(1)人工评估后总结规则。用户画像RD(Research&Design,研发)工程师在属性预测和QA(Quality Assurance,质量保证)评估过程中,积累属性冲突的数据,根据常识和属性冲突的具体数据生成规则。该方案需要逐例(case by case)分析,依赖常识和坏例(badcase)的发现,依赖人力,瓶颈在于评估的数据量。
(2)产品线反馈。具体产品线的PM(Product Manager,产品经理)或者RD工程师在使用数据的时候发现属性冲突,并反馈。该方案依赖用户画像的使用方反馈。时效性低,发现周期长,影响产品体验。
发明内容
本发明实施例提供一种属性冲突发现方法、装置和计算机可读存储介质,以解决现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种属性冲突发现方法,包括:
利用预测数据统计得到各预测属性的频度;
利用各预测属性的频度计算各预测属性的概率和条件概率;
利用贝叶斯网络对各预测属性的概率和条件概率进行判定,以确定各预测属性之间是否冲突。
在一种实施方式中,该方法还包括:
利用训练数据统计得到各样本属性的频度;
利用各样本属性的频度计算各样本属性的概率和条件概率;
利用各样本属性的概率和条件概率,建立贝叶斯网络。
在一种实施方式中,利用训练数据统计得到各样本属性的频度,包括:
利用用户画像的训练数据统计得到第一样本属性和第二样本属性的频度。
在一种实施方式中,利用各样本属性的频度计算各样本属性的概率和条件概率,包括:
利用所述第一样本属性和所述第二样本属性的频度,计算所述第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,以及所述第二样本属性的概率和在第二样本属性条件下第一样本属性的概率。
在一种实施方式中,利用各样本属性的概率和条件概率,建立贝叶斯网络,包括:
利用第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,建立第一贝叶斯子网络;
利用第二样本属性的概率和在第二样本属性条件下第一样本属性的概率,建立第二贝叶斯子网络。
在一种实施方式中,利用预测数据统计得到各预测属性的频度,包括:
利用用户画像的预测数据统计得到第一预测属性和第二预测属性的频度。
在一种实施方式中,利用各预测属性的频度计算各预测属性的概率和条件概率,包括:
利用所述第一预测属性和所述第二预测属性的频度,计算所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率,以及所述第二预测属性的概率和在第二预测属性条件下第一预测属性的概率。
在一种实施方式中,利用贝叶斯网络对各预测属性的概率和条件概率进行判定,以确定各预测属性之间是否冲突,包括:
利用第一贝叶斯子网络对所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率进行判定;
利用第二贝叶斯子网络对所述第二预测属性的概率和在第二预测属性条件下第二预测属性的概率进行判定;
确定所述第一预测属性与所述第二预测属性是否冲突。
第二方面,本发明实施例提供了一种属性冲突发现装置,包括:
第一统计模块,用于利用预测数据统计得到各预测属性的频度;
第一计算模块,用于利用各预测属性的频度计算各预测属性的概率和条件概率;
判定模块,用于利用贝叶斯网络对各预测属性的概率和条件概率进行判定,以确定各预测属性之间是否冲突。
在一种实施方式中,该装置还包括:
第二统计模块,用于利用训练数据统计得到各样本属性的频度;
第二计算模块,用于利用各样本属性的频度计算各样本属性的概率和条件概率;
建立模块,用于利用各样本属性的概率和条件概率,建立贝叶斯网络。
在一种实施方式中,所述第二统计模块还用于利用用户画像的训练数据统计得到第一样本属性和第二样本属性的频度。
在一种实施方式中,所述第二计算模块还用于利用所述第一样本属性和所述第二样本属性的频度,计算所述第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,以及所述第二样本属性的概率和在第二样本属性条件下第一样本属性的概率。
在一种实施方式中,所述建立模块还用于:
利用第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,建立第一贝叶斯子网络;
利用第二样本属性的概率和在第二样本属性条件下第一样本属性的概率,建立第二贝叶斯子网络。
在一种实施方式中,所述第一统计模块还用于利用用户画像的预测数据统计得到第一预测属性和第二预测属性的频度。
在一种实施方式中,所述第一计算模块还用于利用所述第一预测属性和所述第二预测属性的频度,计算所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率,以及所述第二预测属性的概率和在第二预测属性条件下第一预测属性的概率。
在一种实施方式中,所述判定模块还用于:
利用第一贝叶斯子网络对所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率进行判定;
利用第二贝叶斯子网络对所述第二预测属性的概率和在第二预测属性条件下第二预测属性的概率进行判定;
确定所述第一预测属性与所述第二预测属性是否冲突。
第三方面,本发明实施例提供了一种属性冲突发现装置,所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的设计中,所述装置的结构中包括处理器和存储器,所述存储器用于存储支持所述装置执行上述属性冲突发现方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述装置还可以包括通信接口,用于与其他设备或通信网络通信。
第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储属性冲突发现装置所用的计算机软件指令,其包括用于执行上述属性冲突发现方法所涉及的程序。
上述技术方案中的一个技术方案具有如下优点或有益效果:通过贝叶斯网络,可以批量发现属性冲突、缩短人工评估、节省人力成本、周期短、提升用户体验。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。
图1示出根据本发明实施例的属性冲突发现方法的流程图。
图2示出根据本发明实施例的属性冲突发现方法的流程图。
图3示出根据本发明实施例的属性冲突发现方法的流程图。
图4示出根据本发明实施例的属性冲突发现装置的结构框图。
图5示出根据本发明实施例的属性冲突发现装置的结构框图。
图6示出根据本发明实施例的属性冲突发现装置的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
图1示出根据本发明实施例的属性冲突发现方法的流程图。如图1所示,该属性冲突发现方法可以包括判定过程,具体可以包括:
步骤S11、利用预测数据统计得到各预测属性的频度。
步骤S12、利用各预测属性的频度计算各预测属性的概率和条件概率。
步骤S13、利用贝叶斯网络对各预测属性的概率和条件概率进行判定,以确定各预测属性之间是否冲突。
预测数据中可能包括多种属性,需要判定是否存在冲突的属性为预测属性。利用统计数据计算出各预测属性的概率和条件概率后,可以利用预先训练的贝叶斯网络进行判定,以确定各预测属性之间是否冲突。
在一种实施方式中,如图2所示,该方法还包括训练过程,具体可以包括:
步骤S21、利用训练数据统计得到各样本属性的频度。
步骤S22、利用各样本属性的频度计算各样本属性的概率和条件概率。
步骤S23、利用各样本属性的概率和条件概率,建立贝叶斯网络。
在本发明实施例中,需要判定哪些属性之间是否冲突,可以先利用这些属性训练得到对应的贝叶斯网络。在判定阶段,再利用对应的贝叶斯网络判定这些属性之间是否冲突。例如,如果训练数据中包括多个样本属性,可以利用每两个样本属性训练得到一组贝叶斯网络。这样,可能得到多组贝叶斯网络。
在一种实施方式中,以两个样本属性进行训练为例,如图3所示,步骤S21包括:
步骤S31、利用用户画像的训练数据统计得到第一样本属性和第二样本属性的频度。
其中,用户画像可以包括但不限于用户的年龄属性、经历属性、身体状况属性、兴趣爱好属性和位置属性等多种属性。
在一种实施方式中,步骤S22包括:
步骤S32、利用所述第一样本属性和所述第二样本属性的频度,计算所述第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,以及所述第二样本属性的概率和在第二样本属性条件下第一样本属性的概率。
在一种实施方式中,步骤S23包括:
步骤S33、利用第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,建立第一贝叶斯子网络;
步骤S34、利用第二样本属性的概率和在第二样本属性条件下第一样本属性的概率,建立第二贝叶斯子网络。
在一种示例中,在生成贝叶斯网络的阶段,利用训练数据统计属性A和B的频度,用频度近似概率,得到概率P(A)、P(B)和条件概率P(B|A)和P(B|A);P(A)和P(B|A)生成贝叶斯网络A,P(B)和P(A|B)生成贝叶斯网络B。在一种示例中,贝叶斯网络可以采用包括概率和条件概率的表格来表示。如下表1和表2表示,P(B)和P(A|B)生成的贝叶斯网络B。
表1
P(B=bj) b1 b2 b3
0.68 0.31 0.01
表2
P(A=ai|B=bj) b1 b2 b3
a1 0.20 0.1 0.8
a2 0.75 0.3 0.15
a3 0.05 0.6 0.05
在一种实施方式中,在判定过程中,以两个预测属性为例,步骤S11包括:
步骤S35、利用用户画像的预测数据统计得到第一预测属性和第二预测属性的频度。
在用户画像的属性预测中,通常使用某种规则或者模型,预测一种属性,而非同时预测多种属性,容易导致属性与属性之间的冲突。两个属性预测完成后,可以先对利用预测数据统计这两个属性的频度,以进行冲突发现。
在一种实施方式中,步骤S12包括:
步骤S36、利用所述第一预测属性和所述第二预测属性的频度,计算所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率,以及所述第二预测属性的概率和在第二预测属性条件下第一预测属性的概率。
在一种实施方式中,步骤S13包括:
步骤S37、利用第一贝叶斯子网络对所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率进行判定;
步骤S38、利用第二贝叶斯子网络对所述第二预测属性的概率和在第二预测属性条件下第二预测属性的概率进行判定;
步骤S39、确定所述第一预测属性与所述第二预测属性是否冲突。
在一种示例中,使用贝叶斯网络发现属性冲突的过程包括:利用预测数据统计属性A和B的频度,用频度近似概率,得到概率
Figure GDA0003601044270000071
和条件概率
Figure GDA0003601044270000072
Figure GDA0003601044270000073
将这些概率与之前生成的贝叶斯网络进行比较,发现属性冲突。
在本发明实施例中,基于贝叶斯网络的属性冲突发现方法充分利用先验数据,生成属性和属性之间的贝叶斯网络,使用贝叶斯网络发现预测属性之间的冲突。本发明实施例通过比较后验概率和贝叶斯网络,可以批量发现属性间的冲突。属性预测完成后,可以马上进行属性冲突发现,尽量避免人工评估和使用方反馈,缩短了属性冲突发现的周期和用户体验。
应用示例:
属性A为年龄,包括:(6-18岁)、(18-24岁)、(25-34岁)等。
属性B为经历,包括:小学、初中、高中、大学、工作、结婚等。
其中,如果属性A是(18-24岁),则属性B大概率处于大学;
如果属性A是(25-34岁),则属性B大概率处于工作。
在贝叶斯网络中,记录属性A和属性B的概率和条件概率后。可以利用贝叶斯网络对实际需要预测的数据进行判定。
例如,如果某条数据的属性A是(25-34岁),但属性B是中学的概率最大,则该条数据的属性A和属性B可能冲突。
再如,如果对大量预测数据统计得到的属性A是(25-34岁)的概率
Figure GDA0003601044270000082
和条件概率
Figure GDA0003601044270000081
与贝叶斯网络中不同(或差距较大),说明这些数据的属性A、B可能冲突。
通过构建贝叶斯网络,可以批量发现属性冲突、缩短人工评估、节省人力成本、周期短、提升用户体验。
图4示出根据本发明实施例的属性冲突发现装置的结构框图。如图4所示,该装置可以包括:
第一统计模块41,用于利用预测数据统计得到各预测属性的频度;
第一计算模块42,用于利用各预测属性的频度计算各预测属性的概率和条件概率;
判定模块43,用于利用贝叶斯网络对各预测属性的概率和条件概率进行判定,以确定各预测属性之间是否冲突。
在一种实施方式中,如图5所示,该装置还包括:
第二统计模块51,用于利用训练数据统计得到各样本属性的频度;
第二计算模块52,用于利用各样本属性的频度计算各样本属性的概率和条件概率;
建立模块53,用于利用各样本属性的概率和条件概率,建立贝叶斯网络。
在一种实施方式中,所述第二统计模块51还用于利用用户画像的训练数据统计得到第一样本属性和第二样本属性的频度。
在一种实施方式中,所述第二计算模块52还用于利用所述第一样本属性和所述第二样本属性的频度,计算所述第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,以及所述第二样本属性的概率和在第二样本属性条件下第一样本属性的概率。
在一种实施方式中,所述建立模块53还用于:利用第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,建立第一贝叶斯子网络;利用第二样本属性的概率和在第二样本属性条件下第一样本属性的概率,建立第二贝叶斯子网络。
在一种实施方式中,所述第一统计模块41还用于利用用户画像的预测数据统计得到第一预测属性和第二预测属性的频度。
在一种实施方式中,所述第一计算模块42还用于利用所述第一预测属性和所述第二预测属性的频度,计算所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率,以及所述第二预测属性的概率和在第二预测属性条件下第一预测属性的概率。
在一种实施方式中,所述判定模块43还用于:
利用第一贝叶斯子网络对所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率进行判定;
利用第二贝叶斯子网络对所述第二预测属性的概率和在第二预测属性条件下第二预测属性的概率进行判定;
确定所述第一预测属性与所述第二预测属性是否冲突。
本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
图6示出根据本发明实施例的属性冲突发现装置的结构框图。如图6所示,该装置包括:存储器910和处理器920,存储器910内存储有可在处理器920上运行的计算机程序。所述处理器920执行所述计算机程序时实现上述实施例中的事务提交方法。所述存储器910和处理器920的数量可以为一个或多个。
该装置还包括:
通信接口930,用于与外界设备进行通信,进行数据交互传输。
存储器910可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
如果存储器910、处理器920和通信接口930独立实现,则存储器910、处理器920和通信接口930可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,PeripheralComponent)总线或扩展工业标准体系结构(EISA,Extended Industry StandardComponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器910、处理器920及通信接口930集成在一块芯片上,则存储器910、处理器920及通信接口930可以通过内部接口完成相互间的通信。
本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述实施例中任一所述的方法。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (18)

1.一种属性冲突发现方法,其特征在于,包括:
根据预设规则或预设模型获取预测数据,利用所述预测数据统计得到第一预测属性和第二预测属性的频度;
利用所述第一预测属性和第二预测属性的频度计算所述第一预测属性和第二预测属性的概率和条件概率;
利用贝叶斯网络对所述第一预测属性和第二预测属性的概率和条件概率进行判定,以确定所述第一预测属性和第二预测属性之间是否冲突。
2.根据权利要求1所述的方法,其特征在于,还包括:
利用训练数据统计得到第一样本属性和第二样本属性的频度;
利用所述第一样本属性和第二样本属性的频度计算所述第一样本属性和第二样本属性的概率和条件概率;
利用所述第一样本属性和第二样本属性的概率和条件概率,建立贝叶斯网络。
3.根据权利要求2所述的方法,其特征在于,利用训练数据统计得到第一样本属性和第二样本属性的频度,包括:
利用用户画像的训练数据统计得到第一样本属性和第二样本属性的频度。
4.根据权利要求3所述的方法,其特征在于,利用所述第一样本属性和第二样本属性的频度计算所述第一样本属性和第二样本属性的概率和条件概率,包括:
利用所述第一样本属性和所述第二样本属性的频度,计算所述第一样本属性的概率和在第一样本属性条件下第二样本属性的概率;或者,
利用所述第一样本属性和所述第二样本属性的频度,计算所述第二样本属性的概率和在第二样本属性条件下第一样本属性的概率。
5.根据权利要求4所述的方法,其特征在于,利用所述第一样本属性和第二样本属性的概率和条件概率,建立贝叶斯网络,包括:
利用所述第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,建立第一贝叶斯子网络;或者
利用所述第二样本属性的概率和在第二样本属性条件下第一样本属性的概率,建立第二贝叶斯子网络。
6.根据权利要求3至5中任一项所述的方法,其特征在于,利用所述预测数据统计得到第一预测属性和第二预测属性的频度,包括:
利用用户画像的预测数据统计得到第一预测属性和第二预测属性的频度。
7.根据权利要求6所述的方法,其特征在于,利用所述第一预测属性和第二预测属性的频度计算所述第一预测属性和第二预测属性的概率和条件概率,包括:
利用所述第一预测属性和所述第二预测属性的频度,计算所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率;或者
利用所述第一预测属性和所述第二预测属性的频度,计算所述第二预测属性的概率和在第二预测属性条件下第一预测属性的概率。
8.根据权利要求7所述的方法,其特征在于,利用贝叶斯网络对所述第一预测属性和第二预测属性的概率和条件概率进行判定,以确定所述第一预测属性和第二预测属性之间是否冲突,包括:
利用第一贝叶斯子网络对所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率进行判定;或者
利用第二贝叶斯子网络对所述第二预测属性的概率和在第二预测属性条件下第一预测属性的概率进行判定;
确定所述第一预测属性与所述第二预测属性是否冲突。
9.一种属性冲突发现装置,其特征在于,包括:
第一统计模块,用于根据预设规则或预设模型获取预测数据,利用所述预测数据统计得到第一预测属性和第二预测属性的频度;
第一计算模块,用于利用所述第一预测属性和第二预测属性的频度计算所述第一预测属性和第二预测属性的概率和条件概率;
判定模块,用于利用贝叶斯网络对所述第一预测属性和第二预测属性的概率和条件概率进行判定,以确定所述第一预测属性和第二预测属性之间是否冲突。
10.根据权利要求9所述的装置,其特征在于,还包括:
第二统计模块,用于利用训练数据统计得到第一样本属性和第二样本属性的频度;
第二计算模块,用于利用所述第一样本属性和第二样本属性的频度计算所述第一样本属性和第二样本属性的概率和条件概率;
建立模块,用于利用所述第一样本属性和第二样本属性的概率和条件概率,建立贝叶斯网络。
11.根据权利要求10所述的装置,其特征在于,所述第二统计模块还用于利用用户画像的训练数据统计得到第一样本属性和第二样本属性的频度。
12.根据权利要求11所述的装置,其特征在于,所述第二计算模块还用于利用所述第一样本属性和所述第二样本属性的频度,计算所述第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,或
利用所述第一样本属性和所述第二样本属性的频度,计算所述第二样本属性的概率和在第二样本属性条件下第一样本属性的概率。
13.根据权利要求12所述的装置,其特征在于,所述建立模块还用于:
利用所述第一样本属性的概率和在第一样本属性条件下第二样本属性的概率,建立第一贝叶斯子网络;或者,
利用所述第二样本属性的概率和在第二样本属性条件下第一样本属性的概率,建立第二贝叶斯子网络。
14.根据权利要求11至13中任一项所述的装置,其特征在于,所述第一统计模块还用于利用用户画像的预测数据统计得到第一预测属性和第二预测属性的频度。
15.根据权利要求14所述的装置,其特征在于,所述第一计算模块还用于利用所述第一预测属性和所述第二预测属性的频度,计算所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率;或者,
利用所述第一预测属性和所述第二预测属性的频度,计算所述第二预测属性的概率和在第二预测属性条件下第一预测属性的概率。
16.根据权利要求15所述的装置,其特征在于,所述判定模块还用于:
利用第一贝叶斯子网络对所述第一预测属性的概率和在第一预测属性条件下第二预测属性的概率进行判定;或者,
利用第二贝叶斯子网络对所述第二预测属性的概率和在第二预测属性条件下第一预测属性的概率进行判定;
确定所述第一预测属性与所述第二预测属性是否冲突。
17.一种属性冲突发现装置,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至8中任一项所述的方法。
18.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至8中任一项所述的方法。
CN201811255193.XA 2018-10-26 2018-10-26 属性冲突发现方法、装置和计算机可读存储介质 Active CN111105059B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811255193.XA CN111105059B (zh) 2018-10-26 2018-10-26 属性冲突发现方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811255193.XA CN111105059B (zh) 2018-10-26 2018-10-26 属性冲突发现方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111105059A CN111105059A (zh) 2020-05-05
CN111105059B true CN111105059B (zh) 2022-06-03

Family

ID=70418675

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811255193.XA Active CN111105059B (zh) 2018-10-26 2018-10-26 属性冲突发现方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111105059B (zh)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102006033267B4 (de) * 2006-07-18 2009-12-31 Siemens Ag Verfahren zur rechnergestützten Ermittlung von quantitativen Vorhersagen aus qualitativen Informationen mit Hilfe von Bayesianischen Netzwerken
CN105205184A (zh) * 2015-10-30 2015-12-30 云南大学 基于隐变量模型的用户偏好提取方法
CN105740712B (zh) * 2016-03-09 2018-07-24 哈尔滨工程大学 基于贝叶斯网络的Android恶意行为检测方法
CN106326585B (zh) * 2016-08-29 2019-05-31 东软集团股份有限公司 基于贝叶斯网络推理的预测分析方法以及装置
CN107330445B (zh) * 2017-05-31 2020-06-05 北京京东尚科信息技术有限公司 用户属性的预测方法和装置

Also Published As

Publication number Publication date
CN111105059A (zh) 2020-05-05

Similar Documents

Publication Publication Date Title
CN108683530B (zh) 多维度数据的数据分析方法、装置及存储介质
Feige et al. Learning and inference in the presence of corrupted inputs
CN110830234B (zh) 一种用户流量分配方法及装置
CN103577658A (zh) 智能终端硬件的评估方法及评估系统
CN111325417A (zh) 实现隐私保护的多方协同更新业务预测模型的方法及装置
CN111222553B (zh) 机器学习模型的训练数据处理方法、装置和计算机设备
CN110415044A (zh) 作弊检测方法、装置、设备及存储介质
CN108920601B (zh) 一种数据匹配方法及装置
CN116781434B (zh) 基于拟态防御的访问控制方法、系统及相关设备
CN112333246B (zh) 一种ABtest实验方法、装置、智能终端及存储介质
CN111651741B (zh) 用户身份识别方法、装置、计算机设备和存储介质
CN111105059B (zh) 属性冲突发现方法、装置和计算机可读存储介质
CN108463813B (zh) 一种进行数据处理的方法和装置
CN106304084B (zh) 信息处理方法及装置
CN111176985B (zh) 软件接口的性能测试方法及装置、计算机设备、存储介质
CN117014507A (zh) 任务卸载模型的训练方法、任务的卸载方法及装置
CN117009221A (zh) 产品测试的处理方法、装置、设备、存储介质及程序产品
CN115203556A (zh) 一种评分预测模型训练方法、装置、电子设备及存储介质
CN115080412A (zh) 软件更新质量评估方法、装置、设备及计算机存储介质
CN109492759B (zh) 神经网络模型预测方法、装置和终端
CN110134575B (zh) 一种服务器集群的服务能力计算方法及装置
CN110852684B (zh) 货源偏好的确定方法、装置、设备及存储介质
CN111079390A (zh) 一种复选框列表的选择状态确定方法以及装置
KR20200036173A (ko) 사용자 그루핑 및 그룹별 선호 기계학습 분석 알고리즘을 추천하는 방법 및 장치
CN115861662B (zh) 基于组合神经网络模型的预测方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant