CN112307433B - 女性用户非常用形体数据可靠性判断方法及装置 - Google Patents

女性用户非常用形体数据可靠性判断方法及装置 Download PDF

Info

Publication number
CN112307433B
CN112307433B CN201910704957.7A CN201910704957A CN112307433B CN 112307433 B CN112307433 B CN 112307433B CN 201910704957 A CN201910704957 A CN 201910704957A CN 112307433 B CN112307433 B CN 112307433B
Authority
CN
China
Prior art keywords
shape data
value
difference
common
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910704957.7A
Other languages
English (en)
Other versions
CN112307433A (zh
Inventor
孙宇
�原浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Leiertuote Technology Co ltd
Original Assignee
Shenzhen Leiertuote Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Leiertuote Technology Co ltd filed Critical Shenzhen Leiertuote Technology Co ltd
Priority to CN201910704957.7A priority Critical patent/CN112307433B/zh
Publication of CN112307433A publication Critical patent/CN112307433A/zh
Application granted granted Critical
Publication of CN112307433B publication Critical patent/CN112307433B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本发明提供了一种女性用户非常用形体数据可靠性判断方法及装置,所述方法包括获得女性用户形体数据;将所述女性用户形体数据区分为常用形体数据值和非常用形体数据值;将所述常用形体数据值输入已经训练好的Bagging算法模型中,获得所述Bagging算法模型输出的非常用形体数据预测值;计算所述非常用形体数据值与预测值的差值;根据所述差值与训练好的置信区间的关系判定所述非常用形体数据值是否可靠。本发明中,首先通过Bagging算法模型对非常用形体数据进行预测,获得相应的预测值,并计算用户输入的非常用形体数据值与对应预测值之间的差值,然后根据该差值与置信区间的关系判断用户输入的数据是否正确,能够有效的降低用户输入错误数据的可能性。

Description

女性用户非常用形体数据可靠性判断方法及装置
技术领域
本发明涉及用户形体测量技术领域,具体的说是一种女性用户非常用形体数据可靠性判断方法及装置。
背景技术
某些时候,女性用户需要在终端上输入形体数据,例如某些软件需要根据用户数据的形体数据向用户推荐合适尺码的衣物。由于某些形体数据并不常用,例如:腰围、臀围、上胸围等,女性用户在输入这些不常用的形体尺寸时可能会输错,如果其给出了错误数值,则在判断时会引入很大的误差,得出错误的结果。
传统的判断亚洲女性标准三围为根据身高来判断标准的胸围,腰围数据。一是提供了《女性标准身高、三维标准尺寸对照表》,根据女性的身高可以查表得到标准三维尺寸。二是提供了根据身高计算三维标准尺寸的公式,例如,标准腰围=身高x0.34。然而女性用户的身材数据千差万别,这些方式只给出了标准数据,却没有给出女性用户三维数据的分布,不能定量的判断数值是否在置信区间范围内。
发明内容
根据以上现有技术的不足,本发明提出了女性用户非常用形体数据可靠性判断方法及装置,能够对女性用户的形体数据的准确性进行判断,减少数据出现错误的可能性。
本发明解决其技术问题采用以下技术方案来实现:
作为本发明的第一个方面,提供了一种女性用户非常用形体数据可靠性判断方法,包括
获得女性用户形体数据;
将所述女性用户形体数据区分为常用形体数据值和非常用形体数据值;
将所述常用形体数据值输入已经训练好的Bagging算法模型中,获得所述Bagging算法模型输出的非常用形体数据预测值;
计算所述非常用形体数据值与所述非常用形体数据预测值的差值;
根据所述差值与训练好的置信区间的关系判定所述非常用形体数据值是否可靠。
作为一种可选的实施方式,所述Bagging算法模型的训练过程包括
获取女性用户形体的历史数据;
将女性用户形体的历史数据作为训练集,将所述训练集中的常用形体数据值作为输入值,并将所述非常用形体数据值作为输出值;
从训练集中进行有放回的t次抽样;
针对每一次抽样结果,使用决策树算法进行训练,得到一个弱的假设模型;
针对已知常用形体数据的新样本s,每一个假设模型均能够得到一个预测输出值,得票最高的预测输出值即为该新样本s的非常用形体数据预测值。
作为一种可选的实施方式,所述置信区间的训练过程为
获取女性用户形体的历史数据;
将所述历史数据中的常用形体数据值作为训练集,输入训练好的Bagging算法模型中,得到Bagging算法模型输出的非常用形体数据预测值的集合;
计算与常用形体数据值对应的非常用形体数据值与非常用形体数据预测值的差值,获得差值集合;
由所述差值集合计算差值平均值以及差值的标准差;
根据所述差值平均值和所述差值的标准差建立置信区间。
作为一种可选的实施方式,所述置信区间为其中/>表示差值平均值,Sδ表示差值的标准差。
作为一种可选的实施方式,其特征在于:所述常用形体数据值包括身高、体重、文胸罩杯和胸部下围。
作为一种可选的实施方式,所述非常用形体数据值包括胸部上围和/或腰围和/或臀围。
作为本发明的第二个方面,提供了一种女性用户非常用形体数据可靠性判断装置,包括
获取模块,用于获得女性用户形体数据,并将所述女性用户形体数据区分为常用形体数据值和非常用形体数据值;
预测模块,用于将所述常用形体数据值输入已经训练好的Bagging算法模型中,获得所述Bagging算法模型输出的非常用形体数据预测值;
计算模块,用于计算所述非常用形体数据值与所述非常用形体数据预测值的差值;
判断模块,用于根据所述差值与训练好的置信区间的关系判定所述非常用形体数据值是否可靠。
本发明的有益效果是:
本发明中,首先通过Bagging算法模型对非常用形体数据进行预测,获得相应的预测值,并计算用户输入的非常用形体数据值与对应预测值之间的差值,然后根据该差值与置信区间的关系判断用户输入的数据是否正确,能够有效的降低用户输入错误数据的可能性,提高数据的准确性。
附图说明
下面结合附图和实施例对本发明进一步说明。
图1为本具体实施方式的逻辑结构示意图;
图2为本具体实施方式的训练Bagging算法的逻辑结构示意图;
图3为本具体实施方式的训练置信区间的逻辑结果示意图。
具体实施方式
下面通过对实施例的描述,本发明的具体实施方式如所涉及的各构件的形状、构造、各部分之间的相互位置及连接关系、各部分的作用及工作原理、制造工艺及操作使用方法等,作进一步详细的说明,以帮助本领域技术人员对本发明的发明构思、技术方案有更完整、准确和深入的理解。
作为本发明的第一个方面,如图1所示,提供了一种女性用户非常用形体数据可靠性判断方法,包括
步骤S10、获得女性用户形体数据;
步骤S20、将所述女性用户形体数据区分为常用形体数据值和非常用形体数据值;
步骤S30、将所述常用形体数据值输入已经训练好的Bagging算法模型中,获得所述Bagging算法模型输出的非常用形体数据预测值;
步骤S40、计算所述非常用形体数据值与所述非常用形体数据预测值的差值;
步骤S50、根据所述差值与训练好的置信区间的关系判定所述非常用形体数据值是否可靠。
本发明中,首先将用户输入的女性用户形体数据区分为常用形体数据值和非常用形体数据值两种类型,并将常用形体数据值作为输入值输入以及训练好的Bagging算法模型中,获得该模型输出的非常用形体数据预测值,然后将用户输入的非常用形体数据值与模型输出的非常用形体数据预测值进行比较,计算两者的差值,最后将获得的差值与训练好的置信区间进行比较,若差值处于该置信区间内,则表明用户输入的非常用形体数据值时可信的,相关的程序能够以用户输入的女性形体数据值作为依据,执行后续的步骤,例如像用户推荐合适该形体数据的服装等,若差值处于该置信区间外,则表明用户输入的非常用形体数据值是可疑的,此时相关的程序可以通过设置提醒页面或者提醒弹窗等操作提醒用户检查其输入的形体数据值,以便用户校核输入数据,以提高输入的准确性,避免因用户输入的数据错误导致后续其他步骤一系列错误。本发明中,首先通过Bagging算法模型对非常用形体数据进行预测,获得相应的预测值,并计算用户输入的非常用形体数据值与对应预测值之间的差值,然后根据该差值与置信区间的关系判断用户输入的数据是否正确,能够有效的降低用户输入错误数据的可能性,提高数据的准确性。
具体的,所述常用形体数据值包括身高、体重、文胸罩杯和胸部下围;所述非常用形体数据值包括胸部上围和/或腰围和/或臀围。
作为一种可选的实施方式,如图2所示,所述Bagging算法模型的训练过程包括
步骤S31、获取女性用户形体的历史数据;
步骤S32、将女性用户形体的历史数据作为训练集,将所述训练集中的常用形体数据值作为输入值,并将所述非常用形体数据值作为输出值;
步骤S33、从训练集中进行有放回的t次抽样;
步骤S34、针对每一次抽样结果,使用决策树算法进行训练,得到一个弱的假设模型;
步骤S35、针对已知常用形体数据的新样本s,每一个假设模型均能够得到一个预测输出值,得票最高的预测输出值即为该新样本s的非常用形体数据预测值。
根据用户数据,使用基于决策树(Decision Tree)的Bagging回归算法对用户胸围上围进行回归。综合分类算法(Ensemble Classification)利用多个基分类器的输出以获得更好的性能,Bagging算法是一种很通行的综合分类方法。Bagging从原始训练集中进行T轮重抽样,根据每轮抽出的训练集学习出不同的基分类器。对未知实例根据T个分类器的输出用投票表决法决定最终结果。决策树(Decision Tree)是一种基本的分类与回归方法。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。
作为一种可选的实施方式,如图3所示,所述置信区间的训练过程为
步骤S51、获取女性用户形体的历史数据;
步骤S52、将所述历史数据中的常用形体数据值作为训练集,输入训练好的Bagging算法模型中,得到Bagging算法模型输出的非常用形体数据预测值的集合;
步骤S53、计算与常用形体数据值对应的非常用形体数据值与非常用形体数据预测值的差值,获得差值集合;
步骤S54、由所述差值集合计算差值平均值以及差值的标准差;
步骤S55、根据所述差值平均值和所述差值的标准差建立置信区间。
具体的,所述置信区间为其中,/>表示差值平均值,,Sδ表示差值的标准差。
具体的,n表示样本数量。
作为本发明的第二个方面,提供了一种女性用户非常用形体数据可靠性判断装置,包括
获取模块,用于获得女性用户形体数据,并将所述女性用户形体数据区分为常用形体数据值和非常用形体数据值;
预测模块,用于将所述常用形体数据值输入已经训练好的Bagging算法模型中,获得所述Bagging算法模型输出的非常用形体数据预测值;
计算模块,用于计算所述非常用形体数据值与所述非常用形体数据预测值的差值;
判断模块,用于根据所述差值与训练好的置信区间的关系判定所述非常用形体数据值是否可靠。
工作时,获取模块获得用户输入的女性用户形体数据,然后将其区分为常用形体数据值和非常用形体数据值,然后将常用形体数据值输入预测模块中,获得非常用形体数据预测值,接着计算模块对用户输入的非常用形体数据值以及预测模块输出的非常用形体数据预测值进行计算,获得两者之间的差值,最后,判断模块依据所述差值对用户输入的非常用形体数据值是否可信进行判断。
上面对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。本发明的保护范围应该以权利要求书所限定的保护范围为准。

Claims (3)

1.女性用户非常用形体数据可靠性判断方法,其特征在于:包括
获取女性用户形体的历史数据;
将女性用户形体的历史数据作为训练集,将所述训练集中的常用形体数据值作为输入值,并将非常用形体数据值作为输出值,所述非常用形体数据值包括胸部上围和/或腰围和/或臀围;
从训练集中进行有放回的t次抽样;
针对每一次抽样结果,使用决策树算法进行训练,得到一个弱的假设模型;
针对已知常用形体数据的新样本s,每一个假设模型均能够得到一个预测输出值,得票最高的预测输出值即为该新样本s的非常用形体数据预测值,得到训练好的Bagging算法模型;
将所述历史数据中的常用形体数据值作为训练集,输入训练好的Bagging算法模型中,得到Bagging算法模型输出的非常用形体数据预测值的集合,所述常用形体数据值包括身高、体重、文胸罩杯和胸部下围;
计算与常用形体数据值对应的非常用形体数据值与非常用形体数据预测值的差值,获得差值集合;
由所述差值集合计算差值平均值以及差值的标准差;
根据所述差值平均值和所述差值的标准差建立置信区间;
获得女性用户形体数据;
将所述女性用户形体数据区分为常用形体数据值和非常用形体数据值;
将所述常用形体数据值输入已经训练好的Bagging算法模型中,获得所述Bagging算法模型输出的非常用形体数据预测值;
计算所述非常用形体数据值与所述非常用形体数据预测值的差值;
根据所述差值与训练好的置信区间的关系判定所述非常用形体数据值是否可靠。
2.根据权利要求1所述的女性用户非常用形体数据可靠性判断方法,其特征在于:所述置信区间为其中/>表示差值平均值,/>表示差值的标准差。
3.女性用户非常用形体数据可靠性判断装置,其特征在于:包括
获取模块,用于获取女性用户形体的历史数据;
还用于将女性用户形体的历史数据作为训练集,将所述训练集中的常用形体数据值作为输入值,并将非常用形体数据值作为输出值,所述非常用形体数据值包括胸部上围和/或腰围和/或臀围;
还用于从训练集中进行有放回的t次抽样;
还用于针对每一次抽样结果,使用决策树算法进行训练,得到一个弱的假设模型;
还用于针对已知常用形体数据的新样本s,每一个假设模型均能够得到一个预测输出值,得票最高的预测输出值即为该新样本s的非常用形体数据预测值,得到训练好的Bagging算法模型;
还用于将所述历史数据中的常用形体数据值作为训练集,输入训练好的Bagging算法模型中,得到Bagging算法模型输出的非常用形体数据预测值的集合,所述常用形体数据值包括身高、体重、文胸罩杯和胸部下围;
还用于计算与常用形体数据值对应的非常用形体数据值与非常用形体数据预测值的差值,获得差值集合;
还用于由所述差值集合计算差值平均值以及差值的标准差;
还用于根据所述差值平均值和所述差值的标准差建立置信区间
还用于获得女性用户形体数据,并将所述女性用户形体数据区分为常用形体
数据值和非常用形体数据值;
预测模块,用于将所述常用形体数据值输入已经训练好的Bagging算法模型中,获得所述Bagging算法模型输出的非常用形体数据预测值;
计算模块,用于计算所述非常用形体数据值与所述非常用形体数据预测值的差值;
判断模块,用于根据所述差值与训练好的置信区间的关系判定所述非常用形体数据值是否可靠。
CN201910704957.7A 2019-08-01 2019-08-01 女性用户非常用形体数据可靠性判断方法及装置 Active CN112307433B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910704957.7A CN112307433B (zh) 2019-08-01 2019-08-01 女性用户非常用形体数据可靠性判断方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910704957.7A CN112307433B (zh) 2019-08-01 2019-08-01 女性用户非常用形体数据可靠性判断方法及装置

Publications (2)

Publication Number Publication Date
CN112307433A CN112307433A (zh) 2021-02-02
CN112307433B true CN112307433B (zh) 2023-08-29

Family

ID=74485833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910704957.7A Active CN112307433B (zh) 2019-08-01 2019-08-01 女性用户非常用形体数据可靠性判断方法及装置

Country Status (1)

Country Link
CN (1) CN112307433B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105136704A (zh) * 2015-09-15 2015-12-09 唐山拓普生物科技有限公司 一种快速测定啤酒酵母乳干物质含量的方法
CN105676670A (zh) * 2014-11-18 2016-06-15 北京翼虎能源科技有限公司 用于处理能源数据的方法和系统
CN108197654A (zh) * 2018-01-03 2018-06-22 杭州贝嘟科技有限公司 基于svm算法的身材数据预测方法、装置、存储介质及设备
CN109711894A (zh) * 2018-12-28 2019-05-03 携程旅游网络技术(上海)有限公司 航线需求异常的检测方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060101048A1 (en) * 2004-11-08 2006-05-11 Mazzagatti Jane C KStore data analyzer

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105676670A (zh) * 2014-11-18 2016-06-15 北京翼虎能源科技有限公司 用于处理能源数据的方法和系统
CN105136704A (zh) * 2015-09-15 2015-12-09 唐山拓普生物科技有限公司 一种快速测定啤酒酵母乳干物质含量的方法
CN108197654A (zh) * 2018-01-03 2018-06-22 杭州贝嘟科技有限公司 基于svm算法的身材数据预测方法、装置、存储介质及设备
CN109711894A (zh) * 2018-12-28 2019-05-03 携程旅游网络技术(上海)有限公司 航线需求异常的检测方法及系统

Also Published As

Publication number Publication date
CN112307433A (zh) 2021-02-02

Similar Documents

Publication Publication Date Title
CN106529559A (zh) 一种指针式圆形多仪表盘实时读数识别方法
CN105046705B (zh) 一种基于模糊理论的裂纹边缘检测方法
TW201514472A (zh) 整合影像分析與資料挖礦之自動光學檢測缺陷影像分類方法
Shi et al. Region diversity maximization for salient object detection
CN108195841A (zh) 基于gfv-sift特征的振动环境注塑模具异常缺陷检测方法
CN110141219A (zh) 基于导联融合深度神经网络的心肌梗死自动检测方法
CN108197564B (zh) 一种画钟试验的评估系统及方法
US20200257885A1 (en) High speed reference point independent database filtering for fingerprint identification
CN107273726B (zh) 基于加速度周期变化规律的设备机主身份实时识别方法及其装置
CN106056597A (zh) 物体视觉检测方法及装置
CN110119680A (zh) 一种基于图像识别的电气柜接线自动查错系统
CN116150676A (zh) 基于人工智能的设备故障诊断与识别方法及装置
CN104197836A (zh) 基于机器视觉的汽车门锁装配尺寸检测方法
CN104027100A (zh) 一种基于最近历史值的血压异常数据处理方法
CN109623489A (zh) 一种改进的机床健康状态评定方法及数控机床
CN109919166A (zh) 获取属性的分类信息的方法和装置
CN108007912B (zh) 光谱修正分析装置、修正分析方法以及药品真伪判定系统
CN113155043A (zh) 透明材质屏幕厚度测量系统、方法及装置
CN112462720A (zh) 一种服装工装大规模及定制生产的工艺模块标准化系统
CN112307433B (zh) 女性用户非常用形体数据可靠性判断方法及装置
CN110083724A (zh) 一种相似图像检索方法、装置及系统
US20230237682A1 (en) Method and system for binocular ranging for children
CN111191659B (zh) 服装生产系统多形状衣架识别方法
CN109060799A (zh) 一种装配流水线成品检测判定方法
CN111760292A (zh) 采样数据的检测方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant