CN107220674A - 一种众包环境下物品概念空间的建模方法 - Google Patents

一种众包环境下物品概念空间的建模方法 Download PDF

Info

Publication number
CN107220674A
CN107220674A CN201710431255.7A CN201710431255A CN107220674A CN 107220674 A CN107220674 A CN 107220674A CN 201710431255 A CN201710431255 A CN 201710431255A CN 107220674 A CN107220674 A CN 107220674A
Authority
CN
China
Prior art keywords
mrow
msub
mass
article
rent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710431255.7A
Other languages
English (en)
Inventor
孙凌云
楼赟
何博伟
高瑋玥
向为
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201710431255.7A priority Critical patent/CN107220674A/zh
Publication of CN107220674A publication Critical patent/CN107220674A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种众包环境下物品概念空间的建模方法,属于计算机技术领域。建模方法包括向众包平台服务器发送众包请求,以获取对物品三元组的概念相似性判断的判断结果;基于该判断结果,构建物品集合的概念模型及获取物品集合的所有空间嵌入矩阵;基于获取的空间嵌入矩阵,以两个空间嵌入之间的欧式距离表征两个物品概念间的相似程度。通过对建模方法进行改进,从而提升了概念相似性偏好选择的准确性。

Description

一种众包环境下物品概念空间的建模方法
技术领域
本发明涉及计算机技术领域,具体地说,涉及一种众包环境下物品概念空间的建模方法。
背景技术
概念空间建模旨在通过人为打分、机器评判等方法对物品间的相关关系建立描述模型,常用建模方法多基于概念间相似关系或距离关系的相似性学习,以习得物品间相似性的一种相关关系或度量。
当前,对物品概念空间的建模主要是直接从图像或文本中提取特征,但是直接提取的图像或文字难以完全表征出人对概念的认知,导致对产品、创意设计方案等物品概念间的相似性判断偏离人认识的本意
发明内容
本发明的目的是提供一种众包环境下物品概念空间的建模方法,以更符合人对物品概念间相似性的判断。
为了实现上述目的,本发明提供众包环境下概念空间的建模方法包括获取步骤与建模步骤;其中,获取步骤包括通过通讯线路向众包平台服务器发送物品集合II中物品三元组的概念相似性判断的众包请求,众包请求包括对判断结果的描述满足相比ic更相似于ia},并接收众包平台服务器基于该众包请求获取的判断结果;建模步骤包括基于所获取的判断结果,使用随机三元组嵌入的建模方法对物品集合II的概念空间进行二维空间建模,获取物品集合中物品的空间嵌入{M1,M2,…,Mn}构成的空间嵌入矩阵M,以两个空间嵌入之间的欧式距离表征两个物品概念间的相似程度。
通过众包平台获取对物品相似性的判断,能获取来自不同地域及具有不同专业背景的参与者的判断认识,及在短时间内获取所期望的结果;并且要求众包参与者对由物品组成的三元组之间的相似性进行判断,判断过程简单,能够很好地获得一致性的判断结果;且将判断结果描述成统一形式,便于后续建模等环节的处理。此外,利用众包参与者的判断构建得到的概念空间,不同物品在该概念空间中的距离更贴合于人的认识,即不同方案间的距离更贴近人的感知距离。
具体的方案为获取步骤还包括:通过通讯线路向众包平台服务器发送若干轮次获取目标物品的众包请求,并接收众包平台服务器基于该众包请求所获取的物品,剔除不符合要求的物品,剩余物品构成物品集合II。
另一个具体的方案为使用随机三元组嵌入的建模方法对物品集合II的概念空间进行二维空间建模的步骤包括:
(1)使用随机三元组嵌入方法定义三元组(ia,ib,ic)满足某随机选择规则的概率pabc为,
其中,||.||2为欧氏距离,Ma、Mb及Mc分别为物品ia、ib及ic的空间嵌入;
(2)以目标函数为最大值时的空间嵌入矩阵所对应的概念空间为目标概念空间。
更具体的方案为在步骤(1)中,若众包参与者的评价中存有冲突,则概率pabc为:
再具体的方案为众包参与者的评价中存有冲突为:众包参与者对同一组物品(ia,ib,ic)相似性判断结果中同时存在
优选的方案为以目标函数为最大值时的空间嵌入矩阵所对应的概念空间为目标概念空间的步骤包括:
(1)构建损失函数
(2)利用随机梯度下降方法,以损失函数的梯度迭代更新众包参与者评价对应的三个元素(ia,ib,ic)的空间嵌入Ma,Mb,Mc,直至损失函数C在两次迭代间变化量小于预设阈值。
附图说明
图1是本发明实施例的工作流程图。
具体实施方式
以下结合实施例及其附图对本发明作进一步说明。
实施例
参见图1,本众包环境下物品概念空间的建模方法包括第一获取步骤S1、第二获取步骤S2及建模步骤S3。
第一获取步骤S1,通过通讯线路向众包平台服务器发送搜寻目标物品的众包请求,并接收众包平台服务器基于该众包请求获取的物品。
在本实施例中,获取目标物品的搜寻任务具体为搜寻一款能保持正确坐姿的产品、方案的搜寻任务,在本实施例中产品与方案统称为物品,包括但不局限于硬件、软件及手机应用,并提供描述该物品的页面网址、描述图片网址、简要文字描述。
“通讯线路”为包括一个或多个被配置在用户与众包平台间用于传送信息数据的数据路线,可以是通讯网络中的电线路、光学线路、无线线路及它们的组合,其还有多种显而易见的变化。
可以通过发布多轮次目标物品搜寻任务,以搜集尽可能多的既有产品、方案等,在本实施例中为发布3轮次,并筛除不符合要求的物品,剩余物品构成用于物品概念相似度判断实验对象的物品集合II={i1,i2,…,in},即需要估计这n个物品的相似性。
第二获取步骤S2,通过通讯线路向众包平台服务器发送物品三元组相似性判断的众包请求,并接收众包平台服务器基于该众包请求获取针对相似性判断问题给出的判断,该判断满足形式相比ic更相似于ia,ia,ib,ic∈II}。
从物品集合II中筛选出三个物品构成物品三元组,并发布对该物品三元组中三个物品间的相似性进行判断的判断任务。
建模步骤S3,基于评价结果,使用随机三元组嵌入的建模方法对物品集合II的概念空间进行二维空间建模,获取物品的空间嵌入Mx及由物品集合II中物品的空间嵌入{M1,M2,…,Mn}构成的空间嵌入矩阵M,以两个空间嵌入之间的欧式距离表征两个物品概念间的相似程度。
(1)、使用随机三元组嵌入t-STE(t-Distributed Stochastic TripletEmbedding)定义一个三元组(ia,ib,ic)满足某随机选择规则(stochastic selectionrule)的概率pabc为:
其中||.||2表示欧氏距离(或称L2范数),t-STE假设三元组在较高概率水平上与真实距离s相关,即有:
若众包参与者对同一组物品(ia,ib,ic)相似度的判断结果中同时存在时,即作为约束条件的参与者评价中存在冲突,t-STE方法为引入Student-t检验中的α自由度构造上述概率pabc为,
(2)、在这一假设的前提下,定义学习的目标为最大化参与者评价集合的对数概率,即以目标函数为时的空间嵌入矩阵所对应的概念空间为目标概念空间。
为了获取目标函数的最大值,将目标概率函数作损失函数,即,损失函数并利用随机梯度下降方法,以损失函数的梯度迭代更新参与者评价对应的三个元素ia,ib,ic的空间嵌入Ma,Mb,Mc,迭代的终止条件为损失函数在两次迭代间变化量位于预设区间
(3)、根据给定的空间嵌入,计算两个嵌入之间的欧式距离(L2范数)
kxy=||Mx-My||2,作为表征两个物品概念间的相似程度。

Claims (6)

1.一种众包环境下物品概念空间的建模方法,其特征在于,包括:
获取步骤,通过通讯线路向众包平台服务器发送物品集合II中物品三元组的概念相似性判断的众包请求,所述众包请求包括对判断结果的描述满足相比ic更相似于ia},并接收众包平台服务器基于该众包请求获取的判断结果;
建模步骤,基于所获取的判断结果,使用随机三元组嵌入的建模方法对物品集合II的概念空间进行二维空间建模,获取物品集合中物品的空间嵌入{M1,M2,…,Mn}构成的空间嵌入矩阵M,以两个空间嵌入之间的欧式距离表征两个物品概念间的相似程度。
2.根据权利要求1所述的建模方法,其特征在于,所述获取步骤还包括:
通过通讯线路向众包平台服务器发送若干轮次获取目标物品的众包请求,并接收众包平台服务器基于该众包请求所获取的物品,剔除不符合要求的物品,剩余物品构成物品集合II。
3.根据权利要求1所述的建模方法,其特征在于,所述使用随机三元组嵌入的建模方法对物品集合II的概念空间进行二维空间建模的步骤包括:
(1)使用随机三元组嵌入方法定义三元组(ia,ib,ic)满足某随机选择规则的概率pabc为,
<mrow> <msub> <mi>p</mi> <mrow> <mi>a</mi> <mi>b</mi> <mi>c</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mo>|</mo> <mo>|</mo> <msub> <mi>M</mi> <mi>a</mi> </msub> <mo>-</mo> <msub> <mi>M</mi> <mi>b</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mo>|</mo> <mo>|</mo> <msub> <mi>M</mi> <mi>a</mi> </msub> <mo>-</mo> <msub> <mi>M</mi> <mi>b</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mo>-</mo> <mo>|</mo> <mo>|</mo> <msub> <mi>M</mi> <mi>a</mi> </msub> <mo>-</mo> <msub> <mi>M</mi> <mi>c</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>;</mo> </mrow>
其中,||.||2为欧氏距离,Ma、Mb及Mc分别为物品ia、ib及ic的空间嵌入;
(2)以目标函数为最大值时的空间嵌入矩阵所对应的概念空间为目标概念空间。
4.根据权利要求3所述的建模方法,其特征在于,在步骤(1)中,若众包参与者的评价中存有冲突,则概率pabc为:
<mrow> <msub> <mi>p</mi> <mrow> <mi>a</mi> <mi>b</mi> <mi>c</mi> </mrow> </msub> <mo>=</mo> <mfrac> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>+</mo> <mfrac> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>M</mi> <mi>a</mi> </msub> <mo>-</mo> <msub> <mi>M</mi> <mi>b</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>2</mn> </msub> </mrow> <mi>&amp;alpha;</mi> </mfrac> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mfrac> <mrow> <mi>&amp;alpha;</mi> <mo>+</mo> <mn>1</mn> </mrow> <mn>2</mn> </mfrac> </mrow> </msup> <mrow> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>+</mo> <mfrac> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>M</mi> <mi>a</mi> </msub> <mo>-</mo> <msub> <mi>M</mi> <mi>b</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>2</mn> </msub> </mrow> <mi>&amp;alpha;</mi> </mfrac> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mfrac> <mrow> <mi>&amp;alpha;</mi> <mo>+</mo> <mn>1</mn> </mrow> <mn>2</mn> </mfrac> </mrow> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mn>1</mn> <mo>+</mo> <mfrac> <mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>M</mi> <mi>a</mi> </msub> <mo>-</mo> <msub> <mi>M</mi> <mi>c</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>2</mn> </msub> </mrow> <mi>&amp;alpha;</mi> </mfrac> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mfrac> <mrow> <mi>&amp;alpha;</mi> <mo>+</mo> <mn>1</mn> </mrow> <mn>2</mn> </mfrac> </mrow> </msup> </mrow> </mfrac> <mo>.</mo> </mrow>
5.根据权利要求4所述的建模方法,其特征在于:
所述众包参与者的评价中存有冲突为众包参与者对同一组物品(ia,ib,ic)相似性判断结果中同时存在
6.根据权利要求3至5任一项权利要求所述的建模方法,其特征在于,所述以目标函数为最大值时的空间嵌入矩阵所对应的概念空间为目标概念空间的步骤包括:
(1)构建损失函数
(2)利用随机梯度下降方法,以损失函数的梯度迭代更新众包参与者评价对应的三个元素(ia,ib,ic)的空间嵌入Ma,Mb,Mc,直至损失函数C在两次迭代间变化量位于预设区间内。
CN201710431255.7A 2017-06-08 2017-06-08 一种众包环境下物品概念空间的建模方法 Pending CN107220674A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710431255.7A CN107220674A (zh) 2017-06-08 2017-06-08 一种众包环境下物品概念空间的建模方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710431255.7A CN107220674A (zh) 2017-06-08 2017-06-08 一种众包环境下物品概念空间的建模方法

Publications (1)

Publication Number Publication Date
CN107220674A true CN107220674A (zh) 2017-09-29

Family

ID=59948521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710431255.7A Pending CN107220674A (zh) 2017-06-08 2017-06-08 一种众包环境下物品概念空间的建模方法

Country Status (1)

Country Link
CN (1) CN107220674A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740327A (zh) * 2016-01-22 2016-07-06 天津中科智能识别产业技术研究院有限公司 一种基于用户偏好的自适应采样方法
CN105868366A (zh) * 2016-03-30 2016-08-17 浙江工业大学 基于概念关联的概念空间导航方法
CN106528609A (zh) * 2016-09-28 2017-03-22 厦门理工学院 一种向量约束嵌入转换的知识图谱推理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740327A (zh) * 2016-01-22 2016-07-06 天津中科智能识别产业技术研究院有限公司 一种基于用户偏好的自适应采样方法
CN105868366A (zh) * 2016-03-30 2016-08-17 浙江工业大学 基于概念关联的概念空间导航方法
CN106528609A (zh) * 2016-09-28 2017-03-22 厦门理工学院 一种向量约束嵌入转换的知识图谱推理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LAURENS VAN DER MAATEN等: "STOCHASTIC TRIPLET EMBEDDING", 《2012 IEEE INTERNATIONAL WORKSHOP ON MACHINE LEARNING FOR SIGNAL PROCESSING》 *

Similar Documents

Publication Publication Date Title
CN108287864B (zh) 一种兴趣群组划分方法、装置、介质及计算设备
CN105608179B (zh) 确定用户标识的关联性的方法和装置
CN109934249A (zh) 数据处理方法、装置、介质和计算设备
CN108197532A (zh) 人脸识别的方法、装置及计算机装置
CN111428147A (zh) 结合社交和兴趣信息的异源图卷积网络的社交推荐方法
CN106933867B (zh) 一种图像查询方法和装置
CN105677780A (zh) 可拓展的用户意图挖掘方法及其系统
CN105917359A (zh) 移动视频搜索
CN108647800B (zh) 一种基于节点嵌入的在线社交网络用户缺失属性预测方法
CN106845644A (zh) 一种通过相互关系学习用户及移动应用的联系的异构网络
CN110928894B (zh) 实体对齐的方法及装置
CN110209810A (zh) 相似文本识别方法以及装置
CN109902471A (zh) 滑块验证的检测方法、装置、计算机设备及存储介质
CN110489574A (zh) 一种多媒体信息推荐方法、装置和相关设备
CN109189960A (zh) 信息获取方法、信息获取装置及计算机存储介质
CN105574480B (zh) 一种信息处理方法、装置以及终端
CN106803092B (zh) 一种标准问题数据的确定方法及装置
CN109753275A (zh) 应用编程接口的推荐方法、装置、存储介质和电子设备
CN108846708A (zh) 用户购买行为预测方法、装置、设备及存储介质
CN104750762A (zh) 一种信息检索方法及装置
CN104035978B (zh) 社团发现方法及系统
CN103399900A (zh) 基于位置服务的图片推荐方法
Zhang et al. Improving augmented reality using recommender systems
CN111767953B (zh) 用于训练物品编码模型的方法和装置
WO2020135420A1 (zh) 对用户进行分类的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170929